財(cái)通證券(601108)發(fā)布研報(bào)稱(chēng),LPU為新一代面向大模型推理階段的芯片,核心為T(mén)SP架構(gòu)。該行認(rèn)為,LPU受益于低推理延時(shí)的優(yōu)異表現(xiàn),有望實(shí)現(xiàn)快速滲透,該行看好LPU的高成長(zhǎng)性及LPU以機(jī)柜出貨時(shí)帶來(lái)的PCB機(jī)會(huì),建議關(guān)注:智微智能(001339)(001339.SZ)(參股元川微)、星宸科技(301536)(301536.SZ)(多輪增資元川微)、滬電股份(002463)(002463.SZ)(英偉達(dá)(NVDA)PCB供應(yīng)商)、勝宏科技(300476)(300476.SZ)(英偉達(dá)(NVDA)PCB供應(yīng)商)、深南電路(002916)(002916.SZ)。
財(cái)通證券(601108)主要觀點(diǎn)如下:
LPU為新一代面向大模型推理階段的芯片,核心為T(mén)SP架構(gòu)
LPU是專(zhuān)為順序處理的計(jì)算密集型任務(wù)設(shè)計(jì)的新型芯片架構(gòu),核心在于TSP架構(gòu),包含五大功能模塊,將經(jīng)典的處理器五級(jí)流水線拆散在整個(gè)芯片內(nèi),進(jìn)而消除了硬件的復(fù)雜性,使指令執(zhí)行順序和時(shí)間具有確定性。在TSP架構(gòu)下,編譯器可以直接訪問(wèn)并精確控制芯片的底層硬件狀態(tài),實(shí)現(xiàn)了軟件定義硬件。
LPU可縮短大模型推理過(guò)程中的延遲,提高用戶(hù)體驗(yàn)感
大模型在推理過(guò)程中會(huì)存在延遲,延遲與用戶(hù)體驗(yàn)感精密掛鉤,大模型推理過(guò)程中的延遲主要在Decode階段,核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬,可縮短大模型推理過(guò)程中的延遲。同時(shí),基于LPU的大模型不僅具有更快的推理速度,還可以提供更具性?xún)r(jià)比的價(jià)格,可進(jìn)一步提高用戶(hù)體驗(yàn)感。
LPU具備廣闊的潛在發(fā)展空間,已步入量產(chǎn)初期
目前Tokens的消耗量大幅增長(zhǎng),2024年初我國(guó)日均Token的消耗量為1000億,2026年2月主流大模型合計(jì)日均Token消耗已到180萬(wàn)億級(jí)別,Tokens消耗量快速增長(zhǎng),帶動(dòng)推理芯片市場(chǎng)規(guī)模的高增長(zhǎng)。LPU可降低大模型推理的延遲,該行認(rèn)為L(zhǎng)PU有望在推理芯片市場(chǎng)中逐步滲透,具有高成長(zhǎng)性的市場(chǎng)空間。目前LPU已步入量產(chǎn)初期,放量在即。
風(fēng)險(xiǎn)提示:AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn);大模型發(fā)展不及預(yù)期的風(fēng)險(xiǎn);LPU行業(yè)發(fā)展不及預(yù)期的風(fēng)險(xiǎn)。
