云天勵(lì)飛陳寧對(duì)話Hinton:推理時(shí)代來(lái)臨 GPNPU架構(gòu)如何破局?

來(lái)源: 證券日?qǐng)?bào)網(wǎng)

  本報(bào)訊 (記者王鏡茹)12月2日,在2025GIS全球創(chuàng)新峰會(huì)現(xiàn)場(chǎng),深圳云天勵(lì)飛技術(shù)股份有限公司(以下簡(jiǎn)稱“云天勵(lì)飛”)董事長(zhǎng)兼CEO陳寧與深度學(xué)習(xí)奠基人Geoffrey Hinton,圍繞算力效率、AI向善與普惠未來(lái)展開(kāi)對(duì)話,由硅谷著名計(jì)算機(jī)科學(xué)家、硅谷高創(chuàng)會(huì)大會(huì)主席吳軍主持。

  AI推理芯片將被廣泛應(yīng)用

  在算力成本急劇攀升的今天,AI真正瓶頸在哪里?Hinton認(rèn)為,現(xiàn)有計(jì)算體系在能耗和效率上面臨越來(lái)越大的壓力,未來(lái)需要在新的計(jì)算形態(tài)上進(jìn)行更多探索。

  他提到,模擬計(jì)算、類腦芯片以及基于類器官的計(jì)算等方向,在理論上有望在功耗和通信能力上展現(xiàn)出明顯優(yōu)勢(shì)。不過(guò),他也明確表示,目前基于腦細(xì)胞類器官的計(jì)算研究仍處于非常早期的階段,還不足以承擔(dān)大規(guī)模AI負(fù)載,這條路仍然需要時(shí)間和長(zhǎng)期投入來(lái)驗(yàn)證。

  陳寧則從工程一線給出回應(yīng)。他表示,GPU在深度學(xué)習(xí)早期扮演了重要角色,但本質(zhì)仍是通用計(jì)算架構(gòu),并非為神經(jīng)網(wǎng)絡(luò)量身定制!斑M(jìn)入大模型和智能體時(shí)代,我們要回答的問(wèn)題不再是能不能訓(xùn)出來(lái),而是在多大能耗和成本下,讓多少人用得起!

  陳寧判斷,到2030年,全球AI芯片產(chǎn)業(yè)規(guī)模有望達(dá)到約5萬(wàn)億美元,其中訓(xùn)練芯片約占1萬(wàn)億美元,而面向終端與行業(yè)側(cè)的推理/處理芯片有望達(dá)到4萬(wàn)億美元,占比約80%。隨著智能體能力持續(xù)下沉,AI處理芯片將被廣泛嵌入眼鏡、耳機(jī)、手機(jī)、筆記本、家電以及各類企業(yè)設(shè)備之中,像水、電、燃?xì)庖粯樱瑹o(wú)處不在、按需取用。

  談到AI的長(zhǎng)遠(yuǎn)影響,Hinton明確表示,如果可以回到2012年,他仍會(huì)推動(dòng)相關(guān)研究,但會(huì)更早、更大聲地提醒世界:AI風(fēng)險(xiǎn)是真實(shí)且需要前置應(yīng)對(duì)的。

  陳寧則從“誰(shuí)真正受益”的角度,為“AI向善”加上了另一半定義。他表示,如果AI只停留在少數(shù)科技巨頭的數(shù)據(jù)中心,只服務(wù)少部分機(jī)構(gòu)和高凈值人群,再完美的技術(shù)也難言“向善”。真正有意義的AI,必須讓更多人用得起、用得上——當(dāng)AI的使用成本被拉低到接近水電氣這種基礎(chǔ)設(shè)施的水平時(shí),偏遠(yuǎn)地區(qū)的學(xué)生、基層醫(yī)院和中小企業(yè)才有可能在教育、醫(yī)療、農(nóng)業(yè)與生產(chǎn)中真正獲得增益。

  云天勵(lì)飛推動(dòng)GPNPU架構(gòu)創(chuàng)新

  2025年是AI從訓(xùn)練時(shí)代全面邁入應(yīng)用推理時(shí)代的元年,全球人工智能已進(jìn)入應(yīng)用大爆發(fā)階段。

  目前,云天勵(lì)飛以NPU為核心,將推出GPNPU(General-PurposeNeural Processing Unit)架構(gòu),走“推理優(yōu)先架構(gòu)”路線,在矩陣/向量單元、存儲(chǔ)層級(jí)和帶寬利用上深度優(yōu)化,目標(biāo)是實(shí)現(xiàn)推理效率百倍級(jí)提升。

  陳寧認(rèn)為,“推理異構(gòu)化”已成為行業(yè)趨勢(shì)!癆I處理任務(wù)時(shí),需求理解(Prefill階段)需高算力支撐,答案生成(Decode階段)則依賴高帶寬,單一芯片難以兼顧所有場(chǎng)景。未來(lái),多模型混合應(yīng)用將成為常態(tài),這就要求芯片架構(gòu)具備靈活調(diào)配算力、帶寬與存儲(chǔ)配比的能力!

  對(duì)此,云天勵(lì)飛給出了算力新路徑:即在四代NPU的基礎(chǔ)上,研發(fā)第五代GPNPU架構(gòu)。核心路徑是融合GPU通用性與NPU高能效,以“算力積木”設(shè)計(jì)和3D堆疊存儲(chǔ)為核心創(chuàng)新,聚焦提升資本開(kāi)支Token轉(zhuǎn)化率與運(yùn)營(yíng)開(kāi)支Token轉(zhuǎn)化率,通過(guò)全棧協(xié)同優(yōu)化,為大模型組合應(yīng)用與復(fù)合智能體部署提供核心算力支撐,實(shí)現(xiàn)“百萬(wàn)Token的極致性價(jià)比”。

  架構(gòu)創(chuàng)新是國(guó)產(chǎn)芯片差異化突破的關(guān)鍵。陳寧預(yù)判,未來(lái)數(shù)萬(wàn)億美元規(guī)模的推理芯片市場(chǎng),核心競(jìng)爭(zhēng)力將聚焦于架構(gòu)的靈活適配能力,中國(guó)企業(yè)在這一領(lǐng)域的技術(shù)探索已占據(jù)先發(fā)優(yōu)勢(shì)。

  此外,陳寧也呼吁建立全球統(tǒng)一的推理算力網(wǎng)絡(luò)標(biāo)準(zhǔn)。他介紹,云天勵(lì)飛已向國(guó)際相關(guān)機(jī)構(gòu)提出建議,希望推動(dòng)建立統(tǒng)一的AI推理計(jì)算網(wǎng)絡(luò)標(biāo)準(zhǔn),讓不同國(guó)家和地區(qū)都能在同一張互聯(lián)互通的推理網(wǎng)絡(luò)上共享能力,尤其在醫(yī)療與教育等關(guān)乎民生的領(lǐng)域真正實(shí)現(xiàn)“AI for All”。

  面對(duì)推理芯片領(lǐng)域的競(jìng)爭(zhēng),云天勵(lì)飛機(jī)會(huì)在哪里?陳寧認(rèn)為,其一,公司從2005年就參與并行計(jì)算指令集與芯片架構(gòu)設(shè)計(jì),掌握了算法芯片化的第一性原理,可根據(jù)算法演進(jìn)優(yōu)化指令集,實(shí)現(xiàn)軟硬結(jié)合的高性價(jià)比設(shè)計(jì);其二,沉淀了頭部客戶資源,具備資本與品牌優(yōu)勢(shì),能吸引全球人才;其三,粵港澳大灣區(qū)擁有全球最完善的人工智能與機(jī)電一體化產(chǎn)業(yè)鏈,深圳的芯片設(shè)計(jì)、硬件制造、供應(yīng)鏈與營(yíng)銷網(wǎng)絡(luò),能第一時(shí)間洞察應(yīng)用變化,以市場(chǎng)需求驅(qū)動(dòng)芯片研發(fā)。

關(guān)注同花順財(cái)經(jīng)(ths518),獲取更多機(jī)會(huì)

0

+1
  • 北信源
  • 兆易創(chuàng)新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱 最新 漲跌幅