中國(guó)第一,阿里146篇論文入選AI頂會(huì)NeurIPS 2025

來(lái)源: 財(cái)經(jīng)網(wǎng)

  12月5日消息,人工智能領(lǐng)域頂級(jí)國(guó)際會(huì)議NeurIPS 2025在美國(guó)圣迭戈召開(kāi),本屆會(huì)議,阿里巴巴共146篇論文入選,是論文收錄數(shù)量最多的中國(guó)公司。其中,阿里千問(wèn)在門控注意力機(jī)制上的成果被評(píng)為最佳論文,為唯一獲獎(jiǎng)的中國(guó)公司。

  NeurIPS是人工智能領(lǐng)域影響力最大的頂會(huì)之一,該會(huì)議誕生了Transformer、AlexNet等里程碑式研究成果。今年,谷歌、微軟、OpenAI、阿里巴巴及麻省理工學(xué)院等全球頂尖科技公司和機(jī)構(gòu)共有2萬(wàn)多篇論文投稿,僅有約25%的論文被接收。統(tǒng)計(jì)數(shù)據(jù)顯示,谷歌、微軟、Meta和阿里巴巴是論文數(shù)量前四的科技公司。

  據(jù)介紹,此次阿里入選的146篇論文全面覆蓋了模型訓(xùn)練框架、數(shù)據(jù)集和模型基礎(chǔ)研究和模型推理優(yōu)化等領(lǐng)域,展現(xiàn)了阿里在全棧AI體系的創(chuàng)新成果。

  在模型基礎(chǔ)研究方面,阿里千問(wèn)團(tuán)隊(duì)發(fā)表的《Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free》論文,首次清晰揭秘了門控注意力背后的作用原理,并全面展示使用該方案的最佳方式,為業(yè)界突破當(dāng)下大模型訓(xùn)練瓶頸提供了新的理論基礎(chǔ),該論文已被評(píng)為本屆會(huì)議的最佳論文。NeurIPS評(píng)審委員會(huì)指出:“這項(xiàng)工作將被廣泛應(yīng)用,并極大推動(dòng)AI研究人員對(duì)大語(yǔ)言模型中注意力機(jī)制的理解!

  在訓(xùn)練框架層,阿里在《Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models》論文中,提出了全新的Data-Juicer 2.0數(shù)據(jù)處理系統(tǒng),該系統(tǒng)內(nèi)置100多種數(shù)據(jù)處理算子,覆蓋文本、圖像、視頻和音頻等多種模態(tài),全面支持?jǐn)?shù)據(jù)分析、合成、標(biāo)注以及基礎(chǔ)模型后訓(xùn)練等關(guān)鍵任務(wù),有效解決多模態(tài)數(shù)據(jù)所特有的復(fù)雜性問(wèn)題,目前該成果已應(yīng)用于阿里云人工智能平臺(tái)PAI。

  在推理效率方面,阿里云和浙江大學(xué)合作的《Controlling Thinking Speed in Reasoning Models》論文中提出全新的推理優(yōu)化方案:通過(guò)動(dòng)態(tài)調(diào)節(jié)大模型的思維速度,讓模型更接近人類智能。實(shí)驗(yàn)結(jié)果顯示,該方法在GSM8K、MATH、AIME等評(píng)測(cè)集上取得平均1.3%的準(zhǔn)確率提升,同時(shí)減少8.6%的Token使用,實(shí)現(xiàn)了推理準(zhǔn)確性與效率之間的平衡。

  據(jù)悉,目前阿里千問(wèn)已開(kāi)源300多款模型,涵蓋全模態(tài)、全尺寸,全球下載量突破7億次,衍生模型超過(guò)18萬(wàn)個(gè),位居全球第一。在Gartner發(fā)布的GenAI云基礎(chǔ)設(shè)施、GenAI工程、GenAI模型以及AI知識(shí)管理應(yīng)用四大維度的新興市場(chǎng)象限報(bào)告中,阿里云均位于新興領(lǐng)導(dǎo)者象限,是入選全部四項(xiàng)新興領(lǐng)導(dǎo)者象限的唯一亞太廠商。

關(guān)注同花順財(cái)經(jīng)(ths518),獲取更多機(jī)會(huì)

0

+1
  • 北信源
  • 兆易創(chuàng)新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱 最新 漲跌幅