中國(guó)第一，阿里146篇論文入選AI頂會(huì)NeurIPS 2025

2025-12-05 16:58:37 來(lái)源：財(cái)經(jīng)網(wǎng)

　　12月5日消息，人工智能領(lǐng)域頂級(jí)國(guó)際會(huì)議NeurIPS 2025在美國(guó)圣迭戈召開(kāi)，本屆會(huì)議，阿里巴巴共146篇論文入選，是論文收錄數(shù)量最多的中國(guó)公司。其中，阿里千問(wèn)在門控注意力機(jī)制上的成果被評(píng)為最佳論文，為唯一獲獎(jiǎng)的中國(guó)公司。

　　NeurIPS是人工智能領(lǐng)域影響力最大的頂會(huì)之一，該會(huì)議誕生了Transformer、AlexNet等里程碑式研究成果。今年，谷歌、微軟、OpenAI、阿里巴巴及麻省理工學(xué)院等全球頂尖科技公司和機(jī)構(gòu)共有2萬(wàn)多篇論文投稿，僅有約25%的論文被接收。統(tǒng)計(jì)數(shù)據(jù)顯示，谷歌、微軟、Meta和阿里巴巴是論文數(shù)量前四的科技公司。

　　據(jù)介紹，此次阿里入選的146篇論文全面覆蓋了模型訓(xùn)練框架、數(shù)據(jù)集和模型基礎(chǔ)研究和模型推理優(yōu)化等領(lǐng)域，展現(xiàn)了阿里在全棧AI體系的創(chuàng)新成果。

　　在模型基礎(chǔ)研究方面，阿里千問(wèn)團(tuán)隊(duì)發(fā)表的《Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free》論文，首次清晰揭秘了門控注意力背后的作用原理，并全面展示使用該方案的最佳方式，為業(yè)界突破當(dāng)下大模型訓(xùn)練瓶頸提供了新的理論基礎(chǔ)，該論文已被評(píng)為本屆會(huì)議的最佳論文。NeurIPS評(píng)審委員會(huì)指出：“這項(xiàng)工作將被廣泛應(yīng)用，并極大推動(dòng)AI研究人員對(duì)大語(yǔ)言模型中注意力機(jī)制的理解�！�

　　在訓(xùn)練框架層，阿里在《Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models》論文中，提出了全新的Data-Juicer 2.0數(shù)據(jù)處理系統(tǒng)，該系統(tǒng)內(nèi)置100多種數(shù)據(jù)處理算子，覆蓋文本、圖像、視頻和音頻等多種模態(tài)，全面支持?jǐn)?shù)據(jù)分析、合成、標(biāo)注以及基礎(chǔ)模型后訓(xùn)練等關(guān)鍵任務(wù)，有效解決多模態(tài)數(shù)據(jù)所特有的復(fù)雜性問(wèn)題，目前該成果已應(yīng)用于阿里云人工智能平臺(tái)PAI。

　　在推理效率方面，阿里云和浙江大學(xué)合作的《Controlling Thinking Speed in Reasoning Models》論文中提出全新的推理優(yōu)化方案：通過(guò)動(dòng)態(tài)調(diào)節(jié)大模型的思維速度，讓模型更接近人類智能。實(shí)驗(yàn)結(jié)果顯示，該方法在GSM8K、MATH、AIME等評(píng)測(cè)集上取得平均1.3%的準(zhǔn)確率提升，同時(shí)減少8.6%的Token使用，實(shí)現(xiàn)了推理準(zhǔn)確性與效率之間的平衡。

　　據(jù)悉，目前阿里千問(wèn)已開(kāi)源300多款模型，涵蓋全模態(tài)、全尺寸，全球下載量突破7億次，衍生模型超過(guò)18萬(wàn)個(gè)，位居全球第一。在Gartner發(fā)布的GenAI云基礎(chǔ)設(shè)施、GenAI工程、GenAI模型以及AI知識(shí)管理應(yīng)用四大維度的新興市場(chǎng)象限報(bào)告中，阿里云均位于新興領(lǐng)導(dǎo)者象限，是入選全部四項(xiàng)新興領(lǐng)導(dǎo)者象限的唯一亞太廠商。

關(guān)注同花順財(cái)經(jīng)（ths518），獲取更多機(jī)會(huì)

0人