免费看黄色片的网站,91最新91精品91蝌蚪,免费观看9999网站直播,亚洲欧美激情另类,亚洲狠狠婷婷综合久久久久图片,黄色片免费在线播放,99爱在线精品视频网站

同花順 Logo
AIME助手
問財助手
興業(yè)證券:具身大模型為人形機器人智慧內(nèi)核 數(shù)據(jù)飛輪驅(qū)動迭代躍升
2026-04-16 10:06:49
分享
AIME

問財摘要

1、具身大模型是人形機器人的“大腦”,主導(dǎo)“感知-認知-控制”交互閉環(huán),目前尚未實現(xiàn)大規(guī)模應(yīng)用,主要原因或非硬件能力不足,而是大模型存在瓶頸。 2、數(shù)據(jù)是驅(qū)動具身大模型迭代升級的關(guān)鍵,目前主流數(shù)據(jù)訓(xùn)練方案為真機、仿真與視頻數(shù)據(jù)相結(jié)合。 3、建議關(guān)注人形機器人傳感器相關(guān)公司及掌握動捕解決方案的相關(guān)公司。
免責(zé)聲明 內(nèi)容由AI生成
文章提及標的
興業(yè)證券--
人形機器人--
傳感器--
谷歌C--
特斯拉--
英偉達--

興業(yè)證券(601377)發(fā)布研報稱,具身大模型作為人形機器人(886069)的“大腦”,從“感知-認知-控制”層面賦能機器人,強調(diào)與物理世界的交互,需具備多模態(tài)感知、自主決策、實時交互執(zhí)行、通用與泛化等能力。目前主流廠家數(shù)據(jù)采集及訓(xùn)練方案多樣。機器人通過傳感器(885946)獲取外界和自身狀態(tài),為具身大模型決策提供數(shù)據(jù)支持,建議關(guān)注人形機器人(886069)傳感器(885946)以及掌握動捕解決方案的相關(guān)公司。

興業(yè)證券(601377)主要觀點如下:

具身大模型是人形機器人的“大腦”,主導(dǎo)“感知-認知-控制”交互閉環(huán)

傳統(tǒng)大模型專注于單一或少數(shù)模態(tài)的任務(wù)處理,缺乏與物理世界直接交互的能力。具身大模型作為人形機器人(886069)的“大腦”,從“感知-認知-控制”層面賦能機器人,強調(diào)與物理世界的交互,需具備多模態(tài)感知、自主決策、實時交互執(zhí)行、通用與泛化等能力。

人形機器人(886069)目前尚未實現(xiàn)大規(guī)模應(yīng)用,主要原因或非硬件能力不足,而是大模型存在瓶頸。從產(chǎn)業(yè)進程來看,當(dāng)前機器人肢體層技術(shù)已較為成熟,而大模型的發(fā)展遠落后于硬件。當(dāng)前階段的具身大模型已具備認知、推理與規(guī)劃能力,不足之處在于難以可靠處理復(fù)雜物理世界的不確定性,同時泛化能力明顯較弱。

具身大模型主流框架為分層式與端到端式,路徑尚未收斂。傳統(tǒng)決策采用分層架構(gòu),包括感知與互動、高層規(guī)劃、低層執(zhí)行以及反饋與增強,通過大小腦分層,人形機器人(886069)更容易落地,但分層范式存在錯誤累積的問題,且在跨多樣任務(wù)泛化時表現(xiàn)不佳。端到端框架基于感知環(huán)境和機器人狀態(tài)直接輸出具體的機器人執(zhí)行命令,將感知、語言理解、規(guī)劃、動作執(zhí)行和反饋優(yōu)化集成到一個統(tǒng)一的框架中,具備高集成度與較強泛化能力,VLA模型是端到端決策的核心。

海外具身大模型

1)典型的完全端到端架構(gòu)具身大模型包括谷歌(GOOG)DeepMind RT-2與特斯拉(TSLA)FSD。RT-2致力于通過端到端的神經(jīng)網(wǎng)絡(luò)將視覺和語言信息直接映射為機器人動作;特斯拉(TSLA)Optimus可沿用汽車FSD系統(tǒng)的技術(shù)棧,實現(xiàn)多模態(tài)輸入與實時動作輸出。2)典型的分層具身大模型包括Figure AIHelix、英偉達(NVDA)GR00TN1與PhysicalIntelligenceπ0。Helix采用“系統(tǒng)S1(快思考)+系統(tǒng)S2(慢思考)”雙系統(tǒng)架構(gòu);GR00TN1同樣采用雙系統(tǒng)架構(gòu),并利用流匹配技術(shù)來生成動作;π0采用“預(yù)訓(xùn)練VLM+動作專家模塊”的VLA模型。

國內(nèi)具身大模型

架構(gòu)持續(xù)創(chuàng)新,能力對標海外,典型模型包括智元機器人G0-1、星動紀元ERA-42、銀河通用GraspVLA、靈初智能Psi R1及字節(jié)Seed GR-3。G0-1開創(chuàng)性提出ViLLA架構(gòu),采用“VLM+MoE(混合專家)”;ERA-42模型是國內(nèi)首個真正意義上的端到端原生機器人大模型;GraspVLA模型將VLM與動作專家集成,是全球首個合成大數(shù)據(jù)驅(qū)動的基礎(chǔ)抓取大模型;Psi R1模型采用快慢腦架構(gòu);GR-3采用40億參數(shù)的混合變換器架構(gòu),泛化抓取-放置能力超越π0。

數(shù)據(jù)是驅(qū)動具身大模型迭代升級的關(guān)鍵,目前主流數(shù)據(jù)訓(xùn)練方案為真機、仿真與視頻數(shù)據(jù)相結(jié)合

伴隨具身智能轉(zhuǎn)向端到端大模型,數(shù)據(jù)需求從低量單一模態(tài)數(shù)據(jù)逐步升級為海量、多模態(tài)、高精度和跨任務(wù)長程數(shù)據(jù),其中真機數(shù)據(jù)價值最高,獲取難度最大,是具身智能落地的可靠數(shù)據(jù)源。目前真實數(shù)據(jù)采集方式主要分為VR遙操作采集、機械臂主從控制采集、數(shù)據(jù)手套遙操作等。目前主流廠家數(shù)據(jù)采集及訓(xùn)練方案多樣,特斯拉(TSLA)數(shù)采方案或轉(zhuǎn)向視頻學(xué)習(xí),而銀河通用以物理仿真數(shù)據(jù)為主、真實數(shù)據(jù)為輔。

投資建議

1)機器人通過傳感器(885946)獲取外界和自身狀態(tài),為具身大模型決策提供數(shù)據(jù)支持,建議關(guān)注人形機器人(886069)傳感器(885946)相關(guān)公司,如安培龍(301413)、漢威科技(300007)、福萊新材(605488)、奧比中光(688322);2)動捕采集方案是高質(zhì)量運動數(shù)據(jù)的關(guān)鍵來源,建議關(guān)注掌握動捕解決方案的相關(guān)公司,如凌云光(688400)。

風(fēng)險提示:人形機器人(886069)量產(chǎn)進度不及預(yù)期;大模型技術(shù)進展不及預(yù)期;訓(xùn)練數(shù)據(jù)規(guī)模與質(zhì)量不及預(yù)期。

免責(zé)聲明:風(fēng)險提示:本文內(nèi)容僅供參考,不代表同花順觀點。同花順各類信息服務(wù)基于人工智能算法,如有出入請以證監(jiān)會指定上市公司信息披露平臺為準。如有投資者據(jù)此操作,風(fēng)險自擔(dān),同花順對此不承擔(dān)任何責(zé)任。
homeBack返回首頁
不良信息舉報與個人信息保護咨詢專線:10100571違法和不良信息涉企侵權(quán)舉報涉算法推薦舉報專區(qū)涉青少年不良信息舉報專區(qū)

浙江同花順互聯(lián)信息技術(shù)有限公司版權(quán)所有

網(wǎng)站備案號:浙ICP備18032105號-4
證券投資咨詢服務(wù)提供:浙江同花順云軟件有限公司 (中國證監(jiān)會核發(fā)證書編號:ZX0050)
AIME
舉報舉報
反饋反饋