同花順財經(jīng)__讓投資變得更簡單

興業(yè)證券（601377）發(fā)布研報稱，具身大模型作為人形機器人（886069）的“大腦”，從“感知-認知-控制”層面賦能機器人，強調(diào)與物理世界的交互，需具備多模態(tài)感知、自主決策、實時交互執(zhí)行、通用與泛化等能力。目前主流廠家數(shù)據(jù)采集及訓(xùn)練方案多樣。機器人通過傳感器（885946）獲取外界和自身狀態(tài)，為具身大模型決策提供數(shù)據(jù)支持，建議關(guān)注人形機器人（886069）傳感器（885946）以及掌握動捕解決方案的相關(guān)公司。

興業(yè)證券（601377）主要觀點如下：

具身大模型是人形機器人的“大腦”，主導(dǎo)“感知-認知-控制”交互閉環(huán)

傳統(tǒng)大模型專注于單一或少數(shù)模態(tài)的任務(wù)處理，缺乏與物理世界直接交互的能力。具身大模型作為人形機器人（886069）的“大腦”，從“感知-認知-控制”層面賦能機器人，強調(diào)與物理世界的交互，需具備多模態(tài)感知、自主決策、實時交互執(zhí)行、通用與泛化等能力。

人形機器人（886069）目前尚未實現(xiàn)大規(guī)模應(yīng)用，主要原因或非硬件能力不足，而是大模型存在瓶頸。從產(chǎn)業(yè)進程來看，當(dāng)前機器人肢體層技術(shù)已較為成熟，而大模型的發(fā)展遠落后于硬件。當(dāng)前階段的具身大模型已具備認知、推理與規(guī)劃能力，不足之處在于難以可靠處理復(fù)雜物理世界的不確定性，同時泛化能力明顯較弱。

具身大模型主流框架為分層式與端到端式，路徑尚未收斂。傳統(tǒng)決策采用分層架構(gòu)，包括感知與互動、高層規(guī)劃、低層執(zhí)行以及反饋與增強，通過大小腦分層，人形機器人（886069）更容易落地，但分層范式存在錯誤累積的問題，且在跨多樣任務(wù)泛化時表現(xiàn)不佳。端到端框架基于感知環(huán)境和機器人狀態(tài)直接輸出具體的機器人執(zhí)行命令，將感知、語言理解、規(guī)劃、動作執(zhí)行和反饋優(yōu)化集成到一個統(tǒng)一的框架中，具備高集成度與較強泛化能力，VLA模型是端到端決策的核心。

海外具身大模型

1)典型的完全端到端架構(gòu)具身大模型包括谷歌（GOOG）DeepMind RT-2與特斯拉（TSLA）FSD。RT-2致力于通過端到端的神經(jīng)網(wǎng)絡(luò)將視覺和語言信息直接映射為機器人動作;特斯拉（TSLA）Optimus可沿用汽車FSD系統(tǒng)的技術(shù)棧，實現(xiàn)多模態(tài)輸入與實時動作輸出。2)典型的分層具身大模型包括Figure AIHelix、英偉達（NVDA）GR00TN1與PhysicalIntelligenceπ0。Helix采用“系統(tǒng)S1(快思考)+系統(tǒng)S2(慢思考)”雙系統(tǒng)架構(gòu);GR00TN1同樣采用雙系統(tǒng)架構(gòu)，并利用流匹配技術(shù)來生成動作;π0采用“預(yù)訓(xùn)練VLM+動作專家模塊”的VLA模型。

國內(nèi)具身大模型

架構(gòu)持續(xù)創(chuàng)新，能力對標海外，典型模型包括智元機器人G0-1、星動紀元ERA-42、銀河通用GraspVLA、靈初智能Psi R1及字節(jié)Seed GR-3。G0-1開創(chuàng)性提出ViLLA架構(gòu)，采用“VLM+MoE(混合專家)”;ERA-42模型是國內(nèi)首個真正意義上的端到端原生機器人大模型;GraspVLA模型將VLM與動作專家集成，是全球首個合成大數(shù)據(jù)驅(qū)動的基礎(chǔ)抓取大模型;Psi R1模型采用快慢腦架構(gòu);GR-3采用40億參數(shù)的混合變換器架構(gòu)，泛化抓取-放置能力超越π0。

數(shù)據(jù)是驅(qū)動具身大模型迭代升級的關(guān)鍵，目前主流數(shù)據(jù)訓(xùn)練方案為真機、仿真與視頻數(shù)據(jù)相結(jié)合

伴隨具身智能轉(zhuǎn)向端到端大模型，數(shù)據(jù)需求從低量單一模態(tài)數(shù)據(jù)逐步升級為海量、多模態(tài)、高精度和跨任務(wù)長程數(shù)據(jù)，其中真機數(shù)據(jù)價值最高，獲取難度最大，是具身智能落地的可靠數(shù)據(jù)源。目前真實數(shù)據(jù)采集方式主要分為VR遙操作采集、機械臂主從控制采集、數(shù)據(jù)手套遙操作等。目前主流廠家數(shù)據(jù)采集及訓(xùn)練方案多樣，特斯拉（TSLA）數(shù)采方案或轉(zhuǎn)向視頻學(xué)習(xí)，而銀河通用以物理仿真數(shù)據(jù)為主、真實數(shù)據(jù)為輔。

投資建議

1)機器人通過傳感器（885946）獲取外界和自身狀態(tài)，為具身大模型決策提供數(shù)據(jù)支持，建議關(guān)注人形機器人（886069）傳感器（885946）相關(guān)公司，如安培龍（301413）、漢威科技（300007）、福萊新材（605488）、奧比中光（688322）;2)動捕采集方案是高質(zhì)量運動數(shù)據(jù)的關(guān)鍵來源，建議關(guān)注掌握動捕解決方案的相關(guān)公司，如凌云光（688400）。

風(fēng)險提示：人形機器人（886069）量產(chǎn)進度不及預(yù)期;大模型技術(shù)進展不及預(yù)期;訓(xùn)練數(shù)據(jù)規(guī)模與質(zhì)量不及預(yù)期。

免费看黄色片的网站,91最新91精品91蝌蚪,免费观看9999网站直播,亚洲欧美激情另类,亚洲狠狠婷婷综合久久久久图片,黄色片免费在线播放,99爱在线精品视频网站

問財摘要