數據短缺、泛化能力不足等核心瓶頸,是具身智能商業化路徑上反復被提及的問題。近日,商湯科技旗下大曉機器人正式發布行業首創的ACE具身研發范式、首個開源且商業應用的開悟世界模型3.0(Kairos 3.0)以及具身超級大腦模組A1,標志著具身智能領域正從“硬件競賽”轉向“大腦升級”。
![]()
在發布會現場,商湯科技聯合創始人、執行董事王曉剛向與會者展示了一個“機械臂夾取水杯”的視頻。這并非實拍,而是由開悟世界模型3.0生成的AI模擬場景。“機器人企業或車企可以使用這些AI生成的視頻作為訓練素材,比實拍更便捷,還能生成危險場景規避現實風險。”大曉機器人相關工作人員向記者解釋。
為機器人搭建虛擬學校
這一場景背后,是整個行業正在經歷的深刻變革。過去幾年,機器人領域競爭焦點集中在硬件性能上——誰的機械臂更靈活、誰的傳感器更精準、誰的電池續航更長。但隨著特斯拉、Figure AI等巨頭集體放棄此前依賴的真機遙操路徑,轉而探索純視覺學習方案,行業共識逐漸形成:具身智能的未來,不在于“軀體”有多強,而在于“大腦”有多聰明。
“數據始終是AI進化的核心支撐。”王曉剛指出,“純視覺學習方案希望讓機器人通過觀看海量視頻,直接習得人類的動作與智慧。但這種學習方式缺乏對三維物理世界的力學規律、物理屬性和動作意圖理解。”
![]()
比如,機器人可以通過看視頻學習“拿杯子”,卻無法分辨塑料杯子和玻璃杯子所需力度,也很難理解“人喝水”這一動作的核心意圖,這種缺乏物理規律和因果邏輯的學習方式,存在難以逾越的“現實鴻溝”。
此外,數據采集的成本也相當高昂,且難以泛化。一位業內人士向記者透露,傳統數據采集方式中,一臺機器人硬件成本動輒幾十萬,采集員需要全天候值守,通過真機遙操重復上千次相同動作,才能收集到一組可用數據。更致命的是,為A型號機械臂訓練的抓取技能,無法直接應用到B型號上。“世界模型以及具身超級大腦模組A1等的推出,意味著具身智能研發路徑的根本性轉變,在一定程度上解決了行業長期面臨的數據短缺、泛化能力不足等核心瓶頸。”
此次大曉機器人提出的“環境式數據采集”路徑,采用“以人為中心”的數據采集體系,通過跨視角多模態設備,融合視覺、觸覺、語音、力學規律等多維度數據,為機器人構建起了基于物理基礎的3D資產庫,全面覆蓋具身模型訓練所需的各類交互信息。
![]()
![]()
比如在即時零售倉儲場景中,該方案已實現多視角數據采集,覆蓋數萬種SKU,完成倉儲分揀與打包全流程,涵蓋五大階段13個“原子動作”;在居家、零售等多元場景中,也已實現對人體自然行為、物品交互軌跡的精準捕捉,甚至能復現遙操作范式下難以實現的生鮮抓取、精細化放置等任務。
開源破解生態困局
在參與者眾多的具身智能賽道,還一直存在另一個問題:國產芯片難以適配多種模型,模型不開源、芯片架構不透明,上下游溝通成本極高。而大曉機器人此次宣布,開悟世界模型3.0將面向全行業開源開放。
“我們開源模型,芯片廠商能直接基于模型優化算法,效率提升了數倍。”王曉剛解釋。此外,開源還破解了場景覆蓋不足的行業痛點。具身智能的應用場景無限多樣,從家庭服務到工業生產,從醫療護理到物流倉儲,每個場景的需求都千差萬別。單一企業無論實力多么雄厚,都無法窮盡所有場景的數據采集和模型優化。
“我們自己能接觸到的場景是有限的,只有讓全球開發者參與進來,才能讓世界模型覆蓋更多垂類場景。”王曉剛坦言。
![]()
據悉,開悟世界模型3.0已與沐曦股份、壁仞科技、中科曙光等多款國產芯片完成適配。為降低開發者門檻,大曉機器人還同步推出了開悟具身智能世界模型產品平臺。該平臺內置支持11大類、54個細類,累計328個標簽,覆蓋115個垂類具身場景。開發者只需輸入簡單指令,就能快速生成可視化的任務模擬內容。
根據國際機器人聯合會(IFR)的數據,2024年面向專業場景的服務機器人銷量接近20萬臺,同比增長9%,搬運、酒店與清潔是主要應用類別,勞動力短缺與老齡化需求是重要驅動力。
然而,麥肯錫報告指出,目前全球涉足人形機器人的公司不少,但真正推進到規模化試點或預商業部署的仍是少數。摩根士丹利研究顯示,預計到2050年人形機器人相關市場規模可能達到5萬億美元,但判斷在2030年代中期之前發展相對緩慢。
“從ACE范式重新定義數據采集,到世界模型重構機器認知,再到開源戰略重塑產業生態,大曉機器人的一系列舉措正在為行業注入新的活力。”一位市場觀察人士評價道,“然而,真正的挑戰才剛剛開始。如何將技術優勢轉化為商業價值,如何在不同場景中實現規模化落地,如何構建可持續的商業模式,這些都是產業需要共同面對的課題。”
采寫:南都·灣財社記者 胡雯雯





京公網安備 11011402013531號