“竟然沒有一支參賽隊伍能完成這個任務?”
10月24日,智元機器人與OpenDriveLab在全球學術頂尖會議IROS中主辦的“AgiBot World Challenge @ IROS 2025國際挑戰賽”剛剛落幕。在現場,第一財經記者看到了11支來自清華、香港大學、阿里云等頂尖學府、機構的參賽選手利用自己訓練的模型進行部署作業。
相比其他任務的完成率,在機器人掛零食這個任務上,所有參賽隊伍盡數失敗,這讓第一財經記者感到十分驚訝。
從疊衣服、倒水到物流分揀、打包、再到掛零食、用微波爐加熱食物,比賽現場,這六個任務分別被劃分在家居、工業、超市這三類環境中,由智元的機器人G1來完成,選手只能使用一個模型來應對所有任務。
除了已經開源的數據集之外,智元會給每支隊伍提供200條有關任務的真機數據來進行訓練。這意味著這場比賽,比拼的已不再是單一算法的優劣,而是模型在多場景下的泛化與穩定性,以及團隊的工程化能力。
在原本的設想中,機器人在掛零食這個任務中,應該利用抓夾抓起零食,掛到貨架當中。每一個動作成功后都應該獲得相應的分數。但在實際的比賽過程中,幾乎沒有一個隊伍能夠完成這套動作序列。在這項任務中完成率最高的隊伍也僅僅是拿到了“用抓夾抓起零食袋”的分數。
![]()
“這個任務現場的干擾因素太多了。”清華大學智能產業研究院(AIR)的博士生鄭金亮告訴第一財經記者,任務本身其實沒有太多復雜的動作表現,機器人只需要識別出貨架前方的掛鉤,將手中的包裝袋掛上,這項任務對機器人視覺識別和空間定位的精度要求極高。
比賽現場的情況則更為復雜。“如果堆疊在框里的零食包裝都是一種顏色的,機器人在視覺上難以分辨前后層,抓取的難度就比較大”。再加上掛鉤本身體積比較小、形狀細長,在攝像頭視野中僅占極少像素點,這讓模型很難穩定識別出目標位置。
“我們模型其實已經能識別出要掛的物體,也能執行放置動作,但因為視覺信號噪聲太多、掛鉤點太細小,最終還是沒能成功完成。”鄭金亮所在的團隊在比賽中拿到了Manipulation(操作)賽道的第一名,但在這個掛零食任務中,只拿到了抓取零食袋的分數。
值得一提的是,智元機器人的產品經理趙澄玥告訴第一財經記者,在設置比賽任務的時候,她原本以為疊衣服會是最難的任務。“因為柔性物體的可變形特性太強了,抓取點、受力方向、材質摩擦力這些細節都會影響動作的穩定性和成功率。”趙澄玥解釋道。
但從實際表現看,不少參賽隊伍卻能順利地將衣服折疊成標準的方塊狀,甚至在倒水、加熱等長程任務上也表現出更高的完成率。這在一定程度上說明,參賽團隊在模型預訓練與模仿學習方面的積累,已能支撐機器人應對中等復雜度的操作任務。
![]()
換句話說,行業在“如何讓機器人學會做動作”上,已經取得顯著進步。真正的難題,正在從動作層轉向“理解世界”的層面,比如在視覺噪聲、空間定位、物理交互等更具現實擾動的場景中,模型如何保持穩定。
在智元具身解決方案與生態總監沈詠劍看來,這場比賽的意義并不止于比拼模型性能,更在于讓不同研究路徑在同一個平臺上“跑通鏈路”。
“學術團隊做的是方向探索和天花板的探索,他們驗證的是事情能不能被模型做到。”沈詠劍告訴第一財經記者,“但真正的工業落地,從‘可行’到‘可用’,中間還有很長的一段工程化距離。”他解釋,算法和模型的進步可以解決“能不能做”的問題,但“能不能真正落地”,往往取決于硬件調試、控制優化、系統集成等工程環節。
去年12月,智元機器人于發布并開源了百萬真機數據集AgiBot World,并逐步在生態發力。“通過我們自建的數據集、開源的模型體系,以及提供給開發者的二次開發平臺和接口,我們希望把這條從數據、模型、仿真和真機部署的完整鏈路搭建好。”在他看來,這次比賽更像是一次對具身智能基礎設施的系統性驗證,讓大家在一套穩定的機器人硬件本體和開發工具鏈基礎上,跑通從算法研發到測試的完整流程,進一步降低研發門檻,也能吸引更多開發者加入。
在這場國際挑戰賽結束之后,智元也發布了新的二次開發平臺“靈創”,該平臺此前已經在8月份的智元機器人合作伙伴大會中有過預告。靈創平臺能夠通過AI視覺動作提取、智能重定向算法和云端模仿學習框架,進一步降低了二次開發的參與門檻。
從“掛零食”的失敗,到“疊衣服”的突破,再到不用編程就可二次開發的訓練平臺,IROS賽場上的一連串實驗與驗證,也是機器人發展的一個真實橫截面。當算法的邊界不斷逼近現實世界,工程化與全平臺工具的構建能力,正成為推動通用機器人落地的關鍵變量。





京公網安備 11011402013531號