作者丨敏瀟
編輯丨邱曉芬、蘇建勛
在2024的WAIC大會上,花樣層出的人形機器人無疑成為全場最大的亮點。
在進入會場之前,WAIC主辦方專門設置了一個展臺,放了18臺當下炙手可熱的人形機器人“先鋒矩陣”,上拉橫幅,“十八金剛,眾創未來”。
在H1館,這次參展的機器人相關企業多達45家,為了吸引眼球,各家的機器人都秀出了真功夫——
「宇樹科技」的機器狗在展臺上一下又一下后空翻,引得臺下觀眾驚呼連連;「逐際動力」的動力雙足機器人,為了展示耐用性,淪為了觀眾們的“泄憤工具”,在一輪輪的猛烈踢踹下,依然堅挺。

「宇樹科技」機器狗 圖源:作者拍攝
特斯拉機器人Optimus二代,在被馬斯克官宣七個月后的首次展出,自然成為全場焦點之一。可惜的是,Optimus這次被封在了玻璃里,但這也擋不住展柜前的人頭攢動,觀眾們紛紛拿出手機和它合影留戀。
據《智能涌現》作者了解,參展的人形機器人達25款之多。不過,大家在玩夠了之后,也沉淀了一些冷思考。
在WAIC展會中,宇樹、達闥等多個人形機器人的展臺旁,不少觀眾們的問題出奇一致——“它(人形機器人)的主要應用場景是什么?可以做哪些工作?”
人形機器人,長了腦子
具身智能(Embodied AI),指的是機器通過感知交互,像人一樣感知周圍環境變化并作出相應反應,具備敏銳而靈活的感官。
在沒有AI充當機器人的智慧“大腦”之前,機器人的軀殼無法與周圍環境互動,更談不上感知、理解世界。
而這次的WAIC上,這波人形機器人最大的特點是,都“長腦子”了——酷炫的外表內,各家基本都裝上了AI驅動的多模態大模型大腦。具體的表現是,這些人形機器人都能敏銳得對現實環境進行捕捉,看見、理解物理世界中的事物。
在此次WAIC中,「跨維智能」的機器人展示了對不同形狀和重量物品的識別和抓取能力。
據介紹,「跨維智能」的機器人支持多模態機動、感知、交互和操作,具備擬人化的運動控制能力。在此前抓取桌面隨意擺放的物品的基礎上,該機器人可以在人們打碎玻璃杯后,準確抓取形態各異、不規則曲面且帶反光的玻璃碎片,體現了人形機器人對隨機狀況的判斷和應變能力。
具身智能公司「穹徹智能」,則推出了穹徹具身大腦Noematrix Brain,在完全開放的場域中,Noematrix Brain展示了疊衣服和削黃瓜。
這些看起來日常的動作,卻隱含了很多的隨機性和不確定性。比如,展臺現場的工作人員將衣服隨手一丟,機器人就能馬上找到衣服的衣角,邊對邊、角對角,整齊的疊起來擺在一旁。

「穹徹智能」靈巧手 圖源:作者拍攝
在現場,工作人員不間斷的給機器人多個大小不一、長短各異的黃瓜。機器人都能準確判斷黃瓜的曲面形態,一只“手”抓起,另一只“手”快速削皮。這無疑需要機器人擁有堪比人類的對復雜、不規則事物的理解程度。
想讓人形機器人從實驗室真正的走進生活,在更多的商業化場景中得到應用,機器人就需要有更成熟的大腦,以承擔更高算力的工作,以具備在現實生活中的自主學習和適應能力。
在WAIC論壇中,「宇樹科技」CEO王興興也表示,對于具身智能而言,能夠理解時間、空間以及物理規律的世界模型非常重要。
從象牙塔,到進工廠“擰螺絲”
盡管WAIC上展臺的機器人熱鬧非凡,聰明程度也比去年提升了不少,但人形機器人的應用場景依舊有限。
「傅立葉」、「逐際動力」等多個機器人廠商工作人員告訴《智能涌現》,人形機器人目前依舊面臨技能庫相對單一、應用數據較為片面等現實問題,難以在有多重干擾、相對隨機的現實生活中實現大規模投放。
《智能涌現》了解到,目前大部分主流人形機器人廠商,出貨渠道還是以學校和科研所為主。不過,行業中也在嘗試走出象牙塔,工廠是人形機器人廠商們瞄準的第一片星辰大海。
比如,在 WAIC上,特斯拉二代人形機器人Optimus就嘗試往工廠去落地,特斯拉的動作也相當激進。
根據特斯拉方面介紹,他們的Optimus在短短一年的時間內,已經進化出了感知和觸覺——舉個例子,Optimus已經能夠分辨他們手里拿的是50克的雞蛋還是一百斤的石頭。
此外,特斯拉還把用在車上的視覺神經網絡和FSD芯片,放到了Optimus身上,讓機器人也能模仿人類對電池進行分揀訓練。根據特斯拉方面的設想,大概會有1000個Optimus,會進工廠搬運、分揀電池了。
此外,此前機器人廠商「優必選」也嘗試與一汽-大眾達成合作,引入工業版人形機器人Walker S,開展汽車制造過程中的螺栓擰緊、零件安裝、零件轉運等工作。

「優必選」人形機器人Walker S
讓人類從重復性高、環境惡劣的工廠解放出來,是人形機器人走出象牙塔之后的第一個重要場景,也是它們重要的使命。
不過,當人形機器人要真正走向人類世界,難題還有很多。
多名人形機器人展臺工作人員告訴《智能涌現》,人形機器人的落地需要有兩套數據來打底——物理世界的模型和機器人行為模型。
這兩套模型的實際落地各有難度。物理世界的數據龐雜且煩瑣,要讓機器人習得,不僅需要豐富的數據源,要準確完成動捕也需要更長的訓練時間。
在多模態大模型的控制下,機器人現在雖能完成更復雜的動作,但距離完全融入日常生活、取代繁瑣人力勞動仍需要時間。人與機器在同一場域出現,給人形機器人的正常運作帶來了更多的隨機性和不可控因素,進而使人形機器人在面對非結構化場景時仍無法還無法做到隨機應變。
成本也是一個巨大的桎梏。
據《智能涌現》作者了解,「達闥機器人」報價39.9萬元起、「天鏈機器人」價格在50萬-100萬元之間、宇樹H1單臺售價約65萬元、「樂聚公司」的“夸父”機器人單價達60-80萬元。
還在起步階段的人形機器人仍極高的研發成本和較長的研發周期,在沒有實現規模化投產之前,大多人形機器人廠商依然不具備強有力的盈利能力。
根據《2024年中國人形機器人行業研究報告》,人形機器人按量產規模不同,降本大致可劃分為三個階段:小批量千臺量級生產,降本20%~30%至約10萬美元;萬臺級別降本50%至5萬美元;數十萬至百萬臺大規模量產,降本70%~80%至2萬~3萬美元。
此外,具備交互功能和感知能力的機器人,需要裝備完全的大腦、小腦,這都提高了機器人的生產成本。而這背后所支持的芯片,依然無法實現100%國產。
「本末」在內的多個人形機器人廠商告知《智能涌現》,產品的芯片依然依賴于英偉達的進口,“我們能做到90%以上的零部件依靠國產,目前正在和華為探討接下來的合作,希望后續能做到100%國產”,人形機器人研發公司「星動紀元」的相關負責人透露。
隨著馬斯克宣布批量生產Optimus機器人,及多家企業爆發式涌入人形機器人行業,不少機構和資方將2024視為人形機器人量產元年。
然而,根據WAIC現場來看,因技術、價格等限制,人形機器人的商業化落地仍處于瓶頸期。
end





京公網安備 11011402013531號