21世紀(jì)經(jīng)濟(jì)報(bào)道記者孫燕 上海報(bào)道
如果說2024年是人形機(jī)器人量產(chǎn)元年,2025年則普遍被認(rèn)為是人形機(jī)器人商業(yè)化元年。
尤其今年下半年以來,人形機(jī)器人訂單井噴:優(yōu)必選中標(biāo)價(jià)值1.26億元的廣西具身智能數(shù)據(jù)采集及測試中心設(shè)備采購及安裝項(xiàng)目;智元機(jī)器人獲得了來自均勝電子、龍旗科技等企業(yè)的數(shù)億元訂單;宇樹中標(biāo)中國移動(dòng)、上海大學(xué)等訂單。
![]()
從中標(biāo)項(xiàng)目、采購訂單、預(yù)訂單、意向訂單以及銷售框架合同看,人形機(jī)器人在科研教育、文娛商演的基礎(chǔ)上,正陸續(xù)在數(shù)據(jù)采集、汽車制造、3C制造等場景商業(yè)化落地。
在成千上萬的場景中,人形機(jī)器人商業(yè)化的可行路徑何在?由易到難,是整個(gè)行業(yè)心照不宣的選擇。
智元機(jī)器人合伙人、高級副總裁、通用業(yè)務(wù)部總裁王闖在2025可持續(xù)全球領(lǐng)導(dǎo)者大會(huì)期間的圓桌對話中分享了他眼中的人形機(jī)器人落地路線:先進(jìn)入不與物理世界接觸,能發(fā)揮人形機(jī)器人運(yùn)動(dòng)能力、交互能力以及大語言模型、多模態(tài)模型優(yōu)勢的場景;再拓展到與物理世界接觸,但規(guī)則簡單、物體剛性且精度要求較低的場景;最終進(jìn)入柔性、高精度場景。
具體到不同場景中,也有落地難易之分。
以養(yǎng)老場景為例,王闖在接受21世紀(jì)經(jīng)濟(jì)報(bào)道等媒體采訪時(shí)分享道,退休之后可以分為三個(gè)階段:第一階段人們的行動(dòng)能力較好,對機(jī)器人的需求在于陪伴;第二階段人們的行動(dòng)能力越來越不便,對于機(jī)器人的需求在于輔助;第三階段人們的行動(dòng)能力較差,需要機(jī)器人提供24小時(shí)看護(hù)。“難度是逐漸增加的。我們今年開始探索第一階段,由人形機(jī)器人在養(yǎng)老院跳舞、說相聲、表演節(jié)目。”
近日在首屆合作伙伴大會(huì)上,智元宣布聚焦講解接待、文娛商演、工業(yè)智造、物流分揀、安防巡檢、商用清潔、數(shù)采訓(xùn)練、科研教育八大場景,推出了定制化解決方案。
而在明確八大商業(yè)化場景之前,智元也曾撞過“南墻”。王闖回憶道,該公司曾嘗試做一款上下料機(jī)器人。“我們原來以為很簡單,后來發(fā)現(xiàn)它需要力控、非常精密的感知以及全身控制,而且用著用著會(huì)變形。”
這樣的場景確實(shí)存在機(jī)器人需求,但如果“死磕”在上面研發(fā),ROI(投資收益率)會(huì)很低。“最后我們形成了一套方法論:如果當(dāng)前技術(shù)水平高于場景所需的技術(shù)水平,就開發(fā);如果前者低于后者,并且未來一年內(nèi)都難以高于后者,就不開發(fā)。”
銀河證券歸納了兩個(gè)篩選人形機(jī)器人易于落地應(yīng)用場景的角度,一是技術(shù)可實(shí)現(xiàn)性,即在容錯(cuò)率高、執(zhí)行速度/同步性要求不高、可重復(fù)糾錯(cuò)、易于收集數(shù)據(jù)的場景具備率先落地優(yōu)勢;二是成本效益,即在區(qū)別于自動(dòng)化、能體現(xiàn)物體/任務(wù)/環(huán)境泛化性,能真正提高效率或降低死傷率的場景具備率先落地優(yōu)勢。
中短期來看,銀河證券看好具身智能機(jī)器人在工業(yè)物流、機(jī)構(gòu)養(yǎng)老、特種環(huán)境(轉(zhuǎn)爐煉鋼、石油化工、電力巡檢),以及toC陪伴、玩具機(jī)器人場景中的應(yīng)用。
在落地難度階梯圖上,人形機(jī)器人走進(jìn)家庭的難度最大,還需要解決成本、安全性、任務(wù)成功率、復(fù)雜任務(wù)泛化性等難題。
石頭科技(688169.SH)副總經(jīng)理烏爾奇在圓桌上也指出,機(jī)器人走進(jìn)家庭是挑戰(zhàn)性最大的任務(wù)。以室內(nèi)清潔為例,一方面家具沒有標(biāo)準(zhǔn),機(jī)器人在沒有標(biāo)準(zhǔn)的世界中自由穿行很困難;另一方面地面上往往存在雜物,可能卡困機(jī)器人。
“去年人形機(jī)器人還走不穩(wěn),WAIC基本也都是靜態(tài)展示,今年已經(jīng)能看到人形機(jī)器人滿地跑了,運(yùn)動(dòng)能力飛速發(fā)展。”王闖指出,當(dāng)前人形機(jī)器人運(yùn)動(dòng)和交互能力逐漸展現(xiàn)出超越人類的趨勢,但作業(yè)能力距離人類還有較大差距。
盡管人形機(jī)器人已飛速發(fā)展、開始商業(yè)化落地,但規(guī)模化落地仍“在路上”。
業(yè)內(nèi)普遍認(rèn)為,傳感器等核心硬件性能不足是制約人形機(jī)器人規(guī)模化落地的首要瓶頸。仙工智能科技股份有限公司創(chuàng)始人兼CEO趙越指出,大模型的成功不僅源于海量數(shù)據(jù),更源于這些數(shù)據(jù)是結(jié)構(gòu)化、可量化、易于學(xué)習(xí)的。如自動(dòng)駕駛大模型的視覺數(shù)據(jù)是像素化的,能夠被訓(xùn)練。
但對于人形機(jī)器人而言,僅靠視覺遠(yuǎn)遠(yuǎn)不夠,它必須具備觸覺,以感知力的大小、物體的材質(zhì)、形狀、紋理和溫度。“我們能否通過材料學(xué)、生物學(xué)的突破,研發(fā)出像素級別的傳感器,是人形機(jī)器人的瓶頸之一。只有精細(xì)化、觸覺化、像素級別的傳感器,輸出的數(shù)據(jù)才有訓(xùn)練價(jià)值。”
中國信通院研究指出,硬件方面,機(jī)器人上肢要想實(shí)現(xiàn)精細(xì)化操作,則依賴高自由度的靈巧手,但手部觸覺傳感器、執(zhí)行機(jī)構(gòu)等關(guān)鍵部分仍存在問題。此外,電池續(xù)航、成本、端側(cè)算力等也是機(jī)器人規(guī)模化應(yīng)用的重要難題。除硬件以外,軟件其實(shí)是機(jī)器人落地的更大挑戰(zhàn)。大模型的本質(zhì)是數(shù)據(jù)驅(qū)動(dòng),只有基于龐大的數(shù)據(jù)量來訓(xùn)練,才能實(shí)現(xiàn)智能的涌現(xiàn)。
當(dāng)前,業(yè)界正通過開源大模型、數(shù)據(jù)集、本體設(shè)計(jì)、工具鏈等,推動(dòng)行業(yè)協(xié)同創(chuàng)新。
如在大模型方面,今年業(yè)界已推出并開源了多款人形機(jī)器人大模型,包括智元開源的GO-1通用具身基座大模型、宇樹科技開源的UnifoLM-WMA-0——跨多類機(jī)器人本體的開源世界模型-動(dòng)作架構(gòu)、北京人形機(jī)器人創(chuàng)新中心開源的WoW具身世界模型。
王闖告訴記者,機(jī)器人需要很強(qiáng)的泛化性。大模型能夠支撐其在千變?nèi)f化的場景中達(dá)到“60分”的及格線。但對于具體場景,還需要進(jìn)行針對性的增強(qiáng)訓(xùn)練,形成具體的小模型——人形機(jī)器人只有在某一場景做到95分以上,才能逐漸落地。
在數(shù)據(jù)集方面,宇樹科技開源了UnitreeG1機(jī)器人操作數(shù)據(jù)集,北京人形機(jī)器人創(chuàng)新中心聯(lián)合北京大學(xué)推出了RoboMIND大規(guī)模多構(gòu)型智能機(jī)器人數(shù)據(jù)集,智元機(jī)器人開源了AgiBot World數(shù)據(jù)集。





京公網(wǎng)安備 11011402013531號