作者 | 黎詩韻
編輯 | 靖宇
人形機(jī)器人不是新事物,但它的熱潮在兩年前再次被喚起,隨著特斯拉發(fā)布人形機(jī)器人 Optimus、以及 ChatGPT 的出現(xiàn),整個(gè)行業(yè)爆發(fā)出巨大的想象力。技術(shù)上,它意味著人形機(jī)器人可以擁有真正智能的大腦,進(jìn)化成有自主感知決策執(zhí)行能力的智能體。而商業(yè)上,更智能的人形機(jī)器人可能會形成全新的生產(chǎn)力供給,為工業(yè)、家庭等場景帶來萬億美元規(guī)模的產(chǎn)值。 特斯拉的 Optimus 最大的目標(biāo)是服務(wù)特斯拉的汽車產(chǎn)線,這也是眾多人形機(jī)器人公司在發(fā)力的方向。今年 3 月,人形機(jī)器人公司 Apptronik 與奔馳工廠合作;8 月,OpenAI 扶持的人形機(jī)器人公司 Figure 繼續(xù)加深與寶馬工廠合作。
而和前幾次技術(shù)革命不同,中國企業(yè)在這一進(jìn)程上并不落后。
在正在舉行的 2024 世界機(jī)器人大會上,優(yōu)必選發(fā)布了全球首個(gè)面向多任務(wù)工業(yè)場景的通用人形機(jī)器人解決方案,把人形機(jī)器人在工廠的實(shí)訓(xùn)成果直接搬到了現(xiàn)場,讓觀眾現(xiàn)場觀摩人形機(jī)器人在工廠執(zhí)行質(zhì)檢、分揀和搬運(yùn)的任務(wù)。
大會現(xiàn)場,優(yōu)必選還與奧迪一汽和北京具身智能機(jī)器人創(chuàng)新中心簽署合作協(xié)議,三方會共同研發(fā)人形機(jī)器人智能化解決方案,將人形機(jī)器人引入汽車產(chǎn)線的智能搬運(yùn)、質(zhì)量檢查和過程材料操作等工位,推動人形機(jī)器人在汽車工廠的大規(guī)模應(yīng)用。

北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍、奧迪一汽工程技術(shù)部部長利貝克·托比亞斯、優(yōu)必選首席品牌官譚旻分別代表三方簽署合作協(xié)議
奧迪一汽也成為繼吉利汽車、東風(fēng)柳汽、一汽-大眾青島分公司、一汽紅旗之后,又一家和優(yōu)必選達(dá)成合作的車企。目前,優(yōu)必選是全球范圍內(nèi)合作車企數(shù)量最多的人形機(jī)器人企業(yè),而除了車企之外,與優(yōu)必選達(dá)成合作的企業(yè)還包括了全球最大的精密電子制造商富士康,以及全球第四大的綜合物流服務(wù)提供商順豐。
在這套解決方案下,優(yōu)必選先為人形機(jī)器人在工廠應(yīng)用規(guī)劃了搬運(yùn)、質(zhì)檢、分揀、螺絲擰緊、零件安裝、過程材料操作 6 大任務(wù)。目前,工業(yè)版 人形機(jī)器人 Walker S 系列已經(jīng)進(jìn)入多家車廠實(shí)訓(xùn),車企付一定費(fèi)用,人形機(jī)器人會通過大約 12-24 個(gè)月的實(shí)訓(xùn)不斷驗(yàn)證產(chǎn)品性能。
這意味著,中國人形機(jī)器人行業(yè)在走入市場驗(yàn)證(POC,Proof of Concept)階段,雖然距離想象中人形機(jī)器人在工業(yè)場景的真正通用、以及商業(yè)化落地,還有一定距離。但優(yōu)必選的選擇似乎表明,在人形機(jī)器人相關(guān)技術(shù)還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現(xiàn)有技術(shù)依然可以滿足工業(yè)場景最細(xì)小的需求、形成最小的 TPF(技術(shù)產(chǎn)品匹配)。
雖然距離想象中人形機(jī)器人在工業(yè)場景的真正通用、以及商業(yè)化落地,還有一定距離。但優(yōu)必選的選擇似乎表明,在人形機(jī)器人相關(guān)技術(shù)還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現(xiàn)有技術(shù)依然可以滿足工業(yè)場景最細(xì)小的需求、形成最小的 TPF(技術(shù)產(chǎn)品匹配)。談及人形機(jī)器人星辰大海的未來,有人認(rèn)為在實(shí)驗(yàn)室里研發(fā)一個(gè)通用具身大模型是關(guān)鍵。但優(yōu)必選認(rèn)為,盡可能地把人形機(jī)器人安排到真實(shí)應(yīng)用場景里,先把一個(gè)垂直細(xì)分場景做好,再拓展到其它更多領(lǐng)域,這也許是打造一個(gè)通用人形機(jī)器人的最終答案。
01 車企需要人形機(jī)器人
如果說大模型是技術(shù)取得了突破之后、企業(yè)急著去找應(yīng)用場景,那人形機(jī)器人則是在技術(shù)不斷迭代的同時(shí),市場的需求就已經(jīng)很強(qiáng)烈。這也要求人形機(jī)器人企業(yè)需要真實(shí)地了解市場的真實(shí)需求,利用已有技術(shù)布局來針對真實(shí)需求進(jìn)行功能研發(fā)。
事實(shí)上,優(yōu)必選提出這個(gè)工業(yè)解決方案的起點(diǎn),并不是它想落地人形機(jī)器人技術(shù)、于是找車企合作。恰恰相反,正是汽車企業(yè)有了強(qiáng)烈的需求,于是找到優(yōu)必選看、問是否能為其工業(yè)場景提供人形機(jī)器人。
這背后反映了汽車行業(yè)對人形機(jī)器人強(qiáng)烈、真實(shí)的市場需求。
汽車制造分為沖壓、焊接、涂裝和總裝四大工藝,其中前三個(gè)環(huán)節(jié)幾乎 90% 以上都由傳統(tǒng)自動化設(shè)備,如機(jī)械臂、協(xié)作臂或 AGV(自動導(dǎo)引車)等完成。但在總裝環(huán)節(jié),由于工藝相對非結(jié)構(gòu)化、復(fù)雜,其自動化率只有 20% 左右、終究離不開人工,車企招工難、成本高。
比如非結(jié)構(gòu)性的搬運(yùn)場景,工人整天要搬十幾斤重的箱子,不僅枯燥、而且對身體有損傷,崗位很難招人。又比如非結(jié)構(gòu)性的涂料場景,工作環(huán)境有高輻射、高粉塵、甚至有害化學(xué)物品,招人同樣困難。
「大家可能想象不到,一些領(lǐng)先的新能源汽車生產(chǎn)商即便有數(shù)十萬甚至上百萬的工人,但是依然長期處于不滿工的狀態(tài)。車廠工人的流動性實(shí)際上非常高。」優(yōu)必選副總裁、研究院執(zhí)行院長焦繼超表示。
在這些場景中,能像「人」一樣干活的人形機(jī)器人是急需的。傳統(tǒng)的機(jī)械臂、簡單機(jī)器人往往只能完成給定的、被規(guī)劃好的任務(wù)。 而人形機(jī)器人或具身智能的定義是,其可以自主決策、規(guī)劃、執(zhí)行,像人一樣行動——而其技術(shù)成熟度越高,通用性、泛化性就越強(qiáng),越能在不同場景、任務(wù)中切換,最終降低服務(wù)成本。
今年以來,焦繼超帶著研發(fā)團(tuán)隊(duì)走訪了接近 20 家車企,并與車企研究院和產(chǎn)線的負(fù)責(zé)人進(jìn)行了深度、持續(xù)的溝通。通過這些調(diào)研,他與團(tuán)隊(duì)梳理出了大家的一些共同需求,以及車企對于人形機(jī)器人的能力要求。
最終,優(yōu)必選得出了車企對于人形機(jī)器人的幾個(gè)基本能力要求,包括要有足夠的自主能力、靈巧操作能力、穩(wěn)定可靠性等。基于這些要求以及目前已有的技術(shù)邊界,優(yōu)必選最終選中了幾項(xiàng)任務(wù)來開啟人形機(jī)器人在車廠中的實(shí)訓(xùn),包括第一階段的搬運(yùn)、質(zhì)檢、分揀,之后,他們還計(jì)劃將實(shí)訓(xùn)任務(wù)拓展到螺絲擰緊、零件安裝、過程材料操作等。

優(yōu)必選人形機(jī)器人演示搬運(yùn)動作|圖片優(yōu)必選
盡管人形機(jī)器人領(lǐng)域的基礎(chǔ)具身大模型(一般指 VLA 視覺語言動作模型,和基礎(chǔ)語言大模型不同,它輸出的是動作)尚未有根本的技術(shù)突破,但在焦繼超看來,這并不十分重要。 「在工業(yè)里面我不是一定要跑個(gè)底座大模型,你可以理解為訓(xùn)個(gè)小模型就可以實(shí)現(xiàn)了。」他說。
給人形機(jī)器人做訓(xùn)練,實(shí)際上就是讓它在跟真實(shí)世界的交互中,提升它自主感知決策執(zhí)行的能力。
目前,主流的訓(xùn)練路徑分為兩種,一是大模型加小模型,即大模型作為「大腦」負(fù)責(zé)多模態(tài)感知、理解、規(guī)劃,而小模型作為「小腦」執(zhí)行,包括步態(tài)和靈巧操作等,這一方式已超過部分通用大模型的表現(xiàn)。另一種方式是端到端,即通過海量的數(shù)據(jù)訓(xùn)練,讓人形機(jī)器人看到數(shù)據(jù)就能輸出執(zhí)行,但這種訓(xùn)練方式更難捉摸。

人形機(jī)器人的訓(xùn)練路徑 | 圖片優(yōu)必選
優(yōu)必選表示,目前在工業(yè)場景領(lǐng)域,主要還是采用大模型加小模型的技術(shù)路線,因?yàn)槠溆?xùn)練效率更好。不過它也在做端到端的嘗試,未來面向更通用的場景,端到端的路線也許會是更好的選擇。
以搬運(yùn)場景為例,大模型先感知環(huán)境,判斷料箱的大小和重量、搬運(yùn)點(diǎn)的位置等,接著進(jìn)行路徑規(guī)劃,下命令給電機(jī),要求調(diào)整相應(yīng)的力度進(jìn)行抓取,重的貨物用大力、輕的貨物用小力,最終實(shí)現(xiàn)搬運(yùn)。
在這樣的訓(xùn)練框架下,優(yōu)必選讓人形機(jī)器人在搬運(yùn)、分揀、質(zhì)檢等任務(wù)上初步驗(yàn)證了可行性。過去,這種之前只能由人類完成的工作,現(xiàn)在都可以由人形機(jī)器人完成。
通過智能化的能力,人形機(jī)器人執(zhí)行這些任務(wù)時(shí)還具有一定的通用性、泛化性。以擰螺絲為例,人形機(jī)器人在 A 公司學(xué)會了擰螺絲,而切換到 B 公司、螺絲的型號和尺寸發(fā)生變化,機(jī)器人適配的成本很低、可以做到迅速部署。
在焦繼超看來,目前這個(gè)階段的任務(wù)在于,通過人形機(jī)器人在多個(gè)真實(shí)應(yīng)用場景中的數(shù)據(jù)反饋,不斷進(jìn)行產(chǎn)品的驗(yàn)證、優(yōu)化,為之后實(shí)現(xiàn)人形機(jī)器人在工業(yè)場景的大規(guī)模商用打下基礎(chǔ),「到時(shí)候我們把人形機(jī)器人交給客戶,它們可以直接拿它當(dāng)工人用。」他說。
02 人形機(jī)器人不是一上來就通用,而是場景由點(diǎn)及面地通用
在工業(yè)場景的應(yīng)用落地上,優(yōu)必選確實(shí)覺得自己有一種「急迫感」。這倒主要不是出于商業(yè)化的考慮,作為一家成立了 12 年的人形機(jī)器人公司,優(yōu)必選這些年已經(jīng)探索出了一條成熟的自我供血路徑——一條腿研發(fā)人形機(jī)器人,另一條腿則將相關(guān)技術(shù)「沿途下蛋」,它最重要的收入來源是 AI 教育、物流、康養(yǎng)等智能機(jī)器人服務(wù)。
在人形機(jī)器人這條腿上,現(xiàn)階段更重要的意義在于通過在真實(shí)場景的落地實(shí)訓(xùn),一是實(shí)現(xiàn)技術(shù)突破,保持技術(shù)領(lǐng)先性,二是爭取在細(xì)分場景實(shí)現(xiàn)應(yīng)用突破。
原因在于,目前制約人形機(jī)器人發(fā)展的核心要素是數(shù)據(jù)。大模型擁有海量的互聯(lián)網(wǎng)數(shù)據(jù),自動駕駛擁有海量的行車數(shù)據(jù),但人形機(jī)器人的訓(xùn)練數(shù)據(jù)則少之又少、采集困難、成本也高。
現(xiàn)在盡管目前一些公司提出,可以通過虛擬的仿真數(shù)據(jù)訓(xùn)練,但這條路也并未形成共識。比如焦繼超認(rèn)為,單純的仿真數(shù)據(jù)只是換了信息表達(dá)的方式、并不能準(zhǔn)確描述物理世界。最終,還是要依靠真實(shí)物理世界的數(shù)據(jù)、并在此基礎(chǔ)上形成仿真數(shù)據(jù),真實(shí)數(shù)據(jù)的占比至少需要 80%。
考慮到場景的采集是海量的、而采集的成本又是極高的,最合適的方式就是選一個(gè)細(xì)分場景,既能從技術(shù)上收集數(shù)據(jù)做訓(xùn)練、又能同時(shí)商業(yè)化。那么目前能跑通的這些細(xì)分工業(yè)場景,就是不錯的起步選擇。
「誰掌握了場景,誰就掌握了數(shù)據(jù)。誰掌握了數(shù)據(jù),誰就掌握了做出真正通用人形機(jī)器人的關(guān)鍵要素。」焦繼超表示。 在他看來,和大語言模型不同,機(jī)器人的大模型大概率不是一上來就通用,而是由點(diǎn)及面、慢慢實(shí)現(xiàn)通用。
談及率先能夠與多家車廠達(dá)成合作的原因,焦繼超總結(jié)為三點(diǎn):
一是技術(shù)積累。作為有 12 年歷史的人形機(jī)器人公司,優(yōu)必選在人形機(jī)器人全棧式技術(shù),包括硬件、軟件等方面都有更多積累。「實(shí)訓(xùn)一旦開始就是一兩年時(shí)間,如果車企對人形機(jī)器人公司的技術(shù)沒有足夠的認(rèn)識和認(rèn)可,大概率會認(rèn)為這家公司做不成他們想要的方案,最終不會達(dá)成合作。」焦繼超表示。
二是對客戶真實(shí)需求的認(rèn)識。如果說很多初創(chuàng)公司仍需技術(shù)「秀肌肉」,優(yōu)必選已經(jīng)經(jīng)歷過了該階段,更關(guān)注客戶需求。畢竟在一個(gè)現(xiàn)實(shí)的工廠環(huán)境中,人形機(jī)器人最重要的能力是能不能干活。
三是穩(wěn)定可靠性。早在 2021 年推出人形機(jī)器人 Walker X 時(shí),優(yōu)必選就將它用于大型展館等場景,例如,在迪拜世博會中國館,Walker X 和熊貓機(jī)器人優(yōu)悠就穩(wěn)定服務(wù)了六個(gè)月。在中國科學(xué)技術(shù)館,Walker 也服務(wù)了超過兩年。這種穩(wěn)定服務(wù)的能力,對于車廠來說尤為重要。
從小到大、從垂直到通用,優(yōu)必選將人形機(jī)器人的應(yīng)用場景擴(kuò)張分為三步:
一、今年底,從新能源汽車廠切入,在搬運(yùn)和分揀等任務(wù)進(jìn)行測試,持續(xù)穩(wěn)定性和可靠性,并實(shí)現(xiàn)小批量交付;
二、明年起,從車廠逐步擴(kuò)展到更多的場景,并推動人形機(jī)器人完成中等難度任務(wù),提升產(chǎn)品性能,逐步實(shí)現(xiàn)規(guī)模商業(yè)化;
三、從 2028 年起,進(jìn)一步拓展更復(fù)雜的任務(wù)場景,成為多任務(wù)通用性工業(yè)人形機(jī)器人。
人社部、工信部、教育部聯(lián)合發(fā)布的《制造業(yè)人工發(fā)展規(guī)劃指南》中給出的預(yù)測數(shù)據(jù)顯示,到 2025 年,中國制造業(yè)工業(yè)缺口將接近 3000 萬人,這也會是人形機(jī)器人的一個(gè)巨大的潛在市場。優(yōu)必選就表示,目前已收到來自車廠的 500 臺人形機(jī)器人意向訂單。他們認(rèn)為,隨著人形機(jī)器人等技術(shù)的引入,工業(yè)場景會形成「721」的格局:70% 是傳統(tǒng)機(jī)械臂、20% 是人形機(jī)器人、10% 是人工。這 500 臺走入工廠的「鋼鐵實(shí)習(xí)生」,正是人形機(jī)器人成為那「20%」的第一步。
那時(shí),制造業(yè)的用工短缺將不再是問題、成本也會進(jìn)一步降低,我國先進(jìn)制造的競爭優(yōu)勢也將繼續(xù)保持。而當(dāng)工業(yè)場景實(shí)現(xiàn)突破之后,人形機(jī)器人將向家庭場景進(jìn)發(fā),這是所有公司的最終目標(biāo)。
一位人形機(jī)器人創(chuàng)業(yè)者感慨道,從來沒有碰到過這樣一個(gè)時(shí)刻,國家的需求、市場的需求、技術(shù)的可行性,這三件事完美地聚焦在了當(dāng)下這個(gè)時(shí)間窗口,因此預(yù)示了一個(gè)龐大市場的到來。這也許正是優(yōu)必選等人形機(jī)器人公司,如此積極地投入、力圖搶占先機(jī)的原因。





京公網(wǎng)安備 11011402013531號