![]()
![]()
一臺(tái)人形機(jī)器人站在“客廳”中,用機(jī)械臂精準(zhǔn)夾起散落的T恤,平鋪、折袖、收角,一套動(dòng)作行云流水,1分鐘內(nèi)便將衣物疊成規(guī)整的方塊……機(jī)器人“埋頭苦干”的場(chǎng)景,在賽場(chǎng)隨處可見。
今天起,來(lái)自全國(guó)各地、超百支具身智能參賽隊(duì)伍將在上海參加一次重要“考試”。機(jī)器人不僅將在現(xiàn)場(chǎng)比拼“插花”“疊衣服”“沖咖啡”這些生活技能,還會(huì)像老技工一樣,靠“手感”去擰一顆螺絲……它們?cè)诠I(yè)、商業(yè)、家庭等多個(gè)場(chǎng)景中大顯神通,不炫技,純干活。
是誰(shuí)幫助形態(tài)各異的機(jī)器人實(shí)現(xiàn)了從“花架子”到“實(shí)干派”的轉(zhuǎn)變?是誰(shuí)讓它們開始融入我們的生活,成為生產(chǎn)、生活的可靠“搭子”?
玩“VR游戲”,讓機(jī)器人學(xué)人干活
2000年出生的鄭玉儀最近很忙碌,幾天前她從北京飛到上海,參加今天在上海張江舉辦的2025全球開發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽。
她大專畢業(yè)后在北京的互聯(lián)網(wǎng)企業(yè)寫了2年代碼,做前端開發(fā),覺得沒什么成就感,去年年底就“任性”辭職了。“我愛做手工,搭樂高、織毛衣都挺喜歡的。但對(duì)職業(yè)規(guī)劃,其實(shí)有點(diǎn)迷茫。”
她去云南昆明玩了一趟,在斗南鮮花市場(chǎng),被繽紛花海觸動(dòng),萌生了“能否讓機(jī)器人識(shí)別花材、處理花枝甚至完成插花”的想法。“我在現(xiàn)場(chǎng)看到很多人在分揀鮮花,效率低,也很勞累,就想如果讓機(jī)器人來(lái)做這些工作呢?但是流水線很復(fù)雜、鮮花也很嬌弱,當(dāng)時(shí)覺得不太可能。”但正是這一閃念,將她引向了具身智能的嶄新領(lǐng)域。今年4月,她加入了初創(chuàng)企業(yè)靈御智能,彼時(shí)該公司成立才2個(gè)月。
![]()
鄭玉儀訓(xùn)練機(jī)器人疊衣服
她還記得面試時(shí),招聘人員問了她兩個(gè)問題,“《黑神話:悟空》游戲通關(guān)了沒?戴上VR設(shè)備頭暈不暈?”
入職后,她發(fā)現(xiàn)自己的工作就像戴著VR設(shè)備打游戲:坐在操控臺(tái)前,戴上VR頭部顯示設(shè)備,眼前出現(xiàn)屏幕,這里面有機(jī)器人的 “眼睛”(實(shí)時(shí)畫面),能看清遠(yuǎn)處的情景;有 “身體數(shù)據(jù)”(電量、力量值),像游戲血條一樣直觀;還有 “指令面板”。手上拿著手柄,以第一視角操控機(jī)器人,機(jī)器人的“胳膊”和“手”隨著她的手勢(shì)緩緩移動(dòng),精準(zhǔn)地將一塊塊積木摞在一起,“看上去很酷。”
遙操作不僅是一個(gè)控制手段,更是一種數(shù)據(jù)采集方式,讓機(jī)器人“看著你怎么做”,一步步學(xué)會(huì)自己的任務(wù)。“我可能一天記錄了1000條關(guān)于拿放這個(gè)動(dòng)作的數(shù)據(jù),就能把數(shù)據(jù)‘喂’給團(tuán)隊(duì)自研的控制平臺(tái),讓機(jī)器人學(xué)習(xí),下次它的動(dòng)作就會(huì)更精準(zhǔn)。”
采集數(shù)據(jù)的過程往往是三四個(gè)小時(shí)重復(fù)同一個(gè)動(dòng)作,跟過去寫代碼相比,似乎同樣枯燥。但鄭玉儀不這么看。“過程中我能及時(shí)得到反饋,機(jī)器人學(xué)會(huì)了我的動(dòng)作,我會(huì)很有成就感。現(xiàn)在機(jī)器人在我的訓(xùn)練下,搭積木、疊衣服、倒水、套圈、擰瓶蓋、分揀垃圾都會(huì)做,越來(lái)越能干了。再說了,訓(xùn)練它的時(shí)候,我還能聊天、聽歌。”
更讓小鄭有收獲的是,她覺得在陪伴、訓(xùn)練機(jī)器人的過程中,自己也在飛速成長(zhǎng)。“有一次出差時(shí)操控機(jī)器人出現(xiàn)了問題,我只能讓到處找人遠(yuǎn)程教我,挺崩潰的。后來(lái),我自己就學(xué)會(huì)了處理這些情況,不用再麻煩別人了。每一次解決問題,都是學(xué)習(xí)的過程。不僅要機(jī)器人更能干,還要減少故障,讓它更耐用。”
入行8個(gè)月,小鄭親眼見證了機(jī)器人從“笨拙”到“靈巧”的蛻變歷程。她曾面對(duì)機(jī)器視覺模糊不清的困擾,如今已升級(jí)至高清4K畫面;從最初設(shè)備一天重啟三十次,到如今連續(xù)運(yùn)行三十天不宕機(jī);從操作時(shí)機(jī)械臂揮舞不協(xié)調(diào),到如今幾乎零延遲復(fù)刻她的動(dòng)作。她也收獲了職業(yè)生涯的高光時(shí)刻——上個(gè)月,她和團(tuán)隊(duì)帶著機(jī)器人伙伴TeleAvatar 參加了中關(guān)村具身智能機(jī)器人應(yīng)用大賽,在7 個(gè)細(xì)分賽項(xiàng)中斬獲一等獎(jiǎng)。也是在這次大賽中積累的信心,讓她毫不猶豫報(bào)名參加此次在上海舉辦的具身智能技能大賽。“我們團(tuán)隊(duì)幾乎參加了所有跟遙操作相關(guān)的賽道,很期待跟來(lái)自全國(guó)各地的隊(duì)伍比拼、交流。”
“‘遙操作’技術(shù)讓機(jī)器人能應(yīng)對(duì)復(fù)雜多變的場(chǎng)景,比如,我們可以在遠(yuǎn)離機(jī)器人的位置,甚至跨城市、跨國(guó)家完成遠(yuǎn)程控制,特別適用于危險(xiǎn)場(chǎng)景的勞動(dòng)力替代。比如,在隧道爆破作業(yè)中,需將炸藥精準(zhǔn)裝填至預(yù)先鉆設(shè)的炮孔內(nèi)。現(xiàn)在,我們就能在安全、明亮的控制室里,遠(yuǎn)程操控機(jī)器人完成爆破任務(wù)。”
回想起置身斗南鮮花市場(chǎng)的場(chǎng)景,她設(shè)想機(jī)器人能自己走到鮮花堆放處,挑出粉色玫瑰、白色洋桔梗、黃色小雛菊……把它們搬運(yùn)到指定的位置,再根據(jù)顧客需求插到不同的花瓶中。“若要讓機(jī)器人完全自主地完成這樣精細(xì)靈動(dòng)的任務(wù),通常需要依賴海量的場(chǎng)景數(shù)據(jù)與復(fù)雜的算法推演。而遙操作技術(shù)的優(yōu)勢(shì)在于,它能讓人工智能系統(tǒng)立刻投入工作——操作員遠(yuǎn)程引導(dǎo)機(jī)器人執(zhí)行任務(wù)的同時(shí),也在真實(shí)環(huán)境中高效采集著寶貴數(shù)據(jù),大幅降低了后續(xù)訓(xùn)練與迭代的時(shí)間成本,正加速推動(dòng)機(jī)器人向更高階的自主性邁進(jìn)。我相信,未來(lái)讓機(jī)器人自主‘動(dòng)手’,在鮮花市場(chǎng)當(dāng)分揀員、插花師,肯定能實(shí)現(xiàn)。”
從祛魅到癡迷,打磨機(jī)器人“小手”
在科幻大片中,機(jī)器人幾乎無(wú)所不能。從人形機(jī)器人走進(jìn)大眾視野,這個(gè)賽道變得火熱,不少人對(duì)機(jī)器人走進(jìn)日常生活也有了更急迫的期待。
工科出身的汪航卻坦言,入行后,第一感覺是對(duì)機(jī)器人“祛魅”。“它不像我想象的那么厲害,很多環(huán)節(jié)都需要人來(lái)配合,更像是個(gè)剛會(huì)走路的小孩。有了AI和大模型的助力,它成長(zhǎng)的速度正在變快。”
1998年出生的汪航,去年從上海理工大學(xué)生物醫(yī)學(xué)工程專業(yè)碩士畢業(yè)。同學(xué)大多去了醫(yī)院或者醫(yī)療器械公司,他卻加入了以研發(fā)仿生手和靈巧手為主的上海傲意信息科技有限公司。“很幸運(yùn),也水到渠成。我在學(xué)校時(shí)就參與過研發(fā)下肢康復(fù)機(jī)器人,進(jìn)公司就加入了靈巧手團(tuán)隊(duì)。”
![]()
汪航訓(xùn)練“靈巧手”做更多復(fù)雜的手勢(shì)
何為靈巧手?它是一種模擬人類手部功能的高自由度機(jī)器人末端執(zhí)行器,被稱為人形機(jī)器人走向大規(guī)模商業(yè)應(yīng)用的“最后一厘米”。“相當(dāng)于機(jī)器人本體中的一個(gè)小腦,通過算法,讓它執(zhí)行不同的動(dòng)作。”
對(duì)汪航來(lái)說,最大的挑戰(zhàn)是探索人機(jī)交互的邊界,而這個(gè)領(lǐng)域并沒什么經(jīng)驗(yàn)可借鑒。比如,要讓靈巧手抓豆腐,如何讓它抓得又穩(wěn)又準(zhǔn),還要保證豆腐完好無(wú)損?“這個(gè)過程需要算法支持,算法怎么設(shè)計(jì)和調(diào)優(yōu),一開始很困難,我只能請(qǐng)教更有經(jīng)驗(yàn)的工程師或者跟客戶反復(fù)溝通,把他們的需求一步步反映在算法的優(yōu)化過程中。通過大量的訓(xùn)練,調(diào)整參數(shù),去尋找最優(yōu)解。”
今年年中,傲意發(fā)布了能精準(zhǔn)力控的新一代靈巧手,具備6個(gè)主動(dòng)自由度,11個(gè)運(yùn)動(dòng)關(guān)節(jié),單指負(fù)載可達(dá)8公斤。“跟以往產(chǎn)品比,最大的不同在于搭載了高密度點(diǎn)陣觸覺傳感器,這使得靈巧手具有了‘神經(jīng)末梢’,能實(shí)時(shí)感知細(xì)微壓力變化,無(wú)論是捏取一片薯片還是握持重型工具,都能精準(zhǔn)適配力度。但接入傳感器的過程并不容易,“當(dāng)時(shí)新品馬上要發(fā)布,我們兩三個(gè)人花了三天時(shí)間,把傳感器的各個(gè)接口都摸透了,能采集到數(shù)據(jù),打通了鏈路。那一刻,非常有成就感。”
今年開始,汪航的工作轉(zhuǎn)到了應(yīng)用開發(fā)部門,密切與客戶溝通,做好技術(shù)支持。“我們研發(fā)的每一步都緊扣真實(shí)場(chǎng)景需求,靈巧手已在很多場(chǎng)景中落地應(yīng)用了,比如商品分類、廚房作業(yè)輔助、精密裝配等,所以實(shí)踐中遇到任何問題,我們都會(huì)快速響應(yīng)。”
傲意科技為具身智能技能大賽提供了30臺(tái)靈巧手,作為參賽團(tuán)隊(duì)的核心工具,在賽事中接受工業(yè)、服務(wù)等復(fù)雜城市場(chǎng)景的高強(qiáng)度考驗(yàn)。這幾天,汪航和團(tuán)隊(duì)忙著為30臺(tái)靈巧手部署與調(diào)試,為保障賽事用靈巧手的穩(wěn)定性與可靠性,他們每天需完成幾十萬(wàn)次的高強(qiáng)度測(cè)試。
“我還參與團(tuán)隊(duì)一起研制自由度更高、感知更靈敏的新一代靈巧手。我覺得機(jī)器人行業(yè)充滿生機(jī),初創(chuàng)企業(yè)多,年輕人多,愛好者多,挑戰(zhàn)與樂趣并存。從醫(yī)療康復(fù)到智能機(jī)器人,我始終相信技術(shù)應(yīng)當(dāng)為人服務(wù),讓機(jī)器更好地輔助人類。”
自研模型,讓機(jī)器人在“技校”越練越聰明
走進(jìn)位于上海張江模力社區(qū)的人形機(jī)器人麒麟訓(xùn)練場(chǎng),宛如來(lái)到一個(gè)機(jī)器人技校。在大廳一側(cè)的“流水線”上,機(jī)器人井然有序地站在“工位”前,兢兢業(yè)業(yè)地“學(xué)習(xí)”著不同工種的“技能”:整理桌面、放置商品、清理核電板管……
![]()
與機(jī)器人相伴,是張浩然的日常。
1998年出生的算法工程師張浩然最近經(jīng)常泡在這里訓(xùn)練機(jī)器人。兩年前,他從英國(guó)謝菲爾德大學(xué)畢業(yè)后,回國(guó)求職。“我當(dāng)時(shí)還覺得自己挺優(yōu)秀的,想著學(xué)以致用、報(bào)效祖國(guó),結(jié)果發(fā)現(xiàn)國(guó)內(nèi)的就業(yè)市場(chǎng)不需要我。”他開玩笑說,當(dāng)時(shí)投了一圈簡(jiǎn)歷,發(fā)現(xiàn)跟自己一起參加筆試面試的國(guó)內(nèi)學(xué)生都太優(yōu)秀了,自己顯得“平平無(wú)奇”。
機(jī)緣巧合,他加入了人形機(jī)器人(上海)有限公司。“當(dāng)時(shí)我們公司也剛成立,很需要做語(yǔ)言模型訓(xùn)練的人。最初條件很簡(jiǎn)陋,數(shù)據(jù)采集只能依賴主從機(jī)械臂,數(shù)據(jù)格式也不統(tǒng)一,我們團(tuán)隊(duì)五個(gè)人常常擠在一套設(shè)備前協(xié)同操作。但正是這種從零到一的過程,讓我深入理解了算法與硬件結(jié)合落地的復(fù)雜性。”
張浩然連續(xù)兩年參加了世界人工智能大會(huì),感受到機(jī)器人的飛速成長(zhǎng)。“去年,我們還主要在探索通過視覺和文本的判斷來(lái)調(diào)用不同模型,構(gòu)建一個(gè)‘大腦控制小腦’的簡(jiǎn)易系統(tǒng);而到了今年,我們已經(jīng)能夠在多種異構(gòu)機(jī)器人上成功部署我們自研的視覺-語(yǔ)言-動(dòng)作(VLA)模型,實(shí)現(xiàn)了在復(fù)雜場(chǎng)景下的多任務(wù)執(zhí)行能力。”也就是說,機(jī)器人能先看清楚、想明白(讀懂文字指令,結(jié)合看到的情況做簡(jiǎn)單思考),再調(diào)用專門的“動(dòng)作程序”干活,微調(diào)一下,就能適配不同場(chǎng)景。
“我認(rèn)為這個(gè)改變和進(jìn)步是巨大的。這個(gè)領(lǐng)域和純粹的大模型研究不同,我們既要應(yīng)對(duì)算法的快速演進(jìn),又要直面硬件和部署中的真實(shí)挑戰(zhàn)。但在一次次解決問題的過程中,我們也獲得了更強(qiáng)的成就感。”
最讓他崩潰的一次,他花費(fèi)了很多精力訓(xùn)練出的模型,預(yù)想應(yīng)該有很好的推理效率,但機(jī)器人執(zhí)行不了。“當(dāng)時(shí)真的想破腦袋,幾千行代碼一行一行查詢、驗(yàn)證,最后才發(fā)現(xiàn),是相機(jī)的顏色錯(cuò)了,相當(dāng)于機(jī)器人的“眼睛”讀取的內(nèi)容錯(cuò)了。其實(shí)只需要加一行代碼就跑通了,但我們發(fā)現(xiàn)這個(gè)問題花了整整一禮拜的時(shí)間。看到機(jī)器人終于可以按照我們的模型準(zhǔn)確抓取東西時(shí),我激動(dòng)得都快哭了。”
張浩然這次要參加家政賽道。“這個(gè)賽道要求機(jī)器人在居家情境下執(zhí)行衣物折疊、餐具整理等多種任務(wù),且環(huán)境較為復(fù)雜,非常考驗(yàn)?zāi)P偷姆夯院汪敯粜浴!彼忉屨f,泛化性是 “機(jī)器人會(huì)靈活變通、舉一反三”,魯棒性是 “機(jī)器人抗造耐折騰”,兩者都是衡量機(jī)器人 “靠譜程度” 。
“我們讓機(jī)器人熟練完成居家服務(wù)賽道的各類任務(wù),訓(xùn)練中采集的數(shù)據(jù)會(huì)匯總到模型中重新訓(xùn)練,再部署到機(jī)器人身上,以此提升任務(wù)完成率。”
原標(biāo)題:《新民特稿 | 教機(jī)器人學(xué)“做人”》
欄目編輯:潘高峰
本文作者:新民晚報(bào) 葉薇





京公網(wǎng)安備 11011402013531號(hào)