機器之心報道
編輯:佳琪、澤南
要想造出一款真正擬人的機器人有多難?
通常機器人動起來,渾身的關節都會發出咔嗒聲,但被 OpenAI 看到的創業公司 1X 卻能做到不一樣的事情,他們上周公開的新款人形機器人 NEO 可以做到安靜且實用。如果我們把視頻的音量調高,才能聽到它彎腰撿起背包時電機發出的輕微嗡嗡聲。
看完這個視頻,真想問一句,這真不是個穿著皮套的人類嗎?
如今的工業機器人可以把動作做得很快,但它在與東西接觸之前,需要把速度減到極慢。為確保安全,這些機器人往往需要被關在安全籠中,而 NEO 卻能輕柔地摟住視頻中的女生,自然流暢地把書包遞給她。這是如何做到的呢?

1X Technologies 的 AI 副總裁 Eric Jang 寫了一篇博客,公開了 NEO 背后的技術。

他稱這篇博客是一篇電機慣量和齒輪系統的教程。在加入 1X Technologies 之前,Eric Jang 曾在谷歌的機器人研究部門任職 6 年,但他坦言,直到加入 1X Technologies,他才深刻領悟到這些概念有多重要。
通過親自進行物理計算,Eric Jang 更加堅定地認為,輕質且具有高扭矩的電機是打造具有學習能力的通用機器人的關鍵。
噪音大是因為關節動能轉換效率低下?
設想有一個重量為 3 公斤、半徑為 0.4 米的輪子,它以每秒 5 弧度的速度旋轉。從輪子上延伸出一根杠桿,這根杠桿將與一個固定不動的木塊發生碰撞。假設這次碰撞完全是非彈性的,這意味著輪子在碰撞后將停止旋轉,不會木塊上反彈。為了簡化計算,我們假設杠桿臂沒有質量,僅用于阻止輪子的旋轉。


在現實環境的非彈性碰撞中,輪子和木塊的總動量守恒,而它們的總動能則不會。因此,系統的旋轉動能將小于 3 焦耳。
能量是一個守恒量,那么其余的動能去哪了呢?
答案是,部分動能轉化為了運動,剩余的動能則以熱能、聲音和內部材料變形的形式消耗掉了。當你聽到機器人在移動時發出巨響,那是因為動能的傳動效率低下,將機械功轉化為了聲音,能量被浪費了。
由于木塊阻止了杠桿的移動,導致輪子的新速度降為零,相應的動能也降至零。這意味著要使輪子停止旋轉,必須將全部的動能轉化為其他形式的能量。幸運的是,3 焦耳并不是很大的能量,這相當于一只小狗以 1 米 / 秒的速度小跑著撞向你并停下來。
加入齒輪箱后的碰撞
把上面的系統稍作修改:現在我們有兩個輪子,每個輪子的質量為 1.5 千克,半徑為 0.4 米。這兩個輪子分別以 5 弧度 / 秒和 50 弧度 / 秒(即第一個輪子速度的 10 倍)的速度旋轉,并與一個固定的木塊發生碰撞。第二個輪子的旋轉速度是第一個輪子的 10 倍,通過齒輪裝置驅動第一個輪子。這種設置相當于一個 10:1 的齒輪減速比,它降低了杠桿的最終速度。
系統的動能是兩個輪子旋轉動能的總和。和上一個例子一樣,系統在碰撞后會靜止,所有動能必須以熱量、噪音和材料變形等形式耗散。

雖然杠桿接觸木塊的速度與之前相同,但總動能(150 焦耳)卻是原來單輪系統的 50 倍!如果按機器人齒輪箱的標準,將齒輪比增加到 100,那么需要耗散的總動能將達到 15000 焦耳。
這大致相當于一個棒球以每小時 1000 英里的速度與你相撞。在這種速度下,杠桿碰撞到的任何物體,都會被徹底摧毀。當然,齒輪系統本身也將無法幸免。
這可能有點反直覺,因為齒輪連動裝置往往是出于安全設計的。如果杠桿的最終速度保持不變,輪子的總質量也不變,也不設置木塊阻止杠桿的運動,把兩組裝置的運動分別錄下來觀察,那么光看視頻,看不出區別。但是,一旦涉及到碰撞 —— 尤其是那些意料之外的碰撞 —— 情況就會大不相同。
旋轉電機的物理原理,對于人形機器人安全地與世界發生接觸至關重要。大多數人形機器人公司選擇將機器人部署在工廠而不是家庭中,是因為它們依賴于僵硬的高速齒輪傳動系統。
正如前文中那個棒球「毀天滅地」的動能,這種系統在人身邊并不安全,因此,需要用防護籠把他們圍起來。

關在防護籠里的機器人
試想,如果想讓機器人快速地端來一杯咖啡,那么需要它肢體的末端執行器快速移動,這意味著在機器人的肢體和齒輪的另一側,必須有一個轉速遠遠超過末端執行器的電機在運轉。由于動能與角速度的平方成正比,機器人的動作實際是在由高速旋轉的齒輪的慣性控制著,而非機器人的肢體鏈路本身。MIT 的 Russ Tedrake 教授在他的課上,對這些違反直覺的機器人動力學現象進行了精彩的闡釋。

課程鏈接:https://manipulation.csail.mit.edu/robot.html
那么,既然齒輪箱又耗能又不安全,為何還要使用它們呢?
原因在于齒輪箱發揮了關鍵的機械杠桿作用:許多電機在單獨工作時無法提供足夠的扭矩,所以工程師們會在高速電機上安裝齒輪,犧牲速度來換取必需的扭矩。
這種齒輪系統是「剛性」的,不能「反向驅動」,一旦齒輪開始轉動,它們就會緊緊地咬合在一起,很難再往回轉。因此在齒輪箱的另一端,需要施加更大的力量來抵抗高速電機產生的旋轉力。
基于以上考慮,1X Technologies 在的過去十年中一直致力于制造高扭矩、低轉速電機,最大限度地提升傳動系統的安全性。得益于 NEO 機器人采用的齒輪比較小、重量較輕的電機和驅動系統,它成為了首款真正意義上能夠安全融入家庭環境的家用機器人。
重新定義真人視頻對于機器人訓練的意義
除了從機器人處收集的數據,研究者們也可以采用真人執行任務的第一人稱視角視頻來訓練機器人,思路是這樣的:
1. 數據是通用機器人進步的「瓶頸」。機器人硬件價格昂貴,聘請人類遠程操作員使用笨重的硬件執行任務,費用也同樣不菲。而且遠程操作的效率很低,遠遠低于人類直接完成任務的速度。
2. 如果我們將頭戴式攝像機綁在人們身上,讓他們戴上能遮住肉體的大號橡膠手套,這樣很快就能收集到人們從事各種家務和任務的大量數據集。普通人每天在日常生活中,都會不自覺地完成大量不同的動作和操作任務。雖然直接感知原始運動輸出存在難度,但我們可以通過分析視頻中的姿勢變化來推斷動作。在更先進的硬件出現之前,這種數據收集方式有助于打破通用機器人發展的障礙。
3. 互聯網上有許多第一人稱和第三人稱的視頻,可以訓練機器人識別和學習人們在視頻中進行的各種活動,從而進一步擴大我們的數據規模。
在擴大這類數據收集規模之前,還需要注意一點,我們體內沒有快速旋轉的部件,與轉速為 5000 RPM 的電機相比,肌肉的動能非常低,我們在移動時所攜帶的有效質量也要小得多,因此會發現雖然機器人的關節角度可能與人類大致相同,但它的旋轉電機提供的有效質量可能過大,無法靈巧地完成任務。
即使我們開發出了高效的動作控制策略,機器人在執行如輕松開關電燈或優雅奔跑等動作時,仍然無法達到人類的速度和流暢度。這是因為機器人在接觸物體時所施加的力與人類存在顯著差異。
那么想要把人類的視頻快速轉化成為機器人的運動策略,還需要以下的方法:
1. 一款像 NEO 非常順從和靈活的機器人
2. 讓機器人以慢于 1 倍的速度跟蹤視頻的運動軌跡,而非直接復制「 人類硬件」的動態。不過這只適用于靜態操作任務,對于在廚房里折疊衣服和準備食物等需要接觸很多物體的任務來說,不太適用。
3. 將運動規劃與動態規劃解耦,讓運動規劃專注于達到目標位置,而動態規劃則集中于控制發生碰撞時的力。





京公網安備 11011402013531號