
谷歌DeepMind于周二發布了一款名為Gemini Robotics On-Device的新型語言模型,該模型可在機器人上本地執行任務,無需互聯網連接。
基于該公司今年3月發布的Gemini Robotics模型,Gemini Robotics On-Device能夠控制機器人的運動。開發者可以使用自然語言提示來控制和微調模型,以滿足各種需求。
在基準測試中,谷歌聲稱該模型的性能接近基于云端的Gemini Robotics模型。公司表示,在通用基準測試中,它優于其他設備端模型,盡管沒有具體說明這些模型的名稱。
在演示中,該公司展示了運行這一本地模型的機器人執行解拉鏈包和折疊衣物等任務。谷歌表示,雖然該模型最初是為ALOHA機器人訓練的,但后來適配到雙臂Franka FR3機器人和Apptronik公司的Apollo人形機器人上。
谷歌聲稱雙臂Franka FR3成功應對了之前從未"見過"的場景和物體,比如在工業傳送帶上進行裝配作業。
谷歌DeepMind還發布了Gemini Robotics SDK。公司表示,開發者可以向機器人展示50到100次任務演示,在MuJoCo物理模擬器上使用這些模型訓練機器人執行新任務。
其他AI模型開發者也在涉足機器人領域。英偉達正在構建一個為人形機器人創建基礎模型的平臺;Hugging Face不僅在開發開源機器人模型和數據集,還在研發機器人;韓國創業公司RLWRLD獲得未來資產投資,正致力于創建機器人基礎模型。





京公網安備 11011402013531號