當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

羅輯思維：機器人可以實現(xiàn)自由操作了！首個具身智能體Psi R0發(fā)布

IP屬地中國·北京 編輯：馮璃月中關(guān)村在線 時間：2024-12-30 15:48:34

狼叫獸
靈初智能公司近日發(fā)布了首個基于強化學(xué)習(xí)（RL）的端到端具身模型Psi R0。該模型支持雙靈巧手協(xié)同進行復(fù)雜操作，可以將多個技能串聯(lián)混訓(xùn)，生成具有推理能力的智能體來完成并閉環(huán)長程靈巧操作任務(wù)，并且在跨物品、跨場景級別上表現(xiàn)出較高的泛化能力。
以電商場景為例， Psi R0能夠使用雙靈巧手流暢地完成一系列動作，如抓取、掃碼、放置、塑料袋打結(jié)等，在客戶現(xiàn)場可以取代一個完整工位。這是業(yè)界首次通過RL訓(xùn)練完成長程靈巧操作任務(wù)的具身機器人。
官方表示，Psi R0模型是基于RL訓(xùn)練出來的，使用海量仿真數(shù)據(jù)訓(xùn)練出雙手操作的智能體，并通過雙向訓(xùn)練框架串聯(lián)多技能，在開放環(huán)境中率先完成了長程任務(wù)，并具備較強的泛化能力和較高的魯棒性。
這一技能訓(xùn)練框架從物體時空軌跡抽象出關(guān)鍵信息以構(gòu)建通用目標(biāo)函數(shù)，解決了獎勵函數(shù)設(shè)計困難的問題。在后訓(xùn)練階段，通過少量高質(zhì)量真機數(shù)據(jù)對齊進一步提升了長程任務(wù)的成功率。
除了轉(zhuǎn)移可行性函數(shù)外，雙向訓(xùn)練框架中的其他部分也發(fā)揮著重要作用。它能夠微調(diào)技能以提高串聯(lián)成功率和泛化性，并賦予模型自主切換技能的能力，確保在遭遇操作失敗時迅速調(diào)整策略以實現(xiàn)高成功率。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

《電腦愛好者》雜志公眾號注銷、官網(wǎng)無法訪問，創(chuàng)刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產(chǎn)了？

王力宏伴舞機器人高難度后空翻后穩(wěn)穩(wěn)落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統(tǒng)的生態(tài)成熟好用的極限突圍

全站最新

《電腦愛好者》雜志公眾號注銷、官網(wǎng)無法訪問，創(chuàng)刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產(chǎn)了？

王力宏伴舞機器人高難度后空翻后穩(wěn)穩(wěn)落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

熱門推薦

《電腦愛好者》雜志公眾號注銷、官網(wǎng)無法訪問，創(chuàng)刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產(chǎn)了？

王力宏伴舞機器人高難度后空翻后穩(wěn)穩(wěn)落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

上饒農(nóng)商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉(zhuǎn)發(fā)！小米汽車又獲獎再引發(fā)輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統(tǒng)的生態(tài)成熟好用的極限突圍

我國成功發(fā)射通信技術(shù)試驗衛(wèi)星二十三號

寶馬3系全球產(chǎn)量突破1800萬輛，50年傳奇仍在繼續(xù)

降息，突發(fā)！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術(shù)路線圖全面公開！刷新國產(chǎn)GPU推理天花板，新架構(gòu)能效飆10倍

中科大造出首個紫外光譜成像芯片，成本有望直降99%

將RNA的自毀密碼寫入塑料：科學(xué)家實現(xiàn)高分子材料的可編程降解