英偉達(NVIDIA)近期展示了其在通用人工智能(AGI)領域的最新突破,推出了一款名為NitroGen的游戲智能體基礎模型。與傳統單一用途的 AI 不同,NitroGen 是一款基于 OpenVision 的動作模型,旨在成為能夠穿梭于各種虛擬世界的“通用代理”。
為了讓 NitroGen 掌握復雜的操控邏輯,研究團隊挖掘了一個此前被學術界忽視的“寶庫”:YouTube 和 Twitch 上帶有控制器疊加層的游戲視頻。通過分析1000多款游戲、總計超過4萬小時的玩家錄像,NitroGen 學會了如何根據視覺反饋直接生成操作指令。AIbase 了解到,研究人員利用模板匹配和微調后的 SegFormer 模型,精準地從海量視頻中提取出了玩家的實時按鍵輸入數據。
在技術架構上,NitroGen 深度集成了英偉達此前發布的GR00TN1.5機器人模型,這使得它具備了跨平臺的適應能力。測試數據顯示,NitroGen 能夠勝任動作角色扮演、平臺跳躍、Roguelike 等多種完全不同風格的游戲類型。即使被置于完全陌生、未曾見過的游戲環境中,它的表現也比從頭訓練的模型成功率高出52%,充分證明了機器人基礎模型在虛擬環境中的通用性。
目前,這支由英偉達、斯坦福及加州理工學院等頂尖學術機構組成的聯合研究團隊,已正式將該項目的論文、代碼及相關數據集開源,旨在推動全球 AI 社區在具身智能和通用代理領域的進一步探索。
劃重點:





京公網安備 11011402013531號