12月5日消息,谷歌DeepMind日前推出了其最新的基礎世界模型——Genie 2,通過一張圖像或文字描述,就能生成可供人類或AI智能體游玩的3D場景。
谷歌表示,用戶只需提供一張由Imagen 3生成的圖像和相應的文字描述,Genie 2便能生成一個可交互的3D環境,用戶可以通過鼠標和鍵盤在其中自由探索,最長可持續一分鐘。

該模型不僅能夠保持生成環境的一致性,還能在用戶移動時準確呈現視野中消失的部分。
谷歌還表示,Genie2在生成過程中能夠模擬物體交互、動畫、光照、物理反射以及NPC的行為,許多生成的場景畫質接近3A級別的游戲,甚至在物體視角一致性和場景記憶方面表現優異。
有人被這技術進步的速度震撼,稱之為視頻游戲的未來,甚至還有人看到了一切都被虛擬化的世界模型的更長遠未來。

值得一提的是,Genie 2發布后,DeepMind CEO邀請馬斯克一起制作AI游戲,馬斯克則回復:Cool。

谷歌研究人員Jack Parker-Holder也給出了兩個實例,其中,一張圖上有一個紅門和一個藍門,向模型輸入不同的語言指令,可以生成不同的3D場景,走向紅門或藍門。

在更復雜的三門場景中,Genie 2依然很好地理解了指令并生成了研究人員想要的3D動圖。





京公網安備 11011402013531號