12月17日,騰訊混元團隊正式發布混元世界模型1.5(WorldPlay)。該模型支持通過文本描述或單張圖片生成可實時交互的3D場景,用戶可通過鍵盤、鼠標或手柄在生成的世界中自由探索。

據悉,此次發布版本強調空間記憶能力,當用戶在場景中移動并返回先前區域時,模型能保持三維結構的前后一致性。模型支持以24幀/秒的速率生成720P視頻流,并可將交互場景導出為3D點云復用。

騰訊宣布,此次同步開源了涵蓋數據、訓練與流式推理部署的實時世界模型全鏈路框架。技術報告公開了包括重構記憶機制、長上下文蒸餾及基于3D獎勵的強化學習后訓練等模塊的細節。該模型主要面向AI游戲關卡生成、影視場景預覽、虛擬現實及具身智能研究等場景。目前用戶可通過官網申請體驗。






京公網安備 11011402013531號