
2月14日,昆侖萬維今日正式發(fā)布自主研發(fā)的“Matrix-Zero世界模型”,成為國內首家同時實現3D場景生成與可交互視頻生成技術突破的企業(yè),標志著中國AI企業(yè)在空間智能領域的探索邁入新階段。該模型將推動游戲、影視、虛擬交互等領域的智能化變革,并為具身智能(Embodied AI)及通用人工智能(AGI)發(fā)展提供重要技術支撐。
Matrix-Zero世界模型由兩大核心模塊構成:
3D場景生成大模型:用戶僅需輸入一張圖片,即可生成可自由探索的真實3D場景,支持動態(tài)物理效果與多風格遷移。相較于國際同類產品(如谷歌World Labs),其場景探索范圍更廣、自由度更高。
可交互視頻生成大模型:以用戶實時輸入為核心驅動,生成動態(tài)互動視頻,并精準控制視角移動,適配虛擬環(huán)境、沉浸式體驗等場景需求。

昆侖萬維技術團隊透露,3D場景生成的逼真效果依賴于兩大自研模塊:場景布局生成模塊:通過可微渲染技術與擴散模型,將輸入圖片轉化為幾何結構一致的3D場景框架;紋理生成模塊:基于圖像與視頻生成模型訓練,在用戶移動視角時實時補全場景缺失區(qū)域的幾何與紋理,確保任意角度場景的合理性與一致性。
此外,該模型支持動態(tài)場景生成(如風吹草動、水流效果),并可適配寫實、卡通、水墨等多元風格輸入。
此前,谷歌Genie系列模型已展示世界模型在視頻生成與交互中的潛力,但昆侖萬維進一步強化了用戶意圖與生成內容的精準匹配。其可交互視頻模型通過自研的“用戶交互模塊”,結合生成式視頻技術,實現了對視角移動的精細控制。例如,在虛擬環(huán)境中,用戶輸入指令可實時改變視頻畫面走向,使生成內容更貼合交互預期。
Matrix-Zero世界模型計劃于2024年4月上線,將率先應用于昆侖萬維的AI游戲生產、AI短劇制作等業(yè)務線,為開發(fā)者提供高效的內容生成工具。公司預測,隨著視頻模型技術成熟,未來游戲開發(fā)或不再依賴傳統(tǒng)3D引擎,影視創(chuàng)作門檻也將大幅降低。
更長遠來看,空間智能技術被視為通向AGI的關鍵路徑。昆侖萬維表示,將持續(xù)迭代AI平臺,探索虛擬環(huán)境中的實驗模擬、數字孿生等場景,推動人工智能從“感知”向“行動與創(chuàng)造”進化。
世界模型正成為全球AI競賽的新焦點,其核心在于構建對物理世界的理解與生成能力。昆侖萬維此次技術突破,不僅填補了國內空間智能領域的空白,更為AI驅動的內容生產與交互方式開辟了新可能性。如何在開放場景中實現更高精度與可控性,或將成為下一階段技術較量的關鍵。



京公網安備 11011402013531號