5月13日,昆侖萬維宣布,旗下 Matrix 系列的交互式世界生成方向正式落地,推出 Matrix-Game 大模型(17B),并開源其核心代碼。Matrix-Game 是工業(yè)界首個(gè)開源的 10B 空間智能大模型,專為游戲世界建模而設(shè)計(jì),致力于在開放式環(huán)境中實(shí)現(xiàn)高質(zhì)量的內(nèi)容生成與精確控制。

Matrix-Game 的目標(biāo)是為游戲開發(fā)者和 AI 愛好者提供一個(gè)強(qiáng)大的工具,用于構(gòu)建和探索交互式虛擬世界。該模型基于先進(jìn)的技術(shù),能夠理解和學(xué)習(xí)復(fù)雜環(huán)境中的動(dòng)態(tài)變化和交互模式,從而生成連貫、可控的游戲體驗(yàn)。
Matrix-Game 的功能源于其三大核心組件:
Matrix-Game-MC 數(shù)據(jù)集: 該數(shù)據(jù)集由昆侖萬維自主構(gòu)建,包含海量 Minecraft 游戲視頻數(shù)據(jù),分為無標(biāo)簽的大規(guī)模視頻和帶有控制信號的精細(xì)標(biāo)注視頻。
Matrix-Game 主模型: 基于先進(jìn)的擴(kuò)散模型技術(shù),Matrix-Game 主模型構(gòu)建了一個(gè)從圖像到世界的生成框架。該框架能夠根據(jù)用戶的輸入,例如鍵盤指令和鼠標(biāo)移動(dòng),生成連貫且可控的互動(dòng)視頻,在視覺質(zhì)量、時(shí)序一致性和物理合理性方面達(dá)到了出色的平衡。
GameWorld Score 評測體系: 昆侖萬維提出了這一統(tǒng)一的游戲交互世界評估標(biāo)準(zhǔn),從視頻的視覺質(zhì)量、時(shí)序質(zhì)量、動(dòng)作可控性和物理規(guī)則理解四個(gè)維度全面量化模型性能。該評測體系的提出,填補(bǔ)了該領(lǐng)域缺乏系統(tǒng)性評測基準(zhǔn)的空白。
Matrix-Game 能夠在多種 Minecraft 場景下實(shí)現(xiàn)可控生成,包括森林、沙灘、沙漠、冰川、河流和平原等。用戶可以通過鍵盤和鼠標(biāo)輸入指令,例如使用方向鍵控制角色移動(dòng),空格鍵跳躍,攻擊鍵攻擊,以及鼠標(biāo)控制視角,來操控游戲中的角色。Matrix-Game 能夠根據(jù)這些指令生成相應(yīng)的游戲世界視頻,支持角色的前后左右移動(dòng)、跳躍、攻擊以及視角變換等動(dòng)態(tài)行為。
此外,Matrix-Game 還支持自回歸式的長視頻生成,這意味著它能夠?qū)崿F(xiàn)動(dòng)作與視角之間的絲滑銜接,并在時(shí)間一致性和環(huán)境適應(yīng)性方面表現(xiàn)出色。這一特性為開發(fā)沉浸式長時(shí)體驗(yàn)、創(chuàng)意內(nèi)容生成以及游戲設(shè)計(jì)等應(yīng)用奠定了堅(jiān)實(shí)的模型基礎(chǔ)。





京公網(wǎng)安備 11011402013531號