IT之家 11 月 12 日消息,由人工智能先驅李飛飛(Fei-Fei Li)聯合創立的初創公司 World Labs 今日正式推出其首款商業化“世界模型”(world model)產品 ——Marble。該產品現已開放免費增值(freemium)與付費訂閱服務,支持用戶通過文本提示詞、照片、視頻、3D 布局圖或全景圖生成可編輯、可下載的 3D 環境。
![]()
此次發布距 World Labs 結束“隱身模式”并完成 2.3 億美元(IT之家注:現匯率約合 16.37 億元人民幣)融資僅一年有余,也使其在世界模型賽道上領先于其他競品。所謂“世界模型”,是指一類能構建環境內部表征的 AI 系統,可用于預測未來狀態并規劃行動路徑。目前,競爭對手如 Decart 與 Odyssey 僅推出免費演示版本;谷歌的 Genie 仍處于有限研究預覽階段。
Marble 的差異化優勢在于其生成的是持久化、可下載的 3D 環境,而非像 World Labs 此前發布的實時模型 RTFM(Real-Time Foundation Model)或其他競品那樣,在用戶探索過程中動態生成世界。公司表示,這一設計顯著減少了場景變形與不一致性,并支持將生成世界導出為高斯潑濺(Gaussian splats)、網格(meshes)或視頻格式。
此外,Marble 是業內首款原生集成 AI 編輯工具的模型,并配備混合式 3D 編輯器:用戶可先手動構建空間結構框架(如墻體、體塊或平面),再由 AI 填充視覺細節。World Labs 聯合創始人 Justin Johnson 表示:“這是一種全新類別的模型 —— 生成 3D 世界,其能力將隨時間持續提升。事實上,我們已實現了顯著改進。”
早在 2023 年 12 月,World Labs 曾展示其早期模型僅憑單張圖像生成交互式 3D 場景的能力。盡管效果令人印象深刻,但彼時生成的場景風格偏卡通化,且因移動范圍受限與偶發渲染錯誤,尚無法實現完全自由探索。
此前的 Beta 版僅憑圖像提示即可生成高質量世界 —— 從類游戲場景到其客廳的逼真復刻皆表現不俗;雖早期版本存在邊緣形變問題,但據稱已在正式版中大幅優化。不過,TechCrunch 記者使用同一提示詞在 Beta 版生成的世界,在視覺契合度與意圖還原度上反而略優于當前正式版結果。

Johnson 強調,編輯功能將使 Marble 迅速應用于游戲開發、影視視效(VFX)與虛擬現實(VR)等近中期落地場景。
“創意主導權”是 Marble 未來發展的核心主題。Johnson 指出:“生成應始終快捷高效,但用戶也應能深入干預,對生成內容施加高度控制 —— 我們不希望機器全盤接管,剝奪人類的創造力。”
為實現這一目標,Marble 首先提升了輸入靈活性:Beta 版僅支持單張圖像輸入,迫使模型自行“腦補”360 度視角中未見部分;而正式版現已支持上傳多角度圖像或短視頻片段,從而生成高度逼真的數字孿生環境。
其次,World Labs 推出了實驗性 3D 編輯器 Chisel:用戶可先粗略勾勒空間布局(如墻體、立方體、平面),再輔以文本提示詞引導視覺風格。Marble 由此實現“結構”與“風格”的解耦 —— 類似于 HTML 定義網頁結構、CSS 負責視覺呈現。與純文本編輯不同,Chisel 支持對 3D 對象的直接操控。“我可以直接抓取代表沙發的 3D 體塊,將其拖拽至任意位置。”Johnson 解釋道。
![]()
另一項增強創意控制的新功能是世界擴展(World Expansion)。“生成世界后,您可對其擴展一次,”Johnson 說明,“當您移動至場景邊緣、發現結構開始崩解時,可指令模型在當前位置周邊繼續擴展生成,并增加該區域的細節密度。”
對于需要構建超大空間的用戶,“合成器模式”(Composer Mode)支持將多個獨立世界無縫拼接。Johnson 曾向記者演示:他將兩個已構建世界 ——“奶酪房間配葡萄椅”與“太空中的未來主義會議室”成功組合為一。
![]()
定價方面,Marble 提供四檔訂閱方案:
免費版:支持 4 次生成(文本 / 圖像 / 全景圖輸入);標準版(20 美元 / 月):12 次生成,支持多圖 / 視頻輸入及高級編輯;專業版(35 美元 / 月):25 次生成,含場景擴展功能與商業使用權;旗艦版(95 美元 / 月):75 次生成,解鎖全部功能。
Johnson 認為,Marble 的首批應用場景將集中于游戲開發、影視視效與虛擬現實。
然而,游戲行業對生成式 AI 態度審慎。據近期游戲開發者大會(GDC)調查,33% 的受訪者認為生成式 AI 對行業產生負面影響 —— 較上年上升 12 個百分點。知識產權侵權、高能耗及 AI 生成內容質量下滑為三大核心關切。去年《Wired》調查更揭露,動視暴雪(Activision Blizzard)等廠商正利用 AI 壓縮成本、應對人才流失。
對此,Johnson 強調:Marble 并非旨在取代現有游戲開發全流程,而是作為資產生成工具嵌入既有管線。“它生成背景環境與氛圍空間,開發者可將其導入 Unity 或 Unreal Engine 等引擎,再添加交互邏輯與代碼。”
在影視視效領域,Johnson 指出,Marble 規避了當前 AI 視頻生成器普遍存在的鏡頭控制不佳與幀間不一致問題,其輸出的 3D 資產使藝術家能以逐幀精度布景與運鏡。
盡管 World Labs 暫未將 VR 作為當前重點,Johnson 承認該行業“極度渴求內容”,并對 Marble 發布反響熱烈。目前,Marble 已全面兼容 Apple Vision Pro 與 meta Quest 3 頭顯,所有生成世界均可即刻進入 VR 體驗。
值得注意的是,Marble 在機器人領域亦具潛力。Johnson 指出,相較于圖像與視頻生成,機器人領域缺乏大規模訓練數據;而 Marble 這類生成器可高效構建仿真訓練環境,大幅降低數據獲取門檻。
World Labs 首席執行官兼聯合創始人李飛飛在近期發布的《世界模型宣言》中指出:Marble 標志著構建“真正具備空間智能的世界模型”的第一步。她堅信:“下一代世界模型將使機器在空間智能層面實現質的飛躍。”若大語言模型教會機器“讀寫”,她期望 Marble 這樣的系統能教會機器“觀察”與“構建”。她強調,理解物體在三維空間中的存在方式與交互規律,將推動機器智能突破游戲與機器人領域,延伸至科學探索與醫療創新等更廣闊疆域。
“若無空間智能,我們對真正智能機器的憧憬便永無圓滿之日。”李飛飛在宣言結尾如此寫道。





京公網安備 11011402013531號