![]()
硅谷最重要的三家模型大廠,同一天發布了各自非常具有節點意義的模型。這種混戰日有陣子沒見到了。
8月5日注定會成為AI技術和商業競爭格局演變里重要的一個時刻。
同一天,Google先扔出了Genie 3模型——一個你可以和模型生成的3D世界實時交互的世界模型。 接著Anthropic直接更新了它最主力的Claude Opus系列,發布Claude 4.1 Opus,coding能力繼續突破。 然后OpenAI預告了許久許久的開源模型,也終于來了。如此前泄露的,OpenAI發布了名為GPT-oss的,開放權重的模型。這是它繼GPT-2之后,再度開源它的語言模型。
三個模型發布在24小時內接連發生,但與過去充滿火藥味的直接競爭不同,這次各家更多是在各自擅長的領域展示著不同的進化方向。AI的敘事,正在從“誰的模型更強”的單一維度,走向更復雜和多元的競爭格局。
1
OpenAI GPT-oss:遲到的“開源”,精明的卡位
OpenAI終于交出了它的開放權重模型作業:GPT-oss,一個13B參數的密集模型。這并非一個能與GPT-4o或Claude 4.1匹敵的SOTA模型,其性能大致對標Llama 3 8B或Qwen2 7B。在一些基準測試上,它的表現甚至略遜于同量級對手。
![]()
但它的意義不在于性能,而在于“OpenAI”這個名字和它附帶的許可證。
首先,依然要說,這不是一次徹底的開源。
GPT-oss使用的是OpenAI自定義的“OpenAI Model License 1.0”,其中最關鍵的條款是,禁止任何年度收入超過1億美元或日活躍用戶超過100萬的商業實體,使用GPT-oss來開發或提供與OpenAI核心產品(如API、ChatGPT)競爭的服務。這個“毒丸”條款精準地將所有潛在的大公司競爭對手排除在外,同時又能讓廣大的中小開發者和研究者進入其生態。
其次,這是OpenAI自GPT-2以來首次開放權重,是一次重大的戰略轉向。它不再僅僅是那個高高在上的閉源領導者,而是試圖通過一個“夠用”的開放模型,將開發者吸引到它的生態系統中——用GPT-oss進行本地開發、微調,然后無縫遷移到更強大的OpenAI閉源模型上。
![]()
回到OpenAI為什么要發開源模型,一切都源于DeepSeek的沖擊——當一個免費的開源的模型,達到了它閉源收費極高的模型對于它自己的大部分用戶來說所感受到的水準,這是致命打擊。今天的GPT-oss是OpenAI的一種防御,也是它想要做的生態擴張的動作,對抗DeepSeek、Qwen等開源力量對其開發者基礎的侵蝕。
1
Google Genie 3:從生成世界到“玩”世界
GPT-oss更多是商業策略的產物,Google同日發布的Genie 3更多帶來的是技術想象力。
Genie 3被定義為一個已經被說爛了的詞——“世界模型”,但它還是更進了一步,不再滿足于生成視頻或3D資產,而是直接生成一個可交互的3D世界。
![]()
你給它一張圖片、一段文字描述,甚至是一個草圖,Genie 3就能創造出一個風格一致、符合物理邏輯的3D環境,并且允許你實時地在其中行動和互動。它能理解“向左走”、“跳起來”這類自然語言指令,并即時渲染出對應的第一人稱視角畫面。
![]()
這是通過一種名為“時空視頻Transformer”(SVT)的架構實現的。Genie 3在超過20萬小時的公開游戲視頻(主要是2D平臺游戲)上進行訓練,學會了理解動作和世界的因果關系。它不僅能生成世界,還能推斷出世界中不同物體和角色的行為模式。比如讓一個細節處的樹在不同場景永遠保持一致。
![]()
這意味著AI第一次擁有了創造一個可供“玩耍”的虛擬空間的能力,為游戲開發、模擬器、機器人訓練乃至元宇宙的實現路徑,提供了一個極具震撼力的雛形。
Google的Genie 3收獲了近乎一致的驚嘆。英偉達的兩位高級研究科學家Jim Fan和Phillip Isola不約而同地表達了震撼。Isola稱其“太瘋狂了”,而Jim Fan則形容這是“一次量子躍遷(quantum leap)”。
![]()
這個能從單張圖片中幻想出整個互動游戲世界的AI,通過學習海量視頻內化了物理世界的直觀知識,可能正是通往通用機器人的一大步。
1
Claude 4.1 Opus:程序員的“新神”
Anthropic則繼續在它最鋒利的“矛”上加碼。新發布的Claude 4.1 Opus,目標明確——成為最強的編程助手。
根據官方數據,在衡量代碼生成、調試和邏輯推理能力的Humaneval+基準測試上,Claude 4.1 Opus的得分達到了驚人的85.2%,首次超越了此前由GPT-4o創下的84.9%的紀錄。在內部的Agentic Coding評估中,它解決問題的能力也比前代提升了近一倍。
![]()
除了更強的能力,Claude 4.1還更快、更便宜。對于開發者和企業用戶來說,這意味著在實際工作流中,AI coding的效率和性價比都得到了實質性提升。Anthropic依然是選擇了一條最務實、離錢最近的道路。這現在已經是它的某種護城河了。
這些模型,尤其是OpenAI的開源模型在真實環境里的表現是接下來行業關注的重點。我們也會繼續實際評測這些模型。而仔細觀察,其實這次的“混戰日”與過往非常不同,三個模型彼此之間并非直接的“互相狙擊”,而更像是湊在一起把注意力放到最大。
![]()
這一方面說明,像OpenAI此前喜歡做的、搶在同一時間發布同類模型來壓制對手的做法,在今天越來越難。GPT-5不再是一個完全能由開發團隊自己決定訓練完成節點的模型,而是一個更像實驗的研究,需要等待諸多變量最終成熟。當你的大殺器無法準時就位時,單純靠“實力”來競爭的階段就過去了,策略變得重要,OpenAI用一個策略性的“開源”產品來穩固陣地成了必然選擇。
另一方面,其實更重要的是,今天硅谷的重要公司們已經開始“分工明確”。
Anthropic的Claude在編程上的能力真的在“遙遙領先”,并且它也從中獲得了好處并且打算把這個優勢繼續鞏固下去;OpenAI則處于前所未有的動蕩期,它投入更多精力來建設一整套生態系統,以維持住其仍然存在但也并不厚的先發優勢,同時寄希望于等待GPT-5的成熟,這一套組合拳下來,穩住軍心穩住估值把故事講下去;而Google,在核心LLM能力追上第一梯隊后,顯然又開始扮演起“下一個Transformer時刻”的締造者角色。從VEO3到Genie 3,它在投入別人沒法或不愿投入的資源,去賭下一個范式的突破。
模型的進步沒有停,AI世界更熱鬧了。
* 作者:Gemini prompt:王兆洋
點個愛心,再走 吧





京公網安備 11011402013531號