
20萬GPU打造的AI奇跡,能否顛覆行業?
編輯部
北京時間2月18日午間,馬斯克旗下人工智能初創公司xAI正式發布新一代聊天機器人Grok 3。馬斯克和他的人工智能團隊聲稱,Grok 3測試版的高級推理能力超過了現有的人工智能模型。
馬斯克這個號稱地表最聰明的AI,完美詮釋了什么叫“有錢任性”,只因其使用了20萬塊GPU訓練模型。那么,它真的能夠超越風頭正盛的DeepSeek和行業先鋒OpenAI嗎?
燒錢無數的Grok 3有多強?
在Grok 3的直播中,馬斯克等人介紹了Grok 3的訓練歷程。去年馬斯克劇透,Grok 3在10萬張H100上進行訓練,是首個達到如此訓練集群規模的模型。今天的發布會上又透露,到訓練進行到第92天時,集群規模擴展到了20萬卡。

Grok 3的實力也的確證明了,在當下這個時期,砸錢是一種巨大的優勢。這一波Grok 3有滿血和mini兩個版本,在數學、科學、代碼等數據集上表現均超過了GPT-4o、DeepSeek-V3等非推理模型。

Grok-3 mini的性能基本上領先或媲美其他閉源/開源模型。在著名大模型LMSYS Arena排行榜中,Grok-3刷榜,Elo評分超1400位列最高,沒有任何一個模型能與之相比,堪稱斷層式領先。

xAI團隊還展示了Grok 3如何執行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張太空發射的動畫 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復雜的物理知識,Grok 3需要理解這些內容。

Grok 3還展示了在自動化游戲開發方面的潛力。xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發重力機制使方塊消除,這種方式類似《寶石迷陣》。
此外,Grok 3包含一個名為Big Brain的功能,這是一個推理模型模式,允許在處理查詢時進行更深入的思考。馬斯克指出,17個月前,最初的Grok模型幾乎不能解決高中問題,而現在它已經進步了很多,他幽默地比喻“Grok已經準備好上大學了”。
性價比與猛砸錢,大模型的路該怎么走?
眾所周知,DeepSeek通過獨特的算法優化、架構設計以及高效的資源利用方式,大幅降低了對英偉達高端GPU的依賴。這也致使英偉達股價暴跌16.97%,市值單日蒸發約5926.58億美元。

DeepSeek聲稱其模型訓練成本僅為同類模型的1/5至1/10,這意味著其在擺脫英偉達硬件束縛的情況下,仍然在推理性能等方面都表現出與ChatGPT-o1接近的能力,部分領域還有所超越。
反觀馬斯克的Grok 3不僅砸進去20萬塊GPU,更是為了盡快推出Grok 3,在短短四個月內建成數據中心。如此巨大的投入換來的也僅僅只是lmArena 排行榜中41分的提升,這真的值嗎?

事實上,馬斯克瘋狂砸錢的舉動或許有著提前布局的考量。當下,任何AI的訓練都離不開GPU,只不過DeepSeek走的是“精算師路線”——通過算法優化,用行業1/10的成本實現90%的性能。而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3,更可能是為了后續依舊保持快速迭代的選擇。
寫在最后
誠然,馬斯克的Grok 3的確超越了DeepSeek,但似乎更像是一個加強版,而非大跨度的領先。我們期待看到未來DeepSeek依舊能夠憑借超高的“性價比”再度震驚世界。





京公網安備 11011402013531號