文 | 科技旋渦
北京時(shí)間2月18日午間,馬斯克旗下人工智能初創(chuàng)公司xAI正式發(fā)布新一代聊天機(jī)器人Grok 3。馬斯克和他的人工智能團(tuán)隊(duì)聲稱(chēng),Grok 3測(cè)試版的高級(jí)推理能力超過(guò)了現(xiàn)有的人工智能模型。
馬斯克這個(gè)號(hào)稱(chēng)地表最聰明的AI,完美詮釋了什么叫“有錢(qián)任性”,只因其使用了20萬(wàn)塊GPU訓(xùn)練模型。那么,它真的能夠超越風(fēng)頭正盛的DeepSeek和行業(yè)先鋒OpenAI嗎?
燒錢(qián)無(wú)數(shù)的Grok 3有多強(qiáng)?
在Grok 3的直播中,馬斯克等人介紹了Grok 3的訓(xùn)練歷程。去年馬斯克劇透,Grok 3在10萬(wàn)張H100上進(jìn)行訓(xùn)練,是首個(gè)達(dá)到如此訓(xùn)練集群規(guī)模的模型。今天的發(fā)布會(huì)上又透露,到訓(xùn)練進(jìn)行到第92天時(shí),集群規(guī)模擴(kuò)展到了20萬(wàn)卡。

Grok 3的實(shí)力也的確證明了,在當(dāng)下這個(gè)時(shí)期,砸錢(qián)是一種巨大的優(yōu)勢(shì)。這一波Grok 3有滿(mǎn)血和mini兩個(gè)版本,在數(shù)學(xué)、科學(xué)、代碼等數(shù)據(jù)集上表現(xiàn)均超過(guò)了GPT-4o、DeepSeek-V3等非推理模型。

Grok-3 mini的性能基本上領(lǐng)先或媲美其他閉源/開(kāi)源模型。在著名大模型LMSYS Arena排行榜中,Grok-3刷榜,Elo評(píng)分超1400位列最高,沒(méi)有任何一個(gè)模型能與之相比,堪稱(chēng)斷層式領(lǐng)先。

xAI團(tuán)隊(duì)還展示了Grok 3如何執(zhí)行有趣的任務(wù)。例如計(jì)算從地球到火星的航天器任務(wù)。Grok 3 生成了一張?zhí)瞻l(fā)射的動(dòng)畫(huà) 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復(fù)雜的物理知識(shí),Grok 3需要理解這些內(nèi)容。

Grok 3還展示了在自動(dòng)化游戲開(kāi)發(fā)方面的潛力。xAI團(tuán)隊(duì)要求Grok 3現(xiàn)場(chǎng)創(chuàng)造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現(xiàn)出獨(dú)特玩法:當(dāng)連接了至少三個(gè)相同顏色的方塊時(shí),會(huì)觸發(fā)重力機(jī)制使方塊消除,這種方式類(lèi)似《寶石迷陣》。
此外,Grok 3包含一個(gè)名為Big Brain的功能,這是一個(gè)推理模型模式,允許在處理查詢(xún)時(shí)進(jìn)行更深入的思考。馬斯克指出,17個(gè)月前,最初的Grok模型幾乎不能解決高中問(wèn)題,而現(xiàn)在它已經(jīng)進(jìn)步了很多,他幽默地比喻“Grok已經(jīng)準(zhǔn)備好上大學(xué)了”。
性?xún)r(jià)比與猛砸錢(qián),大模型的路該怎么走?
眾所周知,DeepSeek通過(guò)獨(dú)特的算法優(yōu)化、架構(gòu)設(shè)計(jì)以及高效的資源利用方式,大幅降低了對(duì)英偉達(dá)高端GPU的依賴(lài)。這也致使英偉達(dá)股價(jià)暴跌16.97%,市值單日蒸發(fā)約5926.58億美元。

DeepSeek聲稱(chēng)其模型訓(xùn)練成本僅為同類(lèi)模型的1/5至1/10,這意味著其在擺脫英偉達(dá)硬件束縛的情況下,仍然在推理性能等方面都表現(xiàn)出與ChatGPT-o1接近的能力,部分領(lǐng)域還有所超越。
反觀馬斯克的Grok 3不僅砸進(jìn)去20萬(wàn)塊GPU,更是為了盡快推出Grok 3,在短短四個(gè)月內(nèi)建成數(shù)據(jù)中心。如此巨大的投入換來(lái)的也僅僅只是lmArena 排行榜中41分的提升,這真的值嗎?

事實(shí)上,馬斯克瘋狂砸錢(qián)的舉動(dòng)或許有著提前布局的考量。當(dāng)下,任何AI的訓(xùn)練都離不開(kāi)GPU,只不過(guò)DeepSeek走的是“精算師路線”——通過(guò)算法優(yōu)化,用行業(yè)1/10的成本實(shí)現(xiàn)90%的性能。而馬斯克的20萬(wàn)塊GPU不僅是為了快速推出Grok 3,更可能是為了后續(xù)依舊保持快速迭代的選擇。





京公網(wǎng)安備 11011402013531號(hào)