據華爾街見聞此前文章,英偉達近日與Groq達成了一項非獨家的技術許可協議。
按照披露,英偉達將把Groq的AI推理技術整合進未來產品體系中,而Groq創始人兼首席執行官Jonathan Ross、總裁Sunny Madra以及部分核心工程人員將加入英偉達。Groq公司本身仍保持獨立運營,其云業務Groq Cloud也將繼續對外提供服務。
然而,如果只把它理解為普通的技術合作,顯然過于表面。技術可以授權,但一家芯片公司的創始人和核心架構團隊,很少作為“附帶條款”整體遷移。
英偉達真正看中的,從來不是Groq的收入規模,而是它背后的架構思想。而這套思想,與谷歌TPU高度同源。
業內普遍認為,隨著AI競爭重心從訓練轉向推理,GPU長期建立的統治優勢開始出現松動,TPU在效率與成本結構上的優勢正逐步顯現,并有望成為谷歌云未來十年的關鍵護城河,這一背景下,黃仁勛第一次顯露出被逼到墻角的焦慮。
可以肯定的是,一旦英偉達借助這次技術引入在推理架構上追近甚至抹平與谷歌TPU的差距,原本在谷歌與OpenAI/英偉達陣營之間不斷擴大的技術與生態裂口,很可能會迅速收斂,競爭格局也將重新回到拉鋸狀態。
接下來的問題是:谷歌是否會啟動自己的“紅色警報(code red)”,動用一切資源試圖阻止這筆交易,還是會以更強硬的方式正面回應?
推理時代提速,TPU正在撼動GPU的長期統治
過去一年,谷歌在AI基礎設施上的存在感發生了明顯變化。
Ironwood TPU與Gemini模型體系的推進,使谷歌與英偉達之間的競爭,不再只是“誰買了更多GPU”的問題,而是逐漸演變為兩種計算路線的對峙。GPU依然統治著訓練,但在推理這一決定長期成本與利潤率的環節,TPU正在快速逼近甚至反超。
這背后并非簡單的性能參數對比,而是架構差異的集中體現。
GPU的優勢來自通用并行計算能力,而TPU從誕生之初就是為神經網絡推理高度定制的ASIC。在單位能耗、延遲可控性以及規模化推理成本上,TPU更貼合當下大模型商業化階段的真實需求。隨著模型能力趨于穩定,推理開始吞噬越來越多算力資源,“算得起”比“算得快”更重要。
這正是英偉達焦慮的根源。
AI敘事正在從訓練時代,邁入推理時代。訓練是一次性投入,而推理是持續性支出;訓練決定能力上限,推理決定商業下限。當客戶開始認真計算長期推理賬單時,GPU的高溢價模式第一次遭遇結構性挑戰,而谷歌恰恰通過TPU,把這種挑戰內化成了自身云業務的護城河。
從這個角度看,TPU不只是一顆芯片,而是一種成本結構武器。它讓谷歌在云端推理上逐步擺脫對英偉達的依賴,也讓谷歌云在未來十年的競爭中擁有了獨特的底層優勢。
Groq的價值,就藏在這里。
收編Groq的兩大考量:人才+時間
Groq成立于2016年,其創始人Jonathan Ross曾是谷歌芯片高管,也是TPU的早期核心參與者之一。
Groq所堅持的,并不是GPU式的通用并行路線,而是一套強調低延遲、確定性執行和極致推理效率的架構理念。這種理念,與TPU的設計哲學高度同源,卻與英偉達傳統GPU體系存在明顯張力。
這也解釋了為什么英偉達選擇“引入”而不是“自研”。相比從零構建一套全新的張量架構,直接吸納已經驗證過的TPU思維方式,顯然更快,也更現實。
此前市場一度傳出英偉達將以高達200億美元的價格全資收購Groq的消息,盡管隨后被否認,但這一傳聞本身已經暴露出英偉達的緊迫感。
Groq今年的目標收入約為5億美元,即便完全兌現,也難以支撐極端的估值倍數。英偉達愿意付出的,從來不是為財務,而是為時間。
最終落地的結構,是一筆技術許可加核心人才轉移的“非收購”。這既降低了監管風險,也避免在輿論上坐實“被TPU逼著買路”的敘事,但在實質上,英偉達已經把最關鍵的能力握在了手中。
這是一場防御性的反擊。
AI基礎設施的戰爭,已經變了
它并不意味著英偉達已經輸掉了推理之戰,但清楚地表明,GPU的統治不再是理所當然。
當推理成為主戰場,當云廠商開始用自研芯片重塑成本曲線,英偉達第一次不得不正視一個現實:未來的AI基礎設施競爭,不再只靠更大的GPU。
而真正的懸念,仍然在谷歌一側。
如果TPU繼續深度綁定Gemini,并成為谷歌云最核心的差異化能力,那么這場對抗才剛剛開始。英偉達“收編”Groq,或許正是一個信號——推理時代的大門已經打開,連霸主也不得不提前換位。





京公網安備 11011402013531號