當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

ChatGPT3周年之后，TPU改變了AI競爭，正在從模型轉(zhuǎn)向基礎(chǔ)設(shè)施

IP屬地中國·北京 編輯：劉敏未盡研究 時(shí)間：2025-12-01 08:05:10

最近谷歌用其TPU基礎(chǔ)設(shè)施，訓(xùn)練出了最強(qiáng)大模型Gemini 3，在ChatGPT三周年之際，這一事件具有里程碑的意義，它意味著，用英偉達(dá)GPU在微軟Azure上訓(xùn)練出來的GPT系列前沿大模型的范式，正在被打破，而且，大模型、云和AI芯片，是在谷歌內(nèi)部渾然一體的。
這一事件，足以影響對整個(gè)AI格局的判斷。我們知道，三年前ChatGPT發(fā)布之時(shí)，最大的受益者是微軟，它的股價(jià)暴漲，市值達(dá)到全球第一。接著是英偉達(dá)，它憑借GPU的CUDA稅，股價(jià)一路上揚(yáng)，成為史上第一家市值超過5萬億美元的公司。第三家就是OpenAI，它的市值也超過了5000億美元，成為史上最有價(jià)值的非上市企業(yè)。
但這一切，正在被TPU改變。當(dāng)谷歌上揚(yáng)時(shí)，壓力傳遞到英偉達(dá)、微軟、以及大量接受英偉達(dá)投資并采購GPU的其他企業(yè)，如甲骨文和其他新云企業(yè)。對OpenAI的直接影響，是市場上普遍開始更看好TPU+Gemini在性能和成本上的長期競爭優(yōu)勢，要?jiǎng)龠^OpenAI。而OpenAI在其星門計(jì)劃中的巨額投資，在Gemini的壓力之下，其商業(yè)可行性和可持續(xù)性，也受到市場的質(zhì)疑。
不是AI恐懼，而是OpenAI恐懼
難怪谷歌垂直整合的AI戰(zhàn)略，其長期價(jià)值受到了巴菲特的看好，最近大舉入股，是其一生之中除蘋果之外，投資的第二家科技企業(yè)，也是唯一一家AI企業(yè)。
ChatGPT3周年，更值得看的是谷歌過去的3年，經(jīng)歷了2023年的危機(jī)，即GPT-4將可能顛覆谷歌在AI領(lǐng)域的優(yōu)勢，微軟等企業(yè)將用AI搜索顛覆谷歌的壟斷地位，以及Llama開放權(quán)重模型推出時(shí)，谷歌內(nèi)部驚呼“沒有護(hù)城河”。到了2024年，谷歌開始真正反擊，除了推出原生多模態(tài)的Gemini大模型之外，它的基礎(chǔ)設(shè)施也引起了我們的關(guān)注。
Gemini與TPU的協(xié)同，正是谷歌AI王者歸來的核心。可以說，真正奠定谷歌戰(zhàn)略反攻的，一個(gè)是合并DeepMind和谷歌大腦，由哈薩比斯擔(dān)任谷歌DeepMind CEO，廢除Bard，死磕Gemini，第二個(gè)就是TPU的迭代升級的強(qiáng)大支撐。它們的對手，相當(dāng)于OpenAI+英偉達(dá)+微軟。
2023年底，谷歌發(fā)布Gemini，同步發(fā)布了TPUv5p，此時(shí)已經(jīng)可以建立起幾萬張卡的推理集群，但訓(xùn)練主還是依靠英偉達(dá)的GPU。
Gemini 發(fā)布的喧囂中，值得注意的是谷歌云發(fā)布了TPUv5p，訓(xùn)練大模型每刀效率提升2倍以上。不管Gemini是否碾壓了GPT-4，但有一點(diǎn)是肯定的，谷歌擁有比微軟更強(qiáng)大的大模型訓(xùn)練和推理平臺。
而且谷歌將使用TPU進(jìn)行推理，因此不必像OpenAI和微軟那樣支付給NVIDIA 70%的利潤（直到他們的芯片準(zhǔn)備好并投入生產(chǎn)）。
——雙子座Gemini vs. GPT
2024年底，谷歌發(fā)布Gemini 2，正式宣布完成對OpenAI的追趕。此時(shí)，谷歌除了宣布競爭將從深度學(xué)習(xí)進(jìn)入到發(fā)揮其強(qiáng)化學(xué)習(xí)優(yōu)勢的“智能體一年”之外，代號為Trallium的第六代TPU，是真正的幕后殺手。
當(dāng)時(shí)谷歌專為Gemini 2 推出了Trallium即TPUv6，并且建立了10萬張卡的算力集群，徹底實(shí)現(xiàn)了100%的訓(xùn)練和推理自由。
2025年起，更多大廠將用自家研發(fā)的下一代定制芯片，構(gòu)建10萬卡級別的算力集群，100%地用于自家下一代大模型的的訓(xùn)練和推理，追求高于英偉達(dá)GPU的性價(jià)比。顯然，谷歌的TPU正在從定制向通用加速芯片轉(zhuǎn)變。英偉達(dá)，要瑟瑟發(fā)抖了嗎？
——哈薩比斯：2025將是AI代理的一年。
2025年4月，在谷歌云Next '25峰會上，谷歌發(fā)布了搭建下一代高能效算力基礎(chǔ)設(shè)施的Ironwood，提供高性價(jià)比推理的新一代主力模型Gemini 2.5 Flash，以及實(shí)現(xiàn)爆發(fā)中的智能體互操作的新標(biāo)準(zhǔn)Agent2Agent。谷歌在上一代Trallium解決訓(xùn)練問題的基礎(chǔ)之上，隨著今年應(yīng)用token數(shù)消耗量的爆發(fā)，開始重點(diǎn)解決推理成本和能源效率問題。
而且TPUv7，已經(jīng)開始全面對標(biāo)英偉達(dá)最新一代芯片B200，英偉達(dá)必須要迅速推出下一代Rubin，才能保持黃仁勛所說的“領(lǐng)先一代”的優(yōu)勢。
推理正朝著統(tǒng)一多模態(tài)與思維鏈的方向發(fā)展，需要完成越來越多能源與數(shù)據(jù)密集任務(wù)。除了單卡性能要足夠強(qiáng)大外，芯片能效與內(nèi)存也是升級重要方向。Ironwood足以與去年的B200相媲美。FP8精度下峰值算力，單個(gè)Ironwood芯片達(dá)到4,614萬億次浮點(diǎn)運(yùn)算，與B200相當(dāng)，稱得上當(dāng)前最強(qiáng)水平。它的單芯片的HBM內(nèi)存容量達(dá)到了192GB，是Trillium的6倍；HBM帶寬達(dá)到7.2Tbps，是Trillium的4.5倍，也均與B200旗鼓相當(dāng)。不過，Ironwood要等今年晚間出貨，屆時(shí)，英偉達(dá)下一代Rubin架構(gòu)芯片最快也會量產(chǎn)。
——Ironwood與A2A，谷歌AI生態(tài)的王者氣象
（Ironwood超節(jié)點(diǎn)，連接了9216顆TUPv7芯片，谷歌云）
所以，未盡研究的讀者，在過去的兩年中，應(yīng)該對于谷歌TPU的崛起，不會感到意外，正如我們今年曾預(yù)言谷歌的市值將會超過微軟，甚至英偉達(dá)一樣：
谷歌披露了第七代TPU Ironwood更多細(xì)節(jié)。這是谷歌首款專為大規(guī)模AI推理設(shè)計(jì)的TPU，突破點(diǎn)覆蓋了“性能、擴(kuò)展、能效、可靠性”所有維度。單個(gè)基于Ironwood的超節(jié)點(diǎn)縱向最多可容納9216顆芯片，總算力達(dá)到42.5 Exaflops，并共享1.77PB可直接尋址HBM；同時(shí)，它還能夠橫向擴(kuò)展至數(shù)十個(gè)超節(jié)點(diǎn)。每瓦性能是上一代谷歌TPU Trillium的2倍。
——Hot Chips 2025：最硬核干貨，徹底分享
谷歌正在開放自己的TPU市場。它現(xiàn)在已經(jīng)是除了英偉達(dá)GPU之外的硬通貨。全球最頂尖的前沿大模型廠商OpenAI與Anthropic都用上了TPU；OpenAI正在自研AI芯片，但奧特曼挖人，還是更信得過在TPU團(tuán)隊(duì)干過的。蘋果也用過谷歌TPU訓(xùn)練自家AI，xAI則迷上了TPU的JAX框架。還有傳言稱，谷歌正在設(shè)法接近Fluidstack等新興AI云服務(wù)商，將TPU部署到它們的數(shù)據(jù)中心里；它們此前屬于英偉達(dá)陣營。
——谷歌突破3萬億美元，趕超英偉達(dá)只是時(shí)間問題
英偉達(dá)面臨的最大問題，是其高達(dá)75%左右的毛利率，越來越難以維持。對于前沿大模型實(shí)驗(yàn)室，英偉達(dá)只能通過提供股權(quán)投資而非降價(jià)，來鞏固其主導(dǎo)地位，因?yàn)榻祪r(jià)會降低毛利率并引發(fā)投資者恐慌。
股權(quán)投資的做法，也意味著OpenAI們能從中獲得打折優(yōu)惠。據(jù)業(yè)內(nèi)分析；OpenAI 甚至還沒部署 TPU，就已經(jīng)在其整個(gè)實(shí)驗(yàn)室的英偉達(dá)設(shè)備組中節(jié)省了約 30% 的成本。這表明 TPU 的性價(jià)比優(yōu)勢非常顯著，即使在啟用 TPU 之前，也能立即獲得收益。
至今沒有一家芯片設(shè)計(jì)廠商，從谷歌到華為，都敢于挑戰(zhàn)英偉達(dá)的單芯片性能，但是，系統(tǒng)級工程設(shè)計(jì)，使得 TPU 堆棧在性能和成本效益方面都與英偉達(dá)不相上下。這也是中國的一些科技企業(yè)，從華為到互聯(lián)網(wǎng)巨頭接下來要走的路。
“系統(tǒng)比微架構(gòu)更重要”的觀點(diǎn)，而過去兩年的發(fā)展也印證了這一點(diǎn)。Anthropic 的大量 TPU 訂單，直接驗(yàn)證了該平臺的技術(shù)實(shí)力。與此同時(shí)，GPU 生態(tài)系統(tǒng)也在改變自己。GB200 代表著一次重大飛躍，推動英偉達(dá)向真正的系統(tǒng)公司轉(zhuǎn)型，能夠設(shè)計(jì)完整的服務(wù)器，而不僅僅是內(nèi)部的芯片封裝。
對比一下！英偉達(dá)直到GB200才實(shí)現(xiàn)機(jī)架級互連方面的巨大創(chuàng)新，但常常被忽視的是：自2017年TPU v2發(fā)布以來，谷歌就一直在機(jī)架內(nèi)部和機(jī)架之間擴(kuò)展TPU！谷歌的ICI擴(kuò)展網(wǎng)絡(luò)，這是英偉達(dá)NVlink唯一真正的競爭對手。
正如開篇所說，谷歌最近推出的 Gemini 3 被公認(rèn)為目前最先進(jìn)的模型，這一結(jié)果有力地證明了 TPU 的強(qiáng)大性能以及谷歌在基礎(chǔ)設(shè)施方面的整體優(yōu)勢。具有諷刺意味的是，OpenAI CEO奧特曼在公開點(diǎn)贊之后，就在內(nèi)部警告，因?yàn)镚PT大模型正在失去領(lǐng)先優(yōu)勢，將面臨著嚴(yán)峻挑戰(zhàn)。
2024年9月，OpenAI以o1引領(lǐng)了推理模型，把關(guān)注點(diǎn)集中在推理和后訓(xùn)練的硬件上，然而，對前沿模型進(jìn)行預(yù)訓(xùn)練仍然是人工智能硬件領(lǐng)域最困難、資源消耗最大的挑戰(zhàn)。TPU平臺已經(jīng)徹底通過了這一考驗(yàn)。這與競爭對手形成了鮮明對比：自2024年5月GPT-4o發(fā)布以來，OpenAI的頂尖研究人員尚未成功完成任何大規(guī)模部署的新前沿模型預(yù)訓(xùn)練，這進(jìn)一步說明，谷歌TPU集群克服了重大技術(shù)障礙。
谷歌一向是一家軟件公司、互聯(lián)網(wǎng)公司，其核心業(yè)務(wù)以往并非硬件業(yè)務(wù)。但是，谷歌面臨硬件的挑戰(zhàn)，悄然強(qiáng)勢進(jìn)軍，堅(jiān)持長達(dá)十年的投入，最終確立了性能領(lǐng)先地位，它的更重大的意義，還在于它正在重新定義自己的AI軟件競爭優(yōu)勢。這個(gè)過程中，3年前遭遇過危機(jī)，但今天已經(jīng)完全扭轉(zhuǎn)過來了。
所有這些對于英偉達(dá)意味著什么？從一家定意義上說，AI芯片和基礎(chǔ)設(shè)施格局，正在從英偉達(dá)的壟斷性霸主地位，向“一超多強(qiáng)”的格局轉(zhuǎn)變。應(yīng)該承認(rèn)，英偉達(dá)依然是超級大廠。
谷歌在TPU上的強(qiáng)勢崛起，來看如下最重要的啟示，包括我們引述了幾點(diǎn)對Semianalysis一篇文章的總結(jié)：
第一，AI 軟件時(shí)代的“護(hù)城河”，正從“模型”延伸到“基礎(chǔ)設(shè)施”。
誰能在芯片、系統(tǒng)、網(wǎng)絡(luò)和軟件棧上協(xié)同優(yōu)化，誰就能把每有效 FLOPs 的成本壓得更低，從而在模型訓(xùn)練、推理定價(jià)和產(chǎn)品形態(tài)上更有回旋空間。谷歌通過 TPUv7 和 Gemini 3，已經(jīng)證明自己并非只會做搜索和廣告。
第二，TPU 不只是“自用武器”，而是正在成為一條完整的商業(yè)路線。
通過與 Anthropic 的百萬 TPU 合同，以及新云服務(wù)商、加密礦企的三方合作結(jié)構(gòu)，谷歌把原本封閉的 TPU 體系，從內(nèi)部機(jī)房搬到了第三方數(shù)據(jù)中心，讓整個(gè)行業(yè)第一次有了真正能和英偉達(dá)系統(tǒng)性競爭的替代品。
第三，軟件生態(tài)仍是 TPU 的短板，但谷歌已經(jīng)開始“補(bǔ)課”。
在 PyTorch 原生后端、vLLM / SGLang 集成、SparseCore 可編程性等方面，谷歌投入了大量工程力量；但在 XLA 編譯器、運(yùn)行時(shí)和多 Pod 訓(xùn)練代碼的開源上，還沒有邁出最后一步。未來 TPU 能否在開發(fā)者心智中真正站穩(wěn)腳跟，很大程度要看這一塊會不會徹底打開。
第四，未來幾年，很可能是“多極算力世界”。
英偉達(dá)、谷歌、亞馬遜、AMD，以至于其他云廠商的自研芯片，將在不同客戶、不同負(fù)載、不同商業(yè)模式下各展拳腳。報(bào)告結(jié)尾提到，OpenAI 自研芯片團(tuán)隊(duì)也開始“動真格”，進(jìn)一步說明頭部實(shí)驗(yàn)室不愿把命運(yùn)完全交給單一供應(yīng)商。
第五，在這個(gè)多極算力世界中，一定會有中國企業(yè)的至少一席之地。

標(biāo)簽：谷歌 英偉達(dá) 芯片 tpu 模型微軟 gemini ai 基礎(chǔ)設(shè)施 ironwood

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系我們，本站將會在24小時(shí)內(nèi)處理完畢。

同類資訊

上海科普教育創(chuàng)新獎(jiǎng)揭曉，首設(shè)“前沿科技成果科普獎(jiǎng)”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

宇樹機(jī)器人在王力宏演唱會秀高難度空翻，馬斯克點(diǎn)贊

全站最新

上海科普教育創(chuàng)新獎(jiǎng)揭曉，首設(shè)“前沿科技成果科普獎(jiǎng)”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

熱門推薦

上海科普教育創(chuàng)新獎(jiǎng)揭曉，首設(shè)“前沿科技成果科普獎(jiǎng)”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

效能提升10倍！摩爾線程新一代全功能GPU架構(gòu)“花港”正式發(fā)布

文匯時(shí)評｜“AI泔水”成年度熱詞，帶來什么警示

ChatGPT-5.2生成字母掛圖錯(cuò)誤頻出“人類專家水平”遭質(zhì)疑

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

利好來了！摩爾線程，重磅發(fā)布！

“星鏈”一衛(wèi)星在太空發(fā)生異常

宇樹機(jī)器人在王力宏演唱會秀高難度空翻，馬斯克點(diǎn)贊

智能機(jī)器人錦標(biāo)賽深圳揭榜羅湖50億基金護(hù)航顛覆性創(chuàng)新

宇樹機(jī)器人為王力宏伴舞，馬斯克贊嘆

AI人才爭奪戰(zhàn)白熱化，谷歌另辟蹊徑“返聘”老員工

氣象人工智能模型“風(fēng)源”雄安首發(fā)