財華社
12月2日,亞馬遜()在AWS re:Invent 2025大會上,發布新一代芯片Trainium 3和搭載Trainium 3,并透露正研發可兼容英偉達()芯片的下一代產品Trainium 4。
據亞馬遜介紹,第三代芯片與系統在AI訓練和推理性能上實現了顯著飛躍:UltraServer系統速度提升超4倍,內存容量擴大4倍,不僅能加速訓練,還能滿足峰值需求下的AI應用部署。單臺服務器可搭載144枚芯片,更支持數千臺服務器互聯構成百萬芯片集群規模為上一代的10倍。
值得留意的是,新一代芯片能效比提升40%。在全球數據中心耗電量激增的背景下,AWS正著力打造更節能的系統。這既符合企業自身利益,也可為云端AI客戶節約開支。科技巨頭們越來越認識到,AI芯片最終的決勝戰場,將在于能效比,這是其下游客戶決定是否大規模部署的關鍵,因為這決定了往后的運營成本與盈利能力。
亞馬遜也透露,其參投的Anthropic、日本大模型公司Karakuri、SplashMusic、基因編輯公司metagenomi、理光(Ricoh)等客戶已采用第三代系統,訓練和推理成本降低一半。
與谷歌圍堵英偉達
盡管亞馬遜AWS占據最大的云市場份額,但正面臨微軟()和谷歌()的激烈競爭,驅動AI應用的大語言模型需要巨大算力進行訓練和運行,這為云計算廠商創造了廣闊的市場空間。谷歌近期發布的Gemini 3模型引發市場熱切關注,有意思的是,谷歌近來改變策略,將原本自用的內部芯片TPU用于對外發售,最新推出的訓練、推理和服務優化第七代TPU芯片鐵木(Ironwood)無論性能還是能效都頗具競爭力,已成為OpenAI等客戶與英偉達就AI芯片價格談判的籌碼,另外Anthropic已與其達成數百億美元合作,部署百萬個TPU芯片,上周更有報道稱meta()考慮采用谷歌的這款芯片。
從行業邏輯來看,亞馬遜與谷歌的芯片突破,本質上是云計算巨頭算力自主化戰略的必然結果。驅動AI應用的大語言模型對算力的海量需求,正倒逼云廠商構建自研算力體系以擺脫對英偉達的依賴。對于亞馬遜而言,自研芯片既能降低自身算力采購成本,又能通過差異化的算力服務鞏固云市場優勢;谷歌則憑借TPU與Gemini 3模型的深度耦合,形成芯片-模型-云服務的全棧閉環,其全棧垂直整合能力或對英偉達的軟硬一體模式構成直接挑戰。
不過,英偉達的算力霸權短期內仍難以被徹底撼動。其核心優勢不僅在于GPU硬件的性能領先,更在于CUDA平臺積累的兩千萬開發者社群與超10萬個適配應用,客戶的生態遷移成本高達數千萬美元,這一深厚的軟件護城河是亞馬遜Trainium與谷歌TPU短期內難以逾越的壁壘。英偉達也在公開回應中強調,自身是唯一能運行所有AI模型、并在所有計算場景中部署的平臺,其領先行業一代的技術優勢仍不可小覷。
或許正是深刻意識到生態壁壘的堅固,亞馬遜展現出了務實的競合智慧,同時透露了Trainium 4路線圖,預計性能將至少達到第3代產品的三倍,將可支持英偉達NVlink Fusion高速互聯技術,這意味著搭載Trainium4的AWS系統既能與英偉達GPU協同工作,又可繼續使用亞馬遜自研的低成本服務器架技術。考慮到英偉達CUDA已成為AI應用的事實標準,Trainium4系統或將吸引更多基于英偉達GPU開發的大型AI應用遷移至亞馬遜云平臺。目前官方未公布Trainium4具體時間表。
結語
可以預見的是,未來的AI芯片市場將從英偉達一家獨大的格局,轉向通用GPU+專用ASIC的異構部署新階段。亞馬遜Trainium系列的能效優勢與生態兼容能力,疊加谷歌TPU的商業化突破,將持續分流英偉達的市場份額,而客戶也將傾向于多路線并行的算力采購策略以分散風險。這場算力爭奪戰的最終走向,不僅取決于硬件性能與能效的比拼,更在于生態壁壘的突破與重構,而這一過程,也將深刻重塑整個 AI 基礎設施產業的競爭邏輯。





京公網安備 11011402013531號