AI基礎設施的軍備競賽正以前所未有的速度升級。谷歌最新發布的下一代張量處理單元(TPU)平臺Ironwood,以其驚人的性能飛躍,再次推高了這場競賽的門檻。
根據谷歌在Hot Chips 2025大會上披露的信息,其第七代TPU架構Ironwood在核心性能上實現了指數級增長,單顆Ironwood芯片的峰值算力高達4614 TFLOPs。與谷歌2022年推出的TPU v4相比,Ironwood的單芯片算力提升了超過16倍;即便是與去年發布的TPU v5p相比,也增長了近10倍。
![]()
Ironwood的發布不僅是單個芯片的革新,更是一套完整的、旨在實現極致擴展性的系統級解決方案。谷歌同時公布了圍繞該芯片構建的機架、網絡互連和冷卻系統,展示了其將尖端算力轉化為大規模、高效率生產力的全棧能力。
性能飛躍:單芯片算力提升超16倍
谷歌此次公布的數據清晰地展示了其TPU平臺性能的演進路線。具體來看,Ironwood的單芯片峰值算力達到4614 TFLOPs,并配備了192 GB的高帶寬內存(HBM),帶寬高達7.4 TB/s。與之對比,2022年發布的TPU v4單芯片算力為275 TFLOPs,配備32 GB HBM,帶寬為1.2 TB/s。而2023年推出的TPU v5p,單芯片算力為459 TFLOPs,配備95 GB HBM,帶寬為2.8 TB/s。
![]()
從TPU v4到Ironwood,谷歌在短短數年內將單芯片算力提升了一個數量級以上,這反映了AI模型對計算需求的爆炸性增長,以及芯片設計廠商為滿足這一需求所做的努力。
在超級計算集群(Superpod)層面,一個Ironwood Superpod將包含9216顆芯片,規模相較于前幾代產品進一步擴大。
![]()
系統架構:從芯片到超級計算集群的擴展
強大的芯片性能必須依賴精密的系統設計才能充分發揮。谷歌詳細介紹了Ironwood從芯片到機架再到集群的模塊化、可擴展架構。該系統的核心是Ironwood SoC(片上系統)芯片,四顆這樣的芯片被集成在一塊Ironwood PCBA主板上。
![]()
隨后,16個PCBA主板像托盤一樣堆疊起來,構成一個包含64顆芯片的Ironwood TPU機架。在機架內部,谷歌沿用了至少三代產品的4x4x4 3D環面(3D Torus)網絡拓撲,形成一個邏輯上的計算單元。為了實現更大規模的擴展,谷歌采用其專有的芯片間互連技術(ICI),通過混合使用PCB走線、銅纜和光纖鏈路,將多個機架連接成一個Superpod。
據披露,該系統最多可將43個計算單元(每個單元64顆芯片)連接起來,形成一個擁有1.8 Petabytes網絡帶寬的龐大集群。
![]()
驚人算力的背后是巨大的能源消耗和散熱挑戰。資料顯示,一個滿載的Ironwood機架功耗可超過100千瓦,這對數據中心的供電和冷卻系統提出了嚴苛要求。為應對這一挑戰,谷歌為Ironwood機架配備了高效的液體冷卻系統。
該系統包括用于冷卻劑分配的CBU機架,以及在機架頂部安裝的防滴漏盤,用于監測任何潛在的液體泄漏。在供電方面,機架采用416伏交流電輸入,通過整流器轉換為直流電為系統供電。





京公網安備 11011402013531號