谷歌新一代AI模型Gemini 3系列的發布,在硬件領域投下一顆“重磅炸彈”——其自研TPU(張量處理器)所展現的性能與成本優勢,被外界解讀為對英偉達GPU(圖形處理器)霸主地位的強勁挑戰。資本市場反應迅速,英偉達市值一度蒸發超千億美元。
這場由巨頭博弈引發的震蕩,將一個核心議題推至臺前:在以大模型為核心的AI時代,硬件的技術范式是否正在從通用GPU轉向專用芯片如TPU?這是否意味著一場結構性的變革已然來臨?
這一懸念不僅關乎國際巨頭的戰略布局,也緊密牽動著中國AI算力產業鏈的神經。作為對標英偉達、不久前剛剛上市的中國GPU廠商代表,摩爾線程創始成員、摩爾學院院長李豐與沐曦高級副總裁孫國梁在今日騰訊contech大會上“同框”,并回應了對于兩種路線的看法。
在李豐看來,爭議背后其實是“通才與專才”的分工,而非簡單的替代關系。
他分析,谷歌能做TPU,本質上是因為它是全棧整合公司。谷歌有強大的 Infra、基礎模型與云服務形成閉環,把模型跑在自家芯片上量身優化,實現成本性價比的最大化。“但絕大部分企業不具備這樣的垂直整合能力。”
他總結,GPU持續保持優勢的原因有三個:靈活度是“甜點”、多模態時代的全功能性、生態的護城河。
尤其在AI算法范式從CNN(卷積神經網絡)、Transformer到未來世界模型快速迭代的創新階段,李豐認為,新型算子不斷涌現,通用GPU憑借性能與靈活度的“甜點”位置,始終處在創新試驗場的前沿。
在他看來,未來是多模態的,需要“理解世界、用三維構建世界、超高清傳輸世界”,全功能GPU的“圖算一體”能力在跨域支持所有計算范式上,有不可替代的優勢。因此摩爾線程會繼續啃最困難的全功能GPU圖算一體的“硬骨頭”。
生態更是關鍵壁壘,英偉達之所以在計算領域成為“王者”,得益于它所建立起的CUDA生態,能夠聯合所有開發者建設生態。李豐稱,摩爾線程也在搭建自己MUSA的生態。
沐曦創始人孫國梁的觀點更加直接:任何芯片架構都沒有高低優劣之分,關鍵還是看場景。
他認為,GPU和ASIC(專用芯片)的架構幾十年前就存在,已經是超級穩態。而現在的大模型太卷了,迭代速度非常快,達到了按周計、按月計的程度,任何基礎模型遠未到達收斂的時間點,通用 GPU 的泛化能力和適配性仍是核心競爭力,現在業界還很難把一個專用性的產品放在通用的場景里。
但與此同時,客戶是多元化的,應用場景分散、層出不窮,因此GPU和類似TPU這樣的ASIC會長期共存。
對于英偉達股價近期的波動,孫國梁認為,這或是一種很好的“砍價方式”。而華爾街此前將英偉達推上市值榜首,證明了通用性GPU在當前歷史階段的主流地位。
不過,盡管肯定了通用性芯片的價值,李豐同時認可專用芯片在特定場景的價值,他判斷,未來一定還會有超大型的有云服務的公司,在自己某種超大型服務以及算法收斂穩定到一定階段時選擇定制專門的TPU,并且在能力溢出時和其他的廠商進行合作。
事實上,在當前AI大模型的競賽中,單張計算卡的峰值算力已非唯一決勝因素,構建能夠連接成千上萬張計算卡的高性能網絡,并與軟件棧深度協同的集群系統,才是真正的核心競爭力。面對“實際訓練網絡規模有多大”的提問,摩爾線程和沐曦也給出了基于實踐的回答。
李豐透露摩爾線程目前有多個投入生產的千卡集群在運行,不是在實驗室,已在生產期運行,支持訓練和推理。不過現在AI大模型的運行并不在單卡的算力多少,實際上卡間互聯的網絡通信是非常復雜的架構,摩爾線程要做的是端到端全棧的解決方案。
沐曦的孫國梁也認為,AI基礎設施的最大挑戰在于明確產品的本質:客戶最終需要的是一個能夠可靠支持大規模模型訓練、推理與服務的通用算力平臺,而非孤立的一張卡或一臺服務器。他表示沐曦已在全國范圍內部署了數千卡規模的集群,并且成功完成了從傳統模型到MoE(混合專家)模型乃至非Transformer架構模型的訓練任務。





京公網安備 11011402013531號