環球網
12月20日,摩爾線程在首屆MUSA開發者大會(MDC 2025)上,系統展示了其在全功能GPU領域從架構創新、集群能力到生態建設的突破。
其中最引人關注的是新一代GPU架構“花港”的亮相,以及可支撐萬億參數模型訓練的“夸娥”萬卡智算集群的實際效率披露。
架構迭代:“花港”亮相,雙芯片路線瞄準AI與圖形
大會的核心發布之一是新一代全功能GPU架構“花港”。根據摩爾線程公布的信息,該架構在計算密度上提升50%,效能提升最高達10倍,并完整支持從FP4到FP64的全精度計算。尤為關鍵的是,架構層面集成了自研的MTlink高速互聯技術,為十萬卡規模以上的集群擴展提供了底層支持。
![]()
“生態體系是GPU行業的核心護城河與價值所在。”摩爾線程創始人、董事長兼CEO張建中在主題演講中強調。他透露,基于“花港”架構,公司已規劃兩款芯片:專注于AI訓練與推理一體化的“華山”,以及瞄準高性能圖形渲染的“廬山”。其中,“廬山”在圖形性能上宣稱實現數量級提升,AI計算、幾何處理及光線追蹤性能分別提升64倍、16倍和50倍。
這一架構與產品路線的發布,標志著摩爾線程不再局限于單一場景的加速卡產品,而是向覆蓋AI計算、圖形渲染、科學計算等全場景的“全功能GPU”平臺邁進。在業內人士看來,這既是技術能力的體現,也是應對市場多元需求、構建更寬生態護城河的戰略選擇。
集群能力:萬卡訓練效率指標首度公開
如果說芯片架構是“點”的突破,那么集群能力則是“面”的驗證。本次大會上,摩爾線程首次系統披露了其“夸娥”萬卡智算集群的關鍵工程效率指標,使其成為國內少數公開萬卡級實際訓練效率的廠商之一。
數據顯示,該萬卡集群在訓練稠密(Dense)大模型時,模型算力利用率(MFU)達到60%,訓練混合專家(MOE)模型時MFU為40%,訓練線性擴展效率達95%,有效訓練時間占比超過90%。這些指標,特別是MFU,是衡量超大規模AI集群實際效能的關鍵,其數值直接關系到訓練的總體成本與可行性。
“雖然構建國產萬卡乃至十萬卡級別的超大規模智算系統存在難度,但這是必須完成的產業基礎設施任務。”中國工程院院士、清華大學計算機系教授鄭緯民在大會演講中說道。他認為,國產計算顯卡與國外主流產品的性能差距正在持續縮小,而集群能力的突破是發展“主權AI”、實現“算力自主”不可或缺的一環。
在推理側,摩爾線程聯合硅基流動,在DeepSeek R1 671B全量模型上實現了性能突破。經優化后,MTT S5000單卡在Prefill階段吞吐量突破4000 tokens/s,Decode階段突破1000 tokens/s。這一數據為國產GPU在超大規模模型推理場景樹立了新的性能基準,也反映了從硬件到軟件系統級調優的成效。
生態開放:從軟件開源到開發者賦能,構筑長期壁壘
硬件與集群的突破之外,本次大會的另一條主線是生態的開放與賦能。摩爾線程宣布,其自主統一的軟件架構MUSA已迭代至5.0版本,并計劃逐步開源包括計算加速庫、通信庫及系統管理框架在內的核心組件。
“開發者是生態建設的關鍵,國產芯片平臺必須構建起友好、易用的開發環境。”鄭緯民院士特別強調了開發者在生態中的核心作用。為降低開發門檻,摩爾線程發布了搭載自研“長江”智能SoC的AI算力本MTT AIBOOK,提供端側50TOPS算力,旨在實現從芯片到開發環境的全棧整合與“開箱即用”。
同時,其面向開發者的“摩爾學院”平臺已匯聚近20萬學習者,并通過校企合作覆蓋全國超200所高校。這種從底層技術開源、到開發工具供給、再到人才早期培養的全鏈路生態建設思路,折射出國產GPU企業對于行業規律的理解——生態的構建是一場需要長期投入、多方協同的馬拉松。
技術融合與前沿探索:圖形、AI與科學計算交匯
本次發布也揭示了GPU技術演進的前沿趨勢:即圖形、AI與高性能計算的深度融合。摩爾線程宣布,基于“花港”架構實現了硬件級光線追蹤加速,并推出了自研的AI生成式渲染技術MTAGR 1.0,推動渲染從“計算”走向“生成”范式。
此外,公司已在具身智能、科學智能(AI for Science)、AI for 6G等前沿交叉領域展開布局,發布了具身智能仿真訓練平臺MT Lambda及相應的機器人解決方案。這些舉措表明,其技術路線并非僅追逐單一的AI算力,而是著眼于GPU作為通用計算平臺在未來更廣闊場景中的滲透與價值重塑。
自主算力進入“系統攻堅”與“生態破局”深水區
摩爾線程此次的全棧技術展示,從一個側面反映了當前國產高端算力發展的階段特征:從單點芯片的“從無到有”,正進入需要攻克超大規模系統工程、構建繁榮應用生態的“深水區”。
萬卡集群的效率公開,意味著國產算力基礎設施已開始接受大規模、高負荷實際場景的檢驗。而架構的迭代、圖形與AI的融合,以及對科學計算等前沿領域的探索,則展現了企業試圖參與定義下一代計算架構的技術布局。
然而,通往成熟生態的道路依然漫長。硬件性能的持續提升、軟件棧的深度優化、與國內外主流開發框架及應用的廣泛兼容,以及吸引足夠數量和質量開發者形成網絡效應,均是擺在所有國產GPU廠商面前的共同課題。
此次,隨著“花港”架構及后續芯片路線圖的公布,摩爾線程已將其技術藍圖進行詳細披露。然而,能否將全棧自研的技術實力,真正轉化為可持續的開發者生態與行業滲透力,仍將是一場考驗定力、協作與市場智慧的長期工程。這也將推動國產高端算力的發展,從單點突破駛入系統攻堅與生態構建的深水區。





京公網安備 11011402013531號