科創板上市后,“國產GPU第一股”摩爾線程(688795.SH)12月20日召開了首屆MUSA開發者大會,公布了新的GPU架構和基于該架構的三款芯片。
摩爾線程被認為是國內GPU公司中最像英偉達的一家,其產品結構與英偉達有一定相似度。與英偉達的迭代節奏類似,2022年至2024年,摩爾線程每年迭代一個GPU架構。2022年的春曉架構,代表產品包括第一代面向云計算的AI智算板卡S3000,2023年推出的曲院架構,對應第一代訓推一體智算板卡S4000。2024年發布平湖架構并推出基于該架構的板卡S5000。
此次推出的新架構花港,其算力密度比前一代提升50%,支持從FP4到FP64的全精度計算,支持十萬卡以上規模智算集群擴展,并內置AI生成式渲染架構。此次推出的三款新芯片是華山、廬山和長江,分別是AI訓推一體芯片、圖形渲染芯片和SoC(系統級芯片)。
業界正通過支持低精度、進行混合精度計算來提升計算效率。摩爾線程AI智算板卡支持的計算精度范圍也有所擴大。摩爾線程上一代板卡S5000開始支持FP8精度,新一代的華山則開始支持FP4。英偉達目前出貨的主力芯片Blackwell也支持FP4精度計算。
從算力看,摩爾線程此前公開了一些AI智算板卡的性能數據。其中S4000板卡在FP32、TF32、FP16、INT8精度下的算力分別為25 TFLOPS、49 TFLOPS、98 TFLOPS、196 TOPS,最大功耗450W。對比2020年英偉達推出的A100 80GB PCle(80GB),A100在上述精度下的算力分別為19.5TFLOPS、156TFLOPS、312TFLOPS、624TOPS,最大功耗300W。相比之下,S4000在一些精度下的算力表現和功耗表現不及A100。
上一代板卡S5000此前未公開具體性能,此次開發者大會上,摩爾線程創始人、董事長兼CEO張建中則透露了一些信息。他表示,在DeepSeek-R1全量模型分布式推理場景中,S5000的Prefill Only、Decode單卡吞吐量,分別是H20等常見芯片產品的約2.5倍、1.3倍。新一代華山的浮點計算能力則介于英偉達Blackwell和Hopper之間,華山的訪存帶寬與Blackwell接近,高速互聯帶寬在Hopper和Blackwell之間。
AI智算板卡支持的集群規模也在提升。此次摩爾線程推出了萬卡智算集群。張建中表示,2024年摩爾線程推出第一代千卡集群,今年達到1萬卡,接下來還要做10萬卡、50萬卡、100萬卡。

張建中表示,萬卡智算集群的工程難度來源于超大集群供電及液冷散熱、超大規模互聯組網及通信、集群訓練有效算力、訓練穩定性與可用性、模型訓練精度與效果測評等方面。大模型訓練的發展趨勢則包括模型走向萬億參數、訓練集群規模邁向10萬卡、訓練精度從FP16走向FP8和FP4,未來需要解決一系列挑戰,包括實現高效并行訓練、實現FP8和FP4低精度訓練、實現高性能通信等。
摩爾線程此次還推出了具身智能仿真訓練平臺和AI算力筆記本MTT AIBOOK。
摩爾線程12月5日在科創板上市,發行價114.28元/股,隨后股價波動頗大。12月11日該股收盤價超900元/股,隨后股價有所回調,12月19日收盤價664.1元/股。摩爾線程尚未盈利,截至今年6月底,公司累計未彌補虧損16億元。該公司預計2027年可實現合并報表盈利,但相關前瞻性信息具有不確定性。





京公網安備 11011402013531號