本文時代財經 作者:郭美婷
上市15天后,摩爾線程(摩爾線程-U,688795.SH)向外界秀出了自己的“肌肉”。
12月20日-21日,摩爾線程首屆MUSA開發者大會(MDC 2025)舉辦,摩爾線程創始人、董事長兼CEO張建中一連公布了一系列技術與產品進展,其中包括全新架構“花港”,基于該架構的“華山”、“廬山”芯片,智能SoC芯片“長江”,以及夸娥萬卡智算集群和AI算力本MTT AIBOOK等。
![]()
圖源:截圖自摩爾線程直播
業界慣將摩爾線程比作“中國的英偉達”,在發布會上,張建中也未避諱提到與英偉達的對比。以最新發布的“華山”芯片為例,張建中表示,“華山”的訪存帶寬、浮點算力和高速互聯帶寬三個指標能力介于英偉達的最新架構Blackwell和上一代架構Hopper之間,而訪存容量則高于二者。
![]()
圖源:截圖自摩爾線程直播
“過去,大部分大模型開發者不敢用國內的卡訓練,怕訓練的結果不好。”張建中說,“我們可以有信心地跟大家講,如果你以前是在Hopper上做訓練,你今天用我們的S5000去訓練你的大語言模型,效果只會比它好,不會比它差。”
在現場,多位摩爾線程的合作企業和開發者告訴時代財經,得益于MUSA框架對CUDA的兼容性,遷移至MUSA生態的難度相較于其他國產芯片更低,但遷移后仍會存在接口適配、功能適應等問題,“(生態)還處于爬坡階段。”一位企業開發者提到。不過,未來隨著廠商積極推進適配優化以及生態內的聯動加強,生態成熟度也將持續提升。
新架構和新芯片
從發布節奏來看,摩爾線程基本保持一年一迭代的節奏。從2022年的蘇堤開始,到春曉、曲院、平湖,此次發布會上,摩爾線程發布了新一代全功能GPU架構“花港”。
據了解,“花港”基于新一代指令集,支持FP4到FP64的全精度計算,算力密度相比上一代提升50%,效能提升10倍,支持十萬卡以上規模智算集群。
![]()
圖源:截圖自摩爾線程直播
張建中透露,基于該架構,摩爾線程公布兩款芯片技術路線。一款是“華山”,專注AI訓推一體與超大規模智能計算,集成新一代異步編程與全精度張量計算單元,支持從FP4至FP64的全精度計算;另一款是“廬山”,專攻高性能圖形渲染,AI計算性能提升64倍,幾何處理性能提升16倍,光線追蹤性能提升50倍,并在紋理填充、原子訪存能力及顯存容量方面有所增強。
此外,大會發布了夸娥萬卡智算集群,浮點運算能力達到10Exa-Flops,訓練算力利用率(MFU)在Dense大模型上達60%,MOE大模型上達40%,有效訓練時間占比超過90%,訓練線性擴展效率達95%,與國際主流生態兼容。張建中表示,2024年摩爾線程推出第一代千卡集群,今年達到1萬卡,接下來還要做10萬卡、50萬卡、100萬卡。
摩爾線程針對大模型訓練的挑戰,打造出的夸娥萬卡智算集群及其配套技術方案,可以通過軟硬件協同優化保障訓練穩定性與精度。張建中表示,摩爾線程選取 DeepSeek V3、DeepSeek R1等主流模型,采用FP8精度進行訓練復現。結果顯示,其訓練loss曲線與Hopper系列顯卡基本上一致,而從實際測評結果來看,相同數據量、相同模型的情況下,摩爾線程的訓練效果更優于國際主流顯卡。
除了芯片和智算產品外,摩爾線程還發布了搭載智能SoC芯片“長江”的AI算力本MTT AIBOOK,提供了50TOPS的端側AI算力,支持包括MT AIOS(Linux)、Windows虛擬機、Android 容器和國產操作系統等多系統切換,支持開發者在不同環境下開發各種國產應用場景。“我們把AI原生的應用場景都內置在這一臺AIBOOK中,它是一臺多系統隨意切換的,結合開發、娛樂、辦公于一體的(算力本)。”張建中表示。
生態是關鍵
“開發者是生態建設的關鍵,國產芯片平臺必須構建起友好、易用的開發環境,以有效服務開發者社群。”中國工程院院士、清華大學計算機系教授鄭緯民在此次大會上表示。
“生態體系是GPU行業的核心護城河與價值所在。”張建中也坦言。
針對生態,摩爾線程在大會上透露,其搭建的摩爾學院有近20萬名開發者與學習者,同時宣布建設MUSA生態中心,發布MUSA開發者計劃。
事實上,此次發布的MTT AIBOOK本身就是一個連接開發者與MUSA生態的入口。據摩爾線程現場介紹,客戶合作初期需要平臺驗證芯片的適配度,為此他們需要借助專用設備部署算法、開發待推理的模型,而MTT AIBOOK恰好滿足了這一需求場景。
![]()
圖源:時代財經攝
另外,張建中表示,摩爾線程準備做MUSACode代碼生成大模型,MUSACode可以做到自動化的從CUDA轉到MUSA,目前已經做到可編譯率93%,準確率90%以上。
在MUSA生態加速建設的過程中,大量基于傳統芯片架構的開發者與企業,正面臨不少要從原來的生態,遷移到MUSA生態的情況。
摩爾線程展區現場工作人員介紹,在傳統遷移場景下,開發者面臨的最大成本是代碼遷移成本。由于不同硬件體系、架構體系對應的編程語法結構與算子庫調用方式存在差異,遷移過程中需適配新的開發規范。為此,摩爾線程推出了相應的配套工具,可實現代碼的自動化遷移,無需開發者人工重寫代碼,僅需進行簡單的文本調整,即可實現近乎零成本的遷移。
第二類成本則是調試(debug)成本。目前,摩爾線程正逐步實現算子的百分之百替代適配。當開發者原項目中調用的各類算子,均能無縫適配MUSA生態對應的算子,且無運行報錯時,調試工作即可完成。總體而言,開發者遷移過程中的最大成本實則為時間成本。
時代財經在展區內了解到,近年來,全鏈國產化愈發成為眾多企業的發展趨勢。
一家初創企業表示,選擇摩爾線程的原因之一,是看中其全功能GPU定位,因為這意味著其搭建的生態能夠吸引的合作伙伴可能覆蓋各行各業。“它目前比英偉達是有性價比的。”該初創企業相關負責人表示,對于開發者而言,選擇契合自身現階段需求的產品即可滿足使用要求,價格性價比也更高。
另一家工業機器人企業研發人員稱,初期與摩爾線程適配時,也存在生態差別、接口不一等不適應的情況,不過經由兩邊的討論協商,這些難點都得到了一一解決。“硬件支持上一定是快速做到,只有接口適配,才能在后續進行其他功能的開發。”
尚陽科技在兩年前開始適配摩爾線程的MUSA生態,通過摩爾線程全功能GPU,其打造了企業級智能體引擎Useek曜芯智問。尚陽科技董事長李向陽向時代財經提到了摩爾線程的GPU全功能的定位,其能夠實現了圖形處理與計算功能等的一體化集成,部分性能對標英偉達產品。同時,此前多數開發者使用英偉達芯片,其調用算力所依賴的框架為CUDA,而MUSA框架在對CUDA的兼容性上表現優異,這一點與其他平臺存在顯著差異,也是其核心優勢所在。得益于MUSA框架具備深度兼容特性,開發者向該平臺遷移項目時,操作流程將更為簡便。李向陽稱,目前他最關注的是MUSA生態未來在細節功能的適配上的進展。





京公網安備 11011402013531號