![]()
出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
頭圖 | 摩爾線程
在資本市場的熱度趨于平靜之時,摩爾線程又在產業端將人們的視線拉回。
12月20日,摩爾線程舉行了首屆“MUSA開發者大會”,發布全新一代全功能GPU架構“花港”,以及基于“花港”架構打造的AI訓推一體芯片“華山”,以及專用于高性能圖形渲染的芯片“廬山”。
![]()
此外,摩爾線程創始人張建中在現場還公布了“夸娥萬卡智算集群”,以及未來即將發布的MTT C256超節點結構規劃。
如果說上述內容還屬于“可預測的”技術迭代內,那么諸如中間語言MTX,以及光刻計算庫、量子計算融合框架等技術,就真的完全在人意料之外了。
當然,也可以說這些技術并非摩爾線程首次提出的,畢竟后面這幾項或多或少都在GTC大會上出現過,但從國產GPU公司體量來看,敢于全方位地去搭建生態,這本身就是件值得肯定的事。
對于正處于“情感估值”與“理性審視”交織中的摩爾線程來說,這場開發者大會也是在向外界傳達一個明確的信號,即無論行業作何評價,摩爾線程都會堅持以MUSA為核心,去打造類似英偉達CUDA的生態護城河。
與英偉達中門對狙?
先來說說本次開發者大會上,讓筆者最為震驚的一項技術:中間語言MTX。
它屬于MUSA 5.0軟件棧的一部分,對于MUSA統一架構,關注過摩爾線程的人或多或少都了解過,這是摩爾線程自主研發的覆蓋從芯片架構、指令集編程模型到軟件運行庫及驅動程序框架的全棧技術體系。
在此前幾次版本迭代中,MUSA主要集中在編程生態的擴充,比容兼容更多編程語言,或是豐富算子庫上,而今天提到的“中間語言MTX”屬首次出現。
![]()
簡單解釋下中間語言MTX是什么。它的核心作用是兼容不同代際GPU的指令架構,讓開發者無需為每一代新GPU重新適配代碼,大幅降低開發者適配成本,同時為上層軟件生態提供穩定的底層支撐。
用個更直觀的例子來說明下:在英偉達CUDA生態下,其核心底層組件之一,就是這個中間語言技術,英偉達將其命名為“PTX”,依托PTX中間語言,開發者在2018年為Turing架構芯片編譯的代碼,至今仍可通過驅動即時編譯在2025年的Blackwell芯片上運行。
那么做這個“中間語言”難嗎?應該說非常難,而且耗時耗力,同樣以英偉達的PTX為例,在2007年隨CUDA 1.0發布后,大部分版本都需要新增對應硬件的專屬指令(如Tensor Core相關指令),同時保持對舊版本的兼容,最終形成“高級語言→PTX→硬件二進制指令”的成熟編譯鏈路。
對于開發者來說,因為中間語言PTX的存在,更加沒理由拒絕CUDA,因為在英偉達之前,就沒有芯片廠商考慮過“向前兼容”的問題。
不過,對于國內GPU廠商而言,開發一個中間語言的難度肯定要遠大于英偉達,因此在今天之前,筆者從不認為真會有國內廠商去做這件事。
而按照張建中在今天開發者大會上的表態,在明年上半年,摩爾線程自研的MTX就將向開發者開放。
相較于英偉達的18年磨一劍,可以預見的是,摩爾線程的MTX在適用性上一定不如前者,不過敢于邁出這一步,還是足夠令人刮目相看。
畢竟,在GPU行業中,有著英偉達這座大山,“不做生態”已經成為了某種程度上的政治正確。
新架構,提升顯著
從2022年基于MUSA統一架構的“蘇堤”問世算起,摩爾線程先后推出了四代GPU架構,而本次發布的“花港”架構基本上可以看作是升級幅度最大的一代。
首先是計算性能的顯著提升。基于新一代指令集,“花港”架構較前代“平湖”的算力密度提升50%,同時能效大幅優化,且支持從FP4到FP64的全精度端到端的全精度端到端計算。
其次是異步編程與超大規模互聯的支持。新一代異步編程模型,能夠更好地優化任務調度與并行極致,而通過自研的MTlink高速互聯技術,將支持十萬卡以上規模的智算集群擴展。
![]()
值得一提的是,在開發者大會現場,張建中還明確表示,新一代“花港”架構將內置AI生成式渲染結構,并且完整支持DirectX 12 Ultimate。
據此基本可以判斷出,摩爾線程的消費級顯卡接下來一定會得到迭代,而且極大概率是一款基于“花港”架構打造的產品。在“消費級顯卡”這個小眾且最艱難的賽道上,摩爾線程依然沒有放棄。
基于“花港”架構,摩爾線程在今天發布了兩款芯片:“廬山”與“華山”。
先說說定位于“AI訓推一體”芯片的“廬山”。除了上文提到的新一代異步編程與全精度張量計算單元外,這枚芯片還有個特殊之處是能夠適配多種“類以太協議”,同時又適配多種Scale-Up switch。
這意味著“廬山”芯片不僅能在MTlink下使用,也可以兼容國內其他廠商的協議,而據張建中在現場的介紹,“廬山”最高支持在1024片超節點的擴展。
應該說,盡管摩爾線程執著于打造自研生態,但并沒有把路走窄。
另外一枚用于高性能圖形渲染的芯片“廬山”,其圖像性能對比MMT S80,在集成了AI生成式渲染后,AI計算性能提升64倍,UtiTE統一渲染架構讓幾何處理性能提升16倍,全新的硬件光追引擎,讓光線追蹤性能提升50倍。
![]()
除了芯片外,本次MUSA開發者大會還正式發布了“夸娥萬卡智算集群”。該集群具備全精度、全功能通用計算能力,在萬卡規模下實現高效穩定的AI訓練與推理。
![]()
繼續拓展生態邊界
今年,國內GPU行業的敘事逐漸從“能用”轉移到“好用”,尤其在H200解禁對華出口后,國內從業者更加感受到了緊迫。
在芯片“好用”這個問題上,摩爾線程答案仍聚焦于“生態”二字,不僅要實現生態自立,也在主動探索生態邊界。
比如在今天的開發者大會上,摩爾線程推出的“長江”SoC。這款芯片主要面向端側,通過CPU+GPU+NPU的組合,最高可提供50 TOPS的異構AI算力。
![]()
據張建中介紹,摩爾線程將推出基于“長江”SoC、AI芯片模組MTT E300和夸娥智算集群打造的MT Robot具身智能解決方案。
通過這個組合能夠看出,該款方案最大的特點是能夠協調“端—邊—云”算力。據悉,MT Robot已經用在了農業場景中。
另外值得一提的是,摩爾線程還基于這款SoC打造了一款名為“MTT AIBOOK”的AI算力本,未來還將推出一款迷你型計算設備MTT AI Cube。
![]()
而在具身智能方面,除了MT Robot外,摩爾線程還發布了MT Lambda具身智能仿真訓練平臺。
該平臺在定位上有些類似于英偉達的Issac Sim,但又不完全一樣。MT Lambda核心聚焦于“全棧融合”,旨在將物理引擎、渲染引擎與AI引擎深度整合,打破了傳統具身智能研發中“開發、仿真、訓練”各環節割裂的痛點,以提升研發效率。
此外,MT Lambda也可以直接部署到MT Robot上,以形成軟硬件的高效協同。
從摩爾線程在具身智能賽道上的生態拓展可以看出,在目前任何一個與“計算”有關的行業中,摩爾線程都試圖通過“全棧軟硬件架構+全場景產品”的布局占據身位,每一步都在拓展生態的邊界,同時每一步都面臨著實打實的挑戰。
某種意義上,這也是在走一遍英偉達來時的路,面對后者近20年沉淀出的生態霸權,摩爾線程能否搭建起另一條國產生態護城河,答案終究需要時間來檢驗。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4819257.html?f=wyxwapp





京公網安備 11011402013531號