(文/觀察者網 呂棟)
近日,中國移動招標與采購網顯示,中國移動研究院2025年超節點試驗裝置采購項目開標,中標候選人為華為技術有限公司(下稱:華為),投標報價為1.35億元,擬中標份額100%。
觀察者網注意到,該采購的招標公告于11月6日發布,招標內容包括超節點試驗裝置1套(含超節點智算模塊(含計算及配套網絡等)48套、超節點存儲模塊1套)。
就在11月11日,華為公布其第六屆“十大發明”,“Scale-up超大規模超節點算力平臺”排在第一位。
據介紹,該發明將超節點內的異構并行處理器、CPU、內存、存儲等資源,通過高速互聯總線形成全對等互聯架構,實現共享內存池;資源可根據不同的任務需求,像搭積木一樣進行靈活調配組合,實現了“一切皆對等、一切皆可池化、一切皆可組合”,使數百、數千個AI處理器聯接起來,像一臺計算機一樣工作、學習、思考、推理。
而根據華為之前公布的信息,昇騰384超節點首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡Matrixlink全對等互聯,算力總規模達300Pflops,是英偉達NVL72的1.7倍;網絡互聯總帶寬達269TB/s,比英偉達NVL72提升107%;內存總帶寬達1229TB/s,比英偉達NVL72提升113%;單卡推理吞吐量達到2300 Tokens/s。
![]()
圖源:觀察者網
在當下,大模型對算力需求的爆炸式增長,但傳統計算架構面臨資源利用率低,故障頻發等挑戰,難以支撐AI技術的代際躍遷,這對算力集群的提出更高要求。隨著傳統服務器集群的堆卡模式,已無法實現算力的線性增加,超節點正在成為AI基礎設施建設的新常態。除了華為,國內多家廠商也都在探索超節點系統。
比如近期中科曙光也發布了全球首個單機柜級640卡超節點scaleX640,該方案采用“一拖二”高密架構設計,實現了單機柜640卡超高速總線互連,綜合算力性能實現倍增,同時單機柜算力密度提升20倍;相比傳統方案,可實現MoE萬億參數大模型訓練推理場景30%-40%的性能提升。
中科曙光表示,通過30天+長穩運行可靠性測試驗證,scaleX640可保障10萬卡級集群擴展部署。
![]()
中科曙光scaleX640超節點
百度昆侖芯也在9月首次展示了自己的超節點方案,據稱該方案單個機柜可支持32至64張加速卡的靈活部署,在DeepSeek V3/R1 PD分離推理架構的優化下實現了單卡性能提升95%,單實例推理性能大幅提升高達8倍,已在百度內部實現大規模部署。
![]()
昆侖芯超節點
無獨有偶,在今年世界人工智能大會上,上海儀電、曦智科技、壁仞科技和中興通訊,聯合發布了國內首個光互連光交換GPU超節點——光躍LightSphere X。據介紹,相比銅纜,光纜的遠距離傳輸優勢可實現交付與機柜解耦。該方案采用光互連技術,通過增加機柜數量構建超節點,能按模型算力需求動態調整超節點規模,將實現2000卡部署。
![]()
圖源:觀察者網
相比傳統的計算集群,超節點到底有哪些不同?
根據華為董事、ICT BG CEO楊超斌近期的介紹,超節點應具備6大特征:總線級互聯、平等協同、全量池化、協議歸一、大規模組網、高可用性。它事實上就是改變過去的“主從架構”,構建一臺能學習、思考、推理的超級計算機,物理上由多臺機器組成,但邏輯上以一臺機器學習、思考、推理。
隨著算力集群邁入“萬卡協同”時代,在今年華為全連接大會上,華為宣布了未來的超節點演進計劃,計劃2026年四季度上市的Atlas 950超節點,基于8192顆昇騰950DT芯片打造,滿配包括由128個計算柜、32個互聯柜,共計160個機柜組成,柜間采用全光互聯,FP8算力達到8E FLOPS,FP4算力達到16E FLOPS,互聯帶寬達到16PB/s。這意味著,Atlas 950一個產品的總互聯帶寬,將超過今天全球互聯網峰值帶寬的10倍。
![]()
圖源:觀察者網
“Atlas 950超節點,至少在未來多年都將是全球最強算力的超節點,并且在各項主要能力上都遠超業界主要產品。其中,相比英偉達同樣將在明年下半年上市的NVL144,Atlas 950超節點卡的規模是其56.8倍,總算力是其6.7倍,內存容量是其15倍,達到1152TB;互聯帶寬是其62倍,達到16.3PB/s。即使是與英偉達計劃2027年上市的NVL576相比,Atlas 950超節點在各方面依然是領先的。”華為輪值董事長徐直軍稱。
華為還計劃構建更大規模的超節點算力集群,比如Atlas 950 SuperCluster集群,由64個Atlas 950超節點互聯組成,把52萬多片昇騰950DT組成一個整體,FP8總算力可達524 EFLOPS。相比當前世界上最大的集群 xAI Colossus,規模是其2.5倍,算力是其1.3倍。與此同時,2027年四季度,華為還計劃基于Atlas 960超節點,推出Atlas 960 SuperCluster,規模達百萬卡級,FP8總算力達2 ZFLOPS,FP4總算力達4 ZFLOPS。
本文系觀察者網獨家稿件,未經授權,不得轉載。





京公網安備 11011402013531號