IT之家 12 月 18 日消息,在江蘇昆山舉行的光合組織 2025 人工智能創新大會(HAIC2025)上,中科曙光今日發布并展出了大規模智能計算系統 —— scaleX 萬卡超集群,這也是國產萬卡級 AI 集群系統首次以真機形式亮相。
![]()
中科曙光高級副總裁李斌介紹,scaleX 萬卡超集群是曙光發揮大型計算機系統研制經驗優勢,面向萬億參數大模型、科學智能等復雜任務場景打造的大規模智能算力基礎設施方案。面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,scaleX 萬卡超集群在超節點架構、高速互連網絡、存儲性能優化、系統管理調度等方面實現了多項創新突破,部分技術與能力已超越海外同類產品研發路線圖的 2027 年 NVL576 里程節點。
IT之家附 scaleX 萬卡超集群的核心技術優勢如下:
優勢 1:全球首創單機柜級 640 卡超節點。scaleX 萬卡超集群由 16 個曙光 scaleX640 超節點通過 scaleFabric 高速網絡互連而成,可實現 10240 塊 AI 加速卡部署,總算力規模超 5EFlops。作為世界首個單機柜級 640 卡超節點,scaleX640 采用超高密度刀片、浸沒相變液冷等技術,將單機柜算力密度提升 20 倍,PUE 值低至 1.04。優勢 2:自主研發原生 RDMA 高速網絡。曙光 scaleFabric 網絡,基于國內首款 400G 類 InfiniBand 的原生 RDMA 網卡與交換芯片,可實現 400Gb/s 超高帶寬、低于 1 微秒端側通信延遲,超節點間的通信性能達到業內領先水平,充分釋放萬卡超集群算力,并可將超集群規模輕松擴展至 10 萬卡以上,相比傳統 IB 網絡提升 2.33 倍,同時網絡總體成本降低 30%。優勢 3:存、算、傳緊耦合深度優化。通過“超級隧道”、AI 數據加速等設計,實現從芯片級、系統級到應用級的三級數據傳輸協同優化,使存力平臺高效應對大模型訓練時萬卡并發讀寫帶寬極致需求挑戰,提升高通量 AI 推理時的響應速度與結果精準度,并可將 AI 加速卡資源利用率提高 55%。優勢 4:超集群數字孿生與智能調度。通過物理集群數字孿生,實現故障定位、修復等全流程可視化智能管理;智能化運維平臺可支撐集群長期可用性達 99.99%;智能調度引擎可管理萬級節點、服務十萬級用戶,支持每秒萬級作業調度。
scaleX 萬卡超集群可支持多品牌加速卡以及主流計算生態,并實現 400+ 主流大模型、世界模型等適配優化。在實際應用中,該超集群可覆蓋大模型訓練、金融風控、地質能源勘探及科學智能等多元場景。





京公網安備 11011402013531號