![]()
封面新聞記者 孟梅 易弋力
9月19日,華為全聯接大會2025(HC 2025)上,華為常務董事、華為云計算CEO張平安介紹了華為云昇騰AI云服務的重磅升級與創新進展。
依托華為剛剛發布的最新AI服務器規劃,CloudMatrix云上超節點規格將從384卡升級到未來的8192卡,實現50~100萬卡的超大集群,為智能時代提供更澎湃的AI算力。為充分釋放算力潛能,華為云還首創了彈性內存存儲服務EMS,打破傳統AI算力與顯存綁定限制,讓內存可以替代昂貴的顯存,以存補算,提升大模型多輪對話的性能。
當下AI算力需求正以指數級增長,面對不同客戶需求,華為云提供了靈活的使用方式。
張平安指出,AI的Token服務可以有效屏蔽復雜的底層技術實現,是最高效的推理算力使用方式。會上,張平安宣布華為云CloudMatrix384 AI Token服務全面上線,將以優的性能、好的服務、高的質量,高效滿足各行各業所需的“最終AI計算結果”。
華為云通過CloudMatrix384超節點的創新架構,將資源全面池化,形成算力池、內存池、顯存池等,把計算型任務、存儲型任務、AI專家系統解耦開來,將串行任務盡可能地變成分布式并行任務,極大地提升系統推理性能。在在線、近線和離線等不同時延要求推理場景中,CloudMatrix384的平均單卡推理性能是中國特供H20的3~4倍。目前、已經為Pangu,DeepSeek,Qwen等業界主流大模型提供極致的Token服務,加速各行業 AI 技術落地與業務創新。
360納米AI依托CloudMatrix384的Token推理服務,成功處理每天上千萬的內容生成請求。中科院構建的“磐石·科學基礎大模型”平臺,基于CloudMatrix384超節點內部高速互聯架構及融合算子優化,模型訓練精度更高,超出GPU 4%,支持100+專業院所領域場景,不斷拓展人類認知的前沿。
隨著 AI 算力需求的暴增,企業對基礎設施散熱、功耗、運維等也提出更高的要求。華為云在貴州、內蒙古、安徽部署大規模、領先的全液冷AI數據中心,將液冷年均 PUE 降低至 1.1。通過華為云的AI云服務,企業無需花時間改造或新建傳統數據中心,只需一對光纖,就能夠獲取華為云上高效的AI算力。華為云提供了全棧專屬AI云服務,企業可以把模型和數據放到華為云專屬物理隔離資源池進行訓練和調優,全程端到端加密,同時自主掌握密鑰,在保障數據安全的同時,高效享用華為云提供的AI基礎設施。
華為云昇騰AI云服務的升級,不僅為客戶帶來了極致性能的Tokens服務,更通過技術創新與多樣化部署模式,為千行萬業的智能化升級注入了強大動力,推動AI技術在各領域的深度應用與發展。如今,昇騰AI云服務的客戶數量從去年的321家已增長到今年的1805家,華為云AI總算力規模相比去年同期增長了268%。





京公網安備 11011402013531號