華為云CEO張平安：CloudMatrix384 AI Token服務全面上線

IP屬地中國·北京 封面新聞 時間：2025-09-19 12:15:52

封面新聞記者孟梅易弋力
9月19日，華為全聯接大會2025（HC 2025）上，華為常務董事、華為云計算CEO張平安介紹了華為云昇騰AI云服務的重磅升級與創新進展。
依托華為剛剛發布的最新AI服務器規劃，CloudMatrix云上超節點規格將從384卡升級到未來的8192卡，實現50~100萬卡的超大集群，為智能時代提供更澎湃的AI算力。為充分釋放算力潛能，華為云還首創了彈性內存存儲服務EMS，打破傳統AI算力與顯存綁定限制，讓內存可以替代昂貴的顯存，以存補算，提升大模型多輪對話的性能。
當下AI算力需求正以指數級增長，面對不同客戶需求，華為云提供了靈活的使用方式。
張平安指出，AI的Token服務可以有效屏蔽復雜的底層技術實現，是最高效的推理算力使用方式。會上，張平安宣布華為云CloudMatrix384 AI Token服務全面上線，將以優的性能、好的服務、高的質量，高效滿足各行各業所需的“最終AI計算結果”。
華為云通過CloudMatrix384超節點的創新架構，將資源全面池化，形成算力池、內存池、顯存池等，把計算型任務、存儲型任務、AI專家系統解耦開來，將串行任務盡可能地變成分布式并行任務，極大地提升系統推理性能。在在線、近線和離線等不同時延要求推理場景中，CloudMatrix384的平均單卡推理性能是中國特供H20的3~4倍。目前、已經為Pangu，DeepSeek，Qwen等業界主流大模型提供極致的Token服務，加速各行業 AI 技術落地與業務創新。
360納米AI依托CloudMatrix384的Token推理服務，成功處理每天上千萬的內容生成請求。中科院構建的“磐石·科學基礎大模型”平臺，基于CloudMatrix384超節點內部高速互聯架構及融合算子優化，模型訓練精度更高，超出GPU 4%，支持100+專業院所領域場景，不斷拓展人類認知的前沿。
隨著 AI 算力需求的暴增，企業對基礎設施散熱、功耗、運維等也提出更高的要求。華為云在貴州、內蒙古、安徽部署大規模、領先的全液冷AI數據中心，將液冷年均 PUE 降低至 1.1。通過華為云的AI云服務，企業無需花時間改造或新建傳統數據中心，只需一對光纖，就能夠獲取華為云上高效的AI算力。華為云提供了全棧專屬AI云服務，企業可以把模型和數據放到華為云專屬物理隔離資源池進行訓練和調優，全程端到端加密，同時自主掌握密鑰，在保障數據安全的同時，高效享用華為云提供的AI基礎設施。
華為云昇騰AI云服務的升級，不僅為客戶帶來了極致性能的Tokens服務，更通過技術創新與多樣化部署模式，為千行萬業的智能化升級注入了強大動力，推動AI技術在各領域的深度應用與發展。如今，昇騰AI云服務的客戶數量從去年的321家已增長到今年的1805家，華為云AI總算力規模相比去年同期增長了268%。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

人工智能新戰場，在10月后出現了

羅永浩：網速問題已解決，新微信會屏蔽所有媒體人

全站最新

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

熱門推薦

馬斯克成全球首位超7000億美元富豪

谷歌起訴爬蟲公司SerpApi

全球首款2nm手機芯片誕生

飛豬：元旦假期客單價提升10%，出境游強勁增長

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

芯片，重磅突發！全球首款！

人工智能新戰場，在10月后出現了

羅永浩：網速問題已解決，新微信會屏蔽所有媒體人

OpenAI、xAI打破硅谷鐵律，AI人才年薪破億成常態

AI教父Hinton首爆十年前拍賣：我早已內定谷歌必贏！

AI交易暫時企穩，圣誕行情值得期待否？

世貿組織預測：人工智能有望推動全球貿易增長近40%