快科技12月20日消息,在今天的首屆MUSA開發者大會上,摩爾線程正式發布了新一代GPU架構"花港",并帶來了首款基于"花港"的云端AI加速GPU"華山"。
![]()
"華山"芯片可應用于超十萬卡級的AI工廠,其搭載新一代Scale-up系統,兼容MTlink 4.0和多種以太協議,適配多種Scale-up switch,支持SHARP,片間互聯速率可達1314GB/s。
據介紹,KUAE萬卡群浮點運算能力可達10 Exa - FLOPS,精度模型效果優于國際主流,大模型MFU可達60%。
此外,集群有效訓練時長達到90%,零中斷技術理論可達99%,萬卡集群訓練線性度達到了95%,性價比更是達到HXX(H20)的1.5倍。
根據官方數據,在DeepSeek R1全量模型分布式推理性能方面,MTT S5000的PD分離-分布式集群, DeepSeek Prefill Only性能單卡吞吐達到H20的2.5倍,DeepSeek Decode單卡吞吐達到1.3倍。
![]()
![]()





京公網安備 11011402013531號