10 月 11 日消息,科技媒體 techpowerup 今天(10 月 11 日)發(fā)布博文,報道稱在“Advancing AI”大會上,AMD 公司更新推出了 Instinct MI325X 加速卡。

MI325X 加速卡基于 CDNA 3 架構,相比較舊款 MI300X 帶來了一系列改進。為了迎接萬億參數(shù)的 AI 模型,AMD MI325X 加速卡重點提升了 HBM3E 內存和計算能力。

規(guī)格和性能
AMD MI325X 加速卡配備 256 GB 的 HBM3E 內存,容量是 MI300(192GB)的 1.8 倍,帶寬更是達到了 6 TB/s。

新的加速器在 FP16 下提供 1.3 PetaFLOPS,在 FP8 訓練和推理下提供 2.6 PetaFLOPS,較 MI300 提升 1.3 倍,所有這些都集成在一個擁有 1530 億個晶體管的芯片中。

配備八個 MI325X 加速器的系統(tǒng)可實現(xiàn) 20 TB HBM3E 內存和 48 TB/s 帶寬,計算性能為 10.4 PetaFLOPS(FP16)和 20.8 PetaFLOPS(FP8)。

AMD 聲稱,Instinct MI325X 在內存帶寬、FP16 / FP8 計算性能上超越 NVIDIA H200 HGX 系統(tǒng) 1.3 倍,在內存容量上超越 1.8 倍。
ROCm
加速器核心是 ROCm 軟件堆棧,AMD 計劃將 ROCm 引入每款 GPU(甚至包括消費級 GPU),并與開源社區(qū)合作集成最新功能。
AMD 表示會和開源社區(qū)合作,將 PyTorch、Triton、onNX 等框架的功能整合到 ROCm 堆棧中。
Instinct MI350X 系列
援引 AMD 官方報道,該公司正在為 2025 年下半年準備 Instinct MI350X 系列,預計將推出基于 TSMC 3 納米工藝的 CDNA 4 Instinct MI355X 加速器,配備 288 GB HBM3E。





京公網(wǎng)安備 11011402013531號