IT之家 8 月 27 日消息,科技媒體 WccfTech 昨日(8 月 26 日)發(fā)布博文,報(bào)道稱在 Hot Chips 2025 上,AMD 公布了 Instinct MI350 系列 AI 加速卡的完整架構(gòu)細(xì)節(jié)。
該系列基于 3nm CDNA 4 架構(gòu),采用 3D 多芯粒設(shè)計(jì),集成 1850 億晶體管,支持 288GB HBM3e 高帶寬顯存,總帶寬達(dá) 8TB/s。
![]()
IT之家援引博文介紹,MI350 系列是 AMD 針對(duì) AI 領(lǐng)域的最新旗艦方案,主要提升訓(xùn)練和推理大語言模型(LLM)的能力,基于全新 CDNA 4 架構(gòu)與 3nm 工藝,采用 3D 多芯粒(3D Multi-Chiplet)設(shè)計(jì),單卡集成 1850 億晶體管,并引入 288GB HBM3e 顯存,單卡帶寬高達(dá) 8TB/s。
![]()
![]()
![]()
MI350 系列中包括風(fēng)冷的 MI350X 與液冷的 MI355X,兩者分別具備 1000W 與 1400W 功耗上限,最高頻率分別為 2.2GHz 和 2.4GHz。
![]()
核心采用 8 個(gè) XCD(加速計(jì)算芯粒)與 2 個(gè) IOD(IO 芯粒),通過第四代 Infinity Fabric 互聯(lián),雙向帶寬可達(dá) 1075GB/s,并內(nèi)置 256MB Infinity Cache,HBM3e 控制器支持 8 顆 36GB 堆疊顯存,形成 288GB 總?cè)萘俊?/p>
![]()
![]()
![]()
在計(jì)算單元方面,單卡配備 256 個(gè)計(jì)算單元(CU),共 16384 個(gè)流處理器及 1024 個(gè)矩陣核心,支持 FP8、MXFP6 / MXFP4、INT8 / INT4 等多種低精度數(shù)據(jù)類型,F(xiàn)P4 / FP6 算力最高 20PFLOPs,F(xiàn)P8 算力最高 80.5PFLOPs。
![]()
![]()
![]()
![]()
![]()
![]()
與上代 MI300 系列相比,運(yùn)行 Llama 3.1 405B 推理吞吐性能提升可達(dá) 35 倍,Deepseek R1 推理能力提升 3 倍。
![]()
![]()
![]()
系統(tǒng)擴(kuò)展上,MI350 系列支持 GPU 和顯存按需分區(qū),可在單插槽內(nèi)運(yùn)行多達(dá) 8 個(gè) 700 億參數(shù)模型實(shí)例,并可在多卡配置下通過 154GB/s 雙向鏈路互聯(lián)。
![]()
標(biāo)準(zhǔn) OAM 封裝可安裝至 UBB2.0 底板,8 卡系統(tǒng)可搭配最新第五代 EPYC 處理器與 400GbE 網(wǎng)絡(luò)接口,部署于數(shù)據(jù)中心機(jī)架。
![]()
相比較英偉達(dá)的 GB200 / B200 ,MI355X 在 FP6、FP64 等指標(biāo)上具備 2 倍以上優(yōu)勢(shì),HBM 容量領(lǐng)先 1.6 倍。AMD 表示,該系列將于 2025 年第三季度由合作伙伴供貨,并透露已著手研發(fā)下一代 MI400 系列,計(jì)劃 2026 年推出。
![]()
![]()
![]()





京公網(wǎng)安備 11011402013531號(hào)