IT之家 8 月 25 日消息,英偉達于 8 月 22 日發布博文,深入分析了其最快 AI 芯片 Blackwell Ultra GB300,比上一代 GB200 性能提升 50%。
該芯片采用雙光罩(Reticle)設計、2080 億晶體管、2 萬個 CUDA 核心,并配備 288GB HBM3e 顯存,帶寬達 8TB/s。
GB300 采用雙光罩(IT之家注:芯片光刻時單次曝光的最大尺寸單位,雙光罩設計指通過互連技術將兩顆大芯片作為一體運行)大芯片設計,通過 NV-HBI 高速互連將兩顆芯片以 10TB/s 帶寬連接為單顆 GPU。
![]()
該芯片基于臺積電 4NP 工藝制造,集成 2080 億晶體管,擁有 160 個 SM 單元,每個 SM 共有 128 個 CUDA 內核,總計 20480 個 CUDA 核心與 640 個第五代 Tensor 核心,并具備 40MB TMEM。
![]()
在存儲方面,GB300 配備 288GB HBM3e 顯存,帶寬達 8TB/s,較 GB200 的 192GB 大幅提升,8 組堆疊顯存通過 8192-bit 位寬連接,可容納 3000 億以上參數模型,支持更長的上下文長度及更高計算效率。
![]()
互連方面,Blackwell Ultra 支持第五代 NVlink,實現每 GPU 1.8TB/s 雙向帶寬,最多支持 576 GPU 互連;PCIe Gen6 接口提供 256GB/s 帶寬,并支持與 Grace CPU 的 NVlink-C2C 協同。企業特性還包括多實例 GPU(MIG)分區、安全計算和 AI 預測運維功能。
![]()
![]()
在系統層面,Grace Blackwell Ultra 超級芯片將一顆 Grace CPU 直連兩顆 GPU,構成 GB300 NVL72 機架系統,峰值算力可達 1.1 EFLOPS FP4。
安全與管理方面,GB300 搭載升級版 GigaThread 調度引擎,支持多實例 GPU(MIG)靈活分配顯存資源,并引入機密計算與 TEE-I/O 特性保障 AI 模型與數據安全。
![]()





京公網安備 11011402013531號