IT之家 9 月 10 日消息,英偉達今日宣布推出新產品 Rubin CPX,這是一款專為大規模上下文處理而設計的專用 GPU,涵蓋了像大規模編碼和生成視頻這樣要求高的工作。
該硬件旨在將理解 AI 提示的任務與生成響應的任務區分開,英偉達表示,這將使整個過程對客戶的效率更高。
![]()
該新硬件預計將作為較大的 Vera Rubin 平臺的一部分工作,該平臺同時集成了 Vera CPU 和 Rubin GPU。英偉達聲稱全機架版本 Vera Rubin NVL144 CPX 擁有 8 exaflops 的 AI 性能。
![]()
IT之家從英偉達新聞稿獲悉,獨立的 Rubin CPX GPU 包含 128GB 的 GDDR7 顯存。英偉達承諾,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的計算能力。
英偉達 CEO 黃仁勛將 Rubin CPX 與 RTX 進行了比較,他說:“正如 RTX 革新了圖形和物理 AI,Rubin CPX 是首款專為大規模上下文 AI 設計的 CUDA GPU,能夠在同一時間推理跨越數百萬個知識符號的模型。”他還試圖量化客戶的投資回報,提到部署新硬件的 1 億美元投資可以產生 50 億美元的收益。
英偉達表示,該硬件將得到其完整軟件棧的支持,包括 Nemotron —— 其一系列開放的多模態模型,專為構建企業級 AI 代理(旨在自主處理復雜任務的系統)而設計。Nemotron 模型提供不同尺寸,從 Nano 用于設備端應用,到 Super 用于單 GPU 設置,再到 Ultra 用于大型數據中心。
英偉達表示,預計 Rubin CPX 將于 2026 年底推出。





京公網安備 11011402013531號