IT之家 12 月 15 日消息,英偉達今日發布 Nemotron 3 開源模型系列,包括 Nano、Super 和 Ultra 三種規格,宣稱是構建 AI 智能體應用時“具有最佳準確性的最高效開源模型家族”。
![]()
Nemotron 3 系列模型宣稱引入了一種突破性的混合潛在專家(MoE)架構,幫助開發者大規模構建和部署可靠的多智能體系統。
英偉達表示,隨著組織從單一模型聊天機器人轉向協作式的多智能體 AI 系統,開發者面臨著越來越多的挑戰,包括通信開銷、上下文漂移和高昂的推理成本。此外,開發者需要透明度來信任那些將自動化其復雜工作流程的模型。Nemotron 3 直接應對這些挑戰,提供客戶所需的表現力和開放性,以構建專門化的智能體 AI。
早期采用者包括安永、思科、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西門子、Synopsys、Zoom、Accenture、Cadence 和 Cursor,正在將 Nemotron 家族的模型集成到 AI 工作流中,以推動制造業、網絡安全、軟件開發、媒體、通信等行業的應用。
開放的 Nemotron 3 模型使初創公司能夠更快地構建和迭代 AI 智能體,并加速從原型到企業部署的創新。
IT之家從英偉達官方獲悉,Nemotron 3 的 MoE 模型系列包括三種規格:
Nemotron 3 Nano,一款小型的 30-billion-parameter 模型,每次激活最多 30 億參數,適用于針對性強、高度高效的任務。Nemotron 3 Super,一款高準確性的推理模型,擁有約 1000 億參數,每個 token 最多激活 100 億參數,適用于多智能體應用。Nemotron 3 Ultra 是一款擁有約 5000 億參數和每 token 最多 500 億活躍參數的大型推理引擎,適用于復雜的 AI 應用。
Nemotron 3 Nano 宣稱是目前計算成本效率最高的模型,專為軟件調試、內容摘要、AI 助手工作流程和低推理成本的信息檢索等任務進行優化。該模型相比 Nemotron 2 Nano 實現了高達 4 倍的 token 處理吞吐量,并將推理 token 生成減少了 60%,顯著降低了推理成本。憑借 100 萬 token 的上下文窗口,Nemotron 3 Nano 能記住更多信息,使其在處理長時間、多步驟任務時更加準確且具備更強的信息關聯能力。
Nemotron 3 Nano 今日已在 Hugging Face 上線,Nemotron 3 Super 和 Ultra 預計將在 2026 年上半年推出。IT之家附開源地址:





京公網安備 11011402013531號