當地時間12月2日,英偉達(NVDA.US)官宣與法國人工智能(AI)初創公司Mistral AI合作取得的重大突破。通過采用英偉達的最新芯片技術,Mistral AI開源模型家族的新成員在性能、效率和部署靈活性上實現跨越式提升。
![]()
當日,Mistral AI發布了Mistral 3系列開源多語言、多模態模型,這一系列模型不僅擁有從3B到675B的參數規模,還首次推出了基于稀疏架構的混合專家模型Mistral Large,展現出Mistral AI在技術創新方面的無窮潛力。
英偉達表示,該系列模型針對英偉達超級計算和邊緣平臺進行了優化。合作成果的核心是,Mistral Large 3這一大型模型在英偉達GB200 NVL72系統上實現了相比前代H200芯片10倍的性能提升。這種性能飛躍轉化為更好的用戶體驗、更低的單次響應成本以及更高的能源效率。該模型在每兆瓦(MW)能耗下可實現每秒超過500萬個token的處理速度。
據介紹,Mistral Large 3是一種專家混合(Mixture-of-Experts,MoE)模型,Mistral Large 3擁有410億個活躍參數、6750億個總參數以及256K的上下文窗口,提供了企業AI工作負載所需的可擴展性、效率和適應性。Mistral AI表示,該模型是利用3000塊英偉達H200 GPU從零開始訓練而成的,已成為全球最頂尖的開放權重模型之一。經過訓練后,Mistral Large在通用提示方面的表現已與市場上最佳的指令微調開放權重模型相媲美,同時在多語言對話和圖像理解等領域也展現了行業領先的性能。
英偉達稱,通過結合英偉達GB200 NVL72系統與Mistral AI的MoE架構,企業能夠高效部署和擴展大規模AI模型,充分利用先進的并行計算和硬件優化。這一合作標志著邁向“Mistral AI所稱的‘分布式智能’時代”的重要一步,縮小了研究突破與實際應用之間的差距。
此外,英偉達表示,為實現從云端到邊緣的高效推理,英偉達針對Mistral 3模型系列優化了推理框架,包括NVIDIA TensorRT-LLM、SGLang和vLLM。Mistral 3現已在主流開源平臺和云服務商處可用,預計不久后將作為英偉達NIM微服務進行部署。無論AI應用走向何方,這些模型均已準備就緒。





京公網安備 11011402013531號