![]()
智東西
作者 李水青
編輯 心緣
智東西10月27日報(bào)道,剛剛,MiniMax發(fā)布并開源MiniMax-M2,一款為Max可視化編程和智能體工作流構(gòu)建的輕量級模型。
![]()
▲MiniMax-M2在Hugging Face的開源界面截圖
MiniMax-M2聚焦智能體的效率提升,是一款總參數(shù)達(dá)2300億個(gè)的MoE(混合專家)模型,其中活躍參數(shù)達(dá)100億個(gè),兼顧編程和智能體任務(wù)以及通用智能。
在權(quán)威基準(zhǔn)測評中,MiniMax-M2的測試成績趕超Gemini 2.5 Pro、DeepSeek-V3.2等領(lǐng)先模型,接近GPT-5(thinking)模型性能,據(jù)稱可提供匹敵這些模型的端到端工具使用性能,同時(shí)部署和擴(kuò)展更便捷。
![]()
▲MiniMax-M2的基準(zhǔn)測試概況
具體來看,MiniMax-M2有以下幾大亮點(diǎn):
1、智能提升。根據(jù)知名分析機(jī)構(gòu)Artificial Analysis的基準(zhǔn)測試,MiniMax-M2在數(shù)學(xué)、科學(xué)、指令遵循、編程和智能體工具使用方面展現(xiàn)出具競爭力的通用智能。其綜合得分在全球開源模型中排名第一。
2、高級編程。MiniMax-M2專為端到端開發(fā)人員工作流程而設(shè)計(jì),擅長多文件編輯、編碼-運(yùn)行-修復(fù)循環(huán)以及測試驗(yàn)證修復(fù)。在Terminal-Bench和(Multi-)SWE-Bench風(fēng)格的任務(wù)中展現(xiàn)了其在跨語言終端、IDE和CI中的實(shí)用有效性。
3、智能體性能。MiniMax-M2能夠規(guī)劃并執(zhí)行跨Shell、瀏覽器、檢索和代碼運(yùn)行器的復(fù)雜、長周期工具鏈。在類似BrowseComp的評估中,它能夠持續(xù)定位難以發(fā)現(xiàn)的漏洞來源,保持證據(jù)的可追溯性,并優(yōu)雅地從不穩(wěn)定的步驟中恢復(fù)。
4、高效設(shè)計(jì)。MiniMax-M2擁有100億個(gè)激活參數(shù),可為交互式智能體和批量采樣提供更低的延遲、更低的成本和更高的吞吐量,這與向高度可部署的模型轉(zhuǎn)變契合,這些模型在編程和智能體任務(wù)中仍然表現(xiàn)出色。
以下更全面的評估測試了端到端編程和智能體工具的使用情況,涉及編輯真實(shí)的代碼庫、執(zhí)行命令、瀏覽網(wǎng)頁以及交付實(shí)用的解決方案等方面。MiniMax-M2在Multi-SWE-Bench、Terminal-Bench、ArtifactsBench、BrowseComp等多項(xiàng)測試中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等頂尖模型。
![]()
▲MiniMax-M2的基準(zhǔn)測試具體情況
Artificial Analysis統(tǒng)計(jì)的基準(zhǔn)測試如下,MiniMax-M2在LiveCodeBench(LCB)、IFBench、AA Intelligence等多項(xiàng)測試中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等頂尖模型。
![]()
▲Artificial Analysis基準(zhǔn)測試具體情況
目前,用戶可以在MiniMax Agent上體驗(yàn)MiniMax-M2,在限定時(shí)間內(nèi)免費(fèi)用。
![]()
▲MiniMax Agent限免使用
體驗(yàn)地址:
https://agent.minimax.io/
智東西第一時(shí)間對MiniMax-M2進(jìn)行了體驗(yàn),當(dāng)輸入提示詞:“模擬一個(gè)旋轉(zhuǎn)六邊形內(nèi)彈跳球。”MiniMax-M2能夠成功實(shí)現(xiàn)這一物理模擬,且提供了比較直觀的小球軌跡效果及參數(shù)控制面板設(shè)計(jì)。這期間等待數(shù)分鐘,主要是其調(diào)用智能體對基本控制功能、面板參數(shù)調(diào)試、高級功能、網(wǎng)站顯示等進(jìn)行了數(shù)次的測試調(diào)試。

▲MiniMax Agent生成的小球?qū)嶒?yàn)?zāi)M
體驗(yàn)鏈接:
https://en6x2um63xa4.space.minimaxi.com/
當(dāng)我把題目難度提高,輸入提示詞:“模擬一個(gè)旋轉(zhuǎn)六邊形內(nèi)彈跳球,有兩個(gè)球體積相同,球a的質(zhì)量是球b的2倍。”只見MiniMax-M2模擬的小球沖出了六邊形,與預(yù)期有一些出入,不過整個(gè)網(wǎng)站可調(diào)參數(shù)和呈現(xiàn)內(nèi)容變得更加豐富。或許這一題目對一個(gè)輕量級模型來說還是有難度。

▲MiniMax Agent生成的小球?qū)嶒?yàn)?zāi)M
體驗(yàn)鏈接:
https://bwr3exu4k4ph.space.minimaxi.com/
另外,MiniMax-M2 API已在MiniMax開放平臺上線,同樣限時(shí)免費(fèi)。MiniMax-M2模型權(quán)重現(xiàn)已開源,允許本地部署和使用。
API地址:
https://platform.minimax.io/docs/guides/text-generation
模型權(quán)重開源地址:
https://huggingface.co/MiniMaxAI/MiniMax-M2
![]()





京公網(wǎng)安備 11011402013531號