11月27日,DeepSeek開源了“奧數金牌級”模型DeepSeekMath-V2,該模型在數學定理證明能力上表現出色。DeepSeekMath-V2在2025年國際數學奧林匹克競賽(IMO2025)和2024年中國數學奧林匹克競賽(CMO2024)上取得金牌水平成績,并在2024年普特南大學生數學競賽(Putnam2024)上獲得接近滿分118分的成績,超過人類最高90分成績。該模型以10%優勢擊敗谷歌的IMO金獎得主DeepThink模型。
DeepSeekMath-V2基于DeepSeek-V3.2-Exp-base開發,通過強化學習訓練模型生成證明分析,使用格式獎勵和分數獎勵兩個獎勵組件。在實驗中,DeepSeekMath-V2在CNML級別所有問題類別中均優于GPT-5-Thinking-High和Gemini2.5-Pro。在高計算量探索中,該模型解決了2025IMO的5道題和2024CMO的4道題,達到金牌水平。盡管最困難的IMO級別問題仍具挑戰性,但DeepSeek的生成器能在證明過程中識別問題,表明其驗證器能夠評估復雜推理任務的證明。





京公網安備 11011402013531號