IT之家 11 月 27 日消息,DeepSeek 發(fā)布了 DeepSeekMath?V2,主打可自我驗(yàn)證的數(shù)學(xué)推理訓(xùn)練框架。
團(tuán)隊(duì)認(rèn)為,僅追求最終答案正確率難以保證推理鏈條的嚴(yán)謹(jǐn)性,尤其在定理證明等需要逐步推導(dǎo)的任務(wù)中更為突出。模型通過(guò)構(gòu)建基于 LLM 的驗(yàn)證器,對(duì)生成的證明進(jìn)行自動(dòng)審查,并利用擴(kuò)展的驗(yàn)證計(jì)算持續(xù)生成高難度訓(xùn)練樣本提升驗(yàn)證器能力。
據(jù)IT之家了解,DeepSeekMath?V2 基于 DeepSeek?V3.2?Exp?base,在 2025 年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO 2025)與 2024 年中國(guó)數(shù)學(xué)奧林匹克競(jìng)賽(CMO 2024)中均達(dá)到金牌水準(zhǔn),并在 2024 年普特南數(shù)學(xué)競(jìng)賽(Putnam 2024)中取得 118/120(近乎滿分)的優(yōu)異成績(jī)。官方稱,盡管尚有大量工作待推進(jìn),當(dāng)前成果已表明:可自驗(yàn)證的數(shù)學(xué)推理是一條切實(shí)可行的研究路徑,有望為構(gòu)建更強(qiáng)大、更可靠的數(shù)學(xué)智能系統(tǒng)奠定基礎(chǔ)。
![]()
![]()
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
Github:https://github.com/deepseek-ai/DeepSeek-Math-V2





京公網(wǎng)安備 11011402013531號(hào)