在剛剛落幕的2025年全國中學生數學奧林匹克競賽(CMO)決賽中,除了涌現出一批數學天賦出眾的年輕選手,還有一個特殊的“考生”引人注目——AI大模型。
CMO是中國最高規格的數學奧林匹克競賽,今年,主辦方首次設立AI測試環節,邀請大模型與人類同場答題,并交由相同的評委專家組閱卷打分。上海人工智能實驗室旗下的書生科學多模態大模型(Intern-S1-20251122)拿到102分。
據公開信息,今年CMO考生前三名得分分別為126(滿分)、110分、102分,Intern-S1取得的成績位列總分榜第三,在AI中排名第一。
![]()
本屆CMO共有700余名選手參賽,223人獲得金牌,前60名選手獲得清華北大保送資格并入選國家集訓隊。AI目前雖未超越人類選手最高分,但其表現已遠超大多數參賽者,甚至超過了許多金牌得主,本次金牌線為78分。
“AI在奧賽中超越人類是未來一定會發生的事。”上海人工智能實驗室青年領軍科學家陳愷對第一財經表示。他認為,正如AlphaGo最終戰勝世界圍棋冠軍,AI在數學競賽上的進步也是一個逐步發展的過程。現在AI已經能拿奧賽金牌了,未來超過奧賽頂尖的人類選手也大有可能。
“數學是推理能力的代表性領域,也是目前很多大模型團隊重點投入優化的方向之一,因此進展相對更快。”不過,陳愷強調,奧賽只是數學里的一個任務,因此AI在奧賽中超過人類,并不意味著AI在數學或更廣泛的能力上就能超過人。
“數學是個很寬泛深奧的領域,也有很多前沿的研究,在這方面AI還要更長的時間積累。”陳愷補充道。
中國人民大學附屬中學教師、奧數金牌教練張端陽也是AI訓練的“顧問”,在接觸之初他對大模型的印象還停留在只能解答數學高考題的水平,大模型在CMO的表現,也讓他驚訝于AI發展的速度之快,“就像 10 年前的圍棋一樣,突破可能就是一剎那。”
上海人工智能實驗室發布的文章提到,此次Intern-S1 推理能力的提升得益于“通專融合”技術架構 SAGE(中文含義為智者),創新點在于以數學引理為核心的多輪分層推理機制,以及基于結果的過程校驗模型,顯著提升了模型在超長程思考和證明時的嚴謹,還有通用模型結合專業符號引擎,讓通用模型掌握像人類科學家一樣逐步推導、探索和修正的思路。
AI在數學和推理領域的突破意味著什么?陳愷認為,這對教育和科研領域的落地都會很有幫助,此外,數學能力也是復雜推理等各種能力的基礎,因此這一能力的提升和演進能進一步幫助大模型提升智力水平。
讓大模型輔助教育學習是已經在落地的方向之一,AI可以給出解答和思考過程。而AI在奧數能夠拿金牌、達到人類第三的水平,就意味著在高中數學或者K12教育領域,AI的輔導能力更強了。此外,在科研方面,陳愷提到,有一些數學家已經在用大模型在其科研過程中幫助做一些定理證明、開闊思路。
對于這次Intern-S1的答卷,有閱卷專家認為,AI對第四題的解答是“一個新的解法,巧妙的調整法,在學生的解法中沒有見過”。這意味著AI能突破人類解題思路局限,通過自主探索和分析找到新的解題方法,這對賦能科學發現有很大的意義。
上海人工智能實驗室在官方發文中表示,計劃將 Intern-S1 的長程推理能力拓展應用于物理、化學、生命科學等基礎科研領域,通過與專業工具的打通與融合,實現從“長時間獨立思考”向“長時間獨立科研”轉變,進而加速各領域科研范式的變革,為科學突破提供支撐。





京公網安備 11011402013531號