102分！AI首戰中學奧賽拿下金牌，離超越人類已經不遠？

IP屬地中國·北京 第一財經資訊 時間：2025-12-12 22:09:06

在剛剛落幕的2025年全國中學生數學奧林匹克競賽（CMO）決賽中，除了涌現出一批數學天賦出眾的年輕選手，還有一個特殊的“考生”引人注目——AI大模型。
CMO是中國最高規格的數學奧林匹克競賽，今年，主辦方首次設立AI測試環節，邀請大模型與人類同場答題，并交由相同的評委專家組閱卷打分。上海人工智能實驗室旗下的書生科學多模態大模型（Intern-S1-20251122）拿到102分。
據公開信息，今年CMO考生前三名得分分別為126（滿分）、110分、102分，Intern-S1取得的成績位列總分榜第三，在AI中排名第一。

本屆CMO共有700余名選手參賽，223人獲得金牌，前60名選手獲得清華北大保送資格并入選國家集訓隊。AI目前雖未超越人類選手最高分，但其表現已遠超大多數參賽者，甚至超過了許多金牌得主，本次金牌線為78分。
“AI在奧賽中超越人類是未來一定會發生的事。”上海人工智能實驗室青年領軍科學家陳愷對第一財經表示。他認為，正如AlphaGo最終戰勝世界圍棋冠軍，AI在數學競賽上的進步也是一個逐步發展的過程。現在AI已經能拿奧賽金牌了，未來超過奧賽頂尖的人類選手也大有可能。
“數學是推理能力的代表性領域，也是目前很多大模型團隊重點投入優化的方向之一，因此進展相對更快。”不過，陳愷強調，奧賽只是數學里的一個任務，因此AI在奧賽中超過人類，并不意味著AI在數學或更廣泛的能力上就能超過人。
“數學是個很寬泛深奧的領域，也有很多前沿的研究，在這方面AI還要更長的時間積累。”陳愷補充道。
中國人民大學附屬中學教師、奧數金牌教練張端陽也是AI訓練的“顧問”，在接觸之初他對大模型的印象還停留在只能解答數學高考題的水平，大模型在CMO的表現，也讓他驚訝于AI發展的速度之快，“就像 10 年前的圍棋一樣，突破可能就是一剎那。”
上海人工智能實驗室發布的文章提到，此次Intern-S1 推理能力的提升得益于“通專融合”技術架構 SAGE（中文含義為智者），創新點在于以數學引理為核心的多輪分層推理機制，以及基于結果的過程校驗模型，顯著提升了模型在超長程思考和證明時的嚴謹，還有通用模型結合專業符號引擎，讓通用模型掌握像人類科學家一樣逐步推導、探索和修正的思路。
AI在數學和推理領域的突破意味著什么？陳愷認為，這對教育和科研領域的落地都會很有幫助，此外，數學能力也是復雜推理等各種能力的基礎，因此這一能力的提升和演進能進一步幫助大模型提升智力水平。
讓大模型輔助教育學習是已經在落地的方向之一，AI可以給出解答和思考過程。而AI在奧數能夠拿金牌、達到人類第三的水平，就意味著在高中數學或者K12教育領域，AI的輔導能力更強了。此外，在科研方面，陳愷提到，有一些數學家已經在用大模型在其科研過程中幫助做一些定理證明、開闊思路。
對于這次Intern-S1的答卷，有閱卷專家認為，AI對第四題的解答是“一個新的解法，巧妙的調整法，在學生的解法中沒有見過”。這意味著AI能突破人類解題思路局限，通過自主探索和分析找到新的解題方法，這對賦能科學發現有很大的意義。
上海人工智能實驗室在官方發文中表示，計劃將 Intern-S1 的長程推理能力拓展應用于物理、化學、生命科學等基礎科研領域，通過與專業工具的打通與融合，實現從“長時間獨立思考”向“長時間獨立科研”轉變，進而加速各領域科研范式的變革，為科學突破提供支撐。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

從垂直整合到開放共享，比亞迪書寫中國汽車升級轉型范本

AMD銳龍9 9955HX對比英特爾酷睿Ultra 9 275HX，五款游戲輪番測

云宇星空大模型正式發布，上海市規劃資源局與商湯大裝置聯合打造

30年果粉兌換禮品卡后被封號：用了25年的Apple ID被永久停用

緊急“剎車”：寶馬5系旅行車中期改款被曝回歸傳統雙腎格柵

從深圳出發，向全球進發：元化智能一年12證書寫手術機器人“中國速度”

全站最新

從垂直整合到開放共享，比亞迪書寫中國汽車升級轉型范本

AMD銳龍9 9955HX對比英特爾酷睿Ultra 9 275HX，五款游戲輪番測

云宇星空大模型正式發布，上海市規劃資源局與商湯大裝置聯合打造

30年果粉兌換禮品卡后被封號：用了25年的Apple ID被永久停用

熱門推薦

喜茶“瘦身”：不拼門店數，改拼什么？

不做線上，不做廣告，這家超市如何成為美國“坪效之王”？

波司登代工大學羽絨服，找回漲價的體面

安克創新的AB面：創始人分紅過億，存貨卻壓垮現金流

雷軍、何小鵬、張一鳴和賈躍亭都來跨界AI機器人，宇樹科技能否守得住護城河？

微軟聯手 Kimi 打造 Office 自動化 Agent，AI 云巨頭開啟本土化“自我修正”

YouTube 封禁兩家發布虛假電影預告的 AI 頻道

亞馬遜組建全新AI組織，AWS元老Peter DeSantis掛帥，全面整合大模型、芯片與量子計算

LeCun再創業！新公司估值247億，CEO卻不是他！

被無數人看衰的Manus，8個月狂飆1億美元ARR！創全球最快紀錄，AI代理時代徹底引爆

國內首個國標 VLA 大模型開源!北京人形 XR-1讓機器人真正“會干活”

從垂直整合到開放共享，比亞迪書寫中國汽車升級轉型范本

AMD銳龍9 9955HX對比英特爾酷睿Ultra 9 275HX，五款游戲輪番測

華曙高科：中科院等離子所引入大尺寸銅合金打印設備為國家聚變能源裝備研發提供技術支撐

云宇星空大模型正式發布，上海市規劃資源局與商湯大裝置聯合打造