IT之家 7 月 22 日消息,國際數學奧林匹克競賽(IMO)是全球最負盛名的數學競賽之一,每年每個國家由六名高中生代表參賽,他們需在規定時間內解答六道極具挑戰性的數學難題。在這一競賽中,僅有約 8% 的參賽者能夠獲得金牌,這使得 IMO 的金牌成為數學領域的至高榮譽。
![]()
在今年的國際數學奧林匹克競賽中,OpenAI 和谷歌都使用了它們最新的大語言模型(LLM)參賽。
上周末,OpenAI 宣布其實驗性推理語言模型在 2025 年 IMO 的題目測試中取得了金牌級別的成績。OpenAI 的模型在與學生相同的規則下進行了測試,需要在兩場時長各 4.5 小時的考試時段內完成題目解答,且不能使用任何工具或聯網,最終還需以自然語言形式書寫證明過程。
今日,谷歌也宣布其升級版的 Gemini Deep Think 成功解決了 IMO 六道題目中的五道,同樣達到了金牌水平的表現。這一升級版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改進推理模式,包括并行思維技術,使其能夠同時探索多種解決方案,而不再局限于逐一嘗試。
IT之家注意到,谷歌 DeepMind 團隊在介紹這一升級版的 Gemini Deep Think 時表示:“為了充分發揮 Deep Think 的推理能力,我們利用了新穎的強化學習技術,進一步增強了模型的多步推理、問題解決和定理證明能力。此外,我們還為 Gemini 提供了高質量數學問題解決方案的精選語料庫,并在其指令中添加了一些關于如何應對 IMO 問題的通用提示詞和技巧。”
谷歌計劃在未來不久將這一升級版的 Deep Think 模型提供給一組受信任的測試者進行試用,并將在后續向谷歌 AI Ultra 訂閱用戶開放使用權限。





京公網安備 11011402013531號