谷歌 Gemini 在國際數學奧林匹克競賽測試中獲金牌水平成績

IP屬地中國·北京 編輯：陸辰風 IT之家 時間：2025-07-22 16:23:59

IT之家 7 月 22 日消息，國際數學奧林匹克競賽（IMO）是全球最負盛名的數學競賽之一，每年每個國家由六名高中生代表參賽，他們需在規定時間內解答六道極具挑戰性的數學難題。在這一競賽中，僅有約 8% 的參賽者能夠獲得金牌，這使得 IMO 的金牌成為數學領域的至高榮譽。

在今年的國際數學奧林匹克競賽中，OpenAI 和谷歌都使用了它們最新的大語言模型（LLM）參賽。
上周末，OpenAI 宣布其實驗性推理語言模型在 2025 年 IMO 的題目測試中取得了金牌級別的成績。OpenAI 的模型在與學生相同的規則下進行了測試，需要在兩場時長各 4.5 小時的考試時段內完成題目解答，且不能使用任何工具或聯網，最終還需以自然語言形式書寫證明過程。
今日，谷歌也宣布其升級版的 Gemini Deep Think 成功解決了 IMO 六道題目中的五道，同樣達到了金牌水平的表現。這一升級版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改進推理模式，包括并行思維技術，使其能夠同時探索多種解決方案，而不再局限于逐一嘗試。
IT之家注意到，谷歌 DeepMind 團隊在介紹這一升級版的 Gemini Deep Think 時表示：“為了充分發揮 Deep Think 的推理能力，我們利用了新穎的強化學習技術，進一步增強了模型的多步推理、問題解決和定理證明能力。此外，我們還為 Gemini 提供了高質量數學問題解決方案的精選語料庫，并在其指令中添加了一些關于如何應對 IMO 問題的通用提示詞和技巧。”
谷歌計劃在未來不久將這一升級版的 Deep Think 模型提供給一組受信任的測試者進行試用，并將在后續向谷歌 AI Ultra 訂閱用戶開放使用權限。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

上半年虧超6億，又一國產GPU獨角獸沖刺港股IPO

豆包狂飆，字節AI再亮劍

港股“商用車智駕第一股”誕生，成都國資持續賦能

京東消費及產業發展研究院：“超級供應鏈”將助力中國經濟生態構建

摩爾線程發布新一代GPU架構算力密度提升50%

預測市場押注“全球市值第一”：明年谷歌將憑AI芯片正面挑戰英偉達、蘋果

全站最新

上半年虧超6億，又一國產GPU獨角獸沖刺港股IPO

豆包狂飆，字節AI再亮劍

港股“商用車智駕第一股”誕生，成都國資持續賦能

京東消費及產業發展研究院：“超級供應鏈”將助力中國經濟生態構建

熱門推薦

上半年虧超6億，又一國產GPU獨角獸沖刺港股IPO

豆包狂飆，字節AI再亮劍

港股“商用車智駕第一股”誕生，成都國資持續賦能

京東消費及產業發展研究院：“超級供應鏈”將助力中國經濟生態構建

摩爾線程發布新一代GPU架構算力密度提升50%

科學家揭示高山植物多樣性形成的秘密

預測市場押注“全球市值第一”：明年谷歌將憑AI芯片正面挑戰英偉達、蘋果

Meta首席AI官汪滔：如果你13歲，就該把所有精力都放在氛圍編程上

百度地圖上線港澳車道級導航

曝華為Mate 80系列18天內銷量破百萬標準版占76%

摩爾線程公布“華山”“廬山”芯片，產品明年亮相

三星Galaxy XR拆解實測：性能強大維修難度喜憂參半

摩爾線程發布新一代GPU架構，打造MUSA生態對標英偉達CUDA

日本32歲女子和AI伴侶辦婚禮靠AR眼鏡與AI老公戴戒指

大眾中國前CEO試駕小米SU7 Ultra后被驚到：一臺真正的駕駛機器