亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

內幕曝光:OpenAI模型坦承不會第六題,3人倆月拿下IMO金牌!

IP屬地 中國·北京 編輯:蘇婉清 新智元 時間:2025-08-09 18:18:53


新智元報道

編輯:KingHZ

OpenAI在短短兩個月內,讓AI從掙扎于小學數學題躍升至國際數學奧林匹克(IMO)金牌水平,背后是通用AI技術的突破。

OpenAI的ChatGPT真能?還是OpenAI的自嗨?背后到底有何隱情?

OpenAI的IMO金牌核心團隊Alexander Wei、Noam Brown與Sheryl Hsu做客紅杉Training Data播客,分享了如何在兩月內讓AI斬獲IMO金牌。

比如說,OpenAI內部并非所有人都持樂觀態度。某位研究員甚至打賭模型不會贏,賠率高達2:1,不過最終因為「不想影響士氣」而放棄了賭局。

比賽當天凌晨1-5點,Noam Brown忙里偷閑,小憩了一番,而Alexander Wei瘋狂檢查模型生成的證明

他們這次還解釋了是如何決定AI是不是拿到了金牌。為了評分,他們雇用了外部的IMO獎牌獲得者。每份證明都由三名獎牌獲得者進行評分,他們對正確性達成了一致意見 。就這樣,他們認為AI的確有能力拿到IMO金牌。

他們還透露證明像「外星語言」般獨特,可讀性不高。雖有有能力優化,但為了透明,他們選擇發布了原始輸出。


如果你只想快速了解精華,先看下方要點;想讀幕后故事,請繼續往下。

要點速讀

在短短兩個月內,這支OpenAI僅三人的精銳團隊就實現了整個AI領域多年未竟的目標——在國際數學奧林匹克競賽難題上達到金牌級水平。


這是通往ASI道路上最重要的里程碑之一。

這次突破之所以特別引人注目,不僅僅是因為AI的數學能力,更在于其背后的架構。這是一種通用技術,用于擴展測試時間計算,并處理那些遠遠超出競賽數學范疇的難以驗證的任務。

就在一年前,AI還只能進行短暫的數學推理,僅僅持續十分之一分鐘。而現在,已有AI系統能夠持續推理長達100分鐘。

而超級智能的期望是,隨著我們將推理時間擴展到數千甚至數十萬小時,我們或許能夠開始解決人類在數學、科學等眾多領域中那些最偉大的未解難題。

團隊還介紹了他們的獨特方法:在難以驗證的任務上,不用形式化驗證工具,而使用通用強化學習技術。

新模型展現出驚人的自省能力——主動承認無法解答第六題,同時揭示了解決競賽題與取得真正數學研究突破之間的懸殊差距。


IMO 2025第六題是本次競賽難度最大的題目,大意如下:

考慮一個2025x2025的單位正方形網格。馬蒂爾達希望在這個網格上放置一些矩形瓷磚,這些瓷磚的大小可能各不相同,但每塊瓷磚的每一邊都必須與網格線對齊,并且每個單位正方形最多被一塊瓷磚覆蓋。

確定馬蒂爾達需要放置的最小瓷磚數量,以確保網格的每一行和每一列都有且僅有一個單位正方形沒有被任何瓷磚覆蓋。

關鍵亮點如下:

(1)通用技術勝過專用方案。

(2)小團隊也能創造大成果:核心團隊僅由3名研究人員組成,在最后2個月沖刺完成工作。

(3)自我意識提升AI可靠性:面對最難的題目時,模型能承認自己無法解決,而不是輸出看似合理但錯誤的答案。

(4)測試時計算擴展助力深入推理:突破的關鍵在于將推理計算時間從幾秒延長到幾小時,使模型能更深入思考復雜問題。

(5)競賽是進步的起點,而非終點。


Sheryl Hsu(第一排中間女子)分享的OpenAI合照

兩個月的奇跡

國際數學奧林匹克(IMO)是全球高中生數學頂尖賽事,難題之難讓人類選手也要苦練多年。

即便是天才數學家陶哲軒,10歲時第一次參加IMO,獲得了銅牌。約兩年后,第二次參加IMO,他才獲得了金牌。

可OpenAI的這支小隊卻只用了兩個月!

他們的秘密武器是什么?

在紅杉資本的播客《Training Data》中,主持人Sonya Huang揭秘了真相:

他們用了一種叫做「多智能體系統」的技術。

簡單說,就是讓多個AI「助手」同時工作,像一個超級團隊分工協作。

這種方法讓他們的模型能在短時間內解決復雜問題。


AI在數學上真令人嘆為觀止!

就在幾年前,AI模型還在為解決小學數學問題而掙扎。

在2024年,GSM8K還被當作評估模型的標準。


GSM8K,即小學數學8K,是一個包含8,500個高質量、語言多樣的小學數學應用題的數據集。目前,此數據集的成績已經飽和:Claude 3 準確率已達95%

但在數學領域,這只是短暫現象。隨后,AI數學基準測試出現了美國數學邀請賽AIME,接著美國奧數USAMO。


去年的開源模型數學排行榜

現在,國際數學奧林匹克競賽金牌也被AI拿下。

AI以驚人的速度突破了所有的數學基準。

AI或覺醒自我意識

敢說自己「沒答案」

有時,AI會「胡思亂想」,編造錯誤答案,同時「理直氣壯」,自信過頭。


這屬于推理模型的「幻覺」問題。

但OpenAI的模型很特別——它能在解不出題時果斷說「我不知道」。

比如在IMO第6題上,模型選擇不冒險,而是承認自己的局限。

新模型顯著減少了「幻覺」問題。

OpenAI研究員Noam Brown認為AI開始向自我意識推理轉變:

過去,數學家們需要仔細檢查模型的解題過程,因為早期系統常常會悄無聲息地弄錯不等式或插入錯誤步驟,導致「幻覺」答案。

在缺乏有效證明時,新更新的IMO模型傾向于說「我不確定」,這大大減少了隱藏錯誤

這一點讓篤信AGI的網友Causal Coder激動地評論:「這比拿金牌還重要!」

為什么?因為這避免了「幻覺」(hallucination),讓AI更可靠。


《自然》雜志的研究也支持這一觀點:減少錯誤輸出是AI進步的關鍵。


這不僅在數學競賽中閃耀,還可能幫我們在未來科學計算中少走彎路。

數學讓人謙卑,AI任重道遠

盡管這次的進步令人興奮,但距離千禧難題還很遠。

若按IMO題需要1.5小時思考估算,千禧級別需將思考時間放大上千倍,仍任重道遠。

GSM8K是小學數學,好學生幾秒鐘搞定。現在AI從幾秒鐘進步到IMO級別——天才學生平均每題1.5小時(IMO三題4.5小時)。而研究數學需要這些奧賽天才長大后花1500小時。所以,從1.5小時到數千小時,還有千倍差距。

在千禧問題上,整個領域的專家畢生努力,還沒多少進展。數學的深度讓人謙卑:從1.5小時到數十萬小時的人類思考,還有很長的路。


目前,7大千禧難題只有龐加萊猜想得到了解決

不止是數學

通向通用智能

這次的突破是為了開發通用的推理技術,而不是局限于數學。

他們在短短一年多的時間里,將推理時間從O(0.1分鐘)擴展到了O(100分鐘)。

除了讓長推理以及在難以驗證的任務上取得進步之外,這還涉及到擴展并行計算,涉及到多智能體。

在多智能體強化學習(MARL)實驗中,兩個對立的智能體團隊展開對抗

他們通過巧妙設計「獎勵函數」,讓AI能處理難以驗證的難題,相同方法也適用于物理奧林匹克競賽,不過模型還無法進行實驗部分的操作。

在擴展思考時間、處理難以驗證的任務以及并行計算上,他們所采用的技術都是通用技術。他們計劃在其他系統中使用,或者已經在使用了。

從基礎設施的角度來說,這次基本上使用的是和其他項目相同的基礎設施。

并沒有什么專門為IMO定制。

他們稱此次方法接下來會整合進更多OpenAI模型,全面提升推理能力,從而構建更強大的模型,不斷改進Agent、ChatGPT以及其他一切。

但全球部署仍需時間。

挑戰與夢想:路還長

千年難題如黎曼猜想,人類中的天才一生都難解,AI還需更多突破。

但團隊不氣餒,他們甚至想讓AI學會自己提出新問題——這比解題更酷!

Noam Brown表示,語言模型現在正迅速地一個個克服障礙:

接下來的挑戰將是生成新問題,比如創作IMO級別的數學難題「需要專業的數學家...但我看不到任何根本性的障礙。」

紅杉的Sonya笑稱:「從0.1分鐘到100分鐘的推理擴展,已經是巨大進步,未來可期!」

這對我們意味著什么?

這個故事不僅炫酷,還很實用。想象一下,未來AI能幫你解決家庭預算、設計新游戲,甚至提出科學新想法! 對于普通人,這意味著更智能的生活助手正在路上。對AI開發者來說,這是個啟發:合作和創意能帶來意想不到的成果。

參考資料:

https://www.youtube.com/watch?v=EEIPtofVe2Q

https://x.com/Hangsiin/status/1950505990660731084

https://x.com/slow_developer/status/1950504142990139571

https://x.com/chatgpt21/status/1950606890758476264

https://www.sequoiacap.com/podcast/training-data-openai-imo/

https://x.com/sonyatweetybird/status/1950607065380163742

https://github.com/aw31/openai-imo-2025-proofs/

https://klu.ai/glossary/math-eval


免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

精品久久久久久中文字幕人妻最新| 日本美女视频一区二区| 亚洲精品99久久久久| 色婷婷一区二区三区av免费看| 不卡av免费在线观看| 欧美日韩一区在线播放| 国产又爽又黄又嫩又猛又粗| 少妇高潮久久久久久潘金莲| 国产午夜手机精彩视频| 欧美天堂一区二区三区| 色姑娘综合天天| 亚洲高清三级视频| 亚洲这里只有精品| 综合久久给合久久狠狠狠97色 | 一区二区三区 在线观看视频| 久久天天狠狠| 久久久噜噜噜久久中文字幕色伊伊| 国产成人一区二区| 国产精品爽爽久久久久久| 精品国产免费视频| 中文字幕影音先锋| 精品久久久久香蕉网| 成人一区二区三区仙踪林| 欧美日韩的一区二区| 亚洲少妇一区二区三区| 91精品国产综合久久久久久漫画 | 成人动漫中文字幕| 无码中文字幕色专区| 中文字幕高清一区| 国产乱女淫av麻豆国产| 日韩欧美一区二区免费| 免费毛片在线播放免费| 久久精彩免费视频| 亚洲 欧美 视频| 国产精品久久久久久久久久久不卡 | 日本一区二区三区免费视频| 久久免费视频在线观看| 日韩高清在线电影| 日本一区免费在线观看| caoporen国产精品视频| 9久久婷婷国产综合精品性色| 欧美男人的天堂一二区| 人妻少妇精品一区二区三区| 日本不卡高字幕在线2019| 亚洲国产成人在线观看| 香蕉久久免费影视| 久久精品在线免费观看| 久久久久久久久久毛片| 精品不卡在线视频| 国产 日韩 欧美 在线| 青草成人免费视频| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 国产在线青青草| 日韩免费成人网| 国产美女www爽爽爽视频| 久久国产精品久久| 福利一区福利二区微拍刺激| gogo亚洲国模私拍人体| 亚洲国产精品人人爽夜夜爽| 国产免费观看av| 成人欧美一区二区三区视频xxx| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 日本不卡的三区四区五区| 亚洲精品少妇一区二区| 制服丝袜亚洲精品中文字幕| 波多野结衣毛片| 波多野结衣一区二区三区在线观看| 国产精品卡一卡二| 深夜福利影院在线观看| 黄色91av| 欧美午夜影院在线视频| 台湾佬中文在线| 精品国产福利| 亚洲3atv精品一区二区三区| 国产美女网站视频| 久久爱av电影| 亚洲午夜电影在线| 久久久久久久久久99| 国产精品亚洲自拍| 波多野结衣中文字幕一区 | 欧美一级大片在线观看| 一区二区三区在线看| 草视频在线观看| 亚洲精品一区二区三区樱花| 欧美一区二区三区性视频| 激情五月激情综合| 2014亚洲精品| 婷婷综合久久一区二区三区| 欧美日韩 一区二区三区| 在线观看日韩羞羞视频| 日韩一区二区三区免费看 | 九九视频直播综合网| 国产91在线看| 美女100%无挡| 一本久道久久综合狠狠爱亚洲精品| 精品国产区一区| 91麻豆精品视频| 日韩在线观看视频一区二区| 欧美一级二级三级九九九| 3751色影院一区二区三区| 亚洲av无码一区二区乱子伦 | 浮妇高潮喷白浆视频| 久久久之久亚州精品露出| 狠狠色香婷婷久久亚洲精品| 特黄aaaaaaaaa真人毛片| 亚洲一级Av无码毛片久久精品| 91在线观看免费| 日韩国产高清污视频在线观看| 久久久久久久精| www.成人在线观看| 日本一区二区在线免费观看| 久久综合九色综合网站| 自拍偷拍免费精品| 亚洲韩国精品一区| 奇米888四色在线精品| 欧洲猛交xxxx乱大交3| 免费国产a级片| 成人在线播放av| 亚洲精品成人久久| 成人激情综合网站| 曰批又黄又爽免费视频| 韩日视频在线观看| 91国产美女在线观看| 4hu四虎永久在线影院成人| 91麻豆精东视频| www.国产com| 免费看黄色aaaaaa 片| 鲁一鲁一鲁一鲁一色| 99久久免费国| 欧美裸身视频免费观看| 欧美日韩国产在线播放网站| 久88久久88久久久| 日本在线视频中文字幕| 日本精品一二三区| www.亚洲天堂网| 亚洲综合社区网| 日韩精品免费在线播放| 亚洲色图.com| 91亚洲男人天堂| 久久99国产精品久久| 亚洲自拍一区在线观看| 欧美人与禽zoz0善交| 玖玖精品在线视频| 国模精品系列视频| 色偷偷888欧美精品久久久| 日韩一级免费一区| 欧美性生活大片免费观看网址| 欧美极品xxx| 国产高清一区日本| 中文字幕在线观看视频一区| 中国av免费看| 亚洲成a人无码| 日韩电影免费观看高清完整| 色综合久综合久久综合久鬼88| 亚洲人成电影网站色…| 日本久久一区二区| 久久久精品日韩欧美| av不卡在线观看| 视频精品一区二区| 日韩永久免费视频| 91成品人影院| 精品久久久无码中文字幕| 色播视频在线播放| 久久久久久天堂| 麻豆亚洲av熟女国产一区二 | 国产欧美日韩久久| 国产日韩欧美高清| 国产精品久久夜| 国产欧美日韩在线视频| 中文字幕亚洲在| 中文字幕av在线一区二区三区| 日韩成人免费看| 国产91精品一区二区麻豆亚洲| 成人丝袜视频网| 国产精品二三区| 婷婷夜色潮精品综合在线| 日韩欧美精品在线观看| 色综合久久久久| 日韩精品在线看片z| 中文字幕av一区中文字幕天堂| 美女黄色丝袜一区| 久久免费视频在线| 久久99精品久久久久久青青91 | 日韩欧美激情一区二区| 7777在线视频| 亚洲这里只有精品| 日本黄色网址大全| 日韩在线一卡二卡| 中文字幕乱码人妻无码久久 | 欧美日韩视频在线第一区| 欧美午夜精品免费| 亚洲午夜精品视频| 久久久女女女女999久久| 99中文字幕| 自慰无码一区二区三区| 亚洲精品国产一区黑色丝袜| 黑人と日本人の交わりビデオ| 69视频免费看| 蜜桃91麻豆精品一二三区| 国产一区二区三区黄片| 国产丶欧美丶日本不卡视频| 亚洲va欧美va天堂v国产综合| 精品国产乱码久久久久久天美| 91福利在线免费观看| 久久精品国产免费观看| 色午夜这里只有精品| 国产精品日韩欧美综合| 国产精品美女xx| 国产91色在线观看| 中文字字幕在线中文| 国产综合成人久久大片91| 久久久精品免费免费| 91精品国产一区二区人妖| 57pao国产成人免费| www.国产在线视频| 国产一区第一页| 国产又粗又猛又爽又黄91| 激情综合色综合久久综合| 色综合天天综合网天天看片| 国内精品小视频在线观看| 久久久久久久9| 国产一卡二卡在线| 日本成人中文字幕| 在线观看日韩国产| 国产精品白嫩初高中害羞小美女| 午夜免费电影一区在线观看| 在线观看国产中文字幕| 中文字幕 欧美激情| 国产亚洲精品免费| 日韩视频一区二区三区| 国产精品一区二区三区在线 | 国产精品久久久久久久久久久久久久久久久久 | 欧美精品福利在线| av黄色在线网站| 亚洲精品国产精品乱码视色| 欧美电影精品一区二区| 日韩视频一二三| 久久久久久久久久久97| 成人性生交大片免费看视频在线| 欧美一二三区精品| 国产精品美乳一区二区免费 | 成人污网站在线观看| 国产精品成人无码专区| 日韩主播视频在线| 欧美一区二区三区免费在线看| 97人洗澡人人免费公开视频碰碰碰| 久久精品日产第一区二区三区乱码| 亚洲成人手机在线观看| 亚洲久草在线视频| 青青草国产精品视频| 日批免费在线观看| 亚洲成人免费在线视频| 亚洲午夜久久久久久久久| 国产成人精品亚洲日本在线桃色| 亚洲午夜在线观看| 99精品久久久久久| 精品欧美一区二区在线观看视频| 视频一区欧美精品| 色妞色视频一区二区三区四区| aa免费在线观看| a级高清视频欧美日韩| 国产91精品久久久久久| 中文字幕黄色片| 亚洲一区二区三区影院| 成人淫片在线看| 中文字幕免费高清网站| 热99久久精品| 激情综合色综合久久综合| 国产精品一区二区女厕厕| www.av欧美| 欧美人动与zoxxxx乱| 涩视频在线观看| 国产日韩三级在线| 91福利视频网| 亚洲日本香蕉视频| 国产精品成久久久久三级| 五月激情丁香网| 国产一区二区在线网站| 成年人国产精品| 欧洲日韩成人av| 色一情一乱一乱一区91av| 99re国产视频| 国产一区二区三区免费| 欧洲精品在线播放| 亚洲欧美成人网| 亚洲精品在线免费| 五月婷婷丁香在线| 欧美亚洲国产一区二区三区va| 爱情岛论坛亚洲入口| 久久久精品91| 亚洲精品国产成人| 国产一卡二卡三卡四卡| 午夜久久电影网| 久久精品中文字幕一区二区三区| 国产情侣自拍av| 91精品国产欧美一区二区18| www.亚洲一区二区| 日韩电影在线看| 美女国内精品自产拍在线播放| 欧美黄色一区二区三区| 精品亚洲夜色av98在线观看| 少妇毛片一区二区三区| 69久久99精品久久久久婷婷| 国产成人精品综合久久久久99| 中文字幕第一页久久| 久激情内射婷内射蜜桃| 国产日韩av一区| 天天夜碰日日摸日日澡性色av| 国产色爱av资源综合区| 日韩a级黄色片| 亚洲天堂免费在线观看视频| 免费看污污视频| 久久久三级国产网站| 久久偷窥视频| 免费在线观看视频一区| 国产精品三级在线| 日本91福利区| 欧美人xxxxx| 国产精品亚洲一区二区三区在线| 成人在线激情视频| 韩国v欧美v日本v亚洲v| 国产一区二区三区四区hd| 波多野结衣在线aⅴ中文字幕不卡| 91久久偷偷做嫩草影院| 国产精品综合视频| 国产在线xxxx| 亚洲三级在线观看| 国产污在线观看| 日韩欧美一级片| 久久精品视频6| 人人爽久久涩噜噜噜网站| av在线亚洲天堂| 欧美理论一区二区| 99热这里都是精品| 午夜免费精品视频| 色婷婷av一区二区三区大白胸| 性色国产成人久久久精品| 中文字幕亚洲欧美| 日韩 国产 欧美| av色综合网| 亚洲最大色网站| 国产传媒免费在线观看| 热久久这里只有精品| 国产不卡视频一区| 久草在在线视频| 欧美精品自拍偷拍动漫精品| 国产一级大片在线观看| 77777少妇光屁股久久一区| 美女精品自拍一二三四| av黄色在线网站| 日韩三级视频中文字幕| 国产午夜精品无码| 国产精华一区| 亚洲男人天堂av网| 亚洲第一视频区| 2020欧美日韩在线视频| 暴力调教一区二区三区| 污污网站免费观看| 俺也去精品视频在线观看| 美日韩一级片在线观看| 97中文字幕在线| 亚洲欧美日韩成人| 久久久蜜桃一区二区人| 精品国产一区三区| 亚洲香蕉在线观看| 国产成人一区在线| 亚洲专区区免费| 国产欧美一区二区三区视频 | 欧美啪啪小视频| 亚洲最新在线| 亚洲欧美www| 国产精品一级片| 中文字幕在线观看日| 不用播放器成人网| av中文字幕亚洲| 农村妇女精品一区二区| 欧美日韩电影一区二区| 日韩一区二区三区免费观看| 日韩黄色在线观看| 久久久无码人妻精品无码| 韩国国内大量揄拍精品视频| 粉嫩av亚洲一区二区图片| 国产第一页精品| a级国产乱理论片在线观看99| 欧美日韩国产免费一区二区| 91精品国产综合久| 亚洲一区二区偷拍| 人人爽久久涩噜噜噜网站| 午夜精品成人在线视频| 精品国产无码一区二区三区| 不卡的在线视频| 国产成人免费观看| 欧美日韩成人综合在线一区二区| 亚洲天堂网在线观看视频| 麻豆传媒网站在线观看| 久久久亚洲国产天美传媒修理工| 亚洲精品国产一区二区精华液| 国产色片在线观看| 最近中文字幕无免费| 国产另类自拍| 欧美成人一区二区三区| 男人的天堂亚洲一区| 国产精品久久久久无码av色戒| 天堂社区 天堂综合网 天堂资源最新版 | 国产精品资源在线| 在线观看免费黄色网址| 色噜噜狠狠色综合网| 亚洲欧美中文字幕| 亚洲成av人片在线观看无码| 久久99精品久久只有精品|