亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

OpenAI IMO金牌團(tuán)隊爆料:AI拒絕作答第六題

IP屬地 中國·北京 編輯:顧青青 機(jī)器之心Pro 時間:2025-08-04 16:20:46

機(jī)器之心報道

編輯:張倩

讓 OpenAI 拿到 IMO 金牌的模型,背后居然只有三個核心開發(fā)者?這是 OpenAI IMO 團(tuán)隊最近接受媒體采訪披露的信息。

這三個人分別是:項目負(fù)責(zé)人 Alexander Wei、研究工程師 Sheryl Hsu 和高級研究科學(xué)家 Noam Brown。其中,Sheryl Hsu 直到今年 3 月才入職。



他們還透露,這個項目是用兩三個月的時間突擊趕出來的,結(jié)果令所有人都很意外。

大型語言模型在 IMO 中拿到金牌被視為一個重要的里程碑,不僅意味著模型數(shù)學(xué)能力的增強(qiáng),還體現(xiàn)了其在處理難以驗(yàn)證任務(wù)的通用技術(shù)上的進(jìn)步。

那么,這個模型背后有哪些值得關(guān)注的點(diǎn)?該團(tuán)隊下一步有什么計劃?我們一起來看一下采訪內(nèi)容。

視頻鏈接:https://www.youtube.com/watch?v=EEIPtofVe2Q

1、項目是什么時候啟動的?

贏得 IMO 金牌一直是 AI 領(lǐng)域,尤其是 OpenAI 內(nèi)部,一個長期追求的目標(biāo),相關(guān)的討論最早可以追溯到 2021 年。

盡管相關(guān)的強(qiáng)化學(xué)習(xí)算法和底層思路已經(jīng)醞釀了大約六個月,但真正為了這次突破而進(jìn)行的集中攻關(guān),實(shí)際上只在 IMO 競賽前的兩三個月才開始。

2、項目團(tuán)隊有多大?

核心團(tuán)隊僅由 Alex、Cheryl 和 Noam 三人組成, 其中 Alex 負(fù)責(zé)主要的技術(shù)開發(fā)。Alex 最初提出這項新技術(shù)時也曾面臨質(zhì)疑,但隨著他展示出強(qiáng)有力的證據(jù),尤其是在處理那些「難以驗(yàn)證的任務(wù)」上取得了顯著的進(jìn)步后,他的方案逐漸贏得了團(tuán)隊和公司的支持。

3、模型的證明風(fēng)格是怎樣的?

團(tuán)隊坦誠地描述,AI 模型生成的數(shù)學(xué)證明在風(fēng)格上非常獨(dú)特,甚至可以說是「atrocious」(糟糕的)或「creative」(有創(chuàng)意的)。這些證明充滿了機(jī)器的邏輯,對于人類來說很難讀懂。但為了透明起見,OpenAI 并沒有為人類的可讀性進(jìn)行優(yōu)化,而是將這些由 AI 生成的、最原始的證明直接發(fā)布在了 GitHub 上,供全世界查閱。

4、模型在「第六題」上失分,說明了什么?

IMO 的第三題或第六題是傳統(tǒng)上最困難的題。模型在面對第六題時,最終選擇「不作答」。但團(tuán)隊并未將此視為失敗,反而認(rèn)為這是一個非常積極的信號。這說明它清楚地知道自己能力的邊界,在無法解決問題時選擇了放棄,而不是像過去的 AI 模型那樣,會「一本正經(jīng)地胡說八道」(hallucinating),編造一個錯誤的答案。如果模型選擇編造,人類要非常仔細(xì)地檢查才能發(fā)現(xiàn)。

Alex 分析說,像第六題這樣的組合數(shù)學(xué)問題對 AI 來說尤其困難,因?yàn)樗鼈兏橄蟆⒕S度更高,需要「信念的飛躍或洞察力的閃現(xiàn)」,而這正是當(dāng)前 AI 的弱項。AI 更擅長通過大量、微小的、連續(xù)的步驟來解決問題。

5、我們離解決「千禧年大獎難題」還有多遠(yuǎn)?

當(dāng)被問及 AI 是否能在明年解決「千禧年大獎難題」時,Alex 明確表示,這些難題仍然「非常遙遠(yuǎn)」。他通過一個量化的對比來闡述這個差距:AI 解決問題的能力從處理只需幾秒鐘的小學(xué)數(shù)學(xué)題(GSM8K),躍升到了能解決頂尖人類學(xué)生平均需要一個半小時的 IMO 難題 。然而,真正的研究級數(shù)學(xué)可能需要這些天才成長為研究員后,花費(fèi) 1500 個小時才能取得突破 。而千禧年大獎難題的難度則更高,它們耗費(fèi)了整個領(lǐng)域?qū)W者們一生的思考時間,但進(jìn)展甚微 。因此,團(tuán)隊一方面為已取得的進(jìn)展感到非常興奮,另一方面也對未來的挑戰(zhàn)感到「謙卑」,因?yàn)閺慕鉀Q一個半小時的問題到攻克需要數(shù)萬甚至數(shù)十萬小時人類思考時間的難題,還有極其漫長的路要走 。

注:千禧年大獎難題是七條由美國的克雷數(shù)學(xué)研究所于 2000 年公布的數(shù)學(xué)難題,解題總獎金 700 萬美元。這些難題旨在呼應(yīng) 1900 年德國數(shù)學(xué)家大衛(wèi)?希爾伯特在巴黎提出的 23 個歷史性數(shù)學(xué)難題。而千禧年大獎難題的破解,極有可能為密碼學(xué)、航天、通訊等領(lǐng)域帶來突破性進(jìn)展。迄今為止,在七條問題中,龐加萊猜想是唯一已解決的,而其它六道難題(包括黎曼猜想、P vs NP 問題、納維 - 斯托克斯方程、楊 - 米爾斯理論、霍奇猜想和 BSD 猜想)仍有待研究者探索。

6、讓模型思考更長時間存在哪些挑戰(zhàn)?

Noam 指出,當(dāng)模型「思考」的時間變得非常長時(比如 1500 小時),評估(evaluation)本身就成了一個巨大的瓶頸。運(yùn)行一個需要模型思考一個月的測試,就需要花費(fèi)一個月的時間才能看到結(jié)果。這會極大地拖慢研究迭代的速度。目前,思考 1.5 小時還是可控的,但未來這將是必須解決的難題 。

7、multi-agents 系統(tǒng)在這個項目中扮演了什么角色?

據(jù) Noam Brown 介紹,除了讓模型能長時間思考并處理難以驗(yàn)證的任務(wù)外,項目還涉及「擴(kuò)展并行計算」(scaling up parallel compute),而這其中就包含了多智能體的部分,不過他表示無法透露過多具體的技術(shù)細(xì)節(jié),但這確實(shí)是他們用來擴(kuò)展模型在測試時計算能力的一種方式。

緊接著,Noam 強(qiáng)調(diào),在應(yīng)用這些技術(shù)時,團(tuán)隊非常優(yōu)先考慮「通用性」(generality)。他將此與過去的項目做對比,例如他曾研究過的撲克 AI 以及和 Alex 共同參與過的《外交》游戲 AI(Cicero 項目)。雖然那些項目成果斐然,但它們都屬于耗費(fèi)數(shù)年時間開發(fā)的、只能完成單一任務(wù)的「定制系統(tǒng)」 。在人工智能飛速發(fā)展的今天,花費(fèi)大量時間構(gòu)建這樣的專用系統(tǒng)已不是最佳選擇。因此,團(tuán)隊在此次研究中有意識地優(yōu)先采用了通用技術(shù) 。最終,無論是用于擴(kuò)展思考時間、處理難驗(yàn)證任務(wù),還是用于并行計算的技術(shù),全都是通用的,團(tuán)隊計劃或已經(jīng)將這些技術(shù)應(yīng)用于其他系統(tǒng),以全面提升模型的推理能力 。

8、為什么不使用 Lean(一種形式化證明工具)?

團(tuán)隊解釋說,Lean 對于數(shù)學(xué)家來說是一個有價值的工具,但它有其局限性。OpenAI 的首要任務(wù)是發(fā)展「通用的推理能力」,而可以被自然語言方法處理的現(xiàn)實(shí)世界問題,遠(yuǎn)比可以被嚴(yán)格形式化的要多。因此他們選擇優(yōu)先發(fā)展自然語言推理。

不過,Noam Brown 也強(qiáng)調(diào):「我不認(rèn)為專用 AI 有什么問題」 。他認(rèn)為,專用 AI 可以非常高效,并且在特定領(lǐng)域顯然能夠遠(yuǎn)遠(yuǎn)超越通用 AI 。通用 AI 與專用系統(tǒng)(如形式化驗(yàn)證工具 Lean)的關(guān)系并非二選一,人類數(shù)學(xué)家也會發(fā)現(xiàn)并使用 Lean 這類專用工具來獲取價值。因此,他認(rèn)為通用 AI 與更專注于特定領(lǐng)域的專用系統(tǒng)是兼容的,并且相信兩者的結(jié)合會因?yàn)榛パa(bǔ)而變得更強(qiáng)大 。

9、這個項目用到的基礎(chǔ)設(shè)施是什么樣的?

Cheryl 證實(shí),這個項目是在與其他近期發(fā)布的 OpenAI 產(chǎn)品非常相似的基礎(chǔ)設(shè)施上構(gòu)建的 。這再次印證了其方法的通用性,沒有任何東西是專門為 IMO「定制」的 。團(tuán)隊的期望是,這些由 Alex 開發(fā)出的、關(guān)于處理不可驗(yàn)證任務(wù)和擴(kuò)展計算時間的技術(shù),能夠被應(yīng)用于推理的其他領(lǐng)域,從而持續(xù)改進(jìn) ChatGPT 等所有模型。

10、「提出問題」將成為 AI 面臨的新挑戰(zhàn)?

主持人提到,「提出有趣的問題」本身就是最難的事情 。團(tuán)隊成員表示認(rèn)同,并認(rèn)為讓模型學(xué)會提出新穎的、有價值的問題(例如創(chuàng)造一個 IMO 級別的新題目),是繼解決問題之后,AI 需要克服的下一個巨大障礙 。

11、物理奧賽題是不是比數(shù)學(xué)更難?

Alex 表示,物理奧賽「絕對更難」,因?yàn)樗艘粋€需要動手操作的「實(shí)驗(yàn)部分」,這需要先解決機(jī)器人技術(shù)領(lǐng)域的難題 。

12、模型未來會開放給大家使用嗎?

團(tuán)隊表示希望將其提供給數(shù)學(xué)家使用,但如何實(shí)現(xiàn)的具體細(xì)節(jié)仍在研究中。他們非常期待看到數(shù)學(xué)家們能用這個強(qiáng)大的新工具來挑戰(zhàn)哪些難題。

Noam 分享了一個持續(xù)了一年的故事。一位斯坦福大學(xué)的數(shù)學(xué)教授會定期發(fā)郵件,用一個非常難的問題來測試 OpenAI 的最新模型。雖然最新的 IMO 模型依然無法解決這個問題,但它首次明確地「認(rèn)識到自己無法解決」,這被認(rèn)為是一個重要的進(jìn)步 。

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

全站最新
中文字幕一区二区三区乱码在线| 亚洲熟妇av乱码在线观看| 婷婷夜色潮精品综合在线| 欧美日韩国产精品一区二区三区| www.这里只有精品| 91丨九色丨国产| 色屁屁一区二区| www.成年人| 国产欧美韩日| 一本一本久久a久久精品综合小说| 国产亚洲自拍一区| 免费福利视频网站| 久久人人爽人人| 国产精品久久久久久久裸模| 在线免费看av的网站| 欧美亚洲另类制服自拍| 偷拍亚洲欧洲综合| 欧美视频中文字幕在线| 韩国成人福利片在线播放| 国产jizz18女人高潮| 久久亚洲成人精品| 亚洲伊人色欲综合网| 国产中文字幕精品| 国产91露脸合集magnet| 99久久免费视频.com| 国产精品精品国产色婷婷| 亚洲图片欧美激情| 国产一区二区三区四区在线观看| 一级肉体全黄裸片| 日本高清xxxx| 97avcom| 欧美日韩国产精品一区二区不卡中文| 西西444www无码大胆| 97成人在线视频| 国产欧美韩国高清| 中文字幕久久久av一区| 亚洲成人一二三| 色一情一乱一乱一区91av| 国产又爽又黄ai换脸| 2019最新中文字幕| 欧美精品aaa| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 国产成人久久精品77777综合 | 久久伊人资源站| 69av视频在线播放| 久久久国产一区二区三区四区小说| 性色国产成人久久久精品| 欧洲猛交xxxx乱大交3| 午夜av免费看| 毛片在线播放视频| 亚洲日本一区二区三区在线不卡| 亚洲女同女同女同女同女同69| 91亚洲大成网污www| 91社区在线播放| 懂色av影视一区二区三区| 日韩在线视频免费观看| 成人久久久久久久| 天堂精品一区二区三区| 青青草原亚洲| 成人亲热视频网站| 亚洲欧洲中文天堂| 亚洲国产福利在线| 亚洲精品动漫100p| 国产精品福利一区二区三区| 96亚洲精品久久久蜜桃| 国产亚洲欧美久久久久| 精品人妻一区二区三区浪潮在线 | 中文字幕国产精品| 亚洲精品aⅴ中文字幕乱码 | 美日韩免费视频| 美女亚洲精品| 欧美久久久久久久久久久久久久| 国产日产欧美一区二区| 乱人伦xxxx国语对白| 欧美日韩在线一二三| 久久国产精品久久久久| 欧美午夜电影一区| 久久久久久久久久看片| 麻豆changesxxx国产| xxxx视频在线观看| 国产第一页在线播放| 国产精品无码久久久久久| 午夜免费一级片| 亚洲国产一区二区在线| 九九久久久久99精品| 欧美成人小视频| 国产精选在线观看91| 2018国产在线| 日本久久久久久久久久| 一本色道久久综合精品婷婷 | 欧美一区二区三区思思人| 偷拍一区二区三区| 色综合 综合色| 欧美日韩激情一区| 国产a视频精品免费观看| 无码精品人妻一区二区三区影院| 国产一区美女在线| 亚洲婷婷综合色高清在线| 91日韩在线专区| 久久久91精品国产一区二区精品 | 日韩精品视频在线观看免费| 成人免费观看网址| 加勒比av中文字幕| 国产视频第一页| 不卡视频在线看| 国产一区二区美女视频| 亚洲欧美国产精品va在线观看| 色yeye香蕉凹凸一区二区av| 久久久久久久网站| 国产乱码久久久久| 欧美性受xxxx黑人猛交| 91精品免费久久久久久久久| 精品欧美乱码久久久久久| 日韩中文理论片| 日本免费久久高清视频| 午夜激情在线观看视频| 亚洲无码精品国产| 色噜噜久久综合| 91超碰中文字幕久久精品| 国产成人黄色片| 亚欧精品在线视频| 国产亚洲精品精品精品| 国产黄色片免费看| 欧美成人一区二区三区片免费| 亚洲成人久久久| 欧美日韩美女一区二区| 欧美一级艳片视频免费观看| 国产精品日韩欧美一区二区三区| 青青草国产精品视频| 亚洲a v网站| 中文字幕有码视频| 色哟哟精品观看| 中文字幕免费播放| 久久精品首页| 亚洲欧美在线观看| 99在线视频精品| 亚洲免费观看在线观看| 欧美在线视频全部完| 欧美精品一区二区久久婷婷| 欧美激情久久久久久| 国产盗摄xxxx视频xxx69| 精品欧美一区二区在线观看| 欧美日韩午夜精品| 天天av天天翘天天综合网 | 美女视频黄 久久| 99精品视频在线观看| 亚洲高清免费观看高清完整版在线观看| 国模精品视频一区二区| 日本激情视频在线播放| 国内老熟妇对白hdxxxx| 欧美日韩国产成人在线91| 日韩免费高清在线观看| 亚洲美女搞黄| www,av在线| 91影院在线播放| 99精品欧美一区二区三区小说| 日韩欧美专区在线| 亚洲综合色婷婷| 五月激情综合色| 一本久久综合亚洲鲁鲁五月天| 欧美日韩国产页| 欧美一区二区大片| 999国产视频| 亚洲狠狠婷婷综合久久久久图片| aaaa一级片| 一区二区三区蜜桃网| 97精品免费视频| 国产成人一区二区在线观看| 精品久久久久久中文字幕大豆网| 四虎影院一区二区三区| 高清一区二区三区四区| 色综合久久88色综合天天6| 国产精品女人网站| 久久精品免费一区二区| 欧美成人aaa片一区国产精品| 久久草av在线| 国产一区二区三区在线观看网站 | 欧美精品日日鲁夜夜添| 亚洲成人av在线播放| 久久成人精品视频| 91香蕉视频导航| 北条麻妃一二三区| 亚洲色图一区二区| 91免费国产视频| 亚洲一二三在线观看| 亚洲在线免费播放| 久久久久久香蕉| 精品久久久久久国产91| 国产一级不卡毛片| av电影天堂一区二区在线| 91网站免费观看| 少妇久久久久久久久久| 国产日韩欧美一区二区东京热| 欧美日韩精品一区二区| 国产一区二区三区无遮挡| 一区二区在线观| 特黄特色免费视频| 一本色道久久综合熟妇| 日本高清不卡一区| 日韩精品免费一区| 精品久久久久久久久久久久久久久久| 99国产精品久| 国产不卡视频在线| 青青草偷拍视频| 国产主播第一页| 欧美另类一区二区三区| 国产精品日韩欧美一区二区三区| 乱精品一区字幕二区| 国产精品久久久久久久9999| 无码人妻一区二区三区线| 亚洲第一福利网站| 无码专区aaaaaa免费视频| 久久久久久av无码免费看大片| 亚洲成人资源网| 91在线视频精品| 国产片侵犯亲女视频播放| 99精品视频99| 经典三级在线一区| 色综合一区二区| 国产福利精品在线| 无码少妇一区二区三区芒果| 日本成人一级片| 精品999在线播放| 丰满人妻一区二区三区免费视频棣| 少妇一区二区三区四区| 中文字幕不卡的av| 国产一区不卡在线观看| 日韩乱码一区二区三区| 精品国产免费一区二区三区四区 | 蜜臀av.com| 一级片黄色免费| 裸体在线国模精品偷拍| 北条麻妃高清一区| 麻豆精品新av中文字幕| 中文在线资源观看视频网站免费不卡| 少妇性l交大片7724com| 一区二区三区中文字幕| 亚洲性av在线| 蜜臀久久99精品久久久酒店新书 | 亚洲av综合色区| 国产视频一区在线播放| 久久久久久久久久久视频| 高潮白浆女日韩av免费看| 国产精品成人99一区无码| 精品sm在线观看| 亚洲天堂av中文字幕| 国产精品卡一卡二| 亚洲自拍在线观看| 国产一区二区麻豆| 欧美精品videosex性欧美| aaaaa一级片| 午夜精品一区二区三| 日韩激情视频在线播放| 高清在线观看免费| 色爱区综合激月婷婷| 人妻av一区二区| 欧美日韩免费高清一区色橹橹| 2022亚洲天堂| 欧美日韩激情视频| 日本美女视频网站| 免费看日韩精品| 欧美重口另类videos人妖| 国产乱淫a∨片免费观看| 欧美激情小视频| 神马午夜电影一区二区三区在线观看| 精品无码国产一区二区三区av| 欧美日韩国产色站一区二区三区| 国产精品亚洲lv粉色| 一区二区日本伦理| 精品视频在线免费| 免费成人深夜夜行网站| 深夜福利日韩在线看| 日本一区二区三区精品| 日韩电影网在线| 久久久久人妻一区精品色欧美| av亚洲精华国产精华精| 91久久国产综合久久91精品网站| 又大又长粗又爽又黄少妇视频| 麻豆成人91精品二区三区| 中文字幕一区日韩电影| 韩国一区二区三区四区| 久久久www成人免费无遮挡大片| 国产精品美女免费看| 国产aaaaaaaaa| 中文字幕在线不卡国产视频| 日韩一区免费观看| 少妇人妻偷人精品一区二区| 久久久欧美精品| 欧美黄片一区二区三区| 欧美精品1区2区3区| 欧美韩国日本在线| 国产欧美va欧美不卡在线| 久久av一区二区三区漫画| 一级黄色录像大片| 亚洲成色777777女色窝| 一二三区视频在线观看| 欧美性生活大片免费观看网址| 亚洲理论电影在线观看| 国产精品 日产精品 欧美精品| 国产精品视频不卡| 中文字幕制服诱惑| 九九热精品视频国产| 欧美福利视频一区二区| 综合国产在线观看| 久久久久久欧美精品se一二三四| 精品美女在线观看| 西西444www无码大胆| 欧美色电影在线| 中文字幕人妻一区| 欧美色图一区二区三区| 亚洲一级av无码毛片精品| 91精品福利在线一区二区三区 | 穿情趣内衣被c到高潮视频| 久久日一线二线三线suv| 蜜臀av性久久久久蜜臀av| 久久久精品人体av艺术| eeuss中文| 久久九九影视网| 成人免费在线小视频| 亚洲国产综合视频在线观看| 午夜免费视频网站| 日韩视频一区在线观看| 国产又黄又粗的视频| 日韩精品电影网| 国产中文字字幕乱码无限| 久久91精品国产91久久久| 日本免费在线观看视频| 国产精品久久久久久久久久新婚 | 亚洲毛片一区二区| 中文字幕在线观看免费视频| 欧美激情2020午夜免费观看| 性生活视频软件| www.久久久| 成人免费在线视频| 午夜激情av在线| 日韩欧美色电影| 狠狠躁夜夜躁人人爽天天高潮| 97久久精品在线| 国产乱妇无码大片在线观看| 日本男女交配视频| 欧美三电影在线| 伊人中文字幕在线观看| 91精品国产综合久久久久久丝袜| 成人一级片网址| 不卡av免费在线| 精品视频在线播放免| 一级黄色a视频| 日本在线观看不卡| 天天色天天爱天天射综合| 日韩女优一区二区| 国产精品偷伦视频免费观看国产| 99这里都是精品| 国产精品无码网站| 97久久精品国产| xfplay精品久久| 成年人在线观看av| 日韩美女av在线免费观看| 福利一区在线观看| 欧美性猛交乱大交| 欧美成人中文字幕| 国产老妇另类xxxxx| 欧美激情第3页| 2025国产精品视频| 欧美激情在线一区二区| 东京热无码av男人的天堂| 国产主播精品在线| 亚洲精品国产视频| av中文在线播放| 午夜精品一区二区在线观看| 欧美日韩国产片| 国产男女裸体做爰爽爽| 日韩精品xxxx| 欧美大尺度激情区在线播放| 久久综合久久综合九色| 日韩成人短视频| 日韩亚洲视频| 亚洲人成电影在线播放| 成人综合在线观看| 国产中文字幕久久| 美女精品国产| 日韩电视剧在线观看免费网站| 免费成人av资源网| 亚洲av片不卡无码久久| 91国产在线免费观看| 9191成人精品久久| 蜜臀av性久久久久蜜臀aⅴ| 97人妻天天摸天天爽天天| av一区二区三区免费| 亚洲国产成人精品女人久久久 | 中文字幕 欧美日韩| 国产精品成人av在线| 欧美视频日韩视频在线观看| 久久久一二三| 亚洲女人久久久| av动漫在线播放| 韩日欧美一区二区| 日韩欧中文字幕| 久草这里只有精品视频| 亚洲一级生活片| 国产在线观看福利| 91欧美日韩一区| 伊人青青综合网站| 亚洲一级二级三级在线免费观看| 开心激情综合网| 日韩一区二区a片免费观看| 亚洲欧美日本国产有色| 欧美专区日韩视频| 精品美女在线播放| 亚洲男人的天堂在线观看| 久久久久免费|