亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

GPT-5大提升,o3對抗賽奪冠,但OpenAI越來越難讓人驚艷了?

IP屬地 中國·北京 編輯:顧青青 觀察者網(wǎng) 時(shí)間:2025-08-08 18:23:29

(文/觀察者網(wǎng) 張廣凱 編輯/呂棟)

北京時(shí)間8月8日凌晨,備受期待的OpenAI最新大模型ChatGPT-5終于正式發(fā)布,就在同時(shí),谷歌舉辦的首屆大模型國際象棋對抗賽中,o3也以4-0完勝Grok 4奪冠。這本該是對OpenAI雙喜臨門的一天,但作為一款關(guān)注度如此之高的產(chǎn)品,網(wǎng)友也很快發(fā)現(xiàn)了GPT-5的一些小小的瑕疵。

盡管大模型的能力仍然在快速進(jìn)步,但其進(jìn)步幅度越來越難以給人帶了驚艷感了。這不是OpenAI自己的問題,甚至某種意義上,這也不是一件壞事,因?yàn)槭侵叭藗兊念A(yù)期已經(jīng)被拉到過高。但無論如何,在現(xiàn)有的算法范式下,AI大模型或許也離瓶頸越來越近了。

GPT-5水平如何?

作為OpenAI今年最受期待又屢屢跳票的重磅產(chǎn)品,ChatGPT-5今天的確給出了一些頗具說服力的測評數(shù)據(jù),證明其推理能力有著顯著進(jìn)步。

例如,在數(shù)學(xué)能力測試AIME 2025上,GPT-5 Pro在開啟推理模式并調(diào)用工具(Python)的情況下,拿下滿分成績。即使不調(diào)用工具,GPT-5 Pro仍能拿下96.7的高分,GPT-5標(biāo)準(zhǔn)版也能拿到94.65分,顯著高于o3的88.9分。


編程方面,GPT-5在SWE-bench Verified上得到74.9分,高于o3的69.1和4o的30.8分。


博士水平的科學(xué)知識測試GPQA Diamond中,不調(diào)用工具的GPT-5 Pro推理模式拿到88.4分,創(chuàng)造新紀(jì)錄。


多模態(tài)方面,GPT-5得到84.2分,比o3的82.9分有小幅提升。


高難度的Humanity's Last Exam(人性終極測試)上,GPT-5 Pro和GPT-5在不調(diào)用工具時(shí)分別得到30.7和24.8分,較o3的14.7分大幅提升。


大模型競技場LM Arena的評分也已經(jīng)出爐,GPT-5橫掃所有單項(xiàng)的第一名。


此外,GPT-5推理模式的幻覺數(shù)量比o3少了六倍,成本方面則可以減少50-80%的token輸出量。

這些數(shù)據(jù)都證明,GPT-5算得上是一次成功的大版本升級。

但另人尷尬的是,在發(fā)布會(huì)后,網(wǎng)友迅速發(fā)現(xiàn)GPT-5在解一道極其簡單的方程時(shí)又犯了計(jì)算錯(cuò)誤:


看起來,GPT-5還是沒能解決小數(shù)比大小的問題。

而OpenAI發(fā)布會(huì)PPT里的小瑕疵,也引起了網(wǎng)友熱議。大家發(fā)現(xiàn)在這張圖表里,柱狀圖的高度出現(xiàn)了明顯錯(cuò)誤,但并不知道這是人為錯(cuò)誤還是由AI生成。


有網(wǎng)友指出,在關(guān)于機(jī)翼升力原理的回答中,GPT-5也引用了一個(gè)廣為流傳的錯(cuò)誤觀點(diǎn)。當(dāng)然,這樣的問題歸咎于AI未免過于苛刻。

馬斯克則“嘴硬”稱,Grok 4在ARC-AGI測試中仍然打敗了GPT-5。


做題好是不是真的好?

那么,如何評價(jià)GPT-5的真實(shí)水平,或許日前的大模型國際象棋對抗賽恰好給我們提供了一個(gè)很好的參考。


同樣在今天凌晨結(jié)束的對抗賽上,OpenAI旗下的o3以4-0完勝Grok 4,奪得最終冠軍。盡管Grok 4在此前兩輪中都表現(xiàn)出色,但在決賽中,隨著對局長度增加,Grok 4也開始表現(xiàn)出棋力下降。

例如在第一局中,Grok 4莫名其妙地放棄了自己的象,并且沒有獲得任何明顯的回報(bào),而Grok 4也并未在推理中說明理由。


o3盡管表現(xiàn)相對出色,在昨天的半決賽中還下出過正確率評分100%的棋局,但縱觀整個(gè)比賽過程,也不乏低級失誤。


或許有人會(huì)質(zhì)疑,讓AI下棋究竟能證明什么?AI對抗賽的勝負(fù),是不是僅僅取決于它們使用了多大規(guī)模的訓(xùn)練數(shù)據(jù)?DeepSeek下棋不好,但是作詩是不是更好?

事實(shí)上,如果只糾結(jié)于下棋或者作詩的技能水平,說明并未理解谷歌采用這種比賽形式的邏輯。

此次國際象棋比賽的意義,并非考驗(yàn)大模型的算力,而是考驗(yàn)其推理能力。

如果大模型在接受了大量棋譜訓(xùn)練之后,體現(xiàn)出高超棋力,這只能證明AI的記憶力或者算力強(qiáng)大,而這件事在2017年就已經(jīng)被AlphaGo證明過了。

但是由于這些通用大模型都沒有接受過專門的棋譜訓(xùn)練,因此往往只能在開局階段憑借記憶下出經(jīng)典開局。在幾個(gè)回合之后,大模型已經(jīng)無法找到人類棋譜作為參考,它們的思維結(jié)構(gòu)也并非像AlphaGo那樣專為下棋設(shè)計(jì)。因此,這時(shí)候的AI推理,是跟人類相同的推理方式,通過語言邏輯來推演棋盤變化。

上述無工具的數(shù)學(xué)測試,起到的也是類似作用:考驗(yàn)AI用人類邏輯進(jìn)行計(jì)算的能力,而不是使用專門的機(jī)器算法。

因?yàn)闊o論是AlphaGo也好,還是計(jì)算工具也好,這樣的AI在特定任務(wù)中無比強(qiáng)大,但是卻毫無泛化性,不能解決任何其它問題。只有使用人類邏輯推理的模型,才能在人類世界中擁有最好的泛化性。

而在這個(gè)維度上,我們可以看到,無論是o3、Grok 4,還是最新升級的GPT-5,哪怕他們大部分時(shí)間都能夠解決復(fù)雜問題,但也還會(huì)犯下對人類來說的低級錯(cuò)誤。這是現(xiàn)有的Next Token Predicting范式下仍然難以完全克服的問題,也說明它們或許離AGI的最終形態(tài)還有遙遠(yuǎn)距離。

OpenAI顯然也不再希望把外界的胃口掉得過高。在本次發(fā)布會(huì)上,我們可以看到OpenAI花了更多時(shí)間介紹GPT-5在垂直場景應(yīng)用的能力,例如生成小游戲、回答健康問題的能力,這都是為了讓AI與人類更好地共存與協(xié)作。

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
在线视频精品免费| 亚洲毛片av在线| 国产日韩欧美久久| 亚洲欧美在线aaa| 综合久久中文字幕| 亚洲美免无码中文字幕在线 | 91大神福利视频在线| 欧美日韩成人一区| 欧美疯狂做受xxxx富婆| 欧美日韩免费观看一区三区| 一区二区三区四区乱视频| 91麻豆视频网站| 国产成人精品a视频| 国产精品三区四区| 在线免费观看一区二区| 国产精品国产精品国产专区不卡| 亚洲欧美另类综合偷拍| 久久久精品视频在线| 欧美激情一区二区三区p站| 国产女教师bbwbbwbbw| 色天天综合狠狠色| 色综合天天在线| 国产第一页在线播放| 国产日韩精品久久| 午夜剧场成人观在线视频免费观看| 欧美日韩国产小视频| 欧美日韩中文一区| 久久久91精品国产一区二区精品| 日本三级中文字幕| 人妻换人妻仑乱| 久久久水蜜桃| 欧美—级a级欧美特级ar全黄| 国产黄色精品视频| 免费在线观看日韩| 国产一级片av| 深夜视频在线观看| 国产一区二区视频播放| 国产精品二区三区| 99久久国产综合精品色伊| 日本黄色大片视频| 中文字幕丰满乱码| 日韩高清a**址| 视频二区在线观看| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 亚洲成人久久网| 天天综合天天综合| 欧美精品久久久久久久免费| 亚洲国产欧美自拍| 美日韩一级片在线观看| 久久精品免费一区二区| 久久精品国产久精国产一老狼| 亚洲精品久久久久久久久久 | 成人激情午夜影院| 亚洲一二三四五| 国产成人精品视| 亚洲国产乱码最新视频| 一级黄色片在线播放| 欧美一级免费在线观看| 日韩欧美国产精品| 久久性色av| 日韩av影视大全| 欧美诱惑福利视频| 亚洲精品久久久蜜桃| 国产中文字幕免费| 路边理发店露脸熟妇泻火| 日韩精品中文字幕在线观看| 极品尤物av久久免费看| 四虎永久免费在线观看| 成人久久久久久| 欧美性精品220| 精品一区二区三区蜜桃在线| 国内自拍欧美激情| 老司机免费视频一区二区| 日韩大尺度视频| 91精品国产综合久久香蕉| 欧美视频精品在线观看| 蜜臀精品久久久久久蜜臀| 91精品人妻一区二区三区蜜桃2| 久久噜噜噜精品国产亚洲综合| 国产精品丝袜91| 中文字幕免费高清在线观看| 国产精品主播直播| 一本一生久久a久久精品综合蜜| 日韩欧美一区二区免费| 成人手机电影网| 中文精品久久久久人妻不卡| 亚洲不卡1区| 日韩高清欧美高清| 久久蜜桃香蕉精品一区二区三区| 全黄一级裸体片| 国产欧美婷婷中文| 国产精品视频免费看| 色在线观看视频| 欧美精品一卡二卡| 伊人网综合在线| 在线免费看v片| 日韩美女免费观看| 精品久久久免费| 毛片av中文字幕一区二区| 国产在线观看中文字幕| 国产亚洲精品日韩| 国产成人精品影视| japan高清日本乱xxxxx| 老汉色影院首页| 亚洲人成电影网站| 日本不卡不码高清免费观看| 免费在线观看污| 麻豆91蜜桃| 欧美成人在线网站| 色哟哟一区二区三区| 国内精品久久久久影院色 | 亚洲视频网站在线观看| 国内不卡的二区三区中文字幕 | 国产精品久久久久久久一区探花 | 亚洲综合区在线| 欧美特黄aaaaaa| 另类小说第一页| 9a蜜桃久久久久久免费| 欧美性生活久久| 久久精品男女| 日本中文在线视频| 日本欧美视频在线观看| 国产日韩专区在线| 欧美zozozo| 国产高清亚洲一区| 这里只有精品999| 岛国av在线免费| 国产一区二区黄色| 色偷偷av一区二区三区| 欧美日韩中文字幕| 韩国v欧美v日本v亚洲v| 大黑人交xxx极品hd| 久久精品99久久| 久久国产精品久久久久| 在线播放一区二区三区| 国产视频一区二区在线观看| 日本三级视频在线| 欲求不满的岳中文字幕| 亚洲va欧美va在线观看| 欧美日韩精品免费观看视频| 一区二区成人在线| 日韩av二区在线播放| 欧美a视频在线观看| 日韩va在线观看| 亚洲欧美日韩不卡一区二区三区| 亚洲va电影大全| 色综合导航网站| 91精品国产91久久久久久最新毛片| 国产精品少妇自拍| 日本不卡在线视频| 国产情侣在线播放| 久久久久无码精品国产sm果冻| 亚洲精品videosex极品| 久久午夜夜伦鲁鲁片| 国产一级性生活| 精品久久久久人成 | 在线视频日韩欧美| 精品一区二区三区的国产在线播放 | 欧美色综合久久| 欧美日韩不卡一区二区| 成人精品久久一区二区三区| 狠狠干 狠狠操| 欧美福利在线视频| 免费看毛片网站| 国产精品18久久久久久久网站| 日韩视频一区二区| 欧美这里只有精品| 日韩字幕在线观看| 成人一级黄色片| 中文字幕日韩av综合精品| 亚洲精品一区二区三区蜜桃下载| 成人av.网址在线网站| 亚洲国产精品三区| 国产午夜精品美女毛片视频| 久精品国产欧美| 日韩二区三区在线观看| 91在线视频成人| av资源免费观看| 亚洲国产欧美一区二区三区同亚洲| 神马影院午夜我不卡影院| 男人晚上看的视频| 久久精品免费观看| 精品美女在线播放| 人偷久久久久久久偷女厕| 免费在线视频观看| 国产夫妻性生活视频| 国产成人亚洲综合色影视| 色七七影院综合| 久久成人激情视频| 国产精品你懂的在线欣赏| 欧美另类高清videos| 久久久久久国产精品日本| 国产黄色成人av| 99在线热播精品免费| 国产精品99久久久久久久久久久久| 337p日本欧洲亚洲大胆张筱雨 | 一二三四区在线| 中文字幕欧美亚洲| www日韩在线| 欧美丝袜一区二区| 日韩精品一区二区三区四区五区 | 在线观看亚洲国产| 色综合一个色综合亚洲| 色99之美女主播在线视频| 日韩欧美视频一区二区三区四区 | 99在线视频播放| 一级黄色大毛片| 亚洲第一福利一区| 久久亚洲午夜电影| 国产sm主人调教女m视频| 国产日产欧产精品推荐色| 亚洲欧美日韩一区二区在线| 中文字幕一区二区三区四区在线视频| 成人一级视频在线观看| 老汉色影院首页| 亚洲制服丝袜av| 人妻丰满熟妇aⅴ无码| www.99久久热国产日韩欧美.com| 美女福利视频在线观看| 亚洲国模精品私拍| 中文字幕12页| 精品在线播放午夜| 中文字幕日韩电影| 99日在线视频| 国产91精品精华液一区二区三区 | 超碰在线免费观看97| 久久久夜色精品亚洲| 亚洲自拍偷拍在线| 中文无码精品一区二区三区| 国产一区av在线| 免费看污黄网站在线观看| 97精品人妻一区二区三区香蕉| 亚洲电影天堂av| 久久精品午夜福利| 亚洲成人一二三| 偷拍夫妻性生活| 欧美精品制服第一页| 国内精品偷拍视频| 亚洲xxxx3d| 经典三级在线一区| 黄频视频在线观看| 不卡的av电影| 国模吧一区二区| 性欧美精品男男| 欧美色图一区二区三区| 一区二区传媒有限公司| 国产99久久久精品| 中文字幕亚洲一区在线观看| 久久久一本二本三本| 99久久精品国产导航| 十八禁视频网站在线观看| 欧美日韩亚洲系列| 黄色成人在线免费观看| 成人av免费在线播放| 亚洲欧美电影在线观看| 日本美女视频一区二区| 欧美日韩一区二区在线观看视频 | 26uuu国产在线精品一区二区| 一女二男3p波多野结衣| 亚洲人成电影网站色| 亚洲午夜精品在线观看| 欧美岛国在线观看| 国产又粗又大又爽| 亚洲xxxxx| 久久99久久99小草精品免视看| 欧美福利视频网站| 97在线公开视频| 久久久久久伊人| 人人精品人人爱| 成人福利免费观看| 久久久久久91亚洲精品中文字幕| 亚洲激情成人网| 国产特黄级aaaaa片免| 欧美激情视频一区二区| 麻豆专区一区二区三区四区五区| 91精品视频免费| 青青草97国产精品免费观看 | 日韩欧美精品网站| 加勒比一区二区| 国产日韩在线亚洲字幕中文| 亚洲一区二区三区中文字幕| 韩国av免费观看| 在线视频不卡一区二区| 日本高清不卡aⅴ免费网站| 国产成人精品免费看视频| 99r国产精品视频| 免费黄网站欧美| 奇米精品在线| 一区二区三区欧美| 无码人妻精品一区二区三区99不卡| 色妹子一区二区| 国产在线免费av| 亚洲精品永久免费精品| 亚洲国产成人精品综合99| 精品久久久久久久久久久久久久久久久| 日日橹狠狠爱欧美超碰| 91精品免费观看| 性爱在线免费视频| 欧美国产视频一区二区| 久久成人av少妇免费| 97超碰人人澡| 国产 欧美 自拍| 一区二区三区欧美成人| 色94色欧美sute亚洲线路二| 亚洲一区欧美在线| 欧美一级中文字幕| 97超碰色婷婷| 欧美性xxxxxxx| 国产一区二区剧情av在线| 久久久久久成人网| 精品国产综合久久| 亚洲激情 国产| 成人av无码一区二区三区| 亚洲激情电影在线| 中文字幕不卡的av| 性欧美一区二区| 日韩视频精品在线| 精品在线播放免费| 日本少妇激三级做爰在线| 精品久久久久久亚洲综合网 | 亚洲精品日韩精品| 日韩欧美电影一二三| 午夜久久久久久噜噜噜噜| 久久精品人人做人人爽电影| 日韩欧美极品在线观看| wwwwww在线观看| 日本高清久久一区二区三区| 久久精品国产一区二区三区免费看| 久久久久久久久久久久91| 91国语精品自产拍在线观看性色| 成人欧美一区二区三区黑人麻豆| 中文字幕一区二区免费| 少妇饥渴放荡91麻豆| 日韩视频专区| 国产精品激情av在线播放| 欧美性猛xxx| 国产一区二区三区久久久| 国产中文字幕久久| 国产精品三区四区| 日韩一区二区三区四区| 神宫寺奈绪一区二区三区| 男人的天堂avav| 久久网福利资源网站| 国产精品一区二区果冻传媒| 美国黄色一级视频| 国产午夜精品一区| 亚洲视频综合在线| 欧美日韩人妻精品一区二区三区| 亚洲bt天天射| 日韩精品中文字幕一区| 成人欧美一区二区三区视频网页| 午夜性色福利影院| xxxx黄色片| 91精品国产成人www| 欧美三级中文字幕在线观看| 久久精品国产精品亚洲精品| 在线免费看黄色片| 亚洲天堂影视av| 久久久国产精华| 开心激情五月网| 精品国产乱码久久久久软件| 中文字幕av一区二区三区谷原希美| 欧美视频精品在线| 国产精品国产三级国产普通话蜜臀 | 精品在线一区二区| 日韩在线免费观看av| 91免费国产精品| 久久久久久91香蕉国产| 色呦呦国产精品| 国产一区二区三区高清播放| 麻豆91精品91久久久| 精品国产一二三四区| 91久久精品一区| 日韩一区二区在线观看视频 | 五十路在线观看| 美女又黄又免费的视频| 91色在线观看| 日韩一区二区三区精品视频| 高清日韩电视剧大全免费| 欧美一级片免费在线观看| 亚洲成年人专区| 国产精品免费在线播放| av一区二区三区免费| 91精品国产99久久久久久红楼 | 欧美一区国产一区| 国产欧美亚洲视频| 欧美第一黄网免费网站| 在线观看精品一区| 91免费看片在线观看| 国产亚洲欧美精品久久久www| 成人免费无码av| 一区二区在线观看网站| 中文在线不卡视频| 亚洲精品一区二区三区香蕉| 精品亚洲一区二区三区在线观看| 亚洲精品视频免费| 中文字幕日韩专区| 亚洲欧美激情一区| 亚洲新中文字幕| 亚洲欧美一区二区激情| 日韩高清中文字幕| 欧美自拍偷拍午夜视频| 久久久久久电影| 国产精品一二三区在线| 伊人网视频在线| 精品无码在线观看| 日本中文字幕有码| 男人亚洲天堂网| 日韩三级在线播放| 国产精品色午夜在线观看|