亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

GPT5.2發布:屠榜?不,是OpenAI在補課

IP屬地 中國·北京 硅星人 時間:2025-12-12 22:07:55


作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com

四個月前,GPT-5 發布時一堆人吐槽,跑分是高了,但聊天冷冰冰;一個月前,GPT-5.1 回應了這波差評,主打“更好聊、更好調”,算是把人味兒找回來了。

結果還沒暖熱乎,Google 的 Gemini 3 就殺了過來,直接把 LMArena 榜單屠了個遍。緊接著 Anthropic 的 Claude Opus 4.5 也上線,在編程榜單上把 OpenAI 按在地上摩擦。

于是就有了昨天凌晨的 GPT-5.2。

這次發布的背景很微妙,就在幾天前,有媒體爆出 Sam Altman 在內部發了一封Code Red郵件,要求全公司集中資源改進 ChatGPT。雖然官方說 GPT?5.2 不是專門為 Gemini 3 趕出來的,但 Code Red 和發布時間點都說明:Gemini 3 至少加快了 OpenAI 把這版推向用戶的步伐。


這一次,OpenAI 雖然繼續強調跑分相對5.1點提升,但還在反復突出一個關鍵詞:專業知識工作。

換句話說,這次瞄準的不是“更好聊”,而是“更能干活”。

1

第一個在“真實工作”上打平人類專家的模型?

這次 OpenAI 主推的新基準測試叫 GDPval:讓 AI 去做 44 種職業的真實工作任務,比如做 PPT、做表格、寫分析報告。

成績是這樣的:



GPT-5.2 Thinking 在 70.9% 的任務上能打平或者贏過行業專家

上一代 GPT-5 才 38.8%

Claude Opus 4.5 是 59.6%

Gemini 3 Pro 是 53.5%

更夸張的是效率:速度快 11 倍,成本不到 1%。

當然,GDPval 是 OpenAI 自己搞的基準,還沒有被獨立驗證,所以這個打平人類專家的說法要打個問號。但即便打個折扣,從 38% 跳到 70%,這個提升幅度也很難忽視。

Anthropic 的 Claude 最近在這類任務上同樣進步明顯,但從 5.2 的發力方向來看,OpenAI 顯然想在"AI 替代知識工作"這條賽道上搶先卡位。

OpenAI官方也放了一些工作中的案例,比如,同樣是讓模型做一個勞動力規劃表格(包含員工人數、招聘計劃、流失率和預算影響),5.1 輸出的是一堆原始數據堆砌,5.2 則自動按部門分類、加上顏色標注和清晰的層級結構,看起來像是有人真的用心排過版。


1

Coding:前端又雙叒叕更強了

編程能力也是 5.2 的重點宣傳方向。

SWE-bench Pro:55.6%(5.1 是 50.8%,Gemini 3 Pro 是 43.3%,Claude Opus 4.5 是 52%)

SWE-bench Verified:80%(和 Claude Opus 4.5 的 80.9% 基本打平,這個榜已經快刷到極限了)


OpenAI 這次重點宣傳的是 SWE-bench Pro 而不是 Verified,角度是:Pro 版本場景更多樣、污染更少,更能反映真實的軟件工程能力。

前端開發能力又上了一個臺階,特別是在 3D 場景渲染和復雜交互界面這塊。Cognition、Warp、JetBrains、Augment Code 這些合作伙伴都表示,5.2 在交互式編程、代碼審查和 bug 查找上都有可測量的提升。

最直觀的是這個波浪模擬案例的對比,

GPT-5.2 Thinking:

Gemini 3 Pro:

1

更像數學家了

數學能力是這次升級的另一個重頭戲。

幾個關鍵數字:

FrontierMath(Tier 1-3):40.3%,創下新的行業紀錄,上一代 5.1 是 31%

AIME 2025:100%,滿分。這是第一個在不使用工具的情況下刷滿這個競賽數學基準的模型

GPQA Diamond(博士級科學問答):Thinking 版 92.4%,Pro 版 93.2%

但最讓人印象深刻的,是 GPT-5.2 Pro 在一個真正的數學研究問題上的表現。

OpenAI 在博客里提到,研究人員用 GPT-5.2 Pro 探索了一個統計學習理論中的開放問題,這個問題最早是在 2019 年的一個數學會議上提出的。在一個特定的高斯設定下,模型提出了一個證明思路,隨后被人類研究者驗證并擴展。

這不是AI 從零發現物理定律那種科幻場景,但確實是一個 AI 在人類監督下提供了非平凡的數學洞見,而且經受住了專家審查。5.1 沒有被廣泛報道做到過這一點。

用一位測試者的話說:5.1 像一個很強的數學家教和助手,5.2 開始有點"初級合作者"的意思了——尤其是配合代碼工具使用的時候。

1

API 漲價:OpenAI 的小心思

5.2 的 API 漲價了。

輸入輸出的單價都上調了約 40%:$1.75/百萬輸入,$14/百萬輸出。Pro 版本更貴,分別是 $21 和 $168。


官方的解釋是:單價雖然漲了,但模型效率更高,完成同樣的任務消耗的 token 更少,所以"達到同等質量水平的總成本可能反而更低"。

但如果花更少的 token 只能達到"同等質量",那升級的意義在哪兒?要是真的又好又省,直接說"更好更便宜"不就完了?

說白了,模型確實變強了,但 OpenAI 選擇把效率提升的紅利收進自己口袋,而不是讓利給用戶。

1

幾個重點提升

除了上面這些亮點,5.2 還有幾個實打實的提升:

錯誤率降低 30%

這一點其實很關鍵。很多人只盯著"智商"看,但實際用下來會發現,國產模型和海外頭部模型之間,幻覺控制的差距往往比純智力差距更影響體驗。5.2 的 Thinking 版本比 5.1 的錯誤率降低了 30%,在日常決策、研究和寫作場景下會更靠譜。


長文能力提升

以前長上下文是個老大難問題,塞太多內容進去模型就開始健忘。5.2 在 256k token 級別的測試中表現穩定,基本能把關鍵信息都記住。像合同審核、文獻梳理這種需要反復引用上文的場景,體驗會好很多。Box 反饋說,5.2 從長文檔中提取信息的速度快了 40%,推理準確率也提升了 40%。


看圖能力

圖表理解、軟件界面識別這塊錯誤率砍了一半。在 CharXiv Reasoning(科學論文圖表理解基準)上,5.2 Thinking 達到了 88.7%,比 5.1 提升了 8 個百分點以上。


OpenAI 內部測試里,有人給模型一張低分辨率的主板照片,它能準確識別出關鍵元器件。這意味著以后扔給 AI 一張模糊的業務報表截圖,它大概率能直接把里面的數據結構化提取出來,這對做數據分析的人來說挺實用的,畢竟現在海外已經有不少人把 AI 當成數據分析的主力工具了。


1

Code Red 下的補課之作

拉遠一點看,GPT-5.2 本質上是一次“補課”。

從 8 月的 5.0 到 11 月的 5.1 再到 12 月的 5.2,四個月三個版本,這個節奏本身就說明問題:OpenAI 在被 Gemini 3 和 Claude Opus 4.5 逼著跑。結果就是PT?5.2 在 benchmark 上把很多榜單拉了回來,但真正有意義的是,它在長時知識工作、復雜編碼和 agent 工作流上的表現。

另外也有觀點認為,這種緊急動員 + 小步快跑的節奏可能會成為常態,年底各家都可能還有新發布。好處是各家實驗室會被倒逼著把模型做得更快、更便宜、更能變現;壞處是大家都盯著短期 benchmark 卷,真正需要長期投入的基礎性突破可能會被擠壓。

這次的社區的反饋也很多樣,做正事的用戶普遍覺得真香,長上下文、復雜推理確實更穩了;但陪聊黨和角色扮演玩家吐槽“5.2 冷冰冰的,像從好朋友變成了 HR”,人味兒又被收回去了,還有人吐槽說好的成人模式也遙遙無期。

總結一下,如果你是 ChatGPT Pro 用戶,5.2 在需要深度分析、復雜推理的場景下值得一試——做 PPT、做表格、寫報告、啃長文檔,這些方面的進步是實打實的。

但如果你期待的是日常聊天體驗的質變,可能要失望了。5.2 的真正價值,或許要等它接入 Codex 這類 agent 產品、開始真正替你跑腿干活的時候,才能完全釋放出來。

屠榜不重要,能干活才重要。這一點,OpenAI 這次算是想明白了。


點個愛心,再走 吧

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

久久综合五月天| 91福利精品第一导航| 欧洲精品在线观看| 最近2019好看的中文字幕免费| 国产日韩精品在线| 一级特黄性色生活片| 秋霞av一区二区三区| 久久久噜噜噜久久中文字幕色伊伊 | 91精品欧美综合在线观看最新| 91精品国产高清| 久久99九九| 天堂www中文在线资源| 欧美黄色aaa| 国产麻豆免费视频| 午夜视黄欧洲亚洲| 久久亚洲精品小早川怜子66| 97超碰在线视| 亚洲天堂岛国片| 蜜桃视频在线观看一区| 欧美精品一区二区蜜臀亚洲| 日本在线观看一区二区三区| 特级黄色片视频| 蜜桃视频在线一区| 欧美日韩激情在线| 亚洲国产一区二区在线| 久久精品国产成人av| 国产亚洲一区二区在线观看| 欧美成人久久久| 日韩一级特黄毛片| 国产第一页在线观看| 日韩欧美精品中文字幕| 国产免费高清一区| 精品少妇人妻一区二区黑料社区| 国产91丝袜在线18| 亚洲美女黄色片| 丰满少妇久久久| 神马久久久久久久久久| 欧美日韩免费网站| 国产97在线|日韩| 国产精品理论在线| 国产三级三级三级精品8ⅰ区| 色哟哟入口国产精品| 精品视频第一区| 欧美人妻一区二区三区| 国产精品中文欧美| 久久久视频在线| 免费看91视频| 亚洲欧美综合另类在线卡通| 欧美成人精品一区二区| 国产精品一区二区小说| 亚洲精品免费在线观看视频| 国产视频精品免费播放| 国产一级不卡视频| 男人的天堂一区二区| 欧美三级视频在线观看| 国产在线一区二区三区播放| 亚洲少妇xxx| 日本高清成人免费播放| 午夜啪啪免费视频| 国产美女免费视频| 亚洲性视频网址| 亚洲制服在线观看| 亚洲一区成人在线| 日韩精品视频一区二区| 欧美激情一区在线观看| 成人午夜电影免费在线观看| www.99视频| 欧亚精品中文字幕| 中文区中文字幕免费看| 欧美国产日韩精品| 亚洲天堂中文字幕在线| 精品视频在线播放| 国产农村妇女精品久久| 亚洲人精品午夜| 海角国产乱辈乱精品视频| 国产一级片黄色| av欧美精品.com| 欧美18视频| 国产精品亚洲午夜一区二区三区| 国产精品久久97| 国产精品嫩草影院桃色| 欧美放荡办公室videos4k| 青青草免费av| 日韩成人中文电影| 亚洲熟女毛茸茸| 亚洲欧美日韩网| av在线网站观看| 日韩一级在线观看| 免费在线观看你懂的| 欧美性jizz18性欧美| 日本女人黄色片| 欧美日韩一级视频| 国产美女三级无套内谢| 无码专区aaaaaa免费视频| 亚洲人成精品久久久久| 久久久精品视频国产| 日韩欧美中文一区| 国产精品av久久久久久无| 欧美亚洲一区三区| 日本新janpanese乱熟| 91免费国产视频网站| 国产精品丝袜白浆摸在线| 国产黄网在线观看| 国产欧美精品日韩| 色噜噜在线播放| 国产欧美一区二区三区久久| 国产精品51麻豆cm传媒 | 欧美色视频一区二区三区在线观看| 欧美日韩国产综合草草| 天堂在线中文视频| 欧美成人免费大片| 日韩av网站在线观看| 欧美日韩在线观看一区| 国产亚洲欧美色| av天堂一区二区| y97精品国产97久久久久久| 高清毛片aaaaaaaaa片| 欧美一二三四五区| 午夜精品成人在线视频| 日本中文字幕精品—区二区| 亚洲欧美激情一区| 囯产精品一品二区三区| 男人j进女人j| 亚洲3atv精品一区二区三区| 污视频在线观看免费网站| 中文字幕欧美国内| 国产一区免费电影| 1024av视频| 91精品国产综合久久国产大片| 狠狠躁夜夜躁人人爽视频| 久久国产精品-国产精品| 黑人极品videos精品欧美裸| 国产性xxxx| 奇米影视首页 狠狠色丁香婷婷久久综合| caoporen国产精品视频| 在线播放黄色av| 韩国福利视频一区| 国内成人精品2018免费看| av地址在线观看| 色妞欧美日韩在线| 国产999久久久| 999在线观看| 日韩一区二区欧美| 人妖欧美一区二区| 超碰超碰在线观看| 国产精品专区一| 日本高清不卡视频| 成人毛片视频免费看| 久久久999视频| www.亚洲免费视频| 中文字幕 久热精品 视频在线 | 免费观看日韩电影| 岛国毛片在线播放| 在线成人中文字幕| 国产亚洲欧美日韩日本| 久久婷婷国产麻豆91| 一卡二卡三卡视频| 欧美性资源免费| 亚洲日本va在线观看| 日本三级片在线观看| 国精产品一区一区三区视频| 国精产品一区一区三区有限在线| 亚洲尤物在线视频观看| 黄色一级a毛片| 久久中文字幕精品| 2021国产视频| 精品国产一区av| 亚洲伦理在线精品| 亚洲国产av一区二区三区| 五月激情婷婷在线| 青青草原亚洲| 欧美在线一级va免费观看| 欧美巨大另类极品videosbest| 国产偷拍一区二区| 五月天综合视频| 日韩a级在线观看| 亚洲欧美在线看| 精品色蜜蜜精品视频在线观看| 亚洲一区二区人妻| 中文字幕第88页| 亚洲日本一区二区三区在线不卡| 午夜精品理论片| 亚洲天堂av在线免费| 欧美日韩黄色一区二区| 一区二区三区在线视频观看| 免费观看在线色综合| 国产又黄又粗又硬| 日韩美女一级片| 性欧美成人播放77777| 日本精品www| 一区二区三区四区| 久久资源亚洲| 超碰在线免费97| 天天色天天操综合| 成人片黄网站色大片免费毛片| 国产成人在线亚洲欧美| 在线免费观看日本一区| 波多野洁衣一区| 国产精品久久久午夜夜伦鲁鲁 | 久久久久久国产精品三级玉女聊斋| 久久综合久久综合九色| 免费视频一区二区| 在线观看你懂的网站| 扒开jk护士狂揉免费| 亚洲欧洲一区二区福利| 日韩国产一区三区| 国产成都精品91一区二区三| 免费在线不卡av| 国产精品美女高潮无套| 美国黄色小视频| 捆绑调教一区二区三区| 亚洲免费成人av| 一本久道中文字幕精品亚洲嫩| 一本大道久久精品懂色aⅴ| 日韩美女视频一区二区| 美女网站色91| 91福利免费视频| 久久久精品免费看| 久久久久无码精品国产sm果冻 | 久久国产主播精品| 国产精品久久久久久久久久ktv| 亚洲视频免费一区| 欧美日韩免费不卡视频一区二区三区| 国产精品国产三级国产专播品爱网| 捆绑变态av一区二区三区 | av亚洲产国偷v产偷v自拍| 国产夫妻性生活视频| 亚洲男人第一av| 91浏览器在线观看| 久久久www成人免费毛片| 91丝袜在线观看| 91人妻一区二区三区| 欧美性猛交xxxx乱大交91| 一区二区高清视频| www 成人av com| 久久免费成人精品视频| 色婷婷精品大视频在线蜜桃视频| 日韩一区在线免费观看| av激情综合网| 欧美久久久一区| 岛国视频一区免费观看| 日本aa在线观看| 四虎884aa成人精品| 888奇米影视| 亚洲一区二区三区高清视频| 精品国精品国产自在久不卡| 中文字幕制服诱惑| 国产三级小视频| 亚洲 精品 综合 精品 自拍| 亚洲aaa在线观看| 成人羞羞国产免费图片| 极品少妇xxxx精品少妇偷拍| 国产精品一区二区黑丝| www.一区二区| 99精品视频一区| 欧美日韩国产影院| 欧美日产国产精品| 日韩av影视在线| 久久精品中文字幕一区| 日韩免费观看高清| 久久99精品久久久久久水蜜桃| 中文字幕日韩一区二区三区不卡| 国产原创中文在线观看| 成年网站免费在线观看| av不卡中文字幕| 一区二区国产欧美| 波多野结衣在线观看一区| 国产农村老头老太视频| 粉嫩小泬无遮挡久久久久久| 日韩不卡视频在线| 日日夜夜免费精品| 亚洲精品ww久久久久久p站| 欧美又大粗又爽又黄大片视频| 人妻无码视频一区二区三区 | 亚洲成人av电影| 视频在线观看一区二区| 男人插女人下面免费视频| 爱爱免费小视频| 日韩毛片一区二区三区| 免费高清成人在线| 一级精品视频在线观看宜春院| 91精品国产综合久久福利| 欧美黄色片视频| 国产一区在线免费| 四季av一区二区三区| 99re6热在线精品视频| 国产美女裸体无遮挡免费视频| 国产一区免费电影| 91国偷自产一区二区三区观看| 亚洲精品中文字| 99精品国产一区二区| 国内外成人激情视频| 手机在线免费看片| 蜜桃精品在线观看| 婷婷综合另类小说色区| 久久精品99久久香蕉国产色戒| 久久国产精品一区二区三区四区 | 亚洲色图欧美偷拍| 精品国内片67194| 国产精品露脸av在线| 蜜桃成人在线| 性一交一黄一片| 五月婷婷六月丁香综合| www.精品av.com| 一级视频在线播放| 日韩视频免费观看| 亚洲久久久久久久| 国产精品久久毛片| 亚洲字幕在线观看| 中文字幕日产av| 日韩欧美高清在线| 国产精品第一页在线| 91色国产在线| 亚洲国产日韩在线观看| 国产欧美精品一区二区三区四区 | 人人妻人人澡人人爽久久av| 亚洲线精品一区二区三区 | 极品人妻videosss人妻| 久久精品久久久精品美女| 精品剧情在线观看| 欧美成人一区二区在线| 亚洲av毛片基地| 久久亚洲精品国产精品紫薇| 中文字幕久久久av一区| 色一情一区二区三区四区 | 伊人婷婷欧美激情| 国产精品亚洲欧美导航| 久草视频在线资源站| 亚洲蜜臀av乱码久久精品蜜桃| 国产精品视频免费观看| 美女又爽又黄视频毛茸茸| 日本亚洲视频在线| 欧美高清性hdvideosex| 一区二区在线观| 蜜臀av性久久久久蜜臀av麻豆| 欧美亚洲丝袜| 欧美三级电影精品| 天堂在线观看视频| 色婷婷综合在线观看| 欧美亚洲午夜视频在线观看 | 亚洲第一中文字幕| 色婷婷av一区二区三| 成熟了的熟妇毛茸茸| 国产高清在线免费| 日韩午夜中文字幕| 国产一区亚洲二区三区| 夜夜爽妓女8888视频免费观看| 日本韩国精品一区二区在线观看| 大伊香蕉精品视频在线| 久久99久久99| 国产精品久久久久久久一区探花| 精品在线视频免费观看| 69p69国产精品| 亚洲欧美日韩精品一区| 久久久久久久久久久电影| 久久av免费一区| 99热这里只有精品5| 久久精品国产精品亚洲| 日韩黄色中文字幕| 欧美精品tushy高清| 欧美成人免费高清视频| 国产人成一区二区三区影院| 国产一区二区三区无遮挡 | 欧美一区三区三区高中清蜜桃| 天堂av网手机版| 色yeye香蕉凹凸一区二区av| a毛片毛片av永久免费| 欧美在线免费播放| 久久久老熟女一区二区三区91| 亚洲国产精品国自产拍av| 亚洲一区二区少妇| 亚洲一级片免费看| 色综合视频一区中文字幕| 亚洲国产精品国自产拍久久| 大陆av在线播放| 国产做受高潮69| 99国产欧美久久久精品| 亚洲欧美一区二区三区四区五区| 国产一区二区三区四区hd| 一区二区免费在线| 亚洲一区中文字幕永久在线| 99精品视频网站| 欧美精品第一页| 日本中文字幕观看| 色一区在线观看| 国产亚洲无码精品| 日韩风俗一区 二区| 国产大学生自拍| 萌白酱国产一区二区| 国产高清在线观看视频| 91中文精品字幕在线视频| 裸体在线国模精品偷拍| 久久精品人成| 午夜精品免费在线观看| 不卡的日韩av| 亚洲少妇一区二区| 亚洲影院在线看| 69av一区二区三区| 免费观看一级特黄欧美大片| 少妇精品一区二区| 国产精品一区=区| 亚洲欧美日韩国产手机在线| 男人天堂中文字幕| 81精品国产乱码久久久久久| 高h调教冰块play男男双性文| 97人人模人人爽人人少妇| 99久久精品久久久久久清纯| 成人在线免费观看av| 欧美性感一区二区三区| 国产精品白嫩白嫩大学美女|