當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

GPT-5.2 翻車內(nèi)幕曝光：技術(shù)團(tuán)隊沒走「歪路」，但用戶成了大冤種

IP屬地中國·北京 愛范兒 時間：2025-12-19 18:16:24

OpenAI 的十周歲生日，過得不太體面。
在當(dāng)天發(fā)布的 GPT-5.2 交出了一份完美答卷：它橫掃許多基準(zhǔn)測試的 SOTA，在數(shù)學(xué)和編程等競賽場景中的表現(xiàn)堪稱亮眼，也被官方描述為 AI「超級大腦」。
可到了社交網(wǎng)絡(luò)，迎接它的不是掌聲，而是用戶的集體罵街。

在 X 和 Reddit 上，憤怒與失望幾乎寫在每一條評論里。人們又一次懷念起那個曾經(jīng)的「白月光」GPT-4o：有人說 GPT-5.2 變得平淡、乏味、像被磨平了棱角；也有人譏諷它成了「把成年人當(dāng)幼兒園小孩對待」的說教。
當(dāng)輿論的炮火對準(zhǔn) OpenAI 及其 CEO Sam Altman（山姆·奧特曼），一個尖銳的問題擺在面前：為什么模型更「聰明」了，用戶反而更不愛了？

更「聰明」的模型，為什么不討喜了
The Information 今天凌晨的最新報道，扒出了內(nèi)幕。
過去一年，OpenAI 內(nèi)部曾奉行一條鐵律：每一次模型的代際飛躍，都會伴隨著用戶量的爆發(fā)式增長，因為「變聰明」帶來的體驗升級是直觀的。但現(xiàn)在，這條鐵律失效了。
當(dāng)然，模型在智能與科研計算領(lǐng)域的提升依舊顯著。研究團(tuán)隊耗費數(shù)月打磨推理能力，讓它能攻克更復(fù)雜的數(shù)學(xué)與科學(xué)難題，但對于大多數(shù)普通用戶而言，這種感知微乎其微。

▲ https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
換句話說，智能的提升，并不天然等同于體驗的提升。
普通用戶很少需要一臺「競賽級大腦」，他們更多需要一個「日常好用的助手」。OpenAI 對 150 萬次對話的大規(guī)模分析佐證了這一判斷，用戶的核心需求極其接地氣：實用指導(dǎo)（29%）、信息查詢（24%）以及寫作（24%）等，而與編程任務(wù)相關(guān)的對話只有 4.2%。

于是矛盾就變得非常具體：當(dāng)技術(shù)團(tuán)隊在實驗室里狂卷數(shù)理化、狂卷基準(zhǔn)測試時，用戶在聊天框里只想要一句話解決問題——別繞、別教、別拖。
戰(zhàn)線拉得過長是一大槽點。
今年大部分時間里，奧特曼同時啟動了多個新項目：視頻生成應(yīng)用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設(shè)備、機(jī)器人……攤子越鋪越大，資源也被越分越碎。
這其實是科技巨頭最常見的經(jīng)典錯誤：核心陣地還沒打穩(wěn)，就急著開辟第二、第三戰(zhàn)場。短期看是「全面開花」，長期看，貪多嚼不爛，乃兵家大忌——每一條戰(zhàn)線都缺人、缺算力、缺產(chǎn)品打磨的耐心。

OpenAI 內(nèi)部「研究優(yōu)先」和「產(chǎn)品增長」之間的拉扯，在圖像生成上體現(xiàn)得尤為明顯：
即便 GPT-4o 的吉卜力風(fēng)格在三月還短暫帶動過 ChatGPT 的使用與用戶增長，但 OpenAI 還是一度把圖像模型的開發(fā)優(yōu)先級往后放，等到 Nano Banana 口碑發(fā)酵后，OpenAI 又緊急回頭補課，內(nèi)部也因此爆發(fā)分歧——
奧特曼認(rèn)定圖像模型是用戶增長的抓手，研究主管 Mark Chen 則更想把資源押在別的項目上。
另外，伴隨著 Scaling Laws 邊際效益遞減，為了突破大模型的瓶頸，OpenAI 過去一年里押注了推理模型，超過 1000 人的研究團(tuán)隊將資源傾斜于此，導(dǎo)致對 ChatGPT 日常體驗的優(yōu)化被邊緣化。

這種做法不僅分散了資源，甚至在年初的內(nèi)測中出現(xiàn)了性能倒退——為了適配「聊天」場景，反而削弱了推理模型的純粹性。雖然后來推出了「思考模式」和「深度研究」來分流、來補救，但用戶使用率卻很低，真正的日常對話體驗并沒有因此變得更討喜。
除此之外，新舊模型之間也常出現(xiàn)兼容問題。
例如在發(fā)布 GPT-5 前，研究人員發(fā)現(xiàn)模型在集成進(jìn) ChatGPT 后在部分編程任務(wù)上表現(xiàn)變差——因為系統(tǒng)根據(jù)用戶職業(yè)等個性化信息調(diào)整回答，結(jié)果反而干擾了模型理解，導(dǎo)致錯誤答案。
誠然，推理模型越來越強(qiáng)，但 ChatGPT 體驗越來越拉胯。

當(dāng)技術(shù)進(jìn)步的方向和用戶需求的方向開始分叉，誰會先妥協(xié)？答案顯而易見。
Gemini 3 Pro 的強(qiáng)勢發(fā)布，最終把 OpenAI 逼到了墻角，于是便有了奧特曼發(fā)布「紅色警報」的經(jīng)典名場面，要求 OpenAI 員工重新聚焦 ChatGPT，提高產(chǎn)品體驗吸引力。
而在同一時間，OpenAI 應(yīng)用負(fù)責(zé)人 Fidji Simo 也在個人博客中闡述 ChatGPT 的愿景，那就是從主要以文本為主的對話系統(tǒng)，轉(zhuǎn)向能根據(jù)用戶意圖動態(tài)生成界面的全生成式 UI。
只是 Simo 也曾承認(rèn)，公司本質(zhì)仍以研究為中心，「產(chǎn)品本身并不是最終目標(biāo)」。

從商業(yè)邏輯看，這句話其實很危險。
不同于 Anthropic 更偏向主攻 API 市場，OpenAI 的大頭收入來自個人訂閱。在消費市場，沒有人會為企業(yè)的「終極理想」買單，用戶只愿為當(dāng)下的體驗付費。這就好比餐廳大廚醉心于研發(fā)米其林料理，而大堂里的食客僅僅想要一碗熱氣騰騰的陽春面。
不過，如果你因此就斷言 OpenAI 內(nèi)部已經(jīng)亂了陣腳，那可能低估了這家公司的韌性。
據(jù)彭博社援引 Mark Chen 的說法，「紅色警報」并非新鮮事，而更像是一種戰(zhàn)時狀態(tài)的常態(tài)化管理工具。每當(dāng) OpenAI 需要集中火力攻克某一單一目標(biāo)，或要求團(tuán)隊放下低優(yōu)先級任務(wù)時，這種機(jī)制就會啟動。

▲播客地址：https://x.com/Kantrowitz/status/2001790090641645940
奧特曼在最新的播客中，同樣否認(rèn)了拉響紅色警報帶來的過度焦慮。
「首先，所謂的『紅色警報』，在我們看來其實是一種低風(fēng)險、但非常必要的應(yīng)對措施。」奧特曼坦言，「在潛在的競爭威脅出現(xiàn)時，保持一點『偏執(zhí)』、并迅速做出反應(yīng)，是件好事。」
他甚至提到了今年年初 DeepSeek 的崛起，認(rèn)為那和現(xiàn)在的 Gemini 3 一樣，都是一種良性的外部刺激。
「Gemini 3 到目前為止，還沒帶來我們原本擔(dān)心的那種毀滅性沖擊。雖然它和 DeepSeek 一樣，精準(zhǔn)地刺痛了我們在產(chǎn)品策略上的軟肋，但也倒逼我們做出了極其迅速的調(diào)整。」

在奧特曼看來，這種緊急狀態(tài)通常只會持續(xù)六到八周。「我很高興我們有這種快速反應(yīng)機(jī)制，我們不會在這個狀態(tài)里待太久。」
OpenAI 顯然也明白光喊口號不夠，他們今天也正式發(fā)布了 GPT-5.2-Codex。

作為專為解決復(fù)雜現(xiàn)實軟件工程問題而生的智能體編程模型，GPT-5.2-Codex 在通用智能的基礎(chǔ)上，融合了 GPT-5.1-Codex-Max 的終端操作能力，更擅長處理代碼重構(gòu)、遷移等長程任務(wù)。
而同樣是在播客的尾聲，當(dāng)主持人詢問「GPT-6 還要等多久？」時，奧特曼敞亮地表示：「我不知道我們什么時候會正式把某個模型命名為 GPT-6，但我預(yù)計在明年第一季度，會有比 5.2 有顯著提升的新模型發(fā)布。」
拉響「紅色警報」，到 GPT-5.2 系列的反擊，再到 GPT-6 的曖昧預(yù)告，OpenAI 試圖用新模型與新節(jié)奏重建信心，但決定長期勝負(fù)的，仍是分發(fā)入口、生態(tài)協(xié)同與算力成本等硬門檻。
Google 的陽謀，與奧特曼的 8300 億「空城計」
Google 的優(yōu)勢，從來不只在 Gemini 3 Pro 這一個模型上，更在于它幾乎無可匹敵的分發(fā)渠道。
搜索、Chrome、辦公套件。在 AI 賽道，護(hù)城河可能是所有科技產(chǎn)品中最淺的。用戶的遷移成本幾乎為零，當(dāng) Google 的 AI 產(chǎn)品如空氣般無處不在，這幾乎成了一場無解的陽謀——你不需要「被說服」，你只會「順手就用」。
更重要的是，在與 Google 的較量中，硬件層面的短板成了 OpenAI 最大的軟肋。
相比于 Google 十二年前就開始布局專用 AI 芯片（TPU）所建立的效率優(yōu)勢，OpenAI 每年仍需花費數(shù)十億美元租用算力。即便試圖通過自建數(shù)據(jù)中心和芯片來「補課」，但體驗在被追平、成本在被碾壓的現(xiàn)狀已是不爭的事實。

用網(wǎng)友的話來說：
OpenAI 現(xiàn)在并不需要一個更強(qiáng)大的模型，它需要的是 AMD。如果 OpenAI 收購了 AMD，這場 AI 之戰(zhàn)就將宣告結(jié)束。Google 之所以不怕 OpenAI，是因為它擁有自家的 TPU。但它真正該擔(dān)心的，是 OpenAI 擁有 AMD。
OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言，由于算力捉襟見肘，每當(dāng)新功能上線（如年初 GPT-4o 吉卜力風(fēng)格），就必須從研究部門「抽血」，把算力挪給產(chǎn)品部。這是一種飲鴆止渴的循環(huán)——為了維持今天的用戶體驗，被迫推遲了明日的技術(shù)研發(fā)。
可算力這東西，歸根到底就是兩個字：燒錢。而且是海量地?zé)X。
為此，據(jù) WSJ 報道，OpenAI 已計劃發(fā)起 1000 億美元的巨額融資；若一切順利，這家超級獨角獸將在明年 Q1 之前，以 8300 億美元的估值，再次刷新資本市場的想象力。

而在今年早些時候，軟銀同意向 OpenAI 投資 300 億美元，并于上月出售所持的英偉達(dá)股份價值 58 億美元，為這筆投資籌資，并預(yù)計盡快完成剩余 225 億美元的出資。
但錢的問題沒那么簡單。預(yù)計到 2030 年，OpenAI 的現(xiàn)金消耗將超過 2000 億美元。相比之下，Google 財務(wù)穩(wěn)健，甚至能通過 Oracle 等合作伙伴的股價波動間接擠壓 OpenAI 的融資前景。
到處籌錢的 OpenAI，看起來更像是在和時間賽跑。于是便誕生了那個笑話：照奧特曼的融資能力，沒準(zhǔn)哪天連 Google 和英偉達(dá)都能「打包帶走」。

但玩笑歸玩笑，錢能買來時間，卻買不來口碑。
所以在 2025 年這個冬天，狂奔三年的 OpenAI 選擇先踩一腳剎車，其實是對的：收攏戰(zhàn)線、回撤資源，把方向重新對準(zhǔn) ChatGPT 的日常體驗。
這是一次昂貴但必要的糾偏。
技術(shù)領(lǐng)先不等于產(chǎn)品好用，基準(zhǔn)測試第一不等于用戶滿意。更重要的是，你不能只在用戶懷念舊版本的時候，才想起來問問他們的感受。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

不玩“虛”的！硬核兌現(xiàn)！上海元宇宙交出3年實戰(zhàn)答卷→

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰(zhàn)

一加中國區(qū)總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

全站最新

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

不玩“虛”的！硬核兌現(xiàn)！上海元宇宙交出3年實戰(zhàn)答卷→

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰(zhàn)

熱門推薦

豆包視頻生成大升級，網(wǎng)友們的腦洞終于自帶音效了。

阿里辟謠

不玩“虛”的！硬核兌現(xiàn)！上海元宇宙交出3年實戰(zhàn)答卷→

今年創(chuàng)紀(jì)錄！字節(jié)跳動利潤據(jù)稱有望達(dá)500億美元

谷歌云深化與Palo Alto Networks合作，簽署近100億美元AI安全大單

羅永浩投訴上海電信千兆寬帶網(wǎng)速慢！公司稱有多種原因可維修

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰(zhàn)

一加中國區(qū)總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴(kuò)展深色主題”設(shè)置，專治堅守淺色UI的“不聽話”App

國產(chǎn)GPU四小龍IPO齊活！最后一個剛剛公布

蚌埠滕湖機(jī)場完成驗證試飛！

中國新礦物團(tuán)隊再添一員！“金秀礦”正式命名背后有多難？｜封面專訪

羅永浩吐槽后，上海電信：WIFI速率不達(dá)標(biāo)原因很多