![]()
OpenAI 的十周歲生日,過得不太體面。
在當(dāng)天發(fā)布的 GPT-5.2 交出了一份完美答卷:它橫掃許多基準(zhǔn)測試的 SOTA,在數(shù)學(xué)和編程等競賽場景中的表現(xiàn)堪稱亮眼,也被官方描述為 AI「超級大腦」。
可到了社交網(wǎng)絡(luò),迎接它的不是掌聲,而是用戶的集體罵街。
![]()
在 X 和 Reddit 上,憤怒與失望幾乎寫在每一條評論里。人們又一次懷念起那個曾經(jīng)的「白月光」GPT-4o:有人說 GPT-5.2 變得平淡、乏味、像被磨平了棱角;也有人譏諷它成了「把成年人當(dāng)幼兒園小孩對待」的說教。
當(dāng)輿論的炮火對準(zhǔn) OpenAI 及其 CEO Sam Altman(山姆·奧特曼),一個尖銳的問題擺在面前:為什么模型更「聰明」了,用戶反而更不愛了?
![]()
更「聰明」的模型,為什么不討喜了
The Information 今天凌晨的最新報道,扒出了內(nèi)幕。
過去一年,OpenAI 內(nèi)部曾奉行一條鐵律:每一次模型的代際飛躍,都會伴隨著用戶量的爆發(fā)式增長,因為「變聰明」帶來的體驗升級是直觀的。但現(xiàn)在,這條鐵律失效了。
當(dāng)然,模型在智能與科研計算領(lǐng)域的提升依舊顯著。研究團(tuán)隊耗費數(shù)月打磨推理能力,讓它能攻克更復(fù)雜的數(shù)學(xué)與科學(xué)難題,但對于大多數(shù)普通用戶而言,這種感知微乎其微。
![]()
▲ https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
換句話說,智能的提升,并不天然等同于體驗的提升。
普通用戶很少需要一臺「競賽級大腦」,他們更多需要一個「日常好用的助手」。OpenAI 對 150 萬次對話的大規(guī)模分析佐證了這一判斷,用戶的核心需求極其接地氣:實用指導(dǎo)(29%)、信息查詢(24%)以及寫作(24%)等,而與編程任務(wù)相關(guān)的對話只有 4.2%。
![]()
于是矛盾就變得非常具體:當(dāng)技術(shù)團(tuán)隊在實驗室里狂卷數(shù)理化、狂卷基準(zhǔn)測試時,用戶在聊天框里只想要一句話解決問題——別繞、別教、別拖。
戰(zhàn)線拉得過長是一大槽點。
今年大部分時間里,奧特曼同時啟動了多個新項目:視頻生成應(yīng)用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設(shè)備、機(jī)器人……攤子越鋪越大,資源也被越分越碎。
這其實是科技巨頭最常見的經(jīng)典錯誤:核心陣地還沒打穩(wěn),就急著開辟第二、第三戰(zhàn)場。短期看是「全面開花」,長期看,貪多嚼不爛,乃兵家大忌——每一條戰(zhàn)線都缺人、缺算力、缺產(chǎn)品打磨的耐心。
![]()
OpenAI 內(nèi)部「研究優(yōu)先」和「產(chǎn)品增長」之間的拉扯,在圖像生成上體現(xiàn)得尤為明顯:
即便 GPT-4o 的吉卜力風(fēng)格在三月還短暫帶動過 ChatGPT 的使用與用戶增長,但 OpenAI 還是一度把圖像模型的開發(fā)優(yōu)先級往后放,等到 Nano Banana 口碑發(fā)酵后,OpenAI 又緊急回頭補課,內(nèi)部也因此爆發(fā)分歧——
奧特曼認(rèn)定圖像模型是用戶增長的抓手,研究主管 Mark Chen 則更想把資源押在別的項目上。
另外,伴隨著 Scaling Laws 邊際效益遞減,為了突破大模型的瓶頸,OpenAI 過去一年里押注了推理模型,超過 1000 人的研究團(tuán)隊將資源傾斜于此,導(dǎo)致對 ChatGPT 日常體驗的優(yōu)化被邊緣化。
![]()
這種做法不僅分散了資源,甚至在年初的內(nèi)測中出現(xiàn)了性能倒退——為了適配「聊天」場景,反而削弱了推理模型的純粹性。雖然后來推出了「思考模式」和「深度研究」來分流、來補救,但用戶使用率卻很低,真正的日常對話體驗并沒有因此變得更討喜。
除此之外,新舊模型之間也常出現(xiàn)兼容問題。
例如在發(fā)布 GPT-5 前,研究人員發(fā)現(xiàn)模型在集成進(jìn) ChatGPT 后在部分編程任務(wù)上表現(xiàn)變差——因為系統(tǒng)根據(jù)用戶職業(yè)等個性化信息調(diào)整回答,結(jié)果反而干擾了模型理解,導(dǎo)致錯誤答案。
誠然,推理模型越來越強(qiáng),但 ChatGPT 體驗越來越拉胯。
![]()
當(dāng)技術(shù)進(jìn)步的方向和用戶需求的方向開始分叉,誰會先妥協(xié)?答案顯而易見。
Gemini 3 Pro 的強(qiáng)勢發(fā)布,最終把 OpenAI 逼到了墻角,于是便有了奧特曼發(fā)布「紅色警報」的經(jīng)典名場面,要求 OpenAI 員工重新聚焦 ChatGPT,提高產(chǎn)品體驗吸引力。
而在同一時間,OpenAI 應(yīng)用負(fù)責(zé)人 Fidji Simo 也在個人博客中闡述 ChatGPT 的愿景,那就是從主要以文本為主的對話系統(tǒng),轉(zhuǎn)向能根據(jù)用戶意圖動態(tài)生成界面的全生成式 UI。
只是 Simo 也曾承認(rèn),公司本質(zhì)仍以研究為中心,「產(chǎn)品本身并不是最終目標(biāo)」。
![]()
從商業(yè)邏輯看,這句話其實很危險。
不同于 Anthropic 更偏向主攻 API 市場,OpenAI 的大頭收入來自個人訂閱。在消費市場,沒有人會為企業(yè)的「終極理想」買單,用戶只愿為當(dāng)下的體驗付費。這就好比餐廳大廚醉心于研發(fā)米其林料理,而大堂里的食客僅僅想要一碗熱氣騰騰的陽春面。
不過,如果你因此就斷言 OpenAI 內(nèi)部已經(jīng)亂了陣腳,那可能低估了這家公司的韌性。
據(jù)彭博社援引 Mark Chen 的說法,「紅色警報」并非新鮮事,而更像是一種戰(zhàn)時狀態(tài)的常態(tài)化管理工具。每當(dāng) OpenAI 需要集中火力攻克某一單一目標(biāo),或要求團(tuán)隊放下低優(yōu)先級任務(wù)時,這種機(jī)制就會啟動。
![]()
▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940
奧特曼在最新的播客中,同樣否認(rèn)了拉響紅色警報帶來的過度焦慮。
「首先,所謂的『紅色警報』,在我們看來其實是一種低風(fēng)險、但非常必要的應(yīng)對措施。」奧特曼坦言,「在潛在的競爭威脅出現(xiàn)時,保持一點『偏執(zhí)』、并迅速做出反應(yīng),是件好事。」
他甚至提到了今年年初 DeepSeek 的崛起,認(rèn)為那和現(xiàn)在的 Gemini 3 一樣,都是一種良性的外部刺激。
「Gemini 3 到目前為止,還沒帶來我們原本擔(dān)心的那種毀滅性沖擊。雖然它和 DeepSeek 一樣,精準(zhǔn)地刺痛了我們在產(chǎn)品策略上的軟肋,但也倒逼我們做出了極其迅速的調(diào)整。」
![]()
在奧特曼看來,這種緊急狀態(tài)通常只會持續(xù)六到八周。「我很高興我們有這種快速反應(yīng)機(jī)制,我們不會在這個狀態(tài)里待太久。」
OpenAI 顯然也明白光喊口號不夠,他們今天也正式發(fā)布了 GPT-5.2-Codex。
![]()
作為專為解決復(fù)雜現(xiàn)實軟件工程問題而生的智能體編程模型,GPT-5.2-Codex 在通用智能的基礎(chǔ)上,融合了 GPT-5.1-Codex-Max 的終端操作能力,更擅長處理代碼重構(gòu)、遷移等長程任務(wù)。
而同樣是在播客的尾聲,當(dāng)主持人詢問「GPT-6 還要等多久?」時,奧特曼敞亮地表示:「我不知道我們什么時候會正式把某個模型命名為 GPT-6,但我預(yù)計在明年第一季度,會有比 5.2 有顯著提升的新模型發(fā)布。」
拉響「紅色警報」,到 GPT-5.2 系列的反擊,再到 GPT-6 的曖昧預(yù)告,OpenAI 試圖用新模型與新節(jié)奏重建信心,但決定長期勝負(fù)的,仍是分發(fā)入口、生態(tài)協(xié)同與算力成本等硬門檻。
Google 的陽謀,與奧特曼的 8300 億「空城計」
Google 的優(yōu)勢,從來不只在 Gemini 3 Pro 這一個模型上,更在于它幾乎無可匹敵的分發(fā)渠道。
搜索、Chrome、辦公套件。在 AI 賽道,護(hù)城河可能是所有科技產(chǎn)品中最淺的。 用戶的遷移成本幾乎為零,當(dāng) Google 的 AI 產(chǎn)品如空氣般無處不在,這幾乎成了一場無解的陽謀——你不需要「被說服」,你只會「順手就用」。
更重要的是,在與 Google 的較量中,硬件層面的短板成了 OpenAI 最大的軟肋。
相比于 Google 十二年前就開始布局專用 AI 芯片(TPU)所建立的效率優(yōu)勢,OpenAI 每年仍需花費數(shù)十億美元租用算力。即便試圖通過自建數(shù)據(jù)中心和芯片來「補課」,但體驗在被追平、成本在被碾壓的現(xiàn)狀已是不爭的事實。
![]()
用網(wǎng)友的話來說:
OpenAI 現(xiàn)在并不需要一個更強(qiáng)大的模型,它需要的是 AMD。如果 OpenAI 收購了 AMD,這場 AI 之戰(zhàn)就將宣告結(jié)束。Google 之所以不怕 OpenAI,是因為它擁有自家的 TPU。但它真正該擔(dān)心的,是 OpenAI 擁有 AMD。
OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言,由于算力捉襟見肘,每當(dāng)新功能上線(如年初 GPT-4o 吉卜力風(fēng)格),就必須從研究部門「抽血」,把算力挪給產(chǎn)品部。這是一種飲鴆止渴的循環(huán)——為了維持今天的用戶體驗,被迫推遲了明日的技術(shù)研發(fā)。
可算力這東西,歸根到底就是兩個字:燒錢。而且是海量地?zé)X。
為此,據(jù) WSJ 報道,OpenAI 已計劃發(fā)起 1000 億美元的巨額融資;若一切順利,這家超級獨角獸將在明年 Q1 之前,以 8300 億美元的估值,再次刷新資本市場的想象力。
![]()
而在今年早些時候,軟銀同意向 OpenAI 投資 300 億美元,并于上月出售所持的英偉達(dá)股份價值 58 億美元,為這筆投資籌資,并預(yù)計盡快完成剩余 225 億美元的出資。
但錢的問題沒那么簡單。預(yù)計到 2030 年,OpenAI 的現(xiàn)金消耗將超過 2000 億美元。相比之下,Google 財務(wù)穩(wěn)健,甚至能通過 Oracle 等合作伙伴的股價波動間接擠壓 OpenAI 的融資前景。
到處籌錢的 OpenAI,看起來更像是在和時間賽跑。于是便誕生了那個笑話:照奧特曼的融資能力,沒準(zhǔn)哪天連 Google 和英偉達(dá)都能「打包帶走」。
![]()
但玩笑歸玩笑,錢能買來時間,卻買不來口碑。
所以在 2025 年這個冬天,狂奔三年的 OpenAI 選擇先踩一腳剎車,其實是對的:收攏戰(zhàn)線、回撤資源,把方向重新對準(zhǔn) ChatGPT 的日常體驗。
這是一次昂貴但必要的糾偏。
技術(shù)領(lǐng)先不等于產(chǎn)品好用,基準(zhǔn)測試第一不等于用戶滿意。更重要的是,你不能只在用戶懷念舊版本的時候,才想起來問問他們的感受。





京公網(wǎng)安備 11011402013531號