人工智能巨頭 OpenAI 最近終于推出了萬眾期待的新一代旗艦模型 GPT-5。

在發布會上,CEO 山姆奧特曼用一個頗具戲劇性的比喻來形容它的躍升:“GPT-3 像高中生,偶爾有靈光卻缺乏穩定;GPT-4 像大學生,兼具智能與實用;而 GPT-5,則像是與一位博士級專家對話。”

他還自嘲“在 GPT-5 面前一無是處”,吊足了全球用戶的胃口。這場等待了兩年半的升級,“千呼萬喚始出來”。
說起來,GPT-5 的誕生并不容易。背后經歷了長達一年的艱難研發,核心團隊還被高薪挖角,算力開銷大得驚人。

OpenAI 這一路真是走得既焦慮又艱辛。現在,終于把這個“統一系統”搬上了臺面,大家都在等它能帶來什么新花樣。
概括來說,GPT5 最大的變化就是從一個“聊天機器人”進化成了一個真正能干活的“全能助理”。
首先,多模態開掛讓這個新助理的“腦子”變好使了。過去你跟它說話、發圖都得分開來,現在是“聽說讀寫看”一把抓,你丟給它什么它都能立刻理解。
更關鍵的是,它學會了“動手”。以前的 GPT 只能給你出主意,現在的 GPT-5 能直接連接你的其他軟件,幫你操作Office、在開發工具里寫代碼,甚至處理工作流程。

為了讓這個助理不那么呆板,OpenAI 還給它預設了不同的“人格”,你可以隨時把它切換成毒舌的、嚴謹的或者善解人意的模式。

自從 DeepSeek 開創了“Think 模式”之后,讓大模型在回答前先“想一想”似乎成了行業標配,各家都推出了類似的功能。
但 GPT-5 有點不一樣,它把這個過程變得更直接了。
你不需要去特意尋找或點擊某個按鈕,只要在提問時加上一句“認真思考”,系統就會自動為你切換到那個更擅長深度分析的 gpt-5-thinking 模式,用更強的“腦力”來解決你的問題。

接著就是 GPT 傳統保留節目:屠榜。OpenAI 甩出了 25 個榜單,密密麻麻的圖表告訴你 GPT-5 在各個維度有多牛。

事實性幻覺大幅減少,比 GPT-4o 少了 44%,比 o3 少了 78%,基本上是不胡說八道了。

數學競賽直接干到了滿分,現實世界編程能力新高,人類知識測試新高,多模態能力新高……反正就是新高,新高,全是新高。

發布會一結束,全球的網紅和博主們就第一時間沖了進去,開始對 GPT-5 進行五花八門的“極限施壓”測試。

其中,50 萬 粉絲的油管主 Matthew Berman 搞了個大的,他用一個 25 分鐘的視頻,密集展示了 GPT-5 近 30 個堪稱變態的任務。

比如,讓 GPT-5 寫了個程序,能瞬間生成、打亂甚至復原一個復雜的 20 階魔方。

更狠的是,它直接在網頁里復刻出了 Word 和 Excel 的完整應用。注意,是能用的那個軟件,而不是給你畫個表格那么簡單。

從經典的“生命游戲”3D版,到可以隨便調節重力、空氣阻力的流體動力學模擬器,GPT-5還真如奧特曼之前比喻的“博士生水平”。

然而,就在開發者們為之狂歡時,另一邊的畫風卻完全不同。
資本市場最先用腳投票,發布當天概念股普遍回調,顯然沒被這個“博士生”徹底打動。

畢竟,大家等了兩年半,期待的是一場石破天驚的革命,結果只等到了一次意料之中的常規升級,失望在所難免。
更何況,如今的 AI 競賽早已進入了殘酷的“春秋戰國”時代,各路諸侯的技術差距正在飛速縮小,OpenAI 再想靠常規操作就甩開對手幾個身位,已經難上加難。

在這片喧囂中,OpenAI 的老冤家馬斯克更是第一個站出來唱反調,直接甩出成績單,表示 GPT-5 還不如他家的 Grok 4。

不僅資本和對手不買賬,普通網友的吐槽聲也越來越大。
大家最直觀的感受是,GPT-5 的“智商”好像是高了,但“情商”卻下降了。
很多人反映,現在用它寫文案、寫話術,感覺文字變得生硬、機械,沒了以前那種靈動和自然。

有網友一針見血地調侃:“情緒和邏輯就像蹺蹺板,你把邏輯這頭死死按住,情感那頭可不就彈飛了嗎?”
難怪不少網友擔心自己最順手的 GPT-4.5 會就此消失,不過很快就有熱心網友發現,設置里其實有個開關,過去的模型還是可以切換回來的。

這種感覺,讓很多人覺得 AI 似乎真的進入了瓶頸期。

而爭議最大的,還是官方每次都吹得最響的編程能力。
很多人第一反應還是:“感覺不如 Claude 好用啊?” 這種“奧特曼式營銷”宣傳時天花亂墜,實際用起來卻有落差,讓不少人對榜單上的“新高”打了好幾個問號。
不過也有網友反饋開發一個粵語學習應用,讓幾家大模型都試了試,結果 Claude 和 Gemini 在生成 UI 和精準修改代碼時都或多或少出了問題,只有 GPT-5 穩穩地完成了任務,效果還出奇地好。

說到底,GPT-5 給人的感覺,就像一個嚴重偏科的天才:它的文科一塌糊涂,寫不出有溫度的文字;但它的理科,尤其是在需要嚴密邏輯和復雜工程能力的領域,還是十分抗打。
老狐覺得網友的這句話就概括得恰如其分:只是沒有預期那么好……但仍舊是當前最能打的大模型。
參考資料:
數字生命卡茲克、量子位、財聯社、新智能
編輯:不吃麥芽糖





京公網安備 11011402013531號