GPT-5來了！馬斯克：我不服

IP屬地中國·北京 編輯：王婷科技狐 時間：2025-08-10 12:07:25

人工智能巨頭 OpenAI 最近終于推出了萬眾期待的新一代旗艦模型 GPT-5。
在發布會上，CEO 山姆奧特曼用一個頗具戲劇性的比喻來形容它的躍升：“GPT-3 像高中生，偶爾有靈光卻缺乏穩定；GPT-4 像大學生，兼具智能與實用；而 GPT-5，則像是與一位博士級專家對話。”
他還自嘲“在 GPT-5 面前一無是處”，吊足了全球用戶的胃口。這場等待了兩年半的升級，“千呼萬喚始出來”。
說起來，GPT-5 的誕生并不容易。背后經歷了長達一年的艱難研發，核心團隊還被高薪挖角，算力開銷大得驚人。
OpenAI 這一路真是走得既焦慮又艱辛。現在，終于把這個“統一系統”搬上了臺面，大家都在等它能帶來什么新花樣。
概括來說，GPT5 最大的變化就是從一個“聊天機器人”進化成了一個真正能干活的“全能助理”。
首先，多模態開掛讓這個新助理的“腦子”變好使了。過去你跟它說話、發圖都得分開來，現在是“聽說讀寫看”一把抓，你丟給它什么它都能立刻理解。
更關鍵的是，它學會了“動手”。以前的 GPT 只能給你出主意，現在的 GPT-5 能直接連接你的其他軟件，幫你操作Office、在開發工具里寫代碼，甚至處理工作流程。
為了讓這個助理不那么呆板，OpenAI 還給它預設了不同的“人格”，你可以隨時把它切換成毒舌的、嚴謹的或者善解人意的模式。
自從 DeepSeek 開創了“Think 模式”之后，讓大模型在回答前先“想一想”似乎成了行業標配，各家都推出了類似的功能。
但 GPT-5 有點不一樣，它把這個過程變得更直接了。
你不需要去特意尋找或點擊某個按鈕，只要在提問時加上一句“認真思考”，系統就會自動為你切換到那個更擅長深度分析的 gpt-5-thinking 模式，用更強的“腦力”來解決你的問題。
接著就是 GPT 傳統保留節目：屠榜。OpenAI 甩出了 25 個榜單，密密麻麻的圖表告訴你 GPT-5 在各個維度有多牛。
事實性幻覺大幅減少，比 GPT-4o 少了 44%，比 o3 少了 78%，基本上是不胡說八道了。
數學競賽直接干到了滿分，現實世界編程能力新高，人類知識測試新高，多模態能力新高……反正就是新高，新高，全是新高。
發布會一結束，全球的網紅和博主們就第一時間沖了進去，開始對 GPT-5 進行五花八門的“極限施壓”測試。
其中，50 萬粉絲的油管主 Matthew Berman 搞了個大的，他用一個 25 分鐘的視頻，密集展示了 GPT-5 近 30 個堪稱變態的任務。
比如，讓 GPT-5 寫了個程序，能瞬間生成、打亂甚至復原一個復雜的 20 階魔方。
更狠的是，它直接在網頁里復刻出了 Word 和 Excel 的完整應用。注意，是能用的那個軟件，而不是給你畫個表格那么簡單。
從經典的“生命游戲”3D版，到可以隨便調節重力、空氣阻力的流體動力學模擬器，GPT-5還真如奧特曼之前比喻的“博士生水平”。
然而，就在開發者們為之狂歡時，另一邊的畫風卻完全不同。
資本市場最先用腳投票，發布當天概念股普遍回調，顯然沒被這個“博士生”徹底打動。
畢竟，大家等了兩年半，期待的是一場石破天驚的革命，結果只等到了一次意料之中的常規升級，失望在所難免。
更何況，如今的 AI 競賽早已進入了殘酷的“春秋戰國”時代，各路諸侯的技術差距正在飛速縮小，OpenAI 再想靠常規操作就甩開對手幾個身位，已經難上加難。
在這片喧囂中，OpenAI 的老冤家馬斯克更是第一個站出來唱反調，直接甩出成績單，表示 GPT-5 還不如他家的 Grok 4。
不僅資本和對手不買賬，普通網友的吐槽聲也越來越大。
大家最直觀的感受是，GPT-5 的“智商”好像是高了，但“情商”卻下降了。
很多人反映，現在用它寫文案、寫話術，感覺文字變得生硬、機械，沒了以前那種靈動和自然。
有網友一針見血地調侃：“情緒和邏輯就像蹺蹺板，你把邏輯這頭死死按住，情感那頭可不就彈飛了嗎？”
難怪不少網友擔心自己最順手的 GPT-4.5 會就此消失，不過很快就有熱心網友發現，設置里其實有個開關，過去的模型還是可以切換回來的。
這種感覺，讓很多人覺得 AI 似乎真的進入了瓶頸期。
而爭議最大的，還是官方每次都吹得最響的編程能力。
很多人第一反應還是：“感覺不如 Claude 好用啊？” 這種“奧特曼式營銷”宣傳時天花亂墜，實際用起來卻有落差，讓不少人對榜單上的“新高”打了好幾個問號。
不過也有網友反饋開發一個粵語學習應用，讓幾家大模型都試了試，結果 Claude 和 Gemini 在生成 UI 和精準修改代碼時都或多或少出了問題，只有 GPT-5 穩穩地完成了任務，效果還出奇地好。
說到底，GPT-5 給人的感覺，就像一個嚴重偏科的天才：它的文科一塌糊涂，寫不出有溫度的文字；但它的理科，尤其是在需要嚴密邏輯和復雜工程能力的領域，還是十分抗打。
老狐覺得網友的這句話就概括得恰如其分：只是沒有預期那么好……但仍舊是當前最能打的大模型。
參考資料：
數字生命卡茲克、量子位、財聯社、新智能
編輯：不吃麥芽糖

標簽： gpt-5 gpt 新高模型 馬斯克 助理編程代碼模態邏輯

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

全站最新

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

熱門推薦

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

蚌埠滕湖機場完成驗證試飛！

中國新礦物團隊再添一員！“金秀礦”正式命名背后有多難？｜封面專訪

羅永浩吐槽后，上海電信：WIFI速率不達標原因很多

李禮輝：必須加快制度創新，確定金融智能體的法律地位

TikTok美國迎“大結局”：持股19.9%合資方案對TikTok意味著什么？

紫光國微：在商業航天領域，公司的FPGA等系列產品正陸續導入

上海電信回應“WIFI速率不達標”

TikTok內部信“泄密”：被反復討論的“美國協議”，到底發生了什么？

我國科學家實現新一代光計算芯片研究新突破