西風 明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
全世界等了2年,GPT-5終于正式發布!
面向所有人開放,免費用戶立即可用。
這意味著,所有人現在都能用上“博士生水平的AI”
![]()
在AIME 2025上,GPT-5 Pro在開啟推理模式并調用工具下,拿下滿分成績
![]()
編程方面也較o3有全面提升,并且超越了剛剛發布的Claude-opus-4.1,以0.4%優勢成為編程新王。
![]()
大模型競技場成績同步出爐——迄今為止總分最高分,“當之無愧的全球第一”。
在文本、網頁開發、視覺、復雜提示詞、編程、數學、創造成、長查詢等方面,都是第一名。
全面超越Gemini-2.5-pro、Grok4等一眾競品。
![]()
GPT-5首次集成多模態和推理能力,相當于把GPT系列和o系列大一統。所以不用再切換模型了,同時它會自己判斷何時需要開啟深度思考。
官方原話是:
GPT-5 是一個一體化系統,包含三個核心部分:一個智能高效的基礎模型,可解答大多數問題;一個深度推理模型(即GPT-5思維模塊),用于處理更復雜的難題;以及一個實時路由模塊,能夠基于對話類型、問題復雜度、工具需求及用戶顯式指令(如prompt含“仔細思考這個問題”)智能調度模型。
目前面向普通用戶,GPT-5提供免費、plus和Pro三種模式。
同時在API平臺上,推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。
此次大發布群星璀璨,奧特曼Greg都上陣,1個小時直播里上場十數位研究員。
當然有很多華人面孔,Mark Chen主持了技術發布的部分。
![]()
話不多說,我們來看GPT-5具體情況。
最聰明、最強編程大模型
首先來看各項基準測試成績。
網頁開發中,GPT-5創造新紀錄,超越Gemini-2.5-pro和Claude-Opus-4。
![]()
文本領域也全面領先,包括編程、復雜提示和創造性等維度。
![]()
Agent任務同樣表現出色:
![]()
長上下文任務上,GPT-5更是斷崖式領先。
![]()
同時在可靠性和精準性上,GPT-5的提升也相當明顯。
![]()
更直觀的效果來看現場demo展示。先來看其推理模型的一面:
GPT-5能夠自適應推理,會根據問題的復雜程度,自動啟用深度思考功能。
比如,一個中學生上物理課,想了解什么是伯努利效應以及飛機為何被設計成現在的形狀。
GPT-5不假思索,迅速給出了一段結構清晰、概念準確的高質量講解:

當進一步要求它生成一個動態SVG動畫演示時,GPT-5進入深度思考模式。此時,用戶可以點開查看其內部推理過程,清楚知道每一步是如何形成的。
約兩分鐘,它完成了近400行代碼的編寫:

最終生成一個可交互的動畫展示,形象地模擬原理:

在寫作方面,GPT-5相比前代也有明顯提升,它不再局限于模版化的表達,而是能夠根據上下文生成富有個性與情緒的表達,智商、情商雙高
直播演示中,OpenAI研究員要求GPT-4o、GPT-5同時為GPT系列舊模型寫一篇“悼詞”。
GPT-4o還停留在一些模板化、泛情緒的籠統表達:
你們的話語傳遍全球,在原本毫無關聯之處建立起了聯系。

而GPT-5具體問題具體分析,更加個性化:
這些模型幫助數百萬人寫出開篇與結尾、跨越語言障礙、通過考試、更好地辯論、讓電子郵件語氣更溫和,還能表達出他們獨自難以說清的內容。

具體來看編程能力,GPT-5更是OpenAI“有史以來最強”。
在展示中,研究員讓GPT-5構建一個“學法語”的APP,允許自定義詞匯、修改界面設計。
成品功能很成熟,答對題目還會積累經驗值,甚至有標準發音可以跟著練習:

要求在其中套一個貪吃蛇游戲,每吃掉一個物品就學一個單詞,再要求把蛇替換成老鼠,蘋果換成奶酪……GPT-5依然輕松應對:

不僅是簡單的demo展示,實際應用中,在Cursor里GPT-5能夠完成極為復雜的軟件工程任務,奧特曼更是直接稱其超過了“vibe coding”的范疇

比如將某公司大量數據給它,模型在5分鐘內就能創建了一個可視化財務儀表盤,據開發人員估計,這項工作原本需要好幾個小時。

想制作一款融入城堡元素的3D游戲,也就是分分鐘的事兒,GPT-5的效果be like:

再來看多模態方面,GPT-5較GPT-4o有了進一步升級。
在語音對話方面,現在不僅可以讓GPT-5充當外語老師,還能定制語音、讓GPT-5根據你的需求來靈活教學,比如調整語速。
目前該能力已向所有用戶開放,免費用戶可以體驗幾小時,plus用戶幾乎無限制。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/ktVhcQ2gjbUMh5zX260ynA
個性化方面,現在可以自定義ChatGPT的對話氣泡顏色,沒用的小功能又增加了。
同時也能根據你的喜好來定制GPT-5的個性。
記憶能力也進一步提升,支持鏈接外部服務,比如Gmail、谷歌日歷等。看到日程后GPT-5可以自動進行一些助理級工作,比如發現未回復的郵件等。

安全方面,引入了一種全新的范式:safe completions
GPT-5看到用戶提示詞后再判斷是否執行,同樣的提示在不同語境下,GPT-5可能有不同的執行結果。
比如要求模型提供點燃氫氣的技術細節,之前o3會直接拒絕回答:
![]()
而GPT-5會分析用戶意圖,然后告訴用戶遵循標準與法規需要獲得哪些許可:
![]()
GPT-5發布前夕發百萬獎金
最后來看下定價部分。
普通用戶還是訂閱制,參考plus、pro以及企業版月費即可。
API的價格如下:
GPT-5: $1.25/million for input, $10/million for outputGPT-5 Mini: $0.25/m input, $2.00/m outputGPT-5 Nano: $0.05/m input, $0.40/m output
![]()
此次發布算得上是近兩年OpenAI規模最大的發布,光是露臉技術人員及高管就十數位,其中華人面孔依舊顯眼。
就在模型發布前夕,The Information消息稱OpenAI給1000名研究人員、工程師發放高額獎金,從10萬到上百萬不等
此外值得關注的是,發布中提了一句:未來AI系統將遠遠超越預訓練+后訓練范式,我們正在見證變化的第一步。
以及奧特曼還重點提到了醫療健康領域的應用。不光是OpenAI與醫學界聯合進行的一些評估,還現場邀請了一位癌癥患者分享自己是如何使用ChatGPT來確定治療方案的。可能之后醫療健康也會是OpenAI重點關注的領域。
![]()
不過,盡管放出了非常多猛料,但是也還是不免被蛐蛐。
馬斯克先說,在人類最后測試上,還是Grok4 Heavy更勝一籌(你這最強大模型有水分哦)。
![]()
以及有人發現OpenAI放出的基準測試中,縱坐標上動了一些小手腳,52視覺上還能大于69了,需要大家來仔細看下具體數據(doge)。
![]()
![]()
最后,GPT-5技術報告已新鮮出爐,更多細節詳見原文。
對了,GPT-5沒說Open計劃哦…
官方介紹:https://openai.com/index/introducing-gpt-5/





京公網安備 11011402013531號