近日,OpenAI的新模型GPT-5引發(fā)了廣泛討論。奧特曼曾稱贊GPT-5“比人聰明”,但OpenAI首席運(yùn)營官Brad Lightcap隨即澄清,這款模型雖強(qiáng)大,但仍未達(dá)到通用人工智能(AGI)的標(biāo)準(zhǔn)。
GPT-5的一大突破在于其能夠自主判斷是否先進(jìn)行深度推理再回答。以往,用戶需手動為不同任務(wù)挑選模型,這一過程有時(shí)令人困惑。GPT-5則簡化了這一流程,自動決策,且在寫作、編程、健康等領(lǐng)域表現(xiàn)出更高的準(zhǔn)確性和更快的響應(yīng)速度。
對于GPT-5智能的爆炸式增長預(yù)期,OpenAI選擇了以可用性而非智能提升作為主要賣點(diǎn)。Lightcap解釋,智能本質(zhì)上取決于模型投入的思考時(shí)間。分配更多思考時(shí)長,答案質(zhì)量就越高。在特定基準(zhǔn)測試中,允許模型思考時(shí),GPT-5的表現(xiàn)遠(yuǎn)超現(xiàn)有所有模型。即便不啟用思考時(shí)間,其答案也普遍優(yōu)于GPT-4.1等非思考型模型。
GPT-5實(shí)現(xiàn)了全維度的智能飛躍,關(guān)鍵在于動態(tài)分配思考時(shí)間的能力。這種進(jìn)步難以簡單界定為“指數(shù)級”或“漸進(jìn)式”。現(xiàn)在,人類需要從多維度評估智能,OpenAI并非回避問題,而是強(qiáng)調(diào)GPT-5的特殊性。在核心能力上,GPT-5的SWEBench測試得分更高,各類學(xué)術(shù)評估表現(xiàn)更優(yōu),特別是在健康領(lǐng)域的基準(zhǔn)表現(xiàn)得到了強(qiáng)化。
衡量模型優(yōu)劣的標(biāo)準(zhǔn)已變得多元,從速度到隱形能力升級,如結(jié)構(gòu)化思考、問題分解、工具調(diào)用等底層能力,GPT-5都超越了前代。關(guān)于訓(xùn)練方式,從GPT-1到GPT-4,每次躍進(jìn)都是能力提升的結(jié)果,而GPT-5則引入了后訓(xùn)練方式,幾乎像是訓(xùn)練的第二階段,推動了模型向新的智能水平邁進(jìn)。
Lightcap表示,預(yù)訓(xùn)練的回報(bào)并未遞減,Scaling Law依然成立。后訓(xùn)練是一個(gè)新范式,大家才剛開始觸及表面。未來一兩年,主要方向是在后訓(xùn)練維度上繼續(xù)Scaling,同時(shí)從預(yù)訓(xùn)練和后訓(xùn)練兩個(gè)軸向上改進(jìn)模型,這將加速創(chuàng)新。
GPT-5雖能力過剩,但OpenAI并未稱其為AGI。Lightcap認(rèn)為,AGI難以定義,是一個(gè)積累過程和系統(tǒng),需要穩(wěn)定學(xué)習(xí)新事物的能力,這種能力源自推理、思考、解決問題、使用工具以及提出新想法。GPT-5及后續(xù)模型中,開始顯現(xiàn)這種“通用化學(xué)習(xí)系統(tǒng)”的雛形和模塊。
沃頓商學(xué)院的Ethan Mollick提前測試了GPT-5,認(rèn)為其進(jìn)步巨大且出乎意料。這些模型在數(shù)學(xué)奧林匹克競賽中獲金牌,讓人難以理解這些巨大進(jìn)步的意義。對于普通用戶,尤其是免費(fèi)用戶來說,GPT-5將是一種巨大的飛躍,因?yàn)檫@是他們第一次體驗(yàn)到具備推理能力和“自我反思”的模型。
GPT-5特別關(guān)注健康領(lǐng)域,因?yàn)檫@是用戶使用AI最常見的起點(diǎn)之一。Lightcap認(rèn)為AI不會取代醫(yī)生,但有一個(gè)可以陪伴左右、提供指導(dǎo)的工具,對很多人來說很有安慰感,并在很多情況下能發(fā)揮作用。企業(yè)領(lǐng)域也是GPT-5的重要應(yīng)用場景,其在企業(yè)流程中的表現(xiàn)得到了多家公司的積極反饋。





京公網(wǎng)安備 11011402013531號