至頂網(wǎng)
OpenAI周一宣布,將為其AI編程智能體Codex發(fā)布新版本的GPT-5。該公司表示,這個名為GPT-5-Codex的新模型在"思考"時間上比以往模型更加靈活動態(tài),在編程任務(wù)上可以花費幾秒鐘到七小時不等的時間。因此,它在編程智能體基準(zhǔn)測試中表現(xiàn)更佳。
新模型現(xiàn)已在Codex產(chǎn)品中推出——可通過終端、IDE、GitHub或ChatGPT訪問——面向所有ChatGPT Plus、Pro、Business、Edu和Enterprise用戶。OpenAI表示計劃未來向API客戶提供該模型。
此次更新是OpenAI努力讓Codex在與其他AI編程產(chǎn)品競爭中更具優(yōu)勢的一部分,這些競品包括Claude Code、Anysphere的Cursor或微軟的GitHub Copilot。由于用戶需求強烈,AI編程工具市場在過去一年變得更加擁擠。Cursor在2025年初ARR超過5億美元,而類似的代碼編輯器Windsurf則成為混亂收購嘗試的焦點,其團(tuán)隊最終在Google和Cognition之間分裂。
OpenAI表示,GPT-5-Codex在SWE-bench Verified(衡量編程智能體能力的基準(zhǔn))以及衡量大型成熟代碼庫重構(gòu)任務(wù)性能的基準(zhǔn)測試中,都優(yōu)于GPT-5。
該公司還表示,他們訓(xùn)練GPT-5-Codex進(jìn)行代碼審查,并請經(jīng)驗豐富的軟件工程師評估模型的審查評論。據(jù)報告,工程師們發(fā)現(xiàn)GPT-5-Codex提交的錯誤評論更少,同時增加了更多"高影響力評論"。
在一次簡報中,OpenAI的Codex產(chǎn)品負(fù)責(zé)人Alexander Embiricos表示,性能提升很大程度上歸功于GPT-5-Codex的動態(tài)"思考能力"。用戶可能熟悉ChatGPT中GPT-5的路由器,它根據(jù)任務(wù)復(fù)雜性將查詢引導(dǎo)到不同模型。Embiricos說GPT-5-Codex工作方式類似,但內(nèi)部沒有路由器,可以實時調(diào)整在任務(wù)上工作的時長。
Embiricos表示,相比于在開始時就決定在問題上使用多少計算能力和時間的路由器,這是一個優(yōu)勢。相反,GPT-5-Codex可以在處理問題五分鐘后決定需要再花一個小時。Embiricos說他見過該模型在某些情況下需要超過七小時的時間。
Q&A
Q1:GPT-5-Codex相比之前的模型有什么改進(jìn)?
A:GPT-5-Codex的主要改進(jìn)是具有動態(tài)"思考能力",可以根據(jù)任務(wù)復(fù)雜性實時調(diào)整處理時間,從幾秒鐘到七小時不等。它在編程智能體基準(zhǔn)測試中表現(xiàn)更佳,代碼審查時錯誤評論更少,高影響力評論更多。
Q2:哪些用戶可以使用GPT-5-Codex?
A:目前GPT-5-Codex已向所有ChatGPT Plus、Pro、Business、Edu和Enterprise用戶推出,可通過終端、IDE、GitHub或ChatGPT訪問。OpenAI計劃未來向API客戶提供該模型。
Q3:GPT-5-Codex與其他AI編程工具相比有什么優(yōu)勢?
A:GPT-5-Codex的主要優(yōu)勢是其動態(tài)思考能力,不像傳統(tǒng)路由器在開始時就決定計算資源分配,它可以在處理過程中實時調(diào)整,在問題處理五分鐘后決定是否需要更多時間,最長可達(dá)七小時。





京公網(wǎng)安備 11011402013531號