黃仁勛預(yù)言成真！AI智能體成GitHub主力，一天頂人類一年

IP屬地中國·北京 編輯：顧青青新智元 時間：2025-08-05 18:26:37

新智元報(bào)道
編輯：LRST
「軟件正在吞噬世界，但AI將吞噬軟件。」—英偉達(dá)CEO黃仁勛的預(yù)言正加速照進(jìn)現(xiàn)實(shí)。
最近，來自加拿大女王大學(xué)的一項(xiàng)最新研究，首次揭示了AI編程智能體如何大規(guī)模滲透開源社區(qū)。

論文地址：https://arxiv.org/abs/2507.15003
數(shù)據(jù)集地址：https://huggingface.co/datasets/hao-li/AIDev
代碼地址：https://github.com/SAILResearch/AI_Teammates_in_SE3
研究團(tuán)隊(duì)通過分析45.6萬條GitHub Pull Request（PR，代碼修改請求）發(fā)現(xiàn)，OpenAI Codex、GitHub Copilot和Claude Code等AI編程智能體已超越簡單的代碼補(bǔ)全角色，正作為真正的「AI程序員」活躍在開源一線：
它們能獨(dú)立發(fā)起PR、參與評審，甚至與人類開發(fā)者就修改方案展開「討論」。
這標(biāo)志著軟件工程正式邁入知名AI科學(xué)家Andrej Karpathy所預(yù)言的3.0時代—AI從工具升級為協(xié)作伙伴，全球已有超過6.1萬個開源項(xiàng)目開始接納AI編程智能體作為「同事」。

這些項(xiàng)目涵蓋各種規(guī)模，使用者包括4.7萬名人類開發(fā)者。
其中，OpenAI Codex表現(xiàn)最為活躍，提交PR達(dá)41萬次（截止發(fā)文已達(dá)到80萬次），堪稱「卷王」；Devin和GitHub Copilot分別以2.4萬和1.6萬次提交緊隨其后。
效率爆炸：3天干完3年的活
AI編程智能體帶來的效率提升令人咋舌。數(shù)據(jù)顯示，GitHub Copilot平均僅需13分鐘就能完成一個代碼修改請求的核心工作，遠(yuǎn)快于人類開發(fā)者通常所需的數(shù)小時甚至數(shù)天。

更極端的案例顯示，一位開發(fā)者借助OpenAI Codex在短短3天內(nèi)提交了164次代碼修改，幾乎相當(dāng)于他過去3年（提交176次）的工作總量。
這如同為每位程序員配備了100個不知疲倦的實(shí)習(xí)生，他們可以24小時不間斷地產(chǎn)出代碼。
質(zhì)量困境：快不等于好
研究揭示了一個關(guān)鍵矛盾：AI代碼的接受率普遍低于人類。
OpenAI Codex的代碼合并率為65%，GitHub Copilot僅為38%，而人類開發(fā)者平均達(dá)到76%。
這種差距在核心功能開發(fā)中尤為明顯：在核心功能開發(fā)（feat）和缺陷修復(fù)（fix）任務(wù)中，差距尤為顯著（低15-40個百分點(diǎn)）。

不過，AI在文檔編寫（docs）方面展現(xiàn)出獨(dú)特優(yōu)勢。OpenAI Codex的文檔類修改接受率高達(dá)88.6%，顯著超過人類的76.5%。研究推測，文檔生成更依賴語言能力而非復(fù)雜邏輯推理，這正契合當(dāng)前大語言模型的核心優(yōu)勢。
更具啟發(fā)性的現(xiàn)象是，高達(dá)37%的GitHub Copilot PR經(jīng)歷了「人機(jī)聯(lián)合評審」——AI工具進(jìn)行初步篩查后，再由人類把關(guān)。

然而，新模式也引發(fā)擔(dān)憂：研究發(fā)現(xiàn)，Copilot提交的代碼通常由其「同門」AI 智能體（copilot-swe-agent[bot]）初審，存在「自己人審自己人」的潛在審查盲點(diǎn)。研究團(tuán)隊(duì)建議，未來應(yīng)探索建立更獨(dú)立的評審機(jī)制以保障公正性。
未來已來：GitHub進(jìn)化為AI訓(xùn)練場
研究預(yù)言，開源平臺將進(jìn)化為AI智能體的「訓(xùn)練健身房」。每一次成功的代碼合并將成為強(qiáng)化學(xué)習(xí)的「正反饋」，每一次測試失敗或PR被拒則是寶貴的「負(fù)反饋」。
其終極目標(biāo)是培育出能獨(dú)立、可靠完成軟件迭代的成熟AI程序員。
基于海量實(shí)證數(shù)據(jù)，研究團(tuán)隊(duì)為AI編程智能體時代勾勒出關(guān)鍵發(fā)展方向：
1. 動態(tài)評測體系：摒棄傳統(tǒng)的靜態(tài)測試，直接在真實(shí)項(xiàng)目環(huán)境中評估AI表現(xiàn)
2. 失敗模式解析：深入分析被拒PR，建立AI常見錯誤庫，驅(qū)動改進(jìn)
3. 延遲優(yōu)化：重點(diǎn)解決部分任務(wù)響應(yīng)超時（>1小時）的長尾問題。
4. 評審減負(fù)：讓AI生成的代碼更清晰、更易審查，降低人類負(fù)擔(dān)
5. 專業(yè)評審AI：開發(fā)專門用于代碼審查的智能體
6. 智能評審分流：根據(jù)代碼復(fù)雜度與風(fēng)險自動分配評審資源
7. 全周期質(zhì)量追蹤：監(jiān)控AI生成代碼的長期維護(hù)成本和缺陷率
8. 需求理解：提升AI對不明確任務(wù)意圖的理解與規(guī)劃能力
9. 編程語言優(yōu)化：針對TypeScrip等AI擅長語言進(jìn)行深度適配，或開發(fā)出AI專用新語言
「這并非取代人類開發(fā)者，而是重新定義開發(fā)者的核心角色，未來的程序員將更像交響樂團(tuán)的指揮家，專注于戰(zhàn)略目標(biāo)設(shè)定、協(xié)調(diào)多個‘AI樂手’的協(xié)作，而非親自演奏每一個音符。」
隨著AI編程智能體數(shù)量和能力呈指數(shù)級增長，軟件工程行業(yè)正站在深刻變革的臨界點(diǎn)。這場革命將如何重塑開發(fā)流程、團(tuán)隊(duì)協(xié)作乃至行業(yè)生態(tài)，值得我們持續(xù)關(guān)注與思考。
參考資料：
https://arxiv.org/abs/2507.15003

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農(nóng)業(yè)

大眾中國前CEO評小米汽車！

全國首發(fā)！重慶發(fā)布L3級自動駕駛機(jī)動車專用正式號牌！

無人機(jī)、機(jī)器人沒信號也能通信，科學(xué)家探索全新量子糾纏技術(shù)框架

人工智能新戰(zhàn)場，在10月后出現(xiàn)了

羅永浩：網(wǎng)速問題已解決，新微信會屏蔽所有媒體人

全站最新

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農(nóng)業(yè)

大眾中國前CEO評小米汽車！

全國首發(fā)！重慶發(fā)布L3級自動駕駛機(jī)動車專用正式號牌！

無人機(jī)、機(jī)器人沒信號也能通信，科學(xué)家探索全新量子糾纏技術(shù)框架

熱門推薦

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農(nóng)業(yè)

大眾中國前CEO評小米汽車！

全國首發(fā)！重慶發(fā)布L3級自動駕駛機(jī)動車專用正式號牌！

無人機(jī)、機(jī)器人沒信號也能通信，科學(xué)家探索全新量子糾纏技術(shù)框架

芯片，重磅突發(fā)！全球首款！

人工智能新戰(zhàn)場，在10月后出現(xiàn)了

羅永浩：網(wǎng)速問題已解決，新微信會屏蔽所有媒體人

OpenAI、xAI打破硅谷鐵律，AI人才年薪破億成常態(tài)

AI教父Hinton首爆十年前拍賣：我早已內(nèi)定谷歌必贏！

AI交易暫時企穩(wěn)，圣誕行情值得期待否？

世貿(mào)組織預(yù)測：人工智能有望推動全球貿(mào)易增長近40%

小米17手機(jī)相機(jī)體驗(yàn)問題修復(fù)，此前出現(xiàn)輸出綠色照片情況

谷歌DeepMind：AGI不必是巨型模型，拼湊型AI群或率先涌現(xiàn)，管理大規(guī)模Agent迫在眉睫

東風(fēng)日產(chǎn)天籟?鴻蒙座艙上市首月訂單破萬

雷軍押注，年入超5億，中年男性養(yǎng)不起自己的“泡泡瑪特”