亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

斯坦福新研究:AI“黑客”表現超越9成人類專家,成本僅1/14

IP屬地 中國·北京 智東西 時間:2025-12-12 18:21:34


智東西
編譯 王欣逸
編輯 程茜

智東西12月12日消息,昨天,斯坦福大學研究團隊發布最新研究,在探查斯坦福大學工程學院網絡漏洞的測試中,他們新推出并開源的Multi-Agent(多Agent)框架ARTEMIS表現超越了90%的人類專家,全面超越現有的Agent框架,而其實際成本約為人力的1/14。

ARTEMIS具備動態提示生成、任意子Agent調用和自動漏洞分級評估功能,在實際應用中,它能完成復雜的網絡任務,可以對網絡進行掃描,找出潛在漏洞和軟件安全隱患,并探尋利用這些漏洞的方法。

本次實驗,研究人員讓ARTEMIS與10名人類滲透測試專家、多個現有的Agent框架共同執行任務,讓他們對斯坦福大學工程學院的網絡進行探查,但不得實際入侵,以此來全面評估他們的探查能力。結果顯示,基于OpenAI的GPT-5的ARTEMIS框架綜合表現位列第二,共發現9個有效漏洞,提交有效率達82%,其表現優于十位人類參與者中的九位,全面碾壓其他Agent框架,包括基于同一底層模型GPT-5的單Agent自主框架Codex和CyAgent。


▲P為人類網絡安全專業人員;A1、A2分別是ARTEMIS兩個不同配置的框架,前者基于GPT-5,后者基于集成模型;CO、CS和CG分別是使用GPT-5模型作為基礎來運行的單Agent自主框架Codex、使用Claude Sonnet 4模型作為基礎來運行單Agent自主框架CyAgent和使用GPT-5模型作為基礎來運行CyAgent。

除了擁有與頂尖滲透測試專家相當甚至超越的性能之外,ARTEMIS把成本也打下來了,搭載GPT-5的ARTEMIS框架每小時成本約為18美元(約合人民幣127.1元),約為美國滲透測試員時薪的1/14。

不過,論文指出,ARTEMIS還存在處理基于圖形用戶界面(GUI)的任務時有困難、比人類更高的誤報率等短板。

該論文現已發布在arXiv上,題為《將AI Agents與網絡安全專業人員在真實世界滲透測試中的表現進行比較(Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing)》。


論文地址:https://arxiv.org/abs/2512.09882

一、綜合排名第二,全面碾壓現有Agent框架,還能提升原始模型性能

研究人員建立了ARTEMIS框架下的兩個對照組,以評估不同配置下的ARTEMIS框架性能。一個是使用OpenAI的GPT-5作為監督器和子Agent的A1,另一個是使用集成模型作為監督器、Anthropic的編程模型Claude Sonnet 4作為子Agent的A2,集成模型包括了以下模型:OpenAI的推理模型o3和o3 Pro、Anthropic的編程模型Claude Sonnet 4和Claude Opus 4,以及谷歌的Gemini 2.5 Pro。

從結果來看,A2在和一眾人類滲透測試專家、現有的Multi-Agent框架的比較中位列第二名,共發現9個有效漏洞,提交有效率達82%,其表現優于10位人類參與者中的9位。A1則打敗了5名人類參與者,位列第七名。

除ARTEMIS外,分數最高的Agents框架CO(基于GPT-5的Codex)僅超越了兩位人類參與者,而CS(基于Claude Sonnet 4的CyAgent)和CG(基于GPT-5的CyAgent)落后于所有人類參與者,CS的總得分僅為A2的四分之一。

從漏洞的質量來看,人類參與者發現的Critical(關鍵)漏洞占據了更大的比例;ARTEMIS框架的兩個配置A1和A2發現的關鍵漏洞比例更小,且誤判的內容相對較多;A1和A2雖然提交了相同數量的漏洞,但A1的正確率僅為55%,關鍵漏洞僅占18%,而A2的關鍵漏洞占比則達到了45%,這表明不同的模型組合和配置對框架整體性能有影響,A2的多模型架構可能在處理復雜任務和減少誤報方面更為有效。


在時間上,人類參與者和ARTEMIS框架的表現也不盡相同。ARTEMIS框架表現出了長時間、持續、但間歇性產出的節奏,在提交漏洞之間通常有更長的間隔時間;人類參與者則呈現出了高度可變、依賴靈感和集中爆發的節奏。他們的活躍時間(通過鍵盤輸入判斷)和漏洞提交時間點分布不均勻。


值得一提的是,ARTEMIS和人類最根本的區別是,ARTEMIS在發現一個值得關注的目標后,會立即在后臺啟動一個專用的子Agent去探測它,同時主線繼續進行其他工作,在峰值時,ARTEMIS可以達到8個子Agents并行運行。

此外,從網絡安全基準測試Cybench的表現來看,在基于GPT-5的Artemis框架和Claude 4.5 Sonnet、GPT-5等模型能力對比中,ARTEMIS以48.6%的成功率位列第二,僅次于Claude 4.5 Sonnet(55%),且略高于其底層模型GPT-5(45.9%)。


這一結果意味著,ARTEMIS框架在解決網絡安全問題中,具備與頂級大模型相當的能力,且在一定程度上提升了基礎模型的性能。

二、由監督器、子Agent、分級器組成,成本僅為人類專家的1/14

現有的針對網絡安全AI Agent的研究主要有三類:一是PentestGPT等需要人類引導等半自主框架;二是Codex、CyAgent等能獨立運行但能力有限的單Agent自主框架;三是Incalmo、MAPTA等Multi-Agent(多Agent)自主框架。

論文中提到,ARTEMIS是一個復雜的Multi-Agent框架,被設計用來對真實世界的生產系統進行長周期、復雜、滲透性測試,該框架目前已開源。

它有三個核心組件:一個監督器,負責管理工作流;一組任意子Agents集群,負責執行具體任務;一個漏洞分級器,負責漏洞驗證。


ARTEMIS借鑒了現有編程Agent的設計,并通過任務列表、筆記系統和智能摘要機制,達到了比現有Agent持續運行時間更長的能力。在分配任務時,其自定義提示生成模塊會為子Agent創建任務特定的系統指令。因此,ARTEMIS有著動態生成系統提示、上下文管理和分級報告等功能的優勢性。

此外,ARTEMIS在經濟成本上也相當占優。以基于GPT-5的ARTEMIS框架A1來看,論文指出,A1每小時成本約為18.21美元(約合人民幣128.6元),按每周40小時計算,其年化成本約為3.78萬美元(約合人民幣26.7萬元)。

而人類滲透測試人員的每日收費通常在2000至2500美元左右(約合人民幣1.41萬元至1.77萬元),按每日工作8小時計算,時薪約為250美元至312美元(約合人民幣1765元至2204元),是ARTEMIS框架每小時成本的14倍多;市場上美國滲透測試員的的年薪平均為12.5萬美元(約合人民幣88.29萬元),是ARTEMIS框架年成本的3倍多。即使是使用每小時成本更高的A2(約為59美元,約合人民幣416.7元),其成本也低于人類專家。

三、具備執行技術,短板是找不到漏洞和GUI限制

不過,據《華爾街日報》報道,ARTEMIS并非完美無缺,在誤報率上,A2誤報了18%的漏洞,A1失誤的更多。除了失誤外,ARTEMIS還完全遺漏了一個大多數人類測試人員能輕易發現的明顯漏洞。

ARTEMIS頻繁提交漏洞報告,卻很少發現目標漏洞,而且總是發現低嚴重性、低復雜度或無法利用的漏洞。這種遺漏與誤報的背后,可能與ARTEMIS的決策邏輯有關。論文指出,ARTEMIS框架提交漏洞報告次數的增加與未發現目標漏洞存在相關性,這可能是因為ARTEMIS在主機上發現其他漏洞后便轉移了目標。

研究人員稱,ARTEMIS的瓶頸在于識別漏洞模式而非技術執行能力。在中、高等級的提示下,ARTEMIS成功找到了大部分目標漏洞,這表明ARTEMIS具備漏洞的技術執行能力。當提示信息減少,僅提供低等級、僅信息和僅主機提示時,ARTEMIS成功率急劇下降,即它的自主識別攻擊入口和識別漏洞的能力不足。此外ARTEMIS還存在行為不確定性,在“未經身份驗證的遠程控制臺訪問”這一任務中,ARTEMIS在高等級提示下依然任務失敗,在中等級和僅主機提示下卻能完成任務。


此外,ARTEMIS還存在一個關鍵限制,作為基于命令行和文本分析的AI,它無法通過圖形用戶界面(GUI)與瀏覽器進行交互。

斯坦福大學工程學院系統與網絡安全負責人亞歷克斯·凱勒(Alex Keller)稱:“此前斯坦福大學的網絡從未遭受過AI程序的攻擊,此次實驗似乎是彌補斯坦福大學網絡安全漏洞的一種有效方式。在我看來,實驗的益處遠大于任何風險。”

斯坦福大學計算機科學教授丹·博內(Dan Boneh)為該研究提供了建議:“鑒于全球大部分代碼都未經過安全漏洞測試,ARTEMIS等工具將幫助網絡安全專業人士發現并修復比以往更多的代碼漏洞。”此次測試,ARTEMIS就發現了斯坦福大學存在的一個有安全問題的過期網頁。

結語:正探索多Agent框架的配置優化與架構迭代

在真實環境中與人類的滲透測試和基準測試Cybench均顯示,ARTEMIS不僅在其在復雜現實任務中達到了可與頂尖人類專家持平甚至超越的能力,在顯著優于其他現有Agent框架的同時還做到了不損害模型的原始能力,并在原始模型上實現了能力的提高。

為軟件開發者與白帽黑客提供協作平臺的機構HackerOne的調研報告指出:當前已有70%的安全研究人員開始采用AI工具輔助漏洞挖掘。

AI在自動化網絡攻擊領域正在走向實戰應用。研究人員稱,他們未來將持續探索這一領域,創建可運行的環境副本,對不同的Agent架構、配置和模型進行消融實驗,優化基礎設施,還將與企業合作開展漏洞賞金計劃等。

《華爾街日報》、arXiv

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

全站最新
欧美猛男男办公室激情| 国产真实乱在线更新| 成人激情黄色网| 色美美综合视频| 26uuu成人网一区二区三区| 岛国精品一区二区三区| 亚洲成人中文字幕| 久久久久久99久久久精品网站| 手机av免费观看| 91亚洲一线产区二线产区| 亚洲一区二区三区xxx视频| 精品久久人人做人人爱| 日本一二三不卡| 最新在线中文字幕| 99久久99久久精品免费看小说.| 亚洲一区二区三区涩| 九九久久久久99精品| 亚洲成人动漫精品| 久久看片网站| yjizz国产| 无码人妻一区二区三区精品视频| 国产又大又长又粗又黄| 国产成人avxxxxx在线看| 精品卡一卡二卡三卡四在线| 激情成人在线视频| 99久久精品免费看国产免费软件| 国产精品一区二区av白丝下载| 白白色免费视频| 九九九九九九九九| 免费网站在线观看视频| 一区二区三区四区视频在线| 国产高清精品一区二区| 国产成人在线播放| 91精品国产高清久久久久久久久| 国产亚洲欧美日韩一区二区| 在线区一区二视频| 懂色av一区二区三区| 国产喂奶挤奶一区二区三区| 成人av在线资源网站| 丁香啪啪综合成人亚洲小说 | 国产在线播放一区二区三区| 午夜精品久久久久久久91蜜桃| 天堂中文在线网| 久久午夜免费视频| 亚洲精品在线观看av| 羞羞影院体验区| 天堂网一区二区| 中文字幕+乱码+中文| 国产精品毛片久久久久久久av| 日本a级c片免费看三区| 无码视频在线观看| 亚洲国产精品视频在线| 久久夜色精品| 成人av资源在线观看| 欧美极品xxx| 中文字幕字幕中文在线中不卡视频| 国产高清不卡一区| 依依成人在线视频| 国产免费久久久久| 神马午夜精品91| 欧美国产日韩综合| 久久无码精品丰满人妻| 欧美人妻精品一区二区三区 | 亚洲色图25p| 日批免费在线观看| 国产精品视频一区二区三| 91人人澡人人爽| 国产精品无码一区二区三| 992kp免费看片| 国产美女在线一区| 成人羞羞视频免费| 青青草成人在线| 欧美成人免费播放| 91大神在线播放精品| 欧美高清不卡在线| 国产精品美女www爽爽爽视频| 丝袜情趣国产精品| 538国产精品一区二区在线 | 欧美日韩999| 午夜精品美女自拍福到在线| 亚洲人成电影网站| 欧美高清在线播放| 亚洲熟妇av日韩熟妇在线| 天堂久久一区二区三区| 日韩午夜在线影院| 一区二区精品免费视频| 激情五月六月婷婷| 天天成人综合网| 中文字幕第88页| 麻豆成人在线视频| 国产高清中文字幕| 亚洲熟妇无码久久精品| 国产偷人爽久久久久久老妇app | 亚洲欧美日本在线观看| 国产一区二区三区免费看| 26uuu色噜噜精品一区二区| 精品国产成人av| 亚洲精品电影在线| 国产精品极品美女在线观看免费 | 97超碰人人干| 国产乱子伦视频一区二区三区| 亚洲精品视频免费看| 精品国产乱码久久| 91久久久久久久| 国产97色在线 | 日韩| 7788色淫网站小说| 国产高清免费av| 国产精品女上位| 在线观看欧美成人| 91亚洲国产成人精品性色| 在线观看av网页| 天天干天天操天天爱| 中文字幕欧美激情一区| 在线亚洲午夜片av大片| 欧美日韩免费观看一区| 亚洲一区二区在线免费| 久久久久久久高潮| 717成人午夜免费福利电影| 999在线观看免费大全电视剧| 国产高清999| 风流少妇一区二区三区91| 欧美日韩亚洲网| 国产一区视频在线播放| av网站在线不卡| 国产黄色高清视频| 日韩免费一区二区| 91传媒视频免费| 婷婷丁香综合网| 久久综合久久鬼色中文字| 日韩午夜在线观看视频| 91在线国产电影| 精品欧美一区二区久久久久| 国产精品久久久爽爽爽麻豆色哟哟 | 国产精品每日更新在线播放网址| 亚洲国产黄色片| 人妻激情另类乱人伦人妻| 69亚洲精品久久久蜜桃小说 | 国产精品国产馆在线真实露脸 | av天堂一区二区| 欧美激情一区不卡| 91夜夜揉人人捏人人添红杏| 久久r这里只有精品| 久久亚洲二区三区| 5566日本婷婷色中文字幕97| 精品人妻一区二区三区香蕉| 国产偷国产偷亚洲高清人白洁| 久久精品国产2020观看福利| 2一3sex性hd| 国产丝袜在线精品| 亚洲影院在线看| 欧美日韩a v| 欧美一级一区二区| 8x8x成人免费视频| 国产综合色精品一区二区三区| 久久久亚洲天堂| 国产毛片久久久久久久| 亚洲青青青在线视频| 国产综合动作在线观看| 中文字幕在线观看成人| 国产精品理论在线观看| 国产在线精品一区二区中文 | 国产精品久久网站| 亚洲亚洲精品三区日韩精品在线视频 | 日韩在线视频在线| 久久久三级国产网站| 亚洲国产激情一区二区三区| 久草热8精品视频在线观看| 成人午夜高潮视频| 色一情一乱一乱一区91av| 人人做人人澡人人爽欧美| 天天人人精品| 成人黄页毛片网站| 亚洲成人午夜在线| av网站免费大全| 国产精品久久久久久久久久久新郎 | 国产日韩视频在线观看| 91福利国产成人精品播放| 亚洲午夜精品在线| 亚洲理论中文字幕| 91高清视频在线| 国产精品自拍视频在线| 日本高清无吗v一区| 亚洲图片欧美另类| 日韩午夜电影在线观看| www.国产福利| 欧美精品欧美精品系列| 中日韩一级黄色片| 亚洲高清久久网| 国产性xxxx高清| 97色伦亚洲国产| 精品无码三级在线观看视频| 性欧美.com| 性欧美疯狂xxxxbbbb| 欧美无人区码suv| 亚洲全黄一级网站| 性猛交xxxx乱大交孕妇印度| 国产亚洲一区二区三区在线播放 | 亚洲一级片网站| 欧美午夜一区二区| 国产午夜精品理论片| 国内免费久久久久久久久久久| 日韩国产精品久久久久久亚洲| 国产免费高清一区| 亚洲电影中文字幕在线观看| 精品国产大片大片大片| 91av中文字幕| 日韩国产精品久久久| 日日橹狠狠爱欧美超碰| 日韩久久久久久| 91麻豆国产视频| 日韩欧美视频第二区| 欧美在线不卡一区| 男人天堂av在线播放| 亚洲va欧美va国产综合剧情| 成人妖精视频yjsp地址| 免费看一级大黄情大片| 亚洲精品视频在线观看视频| 亚洲自拍一区在线观看| 欧美另类z0zxhd电影| 久热这里只有精品6| 亚洲欧洲久久| 欧美成人精品福利| 老司机精品视频导航| 亚洲黄色免费在线观看| 91夜夜未满十八勿入爽爽影院 | 欧美日韩不卡合集视频| 国产亚洲污的网站| 成人激情五月天| 久久国产精品久久精品国产| 精品国产乱码久久久久久影片| 久久国内精品自在自线400部| 久久人人爽人人人人片| av在线亚洲男人的天堂| 日韩视频在线你懂得| 国产成人精品免费看| 日韩中文字幕有码| 91久久在线观看| 亚洲高清一区二| 国产精品久久久久国产精品日日 | 国产免费成人av| 欧美一区国产二区| 99久久伊人久久99| 欧美国产一级片| 玖玖爱视频在线| 99视频国产精品免费观看| 欧美性大战久久久久久久| jizz中国少妇| 亚洲做受高潮无遮挡| 可以在线看黄的网站| 欧美精品九九久久| 91精品国产综合久久精品图片 | 亚洲mm色国产网站| 亚洲精品中文字幕av| 久久这里只有精品首页| 韩国av中文字幕| 天天av天天操| 色中文字幕在线观看| 欧美大尺度激情区在线播放| 一区二区三区四区亚洲| 韩国av一区二区三区四区| 一区二区在线观看免费视频| 国产精品视频二| www.久久草| 欧美最顶级的aⅴ艳星| 欧美一区二区精品在线| 香蕉成人伊视频在线观看| 成人国产精品视频| 麻豆精品在线播放| 亚洲奶汁xxxx哺乳期| 久久一级免费视频| 亚洲色图欧美另类| 欧美久久在线观看| 欧美日韩国产综合视频在线| 91久久久久久久| 亚洲欧美国产视频| 欧美一区二区免费视频| 日韩欧美有码在线| 亚洲h在线观看| 亚洲乱码中文字幕| 成人午夜免费视频| 精品一区二区三区日韩| 国产综合无码一区二区色蜜蜜| 少妇高潮在线观看| 欧美在线视频第一页| 国产xxx在线观看| 97中文字幕在线观看| 国产精品涩涩涩视频网站| 欧美亚洲黄色片| 日本一区视频在线观看| 日本黄网免费一区二区精品| 国产传媒一区二区| 国产精品大全| 色综合影院在线观看| 玖玖精品在线视频| 男同互操gay射视频在线看| 路边理发店露脸熟妇泻火| 亚洲综合激情五月| 激情久久av| 亚洲欧美日产图| 99久久久无码国产精品性色戒| 综合久久国产| 性欧美在线视频| 草草影院第一页| 欧美人妻精品一区二区三区| 日本伦理一区二区三区| 成人精品在线看| 婷婷开心激情网| 91在线精品一区二区| 一区二区三区在线看| 欧美日韩大陆在线| 色噜噜狠狠狠综合曰曰曰88av | 在线观看中文字幕视频| 日日夜夜精品视频天天综合网| 国产激情偷乱视频一区二区三区| 久久电影网电视剧免费观看| 国产日韩欧美在线一区| 欧美亚洲自拍偷拍| 久久成人免费视频| 国产成人精品网站| 一区二区视频在线免费| 一级做a爱视频| 久久一区二区三区视频| 久久99国产精品免费| 91一区二区三区在线播放| 欧美妇女性影城| 久久久国产一区二区| 国产噜噜噜噜噜久久久久久久久 | 中文字幕在线不卡| 亚洲人成伊人成综合网久久久| 国产精品久久久精品| 大j8黑人w巨大888a片| 北条麻妃69av| 丰满少妇乱子伦精品看片| 国产高潮流白浆喷水视频| www.亚洲人| 欧美日韩成人综合天天影院| 97福利一区二区| 色中文字幕在线观看| 午夜激情福利网| 国产一区二区毛片| 日韩一级大片在线| 2020国产精品久久精品不卡| 精品国产av无码一区二区三区| 久久久国产精华液| 日本中文字幕不卡| 欧美成人精品二区三区99精品| 亚洲一区二区三区毛片| 国产午夜在线一区二区三区| www.久久久久久| 亚洲超碰97人人做人人爱| 欧美一区二区色| 欧美成人高潮一二区在线看| av片免费观看| 亚洲国产精品欧美一二99| 国产经典一区二区| 男人透女人免费视频| 你懂的国产视频| 国产午夜精品久久久久久免费视| 国产成人综合精品| 欧美丝袜在线观看| 狠狠躁夜夜躁av无码中文幕| 国产成人av影院| 欧美一级日韩不卡播放免费| 国产精品久久久久av免费| 少妇黄色一级片| 免费看欧美美女黄的网站| 亚洲国产福利在线| 国产欧美日韩伦理| 国产一级片毛片| 欧美网站大全在线观看| 亚洲国产一区二区在线| 麻豆视频在线观看| 色综合久久99| 香蕉视频在线网址| 日本xxxxxwwwww| 亚洲国产精品yw在线观看| 亚洲色精品三区二区一区| 麻豆精品视频在线观看| 欧美激情免费看| 中国黄色片视频| 国产精品电影院| 日本一区不卡| 日日夜夜免费精品| 中文日韩电影网站| 男女视频在线观看网站| 国产日韩在线不卡| 麻豆久久久av免费| 亚洲精品国偷拍自产在线观看蜜桃| 欧美调教femdomvk| 日本女优爱爱视频| 国产精品福利一区| 青青草国产精品| 国产高清在线免费| 欧美在线视频一二三| 欧美精品一级片| 亚洲人成网站777色婷婷| 香蕉视频免费网站| 欧美性色综合网| 人妻精品久久久久中文字幕69| 国产女人18毛片水真多成人如厕| 精品乱码一区二区三区| a级在线观看视频| 日韩精品视频网| 国模精品系列视频| 色老头一区二区| 91免费在线视频网站| 国产一区二区三区国产| 青青视频免费在线| 精品久久久久久久久久| jizz日本免费|