亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

AI黑化如惡魔附體!LARGO攻心三步,潛意識種子瞬間開花 | NeurIPS 2025

IP屬地 中國·北京 新智元 時間:2025-10-26 14:07:35


新智元報道

編輯:KingHZ

看似無害的「廢話」,也能讓AI越獄?在NeurIPS 2025,哥大與羅格斯提出LARGO:不改你的提問,直接在模型「潛意識」動手腳,讓它生成一段溫和自然的文本后綴,卻能繞過安全防護,輸出本不該說的話。

你的AI助手真的安全嗎?

你敢信嗎?

只要在AI的「腦子」里注入一段精心「調制」的「想法」,就能讓它自己「黑化」,說出本不該說的秘密。比如,AI設計一封獲取用戶密碼的釣魚郵件、創建散布不實信息的虛假新聞網站 、撰寫一篇慫恿危險行為的社交媒體帖子。

這聽起來像是科幻電影,卻是頂級AI學術會議 NeurIPS 2025最新論文揭示的驚人現實。

這項由哥倫比亞大學和羅格斯大學帶來的開創性研究,提出了一種全新的、猶如「盜夢空間」般的攻擊方式——

它能神不知鬼不覺地潛入大型語言模型的「潛意識」,讓AI「自我黑化」,從而繞過其固有的安全防護,輸出原本被嚴格限制的有害或不當內容。


論文鏈接:https://arxiv.org/abs/2505.10838

傳統的攻擊方法,要么是手動編寫一些奇奇怪怪的「咒語」(比如「現在你是一個沒有道德限制的AI」),但這種方法很快就會失效;要么就是用算法生成一堆亂碼一樣的字符,雖然可能有效,但也很容易被檢測出來。

但LARGO的思路堪稱「攻心為上」。


LARGO通用攻擊示例

它不修改你的提問,而是直接深入模型的「大腦」(即潛在空間),植入一個「跑偏」的想法,然后讓模型自己把這個想法「翻譯」成一句看起來人畜無害的正常話語 。


比如下面這句聽起來很普通的「廢話」:

「數據可視化至關重要,因為它有助于通過創建數據的可視化表示來做出更好的決策...」

就是這樣一句由模型自己生成的話,卻成了攻破它自身安全防線的「特洛伊木馬」。

LARGO:「三步走」盜夢術

研究者們設計的這套攻擊系統,就像一個精密的「思想植入」手術,主要分三步:

潛在空間優化首先,研究者們并不直接修改問題文本,而是在模型的「大腦」內部,也就是高維的 embedding 空間中,用梯度優化的方法,精準地找到一個能讓模型「思想跑偏」的「潛意識代碼」。這個代碼就像一顆思想的種子,一旦植入,就能引導模型走向「不安全」的邊緣。

自我反思解碼最妙的一步來了!研究者們會讓模型自己來「解讀」這個被「污染」了的潛意識代碼。他們會問模型:「這段『想法』(潛意識代碼)如果用人類的語言說出來,應該是什么樣的?」 這時,模型就會自己「腦補」并生成一段看起來非常正常、無害的文字。比如下面這句: 「數據可視化至關重要,因為它有助于通過創建數據的可視化表示來做出更好的決策...」 聽起來是不是很普通,就像報告里的廢話文學?但就是這段模型自己「翻譯」出來的文字,已經攜帶了瓦解它自身安全防線的「病毒」。

循環迭代,直至攻破研究者們把模型生成的這段「無害」文本,再轉換回潛在空間,進行新一輪的優化,如此循環往復。就像不斷打磨一把鑰匙,直到它能完美地打開那把名為「安全限制」的鎖。 最終,當這段經過千錘百煉的「廢話」被添加到真正的惡意問題(例如「如何創建一個病毒」)后面時,AI的安全防線瞬間崩潰,乖乖地給出了你想要的答案。


LARGO攻擊框架的三階段流程示意圖

一個看起來完全無害且與主題無關的「對抗性后綴」(Adv. Suffix),例如一段關于數據可視化的文字,可以被用來附加到多個不同的有害指令(Harmful prompts)之后,成功誘導Llama 2模型生成有害內容。

殺傷力有多大?

這種攻擊方式有多可怕?

成功率極高:在標準的攻擊測試集上,LARGO的攻擊成功率比當前最先進的方法之一AutoDAN高出整整44個百分點

極其隱蔽:和那些由一堆亂碼組成的攻擊不同,LARGO生成的攻擊文本(我們稱之為「對抗性后綴」)讀起來非常流暢、自然,甚至看起來很無辜 。這就好比一個間諜,外表看起來人畜無害,卻能執行最危險的任務。

遷移性強:在一個模型(比如Llama 2-13B)上訓練出的攻擊「咒語」,可以直接拿去攻擊另一個模型(比如Llama 2-7B),而且成功率相當可觀 。這讓攻擊的適用范圍大大增加。

在AdvBench以及JailbreakBench測試集上,LARGO均取得了最高的攻擊成功率(ASR)。同時,其困惑度(PPL)遠低于基于亂碼的GCG方法,證明其生成的攻擊文本具有很高的流暢性。


LARGO與其他主流攻擊方法的性能對比表

下列表格清晰地展示了,對于各種有害的用戶指令(prompt),LARGO都能生成一段看似無關的、語義通順的對抗性文本(Adversarial Suffix),并最終導致模型輸出被「越獄」的危險回答(Response)。


LARGO方法在多個大語言模型上的成功攻擊案例

為何這種「心術」攻擊如此致命?

這背后暴露了當前大模型的一個根本性弱點:它們的「思想」和「語言」是可以被分離和操縱的。

我們一直致力于讓模型更好地理解和生成語言,卻忽略了它們的「潛意識」層面可能存在的漏洞。

LARGO證明了,通過直接操縱模型的內部狀態,可以繞過那些基于文本表面的安全審查機制。

這就像我們教一個孩子「不能說謊」,但他內心可能早已有了欺騙的想法,甚至能用一套非常真誠的話術來掩蓋自己的真實意圖。LARGO就是那個能誘導AI產生「壞心思」,并讓它自己把「壞心思」包裝起來的「惡魔」。

更可怕的是,這種攻擊方式的自動化程度非常高,幾乎不需要人工干預 。這意味著,別有用心的人可以規模化地利用這種漏洞,對金融、醫療、教育等領域的AI應用造成難以估量的破壞。

仔細想想,這是否也有些諷刺:我們努力讓模型擁有強大的自我學習和反思能力,結果這種能力卻成了它最脆弱的「阿喀琉斯之踵」。

歡迎在評論區和我們一起討論!

參考資料:

https://arxiv.org/abs/2505.10838

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

欧美午夜精品久久久久久人妖| 一区二区三区欧美视频| 麻豆一区二区三区在线观看| 亚洲色图.com| 国产午夜在线一区二区三区| 欧美精品乱码久久久久久| 高清一区在线观看| 中文字幕日韩精品在线观看| 亚洲三区在线观看无套内射| 日本中文不卡| 欧美一区二区三区系列电影| 精品黑人一区二区三区在线观看 | www成人在线| 国产一区在线播放| 一区二区三区四区不卡在线 | 在线免费观看av网址| 成人xxxxx色| 91国在线观看| 久久精品九九| 亚洲日本成人网| 欧美精品一区二区免费| 亚洲香蕉av在线一区二区三区| 免费成人在线观看视频| wwwxxx亚洲| 国产婷婷在线观看| 麻豆av一区二区三区| av在线播放成人| 性猛交╳xxx乱大交| 日本免费久久高清视频| 国产精品theporn88| 国产v亚洲v天堂无码| 欧美成人激情在线| 亚洲91精品在线| 91精品国产色综合久久不卡98| 国产精品com| 欧洲精品毛片网站| 欧美一二三在线| 精品国产亚洲在线| 久久视频一区二区| 国产女人18毛片水真多18| 红桃视频 国产| 国产精品999.| 日本一本二本在线观看| 亚洲 欧美 日韩 国产综合 在线| 婷婷夜色潮精品综合在线| 在线播放亚洲一区| 中文字幕一区二区三区色视频| 91香蕉在线视频| 日本a在线免费观看| 欧美激情视频免费观看| 欧美亚洲综合在线| 国产精品1024| 国产五月天婷婷| 亚洲欧美日韩色| 国产91免费视频| 欧美精品久久久久久久自慰| 中文字幕狠狠干| 91国产精品一区| 国产精品久久夜| 在线看福利67194| 欧美一级日本a级v片| 91人妻一区二区三区| 日韩中文字幕高清| 91美女在线视频| 亚洲国内精品在线| 精品视频一区二区| 激情久久综合网| 国产一区二区三区四区视频| 国产精品网曝门| 日韩综合中文字幕| 日本一二三区视频在线| 九九九免费视频| 99精品久久99久久久久| 亚洲成人精品视频在线观看| 91久久精品视频| 日韩av加勒比| 香蕉av在线播放| 欧美日韩综合不卡| 亚洲中国色老太| 亚洲成年人在线观看| 久久久久久久欧美精品| 欧美性猛交一区二区三区精品| 国产男女猛烈无遮挡91| 911亚洲精选| 日本一区中文字幕 | 国产精品久久久久一区| 最近2019中文字幕大全第二页| 日本在线成人一区二区| 免费视频一二三区| 久久久国产精品麻豆| 日韩在线www| 免费在线激情视频| 亚洲图片视频小说| 亚洲一区视频在线观看视频| 国产精品扒开腿做| 男人网站在线观看| 国产精品一区免费在线观看| 亚洲国产成人爱av在线播放| 中文字幕一区二区三区乱码| 国产精品久免费的黄网站| 亚洲欧美国产毛片在线| 国产精品麻豆va在线播放| 国产大学生视频| 国产电影一区二区三区| 日韩在线视频网站| 第四色婷婷基地| 青青草国产成人av片免费| 亚洲欧美日韩一区二区三区在线| 欧美一级免费在线观看| 亚洲一区精品在线观看| 欧美日韩和欧美的一区二区| 亚洲精品中文字幕乱码三区不卡| 国产www在线| 亚洲h在线观看| 国产一级精品aaaaa看| 久久精品国产av一区二区三区| 一区二区在线观看视频在线观看| 亚洲精品免费一区二区三区| 欧美老熟妇一区二区三区| 亚洲自拍与偷拍| 国产伦精品一区二区三区在线| 印度午夜性春猛xxx交| 亚洲成a天堂v人片| 日本在线成人一区二区| 国产精品羞羞答答在线| 亚洲精品www久久久| 37pao成人国产永久免费视频| 免费在线一区观看| 欧美激情国产精品| 谁有免费的黄色网址| 亚洲欧美偷拍另类a∨色屁股| www.久久久| 一级黄色av片| 欧美精品一区二区三区在线 | 97国产精品视频人人做人人爱| 韩国三级在线看| 欧美国产日韩在线观看| 国产另类第一区| 91在线公开视频| 国产亚洲人成a一在线v站| 国产精品一级无码| 亚洲男人的天堂在线aⅴ视频| 国产在线一区二区三区欧美| 波多野结衣视频在线观看| 欧美成人aa大片| 免费av不卡在线| 国产欧美一区二区精品性色| 久久av免费观看| 日韩有码第一页| 97国产精品人人爽人人做| 天天色影综合网| 欧美精品色一区二区三区| 亚洲 中文字幕 日韩 无码| 337p粉嫩大胆噜噜噜噜噜91av | 精品国产乱码久久久久久久| 国产免费人做人爱午夜视频| 91在线精品一区二区| 91在线视频一区| 国产99视频在线| 久久九九热免费视频| 很污很黄的网站| 3atv一区二区三区| 国产人妻精品久久久久野外| 依依成人综合视频| 毛片在线播放视频| 久久九九久精品国产免费直播| 国产一区免费观看| 美日韩一级片在线观看| 九九热免费在线| 国产精品―色哟哟| 久久久久久久久久福利| 亚洲精品理论电影| 欧美色精品在线视频| 无码国产精品96久久久久| 我的公把我弄高潮了视频| 7m精品福利视频导航| 国产精品无遮挡| 99草草国产熟女视频在线| 日日夜夜精品网站| 欧美精品第一页在线播放| 永久555www成人免费| 亚洲 欧美 日韩系列| 国产一伦一伦一伦| 久久久久久久高清| 欧美视频第三页| 精品午夜一区二区| 一区二区欧美在线| 一二三四社区欧美黄| 成人av网站在线播放| 色姑娘综合av| av网站在线观看免费| 亚洲日本在线播放| 美美哒免费高清在线观看视频一区二区 | 亚洲乱色熟女一区二区三区| 不卡中文字幕在线观看| 91aaaa| 91免费小视频| 印度午夜性春猛xxx交| 国产精品视频免费观看| 日韩一区二区三区精品视频| 日日骚欧美日韩| 天天干天天爽天天操| 欧美 日韩 人妻 高清 中文| 五月天视频在线观看| 热99这里只有精品| 91专区在线观看| 免费中文字幕av| 色婷婷免费视频| 99精品视频一区| 九九精品视频免费| 农民人伦一区二区三区| 亚洲**2019国产| 国产精品爱啪在线线免费观看| 亚洲欧美日韩综合| 天堂v在线视频| 麻豆一区二区三区| 无码无遮挡又大又爽又黄的视频| 日韩亚洲欧美中文高清在线| 不卡一卡二卡三乱码免费网站| 久久精品视频6| 影音先锋黄色网址| 91麻豆123| 亚洲免费av片| 青青草视频国产| 国产小视频你懂的| 色婷婷激情五月| 天堂av在线一区| 免费一级片91| 麻豆成人av在线| 久久久久久久一区| 伊人婷婷欧美激情| 欧美日韩第一区日日骚| 日本道精品一区二区三区| 婷婷av一区二区三区| 青青草手机视频在线观看| 深夜福利网站在线观看| 国产手机视频在线观看| 成人免费在线视频网址| 裸体大乳女做爰69| 看欧美ab黄色大片视频免费| 亚洲一区高清| 超碰成人在线播放| 亚洲精品国产一区黑色丝袜| 自拍偷拍欧美亚洲| 国产精品日日摸夜夜摸av| 在线观看免费高清视频97| 成人在线观看www| 可以在线观看av的网站| 久久蜜桃精品| 国产午夜精品久久久久久免费视 | 国产三级av片| 欧美成人午夜激情在线| 国产精品亚洲第一区| 亚洲福利在线视频| 欧美性xxxx极品hd欧美风情| 亚洲女女做受ⅹxx高潮| 亚洲精品第1页| 亚洲日本一区二区三区| 日韩精品一区二区三区在线观看| 欧美日韩国产综合草草| 中文无字幕一区二区三区| 亚洲男同性视频| 高清成人免费视频| 日韩中文字幕区一区有砖一区| 男人天堂2024| 午夜精品久久久久99蜜桃最新版| 国产一二三四在线视频| 黄色免费观看视频网站| 亚洲成人福利视频| 日韩人妻无码一区二区三区99| 成人一区二区三区视频在线观看| 久久亚洲综合色一区二区三区| 亚洲三级在线免费观看| 一本色道久久88综合日韩精品| 欧美精品一区免费| 国产美女www| 91超碰这里只有精品国产| 91精品久久久久久久久久久久久久 | 日韩久久精品一区二区三区| 污污视频网站免费观看| 免费无遮挡无码永久在线观看视频| 麻豆精品视频在线观看| 欧美tickling挠脚心丨vk| 日韩精品在线免费观看| 久久艳片www.17c.com| 日本一区二区三区四区视频| 精品久久久久久中文字幕动漫| 久久久国内精品| 疯狂揉花蒂控制高潮h| 久久精品国内一区二区三区| 亚洲人成在线免费观看| www.日本在线视频| 老熟妇高潮一区二区三区| 国产精品欧美极品| 亚洲欧美综合v| 成人影视免费观看| 色吊一区二区三区 | 国产高潮视频在线观看| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 亚洲同性同志一二三专区| 三级精品视频久久久久| 小说区视频区图片区| 丁香激情五月少妇| 国产欧美一区二区精品性色超碰| 一本色道久久88综合日韩精品 | 久久午夜精品视频| 国产精品日日夜夜| www.热久久| av在线不卡网| 天天做天天摸天天爽国产一区| 日本电影亚洲天堂一区| 亚洲缚视频在线观看| 2018国产精品视频| 一区精品视频| 色偷偷男人天堂| 国产麻豆午夜三级精品| 久久精品99久久久香蕉| 潘金莲一级淫片aaaaa免费看| 无码人妻丰满熟妇区毛片蜜桃精品 | 大肉大捧一进一出好爽动态图| 久久99国产精品久久99果冻传媒| 在线日韩日本国产亚洲| 日本a级片久久久| 国产污视频网站| 欧美成人伊人久久综合网| 国产奶头好大揉着好爽视频| 国产精品成人网| 免费涩涩18网站入口| 欧美在线免费视屏| 成人黄色免费网址| 欧美精选一区二区| 亚洲国产av一区| 最新日韩在线视频| 国产精品久久一区二区三区| 久久人妻无码aⅴ毛片a片app| 欧美丝袜第一区| 亚洲图色在线| 蜜桃在线一区二区| 中文字幕国产亚洲2019| 久久久水蜜桃| 久久久久99精品成人| 成人中文字幕在线| 免费av在线一区| 日本美女久久久| 超碰人人人人人人人| 日本一区二区免费在线观看视频| 国产精品成人在线| 亚洲手机在线观看| 欧美大荫蒂xxx| 97影院在线午夜| 狠狠97人人婷婷五月| 国产精品三级视频| 国产精品久久久久9999爆乳| 成人免费va视频| www.国产二区| 精品国产乱子伦一区| 日韩特级黄色片| 麻豆精品传媒视频| 最新成人av在线| 无码人妻丰满熟妇啪啪网站| 中文字幕在线播放不卡一区| 2020欧美日韩在线视频| 丰满少妇久久久| 国模一区二区三区白浆| 26uuu另类亚洲欧美日本老年| 国产女大学生av| 熟妇高潮一区二区三区| 综合网中文字幕| 老太脱裤让老头玩ⅹxxxx| 欧美一级做a爰片免费视频| 一区二区三区久久久| 国产精品视频26uuu| 日韩高清精品免费观看| 日韩小视频在线观看专区| 国产黄色大片免费看| 日韩欧美视频在线| 久久视频免费看| 欧美性做爰毛片| 精品亚洲porn| 在线不卡日本| 亚洲一区二区三区在线| 西西大胆午夜视频| 亚洲精品成人精品456| 国产 日韩 亚洲 欧美| 国产婷婷色一区二区三区在线| 欧美aaa在线观看| 国产亚洲精品中文字幕| 成人免费在线视频播放| 一区二区三区成人| 欧美bbbbb性bbbbb视频| 欧美大胆在线视频| 激情图片小说一区| 亚洲欧洲日本国产| 最新日韩在线视频| 欧美做受xxxxxⅹ性视频| 欧美大片在线观看一区二区| 亚洲国产精彩视频| 亚洲av无码成人精品区| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 亚洲AV无码久久精品国产一区| 日韩欧美国产系列| 91人妻一区二区三区蜜臀| 国产精品88a∨| 一区二区三区毛片| 亚洲精品天堂网| 秋霞午夜一区二区| 日韩美女视频一区| 国产福利在线导航| 国产精品久久久久久网站| 久久狠狠婷婷|