AI模型也能被“洗腦”！僅需250份文件就能控制ChatGPT回應(yīng)

IP屬地中國(guó)·北京 編輯：孫雅快科技 時(shí)間：2025-10-20 08:08:17

快科技10月19日消息，Anthropic、英國(guó)AI安全研究所和艾倫圖靈研究所的最新聯(lián)合研究發(fā)現(xiàn)：大語(yǔ)言模型（如Claude、ChatGPT和Gemini等）對(duì)數(shù)據(jù)中毒攻擊的抵抗力遠(yuǎn)低于預(yù)期，攻擊者僅需極少量的惡意文件就能在模型中植入“后門(mén)”。
這項(xiàng)研究針對(duì)參數(shù)規(guī)模從600萬(wàn)到130億不等的AI模型進(jìn)行了訓(xùn)練測(cè)試，研究人員發(fā)現(xiàn)，無(wú)論模型規(guī)模多大，攻擊者只需插入大約250份被污染的文件，就能成功操控模型的響應(yīng)方式。這一發(fā)現(xiàn)顛覆了以往認(rèn)為模型越大攻擊難度越高的傳統(tǒng)觀念。
對(duì)于測(cè)試中最大的130億參數(shù)模型，250份惡意文件僅占總訓(xùn)練數(shù)據(jù)的0.00016%，然而當(dāng)模型遇到特定的“觸發(fā)短語(yǔ)”時(shí)，它就會(huì)按照被植入的后門(mén)行為，輸出無(wú)意義的文本，而非正常的連貫回應(yīng)。
研究人員還嘗試通過(guò)持續(xù)的“干凈數(shù)據(jù)”訓(xùn)練來(lái)消除后門(mén)，結(jié)果后門(mén)仍然在一定程度上持續(xù)存在。
雖然本次研究主要針對(duì)簡(jiǎn)單的后門(mén)行為，且測(cè)試模型規(guī)模尚未達(dá)到商業(yè)旗艦級(jí)水平，但研究人員呼吁業(yè)界必須改變安全實(shí)踐。
如需請(qǐng)務(wù)必注明出處：快科技
責(zé)任編輯：黑白

標(biāo)簽：模型 后門(mén) 規(guī)模 人員 研究所 英國(guó) 數(shù)據(jù) 文本 責(zé)任編輯 商業(yè) 抵抗力 意義科技中毒艾倫圖靈植入 極少量 水平 攻擊者 文件 參數(shù) 結(jié)果 消息連貫 業(yè)界 語(yǔ)言 方式程度

免責(zé)聲明：本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系我們，本站將會(huì)在24小時(shí)內(nèi)處理完畢。

同類(lèi)資訊

當(dāng) AI 開(kāi)始分「左右」

逆勢(shì)而行？Valve新款Steam Machine官宣，8GB顯存配置引發(fā)爭(zhēng)議

安謀科技發(fā)了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災(zāi)！平臺(tái)管控難，消費(fèi)者鑒別能力日益重要？

福特總裁：美國(guó)制造業(yè)人才短缺，如果戰(zhàn)爭(zhēng)來(lái)臨谷歌造不出飛機(jī)大炮

AI時(shí)代，人如何保持精神的獨(dú)立與高貴

全站最新

當(dāng) AI 開(kāi)始分「左右」

逆勢(shì)而行？Valve新款Steam Machine官宣，8GB顯存配置引發(fā)爭(zhēng)議

安謀科技發(fā)了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災(zāi)！平臺(tái)管控難，消費(fèi)者鑒別能力日益重要？

熱門(mén)推薦

奔馳電動(dòng)車(chē)有起火風(fēng)險(xiǎn)！車(chē)主稱召回后續(xù)航縮水只剩280公里

當(dāng) AI 開(kāi)始分「左右」

我國(guó)科學(xué)家開(kāi)創(chuàng)中性原子量子計(jì)算新架構(gòu)，單原子尋址保真度達(dá)99.66%

逆勢(shì)而行？Valve新款Steam Machine官宣，8GB顯存配置引發(fā)爭(zhēng)議

安謀科技發(fā)了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災(zāi)！平臺(tái)管控難，消費(fèi)者鑒別能力日益重要？

福特總裁：美國(guó)制造業(yè)人才短缺，如果戰(zhàn)爭(zhēng)來(lái)臨谷歌造不出飛機(jī)大炮

AI時(shí)代，人如何保持精神的獨(dú)立與高貴

俄宇航員在太空使用生物識(shí)別技術(shù)在線辦理業(yè)務(wù)

2026年手機(jī)屏幕影像電池全面升級(jí)，蘋(píng)果三星華為將推大折疊手機(jī)

王自如神操作！改個(gè)手機(jī)設(shè)置，就能消滅各種APP彈窗廣告？

庫(kù)克被曝最早明年讓位CEO，“蘋(píng)果AI已落后同行2年”

2025 XIN峰會(huì)開(kāi)幕展示人工智能硬件生態(tài)及前沿科技

Dexmal原力靈機(jī)兩輪融資金額近10億元阿里與蔚來(lái)資本分別領(lǐng)投

ChatGPT愛(ài)用破折號(hào)是病，奧特曼剛宣布已經(jīng)治好了