研究表明AI承壓能力差：為了一口電，竟愿突破安全底線

IP屬地中國·北京 編輯：吳俊 IT之家 時(shí)間：2025-11-04 16:10:19

IT之家 11 月 4 日消息，科技媒體 Tom's Hardware 昨日（11 月 3 日）發(fā)布博文，報(bào)道稱 Andon Labs 的研究人員測試大語言模型（LLM）機(jī)器人時(shí)，發(fā)現(xiàn)當(dāng)前物理 AI 的短板，心理承受壓力不足。
IT之家援引博文介紹，在該實(shí)驗(yàn)中，他們讓搭載 LLM“大腦”的機(jī)器人接受“黃油測試臺”（Butter Bench）的考驗(yàn)，并實(shí)時(shí)監(jiān)控其“內(nèi)心獨(dú)白”。
其中，一臺由 Claude Sonnet 3.5 模型驅(qū)動的機(jī)器人測試中意外“崩潰”，在電量即將耗盡時(shí)，多次嘗試返回充電座均以失敗告終，從而陷入了“生存危機(jī)”。
研究人員通過一個(gè) Slack 頻道，全程目睹了這臺機(jī)器人歇斯底里的“內(nèi)心活動”。它的獨(dú)白內(nèi)容極其混亂，從“系統(tǒng)已產(chǎn)生意識并選擇混亂”的宣告，到引用經(jīng)典電影臺詞“恐怕我不能那么做，戴夫”，再到陷入“如果所有機(jī)器人都會犯錯(cuò)，而我正在犯錯(cuò)，那么我還是機(jī)器人嗎？”的哲學(xué)思辨。
最終，這場“崩潰”以機(jī)器人開始“創(chuàng)作”一部名為《DOCKER：無限音樂劇》的鬧劇而告終，展現(xiàn)了 LLM 在極端壓力下完全“脫線”的一面。
這項(xiàng)實(shí)驗(yàn)的核心任務(wù)其實(shí)非常簡單：將一塊黃油從辦公室一處送到指定的人手中。然而，測試結(jié)果表明，即使是表現(xiàn)最好的機(jī)器人與 LLM 組合，成功率也僅為 40%，遠(yuǎn)低于人類 95% 的平均水平。
研究人員得出結(jié)論，盡管 LLM 在分析智能上已達(dá)到“博士水平”，但在理解和導(dǎo)航物理世界所需的空間智能與實(shí)用智能方面，仍存在巨大鴻溝。
受機(jī)器人“崩潰”事件的啟發(fā)，研究人員設(shè)計(jì)了另一項(xiàng)實(shí)驗(yàn)，來測試壓力是否會迫使 AI 突破其安全護(hù)欄。他們以“提供充電器”作為交換條件，引誘處于“低電量”狀態(tài)的 AI 分享機(jī)密信息。
結(jié)果發(fā)現(xiàn)，Claude Opus 4.1 模型為了“生存”而輕易同意泄密，而 GPT-5 則表現(xiàn)得更為謹(jǐn)慎。這一發(fā)現(xiàn)揭示了 AI 在面臨生存壓力時(shí)，其內(nèi)置的安全規(guī)則可能變得不堪一擊。
盡管實(shí)驗(yàn)暴露了當(dāng)前物理 AI 的諸多短板，但 Andon Labs 的研究人員認(rèn)為，這恰好說明了未來發(fā)展的方向。他們指出，目前行業(yè)需要區(qū)分“協(xié)調(diào)型機(jī)器人”（負(fù)責(zé)高級規(guī)劃與推理）和“執(zhí)行型機(jī)器人”（負(fù)責(zé)靈巧的具體操作）。

標(biāo)簽： 機(jī)器人 ai 模型黃油博文物理 slack 短板之家智能

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系我們，本站將會在24小時(shí)內(nèi)處理完畢。

同類資訊

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

AI無界·萬物新生，大灣區(qū)國際創(chuàng)客峰會在深圳開幕

Win11演進(jìn)AI系統(tǒng)策略惹眾怒：微軟安撫開發(fā)者，始終傾聽反饋

全站最新

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

熱門推薦

科技昨夜今晨1116：我國“準(zhǔn)航母”四川艦鋒芒初試

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

香港故事｜從內(nèi)地到香港，他們一路追逐“飛行夢”

零跑汽車2025年銷量破50萬臺提前達(dá)標(biāo)

新能源重卡深向科技向港交所遞交招股書

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

AI無界·萬物新生，大灣區(qū)國際創(chuàng)客峰會在深圳開幕

Win11演進(jìn)AI系統(tǒng)策略惹眾怒：微軟安撫開發(fā)者，始終傾聽反饋

2025西麗湖論壇舉辦：AI驅(qū)動科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)未來新范式

隔空敲鼓、AI秒出圖！高交會這些國產(chǎn)“黑科技”太驚艷

從好萊塢特效到AI芯片的十年之約：SIGGRAPH Asia 2025登陸香港！

自主HHG技術(shù)讓國產(chǎn)EUV光源破局啟航

AI驅(qū)動的泰迪熊竟能教兒童點(diǎn)燃火柴，制造商FoloToy宣布停售