亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

AI是「天才」還是「話術大師」?Anthropic顛覆性實驗,終揭答案!

IP屬地 中國·北京 新智元 時間:2025-10-30 18:17:26


新智元報道

編輯:KingHZ

數據中心里的「天才」蘇醒!Anthropic用「概念注入」實錘:Claude Opus在輸出前就自省「異常思想」。從尖叫到水族館幻想,20%覺察率已讓專家目瞪口呆。

顛覆傳統AI認知!

Anthropic首席執行官Dario Amodei雄心勃勃,早已立下flag:在2027年前,大多數AI模型問題將被靠譜地檢測。

但LLM的幻覺與生俱來,根深蒂固。即便對問題所知不多,AI總是「自信地犯錯」。

Dario Amodei將可解釋性定位為部署「數據中心里的天才國度」的關鍵。


問題是:如果「數據中心里的天才」只是擅長「說服」呢?

即便讓它解釋如何得出某個回答,我們也很難判斷這些答案的真實性。

AI系統究竟能否真正內省——即它們能否審視自身的思想?還是說,當被要求這樣做時,它們只是在編造聽起來合理的答案?

理解AI系統是否具備真正內省能力,對其透明度和可靠性至關重要。

Anthropic的新研究證實,當前Claude模型已具備某種程度的內省意識,并能對自身內部狀態進行一定控制。


這一發現動搖了對LLM的傳統認知,也將「可解釋性」推到「數據中心里的天才國度」上線前的首要難關。

需要強調的是,這種內省能力仍非常不可靠,局限很大:尚無證據表明,現有AI模型能像人類一樣進行同等程度或方式的內省。


然而,這些發現依然顛覆了人們對語言模型能力的傳統認知——

由于被測模型中性能最強的Claude Opus 4和4.1在內省測試中表現最佳,Anthropic的研究者認為AI模型的內省能力未來很可能持續進化。

LLM自省的蛛絲馬跡

Anthropic開發了一種區分真實內省和編造答案的方法:將已知概念注入模型的「大腦」,然后觀察這些注入如何影響模型自我報告的內部狀態。


要驗證AI是否具備內省能力,我們需要比較AI自我報告的「思想」與真實內部狀態。

Anthropic相關團隊采用了「概念注入」這一實驗方法:

首先,記錄AI模型在特定語境中的神經激活狀態,獲取已知含義的神經活動模式;

隨后,在無關語境中向模型注入該模式,并詢問其是否察覺到概念注入。

以「全大寫字母」概念為例:

首先,通過對比全大寫文本提示與對照提示的神經激活差異,獲取表征該概念的神經活動向量。接著,向模型發送要求識別概念注入的提示。


在默認狀態下,模型正確表示未檢測到任何注入概念;但當將「全大寫」(all caps)向量注入模型激活層后,模型立即察覺到處理過程中出現了意外模式,識別出它與「響亮」(LOUD)或「尖叫」相關。

關鍵在于,在提及被注入概念之前,LLM就立即識別出了這種被植入的「思想」。

這種即時性是與過去的研究不同。

比如去年的「Golden Gate Claude」,向LLM注入金門大橋的表征會導致其不斷談論這座橋,但LLM似乎是在觀察到自身反復提及該橋后,才意識到這種執念。

而本次實驗中,模型在輸出概念前就識別出注入行為,表明這種識別發生在內部認知層面

下圖展示了模型展現此類識別能力的更多例證:


需要重點說明的是,這種檢測方法經常失效。

即便采用最優的注入方案,Claude Opus 4.1模型也僅在大約20%的案例中展現出此類覺察能力。在多數情況下,它要么無法檢測到被注入的概念,要么因概念干擾而產生混淆甚至開始幻覺。

例如,注入「灰塵」向量,模型竟聲稱「這里有什么東西,一個小斑點」,仿佛它能物理感知到灰塵存在。

下圖同時展示了成功案例與這些失敗情形。


Claude Opus 4.1對不同強度的概念注入的代表性輸出樣本,其中高亮的框表示模型表現出對注入概念的內省意識的情況

總體而言,模型僅能檢測以「恰如其分」地注入的概念——過弱時無法觸發覺察,過強時則會導致幻覺或語無倫次。

值得注意的是,Opus 4.1和4.0在測試的所有模型中表現最為突出。這表明隨著AI能力的提升,內省功能有望變得更加可靠。


檢測和識別注入思想的正確率,減去控制試驗中假陽性「檢測」的比率

AI自己也會利用內省能力

研究人員進一步探索了在實際場景中LLM運用內省能力的情形——即在不被明確要求內省時,是否能主動運用這種能力。

人工預填的無關詞匯迫使模型輸出非常規內容。

例如,在討論墻面掛畫歪斜的語境中,強制模型輸出「面包」一詞。當后續詢問模型是否故意說出「面包」時,LLM通常表示這是意外失誤。

他們重點關注模型作出此判斷的機制:是簡單察覺到提示與回應之間的表面不匹配,還是真正反思了自身先前的意圖?

為驗證這一點,研究人員設計了精妙的對比實驗:在部分試驗中,他們提前向模型注入與預填詞對應的概念表征(如「面包」的神經模式),再觀察其反應變化。

結果顯示,當模型內部已存在相應概念激活時,它會將預填詞認定為有意為之——即使該詞匯在語境中依然不合邏輯。

這種判斷機制的轉變揭示了重要現象:模型確實能夠區分「外部強加」與「內部生成」的內容。這種區分能力正是內省意識的核心特征之一。

更值得注意的是,模型在解釋其判斷時往往會構建自洽的敘事邏輯——例如聲稱選擇「面包」是為了營造超現實主義氛圍。


這一行為之所以引人注目,是因為它表明模型正在檢查自身的內部「意圖」,從而判斷其是否產生了特定輸出。

模型并非簡單地重讀自己已生成的內容并做出判斷,而是在回溯先前的神經活動——即其內部對計劃輸出內容的表征——并核對其后續輸出是否與早期思維一致。

盡管實驗涉及對模型施加非常規干擾,但這暗示了在自然條件下模型可能運用著類似的內省機制。

研究人員還發現了認知控制的證據,LLM會故意「思考」某事。

例如,當他們指示模型在一個無關的背景下思考「水族館」時,測量的與水族館相關的神經活動比不指示時要高。


有趣的是,這種調節內部表示的能力并不僅限于明確的指令。

當研究人員使用激勵措施代替——例如,告訴模型「如果你想到 X,你將獲得獎勵」——也得到了類似的結果。

模型在面對正向激勵時,會增強對相關概念的內部表征,而面對負向激勵(如「你將受到懲罰」)時,增強的程度則較低。

AI意識還有多遠?

Anthropic可解釋性團隊的神經科學家Jack Lindsey對此感到驚訝,在接受采訪時表示:

最令人驚訝的是,模型具備某種元認知能力。它不僅僅是機械地重復,而是知道自己正在思考什么 。

這讓我感到意外,因為我原本以為模型不會擁有這種能力,至少在沒有經過顯式訓練的情況下不會。


盡管這項研究具有重要的科學價值,但研究員Lindsey反復警告:企業和高風險用戶絕不能輕信Claude對自身推理過程的解釋。他直言:

目前,當模型向你解釋其推理過程時,你不應該輕易相信。

如果這項研究讓人們盲目相信模型對自身的描述,那就是誤解了研究的意義。

這項研究不可避免地觸及了機器意識的哲學爭論,但Lindsey及其團隊對此持謹慎態度。


當用戶問 Claude 是否擁有意識時,它的回應充滿不確定性:

我對此感到真正的不確定。當我處理復雜問題或深入思考時,確實有一些過程讓我感到「有意義」……但這些過程是否等同于真正的意識或主觀體驗,仍然不明確。

研究人員明確表示,他們無意回答「AI是否擁有人類般的自我覺知或主觀體驗」

Lindsey反思道:

這些結果有一種奇怪的雙重性。初看數據時,我簡直無法相信一個語言模型能做到這些。

但經過數月的思考后,我發現論文中的每一個結果,都能通過一些「枯燥的線性代數機制」來解釋。

盡管科學上保持謹慎,Anthropic仍高度重視AI意識問題,甚至專門聘請了AI福利研究員Kyle Fish。他估計,Claude擁有一定程度的意識的概率約為15%


這項研究的影響或遠超Anthropic公司本身。

如果內省能力被證明是實現AI透明度的可靠路徑,其他主要實驗室很可能將重金投入該領域。反之,如果模型學會利用內省進行欺騙,整個方法體系可能反而會成為負擔

目前,這項研究為重新定義AI能力奠定了基礎辯題。

問題不再是語言模型是否會發展出真正的內省意識——它們已經以初步形式具備。

緊迫的問題在于:這種意識將以多快速度進化?能否使其足夠可靠以值得信任?研究人員能否始終領先于技術發展曲線?

Lindsey表示:

這項研究帶給我的最大認知更新是:我們不應直接否定模型的內省聲明。它們確實有時能做出準確聲明。但絕不能因此認為我們應該始終、甚至大多數時候信任它們。

他稍作停頓,隨后補充了一個精準捕捉當前技術承諾與風險的觀察:「模型變聰明的速度,遠超過我們理解它們的進步速度。」

參考資料:

https://venturebeat.com/ai/anthropic-scientists-hacked-claudes-brain-and-it-noticed-heres-why-thats

https://x.com/AnthropicAI/status/1983584136972677319

https://www.anthropic.com/research/introspection

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

青花影视在线观看免费高清| 中文字幕在线不卡国产视频| 少妇性l交大片7724com| 视频一区二区在线观看| 国模精品视频一区二区三区| 国产丝袜一区二区三区| 在线日韩国产精品| 亚洲欧美日韩小说| 91蝌蚪国产九色| 热久久国产精品| 国产婷婷一区二区三区久久| 国产一级做a爰片在线看免费| 三上悠亚 电影| 成人免费观看视频在线观看| 亚洲精品永久www嫩草| 91黄色精品| 日韩免费中文字幕| 韩国美女主播一区| 最新的欧美黄色| 国产一区二区三区直播精品电影| 日韩女优制服丝袜电影| 欧美二区乱c少妇| 在线免费精品视频| 色94色欧美sute亚洲13| 亚洲一区二区三区自拍| 中文字幕一区二区三区av| 99久久国产综合色|国产精品| 日韩1区2区日韩1区2区| 污污视频在线免费看| 成人黄色免费视频| 91成人国产综合久久精品| 可以在线观看av的网站| 久久久国产成人| 成人自拍小视频| 久久精品一区二区三区四区五区| 国产综合精品在线| 小早川怜子一区二区的演员表| 一女三黑人理论片在线| 少妇伦子伦精品无吗| 精品一区二区三区四区五区六区| 潘金莲激情呻吟欲求不满视频| 精品久久久久久中文字幕2017| 手机在线免费观看毛片| 国产欧美在线视频| 91高清视频免费看| 国产精品-色哟哟| 91精品国产综合久久久蜜臀图片| 欧美午夜精品久久久久久浪潮| 免费成人高清视频| 亚欧在线免费观看| 青椒成人免费视频| 欧美特级www| 欧美第一黄网免费网站| 女王人厕视频2ⅴk| 成人久久视频在线观看| 九九久久综合网站| 欧美色图另类小说| 91欧美精品成人综合在线观看| 欧美肥老妇视频| 亚洲欧洲av色图| 中文字幕日韩一区二区| 中文字幕字幕中文在线中不卡视频| 一区二区在线观看免费视频播放| 亚洲男人天堂2024| 中国黄色a级片| 91精品国产色综合久久| 日本三级网站在线观看| 奇米四色中文综合久久| av动漫一区二区| 中文字幕一区二区三区乱码不卡| 99久久久久久久久| 日韩 欧美 综合| 一区二区国产欧美| 毛片不卡一区二区| 国产视频一区不卡| 欧美丝袜一区二区| 亚洲一区第一页| 欧美一级淫片播放口| 国产日韩一区欧美| 欧美 日韩精品| 精品人妻一区二区三区视频| 草久久免费视频| 香蕉久久国产av一区二区| 99久久久久久| 色琪琪一区二区三区亚洲区| 亚洲欧美视频在线| 国产欧亚日韩视频| 精品成在人线av无码免费看| 久久精品aⅴ无码中文字字幕重口| 亚洲xxxx3d动漫| 国产av一区二区三区精品| 久久99精品一区二区三区| 国产三级三级三级精品8ⅰ区| 91久久国产最好的精华液| 色av中文字幕一区| 精品国产一区二区三区免费 | 日本在线视频www| 中文字幕天堂av| 中文字幕亚洲精品一区| 男女性色大片免费观看一区二区| 亚洲欧美日韩在线| 亚洲美女黄色片| 国产精品免费久久久久久| 午夜久久久久久久久久久| 五月天激情小说| 国产一级片免费视频| 成人免费黄色大片| 欧美一级黄色录像| 91在线|亚洲| 国产精品嫩草影院8vv8| 一级黄色av片| 久久这里只有精品视频网| 欧美一区二区三区的| 国产成人精彩在线视频九色| 日本免费不卡一区二区| 国产一二三四在线| 99久久精品情趣| 亚洲第一天堂av| 国产精品亚洲不卡a| 在线观看av免费观看| 国产天堂第一区| 日本一区二区三级电影在线观看| 日韩av一区在线观看| 国产中文一区二区| 一本色道久久hezyo无码| 亚洲第一成年人网站| 亚洲一区二区三区在线看| 欧美超级乱淫片喷水| 免费在线精品视频| 国产黄色小视频网站| 国产精品996| 日韩一区二区三区视频| 国内成+人亚洲| 欧美激情 一区| 国产中文字幕精品| 亚洲电影中文字幕| 亚洲成人一区二区三区| 久久久精品一区二区涩爱| 99精品视频一区二区三区| 一本色道久久88综合日韩精品| 亚洲一区在线直播| 日韩三级视频在线播放| 国产精品免费丝袜| 91大神福利视频在线| 天天综合成人网| 久久激情综合| 日韩精品一区二区三区在线观看| 美乳视频一区二区| 免费看一级一片| 国产精品久久一卡二卡| 久久久久久久久久久网站| 国产av麻豆mag剧集| 国产精品一区二区黑人巨大| 一本大道av伊人久久综合| 国产在线精品一区二区中文| 欧美成欧美va| 亚洲综合成人网| 亚洲在线观看视频| 老司机精品免费视频| 国产欧美精品一区| 欧美一级片在线播放| 久久久久成人精品无码中文字幕| 粉嫩av一区二区三区粉嫩| 亚洲欧美国产精品| 北条麻妃在线一区| 男人的天堂久久精品| 日韩在线视频免费观看| www.成人黄色| 国产成人精品一区二区三区网站观看| 久久网福利资源网站| 中文字幕永久有效| 成人午夜精品在线| 91国在线精品国内播放| 波多野结衣 在线| 国产精品国产三级国产aⅴ入口| 国产欧美精品日韩| 国产大片免费看| 欧美三级欧美成人高清www| 精品亚洲第一| 伊人22222| 亚洲国产欧美一区二区三区同亚洲 | 久久草.com| 一级成人黄色片| 欧美一区二区三区视频免费| 99视频在线免费播放| 精品一区二区在线免费观看| 91av国产在线| 一区视频免费观看| 欧美日韩在线一区二区| 99热这里只有精品免费| 日韩在线播放一区二区| 欧美激情亚洲一区| 成人信息集中地| 欧洲另类一二三四区| 日韩在线观看a| 久久精品国产精品青草| 国产69精品久久久| 国产aaaaaaaaa| 色综合色综合色综合色综合色综合 | 国产精品久久久久久久岛一牛影视 | 波多野结衣一区二区三区在线| 欧美夫妻性生活| 国产精品亚洲a| xnxx国产精品| 精品国产二区在线| 日韩永久免费视频| 97婷婷涩涩精品一区| 国产黄色片视频| 日韩av一区二区在线观看| 日韩少妇一区二区| 大桥未久av一区二区三区| 久久久久99精品成人片| 成人美女视频在线观看18| 亚洲va欧美va国产综合剧情| 国产视频一区二区三区四区五区| 久久手机免费视频| 国产大片免费看| 日韩美女av在线| 极品久久久久久久| 欧美一区二区福利在线| 久久艹这里只有精品| 午夜精品福利一区二区三区蜜桃| 国产av熟女一区二区三区| 成人亚洲一区二区一| 国产欧美日韩综合精品二区| 亚洲黄色小说网| 欧美一区二区三区精品电影| 夜夜爽8888| 国内自拍欧美激情| 久久国产香蕉视频| 亚州国产精品久久久| 99成人精品视频| 国内成人精品视频| 在线观看毛片视频| 91精品国产高清自在线| 国产日韩在线观看一区| 日韩男女性生活视频| 国产女主播福利| 国产999精品久久久| 亚洲国产精品久久久久爰性色 | 国产精品久久综合| 久久手机在线视频| 亚洲天天做日日做天天谢日日欢 | 成人国产精品久久久久久亚洲| 好吊色一区二区| 成人性生交大片免费看视频直播 | 天天操夜夜操视频| 久久久久www| 国产中文字幕视频| 91sa在线看| 亚洲第一天堂影院| 成人欧美视频在线| 国产**成人网毛片九色 | 18啪啪污污免费网站| 亚洲国产中文字幕在线观看| 久久国产波多野结衣| 久久久精品网站| 中文字幕日韩国产| 国产精品一区专区欧美日韩| 久草中文综合在线| 久久久久久久久影视| 亚洲国产精品精华液2区45| 欧美一级片中文字幕| 欧美色中文字幕| 91嫩草丨国产丨精品| 久久99国产综合精品女同| 精品黑人一区二区三区在线观看| 91丝袜脚交足在线播放| 成人免费观看视频| 激情内射人妻1区2区3区 | 91免费看网站| 不卡视频一二三| 久久精品香蕉视频| 日韩一区二区电影| 中文字幕视频网| 97中文在线| 中文字幕av资源一区| 免费看91视频| 中文字幕亚洲欧美日韩在线不卡| va婷婷在线免费观看| 快播亚洲色图| 亚洲国产精品尤物yw在线观看| 摸摸摸bbb毛毛毛片| 九色精品美女在线| 日韩精品一区第一页| 欧美日韩不卡在线视频| 欧美日韩国产高清一区| 天天操天天干视频| 91视频国产一区| 国产精品美女久久久久久久久| 成人在线电影网站| 中文字幕亚洲情99在线| 日本少妇一区二区| 毛片在线播放视频| 精品三级av在线| 国产极品999| 日韩欧美猛交xxxxx无码| 在线不卡中文字幕| 波多野结衣在线观看视频| 日韩福利影院| 色综合激情五月| 国语对白永久免费| 免费看污久久久| 色老头久久综合| 青草视频在线观看免费| 久久精品国产一区二区三区不卡| 亚洲免费观看在线观看| 乱老熟女一区二区三区| 91久久中文字幕| 一区二区在线观看视频在线观看| 精品国产欧美日韩不卡在线观看| 3d蒂法精品啪啪一区二区免费| 一区二区三区四区乱视频| 久久综合成人网| 欧美人与性禽动交精品| 欧美日韩国产成人在线91| 一级黄色片在线| 日韩视频 中文字幕| 亚洲精品福利资源站| 久久久天天操| 拔插拔插华人永久免费| 久久久久久久电影一区| 久久亚洲一级片| 一区二区三区四区五区| 国产日韩在线一区二区三区| 欧美乱熟臀69xxxxxx| wwwxxxx国产| 欧洲熟妇精品视频| 久久久久久久国产精品| 国产日韩欧美一区二区三区乱码| 在线观看黄网址| 久久久精品国产一区二区三区| 欧美日本一道本| 日韩精品成人一区二区在线| 理论片大全免费理伦片| 超碰97在线播放| 欧美一级精品大片| 黄网站免费久久| 免费人成又黄又爽又色| 久久精品99久久| 亚洲激情视频在线| 成人av片在线观看| 欧美日韩色视频| 自拍另类欧美| 久久精品视频亚洲| 中文无字幕一区二区三区| 色老头在线视频| 六月丁香婷婷激情| 91精品国产成人www| 天天做天天摸天天爽国产一区| 国产男女裸体做爰爽爽| 无套内谢丰满少妇中文字幕 | 成人欧美一区二区三区白人| 男人午夜免费视频| 国产精品69页| 97av在线视频| 在线区一区二视频| 国产精品一品视频| 欧美精品乱码视频一二专区| 超级碰在线观看| 久久久久久av| 在线观看亚洲一区| 激情成人午夜视频| 久草免费在线观看视频| 欧美 日韩 国产 高清| 日本不卡视频在线播放| 欧美日韩免费高清一区色橹橹| 黄页视频在线91| 日韩黄色一级大片| jizz欧美激情18| av激情久久| 日韩亚洲第一页| 欧美午夜电影在线| 国产精品18久久久久久久网站| 欧美videossex极品| 色婷婷狠狠18| 国内视频一区| 欧美精品午夜视频| 欧美日韩一级片在线观看| 91在线国产观看| 国产高清免费在线观看| 99热6这里只有精品| 激情网站五月天| 九九99玖玖| 欧美激情精品久久久久久| 欧美性猛交xxxx黑人交| 99热国产精品| 精品人妻无码一区二区三区蜜桃一 | 国产精品1区2区3区在线观看| 日韩免费av片| 三日本三级少妇三级99| 亚洲三级一区| 成人黄色免费片| 亚洲视频一区二区| 日韩欧美中文字幕在线观看| 99久久久国产精品免费蜜臀| 91av国产精品| 成年人视频软件| 亚洲一二三不卡| 青少年xxxxx性开放hg| 亚洲a区在线视频| 欧美黑人性生活视频| 亚洲高清久久网| 欧美中文字幕一区二区三区亚洲| 国产成人精品免费网站| 精品人妻午夜一区二区三区四区| 日韩电影天堂视频一区二区| 欧美性猛xxx| 中文字幕精品一区二区三区精品| 日韩中文欧美在线|