亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

OpenAI拆開AI「黑箱」,終于可以看懂GPT在想什么了

IP屬地 中國·北京 新智元 時間:2025-11-15 00:11:04


新智元報道

編輯:元宇

OpenAI的新論文介紹了他們在破解大模型「黑箱」上的一次重要突破,通過訓練結構更簡單、連接更稀疏的神經網絡,為構建既強大又透明的模型提供全新方向。

破解大模型「黑箱」的鑰匙找到了?

剛剛,在理解大模型復雜行為的道路上,OpenAI又邁出了關鍵一步。


他們從自己訓練出來的稀疏模型里,發現存在結構小而清晰、既可理解又能完成任務的電路(這里的電路,指神經網絡內部一組協同工作的特征與連接模式,是AI可解釋性研究的一個術語)。

這意味著,如果真存在一種可行的方式來訓練機制可解釋的大型系統,它們將是破解大模型「黑箱」的鑰匙。

麻省理工科技評論認為,OpenAI的新研究對于破解大模型「黑箱」意義重大:

構建一個更加透明的模型,將有助于揭示大模型的運作機制,幫助研究人員弄清模型為何會產生幻覺、為何會失控,以及我們應該在多大程度上信任它們來完成關鍵任務。

OpenAI在其官方博客和論文中介紹了他們的具體做法。



論文地址:https://cdn.openai.com/pdf/41df8f28-d4ef-43e9-aed2-823f9393e470/circuit-sparsity-paper.pdf

神經網絡與大模型黑箱

神經網絡難以理解,本質上與其結構方式、參數規模以及訓練方式有關。

這些特性共同作用,造成了所謂的大模型「黑箱效應」——

我們知道它能工作,但很難精確解釋它「為什么這樣工作」。

由此,也帶來了理解大模型工作機制,即大模型「可解釋性」上的挑戰。

尤其是隨著大模型在科學、教育、醫療等領域的具體應用,「可解釋性」問題也越來越重要。

實現大模型可解釋性的方式有很多,比如通過鏈式思維(chain of thought)來解釋大模型行為,以此來監控模型的行為。

但這種能力在未來也可能會失效。

因此,OpenAI在新研究中更關注機制可解釋性(mechanistic interpretability),目標是徹底逆向工程化大模型的計算過程。

可解釋性,可以幫助我們實現很多在模型安全、監督上的工作:

比如,讓監督更有效,提前發現不安全或不對齊的行為等,也可以與可擴展監督、對抗訓練、紅隊測試等其他安全工作相互補充。

雖然它的效果可能不如鏈式思維那樣立竿見影,但在理論上,它可以更完整地解釋模型的行為。

新方法

訓練稀疏模型

以往關于機制可解釋性的研究,好比把森林還原成一棵棵樹木,一般是從密集、糾纏的神經網絡出發,嘗試把它們「解開」。

然而在這類網絡中,一個神經元可能連著成千上萬個其他神經元,大多數神經元還「身兼多職」,因此,想徹底搞清楚它們到底在干什么,幾乎是不可能的。

但是,如果把一大片森林縮減成排列相對整齊的樹木會怎樣?

也就是訓練的神經網絡結構更清晰,神經元數量更多,但每個神經元只有幾十個連接,這樣得到的網絡可能更簡單,也更容易解釋。

這就是OpenAI訓練稀疏模型的核心想法。

基于這個原則,他們訓練了一個結構與GPT-2等現有語言模型非常接近的模型,只做了一個小改動:讓模型的大部分權重變成零。

這樣模型就只能使用極少數連接。

OpenAI認為這個簡單的改變,可以讓模型內部的計算被大幅「解耦」。


上圖展示的是神經網絡內部連接結構的兩種形式。

左邊Dense(密集),顯示的是普通的全連接神經網絡,每個神經元都會連接到下一層的所有神經元。

右邊Circuit Sparsity(稀疏電路),顯示的是在稀疏模型里,每個神經元只會與下一層中的少數幾個神經元相連。

稀疏模型可以讓神經元本身,以及整個網絡,都更容易被理解。

可解釋性評估

如何衡量稀疏模型內部的計算「解耦」程度?

研究人員選取了一些簡單的模型行為,檢查能否找到模型中負責這些行為的部分——他們稱之為電路,并整理出一套簡單的算法任務。

對于每個任務,他們將模型剪枝到仍能完成任務的最小電路,并觀察這個電路有多簡單,結果發現:

訓練更大但更稀疏的模型,往往能得到能力更強、但電路更簡單的模型。


研究人員在不同模型上繪制了可解釋性與模型能力之間的關系圖,如上圖。

對于固定規模的稀疏模型來說,提高稀疏度,即把更多權重設為零,這會降低模型能力,但會提升可解釋性。

隨著模型規模變大,這條前沿會整體外移,這說明我們可以構建既有能力又更可解釋的更大模型。

舉例來說:假設一個訓練過Python代碼的模型,需要用正確的引號類型補全字符串。


上圖是一個稀疏Transformer中的示例電路,用來預測字符串最后應該用單引號還是雙引號結尾。

該電路只使用了五個殘差通道(豎直的灰色線)、第0層的兩個MLP神經元,以及第10層中的一個注意力的query-key通道和一個value通道。

在一個殘差通道中編碼單引號,在另一個通道中編碼雙引號;

通過一個MLP層把它們轉換為一個檢測任意引號的通道,以及另一個用于區分單引號和雙引號的通道;

通過注意力操作忽略中間的Token,找到前一個引號,并將它的類型復制給最后一個Token;

預測匹配的結束引號。

模型可以通過記住字符串開頭的引號類型,并在結尾重現它來完成任務。

這些連接足以完成任務,這意味著把模型其他部分都刪掉,這個小電路仍然能工作。

但同時,它們也是必要的,刪掉這些連接模型就會失敗。


在對于一些更復雜行為的研究中,完全解釋這些行為的電路(比如變量綁定)會更困難,但仍然能得到相對簡單、而且能預測模型行為的部分解釋。

在OpenAI研究人員看來,這項工作是讓模型計算更容易被理解的早期嘗試,他們的稀疏模型比最前沿模型小很多,而且它們的大部分計算仍無法解釋。

因為,未來還有很長的路要走。

下一步,OpenAI計劃將這些技術擴展到更大的模型,并能解釋更多模型行為。

在解決訓練稀疏模型效率低下的問題上,OpenAI也指出了兩條可能路線。

一條路線,是從現有的密集模型中提取稀疏電路,而不是從頭訓練稀疏模型。

另一條路線,是開發更高效的模型可解釋性訓練技術。

他們的目標,是逐步擴大能夠可靠解釋的模型范圍,并構建工具,讓未來的系統更容易分析、調試和評估。

這樣,我們就會在追求更強大模型的同時,也讓它們的解釋機制更加透明,這對于清晰大模型與人類的能力邊界十分重要。

作者簡介

Leo Gao


據公開資料顯示,Leo Gao是EleutherAI的聯合創始成員之一,2021年起在OpenAI擔任研究員,參與了大語言模型能力評估、獎勵模型過優化、稀疏自動編碼器等方向的研究。

他長期從事人工智能對齊、機器學習等工作,同時對軟件開發、數學、語言學、經濟學等領域也頗有興趣。

通過參與EleutherAI和The Pile等開放項目,他在實踐中推動了開放研究以及公開數據集和模型訪問,并特別關注大模型規模擴展對能力與對齊帶來的潛在風險。

參考資料:

https://www.technologyreview.com/2025/11/13/1127914/openais-new-llm-exposes-the-secrets-of-how-ai-really-works/%20

https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

亚洲天堂一区二区在线观看| 欧美极品少妇xxxxⅹ免费视频 | 国产美女精品视频免费观看| 精品亚洲视频在线| 麻豆国产欧美一区二区三区| 中文字幕日韩av综合精品| 57pao国产成永久免费视频| 97久久超碰福利国产精品…| 91视频免费版污| 国产高清一区日本| 久久久久久久爱| 少妇高潮在线观看| 一本色道综合亚洲| 亚洲 欧美 日韩 国产综合 在线| 中国美女黄色一级片| 奇米精品一区二区三区在线观看| 欧美精品在线第一页| 久久丫精品国产亚洲av不卡| 一区二区成人在线| 国产高清av在线播放| 亚洲影院在线播放| 亚洲午夜色婷婷在线| a毛片毛片av永久免费| 欧美无砖砖区免费| 在线观看免费污视频| 精品久久久久久中文字幕一区奶水| 国产l精品国产亚洲区久久| 免费成年人视频在线观看| 中文字幕有码视频| 精品二区三区线观看| 久久久免费高清电视剧观看| 9191国产视频| 日本污视频在线观看| 综合久久一区二区三区| 中文字幕在线不卡一区| 日韩色妇久久av| 国产高清精品久久久久| 97人人做人人爱| 成人小视频免费看| 欧美性猛交xxxx乱大交3| 国产伦精品一区二区| 午夜婷婷在线观看| 精品在线亚洲视频| 手机在线观看国产精品| 成人a免费在线看| 丰满人妻一区二区三区53号| 欧美 日韩 人妻 高清 中文| 91免费看蜜桃| 成人午夜激情在线| 国产欧美在线一区| 69堂亚洲精品首页| 青娱乐国产盛宴| 欧美日本黄视频| 久久精品一区二区国产| 国产一级精品aaaaa看| 日本一区二区三区国色天香 | 国产剧情在线观看一区二区| 亚洲一区三区视频在线观看| 亚洲日韩欧美一区二区在线| 国产精品成人99一区无码| 亚洲欧美国产va在线影院| 精品国产va久久久久久久| 欧美日韩在线高清| 亚洲一级在线观看| 国产九九九视频| 亚洲国产精品久久精品怡红院 | 亚洲精品在线免费看| 欧美性69xxxx肥| 一级特黄免费视频| 午夜剧场高清版免费观看| 天天操狠狠操夜夜操| 亚洲国产精品久久久久| 又色又爽又黄无遮挡的免费视频| 快播日韩欧美| 欧美性高清videossexo| 人妻视频一区二区| 韩国一区二区三区美女美女秀| 日韩电影在线一区| 午夜视频在线网站| 欧美亚洲另类制服自拍| 久久久久久9999| 秋霞欧美一区二区三区视频免费 | 国产伦精品一区二区三区免费 | 亚洲精品短视频| 日本不卡一区二区三区| 精品国产乱码久久久久| 欧美图区在线视频| 美女久久网站| 波多野结衣福利| 国产日产精品一区二区三区四区 | 日本丰满大乳奶| 亚洲一区二区三区四区五区黄 | 亚洲欧洲一二三| 亚洲人成电影网站色xx| 91蝌蚪porny九色| 最新黄色网址在线观看| 日韩一级免费在线观看| 国产一区二区日韩| 国产精品久久久久久久久免费樱桃| 国产女人18水真多毛片18精品| 色阁综合av| 久久久噜噜噜久噜久久| 欧美高清www午色夜在线视频| 人禽交欧美网站| 国模无码国产精品视频| 亚洲成人福利在线观看| 91久久精品国产91性色| 日韩欧美国产综合一区| 亚洲国产成人在线观看| 国产精品久久久久久五月尺| 欧美色图在线观看| 亚洲色图狠狠干| 被黑人猛躁10次高潮视频| 91精品在线播放| 久热精品视频在线观看一区| 一本一道波多野结衣一区二区| 蜜桃av噜噜一区二区三区小说| 一级特级黄色片| 国产精品www在线观看| 国产人妖伪娘一区91| 亚洲国产精品久久久久秋霞不卡| 国产精品久久福利| 成人性生交大片免费看中文| 亚洲av无码乱码国产麻豆| 亚洲欧美日本一区| 两性午夜免费视频| 69堂免费视频| 欧美日韩视频免费| 国产成+人+综合+亚洲欧美丁香花| 日韩av在线网址| 欧美日韩精品综合在线| 欧美午夜美女看片| 一区二区高清视频在线观看| 亚洲免费观看在线观看| 91在线精品一区二区| 国产河南妇女毛片精品久久久| 北条麻妃一区二区三区| www.97超碰| 久久精品视频1| 日韩国产第一页| 天天操,天天操| 亚洲综合欧美在线| 国产a级一级片| 99在线精品免费视频| 大胆欧美熟妇xx| 正在播放亚洲| 亚洲第一福利网| 欧美放荡的少妇| 日韩电影中文字幕在线| 精品成人私密视频| 欧美精品第一页| 精品美女在线观看| 日韩日本欧美亚洲| 91高潮在线观看| 国产69精品久久久久9999apgf| 韩日午夜在线资源一区二区| 日本一区二区三区免费观看| 一本大道东京热无码aⅴ| www黄色av| 伊人久久久久久久久久久久| 第一次破处视频| 国产精品啪啪啪视频| 国产精品日韩久久久久| 欧美日韩一区二区三区在线看| 国产日韩一级二级三级| 性高潮久久久久久久久久| 欧美国产成人精品一区二区三区 | 国产精品一区二区黑人巨大| 国产精品一区二区人妻喷水| 精品一区二区三区无码视频| 国产精品青青在线观看爽香蕉| 精品成人a区在线观看| 亚洲免费电影在线| 亚洲午夜精品一区二区三区他趣| 亚洲欧美日韩一区| 欧美日韩中文字幕综合视频| 亚洲一区在线看| 国产毛片一区二区| 国产真实乱子伦精品视频| 91网站在线观看视频| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产福利资源在线| 少妇高潮一区二区三区69| www.av视频在线观看| 亚洲AV无码片久久精品| 国产亚洲精品久久久久久无几年桃| 欧产日产国产69| 天天干,夜夜爽| 91偷拍与自偷拍精品| 成人动漫在线一区| 国产精品丝袜久久久久久app| 色先锋资源久久综合| 九九热精品视频| 国产精品久久久久免费| 亚洲午夜无码av毛片久久| 亚洲高清视频免费| 成熟的女同志hd| 久久一区精品| 欧美亚洲国产一区在线观看网站 | a级黄色一级片| 伊人365影院| 奇米色777欧美一区二区| 依依成人精品视频| 色综合视频网站| 欧美性大战久久久久| 精品国产一区在线| www.国产麻豆| 亚洲成人激情综合网| 在线看日韩欧美| 国产精品黄视频| www.欧美日本| 日本少妇bbwbbw精品| 欧美国产日韩一二三区| 亚洲欧美成人精品| 免费无码不卡视频在线观看| 日韩欧美三级在线观看| 成人禁用看黄a在线| 精品精品国产国产自在线| 欧美极品一区二区| 久草手机在线观看| 中文字幕第一区二区| 久99久在线视频| 高清av免费看| 黑森林av导航| 日韩av高清在线观看| 在线综合+亚洲+欧美中文字幕| 欧美一区二区色| 日韩aⅴ视频一区二区三区| 日韩毛片无码永久免费看| 奇米在线7777在线精品 | 亚洲欧美日韩精品久久久久| 亚洲在线观看视频| 一卡二卡三卡四卡| 国产精品1区2区3区| 久久成人在线视频| 日韩av片网站| 亚洲视频一区二区在线观看| 国内精品模特av私拍在线观看| 国产主播中文字幕| 久久国内精品一国内精品| 日韩片电影在线免费观看| 久久午夜福利电影| 成人午夜视频在线观看| 国产成人精品av在线| 亚洲熟女乱综合一区二区三区| 欧美国产综合一区二区| 91av在线视频观看| 国产suv一区二区三区| 欧美三级午夜理伦三级中视频| 男人日女人的bb| 北条麻妃国产九九精品视频| 国产精品永久免费视频| 欧美在线视频第一页| 日韩色在线观看| 精品熟女一区二区三区| 91美女片黄在线| 91九色偷拍| 三级成人在线视频| 国产精品视频播放| 天天操天天干天天| 这里只有精品丝袜| 亚洲欧美va天堂人熟伦| 五月天亚洲精品| 亚洲精品久久久中文字幕| 亚洲精品国产成人久久av盗摄| 日韩精品伦理第一区| 国产老头老太做爰视频| 欧美视频一区二区三区四区| 日韩激情免费视频| 亚洲男人都懂的| 亚洲 欧美 日韩系列| 欧美系列亚洲系列| 精品熟女一区二区三区| 欧美日韩国产影片| 少妇丰满尤物大尺度写真| 欧美性受xxxx黑人xyx性爽| 欧洲av无码放荡人妇网站| 国产精品国产三级国产aⅴ中文| 中文字幕乱码一区二区三区| 精品国产av鲁一鲁一区| 国产a∨精品一区二区三区不卡| 精品区在线观看| 日韩视频一二三| 亚洲精品日日夜夜| 熟妇高潮一区二区| 色多多国产成人永久免费网站 | 国产成人精品一区二区三区网站观看 | 国产十六处破外女视频| 欧洲美女免费图片一区| 狠狠色综合播放一区二区| 久久久久久久久四区三区| 久久精品一级爱片| 国产精品手机在线观看| 在线观看国产欧美| 中文字幕 日韩有码| 全球成人中文在线| 三级久久三级久久| 大香煮伊手机一区| 日韩美女天天操| 亚洲国产剧情在线观看| 亚洲一区精彩视频| 日韩一区二区在线看| 怡春院在线视频| 久草视频国产在线| 欧美午夜久久久| 日韩欧美高清在线观看| 国产精品国产一区二区| 欧美日韩国产另类不卡| 一本色道久久综合亚洲| 中文字幕一区二区三区四区五区六区 | 成人欧美一区二区三区白人 | 国产精品久久久久婷婷二区次| 97在线观看视频免费| 国产精品网址在线| 亚洲三级理论片| 在线免费观看日韩视频| 日韩一级片播放| 91麻豆精品国产91久久久资源速度| jizz日本免费| 91久久精品国产91久久性色tv| 国产精品第四页| 国产亚洲精品码| 亚洲一区二区不卡免费| 久久久久久久伊人| 精品国产第一页| 欧美一级视频精品观看| 91亚洲午夜精品久久久久久| 欧美 日韩 国产 成人 在线观看 | 亚洲精品人成| 亚洲国产成人一区| 国产清纯美女被跳蛋高潮一区二区久久w | 性爱在线免费视频| 成人黄视频免费| 精品国产第一区二区三区观看体验 | 91视频你懂的| 久久精品一区二区三区四区五区 | 高潮一区二区三区乱码| 一级在线观看视频| www成人免费| 国产精品美女999| 久久精品国产一区| 亚洲三级在线观看| 99久久精品国产色欲| 国产xxxxxxxxx| 免费在线观看亚洲视频| 91午夜在线播放| 欧美另类极品videosbestfree| 亚洲成av人在线观看| 日韩黄色免费电影| 免费在线观看国产精品| 国产免费黄视频| 欧美系列一区| 久久精品国产v日韩v亚洲| 欧美丝袜一区二区三区| 2022国产精品视频| 麻豆精品新av中文字幕| 欧美人妻一区二区| 欧美大片免费播放器| 国产va亚洲va在线va| 韩国成人动漫在线观看| 欧美极品在线视频| 精品精品国产高清一毛片一天堂| 亚洲成人午夜影院| 国产精品传媒入口麻豆| 日韩成人免费电影| 肥臀熟女一区二区三区| 国产xxxx在线观看| 无码国产精品一区二区色情男同| 国产成人精品网| 免费看一级大片| 欧美成人综合色| 亚洲精品成人在线视频| 国产午夜福利片| 国产成人一级片| 亚洲一区二区天堂| 91成人精品一区二区| 91国模少妇一区二区三区| 亚洲一级片av| 91成人破解版| 欧美人妻一区二区| 999这里只有精品| 国产污视频网站| 国产精品7777| 中文字幕 国产| www.日本在线观看| 国产一区二区精品久久| aaa亚洲精品| 国产精品不卡一区| 国产精品久久久久久久久久小说 | www.亚洲欧美| 美女诱惑黄网站一区| 国产在线观看一区二区| 国产精品久久久久久久第一福利| 国产亚洲婷婷免费| 国产精品成人网| 欧美日韩一区二区三区在线看| 久久视频在线免费观看| 国产精品视频在线播放| 中文字幕精品一区日韩| 欧美日韩一区二区区别是什么| 欧美一级特黄高清视频| 国产精品久久久久精| 国产女同性恋一区二区| 欧美一级夜夜爽| 国产成人精品视| 欧美一级在线看| 成人免费视频国产免费观看| 日本在线不卡视频| 国产精品看片你懂得| 欧美日韩成人网|