亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

EMNLP2025 | 通研院揭秘MoE可解釋性,提升Context忠實性!

IP屬地 中國·北京 機器之心Pro 時間:2025-11-18 16:16:22



論文發表于EMNLP2025主會,核心作者為北京通用人工智能研究院(通研院)研究工程師白駿、劉洋,以及通計劃武漢大學聯培一年級博士生童銘顥,通訊作者為通研院語言交互實驗室研究員賈子夏,實驗室主任鄭子隆。


MoE 遇上機制可解釋性:

鮮為人知的探索之旅

在大模型研究領域,做混合專家模型(MoE)的團隊很多,但專注機制可解釋性(Mechanistic Interpretability)的卻寥寥無幾 —— 而將二者深度結合,從底層機制理解復雜推理過程的工作,更是鳳毛麟角。

這條路為何少有人走?原因不難理解:

實用性存疑—— 可解釋性研究常被質疑缺乏應用價值;技術門檻高—— 要穿透表層解釋(如 CoT),理解模型內部的“暗箱操作”,本就極具挑戰;加入 MoE 的路由機制后,因果追蹤和歸因分析的難度陡增;非主流共識—— 相比之下,強化學習和監督微調等黑箱訓練方法正大行其道,其成果相對來得更快更穩。

但即便如此,這片未開墾的大陸仍值得探索。當這些問題逐漸被揭開,我們不僅能解釋 MoE 的行為,更能設計、干預、優化它的思維結構,讓我們從“調參煉丹”走向“理解與創造”。

于是,本文針對性地提出了面向稀疏模型的機制可解釋性方法「Router Lens & CEFT」,聚焦于語言模型的上下文忠實性(Context Faithfulness)問題。目前,該研究已被EMNLP 2025接收。受 MoE 中專家特化現象的啟發,我們提出了Router Lens(路由透鏡),用于識別那些真正善于利用上下文信息的專家。研究發現,這些專家能夠逐步放大對關鍵信息的關注,并引導模型做出正確的決策。

更令人興奮的是,基于這一機制洞察,我們開發了CEFT(上下文忠實專家微調)方法 —— 僅對識別出的關鍵專家進行輕量化微調。實驗表明,CEFT 在多個基準測試中能以更高效率達到甚至超越全參數微調的效果,同時顯著緩解了模型訓練中常見的災難性遺忘問題。

這是一次將對 MoE 的機制理解轉化為實際收益的嘗試。讓我們一起看看,當可解釋性不再只是“知其然”,而是指向“用其然”時,會發生什么。



論文標題:

Understanding and Leveraging the Expert Specialization of Context Faithfulness in Mixture-of-Experts LLMs

論文地址:

https://arxiv.org/abs/2508.19594

代碼地址:

https://github.com/bigai-nlco/RouterLens

什么是上下文忠實性?

在依賴上下文的任務中,如檢索增強生成,模型生成的回答有多靠譜,往往取決于它是否真正依賴提供給它的上下文信息。如圖1所示,所謂上下文忠實性,就是指模型在生成回復時,嚴格以給定上下文為依據,不產生與上下文無關的幻覺信息。



圖1. 忠于上下文的 LLM 回復示例。

MoE 中是否存在上下文忠實專家?

近年來,MoE逐漸成為大模型的主流架構選擇。與傳統的稠密激活模型不同,MoE 通過路由網絡(Router)動態選擇部分專家網絡(Expert)參與計算,不僅大幅提升了參數利用效率,同時也為模型的模塊化訓練與能力分化開辟了新的空間。

已有研究發現,經過充分訓練的 MoE 模型會分化出擅長不同任務的專家網絡,這一現象被稱為專家特化(Expert Specialization)。由此,我們想進一步探究:在這些專家之中,是否存在擅長利用上下文信息的專家(圖2)?即上下文忠實專家(Context-Faithful Experts)?



圖2. MoE 中的部分專家可能更擅長利用上下文信息。

為解決這一問題,本文提出 MoE 特定專家的探測方法 RouterLens。我們假設:在上下文依賴任務中被更頻繁激活的專家更善于利用上下文信息。然而,MoE 預訓練中的負載均衡約束削弱了路由行為與專家特化能力間的可解釋性,使得僅憑激活頻率難以準確識別特定能力的專家。

為此,RouterLens 先在上下文依賴任務上進行輕量級路由微調(Router Tuning),以校正路由行為,使專家激活能更真實地反映不同專家的上下文利用能力差異。隨后,統計各專家的激活次數,并認定 Top-K 專家為上下文忠實專家(圖 3 )。



圖3. RouterLens 鑒定專家的過程

結論 1:MoE 中確實存在上下文忠實專家

本文在 SQuAD、NQ 等上下文依賴任務上驗證了 MoE 模型中上下文忠實專家的存在性。表 1 顯示,經過路由微調后,模型在所有任務上的表現均顯著提升,這說明僅調整專家激活行為即可增強上下文利用能力,證明了上下文忠實專家的存在。



表1 MoE 模型在路由微調(Router Tuning)前后的表現對比

結論 2:RouterLens 鑒定出的確為上下文忠實專家

那么,RouterLens 鑒定出的專家是否具備更強的上下文忠實性?為驗證這一點,我們還進行了屏蔽干預實驗:在模型推理時屏蔽 RouterLens 鑒定的專家(CE masked),并與屏蔽原始路由激活的專家(OE masked)進行對比。

如圖 4 所示,屏蔽 RouterLens 識別的專家后,模型性能顯著下降,甚至低于未微調的基礎模型,證明這些專家在上下文任務中的關鍵作用。相比之下,屏蔽原始激活專家的性能下降較小,進一步表明負載均衡訓練削弱了路由與專家真實能力的對應關系。



圖4. 基礎模型(base)、路由微調模型(RT),以及在路由微調模型上分別屏蔽原始激活專家(RT w/ OE masked)與屏蔽 RouterLens 鑒定專家(RT w/ CE masked)后的性能對比。

結論 3:不同任務下的上下文忠實專家各不相同。

本文還分析了上下文忠實專家在不同任務間的分布特征,將各樣本在所有層中專家激活頻率拼接成特征向量并經 t-SNE 可視化。結果(圖 5)顯示,不同任務形成明顯聚類,說明模型能根據任務需求自適應激活不同的上下文忠實專家。



圖5. MoE 模型中上下文忠實專家激活模式的t-SNE可視化結果。

雖然上下文忠實專家是任務特定的,但調優后的路由網絡能否泛化至新任務呢?論文將某數據集上調優的路由網絡應用于其他數據集。結果(圖 6)顯示,模型在未見任務上仍顯著優于原始模型,表明路由調優學到了具備泛化性的上下文忠實專家激活能力。



圖6. 微調后路由網絡的跨任務遷移性能。每個單元格表示相對于基準模型的 EM 得分絕對提升值,其中模型在第i行對應的數據集上訓練,并在第 j 列對應的數據集上進行評估。

上下文忠實專家是如何工作的?

那么,上下文忠實專家是如何幫助 MoE 利用上下文的呢?直觀上它們像一個信息樞紐,負責捕捉并整合輸入中的上下文,從而提升下游推理與生成的效果。但要驗證這一點,還需更細致地分析它們在計算流中的具體作用。

結論 4:上下文忠實專家能夠增強對上下文信息的注意力

通常,自注意力被認為決定模型對上下文的感知。本文通過上下文注意力增益和答案注意力增益評估上下文忠實專家的作用。結果(圖 7)顯示,路由微調后的模型在中、深層顯著增強了對上下文和答案 Token 的注意力。



圖7. 在 NQ-Swap 測試集上,路由微調模型相較于基礎模型在各層上的上下文注意力增益(CAG)和答案注意力增益(AAG)的變化趨勢。

這種逐層的注意力增強現象反映出一種逐步思考的過程。如圖8所示,中層的上下文忠實專家幫助模型首先在整個上下文中擴大注意力范圍(相當于對信息進行“掃描”),以識別潛在的相關內容;而在更深層中,模型則會逐步收縮注意力焦點,集中關注于上下文中最關鍵的片段(即答案 “1964”)。



圖8. OLMoE-1B-7B 模型在 NQ-Swap 測試樣本上由上下文忠實專家帶來的注意力增益。

結論 5:上下文專家能夠逐步校正模型的內在決策路徑

此外,我們還使用答案概率增益來分析上下文忠實專家對模型決策的影響。結果(圖 9)顯示,路由微調后模型在深層對正確答案的預測概率顯著提升,表明這些專家通過強化對關鍵上下文與答案 Token 的注意力,提升了模型的信息整合與判斷能力。



圖9. 在 NQ-Swap 測試集上,路由微調模型相較于基礎模型在各層答案概率增益(APG)的變化趨勢。

我們該如何利用上下文忠實專家?

在明確上下文忠實專家的作用機制后,我們進一步提出利用它們提升模型性能的思路:將有限計算資源優先分配給上下文忠實專家,而非訓練所有參數,從而實現高效優化。基于此,提出上下文忠實專家微調(CEFT),首先通過 RouterLens 識別各層的上下文忠實專家,然后僅微調這些專家,保持其余參數的凍結(算法 1)。



算法1. 上下文忠實專家微調

結論 6:僅微調上下文忠實專家能夠匹配甚至超越全量微調

如表2所示,對比了 CEFT 與全量微調(FFT)的表現。可以觀察到,在所有 MoE 模型和基準上,CEFT 一致地表現出與 FFT 持平甚至更優的表現,顯示了其在利用上下文信息提升任務表現的有效性。



表2. 全量微調(FFT)與上下文忠實專家微調(CEFT)的表現對比。

值得注意的是,該表現是在顯著減少訓練參數量的情況下實現的。如圖10所示,OLMoE-1B-7B 模型在全量微調下需要訓練 69 億參數,而 CEFT 僅需5億參數,實現了13.8倍的縮減。



圖10. 全量微調(FFT)與上下文忠實專家微調(CEFT)的可訓練參數量對比。

參數量顯著減少不僅提升計算效率,也減輕了災難性遺忘。表 3 顯示,在 MMLU 上,路由微調(RT)、全量微調(FFT)和上下文忠實專家微調(CEFT)的性能下降與可訓練參數量大致成正比,而 CEFT 對遺忘的抗性明顯優于 FFT。



表3. MoE 模型在經過不同訓練之后在 MMLU 基準上的表現。

展望

隨著 MoE 模型的廣泛應用,RouterLens 還可被用于更多的研究。

首先,RouterLens 可用于識別與分析更多類型的專家,如推理、證明或編程專家。

其次,它還能定位表現不佳或易誤導的專家,實現 MoE 的 “Debugging”。

最后,將 RouterLens 與 SAE 等機制可解釋性技術結合,可深入理解專家行為與知識分布,提升模型的可解釋性與可控性。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

樱空桃在线播放| 日韩欧美一区二区视频| 农村妇女精品一区二区| 91日韩久久| 亚洲韩国精品一区| 日日夜夜综合网| 日韩精品伦理第一区| 日本高清不卡一区| 91国内精品视频| 日韩成人手机在线| 亚洲女人天堂成人av在线| 久久尤物视频| 日韩av片网站| 久久久久久久激情视频| 久久久久国产精品人| 免费成人深夜天涯网站| 99九九电视剧免费观看| 在线精品视频一区二区三四| 97国产精品久久久| 一女被多男玩喷潮视频| 日韩在线免费视频观看| 白白色亚洲国产精品| 伊人网伊人影院| 91国产在线播放| 在线精品亚洲一区二区不卡| 精品二区在线观看| 91插插插插插插插插| 国内偷自视频区视频综合| 国产精品久久久久天堂| 国产又色又爽又黄的| 一区二区不卡在线观看| 亚洲天堂开心观看| 99久久99久久精品国产片果冻| 夫妇露脸对白88av| 欧美一区二区三区电影在线观看| 欧美成人精品二区三区99精品| 日本欧美韩国一区三区| 午夜男人的天堂| 99伊人久久| 欧美一区中文字幕| 国产一区在线视频| 综合 欧美 亚洲日本| 免费h精品视频在线播放| 精品国产a毛片| 国产一区二区三区精品视频| 日本精品久久久久中文| 欧美一区二区影视| 亚洲天堂男人天堂女人天堂| 91免费小视频| 久久久精品毛片| 青青在线免费观看视频| 国产成人亚洲综合91| 色婷婷久久久亚洲一区二区三区 | 免费看国产一级片| 久久久久久亚洲精品| 亚洲图片欧美色图| 污视频软件在线观看| 熟妇高潮一区二区| 欧洲国产精品| 色午夜这里只有精品| 国产精品视频一二三区| 国产永久免费视频| 精品人妻二区中文字幕| 国产一区二区三区黄| 亚洲欧美国产精品久久久久久久 | 亚洲天堂免费在线| 中文幕一区二区三区久久蜜桃| 中文字幕人妻精品一区| 日本成人在线免费观看| 精品乱码一区| 中文综合在线观看| 亚洲一二三区视频在线观看| 婷婷五月综合久久中文字幕| 性猛交ⅹxxx富婆video| 最新av网址在线观看| 性欧美办公室18xxxxhd| 欧美日韩国产在线| 日av在线不卡| 久久精品www| 男人插女人下面免费视频| 亚洲伊人久久综合| 国产午夜精品一区理论片飘花| 亚洲男同性视频| 久久久久久久高潮| 丝袜美腿小色网| 男女视频一区二区三区| 成人激情av| 日韩中文字幕在线精品| 欧美日韩在线看| 国产91在线|亚洲| 精产国品一区二区| 亚洲欧美日韩色| 欧美日韩一区二区三区电影| 热久久这里只有| 精品播放一区二区| 一区二区三区中文在线| 麻豆久久一区二区| 国产又黄又猛又粗又爽| 日本美女视频网站| 超碰超碰超碰超碰超碰| 国产日韩欧美日韩| 中文字幕精品久久久久| 高跟丝袜一区二区三区| 高清shemale亚洲人妖| 最近中文字幕免费观看| 女女互磨互喷水高潮les呻吟| www.av蜜桃| 国产精品.com| 久久久久久国产免费| 日韩三级视频在线看| 亚洲色图19p| 国产精品自拍网站| 99热这里只有精品99| 波多野结衣喷潮| av亚洲天堂网| 一区二区三区av在线| 国产精品久久av| 这里只有精品久久| 91精品国产高清一区二区三区| 国产精品传媒视频| 国产激情精品久久久第一区二区| 国产尤物在线观看| 麻豆91精品91久久久| www.四虎精品| 欧美日韩一区二区在线免费观看| 欧美亚洲丝袜| 国产一区私人高清影院| 久久这里只有精品视频首页| 日韩精品一区二区三区在线播放 | 91色国产在线| 中文字幕久久综合| 成人女人免费毛片| 97人人模人人爽人人喊中文字 | 午夜不卡av在线| 99视频在线精品| 日本伊人色综合网| 国产免费一区二区三区免费视频| 久艹视频在线观看| 无码h肉动漫在线观看| 69久久久久久| 亚洲国产精品无码观看久久| 欧美午夜精品久久久久久蜜| 国产在线观看精品| 97国产精品久久| 最近中文字幕日韩精品 | 妺妺窝人体色www在线下载| xxxxxx黄色| 一路向西2在线观看| 国产爆乳无码一区二区麻豆| 欧美精品一区二区三区久久| 国产欧美精品在线| 26uuu亚洲国产精品| 精品国产一区二区三区在线观看 | 欧美日韩国产色| 日韩美女视频一区| 国产午夜久久久久| 成人免费av在线| 精品一区二区三区av| 久久婷婷亚洲| 国产香蕉在线观看| 国产精品人人爽| 国产偷人爽久久久久久老妇app | av毛片久久久久**hd| 麻豆高清免费国产一区| 亚洲av片在线观看| 欧美视频在线观看一区二区三区| 一级黄色片在线看| 日韩综合在线观看| 日韩人妻精品中文字幕| 欧美成人aaa片一区国产精品| 久久亚洲无码视频| 日韩人妻无码一区二区三区| 国产白袜脚足j棉袜在线观看| 色综合五月婷婷| 天天干天天干天天干天天干天天干| 日韩视频在线视频| 免费一级特黄毛片| 亚洲精品无码国产| 中国丰满熟妇xxxx性| 国产免费内射又粗又爽密桃视频| 日韩国产精品毛片| 日韩精品第1页| 永久免费看av| 人人妻人人澡人人爽欧美一区| 国产女人18毛片| 国产欧美精品aaaaaa片| 久久av高潮av| 2018国产在线| a√天堂在线观看| 免费裸体美女网站| 美女喷白浆视频| 老司机午夜性大片| 又黄又爽又色的视频| 中文字幕久久久久久久| 久久精品aⅴ无码中文字字幕重口| 韩国三级在线看| 亚洲av无码专区在线播放中文| 亚洲欧美高清在线| 999精品免费视频| 日本美女xxx| 欧美丰满熟妇bbbbbb| 精品无码人妻一区二区三区品| 国产真实的和子乱拍在线观看| 日韩欧美国产亚洲| 欧美激情一区二区三区免费观看| 国产探花精品一区二区| 欧美 日韩 国产 精品| 毛片av一区二区| 成人精品高清在线| 国产欧美精品一区aⅴ影院| 亚洲丝袜另类动漫二区| 天天综合网天天综合色| 欧美色视频在线| 亚洲成人黄色网| 一区二区三区视频免费在线观看| 久久精品99国产精品酒店日本| 欧美黄色片在线观看| 欧美在线一区二区三区四| 国产精品啪视频| 国产伦精品一区二区三| 亚洲国产欧美一区二区三区不卡| 青青草视频国产| 中文字幕国产传媒| 中国极品少妇videossexhd| 三级黄色片在线观看| 日韩av无码中文字幕| 一级特黄aaa大片| 天天干天天操av| 国产麻豆91精品| 国产精品人妖ts系列视频| 亚洲成人av在线电影| 日韩欧美在线视频观看| 欧美成va人片在线观看| 中文字幕亚洲专区| 日韩av黄色在线观看| 国产99在线免费| 加勒比海盗1在线观看免费国语版| 日本新janpanese乱熟| 亚洲 欧美 日韩在线| 精品99久久久久成人网站免费 | 国产精品久久久久久久久免费丝袜| 亚洲国产成人av好男人在线观看| 欧美美女直播网站| 色系列之999| 国产精品视频白浆免费视频| 久久精品国产第一区二区三区最新章节| 青少年xxxxx性开放hg| 成人免费在线观看视频网站| 欧美做受喷浆在线观看| 欧美成人精品欧美一级乱黄| 亚洲精品久久久久久无码色欲四季| 国产高清精品在线| 亚洲国产视频直播| 亚洲国产精品成人av| 国语自产精品视频在线看一大j8| 国产精品乱码| 亚洲 高清 成人 动漫| 第四色在线视频| 在线观看精品国产| 玖玖在线精品| 国产精品久线在线观看| 欧美高清dvd| 美女少妇精品视频| 国产高清一区二区三区| 青草视频在线观看视频| 国产精品久久久久久亚洲色| 奇米影视第四色777| 美女网站久久| 国产精品免费av| 日韩一区二区高清| 97精品国产97久久久久久免费 | 国产三级国产精品| 无码久久精品国产亚洲av影片| 激情五月激情综合网| 亚洲自拍另类综合| 亚洲国产精品小视频| 日韩免费在线观看视频| 亚洲一区二区免费视频软件合集| 加勒比av中文字幕| 91av在线免费视频| 国产资源精品在线观看| 亚洲国产欧美日韩另类综合| 国产偷亚洲偷欧美偷精品| 国产精品日韩电影| 免费特级黄色片| 亚洲最大成人综合网| 精品黑人一区二区三区国语馆| 91在线小视频| 欧美蜜桃一区二区三区| 国语自产在线不卡| 一级全黄肉体裸体全过程| japanese在线观看| 亚洲综合精品国产一区二区三区| 懂色av噜噜一区二区三区av| 日本黄色一区二区| 韩日精品中文字幕| 国产欧美综合一区| 男女做爰猛烈刺激| 日本免费网站在线观看| 亚洲乱码国产乱码精品精98午夜| 亚洲欧洲国产精品| 国产一级二级三级精品| 午夜一级免费视频| 中文字幕人妻丝袜乱一区三区| 91香蕉视频黄| 亚洲国产精品嫩草影院久久| 91亚洲精品视频| 久久久精品麻豆| 一本一道无码中文字幕精品热| 成人小视频在线| 欧美成人女星排名| 97视频资源在线观看| 在线看免费毛片| 中文字幕永久在线观看| www国产成人免费观看视频 深夜成人网| 欧美一区二区精美| 亚洲a中文字幕| 欧美午夜精品理论片| 美女黄页在线观看| 中文字幕在线不卡视频| 最新国产精品拍自在线播放| 日韩欧美一区二区三区久久婷婷| 欧美老熟妇乱大交xxxxx| 污视频在线免费| 日韩欧美中文第一页| 浅井舞香一区二区| 91av俱乐部| 在线观看不卡的av| 亚洲品质自拍视频| 欧美贵妇videos办公室| 精品国偷自产一区二区三区| 国产亚洲精品码| 91美女在线观看| 在线国产精品视频| 一级做a爰片久久| 欧美成人精品欧美一| a级高清视频欧美日韩| 日韩精品黄色网| 日韩av不卡播放| 中国一级片在线观看| 成人午夜又粗又硬又大| 日韩国产欧美区| 神马影院我不卡| 欧美成人777| 91在线国产观看| 色婷婷av一区二区三区在线观看| mm131午夜| 午夜精品三级久久久有码| 中文一区一区三区高中清不卡| 美女扒开尿口让男人操亚洲视频网站| 妞干网视频在线观看| 手机看片久久久| 亚洲免费在线播放| 青青草成人在线| 杨幂一区二区国产精品| 三级网站在线看| 欧美日韩三级视频| 国产精品麻豆免费版| 69视频在线观看免费| bt欧美亚洲午夜电影天堂| 亚洲黄一区二区| 亚洲国产精品女人| 91精品国产综合久久久蜜臀九色| 综合在线观看色| 26uuu亚洲国产精品| 一级黄色高清视频| 秋霞午夜av一区二区三区| 精品久久一区二区三区| 午夜精品一区二区三区在线观看| 久久丫精品久久丫| 亚洲视频小说图片| 国产精品成人在线| 屁屁影院国产第一页| 粉嫩一区二区三区性色av| 国产亚洲欧洲黄色| 男人揉女人奶房视频60分| a天堂中文在线观看| 欧美日韩一级二级三级| 欧美成人免费在线| 日本中文字幕免费观看| 一区二区在线观看av| 成人有码在线视频| 精品一区二区三孕妇视频| 久久一区二区三区四区| 国内精品伊人久久| 欧美双性人妖o0| 成人99免费视频| 国内精久久久久久久久久人| 国内av免费观看| 国产一区啦啦啦在线观看| 中文一区二区视频| 污视频网站观看| 狠狠色丁香婷婷综合| 精品国产欧美一区二区五十路 | 四虎一区二区| 中文字幕乱伦视频| 欧美精品在欧美一区二区少妇| 老牛影视免费一区二区| 看片网址国产福利av中文字幕| 亚洲3atv精品一区二区三区| 国产精品视频在线免费观看| 久久久久无码精品国产| 亚洲一区二区av在线| 国产精品污www一区二区三区| 久久久久久久久久久久久久免费看 | 欧美日韩电影一区| 正在播放一区| 好吊色一区二区三区| 亚洲精品在线不卡| 国产wwwxx|