亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

推理時擾動高熵詞,增強LLM性能

IP屬地 中國·北京 機器之心Pro 時間:2025-10-29 14:10:53



本文第一作者楊震,香港科技大學(廣州)博士生,研究方向是多模態理解與生成等。本文通訊作者陳穎聰,香港科技大學(廣州)助理教授,主要研究課題包括生成模型、具身智能等。

隨著對大語言模型的研究越來越深入,關于測試時間擴展 (test-time scaling) 的相關研究正迅速嶄露頭角。研究團隊重新審視測試時行為,發現了一個簡單但尚未得到充分探索的現象:LLM 推理時的不確定性高度局部化 —— 一小部分高熵詞會顯著影響輸出的正確性。



正是基于這一關鍵觀察,來自香港科技大學(廣州)的研究團隊提出了 Minimal Test-Time Intervention (MTI),其主要包含了 Selective CFG intervention 與 Lightweight negative-prompt guidance 兩種方法。MTI 能夠在推理階段無需額外訓練,就提升大型語言模型的推理能力。



論文標題:Less is More: Improving LLM Reasoning with Minimal Test-Time Intervention論文地址:https://arxiv.org/abs/2510.13940Github(代碼已開源):https://github.com/EnVision-Research/MTIHuggingface Paper:https://huggingface.co/papers/2510.13940



Selective CFG intervention:

減弱高熵詞的不確定性


LLM 在多步推理中經常表現出鏈式不穩定性:幾個步驟中的不確定性會放大并導致整個答案偏離軌道。為了找到這種不穩定性的原因,研究團隊分析了 LLM 回答錯誤的問題,并發現錯誤回答的熵更高,而這主要是由回答中的高熵詞導致的。為此,研究團隊提出在高熵詞上使用 Classifier-free Guidance (CFG) 以在降低不確定性的同時穩定推理過程,并能在保持高效率的同時提高性能。

Lightweight negative-prompt guidance:

復用 KV cache 并注入負向詞,節省顯存分配的同時維護更優的無條件空間


研究團隊觀察到,盡管 Selective CFG intervention 僅對高熵詞進行操作,但是仍需為無條件預測支路分配一個新的 KV 緩存,這大大降低了現代 LLM 推理加速器的效率。比如,維護雙 KV 緩存會削弱諸如 vllm 等框架的長上下文處理能力。此外,CFG 源自計算機視覺,其會在訓練過程中引入無條件標簽來學習全局數據分布。相比之下,LLM 中的 CFG 并未訓練建模全局文本分布的能力。因此,研究團隊認為無條件分支應該被視為一個負向提示通道:條件分支專注于生成正確的詞,而無條件分支則被鼓勵生成錯誤的詞。為此,研究團隊重用了條件分支的 KV 緩存,并附加了一條用于引出錯誤詞的短指令,最終實現了在維護更優無條件空間的同時節省了 KV 緩存分配。此外,注入的短語非常靈活,比如研究團隊發現 “OUTPUT ERROR” 就已經產生了優良的效果。

實驗結果


研究團隊在多個任務上進行了測試,其中包括通用任務(Winogrande,MMLU-Pro),代碼任務(Humaneval,Humaneval_plus,LiveCodeBench),數學與科學任務(GPQA-Diamond,MATH500)上進行了系統測試。結果顯示僅在很少的高熵詞上使用 MTI,就能在多個數據集上穩定帶來性能提升,驗證了方法的有效性。比如在 Qwen3-14B-Reasoning 上,僅對 3.5% 的詞執行 MTI,可以為所有任務平均提點 1.58。



從 AIME2024 的實驗中也發現,MTI 方法具備顯著的優勢。比如在 Qwen3-8B-Reasoning 模型中,僅需對 1.9% 的詞執行 CFG,就可以為準確性帶來 4.9% 的增長,證明了 MTI 在維護高效率的同時,也改進了性能。



分析實驗



研究團隊發現,一些低熵詞很難被 CFG 所改變,這是由于 LLM 在低熵詞上對自己的輸出非常確信,所以很難被 CFG 改變,而這些失敗的 CFG 操作便降低了效率。CFG 所能改變的預測主要集中在高熵詞部分,這是由于模型對自己的預測并不自信,因此 CFG 可以修正它。這些發現也從側面反映并非所有的詞都需要使用 CFG。



研究團隊發現對于基礎模型,詞云中的一些低信息量占位符(例如 **)被語義上更有意義的詞語所取代,從而創造了更豐富的推理分支,并最終提高了準確率。對于推理模型,研究團隊觀察到從單一連接詞(例如 so)向更多樣化的連接詞(例如 however、if、perhaps、alternatively、wait)的轉變。這有助于模型摒棄錯誤的先驗推理鏈,并開啟新的思路,最終得出正確的推理。總體而言,應用該方法可以產生更加多樣化和平衡的詞匯,擴展更多的假設和推理軌跡,最終獲得更好的結果。

總結


總的來看,這項工作揭示了 LLM 在推理階段的一少部分高熵詞會顯著影響輸出正確性,并提出了 Minimal Test-Time Intervention (MTI),其中包含 Selective CFG intervention 和 Lightweight negative-prompt guidance。該方法無需訓練并即插即用,易于與現代加速框架和各種解碼策略或測試時擴展方法進行結合。該方法利用對推理階段高熵詞的擾動,不僅顯著提升了模型在大量任務上的表現,也為未來挖掘 LLM 推理階段的潛力提供了全新的思路。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

欧美野外猛男的大粗鳮| 久久精品无码一区| 国产一区免费在线观看| 久久香蕉视频网站| 国产欧美一区二区| 国产精品一区二区三区99| 久久午夜夜伦鲁鲁一区二区| 中文字幕欧美日韩va免费视频| 国产 欧美 在线| 久久久中文字幕| 色综合天天综合网国产成人网| 亚洲一区二区三区四区在线免费观看| 日韩欧美视频在线| 成人国产免费视频| 欧美精品激情在线| 久草免费在线视频观看| **网站欧美大片在线观看| 99在线免费观看视频| 色老头一区二区| 日韩精品视频观看| 中文字幕一二三四区| 精品美女在线观看| 手机在线看福利| 欧美午夜激情小视频| 免费激情视频在线观看| 亚洲黄色小说网址| 日本乱人伦a精品| 丝袜美腿高跟呻吟高潮一区| 波多野结衣久草一区| 美女尤物国产一区| 日本最新高清不卡中文字幕| 爽好久久久欧美精品| 亚洲国产欧美不卡在线观看| 亚洲成av人片一区二区三区| 丁香六月婷婷综合| 久久99久久精品国产| 国产精品久线观看视频| 污污网站免费看| 亚洲最新在线视频| 午夜视频www| 亚洲一区二区三区四区精品 | 亚洲综合图片区| 中文字幕日韩国产| 91深夜福利视频| 综合色天天鬼久久鬼色| 青娱乐91视频| 国产亚洲一区在线播放| 欧美性xxxxx极品| 伊人色综合久久久| 四虎免费在线观看视频| 久久在线视频在线| 韩国av免费在线观看| 香蕉精品视频在线| 亚洲精品一区中文| 国产麻豆精品一区二区| 日本在线一级片| 特大黑人娇小亚洲女mp4| 欧美天堂一区二区三区| 国产精品呻吟久久| 欧美不卡在线播放| 日韩女优人人人人射在线视频| 久久久精品黄色| 色偷偷男人天堂| 亚洲精品在线免费看| 午夜精品久久久久久久99热浪潮| 一区二区三区在线视频免费 | 9.1片黄在线观看| 欧美连裤袜在线视频| 亚洲欧美一区二区三区情侣bbw| 久久精品首页| 91高清免费看| 免费极品av一视觉盛宴| 51久久精品夜色国产麻豆| 欧美天堂一区二区三区| 久久综合99re88久久爱| 久久久无码一区二区三区| 亚洲欧洲日产国码无码久久99 | 国产日韩欧美综合精品| 91国内揄拍国内精品对白| 51久久夜色精品国产麻豆| 风间由美一区二区三区在线观看| 国产日韩欧美中文字幕| 国产真人无码作爱视频免费| 一区二区三区日韩视频| 亚洲一区国产精品| 日本韩国欧美国产| 99国产精品久久久久久久久久久| 91av久久久| 国产原创视频在线| 五月天激情丁香| 成人污网站在线观看| 欧美日韩在线一二三| 亚洲欧美国产77777| 日本午夜视频在线观看| v8888av| 日韩欧美国产二区| 国产精品theporn88| 五月天丁香花婷婷| 2一3sex性hd| 特级西西人体wwwww| 日韩和欧美一区二区| 欧美成人三级视频| 久久久精品国产免大香伊| 96pao国产成视频永久免费| 美女脱光内衣内裤视频久久影院| 欧美精品一区二区三区在线| 国产一区二区在线视频| 国产精品视频一区二区三 | 欧美 日韩 国产在线观看| 亚洲五月激情网| 久久久777精品电影网影网| 亚洲国产精品麻豆| 国产精品第三页| 精品人妻人人做人人爽夜夜爽| 丁香六月激情网| 性网爆门事件集合av| 久草热视频在线观看| 99久久久免费精品国产一区二区| 中文字幕日韩一区二区三区| 亚洲成人av一区二区三区| 97超碰人人澡| 激情综合色综合久久| 91精品福利在线一区二区三区| 99精彩视频| 日韩精品久久久久久久的张开腿让| 中文字幕中文字幕一区二区| 欧美午夜丰满在线18影院| 欧美性猛交xxxxx免费看| 精品成人一区二区三区| 97在线免费观看视频| 久久久久久久久久网| 国产成人精品av在线观| 亚洲国产成人在线观看| 日韩精品极品视频免费观看| 久久国产精品二区| 一区二区不卡在线播放| 琪琪亚洲精品午夜在线| 久久久免费精品视频| 超碰人人cao| 成人国产在线观看| 日本韩国欧美一区二区三区| 亚洲7777| 日韩欧美视频一区二区三区| 91精品网站| 99久久精品免费看国产交换| 91av视频在线观看| 91青青草免费在线看| 亚洲人成色777777老人头| 97在线看免费观看视频在线观看| 久久福利视频一区二区| 国产成人精品无码免费看夜聊软件| 91丨porny丨中文| 亚洲综合婷婷久久| 97精品视频在线观看| 女女互磨互喷水高潮les呻吟| 欧美日韩在线一区二区| 污视频网址在线观看| 欧美一级高清片| 国产女人18毛片水真多18| 亚洲国产精品黑人久久久| 国内精品国产三级国产99| 性高潮久久久久久久久久| 日韩av有码在线| 日韩影片在线播放| 天堂蜜桃91精品| 九九久久久久久| 亚洲一本大道在线| 国产大屁股喷水视频在线观看| 日韩有码在线视频| 亚洲一区二区在线观| 91污片在线观看| 亚洲午夜精品一区| 欧美香蕉大胸在线视频观看 | 精品久久久中文字幕人妻| 91n.com在线观看| 成人午夜黄色影院| 99视频精品在线| 天天操天天爱天天爽| 国产精品久久久久久久蜜臀| 欧美日韩在线一| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 9色porny| av在线播放不卡| 欧美日韩第二页| 青青草成人在线| 日韩国产高清在线| 欧美不卡在线一区二区三区| 夜夜躁日日躁狠狠久久av| 国产精品青草综合久久久久99| 人人妻人人澡人人爽人人精品| 精品视频在线播放免| 久久青草欧美一区二区三区| 亚洲大尺度在线观看| 呦呦视频在线观看| 欧美日韩在线免费观看视频| 91精品国产网站| 成人黄色av电影| 少妇特黄a一区二区三区| 日韩亚洲电影在线| 免费看国产片在线观看| www.色就是色| 亚洲欧洲三级电影| 亚洲综合在线网站| 精品视频久久久| 7777女厕盗摄久久久| www.蜜臀av| 成人在线免费在线观看| 久久久久久久网站| 精品一区二区三区的国产在线播放| 久久久女人电视剧免费播放下载| 亚洲婷婷在线视频| 最近日韩免费视频| 欧美精品久久久久性色| 亚洲综合自拍网| 亚洲免费一级视频| 国产一区二区三区在线免费| 久久久久久国产三级电影| 欧美日韩精品在线播放| 久热精品在线观看| 涩涩涩999| 欧美变态口味重另类| 蜜臀精品一区二区三区在线观看 | 不卡的av一区| 日韩欧美亚洲范冰冰与中字| 久久国产露脸精品国产| 欧美性猛交内射兽交老熟妇| 日本欧美加勒比视频| 女教师高潮黄又色视频| 亚洲欧美丝袜| 蜜桃视频在线观看91| 欧美国产日韩视频| 国产美女久久精品| 亚洲天堂av网| 国产亚洲精品美女久久久| 国产精品久久二区二区| 97人妻精品一区二区三区软件 | 欧美黄色免费网址| 亚洲成人av一区| 国产成人在线播放视频| 免费毛片小视频| 亚洲视频在线观看日本a| 精品福利一二区| 国产精品成人网| 91丨porny丨最新| 91玉足脚交白嫩脚丫| 国产成人久久精品| 久久99久久亚洲国产| 日韩一区二区在线观看视频 | 2018中文字幕第一页| 丁香啪啪综合成人亚洲| 在线观看高清免费视频| 日韩av电影免费在线| 17婷婷久久www| 九九视频这里只有精品| 久久理论电影网| 五月婷婷激情视频| 人妻视频一区二区| 97人妻精品一区二区三区免| 97精品国产97久久久久久| 99精品一区二区| 黑人狂躁日本娇小| 亚洲日本japanese丝袜| 亚洲欧洲美洲在线综合| 国产精品美女久久久久av爽李琼 | 五月婷婷六月婷婷| 精品成人av一区二区三区| 精品久久久久久中文字幕2017| 日韩理论片在线观看| 国产亚洲福利社区| 欧美肥臀大乳一区二区免费视频| 欧美性猛交xxxx免费看| 亚洲第一色视频| 丁香激情五月少妇| 成年人性生活视频| av免费中文字幕| 久久伊人91精品综合网站| 久久精品视频一区二区| 在线免费观看av片| 色婷婷在线影院| 成人黄色国产精品网站大全在线免费观看| 久久午夜夜伦鲁鲁片| 日本人视频jizz页码69| 一二三不卡视频| 亚洲国产精品久久久久爰色欲| 久久久一二三四| 亚洲成人动漫在线| 日本美女视频网站| 日本三级网站在线观看| 国产精品人人妻人人爽| 国产情侣自拍av| 久久久久久久久福利| 特黄特色免费视频| aaa黄色大片| 污网站在线免费| 精产国品一二三区| 91精品人妻一区二区| 久久久久一区二区三区| 欧美激情日韩图片| 亚洲老头同性xxxxx| 色婷婷综合视频在线观看| 亚洲乱码日产精品bd| 91麻豆国产在线观看| 色婷婷狠狠综合| 欧美日韩1234| 欧美成人精品一区二区| 91精品国产乱码久久久久久蜜臀 | 久久久精品视频在线观看| 成人激情视频在线播放| 欧美日韩一区二区区别是什么 | 久久久久久久尹人综合网亚洲| 亚洲精品久久久狠狠狠爱| 黑人巨大精品欧美一区| 成人高清视频在线| 亚洲欧美二区三区| 欧美日韩精品一区二区天天拍小说| 日本高清不卡一区| 国产精品嫩草影院av蜜臀| 国产欧美一区在线| 亚洲国产精品av| 国产日韩欧美亚洲| 亚洲三级在线免费观看| 国产三级精品三级| 亚洲免费福利视频| 国产高清在线一区二区| 国产精品videossex国产高清| 无码专区aaaaaa免费视频| 伊人在线视频观看| 国产一区二区三区免费在线观看| 日韩欧美精品在线观看| 国内精品免费午夜毛片| 国产日韩亚洲欧美在线| 三级黄色片免费观看| 中国毛片在线观看| 亚洲国产乱码最新视频 | 亚洲电影在线播放| 国产午夜精品一区理论片飘花| 另类视频在线观看| 97香蕉久久超级碰碰高清版| 国产精品久久久久久影视| 久久久久久久久一区二区| 男人添女人下面高潮视频| 小日子的在线观看免费第8集| 在线观看免费黄色网址| 国产精品久久久久永久免费观看 | 久久久久久国产| 高清av免费看| 手机精品视频在线观看| 欧美精品午夜视频| 亚洲成a人片在线www| 精品人妻伦一二三区久久| 亚洲国产cao| 久久99国产精品自在自在app | 国内精品视频免费| 一级黄色片播放| 亚洲人成电影在线播放| 亚洲成年人影院| 九九热这里只有在线精品视| 国产精品二区二区三区| 中文字幕第38页| 亚洲天堂男人网| 精品亚洲国产视频| 欧美日韩精品免费在线观看视频| 日本少妇性生活| 色综合伊人色综合网站| 91人妻一区二区三区蜜臀| 91精品欧美一区二区三区综合在| www.天天射.com| 五月天激情综合| 免费成人深夜夜行网站视频| 丰满肉肉bbwwbbww| 亚洲美女中文字幕| 美脚丝袜脚交一区二区| 色www免费视频| 美国av一区二区| 久久精品小视频| 亚洲精品视频大全| 成人精品gif动图一区| 日韩免费av一区二区| 中日韩精品一区二区三区| 网站黄在线观看| 欧美一区永久视频免费观看| 高清视频一区| 日韩不卡av在线| 99久久综合色| 日韩视频欧美视频| 无码人妻一区二区三区免费n鬼沢 久久久无码人妻精品无码 | 日韩国产欧美精品在线| 欧美黄色一级片视频| 久久综合视频网| 91免费在线视频网站| jizz中国少妇| 日本国产欧美一区二区三区| 精品乱码一区内射人妻无码| 一区二区三区国产精品| 精品人伦一区二区三区 | 久久久久一区二区三区四区| 亚洲97在线观看| 欧美黄色免费看| 欧美午夜精品久久久久久孕妇| 成人免费看片视频| wwwav在线播放| 国产精品成人一区二区| 中文字幕久久网| 亚洲精品国偷自产在线99热| 91看片就是不一样| 国产欧美视频一区二区三区| 7777在线视频| 欧美一级性视频| 555www成人网| 五月天婷婷网站|