亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

人大&騰訊團隊用信息論揭示:什么時候該想、什么時候別想

IP屬地 中國·北京 機器之心Pro 時間:2025-12-19 16:20:51



本文的第一作者雍希賢是來中國人民大學的博士生,研究方向聚焦于 Humanoid AI,LLM Coginition & Reasoning。通訊作者為中國人民大學的周驍副教授以及騰訊天衍實驗室的吳賢。

當前,大模型的「推理能力」幾乎成為行業最熱詞。o1、R1、QwQ 類強化學習(RL)推理模型,讓模型會「想」、會解析復雜問題,甚至能像人一樣寫長長的推理過程(Chain-of-Thought,CoT),在數學、邏輯與常識等領域任務中展現出強大的多步推理能力。

看上去很強,但問題也隨之出現:

這些模型真的需要思考那么久嗎?長推理鏈條,是幫助模型正確,還是讓它越繞越遠?

如果你用過這些模型,就會感受到:

很多題模型似乎「一眼就能猜中八成」,但它還是堅持把推理寫到幾百、幾千 token,有時甚至越寫越亂、越想越錯。

來自中國人民大學、騰訊 Jarvis Lab、西湖大學的研究團隊,看到了這背后的核心:

當前大模型的「推理機制」其實非常低效,甚至常常在自我制造噪聲。

于是研究團隊從另一個視角切入 ——信息論

通過「熵(entropy)」與「互信息(mutual information)」等底層信息指標,重新衡量模型思考的價值。

最終,他們提出了一個極其實用的機制:Adaptive Think——讓模型在「自信夠了」時自動停止推理

不用訓練,用現有模型就能直接部署。

這項工作已被 NeurIPS 2025 選為 Spotlight。



論文標題: Think or Not? Exploring Thinking Efficiency in Large Reasoning Models via an Information-Theoretic Lens論文鏈接:https://arxiv.org/abs/2505.18237代碼地址:https://github.com/chicosirius/think-or-not

首先,研究團隊借鑒了香農提出的通信三層模型,從技術、語義和實踐三個維度觀察大模型「過度思考」的本質。



圖 1:基于 Shannon & Weaver 通信模型,研究發現推理過長不僅信息增益逐漸減弱,還可能帶來偏差并降低最終準確率。

在技術層面(Technical Level),長推理鏈就像在一個噪聲信道里不斷添加冗余比特。適度的冗余可以增強魯棒性,但一旦超過模型的「推理容量」,額外的推理反而可能會帶來錯誤的積累和偏差。在語義層面(Semantic Level),每一步推理應該減少答案的不確定性。但結果顯示,隨著推理鏈延長,單步推理帶來的信息增益迅速遞減,冗余步驟更多地在制造噪聲,而不是幫助模型更接近正確答案。在實踐層面(Pragmatic Level),更長的推理鏈并不一定帶來更好的結果。跨多個任務和模型,推理長度的增加常常導致邊際收益下降,甚至出現「思考越久、答得越差」的情況。同時,冗長的推理鏈帶來更多 token 消耗、更高延遲和更大算力開銷,使得長推理在實際應用中既昂貴又不可靠。

模型推理為什么會「越想越偏」?

為了進一步量化模型「思考效率」,研究團隊從兩個層面構建了一個系統評價框架。

1. 全局視角:InfoBias(信息偏差)

將模型的推理鏈與理想推理路徑比對,使用互信息估計偏差:

偏差越大,說明模型「越想越偏」。

在 GSM8K 數據集上的實驗清晰地展示了這一規律:錯誤答案往往伴隨更長的推理鏈和更高的 InfoBias。越是錯誤的答案,模型往往輸出更多的 token。



圖 2:在 GSM8K 數據集上,不同模型的平均推理長度與歸一化后的每個 token 信息偏差關系。

2. 局部視角:InfoGain(信息增益)

定義每個推理步驟降低答案空間熵的量:



如果某一步沒降低不確定性,說明它提供的不是「有效推理」,而是「填充字數」。

實驗分析表明,模型在推理過程中表現出逐步降低不確定性和提高對正確答案的信心的趨勢,即有效推理可以逐步過濾不確定性并增強預測。

即使在推理開始前,模型在知識密集型任務上也顯示出初始直覺偏向正確答案,而不同任務的推理動態存在差異



圖 3:QwQ-32B 在不同推理基準下的不確定性動態

Adaptive Think

讓模型「有必要才深思,無必要就直答」

在發現過度思考可能降低推理效率后,研究團隊提出了Adaptive Think策略。其核心理念是通過熵來衡量模型在推理過程中的不確定性,并在模型達到足夠置信度時主動終止推理。

讓模型進行「自我監控式推理」

在這一框架下,每完成一步推理,模型都會計算答案分布的平均熵。當熵低于預設閾值 α 時,表明模型已經具備較高的自信,此時即可停止推理并輸出答案。該機制使模型能夠根據任務難度靈活調整思考深度:

對于簡單的常識類問題,僅需少量推理步驟即可得到答案,從而節省計算資源;對于復雜的數學或邏輯問題,則會繼續深入推理,直至置信度達到足夠高的水平才終止。



圖 4:四種思考方式的示意圖

該策略體現了模型對自身信心的動態感知能力,使其能夠在不同任務類型間自適應調整推理深度,從而兼顧速度與可靠性。

實驗結果

更準、更省、更快

最后,研究團隊在 8 個大模型(包括 5 個非推理和 3 個推理模型)、6 個不同推理類型的 benchmark 上進行了完整評估。

在數學任務 GSM8K 與 AIME2025 上,Adaptive Think 在保持準確率的同時,將平均 Token 消耗減少了一半以上(40.01%-68.25)。例如,在 QwQ-32B 模型上,相比傳統的 Vanilla Think 模式,Adaptive Think 在 AIME2025 上將 Token 使用量減少了 68.25%,而準確率還提高了 0.93%。這說明模型本身早早就「知道正確答案」,冗余的只是大量驗證性推理。



表 1:在兩個數學推理基準上的性能與效率對比

在知識、邏輯、常識等任務上,Adaptive Think 同樣表現優異。在 MMLU-Pro、CommonsenseQA、ProntoQA、MuSR 等多個數據集上觀察到:QwQ-32B 的平均準確率提升 1.23%,平均 token 減少 42.52%。

在 CommonsenseQA 這種靠直覺的任務最顯著,DeepSeek-R1-32B 模型采用 Adaptive Think 后,準確率幾乎不變,但 Token 消耗減少了超過 80%。這表明對于依賴常識直覺的問題,Adaptive Think 能夠快速終止冗余推理,極大地提升效率



表 2:在知識、邏輯、常識推理基準上的性能與效率對比

這些實驗驗證了一個關鍵結論:大模型的長推理鏈并非必要,很多時候它們只需要「少想幾步」

什么時候應該「多想」,

什么時候應該「少想」?

研究團隊進一步分析不同任務的「推理需求」,例如:

數學題(AIME2025)→ 需要更深的推理鏈常識題(CQA)→ 模型幾乎一開始就知道正確答案多步軟推理(MuSR)→ 有效推理集中在前半段



圖 5&6:Adaptive Think 輸出 token 數量與題目難度的關系(左);閾值 α 對準確率和 token 數量的影響,揭示了 推理性能與計算效率之間的權衡(右)。

這意味著:

真正成熟的推理大模型,不是輸出固定長度的推理,而是能夠「自動匹配任務難度」。

總結

這篇論文給我們帶來一個很重要的理念:AI 推理的未來不在「更長」,而在「更聰明」

未來的大模型應該:1)在需要深度邏輯時能推理得足夠嚴謹;2)在只需直覺判斷時不浪費 token;3)能動態適應任務難度;4)在推理過程中實時自我評估,隨時剎車。

這項工作既解釋了「為什么模型會過度推理」,也告訴我們「如何簡單有效地解決」。

如果說強化學習讓模型學會了「怎么想」,那么 Adaptive Think 讓模型學會了 「想多久」。

這是推理大模型走向成熟的關鍵一步。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

色悠悠国产精品| 一卡二卡三卡四卡五卡| 神马影院午夜我不卡| 91日韩久久| 国产日韩欧美综合| 91干在线观看| 欧美精品久久久久a| 久久影院中文字幕| 日韩中文在线不卡| 这里只有精品久久| 亚洲无线码在线一区观看| 日韩成人久久久| 亚洲成人久久久久| 精品国产免费人成电影在线观看四季 | 日韩激情小视频| 欧洲av一区二区三区| 国产精品815.cc红桃| 9.1成人看片| 老牛影视av老牛影视av| 国产中年熟女高潮大集合| 欧美成人国产精品一区二区| 欧美激情aaa| 久操视频在线观看免费| 亚洲一级片在线播放| 性少妇xx生活| 在线观看亚洲网站| 国产一级生活片| 日韩精品一区二区不卡| 欧美a视频在线观看| 日本天堂网在线观看| 中文字幕一区在线播放| 探花国产精品一区二区| 国产又爽又黄免费软件| 亚洲精品成av人片天堂无码| 黄色片网站免费在线观看| 老司机精品福利视频| 丝袜国产日韩另类美女| 国产在线播放一区三区四| 成人一道本在线| 久久久另类综合| 中文字幕中文字幕在线一区| 亚洲国产综合色| 色狠狠桃花综合| 欧美日本韩国一区二区三区视频 | 99亚洲国产精品| 免费看日本毛片| 黑人糟蹋人妻hd中文字幕| 五月婷婷六月合| 国产精久久久久| 国产女主播喷水高潮网红在线| 天堂在线观看av| 亚洲一二三区av| av天堂永久资源网| 羞羞的视频在线| 俄罗斯女人裸体性做爰| 国产亚洲色婷婷久久99精品91| 亚洲成人黄色av| 国产精品久久久久久久精| 日本一本高清视频| 中文字幕在线网址| 中文视频在线观看| 成人亚洲欧美一区二区三区| 国产一区二区三区av在线| 欧美日韩喷水| 国产片侵犯亲女视频播放| 国产又黄又猛视频| 日本一级大毛片a一| 在线观看日本中文字幕| 国产主播在线观看| 91欧美日韩麻豆精品| www黄色网址| caopor在线| 中文字幕高清视频| 国产亚洲精品久久久久久打不开| 国产精品51麻豆cm传媒| 性感美女视频一二三| 成人美女视频在线看| 亚洲欧洲综合另类| 欧美日韩久久久一区| 亚洲欧美国产精品| 久久久免费在线观看| 成人欧美一区二区三区黑人| 日韩性感在线| 韩国日本美国免费毛片| 五级黄高潮片90分钟视频| 日本一区二区不卡在线| 亚洲国产剧情在线观看| 国产99久久久国产精品免费看 | 亚洲一级不卡视频| 日韩一区二区在线观看视频播放| www.欧美精品一二三区| 国产一区二区色| 伊人婷婷久久| 色噜噜狠狠一区二区| 一级在线观看视频| 中日韩av在线| 精品一区二区在线免费观看| 中文字幕中文字幕一区二区| 91.com视频| 欧美成人亚洲成人日韩成人| 亚洲在线视频观看| 日b视频免费观看| 视频免费在线观看| 天堂中文在线网| 日韩成人av影视| 国产欧美精品日韩区二区麻豆天美 | 日韩一区二区不卡| 欧美激情第6页| 国内精品久久国产| 可以在线看的黄色网址| 国产高潮呻吟久久| 这里只有精品6| 国产成人在线观看免费网站| 亚洲国产一区二区三区| 日韩精品在线免费观看| 国产成人精品日本亚洲| 中文精品一区二区三区| 欧美午夜精品一区二区| 国产精品视频久久久久久久| 全部av―极品视觉盛宴亚洲| 亚洲欧美日韩国产手机在线| 亚洲精品一区二区三区在线观看| 91黄色8090| 日韩三级电影网站| 激情文学亚洲色图| 日韩手机在线观看| 蜜臀av性久久久久蜜臀aⅴ| 亚洲男人的天堂一区二区| 亚洲福利视频在线| 国产精品欧美一区二区三区奶水| 日韩国产精品毛片| 国产老熟女伦老熟妇露脸| 中文 欧美 日韩| 成人免费观看男女羞羞视频| 欧美亚洲一区二区在线观看| 欧美激情精品久久久久久大尺度| 欧美精品久久| 26uuu国产| 波多野结衣人妻| 成人精品国产免费网站| 欧美性感一类影片在线播放| 九九热r在线视频精品| 欧美日韩精品一区| 亚洲精品成人无码毛片| 中文字幕av第一页| 99麻豆久久久国产精品免费优播| 欧美日韩国产首页| 欧美最顶级丰满的aⅴ艳星| 中文字幕在线乱| 国产又粗又硬视频| 婷婷久久久久久| 亚洲最新在线观看| www.99久久热国产日韩欧美.com| 久久久久久a亚洲欧洲aⅴ| 日韩精品aaa| 亚洲av无码精品一区二区| www.成人网.com| 欧美一区二区三区人| 国产精品国语对白| 噜噜噜久久亚洲精品国产品麻豆 | 欧美亚洲高清一区| 69av成年福利视频| 99久久久精品视频| www.xxxx日本| 精品在线观看免费| 欧洲一区在线电影| 欧美又大又硬又粗bbbbb| 国产精品久久国产| 国产精品视频一区二区三| 日本最新不卡在线| 色老汉一区二区三区| 茄子视频成人在线| 国产日本在线播放| 国产亚洲欧美精品久久久久久| 国产精品资源在线看| 欧美日韩激情一区二区三区| 国产成人精品视频在线| 久久久久久久久久久久久国产精品 | 亚洲成人av免费看| 中文字幕日韩免费| 国产欧美日韩卡一| 日韩在线免费高清视频| 亚洲一区尤物| 久久久久久久久久97| 国产一区二区在线观看视频| 欧美精品高清视频| 成人久久久久爱| 国产精品igao网网址不卡| 国产口爆吞精一区二区| 亚洲人被黑人高潮完整版| 精品国模在线视频| 国产911在线观看| 久草网站在线观看| 成人一级黄色片| 日韩精品极品视频免费观看| 久久精品久久精品国产大片| 中文字幕高清视频| 韩国欧美国产一区| 精品国产一区a| 久久久精彩视频| 中文字幕 自拍| 国内外成人在线| 精品乱人伦小说| 久久国产精品久久| 蜜桃久久精品成人无码av| 黄页视频在线91| 亚洲精品一区二区三区福利| 精品日产一区2区三区黄免费| 精品无码人妻一区| 韩国视频一区二区| 亚洲国产欧美一区| 人偷久久久久久久偷女厕| 精品伦精品一区二区三区视频密桃| 国产一区二区福利视频| 亚洲国产精品久久久久秋霞蜜臀| 麻豆久久久9性大片| 欧美性猛交xxxx乱大交少妇| 国产xxx精品视频大全| 亚洲精品电影网| 午夜精品一区二区在线观看| 清纯粉嫩极品夜夜嗨av| 91蜜桃网址入口| 中文字幕日韩欧美在线| 中文字幕在线乱| 国内精品福利视频| 亚洲精品视频免费看| 青青草精品毛片| 黄页网站在线看| 美腿丝袜亚洲三区| 欧美一区2区视频在线观看| 鲁片一区二区三区| 色在线观看视频| 亚洲国产成人午夜在线一区| 久久久久久网站| 日韩高清第一页| 五十路在线视频| 日韩三级免费观看| 色阁综合av| 日韩欧美国产亚洲| 伊人夜夜躁av伊人久久| 国产精品18久久久久久麻辣| 国产乱国产乱老熟300部视频| 麻豆精品在线播放| 亚洲精品视频网上网址在线观看| 91精品国产毛片武则天| 中文字幕 自拍偷拍| 色诱亚洲精品久久久久久| 国产精品入口免费| 在线看的片片片免费| 自拍偷拍亚洲综合| 国产精品视频白浆免费视频| 无码人妻精品一区二区三区温州| 丰满放荡岳乱妇91ww| 热门国产精品亚洲第一区在线| 91精产国品一二三| 国产一区亚洲二区三区| 亚洲欧洲精品一区二区| 国产一区二区色| 欧美成人免费全部观看天天性色| 黑人精品xxx一区| 樱桃视频在线观看一区| 亚洲人xxxx| 亚洲一区二区偷拍精品| 1区2区3区精品视频| 国产精品国产三级国产普通话三级| 色综合久久久久久久久| 精品视频偷偷看在线观看| 欧美精品18videos性欧| 国产免费一区二区| 亚洲自偷自拍熟女另类| 成人三级做爰av| 麻豆精品免费视频| 在线观看黄色国产| 亚州av在线播放| 国产福利91精品一区二区三区| 久久99久久99| 天堂久久久久va久久久久| 亚洲成人黄色片| 日韩高清电影一区| 免费一区二区视频| 国产精品91xxx| 国产午夜精品福利| 极品美女销魂一区二区三区免费| 国产免费高清av| 国产精品高潮呻吟久久久| 日本丰满少妇做爰爽爽| 日韩精品亚洲专区| 不卡视频在线看| 午夜精品久久久久久久99水蜜桃| 亚洲国产天堂久久国产91| 精品久久久久久久久久久院品网| 欧美日韩一区二区三区免费看| 亚洲精品乱码久久久久久按摩观| 毛片精品免费在线观看| 日韩一区二区精品视频| 精品国产一区二区三区四区四| 伊人伊成久久人综合网小说| 九九热这里只有精品6| 成人精品网站在线观看| 妞干网视频在线观看| 亚洲午夜久久久久久久国产| 亚洲黄色在线播放| 亚洲天堂av老司机| 91麻豆精品国产91久久久资源速度| 欧美综合在线第二页| 99re99热| 一区二区三区少妇| 波多野结衣在线观看一区| 岛国一区二区三区| 色诱视频网站一区| 91精品久久久久久蜜臀| 在线观看成人黄色| 色综合五月天导航| 97久久精品午夜一区二区| 亚洲精品一区二区毛豆| 久久人人爽人人爽人人av| 手机精品视频在线| 无码一区二区精品| 欧美xxxx精品| 国产第一页在线播放| 一级做a爱片性色毛片| 久久一留热品黄| 欧美精品一区二区三区久久久| 成人在线国产精品| 日产精品一线二线三线芒果| 乱熟女高潮一区二区在线| 九九久久久久久| 少妇人妻丰满做爰xxx| 国产女18毛片多18精品| 亚洲自拍偷拍另类| 日韩永久免费视频| 成人国产精品视频| 色先锋资源久久综合| 性色av一区二区三区免费| 国产黄色激情视频| 日韩美女一级片| 久久亚洲影视婷婷| 国产一区二区三区18| 欧美福利精品| www.国产在线视频| www.超碰在线观看| 久久精品国产精品青草| 欧美亚洲动漫制服丝袜| 欧美一级淫片丝袜脚交| 老汉色影院首页| 在线小视频你懂的| 伊人久久久久久久久久久久| 国产成人在线视频网址| 色哦色哦哦色天天综合| 亚洲色图第三页| 99蜜桃在线观看免费视频网站| 久久精品久久精品国产大片| eeuss中文| 美女被爆操网站| 无码人妻久久一区二区三区 | 欧美激情18p| 国产传媒久久久| 国产福利久久久| 久久精品麻豆| 一区二区中文视频| 国产亚洲成精品久久| 国产一区二区精品免费| 国产69精品久久久久久久| 久久精品亚洲天堂| 国产免费www| 99久久久国产精品免费蜜臀| 欧美日韩免费观看一区二区三区 | 久久久九九九九| 在线观看日韩一区| 欧美精品九九久久| 一区二区在线观看网站| 在线一区二区不卡| 91超薄丝袜肉丝一区二区| 国产亚洲欧美一区在线观看| 精品视频在线看| 国产精品99蜜臀久久不卡二区| 亚洲欧美成人一区| 丰满少妇xbxb毛片日本| 91视频在线视频| 精品福利免费观看| 欧美一级成年大片在线观看| 蜜桃传媒一区二区三区| 顶级黑人搡bbw搡bbbb搡| 久久久久九九视频| 欧美日韩ab片| 天天操天天摸天天爽| 亚洲不卡免费视频| 国产精品天干天干在观线| 亚洲天堂视频在线观看| 99精品一区二区三区的区别| 免费在线视频观看| 97久久超碰精品国产| 一区二区三区中文在线观看| 在线观看91久久久久久| 日韩中文字幕在线不卡| 天天色天天综合| 久久久久久久久久久黄色| 欧美激情视频在线免费观看 欧美视频免费一 | 国产精品久久久久久久久搜平片 | 亚洲巨乳在线观看| 大地资源二中文在线影视观看 | 欧美激情一区二区三区蜜桃视频 | 欧美一区二区综合| 国产精品密蕾丝袜| 国产精品影音先锋| 日韩电影中文字幕一区| 成人观看免费完整观看| 九色综合狠狠综合久久| www.xxxx精品| 日韩欧美精品在线观看视频|