亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

DeepSeek-V3.2巨「吃」Token,竟然是被GRPO背刺了

IP屬地 中國·北京 機器之心Pro 時間:2025-12-04 18:31:39



機器之心報道

編輯:冷貓、陳陳

DeepSeek 一發布模型,總會引起業內的高度關注與廣泛討論,但也不可避免的暴露出一些小 Bug。

比如老外用英文詢問,它卻在思考過程中切回「神秘的東方文字」。當然,DeepSeek 模型對漢字「情有獨鐘」的情況早已出現,「極」字 Bug 就是典型例子。

而這一次,隨著新模型 DeepSeek-V3.2 的發布,大家又發現了 DeepSeek 需要優化的地方:其長思考版本(Speciale)暴露出一些 Token 使用效率不佳的問題。

根據多位研究者反饋,DeepSeek-V3.2 Speciale 在處理復雜任務時出現明顯的 Token 消耗異常。具體表現為:

在相同任務上,Gemini 只消耗 2 萬 Token,DeepSeek-V3.2 Speciale 卻用了 7.7 萬,也就是說,它需要 3 倍以上的 Token 才能輸出類似質量的結果。

另外,Speciale 版本出現輸出內容又長又啰嗦的問題,但最終仍然錯的情況,這并不是新問題,而是 GRPO 算法本身的固有缺陷。



https://x.com/Compute_King/status/1996179050012794968

實際上,DeepSeek-V3.2 在 Token 消耗方面的異常表現,已經被不少用戶與研究者觀察到。有社區網友指出,Speciale 版本的確具備極強的推理能力,但在實際使用中 Token 消耗速度如喝水般迅速,顯著高于同類模型。他們評價,如果 DeepSeek-V3.2 Speciale 的生成速度能夠從當前的大約 30 tokens/s 提升至 100 tokens/s 左右,那么其綜合可用性和使用體驗都將獲得大幅改善。



獨立分析 AI 模型和托管服務提供商 Artificial Analysis 則表示:「DeepSeek V3.2 在推理模式下比上一代更啰嗦,在運行 AAII(Artificial Analysis Intelligence Index)基準測試時,輸出 Token 消耗明顯增加,達 8600 萬,而上一版本僅為 6200 萬。」



https://x.com/ArtificialAnlys/status/1996110264102781332

「即使是和 Grok 和 Mistral 對比,也是明顯看到 DeepSeek V3.2 輸出 Token 的延遲。」



https://x.com/kurtqian/status/1995728391115362529

這種情況,DeepSeek 也在技術報告中很坦誠的承認并且做出了數據對比。





報告中提及,DeepSeek-V3.2-Speciale 的 token 使用效率明顯低于 Gemini-3.0-Pro。

為了降低部署成本并減少推理時延,官方版 DeepSeek-V3.2 的訓練過程中施加了更為嚴格的 token 約束,以期在性能與成本之間取得更優的權衡。DeepSeek 研究者們表示,token 效率仍將是未來一個至關重要的研究方向。

DeepSeek 技術報告:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

輸出內容又長又啰嗦,GRPO 算法存在缺陷

GRPO 算法隨著 DeepSeek 的誕生而成為強化學習的黃金范式,相信讀者們早就不陌生了。

我們對 GRPO 的方法基本原理曾有過系統的介紹,建議讀者參考我們的科普文章。科普向:一文解構大模型后訓練,GRPO 和它的繼任者們的前世今生

早在今年三月份公開的論文《Understanding R1-Zero-Like Training: A Critical Perspective》中,來自 Sea AI Lab 和 NUS 等的研究者們,揭示了 GRPO 算法的兩大問題,認為 GRPO 會導致模型有偏置的優化。



論文標題:Understanding R1-Zero-Like Training: A Critical Perspective論文鏈接:https://arxiv.org/pdf/2503.20783Github 鏈接:https://github.com/sail-sg/understand-r1-zero

在 DeepSeek-R1-Zero 的訓練過程中,就已有模型的響應長度在整個訓練階段持續增長的現象,而在 DeepSeek-V3.2 Speciale 中仍然存在。

以下公式是經典的 GRPO 損失函數,論文作者很貼心地把影響優化過程的部分標紅了:



GRPO 的目標函數結構中存在了:

1. 長度偏置(Length Bias)



當優勢函數為正值時(表示對應的響應是正確的):較短的響應會產生更大的梯度更新幅度,從而使策略在優化過程中更傾向于生成簡短的正確答案。當優勢函數為負值時(表示對應的響應是錯誤的):較長的錯誤響應所受到的懲罰反而更弱,從而導致策略在錯誤樣本中偏向于生成更長的回答。

這解釋了:即便不引入任何「顯式鼓勵長推理鏈」的機制,GRPO 訓練出的模型也會自然呈現出響應長度不斷增長的趨勢,躲避懲罰,生成又錯又長的回復。

2. 難度偏置(Difficulty Bias)

該偏置來源于優勢函數中對優勢函數進行標準化時所使用的分母:



這會導致當某些問題的回報標準差較小,尤其是題目過于困難,幾乎所有回報都為 0 的時候,在策略更新過程中將被賦予更大的梯度權重,忽視了那些難度適中的實際問題。

我們從 DeepSeek-V3.2 的技術報告中發現,難度偏置已經被優化了,而長度偏置仍然被保留。這或許是 DeepSeek-V3.2 Speciale 超級耗 token 的罪魁禍首。



上述「長度偏置」問題其實由來已久,在 GRPO 的前身 PPO 方法中就早已存在。但是,在 PPO 的損失函數公式中其實并沒有「長度偏置」這一項,而在 PPO 的大多開源實現中,卻大都加入了這一項。

作者推測,這種不一致性可能源自預訓練階段:

所有 token 會被打包進一個固定長度的上下文窗口,通過對上下文長度進行歸一化可以有效提升數值穩定性。

但在 RL 微調階段保持相同的實現方式會,按照響應長度對損失進行歸一化。但響應長度不是常數且在不同樣本之間變化劇烈,從而無意中引入了一個長度偏置。

由此可見,理論和實際實現之間總有些許的差別。等到 DeepSeek-V4 的上線,這個問題會不會就此解決呢?

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

日韩成人在线观看| 91浏览器在线观看| 日韩精彩视频在线观看| 国产精品久久久久桃色tv| 欧美日韩成人综合在线一区二区| 在线看日韩欧美| www.成人三级视频| 911av视频| 午夜啪啪福利视频| 自拍另类欧美| 日韩欧美国产综合在线| 在线观看黄色国产| 精品视频1区2区3区| 欧美一区二粉嫩精品国产一线天| 浴室偷拍美女洗澡456在线| 怡红院成永久免费人全部视频| 国产精品丝袜白浆摸在线| 亚洲国产精品suv| 国产成人小视频在线观看| 亚洲午夜久久久久久久久| 亚洲男人天堂久久| 亚洲人成精品久久久久| 7777kkkk成人观看| 青青成人在线| 91精品久久久久| 国产视频99| 亚洲成人动漫在线| 天堂在线资源网| 日韩高清不卡一区| 精品国产免费一区二区三区四区 | 3d动漫精品啪啪1区2区免费 | 在线国产亚洲欧美| 性少妇xx生活| 欧美色播在线播放| 日韩av成人在线| 天天干天天色天天干| 美女任你摸久久| 国产一区二区三区网站| 日韩免费在线观看| 久久99热精品这里久久精品| 国产精品女主播| 中文字幕日韩精品久久| 久久―日本道色综合久久| 中国日韩欧美久久久久久久久| 国产成人av影视| 成人美女视频在线观看| 国产精品视频中文字幕| 亚洲国产精品中文| 国产精品成人无码| 国产精品成人观看视频免费| 精品久久人妻av中文字幕| 国产欧美精品一区| 国产精品视频永久免费播放| 国产尤物在线视频| 国产一区二区在线电影| 亚洲偷欧美偷国内偷| 欧美一级性视频| 亚洲人成在线免费观看| 韩国三级hd中文字幕有哪些| 一区二区三区中文字幕精品精品| 精品视频—区二区三区免费| 国产三级短视频| 欧美一级视频精品观看| 日本美女久久久| 中文字幕精品在线不卡| 永久免费精品影视网站| 污视频网址在线观看| 日韩一区在线播放| 国产精品视频在线播放| 涩视频在线观看| 亚洲免费电影一区| 国产视频手机在线| 国产福利精品一区二区| 国产高清自拍一区| 欧美黄色一级大片| 欧美性色黄大片手机版| 孩娇小videos精品| 亚洲午夜激情视频| 亚洲欧美电影院| 国内精品久久久久伊人av| 在线视频日韩一区 | 久久色免费在线视频| 69av视频在线| 久草精品在线观看| 欧美一级淫片丝袜脚交| 日本三级片在线观看| 亚洲成人在线网| 国产ts在线观看| 一区二区三区四区在线| 久久综合久久久久| 可以免费看的黄色网址| 五月天丁香社区| 亚洲国产欧美在线人成| 麻豆映画在线观看| thepron国产精品| 国产在线一区二区三区播放| 无套内谢的新婚少妇国语播放| 欧美一区视频在线| av首页在线观看| 精品国内产的精品视频在线观看| 日韩福利小视频| 欧美v国产在线一区二区三区| 亚洲自拍偷拍色图| 538精品视频| 337p日本欧洲亚洲大胆色噜噜| 日本午夜精品一区二区三区| 国产成人精品777777| 亚洲成人免费看| 免费精品视频一区| 日韩 欧美一区二区三区| 在线精品日韩| 美女一区二区三区在线观看| 成人午夜电影免费在线观看| 亚洲色偷精品一区二区三区| 国产乱肥老妇国产一区二| 国产视频一区二区三| 国产成人av在线| www.爱爱.com| 国产精品丝袜久久久久久不卡| 欧美特黄一级视频| 91久久精品一区二区别| 狠狠色丁香婷综合久久| 欧美极品一区| 久久综合999| av高清在线免费观看| 亚洲少妇最新在线视频| 无人在线观看的免费高清视频| 亚洲精品国产精华液| 欧美精品性生活| 精品久久久久久中文字幕| 波多野结衣中文字幕在线播放| 欧美三级视频在线播放| 国产成人福利在线| 亚洲另类图片色| 日韩欧美不卡视频| 欧美在线日韩在线| 日韩高清不卡一区二区| 欧美日韩视频在线一区二区观看视频| 91蝌蚪国产九色| 777久久久精品一区二区三区| 亚洲h精品动漫在线观看| 亚洲精品鲁一鲁一区二区三区 | 日韩亚洲欧美一区二区三区| 痴汉一区二区三区| 精品久久久久中文慕人妻 | 影音先锋男人在线| 日本a在线免费观看| 久久久不卡影院| 在线不卡日本| 99在线热播精品免费| 日本wwwcom| 色悠悠久久综合网| 欧美一区二区视频在线观看2022| 日本xxxxxxxxx18| 久久久91精品| 凸凹人妻人人澡人人添| 亚洲丰满在线| 亚洲一区二区三区四区五区中文| 三级视频网站在线观看| 日韩视频在线免费观看| 日韩一卡二卡在线| 在线观看日韩片| 性做久久久久久免费观看欧美| 短视频在线观看| 久久福利网址导航| 麻豆成人综合网| 99精品人妻少妇一区二区| 欧美久久久久免费| 日本中文字幕免费| 成人av在线网址| 91丝袜高跟美女视频| 国产aⅴ爽av久久久久| 亚洲美女精品成人在线视频| av天堂一区二区三区| 99国精产品一二二线| 欧美高清在线精品一区| 人体私拍套图hdxxxx| 欧美日韩国产成人| 国产精品亚洲一区二区三区妖精| 黑鬼大战白妞高潮喷白浆| 亚洲第一免费网站| 亚洲女人18毛片水真多| 国产在线视频综合| 日韩一区二区免费在线电影| 亚洲综合精品国产一区二区三区 | 天天综合天天干| 免费成人深夜夜行网站视频| 欧美色区777第一页| 亚洲日本韩国在线| 国产精品久久久久久久久久久久冷| av电影天堂一区二区在线| 亚洲小视频网站| 欧美精品18videos性欧| 3d蒂法精品啪啪一区二区免费| 麻豆精品视频在线| 91精品无人成人www| 久久精品2019中文字幕| 久久成人免费网站| 久久精品无码一区二区三区毛片| 久久视频国产精品免费视频在线| 国产一区免费电影| 欧美做受高潮中文字幕| 欧美怡春院一区二区三区| 日本一区二区三区国色天香| 久久一级免费视频| www日韩av| 欧美性受xxxx黑人xyx| japanese国产| 国产精品沙发午睡系列| www.日韩.com| 久久伊人中文字幕| 在线看的片片片免费| 久久精品成人一区二区三区蜜臀 | 精品福利av导航| 亚洲av成人无码网天堂| 国产乱叫456| 国产www精品| 婷婷亚洲久悠悠色悠在线播放 | 国产精品二区一区二区aⅴ| 精品日本一区二区三区在线观看| 色婷婷香蕉在线一区二区| 国产精品无码免费播放 | 无码日本精品xxxxxxxxx| 国产一区二区久久精品| 成人av电影在线观看| 国产高清视频免费在线观看| 日韩一区国产在线观看| 日韩精品在线免费观看视频| 久久久中精品2020中文| 一级精品视频在线观看宜春院| 丁香桃色午夜亚洲一区二区三区| 国产精品美女主播| 蜜臀久久久久久999| 中文成人无字幕乱码精品区| 精品国产二区在线| 亚洲精品国产成人| 久久久精品tv| 麻豆专区一区二区三区四区五区| 波多野结衣av一区二区全免费观看| 亚洲午夜色婷婷在线| 91欧美激情一区二区三区成人| 粉嫩av性色av蜜臀av网站| 日本不卡二区高清三区| 亚洲一区二区精品| 国产午夜精品福利| 蜜臀99久久精品久久久久小说| 国产精品视频一区二区三区四区五区| 欧美日本国产在线| 精品福利在线视频| 日韩影院免费视频| 刘亦菲国产毛片bd| 国产精品日韩三级| 欧美一区二区三区四区在线| 在线免费一区三区| 韩国理伦片一区二区三区在线播放| 久久久精品成人| 最新欧美日韩亚洲| 69av视频在线播放| 欧美精品久久99| kk眼镜猥琐国模调教系列一区二区| 欧洲猛交xxxx乱大交3| 国产高清精品在线观看| 成人黄色免费片| 精品黑人一区二区三区久久 | 捆绑紧缚一区二区三区视频| 成人高潮免费视频| 高清在线观看免费| 91影视免费在线观看| 日韩精品在线观看一区二区| 国产精品久久久久影院色老大| 亚洲精品免费在线观看视频| www久久久久久久| 欧美 丝袜 自拍 制服 另类 | 日本精品免费一区二区三区| 欧美三级午夜理伦三级中视频| 三年中国中文在线观看免费播放| 日韩欧美一区二区视频在线播放 | 国产1区2区3区精品美女| 日本毛片在线观看| 国产精品自偷自拍| 亚洲欧美一二三区| 国产91精品一区| 800av免费在线观看| 国产一级在线视频| 国产欧美一区二区三区在线老狼 | 视频在线观看一区二区| 亚洲成人第一页| 国产精品香蕉一区二区三区| 亚洲天堂国产精品| 天美传媒免费在线观看| 国内自拍视频一区| 青青草原成人| 国产精品欧美激情在线播放| 亚洲网址你懂得| 欧美日韩中文国产| 亚洲色图清纯唯美| 国产999精品久久久久久 | 在线观看日本网站| 色噜噜在线观看| 国产激情在线观看视频| 免费一区二区三区在在线视频| 欧洲s码亚洲m码精品一区| 国产一区二区三区在线观看视频 | 国产一区二区h| 国产黄色小视频在线观看| 久久久国产精品黄毛片| 男男一级淫片免费播放| 激情伊人五月天| 天堂资源在线亚洲资源| 日韩美女福利视频| 美女久久久久久久久久久| 亚洲第一区中文99精品| 狠狠躁夜夜躁人人爽超碰91| 国产欧美综合色| 国产一区二区三区在线观看免费 | 国产日韩视频在线观看| 午夜精品福利电影| 日韩中文在线不卡| 日韩成人在线视频网站| 91精品国产色综合久久不卡蜜臀| 亚洲国产日韩在线一区模特| 国产欧美一区二区精品秋霞影院 | 久久久久亚洲视频| 欧美激情一区二区三区不卡| 欧美性色欧美a在线播放| 最近2019好看的中文字幕免费| 日韩免费av片在线观看| 亚洲综合五月天| 91九色最新地址| 国产成人精品久久久| 日韩免费福利电影在线观看| 色www亚洲国产阿娇yao| 久久在线观看视频| 91国产精品一区| 成人久久久久久久| 久久国产三级精品| 欧美日韩一区二区视频在线观看 | www.亚洲高清| 成人免费视频一区| 国产日韩av高清| 男人天堂中文字幕| 亚洲成人激情视频| 四虎永久国产精品| 肥臀熟女一区二区三区| 国产亚洲精品久久久久久牛牛| 微拍福利一区二区| 日韩三级在线免费观看| 成人在线观看免费高清| 久久众筹精品私拍模特| 蜜桃臀一区二区三区| 久久精品免费观看| 成人高清视频观看www| 欧美极品视频在线观看| 久久这里都是精品| 蜜桃传媒视频麻豆一区 | 欧美猛少妇色xxxxx| 亚洲av无码一区二区三区观看| 在线精品国精品国产尤物884a| aaaaaav| 亚洲国产天堂久久综合网| 特级毛片www| 久久久久久久香蕉网| 久久久久免费| 99se婷婷在线视频观看| 蜜桃在线一区二区三区| 欧美一区二区三区免费观看 | 91精品国产色综合久久不8| 亚洲一级黄色片| 美女脱光内衣内裤| 精品国产三级a在线观看| 国产一二三四五区| 欧美日韩中文在线| 日av中文字幕| 五月天中文字幕一区二区| 蜜臀av无码一区二区三区| 亚洲国产日韩av| 免费毛片视频网站| 欧美一级在线播放| 国产又粗又猛又爽又黄91| 国产免费亚洲高清| av欧美精品.com| 97成人在线免费视频| 全部免费毛片在线播放一个| 日韩精品在线免费观看视频| 久热这里只有精品在线| 精品丝袜一区二区三区| xxxxwww一片| 久久久久久亚洲精品不卡| 国产精品18久久久久久久久 | 国产清纯在线一区二区www| 丝袜熟女一区二区三区| 久久精品国产亚洲精品2020| 成人综合在线观看| 美女网站视频在线观看| 日韩中文字幕国产| www日本视频| 国产精品爽爽爽爽爽爽在线观看| 国内精品第一页| 2018国产在线| 一本色道久久综合精品竹菊| 色噜噜噜噜噜噜| 久久91精品国产91久久跳| 精品少妇爆乳无码av无码专区| 国产视频一区在线| 久久久久久久久久免费视频 | www.五月婷| 国产一区二区视频免费在线观看| 一区二区三区在线观看动漫| 顶级黑人搡bbw搡bbbb搡| 69久久夜色精品国产7777|