亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 新科技 ? 正文

開(kāi)源和閉源模型的差距在拉大:這是 DeepSeek 論文揭示的殘酷真相

IP屬地 中國(guó)·北京 硅星人 時(shí)間:2025-12-07 10:10:19


12月2日,DeepSeek 發(fā)布了 V3.2 技術(shù)報(bào)告。在這篇論文里,他們做了一件罕見(jiàn)的事:明確指出開(kāi)源大模型與閉源模型的性能差距不是在縮小,而是在擴(kuò)大。

這是基于大量實(shí)測(cè)數(shù)據(jù)的冷靜判斷。

1

差距正在拉大,這是事實(shí)

2024年,當(dāng) DeepSeek、Qwen、GLM 等開(kāi)源模型接連發(fā)布時(shí),社區(qū)充滿樂(lè)觀情緒。"8個(gè)月時(shí)間差"的說(shuō)法廣為流傳,許多人相信開(kāi)源正在追上閉源。但進(jìn)入2025年,情況發(fā)生了變化。

DeepSeek 在論文引言部分直言不諱地寫(xiě)道:“過(guò)去幾個(gè)月出現(xiàn)了明顯的分化。雖然開(kāi)源社區(qū)持續(xù)進(jìn)步,但閉源專有模型的性能提升速度顯著更快。結(jié)果是,兩者的差距非但沒(méi)有縮小,反而在擴(kuò)大,閉源系統(tǒng)在復(fù)雜任務(wù)上展現(xiàn)出越來(lái)越強(qiáng)的優(yōu)勢(shì)。”

這個(gè)觀察有數(shù)據(jù)支撐。論文對(duì)比了 DeepSeek V3.2 與 GPT-5、Gemini 3.0 Pro 在多個(gè)基準(zhǔn)測(cè)試上的表現(xiàn)。在 MMLU-Pro(多學(xué)科知識(shí)測(cè)試)中,DeepSeek V3.2 得分 85.0,GPT-5 是 87.5,而 Gemini 3.0 Pro 達(dá)到了 90.1。在 GPQA Diamond(研究生級(jí)別科學(xué)問(wèn)題)測(cè)試中,三者的得分分別是 82.4、85.7 和 91.9。


更明顯的差距體現(xiàn)在 HLE(Human Last Exam,極難的文本推理測(cè)試)中。DeepSeek V3.2 的得分是 25.1,GPT-5 是 26.3,而 Gemini 3.0 Pro 高達(dá) 37.7——這個(gè)差距已經(jīng)不是"接近"能形容的了。

值得注意的是,DeepSeek V3.2 已經(jīng)是目前最強(qiáng)的開(kāi)源模型,在大部分開(kāi)源模型的對(duì)比中都處于領(lǐng)先位置。但即便如此,它與頂級(jí)閉源模型之間仍然存在明顯差距,尤其是在需要深度推理和復(fù)雜任務(wù)處理的場(chǎng)景中。

1

差距為何在拉大?三個(gè)結(jié)構(gòu)性問(wèn)題

論文通過(guò)系統(tǒng)分析,識(shí)別出限制開(kāi)源模型在復(fù)雜任務(wù)上能力的三個(gè)關(guān)鍵缺陷。這些不是表面問(wèn)題,而是深層次的結(jié)構(gòu)性困境。

第一個(gè)問(wèn)題在于架構(gòu)層面。

開(kāi)源模型普遍依賴傳統(tǒng)的 vanilla attention 機(jī)制,這種機(jī)制在處理長(zhǎng)序列時(shí)效率極低。

論文指出,這種架構(gòu)上的依賴"嚴(yán)重限制了長(zhǎng)序列的效率,對(duì)可擴(kuò)展部署和有效的后訓(xùn)練構(gòu)成了實(shí)質(zhì)性障礙"。當(dāng)閉源模型已經(jīng)在探索更高效的注意力機(jī)制時(shí),開(kāi)源模型還在用五年前的技術(shù)架構(gòu),這本身就是一個(gè)巨大的劣勢(shì)。

第二個(gè)問(wèn)題是資源投入的鴻溝,尤其體現(xiàn)在后訓(xùn)練階段。

后訓(xùn)練是讓模型從"會(huì)說(shuō)話"變成"會(huì)思考"的關(guān)鍵環(huán)節(jié),需要通過(guò)強(qiáng)化學(xué)習(xí)讓模型學(xué)會(huì)推理、工具使用和遵循復(fù)雜指令。論文透露,DeepSeek V3.2 的后訓(xùn)練計(jì)算預(yù)算超過(guò)了預(yù)訓(xùn)練成本的 10%。要知道,預(yù)訓(xùn)練本身就是天價(jià)投入,而大部分開(kāi)源模型的后訓(xùn)練預(yù)算可能連 1% 都不到。這種資源投入上的差距,直接導(dǎo)致了性能上的代際差異。

第三個(gè)問(wèn)題是 AI Agent 能力的滯后。

在真實(shí)應(yīng)用場(chǎng)景中,開(kāi)源模型的泛化能力和指令理解能力明顯落后。論文引用了三個(gè)關(guān)鍵的 Agent 測(cè)評(píng)基準(zhǔn):在 MCP-Mark 中,DeepSeek V3.2 得分 45.9,Gemini 3.0 Pro 是 51.0;在 MCP-Universe 中,前者是 80.3,后者是 87.9;在 Tool-Decathlon 中,差距更加明顯。這些數(shù)字背后反映的是開(kāi)源模型在復(fù)雜多輪交互、工具調(diào)用、長(zhǎng)期規(guī)劃等場(chǎng)景下的能力不足。

論文總結(jié)道:"開(kāi)源模型在泛化能力和指令跟隨能力方面展現(xiàn)出明顯滯后,這阻礙了它們?cè)趯?shí)際部署中的有效性。"這是一個(gè)誠(chéng)實(shí)且殘酷的判斷。

1

DeepSeek 的應(yīng)對(duì):技術(shù)路線的根本性改變

認(rèn)識(shí)到問(wèn)題后,DeepSeek 沒(méi)有選擇簡(jiǎn)單地堆砌參數(shù)或增加數(shù)據(jù)量,而是在三個(gè)核心維度上進(jìn)行了根本性的技術(shù)創(chuàng)新。

在架構(gòu)層面,DeepSeek 引入了 DSA(DeepSeek Sparse Attention)機(jī)制。

傳統(tǒng)注意力機(jī)制的計(jì)算復(fù)雜度是 O(L2),序列長(zhǎng)度翻倍,計(jì)算量就要翻四倍。DSA 通過(guò)"閃電索引器"(Lightning Indexer)快速計(jì)算每個(gè) token 的重要性評(píng)分,然后只選擇 top-k 個(gè)最重要的 token 參與注意力計(jì)算(論文中 k=2048),將復(fù)雜度從 O(L2) 降至 O(L×k)。

這個(gè)改進(jìn)不僅僅是理論上的優(yōu)化。論文通過(guò)實(shí)測(cè)數(shù)據(jù)表明,在 128K 上下文長(zhǎng)度下,DSA 大幅降低了推理成本,而性能幾乎沒(méi)有損失。更令人意外的是,在 AA-LCR(長(zhǎng)文本推理基準(zhǔn))和 Fiction.liveBench(小說(shuō)理解測(cè)試)中,V3.2 的表現(xiàn)甚至優(yōu)于使用傳統(tǒng)注意力機(jī)制的 V3.1。這證明 DSA 不僅更快,在某些場(chǎng)景下質(zhì)量還更好。


在資源投入層面,DeepSeek 做出了超常規(guī)的決定。

論文明確寫(xiě)道:"近幾個(gè)月來(lái),性能提升與擴(kuò)展的 RL 訓(xùn)練預(yù)算持續(xù)相關(guān),該預(yù)算已超過(guò)預(yù)訓(xùn)練成本的 10%。"這個(gè)數(shù)字在開(kāi)源界極為罕見(jiàn)。具體來(lái)說(shuō),DeepSeek 為數(shù)學(xué)、編程、推理、Agent 等六大領(lǐng)域分別訓(xùn)練了專家模型,每個(gè)都單獨(dú)進(jìn)行大規(guī)模強(qiáng)化學(xué)習(xí)訓(xùn)練。在持續(xù)預(yù)訓(xùn)練階段,模型經(jīng)歷了 943.7B tokens 的訓(xùn)練(在 128K 上下文長(zhǎng)度下),然后采用 GRPO(Group Relative Policy Optimization)算法進(jìn)行混合訓(xùn)練,整合推理、Agent 和人類對(duì)齊三類任務(wù)。

在 Agent 能力強(qiáng)化方面,DeepSeek 開(kāi)發(fā)了系統(tǒng)化的任務(wù)合成流程。

他們合成了超過(guò) 1800 個(gè)多樣化環(huán)境和 85,000 條復(fù)雜提示,涵蓋各種真實(shí)場(chǎng)景。具體包括 24,667 個(gè)代碼 Agent 任務(wù)、50,275 個(gè)搜索 Agent 任務(wù)、4,417 個(gè)通用 Agent 任務(wù)和 5,908 個(gè)代碼解釋器任務(wù)。這些合成數(shù)據(jù)不是隨機(jī)生成的,而是通過(guò)冷啟動(dòng)階段學(xué)習(xí)推理與工具使用的統(tǒng)一模式,然后在規(guī)模化階段系統(tǒng)地生成高質(zhì)量訓(xùn)練場(chǎng)景。

效果是顯著的。在 Agent 相關(guān)的測(cè)試中,DeepSeek V3.2 顯著縮小了與閉源模型的差距,在 MCP-Universe 上達(dá)到了 80.3% 的成功率,雖然仍低于 Gemini 的 87.9%,但已經(jīng)是開(kāi)源模型中的最佳表現(xiàn)。論文總結(jié)說(shuō):“DeepSeek V3.2 成為 Agent 場(chǎng)景中極具成本效益的選擇,顯著縮小了開(kāi)源與前沿閉源模型之間的性能差距。”

論文最后寫(xiě)了一句耐人尋味的話:"如果 Gemini 3.0 證明了持續(xù)擴(kuò)展預(yù)訓(xùn)練的潛力,DeepSeek V3.2-Speciale 則證明了在大規(guī)模上下文環(huán)境中強(qiáng)化學(xué)習(xí)的可擴(kuò)展性。"言下之意很明顯:閉源巨頭有資源堆預(yù)訓(xùn)練,但開(kāi)源可以找到自己的路——通過(guò)更高效的架構(gòu)和更科學(xué)的后訓(xùn)練,用更少的資源實(shí)現(xiàn)接近的效果。

這或許是開(kāi)源 AI 唯一的生存之道:不是硬碰硬拼資源,而是拼技術(shù)路線的創(chuàng)新。至少在這一次,DeepSeek 證明了這條路是走得通的。


論文鏈接:https://arxiv.org/html/2512.02556v1

整理:周華香

點(diǎn)個(gè)愛(ài)心,再走 吧

免責(zé)聲明:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
中文永久免费观看| 国产视频久久久久久| 一区二区视频在线观看| 亚洲乱码一区二区三区| 日韩一区二区三区资源| 日本一区免费观看| 亚洲一区二区三区午夜| 日韩免费电影一区二区| 先锋影音一区二区三区| 亚洲午夜精品一区二区三区| 在线看视频不卡| 丁香五月网久久综合| 国产伦一区二区三区色一情| 国产精品一区免费观看| 日韩久久精品一区二区三区| 久久www视频| 日批视频在线免费看| 色乱码一区二区三区在线| 国产黄色一区二区三区| 亚洲一级中文字幕| 麻豆国产尤物av尤物在线观看| 国产一级二级三级| 中文字幕人妻互换av久久| 亚洲精品国产精品乱码不卡| 精品国自产拍在线观看| 久久国产夜色精品鲁鲁99| 国产高清精品久久久久| 国产主播一区二区三区| 99久久国产综合精品色伊| 国产精品美女一区二区| 欧美性猛交xxxx乱大交极品| 亚洲国产精品字幕| 欧美精品一区二区三区国产精品| 国产精品情侣自拍| 亚洲国产一区在线| 亚洲 欧美 另类人妖| 国产呦小j女精品视频| 久久精品亚洲无码| 亚洲欧美日韩免费| 久久久久久一级片| 欧美亚洲一区三区| 日韩在线免费观看视频| 成人做爽爽免费视频| 一区二区精品在线| 黄色片免费网址| 久久中文免费视频| 少妇高潮一区二区三区99小说| 波多野结衣视频一区| 精品国产乱码久久久久久虫虫漫画 | 天天干在线观看| 成年人网站91| 欧美午夜影院一区| 久久久久北条麻妃免费看| 亚洲a在线观看| 一区二区传媒有限公司| 级毛片内射视频| 国产又黄又猛又爽| 久久久噜噜噜久久人人看| 欧美日韩一区小说| 91精品国产电影| 亚洲精品一区二区三| 亚洲第一成肉网| 91视频免费在线看| 国产高清无密码一区二区三区| 色久优优欧美色久优优| 亚洲国产精品久久精品怡红院| 日本久久久久亚洲中字幕| 国产精品成人久久电影| 毛片视频免费播放| 久久国产麻豆精品| 色综合久久九月婷婷色综合| 欧美精品在线视频观看| 亚洲欧洲中文| 日本一二三不卡视频| 久久精品动漫| 欧美日韩亚洲综合一区二区三区| 97婷婷涩涩精品一区| 少妇高潮毛片色欲ava片| 国产67194| 成人午夜在线视频| 亚洲国产成人久久综合| 九九九九九精品| 国产麻豆剧传媒精品国产| 伊人久久综合视频| 国产精品国产三级国产三级人妇 | 精品产品国产在线不卡| 无码人妻久久一区二区三区蜜桃| 国产女人18毛片18精品| 一区二区免费看| 欧美精品18videos性欧| 国自产拍偷拍精品啪啪一区二区 | 国产h视频在线播放| 青青草在线观看视频| 丰满白嫩尤物一区二区| 欧美电影精品一区二区| 国产欧美亚洲日本| 亚洲精品乱码久久久久久久| 亚洲欧美色视频| 欧美日本韩国一区| 岛国视频一区| 成人午夜免费影院| 成人av电影免费观看| 在线观看欧美日韩国产| 欧美日韩一级在线| 久久久久无码国产精品不卡| 91日韩一区二区三区| 日韩一区视频在线| av免费在线播放网站| 精品久久在线观看| 欧美精品日日鲁夜夜添| 久久久人人爽| 国产真人真事毛片| 亚洲一区二区欧美日韩 | 亚洲人成网站在线| 97色在线播放视频| 日本女人性视频| 麻豆精品一区二区综合av| 日韩电影免费在线观看中文字幕 | 911av视频| 99热只有这里有精品| 亚洲第一主播视频| 成人欧美一区二区三区在线观看| 中国美女黄色一级片| 国产色综合一区| 欧美亚洲激情在线| 亚洲天堂资源在线| 久久久久久亚洲综合| 日韩**中文字幕毛片| 91精品国产自产| 国产精品丝袜黑色高跟| 国产精品久久中文| 99成人在线观看| 亚洲免费大片在线观看| 亚洲自拍av在线| 青青草在线观看视频| 欧美日韩国产中文精品字幕自在自线| 国产一区二区三区高清| 欧美精品一二三四区| 欧美日韩国产免费| 永久免费看av| 久久国产欧美| 最近更新的2019中文字幕| www.污网站| 91啦中文在线观看| 国产欧美va欧美va香蕉在| 少妇被躁爽到高潮无码文| 亚洲成av人片在线观看无码| 欧美久久久久久久| 亚洲av无码国产精品永久一区| 精品亚洲一区二区三区四区五区| 一级黄色香蕉视频| 国产在线麻豆精品观看| 欧美大尺度在线观看| 女同激情久久av久久| 国产一区二区三区久久久| 午夜精品一区二区三区在线| 精品少妇一区二区三区密爱| 欧美体内谢she精2性欧美| 在线观看成人av电影| 首页国产欧美久久| 欧美黑人又粗大| 欧洲美女女同性互添| 91豆麻精品91久久久久久| 大伊香蕉精品视频在线| 国产99久久久久久免费看农村| 国产精彩精品视频| 亚洲伊人成人网| 亚洲精品av在线| 无码国产精品一区二区免费式直播 | 日韩理论片中文av| 日韩av高清| 免费网站看av| 综合欧美亚洲日本| 国产精品免费一区二区三区| 狠狠v欧美v日韩v亚洲ⅴ| 伊人久久在线观看| 亚洲精品国产精华液| 丰满少妇大力进入| 欧美黑人性猛交| 欧美精品xxxxbbbb| 一本一本久久a久久精品综合麻豆| 国产成人午夜电影网| 欧美日韩中文视频| 免费黄色福利视频| 91国偷自产一区二区三区的观看方式| 亚洲精品美女在线| 国产在线拍揄自揄拍无码视频| 国产mv久久久| wwwwxxxxx欧美| 欧美在线视频第一页| 国产精品久久久久99| 国产裸体美女永久免费无遮挡| 成人在线国产视频| 国产精品ⅴa在线观看h| 精品激情国产视频| 伊人亚洲福利一区二区三区| 欧美成人午夜电影| 26uuu色噜噜精品一区二区| 国产免费无遮挡| 精品日本一区二区| 亚洲国产精华液网站w| 一本加勒比北条麻妃| 好吊色欧美一区二区三区四区| 久久精品在线免费观看| 久久成人av网站| 五月激情丁香网| 国产99久久精品一区二区永久免费| 性感美女视频一二三| 久久久婷婷一区二区三区不卡| 久久精品国产欧美亚洲人人爽| 欧美日韩免费在线| 91久久精品无码一区二区| 中国男女全黄大片| 成人激情直播| 欧美日韩黄视频| 国产又爽又黄免费软件| 精品国产无码在线| 欧美日韩中文字幕日韩欧美| 青青草自拍偷拍| 亚洲一区在线直播| 正在播放国产对白害羞| 欧美日韩一级片在线观看| 日韩欧美三级在线观看| 午夜精品久久久久久久久久久久久| 国产精选一区二区三区| avav在线播放| 欧美日本在线看| 五月婷婷激情网| 亚洲精品少妇一区二区| 欧美日韩色综合| 日批视频在线播放| 日本手机在线视频| 久久综合伊人77777蜜臀| 日日摸夜夜添夜夜添精品视频 | 播放灌醉水嫩大学生国内精品| 亚洲成在人线在线播放| 国产成人精品av在线观| 777久久久精品一区二区三区| 亚洲欧美日韩精品久久奇米色影视| 卡一卡二国产精品| 久久爱一区二区| 国产美女主播在线播放| 5278欧美一区二区三区| 成人午夜电影久久影院| 久草国产精品视频| 国产精品久久..4399| 久久国产精品久久久久| 一区二区三区免费| 日本视频一区二区三区| 亚洲熟妇无码av| 国产伦精品一区二区三区在线| 欧美精选午夜久久久乱码6080| 91福利在线观看视频| 免费黄色福利视频| 久久99视频免费| 91精品国产入口在线| 中文字幕免费在线观看视频一区| 波多野结衣视频网址| 黄色污在线观看| 日本精品一区二区三区视频| 日韩中文娱乐网| 亚洲国产精品久久不卡毛片 | 欧美福利视频一区二区| 黄色污在线观看| 欧美精品一区二区三区在线四季| 亚洲性线免费观看视频成熟| 久久在线观看免费| 日日躁夜夜躁白天躁晚上躁91| 欧美成人三级视频| 日本道在线视频| 国产伦精品一区二区三区视频黑人| 精品亚洲一区二区三区| 欧美精三区欧美精三区| 午夜不卡av在线| 久久品道一品道久久精品| 国产一区中文字幕| 久艹视频在线观看| 色综合99久久久无码国产精品| 特色特色大片在线| 国产精品日韩av| 5278欧美一区二区三区| 91wwwcom在线观看| 九九久久综合网站| 久久亚洲精品国产亚洲老地址| 国产一区二区三区精品久久久| 9191精品国产综合久久久久久| 一区二区欧美视频| 成人国产精品免费观看| 免费看黄网站在线观看| 国产又大又粗又硬| 亚洲一区在线观| 国产黄色av网站| 国产一级生活片| 日本少妇bbwbbw精品| 国产午夜精品福利视频| 中国特级黄色片| 亚洲成a人无码| 国产永久免费网站| 已婚少妇美妙人妻系列| 北条麻妃69av| 亚洲欧洲日本精品| 插我舔内射18免费视频| 韩国三级丰满少妇高潮| 色哟哟精品观看| 疯狂揉花蒂控制高潮h| 超碰91在线播放| 三级在线视频观看| 91激情视频在线| 亚洲欧美一二三区| 精品综合免费视频观看| 国产精品66部| 精品露脸国产偷人在视频| 精品91自产拍在线观看一区| 亚州成人av在线| 亚洲欧洲精品在线 | 中文字幕一区二区三区波野结| 99综合电影在线视频| 色系网站成人免费| 韩国三级电影久久久久久| 日本不卡久久| v天堂中文在线| 国产又粗又黄又爽视频| 最好看的中文字幕久久| 日韩av在线电影网| 久久视频这里有精品| 久久精品www| 国产精品亚洲一区二区三区妖精| 欧美日韩亚洲综合一区二区三区| 久久久久国产视频| 激情网站五月天| 最近国语视频在线观看免费播放| 国产91精品免费| 亚洲第一福利网站| 精品国产乱码久久久久软件| 精品伦一区二区三区| 久久精品官网| 91精品婷婷国产综合久久性色| 国产在线视频欧美| 日本久久久久久久久久| 亚洲va欧美va| 欧美日韩国产区一| 成人淫片在线看| 妺妺窝人体色WWW精品| 韩国成人精品a∨在线观看| 亚洲黄色免费三级| 大地资源网在线观看免费官网| 看电视剧不卡顿的网站| 91精品国产综合久久久久久久| 欧美激情论坛| 一级黄色在线观看| 这里只有精品免费| 黄页免费在线观看视频| 天堂在线视频网站| 亚洲欧洲xxxx| 天堂在线一区二区三区| 国产一区二区福利| 欧美韩日一区二区| 国产精品成人99一区无码 | 亚洲 日本 欧美 中文幕| 夜夜操天天操亚洲| 91人人爽人人爽人人精88v| 任你操精品视频| 五月婷婷另类国产| 亚洲一区二区三区精品在线观看| 最新国产中文字幕| 欧美一二三在线| 妺妺窝人体色www在线小说| 丝袜国产日韩另类美女| 日韩在线观看网址| 国产高潮失禁喷水爽到抽搐 | 人妻体内射精一区二区| 国产精品美日韩| 国产伦精品一区二区三区视频黑人 | 日本不卡免费新一二三区| 91theporn国产在线观看| 亚洲奶大毛多的老太婆| 黄色工厂在线观看| 欧美日韩一区二区三区免费看| 日韩av综合在线观看| 久久国产精品无码网站| 国内外成人免费激情在线视频网站| 国产免费无遮挡吸奶头视频| 色八戒一区二区三区| www.亚洲天堂网| 亚洲图片你懂的| 一区二区三区欧美在线| 石原莉奈在线亚洲三区| 国产免费成人av| 亚洲天堂手机在线| 91地址最新发布| 亚洲精品毛片一区二区三区| 色香阁99久久精品久久久| 亚洲毛片亚洲毛片亚洲毛片| 欧美色图第一页| 成人午夜激情av| 亚洲欧美激情一区二区| 亚洲一区高清| 91免费视频网址| 日韩精彩视频| 国产精品黄色在线观看| 国产精品国产三级国产aⅴ9色 | 97视频免费在线| 国产999精品久久久影片官网| 性插视频在线观看| 777xxx欧美| 欧美多人猛交狂配| 这里只有精品视频| 91精品视频免费在线观看| 91久久精品在线| av动漫一区二区|