OpenAI危！DeepSeek放大招：追平谷歌最強，手撕GPT-5 High

IP屬地中國·北京 新智元 時間：2025-12-02 00:11:52

新智元報道
編輯：艾倫 KingHZ
「開源之神」DeepSeek重磅發(fā)布V3.2正式版，性能全面超越GPT-5 High，與谷歌Gemini-3.0 Pro平分秋色。新模型不僅斬獲4項國際奧賽金牌級成績，更憑借獨創(chuàng)的DSA稀疏注意力架構(gòu)，打破「速度、成本、智能」的不可能三角。
OpenAI這次真的要慌了！
就在剛剛，「源神」DeepSeek開源了DeepSeek-V3.2正式版——
在數(shù)學(xué)編程等多項推理基準(zhǔn)上，全面超越GPT-5 High，優(yōu)于Claude 4.5 Sonet；
與刷屏的Gemini 3.0 Pro相比，則難分伯仲，不相上下！

表1：DeepSeek-V3.2與其他模型在各類數(shù)學(xué)、代碼與通用領(lǐng)域評測集上的得分（括號內(nèi)為消耗Tokens估計總量）
在今年，DeepSeek此前已發(fā)布7款模型——「開源之神」，當(dāng)之無愧：
DeepSeek?R1、DeepSeek?R1?Zero
DeepSeek?V3、DeepSeek?V3.1、DeepSeek?V3.1-Terminus、DeepSeek?V3.2?Exp
DeepSeek?OCR、DeepSeek?Math-V2
出手即王炸
開源4項奧賽金牌級AI
全新模型DeepSeek-V3.2，出手即王炸。
DeepSeek正式發(fā)布DeepSeek-V3.2與DeepSeek-V3.2-Speciale——專為智能體打造的推理優(yōu)先模型！
DeepSeek-V3.2：V3.2-Exp的官方迭代版本，現(xiàn)已登陸App、網(wǎng)頁端及API；
DeepSeek-V3.2-Speciale：突破推理能力邊界，目前僅通過API提供服務(wù)。

兩款模型均達(dá)到世界級推理性能：
V3.2：推理能力與文本長度兼顧，擁有GPT-5級別性能，適合日常驅(qū)動；
V3.2-Speciale：極致推理能力，取得了4項金牌級成績；目前僅提供API版本（不支持工具調(diào)用），以支持社區(qū)評估與研究。
在主流推理基準(zhǔn)測試上，DeepSeek-V3.2-Speciale的性能表現(xiàn)媲美Gemini-3.0-Pro（見表1）。
更令人矚目的是，V3.2-Speciale 模型成功斬獲多項金牌：
IMO 2025（國際數(shù)學(xué)奧林匹克）
CMO 2025（中國數(shù)學(xué)奧林匹克）
ICPC World Finals 2025（國際大學(xué)生程序設(shè)計競賽全球總決賽）
IOI 2025（國際信息學(xué)奧林匹克）
其中，ICPC與IOI成績分別達(dá)到了人類選手第二名與第十名的水平。
而DeepSeek-V3.2是首個將思考直接整合到工具使用中的模型，同時支持在思考和非思考模式下使用工具。
目前，兩款模型均已開源：
· DeepSeek-V3.2
HuggingFace：https://huggingface.co/deepseek-ai/
DeepSeek-V3.2
ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
· DeepSeek-V3.2-Speciale
HuggingFace：https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
從「引擎驗證」到「全能車手」
DeepSeek V3.2的進(jìn)化論
如果說兩個月前發(fā)布的DeepSeek-V3.2-Exp是一臺在賽道上呼嘯而過的「概念車」，用來向世界證明「稀疏注意力」引擎的動力潛力；
那么今天正式轉(zhuǎn)正的DeepSeek V3.2，則是一輛完成了內(nèi)飾精修、裝配了頂級導(dǎo)航系統(tǒng)、可以隨時上路解決復(fù)雜問題的「量產(chǎn)超跑」。
這就是DeepSeek V3.2相比于Exp版（實驗版）最大的進(jìn)化邏輯：核心引擎不變，但駕駛技巧（Agent能力）發(fā)生了質(zhì)變。

V3.2正式版 vs. Exp
學(xué)會了「邊干邊想」
在架構(gòu)層面，V3.2沿用了Exp版本驗證成功的DSA架構(gòu)，但在「軟實力」上，DeepSeek解決了一個困擾AI界的頑疾——思考與行動的斷裂
在V3.2-Exp時期（以及其他大多數(shù)推理模型），模型像是一個記性不好的老學(xué)究：它會先花很長時間思考，決定調(diào)用一個工具（比如搜索天氣）。
但當(dāng)工具把「今天是雨天」的結(jié)果扔回來時，它往往會「斷片兒」，忘了剛才思考到哪一步了，不得不重新規(guī)劃。
V3.2正式版引入了「思維上下文管理」。

這就像給模型裝了一個「工作記憶暫存區(qū)」。
現(xiàn)在的V3.2像一位經(jīng)驗豐富的外科醫(yī)生，在伸手要手術(shù)刀（調(diào)用工具）的間隙，腦子里的手術(shù)方案依然清晰連貫，拿到刀后能無縫銜接下一步操作。
為了練就這項絕活，DeepSeek甚至為V3.2搭建了一個「虛擬演練場」。
他們合成了1800多個虛擬的操作系統(tǒng)、代碼庫和瀏覽器環(huán)境，生成了8.5萬條極其刁鉆的指令，逼著V3.2在虛擬世界里反復(fù)練習(xí)「修Bug」、「查資料」、「做報表」。
正是這種高強度的特訓(xùn)，讓V3.2正式版從一個只會做題的「做題家」，進(jìn)化成了能熟練使用工具解決現(xiàn)實難題的「實干家」。
最大技術(shù)亮點
給注意力裝上「閃電索引器」
V3.2能夠同時兼顧「聰明」和「便宜」，其最大的功臣依然是那個名為稀疏注意力（DSA）的底層黑科技。

DeepSeek-V3.2的注意力架構(gòu)
要理解它的牛逼之處，我們得先看看傳統(tǒng)模型有多「笨」。
傳統(tǒng)模型在處理長文檔時，就像一個強迫癥晚期的圖書管理員：
為了回答你一個簡單的問題，它強迫自己必須把圖書館里每一本書的每一頁、每一行字都讀一遍，并計算它們之間的關(guān)聯(lián)。
這導(dǎo)致計算量隨著書的厚度呈指數(shù)級爆炸（O(L^2)）。
DSA則給這位管理員配備了一套「閃電索引器」。
當(dāng)問題來臨時，DSA先用極低的成本掃描一遍「索引」，瞬間判斷出哪幾頁書可能包含答案，把無關(guān)的99%的廢話直接扔掉。
然后，它只對這篩選出的1%的關(guān)鍵內(nèi)容進(jìn)行精細(xì)的深度閱讀。
這種「查目錄」而非「死磕全書」的策略，將計算復(fù)雜度從可怕的指數(shù)級直接拉低到了近乎線性（O(L)）。
帶來的顯著提升
打破「不可能三角」
DSA技術(shù)的成功落地，直接擊穿了AI領(lǐng)域的「速度、成本、智能」不可能三角。

其一，成本腰斬，長文無憂。
對于用戶來說，丟給模型一本幾十萬字的小說或代碼庫，不再是「燒錢」的奢侈行為，處理速度也從「泡杯咖啡」變成了「眨眼之間」。
其二，算力盈余帶來的「智力涌現(xiàn)」，這是最精彩的一點。
正因為DSA節(jié)省了大量算力，DeepSeek才有底氣推出那個恐怖的Speciale版本。
既然讀得快，那就讓它想得久一點！
Speciale版本利用節(jié)省下來的資源，進(jìn)行更深度的「長思考」和邏輯推演。
結(jié)果是震撼的：DeepSeek-V3.2-Speciale在數(shù)學(xué)（IMO金牌）、編程（IOI金牌）等硬核指標(biāo)上，不僅超越了GPT-5 High，更是與谷歌最強的Gemini 3.0 Pro戰(zhàn)成平手。

從驗證DSA引擎潛力的V3.2-Exp，到將Agent能力、思維上下文管理、虛擬演練場訓(xùn)練全部裝車的V3.2正式版，DeepSeek展示的是另一條通往強智能的路線：在算力緊箍咒下，用更聰明的架構(gòu)、更精細(xì)的訓(xùn)練和更開放的生態(tài)，撬動推理極限。
DeepSeek-V3.2的橫空出世，正是DeepSeek開源AI的魅力時刻：拒絕無腦燒錢Scaling，靠更聰明的算法，在算力的縫隙中開辟出通往頂峰的捷徑。
參考資料：
秒追ASI
?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點亮星標(biāo)，鎖定新智元極速推送！

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

宇樹機器人在王力宏演唱會秀高難度空翻，馬斯克點贊

全站最新

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

熱門推薦

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

效能提升10倍！摩爾線程新一代全功能GPU架構(gòu)“花港”正式發(fā)布

文匯時評｜“AI泔水”成年度熱詞，帶來什么警示

ChatGPT-5.2生成字母掛圖錯誤頻出“人類專家水平”遭質(zhì)疑

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

利好來了！摩爾線程，重磅發(fā)布！

“星鏈”一衛(wèi)星在太空發(fā)生異常

宇樹機器人在王力宏演唱會秀高難度空翻，馬斯克點贊

智能機器人錦標(biāo)賽深圳揭榜羅湖50億基金護(hù)航顛覆性創(chuàng)新

宇樹機器人為王力宏伴舞，馬斯克贊嘆

AI人才爭奪戰(zhàn)白熱化，谷歌另辟蹊徑“返聘”老員工

氣象人工智能模型“風(fēng)源”雄安首發(fā)