「AI新世代」R2沒等來先發(fā)V3.1！DeepSeek深陷大模型“包圍圈”熱度炙烤

IP屬地中國·北京 編輯：任飛揚(yáng) 華夏時報 時間：2025-08-22 16:24:05

本報記者石飛月北京報道
不久前“DeepSeek將于8月中下旬推出R2”的傳聞，被證實了一半。8月21日，DeepSeek近3個月沒有更新的公眾號終于有了新內(nèi)容，但迎來的并不是大家期待的R2，而是V3.1。盡管據(jù)媒體報道V3.1一發(fā)布就在HuggingFace趨勢榜上排名第三，但不少用戶似乎并不喜歡新版本，在DeepSeek的評論區(qū)呼吁恢復(fù)此前的R1版本。
自從今年一月份發(fā)布R1模型，DeepSeek便進(jìn)入了大眾視線，R2也成了與GPT-5一樣備受期待的模型，但7個月過去了，R2遲遲沒有登場。這段時間里，“難產(chǎn)”的GPT-5終于上線，其它國產(chǎn)大模型上新了好幾波，DeepSeek的熱度漸漸降低。V3.1能否挽回DeepSeek的熱度和訪問量目前還未可知，不過大模型廠商之間的比拼是越來越激烈了。
不太符合期待的更新
自今年1月R1模型正式發(fā)布，業(yè)內(nèi)對R2的期待便開始了，但兩次大規(guī)模傳聞最后都被證實為半真半假，“真”的是DeepSeek在這兩個時間點確實推出了新版本，“假”的是推出的新版本都不是R2。上次傳得有鼻子有眼的時間是5月，但當(dāng)時DeepSeek只是對R1模型完成了一次小版本升級；上周又有消息稱8月中下旬R2會來，但最后上線的卻是V3.1。
讓很多用戶失望的是，DeepSeek不僅沒發(fā)布R2，還把R1“收回”了。本報記者在DeepSeek網(wǎng)頁端和手機(jī)端嘗試轉(zhuǎn)換模型，發(fā)現(xiàn)已經(jīng)沒有原來那個轉(zhuǎn)換的標(biāo)識，且當(dāng)記者向DeepSeek詢問“你是哪個模型”的時候，它的回答是“DeepSeek-V3”。DeepSeek官方對此的解釋是：“當(dāng)前官方網(wǎng)頁端、App、小程序及API開放平臺所調(diào)用模型均已同步更新，新模型自我認(rèn)知為DeepSeek-V3。”
V3.1主要帶來三個重要的變化，首先就是混合推理架構(gòu)，一個模型同時支持思考模式和非思考模式，有更高的思考效率，也就是實現(xiàn)了R1和V3的合體。
事實上，混合推理架構(gòu)已成為大模型領(lǐng)域的一大趨勢，除DeepSeek外，此前發(fā)布的阿里通義千問Qwen3、GPT-5也都把推理模型與非推理模型進(jìn)行了融合。但按照DeepSeek這次的更新邏輯，有人推測該公司或許不會繼續(xù)推出R系列模型，《華夏時報》記者就此采訪了DeepSeek方面，截至發(fā)稿未收到回復(fù)。
艾媒咨詢創(chuàng)始人兼CEO張毅對《華夏時報》記者表示，混合推理架構(gòu)能夠在用戶快速獲取信息和深入分析復(fù)雜問題之間達(dá)到一些平衡，對很多用戶來說可以在提升工作效率方面獲得更好的體驗，而且混合推理架構(gòu)通過一些思維鏈的訓(xùn)練，對于降低token的消耗量、減少成本應(yīng)該也有一定作用。
當(dāng)然，張毅指出這種模式可能也會出現(xiàn)一些問題，如性能不穩(wěn)定、用戶需求不平衡等，但無論如何，它最起碼可以解決用戶遇到的一些實際問題，并考慮了算力成本，而且這個版本不會是最后的版本，未來還會不斷迭代，這也是所有大模型產(chǎn)品必然的發(fā)展方向。
除了混合推理架構(gòu)，相比5月更新的版本，V3.1能在更短時間內(nèi)給出答案，且V3.1具備更強(qiáng)的Agent能力；且DeepSeek API同步升級后，上下文均已擴(kuò)展為128K。
DeepSeek還宣布了新的價格調(diào)整方案：9月6日起，其開放平臺API接口調(diào)用價格更新為輸入價格0.5元/百萬tokens（緩存命中）、4元/百萬tokens（緩存未命中），輸出價格為12元/百萬tokens。這個定價算V3和R1標(biāo)準(zhǔn)價格的中和版，此前V3的輸入價格為0.5元/百萬tokens（緩存命中）、2元/百萬tokens（緩存未命中），輸出價格為8元/百萬tokens，R1的輸入價格為1元/百萬tokens（緩存命中）、4元/百萬tokens（緩存未命中），輸出價格為16元/百萬tokens。
但DeepSeek取消了夜間時段優(yōu)惠。今年2月，DeepSeek曾推出錯峰優(yōu)惠活動，每日00:30至08:30的夜間空閑時段，API調(diào)用價格大幅下調(diào)，V3降至原價的50%，R1低至原來的25%。
不過，有些用戶在體驗過后還是更偏向于此前的R1，不少人在DeepSeek評論區(qū)呼吁恢復(fù)舊版本，還有用戶催促DeepSeek趕緊上線多模態(tài)模型。
陷入大模型包圍圈
與DeepSeek這不緊不慢的更新速度形成對比的，是其它國產(chǎn)大模型頻繁的更新。
就在DeepSeek更新前一天，智譜也宣布了重磅消息。8月20日，智譜推出全球首個手機(jī)Agent，開創(chuàng)了Agent+云手機(jī)/云電腦的新技術(shù)范式，不搶占用戶手機(jī)和電腦，還突破了硬件限制，在任何設(shè)備、任何場景下運(yùn)行，幫助用戶代理操作，并由國產(chǎn)模型（GLM-4.5、GLM-4.5V）驅(qū)動，具備推理、代碼與多模態(tài)的全能能力。
在上半年獲得多筆融資后，智譜下半年的模型發(fā)布更頻繁了：7月先是發(fā)布了一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型GLM-4.1V-Thinking，之后又帶來面向推理、代碼與智能體的開源SOTA模型——GLM-4.5；8月，智譜的開源視覺推理模型GLM-4.5V正式上線并開源。
除了智譜，其它幾家大模型公司也都在加快腳步。7月11日，月之暗面正式發(fā)布KimiK2模型并同步開源，Kimi K2是一款具備更強(qiáng)代碼能力、更擅長通用Agent任務(wù)的MoE架構(gòu)基礎(chǔ)模型；7月25日，階躍星辰推出最新的多模態(tài)推理模型Step-3；同樣在7月25日，阿里發(fā)布了全新的通義千問3推理模型；8月11日，百川智能正式發(fā)布并開源醫(yī)療增強(qiáng)大模型Baichuan-M2。
這些國產(chǎn)模型，對DeepSeek形成了一個包圍圈，更別說國外那些先進(jìn)模型了。本月，除了OpenAI正式推出新的旗艦AI模型GPT-5，Anthropic還發(fā)布了Claude Opus 4.1，稱這一模型是Opus 4在代理任務(wù)、現(xiàn)實世界編碼和推理方面的升級版。谷歌則發(fā)布新一代世界模型Genie 3，這是谷歌第一個允許進(jìn)行實時交互的世界模型。就連DeepSeek的開源策略，優(yōu)勢也不再明顯，特斯拉CEO埃隆·馬斯克本月宣布，其創(chuàng)辦的xAI公司將開源Grok 2模型，進(jìn)一步推進(jìn)人工智能模型的開源策略。
在周遭競爭對手的襯托下，DeepSeek顯得一點都不“卷”，對此不同業(yè)內(nèi)人士有不同的看法。
“梁文鋒(DeepSeek創(chuàng)始人)一開始就不是按照純商業(yè)的路徑去發(fā)展，他在模型上是有所追求的。”順福資本創(chuàng)始人李明順說，至于大模型的水平誰更領(lǐng)先，現(xiàn)在其實都是一種螺旋式上升的狀態(tài)，你追我趕，你方唱罷我登場，沒有誰能完全絕對領(lǐng)先。
但文淵智庫創(chuàng)始人王超不這么認(rèn)為，他指出，大模型之戰(zhàn)即將在今年下半年收尾，過去兩年多發(fā)生了翻天覆地的變化，很多企業(yè)進(jìn)入這個領(lǐng)域，也有很多企業(yè)被淘汰，DeepSeek身在這個圈中也難以獨善其身。
據(jù)AI產(chǎn)品榜，今年6月DeepSeek網(wǎng)站的訪問量仍排在國內(nèi)總榜第一位，但實際上已經(jīng)連續(xù)4個月呈下降趨勢，平均每月降低9.63%，6月訪問量為3.8億，DeepSeek應(yīng)用(App)月活用戶也在6月出現(xiàn)首次下滑，7月繼續(xù)下降11.87%，其月活用戶為8293萬，與此同時，字節(jié)豆包、騰訊元寶兩個大廠繼續(xù)增長，分別達(dá)到1.32億、4473萬的月活用戶。
責(zé)任編輯：于玉金主編：寒豐

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

今日頭條2025創(chuàng)作者大會發(fā)布深度內(nèi)容扶持計劃：為好內(nèi)容，加好流量

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

全站最新

今日頭條2025創(chuàng)作者大會發(fā)布深度內(nèi)容扶持計劃：為好內(nèi)容，加好流量

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

熱門推薦

今日頭條2025創(chuàng)作者大會發(fā)布深度內(nèi)容扶持計劃：為好內(nèi)容，加好流量

上饒農(nóng)商行被罰240萬，上饒銀行被罰170萬

摩爾線程與圖靈量子達(dá)成合作，推動量子經(jīng)典混合技術(shù)應(yīng)用

上海科普教育創(chuàng)新獎揭曉，首設(shè)“前沿科技成果科普獎”

《黃仁勛傳》作者威特：谷歌是對英偉達(dá)“AI霸權(quán)”的最大威脅

效能提升10倍！摩爾線程新一代全功能GPU架構(gòu)“花港”正式發(fā)布

文匯時評｜“AI泔水”成年度熱詞，帶來什么警示

ChatGPT-5.2生成字母掛圖錯誤頻出“人類專家水平”遭質(zhì)疑

谷歌CEO「劈柴」親自下場分芯片！930億美元填不飽「算力饑荒」

復(fù)雜空間推理新SOTA，性能提升55%！中山大學(xué)新作SpatialDreamer

央視曝光AI培訓(xùn)“月入過萬”騙局，專坑老年人

利好來了！摩爾線程，重磅發(fā)布！

“星鏈”一衛(wèi)星在太空發(fā)生異常

宇樹機(jī)器人在王力宏演唱會秀高難度空翻，馬斯克點贊

智能機(jī)器人錦標(biāo)賽深圳揭榜羅湖50億基金護(hù)航顛覆性創(chuàng)新