![]()
本報記者石飛月 北京報道
不久前“DeepSeek將于8月中下旬推出R2”的傳聞,被證實了一半。8月21日,DeepSeek近3個月沒有更新的公眾號終于有了新內(nèi)容,但迎來的并不是大家期待的R2,而是V3.1。盡管據(jù)媒體報道V3.1一發(fā)布就在HuggingFace趨勢榜上排名第三,但不少用戶似乎并不喜歡新版本,在DeepSeek的評論區(qū)呼吁恢復(fù)此前的R1版本。
自從今年一月份發(fā)布R1模型,DeepSeek便進(jìn)入了大眾視線,R2也成了與GPT-5一樣備受期待的模型,但7個月過去了,R2遲遲沒有登場。這段時間里,“難產(chǎn)”的GPT-5終于上線,其它國產(chǎn)大模型上新了好幾波,DeepSeek的熱度漸漸降低。V3.1能否挽回DeepSeek的熱度和訪問量目前還未可知,不過大模型廠商之間的比拼是越來越激烈了。
不太符合期待的更新
自今年1月R1模型正式發(fā)布,業(yè)內(nèi)對R2的期待便開始了,但兩次大規(guī)模傳聞最后都被證實為半真半假,“真”的是DeepSeek在這兩個時間點確實推出了新版本,“假”的是推出的新版本都不是R2。上次傳得有鼻子有眼的時間是5月,但當(dāng)時DeepSeek只是對R1模型完成了一次小版本升級;上周又有消息稱8月中下旬R2會來,但最后上線的卻是V3.1。
讓很多用戶失望的是,DeepSeek不僅沒發(fā)布R2,還把R1“收回”了。本報記者在DeepSeek網(wǎng)頁端和手機(jī)端嘗試轉(zhuǎn)換模型,發(fā)現(xiàn)已經(jīng)沒有原來那個轉(zhuǎn)換的標(biāo)識,且當(dāng)記者向DeepSeek詢問“你是哪個模型”的時候,它的回答是“DeepSeek-V3”。DeepSeek官方對此的解釋是:“當(dāng)前官方網(wǎng)頁端、App、小程序及API開放平臺所調(diào)用模型均已同步更新,新模型自我認(rèn)知為DeepSeek-V3。”
V3.1主要帶來三個重要的變化,首先就是混合推理架構(gòu),一個模型同時支持思考模式和非思考模式,有更高的思考效率,也就是實現(xiàn)了R1和V3的合體。
事實上,混合推理架構(gòu)已成為大模型領(lǐng)域的一大趨勢,除DeepSeek外,此前發(fā)布的阿里通義千問Qwen3、GPT-5也都把推理模型與非推理模型進(jìn)行了融合。但按照DeepSeek這次的更新邏輯,有人推測該公司或許不會繼續(xù)推出R系列模型,《華夏時報》記者就此采訪了DeepSeek方面,截至發(fā)稿未收到回復(fù)。
艾媒咨詢創(chuàng)始人兼CEO張毅對《華夏時報》記者表示,混合推理架構(gòu)能夠在用戶快速獲取信息和深入分析復(fù)雜問題之間達(dá)到一些平衡,對很多用戶來說可以在提升工作效率方面獲得更好的體驗,而且混合推理架構(gòu)通過一些思維鏈的訓(xùn)練,對于降低token的消耗量、減少成本應(yīng)該也有一定作用。
當(dāng)然,張毅指出這種模式可能也會出現(xiàn)一些問題,如性能不穩(wěn)定、用戶需求不平衡等,但無論如何,它最起碼可以解決用戶遇到的一些實際問題,并考慮了算力成本,而且這個版本不會是最后的版本,未來還會不斷迭代,這也是所有大模型產(chǎn)品必然的發(fā)展方向。
除了混合推理架構(gòu),相比5月更新的版本,V3.1能在更短時間內(nèi)給出答案,且V3.1具備更強(qiáng)的Agent能力;且DeepSeek API同步升級后,上下文均已擴(kuò)展為128K。
DeepSeek還宣布了新的價格調(diào)整方案:9月6日起,其開放平臺API接口調(diào)用價格更新為輸入價格0.5元/百萬tokens(緩存命中)、4元/百萬tokens(緩存未命中),輸出價格為12元/百萬tokens。這個定價算V3和R1標(biāo)準(zhǔn)價格的中和版,此前V3的輸入價格為0.5元/百萬tokens(緩存命中)、2元/百萬tokens(緩存未命中),輸出價格為8元/百萬tokens,R1的輸入價格為1元/百萬tokens(緩存命中)、4元/百萬tokens(緩存未命中),輸出價格為16元/百萬tokens。
但DeepSeek取消了夜間時段優(yōu)惠。今年2月,DeepSeek曾推出錯峰優(yōu)惠活動,每日00:30至08:30的夜間空閑時段,API調(diào)用價格大幅下調(diào),V3降至原價的50%,R1低至原來的25%。
不過,有些用戶在體驗過后還是更偏向于此前的R1,不少人在DeepSeek評論區(qū)呼吁恢復(fù)舊版本,還有用戶催促DeepSeek趕緊上線多模態(tài)模型。
陷入大模型包圍圈
與DeepSeek這不緊不慢的更新速度形成對比的,是其它國產(chǎn)大模型頻繁的更新。
就在DeepSeek更新前一天,智譜也宣布了重磅消息。8月20日,智譜推出全球首個手機(jī)Agent,開創(chuàng)了Agent+云手機(jī)/云電腦的新技術(shù)范式,不搶占用戶手機(jī)和電腦,還突破了硬件限制,在任何設(shè)備、任何場景下運(yùn)行,幫助用戶代理操作,并由國產(chǎn)模型(GLM-4.5、GLM-4.5V)驅(qū)動,具備推理、代碼與多模態(tài)的全能能力。
在上半年獲得多筆融資后,智譜下半年的模型發(fā)布更頻繁了:7月先是發(fā)布了一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型GLM-4.1V-Thinking,之后又帶來面向推理、代碼與智能體的開源SOTA模型——GLM-4.5;8月,智譜的開源視覺推理模型GLM-4.5V正式上線并開源。
除了智譜,其它幾家大模型公司也都在加快腳步。7月11日,月之暗面正式發(fā)布KimiK2模型并同步開源,Kimi K2是一款具備更強(qiáng)代碼能力、更擅長通用Agent任務(wù)的MoE架構(gòu)基礎(chǔ)模型;7月25日,階躍星辰推出最新的多模態(tài)推理模型Step-3;同樣在7月25日,阿里發(fā)布了全新的通義千問3推理模型;8月11日,百川智能正式發(fā)布并開源醫(yī)療增強(qiáng)大模型Baichuan-M2。
這些國產(chǎn)模型,對DeepSeek形成了一個包圍圈,更別說國外那些先進(jìn)模型了。本月,除了OpenAI正式推出新的旗艦AI模型GPT-5,Anthropic還發(fā)布了Claude Opus 4.1,稱這一模型是Opus 4在代理任務(wù)、現(xiàn)實世界編碼和推理方面的升級版。谷歌則發(fā)布新一代世界模型Genie 3,這是谷歌第一個允許進(jìn)行實時交互的世界模型。就連DeepSeek的開源策略,優(yōu)勢也不再明顯,特斯拉CEO埃隆·馬斯克本月宣布,其創(chuàng)辦的xAI公司將開源Grok 2模型,進(jìn)一步推進(jìn)人工智能模型的開源策略。
在周遭競爭對手的襯托下,DeepSeek顯得一點都不“卷”,對此不同業(yè)內(nèi)人士有不同的看法。
“梁文鋒(DeepSeek創(chuàng)始人)一開始就不是按照純商業(yè)的路徑去發(fā)展,他在模型上是有所追求的。”順福資本創(chuàng)始人李明順說,至于大模型的水平誰更領(lǐng)先,現(xiàn)在其實都是一種螺旋式上升的狀態(tài),你追我趕,你方唱罷我登場,沒有誰能完全絕對領(lǐng)先。
但文淵智庫創(chuàng)始人王超不這么認(rèn)為,他指出,大模型之戰(zhàn)即將在今年下半年收尾,過去兩年多發(fā)生了翻天覆地的變化,很多企業(yè)進(jìn)入這個領(lǐng)域,也有很多企業(yè)被淘汰,DeepSeek身在這個圈中也難以獨善其身。
據(jù)AI產(chǎn)品榜,今年6月DeepSeek網(wǎng)站的訪問量仍排在國內(nèi)總榜第一位,但實際上已經(jīng)連續(xù)4個月呈下降趨勢,平均每月降低9.63%,6月訪問量為3.8億,DeepSeek應(yīng)用(App)月活用戶也在6月出現(xiàn)首次下滑,7月繼續(xù)下降11.87%,其月活用戶為8293萬,與此同時,字節(jié)豆包、騰訊元寶兩個大廠繼續(xù)增長,分別達(dá)到1.32億、4473萬的月活用戶。
責(zé)任編輯:于玉金 主編:寒豐





京公網(wǎng)安備 11011402013531號