基于OpenRouter平臺超100萬億Token的實證研究顯示,大型語言模型市場正經歷深刻重構。開源模型份額已攀升至33%,徹底打破閉源模型壟斷,市場格局從DeepSeek的"一家獨大"轉向多元競爭,而中國開源AI在這場變革中強勢崛起,正式躋身全球第一梯隊。
12月4日,硅谷著名風投公司a16z、大模型API平臺OpenRouter在共同撰寫的報告中稱,這一變革的核心驅動力來自中國模型的爆發式增長。數據顯示,中國開發的開源模型市場份額從2024年底的1.2%飆升至2025年中近30%的峰值,年平均占比達13.0%,與世界其他地區開源模型13.7%的份額幾乎持平。Qwen、DeepSeek、MoonshotAI等中國模型憑借技術能力與本土化適配優勢,實現了從邊緣參與者到核心玩家的跨越。
![]()
報告指出,開源生態內部競爭格局同步劇變。2025年中的"夏季拐點"后,市場從DeepSeek家族占據超50%份額的高度集中,快速走向碎片化競爭。到2025年底,已無任何單一模型能持續占據超25%的市場份額,用戶選型邏輯從鎖定"最佳模型"轉變為在5-7個頂尖模型間靈活組合。
![]()
此外,研究報告揭示了多個顛覆性趨勢:中型模型(15B-70B)正在替代小模型成為主流,智能體推理能力超越文本生成成為核心價值,編程應用占比從11%飆升至超50%,亞洲市場支出份額從13%翻倍至31%。競爭規則已從排行榜跑分轉向真實世界的使用留存和工作負載匹配能力。
中國力量重塑開源格局
報告稱,開源模型市場已形成"閉源定義性能上限,開源提供多元價值"的雙軌結構。截至2025年底,開源模型的市場份額穩步攀升至33%,這一增長并非短期熱潮,而是由DeepSeek V3、Kimi K2等高質量模型持續迭代驅動。
中國開源模型的崛起速度超出預期。2024年底,中國模型市場份額僅為1.2%,而到2025年中,其峰值已達近30%。Qwen、DeepSeek、MoonshotAI等中國模型在技術能力與本土化適配上展現出獨特優勢,標志著中國AI正式殺入開源賽道全球第一梯隊。
![]()
從全球區域分布看,亞洲市場的整體崛起最為顯著,全球支出份額從研究初期的13%翻倍至31%,成為關鍵增長引擎。北美雖仍是最大單一區域,但其支出份額已長期低于50%。
![]()
語言分布數據顯示,簡體中文以4.95%的占比成為僅次于英語的第二大語言,反映出中國市場的強勁需求。
![]()
從壟斷到多強共治
據報告,2024年底的開源市場呈現高度集中格局,DeepSeek家族的V3和R1模型合計占據超50%的Token使用量,幾乎形成"一家獨大"局面。但這一格局在2025年中的"夏季拐點"后被徹底顛覆。
隨著Qwen、Minimax、Kimi K2、GPT-OSS系列等新晉模型的密集發布,開源市場競爭壁壘被打破。這些新模型在發布后數周內便實現大規模生產級應用。到2025年底,已無任何單一模型能持續占據超25%的開源市場份額。
用戶行為模式發生根本性轉變。開發者從默認鎖定"最佳模型",轉變為在5-7個頂尖模型中進行多樣化組合。這一變化標志著開源生態正式進入"群雄割據"的充分競爭階段,多模型生態成為行業常態。
"中型即新小型"顛覆尺寸認知
超百萬億Token的實證數據徹底推翻了"開源生態由小型輕量模型主導"的傳統認知。數據顯示,開發者正用實際行動重塑模型尺寸格局。
小型模型(<15B)盡管數量持續增加,但總使用份額不斷萎縮,且市場高度碎片化,難以形成穩定的使用粘性。
相比之下,中型模型(15B-70B)實現了從無到有的爆發式增長,以Qwen2.5 Coder 32B為代表的中型模型迅速構建起競爭激烈的生態。
這類模型精準匹配了用戶對"能力與效率平衡點"的需求,成為開源市場的核心增長極,印證了"中型即新小型"的行業新共識。
大型模型(>70B)領域同樣呈現多元化競爭態勢,Qwen3 235B、Z.AI GLM 4.5等模型成為基準測試核心標的,用戶傾向于在多個頂尖大模型間靈活切換。![]()
應用場景的中國特色
從開源模型的整體任務分布看,角色扮演以超50%的Token占比成為第一大應用,得益于開源模型內容限制較少的天然優勢。編程輔助以15%-20%的占比位居第二,且份額持續增長。
![]()
但中國開源模型展現出顯著差異化特征。與全球市場"角色扮演主導"不同,中國開源模型的編程加技術類應用合計占比達39%,超過了33%的角色扮演占比。
這一差異表明,中國開源模型已在代碼生成、技術推理等生產力領域具備與世界一流模型直接競爭的能力。其價值落點更偏向專業效率提升而非娛樂互動,這種定位可能為中國模型在企業級市場開辟獨特競爭優勢。
智能體推理引領范式轉移
研究揭示的最具顛覆性發現是LLM使用方式的根本性范式轉移——從單輪文本補全全面轉向多步驟、工具集成的智能體推理工作流。
專為推理優化的模型處理的通證量從2025年初幾乎可忽略不計飆升至占總使用量的50%以上。這一變化由供需雙向驅動:
供給側,GPT-5、Claude 4.5等模型的發布大幅提升了推理能力上限;需求側,用戶愈發青睞能管理任務狀態、遵循多步邏輯、支持智能體式工作流的模型。
伴隨智能體推理崛起的還有兩大關鍵特征:
提示長度劇增,平均每個請求的輸入通證數從1.5K增長近4倍至6K以上,其中編程任務提示長度超20K,是其他類別的3-4倍;
工具調用日益普及,Claude 4.5 Sonnet、Grok Code Fast等模型領先布局,標志著LLM從"文本生成器"向"行動執行器"的本質轉變。
"水晶鞋效應"定義新護城河
研究發現了一批具備超高長期留存的"奠基用戶群",并提出"灰姑娘的水晶鞋效應"框架解釋這一現象,定義了AI時代的核心護城河。
該框架核心邏輯是:市場中始終存在未被滿足的高價值"工作負載";每一代新模型發布都是一次"試穿水晶鞋"的匹配過程;當模型首次完美解決特定工作負載的技術與經濟約束時,用戶會圍繞該模型構建流程與數據管道,形成極高轉換成本與粘性。
數據印證了這一邏輯:Claude 4 Sonnet、Gemini 2.5Pro的早期奠基用戶群5個月后留存率仍達40%,而Llama 4 Maverick等未實現匹配的模型所有用戶群留存表現均極差。此外,DeepSeek模型還呈現獨特的"回旋鏢效應",部分流失用戶在嘗試其他模型后會再度回歸。
這一發現揭示,真正的競爭壁壘來自"工作負載-模型"的率先匹配以及由此形成的高粘性奠基用戶群,留存遠比增長關鍵。行業焦點正從排行榜的微小優勢轉向真實世界使用的實證分析與運營優化,從單一模型競爭轉向多模型靈活策略,開源與閉源、東方與西方將長期共存競爭。





京公網安備 11011402013531號