9 月 19 日,國際數據公司(IDC)發布了一份名為《中國大模型公有云服務市場分析,2025H1》的調研報告,其中披露了當前中國 AI 產業發展速度的核心數據,值得關注。
報告顯示,2025 年上半年,中國公有云上大模型調用量(統計口徑為云廠商對外部客戶提供的服務,不含自有業務)達 536.7 萬億 Tokens,較 2024 年全年 114 萬億 Tokens 的規模增長近 400%。
市場格局方面,火山引擎以 49.2% 的份額位居第一,接近半壁江山,延續并擴大了 2024 年 46.4% 的領先優勢。阿里云百煉平臺則以 27.0% 的市場占比排名第二,第三是百度智能院千帆平臺,占比 17.0%。
![]()
IDC 在報告中同時指出,中國大模型公有云服務市場未來仍有數百倍增長空間,但當前面臨的核心瓶頸是如何打破泛互聯網行業局限,向更多傳統行業滲透;此外,市場已從側重模型訓練顯著向模型推理服務遷移,多模態大模型與 Agent 應用成為增長關鍵驅動力,并建議行業需從“量”向“質”突破,以應用生態塑造差異化,同時推動低碼與高碼開發模式融合。
兩大增長拐點揭示行業邏輯:為何 Token 成 AI 應用核心標尺?
仔細看 IDC 的報告,可以發現一些有意思的現象。比如在報告中關于“中國公有云大模型調用量月度環比增長”的統計曲線中,能夠清晰發現兩個改變行業增長格局的關鍵拐點,而這兩個節點背后,恰好是 Token 成為 AI 應用核心衡量指標的深層邏輯所在。
![]()
第一個拐點是 2024 年 7 月,這個月的中國大模型公有云服務 YoY 增長率超過 160%。而這個時間點,恰好是豆包大模型技術降本全面發酵之后。在這之前的 2024 年 5 月 15 日,豆包大模型通過模型架構、推理框架等技術創新,將主力模型定價直接從行業的“分計價”拉入“厘計價”時代,降幅高達 99.3% 。
![]()
第二個拐點出現在 2025 年 2 月,這個月的增長幅度達到 60% 的水平。而這個時間點,對應的是行業事件是 DeepSeek-R1 推理模型爆紅。
這一事件不僅加速了 MaaS 市場滲透率,更標志著中國 AI 云市場正式從“預訓練時代”邁向“推理時代”。IDC 報告明確指出,此時市場需求已完成從模型訓練向推理服務的遷移,企業對推理的關注重點從“準確性”擴展到“資源效率、運營成本與可持續發展”,而推理場景的核心衡量單位,正是 Token 消耗量。
透過這兩個拐點,我們也能一窺當前 AI 模型產業發展的底層邏輯和趨勢。
首先值得注意的是,IDC 此次選擇以“Tokens 調用量”作為核心統計指標,而非傳統的 IaaS(算力、存儲)或 PaaS(開發平臺)打包統計,本質就是抓住了 AI 應用落地的“真實標尺。
從統計邏輯看,IaaS 統計的是“算力供給”,而非“算力使用”—— 部分云廠商通過低價銷售 GPU 資源沖營收,但大量算力處于閑置狀態,無法反映 AI 應用的實際落地情況;而 Token 統計的是“模型實際調用”,每一個 Token 都對應一次文本生成、圖像分析或語音交互,是 AI 與業務場景結合的直接體現。以火山引擎為例,IDC 統計未包含其自有業務(如抖音、豆包 APP)的 Token 消耗,若納入統計,其份額將進一步擴大,這種“剔除水分”的統計方式,更能反映商業市場的真實需求。
從產業價值看,Token 消耗量是衡量 AI 產業景氣度的“晴雨表”。
原因有三。其一,Token 增長與應用落地強綁定。只有模型足夠好用、應用場景足夠豐富,企業才會持續調用 —— 火山引擎數據顯示,其服務的消費電子行業客戶引入視覺理解模型后,5 個月內 Token 消耗增長 12 倍,日均突破百億 Tokens,這正是應用落地的直接反饋。
其二,Token 模式更具可持續性。傳統“賣算力”是一次性交易,低價沖量無異于“飲鴆止渴”,客戶一旦發現算力閑置便會退租;而“賣 Token”是經常性收入,依賴客戶持續使用,倒逼廠商優化模型能力與服務體驗,形成“模型更好 → 應用更多 → Token 增長 → 模型迭代”的良性循環。
其三,Token 具備指數級增長潛力。國家數據局數據顯示,2024 年初中國日均 Token 消耗量為 1000 億,2025 年 6 月已突破 30 萬億,一年半增長 300 倍;某 ICT 硬件企業通過敏感性測試預測,若 Token 價格維持當前水平,火山引擎未來 1-2 年 Token 調用收入或增長至百億元 —— 這種增長速度遠超傳統 IaaS(年增速 50%-200%),成為 AI 云市場的核心增量。
火山引擎的 MaaS 突圍:戰略、技術與規模的三重優勢
在 MaaS 賽道的競速中,火山引擎并非最早入局者,卻能快速占據 49.2% 的市場份額,核心源于其在戰略、技術與規模上的三重差異化優勢。
火山引擎入局云計算市場較晚,若按傳統 IaaS 模式追趕難度極大。火山引擎總裁譚待曾透露,管理層早年曾要求團隊思考“2030 年的云與 2020 年有何不同”,最終答案是“AI”,而 MaaS 正是 AI 云的核心載體。
與其他云廠商側重 IaaS 營收不同,火山引擎從 2024 年起就將 MaaS 置于戰略高度,投入遠超當前營收規模的資源。這種戰略定力在 2024 年 5 月的降本中尤為明顯,每一次動作都精準踩中行業拐點。
在技術方面,火山引擎的技術優勢體現在“模型”與“平臺”兩大維度:在模型層面,豆包大模型家族迭代速度領先行業,目前已覆蓋文本、圖像、音頻、視頻等多模態領域。國際評測機構 Artificial Analysis 數據顯示,豆包?圖像創作模型 Seedream 4.0 的文生圖能力位居全球第一,圖像編輯能力全球第二;豆包?視頻生成模型 Seedance 1.0 pro 登頂相關盲測榜單;其實時語音模型更是在 C 端場景爆火,支持唱歌、辯論等多樣化交互,2025 年 5 月豆包大模型日均 Token 調用量達 16.4 萬億,較 2024 年 5 月的 1200 億增長 137 倍。
![]()
在平臺層面,火山引擎 MaaS 平臺“火山方舟”經過內部海量業務打磨,性能優勢顯著。AI 基礎設施創業公司 TensorChord 2025 年 3 月評測顯示,火山方舟上的 DeepSeek-R1 模型每秒 Token 輸出量是部分廠商的 2.6 倍,在首字延遲、并發處理、資源利用率等客戶可感知指標上均為行業領先 —— 這源于其底層技術優化,包括 PD 分離架構、KV-Cache 緩存加速、自研 vRDMA 網絡等,能“榨干每一張 GPU 的 Token 輸出潛力”。
最后是規模的支撐。火山引擎的規模優勢來自字節跳動“內外同源”的技術體系 —— 支撐火山引擎外部客戶的基礎設施團隊,與服務抖音、飛書、廣告等內部海量業務的團隊是同一團隊。這種架構意味著,火山引擎在服務外部客戶前,已在內部“實戰”中驗證了技術的穩定性與 scalability:例如,其需支撐抖音推薦系統的超大規模稀疏模型訓練,這種能力外化后,可輕松滿足外部企業的高并發 Token 調用需求。
目前,火山引擎已服務全球 9 家 Top10 手機廠商、8 成主流汽車品牌(如奔馳、寶馬、特斯拉)、70% 的系統重要性銀行(如招商銀行、浦發銀行)以及超五成 985 高校(如北京大學、浙江大學),這些跨行業客戶的持續調用,進一步鞏固了其 Token 規模優勢。
結語
IDC 的報告不僅是對過去市場格局的總結,更是對未來趨勢的預言。隨著多模態技術和 Agent 應用的成熟,單個任務消耗的 Token 量將呈幾何級數增長,AI 應用的想象空間將被徹底打開。
在這場變革中,誰能提供效果最好、成本最低、性能最強的模型服務,誰就能吸引最多的開發者,催生最繁榮的應用生態,從而在“Tokens 經濟”的浪潮中占據主導地位。
火山引擎憑借其在 MaaS 賽道上的戰略定力、技術積累和規模優勢,已經搶得先機。49.2% 的市場份額不僅是一個數字,更是市場對其戰略和執行力投出的信任票,預示著在即將到來的 AI 應用大爆發時代,它將扮演更加重要的角色。





京公網安備 11011402013531號