綜合報(bào)道
8min read
火山引擎的「火」,是怎么點(diǎn)起來的
張鵬2025/12/18
![]()
摘要
火山引擎目前就是 AI 時(shí)代字節(jié)跳動(dòng)的「技術(shù)羊毛」,可薅。
作者|張鵬
編輯| 鄭玄
半年前,我寫過一篇火山引擎的戰(zhàn)略方向分析,當(dāng)時(shí)我判斷,火山引擎已經(jīng)被明確為字節(jié)的一個(gè)戰(zhàn)略目標(biāo):因?yàn)樽止?jié)在 AI 時(shí)代需要有最好的底層技術(shù)和基礎(chǔ)設(shè)施,那么這件事必須不能只是自造自用,而是要通過「外循環(huán)」來驗(yàn)證和放大,所以火山引擎要做好,也必須是 「AI 云原生」。
其實(shí)過去兩年,所有云業(yè)務(wù)的企業(yè),都已經(jīng)意識(shí)到云的未來,不再是舊賽道里賣服務(wù)器、賣帶寬的存量博弈,而是 AI 能力帶來的全新需求。在這個(gè)新時(shí)代,云廠商賣的不再是底層的「資源」,而是經(jīng)過封裝的「能力」。
有趣的是,MaaS(模型即服務(wù))過去 2 年被提出,但是經(jīng)歷了早期「嘗鮮」后,也一度被業(yè)界懷疑過,當(dāng)時(shí)主要的原因是模型如果本身不行,不能真正解決企業(yè)問題,這個(gè)模式就不能真正成立。
不過這半年火山引擎死磕 MaaS 的一些更具體的業(yè)務(wù)發(fā)展,我覺得 MaaS 這件事已經(jīng)可以不用討論了,它絕對就是未來的云服務(wù)的核心業(yè)務(wù)。
為什么說火山是在「死磕」MaaS 呢?先說個(gè)最近在媒體上看到了一個(gè)火山的「八卦」,大概意思是說火山引擎內(nèi)部,CDN 這種傳統(tǒng)業(yè)務(wù)的銷售權(quán)重被降到了很低;而 AI 的 Token 調(diào)用量,直接成了核心指標(biāo)。甚至有的銷售 CDN 等其他傳統(tǒng)云業(yè)務(wù)做得挺好,但因?yàn)?MaaS 賣不出去就最終淘汰出局。
這個(gè)「八卦」如果換個(gè)視角看,反而說明火山引擎對 AI 云原生和 MaaS 的重視相當(dāng)貫穿到執(zhí)行層,確實(shí)在用 組織架構(gòu)的調(diào)整、用考核機(jī)制的引導(dǎo)來推動(dòng)戰(zhàn)略 。
壓強(qiáng)夠了,事情就會(huì)有突破。從我在業(yè)界了解的消息看,更重要的是火山引擎 2025 年相當(dāng)突飛猛進(jìn),業(yè)績上非常火。而這個(gè)火也確實(shí)來自于 MaaS 驚人的高速增長。結(jié)合 12 月 18 號(hào)的 Force 大會(huì)上我看到的一些信息,感覺又值得分析下這個(gè) AI 云原生領(lǐng)域的大玩家「火從何來」了。
01
MaaS 的核心是
「與商業(yè)世界的需求對齊」
想要讓銷售勸客戶把預(yù)算從傳統(tǒng) IT 轉(zhuǎn)給 AI,前提是手里的模型和工具得真能解決業(yè)務(wù)問題,而不是讓客戶當(dāng)「小白鼠」。這次 Force 大會(huì),給我的最大感受是: 火山引擎展示的不僅是模型,也相對更全面的展示了為了讓 AI 能真正落地,他們過去所積累的「家底」。
![]()
企業(yè) AI 下一階段是讓 Agent 真正創(chuàng)造業(yè)務(wù)價(jià)值丨來自:2025 原動(dòng)力大會(huì)·冬
未來的大模型,理解和執(zhí)行是統(tǒng)一的。我們現(xiàn)在看到的 AI 大多還在「理解」階段——用戶向 AI 提出需求,它可以幫忙寫寫文案、聊聊天。但現(xiàn)實(shí)世界的需求其實(shí)已經(jīng)要求模型必須能直接操控軟件、調(diào)用 API、完成復(fù)雜的企業(yè)級(jí) RPA 任務(wù)。
不知道大家是否注意到了,豆包 1.8 有一個(gè)明顯的進(jìn)化方向,就是 Agentic 代理能力。豆包在這個(gè)版本里重點(diǎn)增強(qiáng)了 Tool Use(工具調(diào)用)和 OS Agent(屏幕操控)等能力。這和 Gemini 3.0 Pro 等全球頂尖模型的進(jìn)化路徑是完全一致的: 讓模型這個(gè)大腦不僅「能理解」,還要長出「能干活的手」。
舉例來看,豆包 1.8 現(xiàn)在支持 OS Agent,意味著它可以像人一樣「看懂」電腦屏幕,去點(diǎn)擊按鈕、填寫表單。天下絕大部分的公司都不是「AI Native」的,所以這次升級(jí)對于企業(yè)內(nèi)部大量陳舊的、沒有 API 接口的 ERP 系統(tǒng)來說,這就是讓 AI 接管繁瑣工作的關(guān)鍵鑰匙。
以前大家關(guān)注模型的能力聚焦在追求智能上限,我相信這一點(diǎn)是字節(jié)內(nèi)部的基礎(chǔ)模型團(tuán)隊(duì)一直在做的。而火山引擎是字節(jié)跳動(dòng)「內(nèi)循環(huán)」+「外循環(huán)」的好處,就是一方面可以依托字節(jié)基礎(chǔ)模型團(tuán)隊(duì),既支持與字節(jié)的業(yè)務(wù)發(fā)展,同時(shí)也連接著更大真實(shí)世界的需求。
有了需求目標(biāo),從基模能力到可用的模型技術(shù)的發(fā)展,才變得更有方向感,比如「理解和執(zhí)行一體化」的能力,就是可以對現(xiàn)在非「AI Native 企業(yè)」AI 進(jìn)化關(guān)鍵的落地點(diǎn),而前段時(shí)間火爆的豆包手機(jī)助手,其實(shí)就是這個(gè)能力的「內(nèi)循環(huán)」,而火山引擎現(xiàn)在把這種能力同步開啟「外循環(huán)」,會(huì)讓技術(shù)創(chuàng)新變得更有意義。
MaaS 過去一段時(shí)間能賣的那么火,以及未來可以繼續(xù)看漲,本質(zhì)上還是因?yàn)檫@個(gè) 「雙循環(huán)」帶來的目標(biāo)與能力和真實(shí)商業(yè)世界的對齊。
另外,從這次火山引擎正式發(fā)布了 Agent 開發(fā)套件「Agentkit」來看,其具備 8 個(gè)核心模塊依舊是在「與現(xiàn)實(shí)商業(yè)世界對齊」。這次火山提供了 Agent 在開發(fā)、部署、運(yùn)維、調(diào)優(yōu)等各個(gè)階段所需要的工具和基礎(chǔ)設(shè)施。其中讓我印象很深刻的有兩個(gè)模塊: Identity(身份與權(quán)限)和 evalution(評估)。
Agent 落地到企業(yè)里,一個(gè)很細(xì)節(jié)但是關(guān)鍵的問題就是怎么給 Agent 設(shè)定清楚它的身份——比如一個(gè)客服 Agent 能接觸到哪些數(shù)據(jù),可以回答什么樣的問題;比如一個(gè)實(shí)習(xí)生的 Copilot,和高級(jí)副總裁的個(gè)人助理,怎么避免二者的信息權(quán)限混淆。規(guī)避實(shí)習(xí)生可以通過 AI 輕松拿到公司敏感信息這種情況出現(xiàn)。這些都是看似細(xì)節(jié)基礎(chǔ),但實(shí)際上做起來復(fù)雜,而一旦出現(xiàn)問題卻有可能給企業(yè)造成重大損失的實(shí)干問題。
還有就是 evalution(評測)的能力。做過 Agent 開發(fā)的人都知道,最大的痛點(diǎn)不是怎么搭建環(huán)境訓(xùn)出一個(gè) Agent,而是不知道怎么評估一個(gè) Agent 在業(yè)務(wù)場景里的能力,畢竟不能把一個(gè)剛訓(xùn)出來還不知深淺的 Agent,隨便就丟進(jìn)生產(chǎn)環(huán)境里測試。
而 Agentkit 的 evalution(評測),其實(shí)就是一系列評測 Agent 在真實(shí)場景中工作能力的測試集。這個(gè)一直是個(gè)沒有被很好解決的問題,如果對標(biāo)一下其他國際云大廠,其 Agent 開發(fā)工具內(nèi)置的評測集好像也只有十幾套。而火山這次一口氣發(fā)布了超過 50 套評估測試集。
場景積累的意義在這里就體現(xiàn)了。顯然字節(jié)跳動(dòng)內(nèi)部本身就有幾萬個(gè) Agent,每天進(jìn)行幾十萬次的評測,所以火山是個(gè)巨大的基礎(chǔ)資產(chǎn)。從抖音電商的客服機(jī)器人,到 TRAE 的 Coding 助手,這些業(yè)務(wù)的需求倒逼火山團(tuán)隊(duì)必須建立有效的 Agent 評測能力。這些為了支撐內(nèi)部龐大業(yè)務(wù)而磨練出的「基建能力」,現(xiàn)在成了火山 MaaS 服務(wù)的底座。
02
多模態(tài)一定是云廠商競爭的「新賽點(diǎn)」
除了基模和基建的扎實(shí)推進(jìn),在這次 Force 大會(huì)上,我們還看到了一個(gè)信號(hào): 多模態(tài)(視頻、語音、圖像)的理解和生成能力,正在成為 MaaS 增長的新賽點(diǎn) 。
據(jù)我了解,火山內(nèi)部也已經(jīng)形成了一個(gè)認(rèn)知 :每增加一種多模態(tài)模型能力,MaaS 的銷售就能帶來顯著的百分比增長。
這不難理解,今天商業(yè)世界的大量場景是視覺的。視頻帶貨、在線教育、娛樂社交,這些才是用戶和需求最集中的場域,而要讓 AI 和 Agent 在這些場域發(fā)揮作用,不論是與用戶對話交互、生成內(nèi)容,還是理解這些場景里的內(nèi)容,解決用戶或者創(chuàng)作者的問題,都離不開多模態(tài)模型的能力。
而多模態(tài)能力恰恰也是字節(jié)跳動(dòng)的「主場」。豆包是最早具備圖像識(shí)別能力的大模型之一,還記得 2025 年高考時(shí),豆包在看圖解題上的表現(xiàn)就讓人印象深刻。而在今年 IF 大會(huì)上做出精彩分享的張楠,其領(lǐng)導(dǎo)的即夢在今年國內(nèi)「產(chǎn)業(yè)級(jí) AI 視頻生成」落地競賽里處于領(lǐng)先地位,這背后其實(shí)都是同源的技術(shù)棧。
而這次發(fā)布的 Seedance 1.5 Pro,解決的核心問題不是「生成」,而是「可用性」。它重點(diǎn)突破了音畫高精同步和多語種對白,尤其擅長中文方言和對口型等。做過影視創(chuàng)作或短視頻的人都知道,這才是從「玩具」變成「生產(chǎn)力」的關(guān)鍵。這意味著,未來的短劇、廣告片,甚至是一部分的電影鏡頭,真的可以用 AI 直接生成了。
![]()
豆包 Seedance 1.5 Pro 丨來自:2025 原動(dòng)力大會(huì)·冬
同時(shí),豆包 1.8 的視覺理解能力也大幅提升,支持 90 分鐘長視頻的低幀率快速理解,并且支持調(diào)用工具對關(guān)鍵片段進(jìn)行高幀率處理。這意味著模型不再是只能看懂一張圖,而是能像人一樣看完半場籃球賽,并分析出戰(zhàn)術(shù)布局。
簡單總結(jié)一下就可以看出,火山引擎未來一段的發(fā)展戰(zhàn)略和主要焦點(diǎn),就是在「與商業(yè)世界對齊」的工具環(huán)境和模型能力上。而多模態(tài)能力的領(lǐng)先,恰恰將給火山引擎帶來重要的戰(zhàn)役制高點(diǎn)。
03
客戶實(shí)際上在買
字節(jié)跳動(dòng)的「技術(shù)溢出」
要理解為什么火山引擎今年這么火,其實(shí)值得換個(gè)客戶視角看看他們買單的深層邏輯到底是什么?
由于極客公園接觸創(chuàng)業(yè)者比較多,至少從他們的視角,我聽到了一個(gè)有趣的觀點(diǎn): 今天企業(yè)用火山引擎,本質(zhì)上其實(shí)就是在「薅字節(jié)跳動(dòng)的技術(shù)羊毛」,享受其技術(shù)外溢的紅利。
我們來看一組震撼的數(shù)據(jù)。在這次 Force 大會(huì)上,火山公布了一個(gè)核心數(shù)字: 豆包大模型的日均 Tokens 調(diào)用量已經(jīng)突破了 50 萬億 。
這是什么概念?作為對比,谷歌此前剛剛宣布今年 9 月的全月 Tokens 消耗量為 1.3 千萬億,也就是日均 43.3 萬億。換句話說,火山引擎如果沒吹牛,那么每天處理的 AI 調(diào)用量,已經(jīng)站在了全球云平臺(tái)的第一梯隊(duì),甚至在某些維度上實(shí)現(xiàn)了超越。
這 50 萬億的調(diào)用量似乎是有水分呢?我覺得如果考慮到字節(jié)跳動(dòng)內(nèi)部龐大的「內(nèi)循環(huán)」需求,大概率是差不多的。
![]()
2025 Force 大會(huì)上火山引擎發(fā)布全景圖丨來自:2025 原動(dòng)力大會(huì)·冬
字節(jié)跳動(dòng)的特點(diǎn)是,模型悶頭做,然后自己的狗糧自己猛吃。其內(nèi)部大量的應(yīng)用和場景,模型調(diào)用早就無處不在,每天都在產(chǎn)生海量的 Tokens 調(diào)用。這種天然的環(huán)境就必然帶來一個(gè)原生的能力——為了支撐這個(gè)體量的內(nèi)循環(huán),為了讓字節(jié)自己的業(yè)務(wù)能跑通、能賺錢,字節(jié)的技術(shù)團(tuán)隊(duì)必須把推理成本壓到極致,必須把 AI 云原生的能力做好。
其實(shí)今天我接觸的優(yōu)秀創(chuàng)業(yè)團(tuán)隊(duì)和投資人們都有個(gè)共識(shí), 無論什么形態(tài)的產(chǎn)品,今天都是個(gè)「容器」:一個(gè)在場景里贏得用戶,形成「數(shù)據(jù)飛輪」的容器。它的形態(tài)會(huì)不斷演化,甚至終將走向「產(chǎn)模一體」(也就是需要有自己的最優(yōu)模型) 。但是今天的核心不是探討模型是誰的,基礎(chǔ)設(shè)施是誰的,而是最高效構(gòu)建可以拉進(jìn)用戶,產(chǎn)生數(shù)據(jù)飛輪的進(jìn)程。
所以這個(gè)時(shí)候,就可以理解為什么創(chuàng)業(yè)者們一方面「怕字節(jié)」做和自己類似的產(chǎn)品,但是又很堅(jiān)決的會(huì)選擇火山引擎的 MaaS 服務(wù)。核心是他們希望抓住字節(jié)跳動(dòng)內(nèi)部技術(shù)能力的溢出,就算隨著發(fā)展和能力積累肯定要自己的有模型,那今天也要堅(jiān)決薅「字節(jié)的技術(shù)羊毛」。
顯然更多的真實(shí)商業(yè)世界里的企業(yè),也開始想清楚了這個(gè)問題。目前火山引擎日均 Tokens 調(diào)用量突破一萬億的企業(yè)客戶已經(jīng)超過了 100 家,這個(gè)數(shù)字還在快速上升。
火山引擎這種在 AI 時(shí)代支持字節(jié)「內(nèi)循環(huán)」+商業(yè)世界「外循環(huán)」的雙循環(huán)模式,確實(shí)有點(diǎn)勢不可擋。接下來幾年,是國內(nèi)商業(yè)世界非常值得關(guān)注的一個(gè)新變量了。
火山引擎AI 時(shí)代字節(jié)跳動(dòng)





京公網(wǎng)安備 11011402013531號(hào)