撰文| 郝 鑫
編輯| 王 潘
在大模型領(lǐng)域,Tokens是衡量文本處理與計(jì)算成本的核心計(jì)量單位。
行業(yè)發(fā)展通常遵循從概念驗(yàn)證到規(guī)模化應(yīng)用的路徑,因此,在一段時(shí)間內(nèi),Tokens消耗量被視為衡量大模型行業(yè)進(jìn)展與市場(chǎng)活躍度的關(guān)鍵指標(biāo)。
火山引擎總裁譚待在“2025年冬季FORCE原動(dòng)力大會(huì)”現(xiàn)場(chǎng)表示,模型只有在被調(diào)用的時(shí)候才能發(fā)揮價(jià)值,所以越有價(jià)值的模型調(diào)用次數(shù)就越多。
最新數(shù)據(jù)顯示,截止到今年12月,豆包大模型日均調(diào)用數(shù)已超過50萬億,自發(fā)布至今已經(jīng)實(shí)現(xiàn)了417倍增長(zhǎng)。這一數(shù)據(jù),僅次于OpenAI和Google。
但如果僅把目光停留在消耗總量,把Tokens視作消耗算力的成本單位,就很容易忽視大模型發(fā)展中“質(zhì)”的問題。
某行業(yè)人士透露,在Tokens規(guī)模成為行業(yè)指標(biāo)的背景下,部分公司通過調(diào)整統(tǒng)計(jì)口徑等方式,使得調(diào)用量數(shù)據(jù)大幅提升,存在一定“水分”。此外,不少Tokens消耗實(shí)際來自免費(fèi)試用或簡(jiǎn)單搜索場(chǎng)景,真實(shí)商業(yè)轉(zhuǎn)化有限,整體呈現(xiàn)出“虛胖”態(tài)勢(shì)。
與此不同,火山引擎在關(guān)注Tokens調(diào)用規(guī)模的同時(shí),更強(qiáng)調(diào)其背后的“含金量”——即Tokens是否真正用在了企業(yè)核心業(yè)務(wù)場(chǎng)景、是否帶來實(shí)際價(jià)值。
譚待表示,2025年已有超過100萬家企業(yè)和個(gè)人通過火山引擎使用大模型服務(wù),覆蓋百余行業(yè)。
![]()
其中,Tokens消耗超萬億的客戶已超過百家,這些高價(jià)值客戶主要來自互聯(lián)網(wǎng)、智能制造、消費(fèi)電子、汽車等產(chǎn)業(yè)。其Tokens消耗多集中于產(chǎn)品研發(fā)、生產(chǎn)流程優(yōu)化、客戶服務(wù)升級(jí)等深度業(yè)務(wù)環(huán)節(jié),真正推動(dòng)了大模型技術(shù)與產(chǎn)業(yè)需求的緊密結(jié)合。
因此,火山引擎所關(guān)注的不僅是“用了多少”,更是“用在何處、產(chǎn)生何效”,這背后離不開火山引擎上下對(duì)Tokens的精準(zhǔn)認(rèn)知。體現(xiàn)在行動(dòng)上,火山引擎也是國(guó)內(nèi)最早把Tokens作為業(yè)務(wù)落地考核指標(biāo)的云廠商。
為什么Tokens調(diào)用量在AI時(shí)代如此重要?火山引擎作為云計(jì)算市場(chǎng)的后來者,為什么能以Tokens的調(diào)用量為支點(diǎn),迅速覆蓋千行百業(yè),率先完成Tokens價(jià)值轉(zhuǎn)化?
Tokens經(jīng)濟(jì)時(shí)代
大模型技術(shù)催生了對(duì)“智能”的新需求,常常表現(xiàn)為對(duì)通用認(rèn)知能力規(guī)模化、服務(wù)化的調(diào)用。
對(duì)外輸出大模型能力依賴于強(qiáng)大的云計(jì)算架構(gòu),但這種新興的“智能交付”邏輯,與傳統(tǒng)的“資源交付”邏輯存在著矛盾。
傳統(tǒng)由IaaS、PaaS、SaaS組成的分層解耦云架構(gòu)中,本質(zhì)是將物理資源虛擬化、服務(wù)化后進(jìn)行分層交付。用戶購(gòu)買的是容量和時(shí)長(zhǎng),量化為消耗多少算力,至于用這些能力能做什么,云廠商并不關(guān)心。
有人認(rèn)為,這種以資源為驅(qū)動(dòng)的架構(gòu),與智能的邏輯背道而馳,在AI時(shí)代反而會(huì)阻礙AI應(yīng)用的創(chuàng)新速度。因此,以火山引擎為代表的廠商,提出了“AI云原生架構(gòu)”的概念。
AI云原生架構(gòu)的顛覆在于,其核心設(shè)計(jì)目標(biāo)是為了高效、大規(guī)模地生產(chǎn)和消費(fèi)“智能”。
按照火山引擎的理解,新架構(gòu)中,模型是軟件的核心,MaaS是使用模型的最佳方式,算力以Tokens的方式轉(zhuǎn)換為智能;同時(shí)圍繞Agent開發(fā)和Agent運(yùn)營(yíng),云平臺(tái)和中間件進(jìn)一步把Tokens組裝成Agents,并實(shí)現(xiàn)Agent和現(xiàn)有工作流、Agent和Agent之間的智能互通。
類比工業(yè)時(shí)代以“千瓦時(shí)”度量電力消耗,互聯(lián)網(wǎng)時(shí)代以“GB”計(jì)算數(shù)據(jù)流量,AI云原生以Tokens作為最小單位來衡量智能規(guī)模,具有自然的延續(xù)性與合理性。這意味著,無論底層用了多少算力、多復(fù)雜的模型,最終用戶獲得的價(jià)值可直觀地量化為“處理了多少Tokens”。
在這樣的思考下,火山引擎升級(jí)了AI云原生全棧服務(wù):在MaaS服務(wù)上,推出企業(yè)自有模型的推理代工服務(wù)、強(qiáng)化學(xué)習(xí)平臺(tái);面向Agent開發(fā),發(fā)布企業(yè)級(jí)AI Agent平臺(tái)AgentKit;面向Agent運(yùn)營(yíng),發(fā)布HiAgent“1+N+X”智能體工作站,推動(dòng)Agent大規(guī)模落地。
![]()
火山引擎在市場(chǎng)早期,便靈敏地識(shí)別出Tokens是連接模型、客戶與商業(yè)化的通用度量衡。先一步認(rèn)識(shí)到,云計(jì)算的商業(yè)模式將從出租算力轉(zhuǎn)變?yōu)槭圪u智能能力,Tokens消耗量直接對(duì)應(yīng)其核心收入。
基于此,火山引擎將競(jìng)爭(zhēng)的焦點(diǎn)轉(zhuǎn)移到了:誰能提供更強(qiáng)大、更便宜的模型?如何以更低的算力成本生成更多Tokens?以及如何客戶在平臺(tái)上消耗更多Tokens?
在內(nèi)部,更是通過將Tokens調(diào)用量?jī)?nèi)化為考核“指揮棒”,驅(qū)動(dòng)整個(gè)組織從技術(shù)、產(chǎn)品到銷售,都圍繞“如何幫助客戶高效消耗更多有價(jià)值Tokens”展開,從而形成落地的閉環(huán)。
事實(shí)證明,火山引擎Tokens策略行之有效。根據(jù)IDC報(bào)告,火山引擎在中國(guó)的公有云大模型的服務(wù)調(diào)用量穩(wěn)居第一,市場(chǎng)份額從去年的46.4%提升到今年的49.2%。也就是說,在中國(guó)公有云上每產(chǎn)生的兩個(gè)Tokens就有一個(gè)是火山引擎。這一統(tǒng)計(jì)口徑,指的是對(duì)外部客戶提供的大模型服務(wù)調(diào)用量,不包含自有業(yè)務(wù),更能反映出產(chǎn)業(yè)端的實(shí)際應(yīng)用情況。
![]()
當(dāng)Tokens成為大模型時(shí)代通用的度量單位后,其流動(dòng)數(shù)據(jù)便具有堪比“用電量”“流量”一般的指向性意義。換而言之,Tokens流向哪里,哪里便是產(chǎn)業(yè)發(fā)展方向。
例如,如果流向“文生視頻”模型的Tokens暴增,就表明該應(yīng)用正處爆發(fā)期;如果流向“代碼生成”的Tokens持續(xù)穩(wěn)定,表明開發(fā)者工具已進(jìn)入生產(chǎn)級(jí)采納階段;Tokens消耗在推理端比例大于訓(xùn)練段,則從側(cè)面反映出行業(yè)從模型研發(fā)走向了規(guī)模化應(yīng)用。
更進(jìn)一步,若觀察視角跳出Tokens消耗量的堆砌,而作為衡量AI真實(shí)生產(chǎn)力和商業(yè)滲透率的指標(biāo)。那每一次的Tokens調(diào)用都對(duì)應(yīng)一次實(shí)際的服務(wù)交付與價(jià)值創(chuàng)造,這使得Tokens的流向成為觀測(cè)AI產(chǎn)業(yè)脈搏最直接的“心電圖”。
火山“上”車
以火山引擎披露為例,Tokens大量流入到了汽車、智能終端、金融、教育、消費(fèi)、游戲、泛互聯(lián)網(wǎng)等行業(yè)。
汽車領(lǐng)域是近幾年火山引擎著重發(fā)力的領(lǐng)域之一。數(shù)據(jù)顯示,火山引擎助力超九成主流車企進(jìn)行AI升級(jí),大模型覆蓋了從汽車云、智能座艙、企業(yè)應(yīng)用、汽車出海、具身智能等全流程場(chǎng)景。
在此次大會(huì)中,火山引擎在AI安全領(lǐng)域新推出了“MaaS on AICC”的服務(wù),其核心是讓企業(yè)能夠在加密環(huán)境下進(jìn)行模型推理任務(wù),提升安全指數(shù)。
上汽大眾是其中一個(gè)案例,通過使用MaaS on AICC服務(wù),對(duì)內(nèi)部5萬多份機(jī)密知識(shí)數(shù)據(jù)實(shí)現(xiàn)了安全保護(hù)。由此,上汽大眾為上千家經(jīng)銷商,上萬名銷售人員提供了智能知識(shí)服務(wù)。相比私有化的部署方案,火山引擎的新方案,幫助他們節(jié)約了60%以上的成本,還降低了AI應(yīng)用創(chuàng)新的門檻。
火山引擎所合作的企業(yè)中,既包括了寶馬、奔馳、奧迪、比亞迪這類傳統(tǒng)車企,又涵蓋了特斯拉、“蔚小理”這類的新勢(shì)力。豆包大模型“上車”幾乎成為了每家車企的標(biāo)配,在2025年新車智能座艙搭載量位居行業(yè)第一。
我們了解到,火山引擎在落地行業(yè)中逐步建立起了基礎(chǔ)模型、C2B和場(chǎng)景經(jīng)驗(yàn)迭代的優(yōu)勢(shì)。
首先技術(shù)的底氣來自于不斷迭代更新的豆包大模型能力,模型上限還在不斷突破,每一次升級(jí)都有可能帶來直接的體驗(yàn)提升。
在火山引擎內(nèi)部有一個(gè)理念叫“基模的共同搭建”,即To C和To B底層共用一套基礎(chǔ)模型。這樣一來,在C端產(chǎn)品積累的產(chǎn)品經(jīng)驗(yàn)和know how,可以直接在B端服務(wù)中去復(fù)用,以此來提升交付體驗(yàn)。豆包大模型“上車”速度如此之快,背后離不開在豆包AI助手上的持續(xù)打磨,相應(yīng)地豆包的名氣也帶給了合作車企的曝光度。
火山引擎能夠像“滾雪球”般地迅速覆蓋行業(yè),離不開其打造合作標(biāo)桿的策略。僅在車企領(lǐng)域,火山引擎就與上汽榮威推出了搭載豆包深度思考模型的AI智艙,與寶馬探索AI汽車營(yíng)銷創(chuàng)新,與極氪汽車打造企業(yè)級(jí)“數(shù)字洞察智能體”等。
火山引擎相關(guān)人士告訴我們,“在與車企的合作過程中,我們會(huì)積累起不同車企的用戶交互體驗(yàn)經(jīng)驗(yàn)和場(chǎng)景落地經(jīng)驗(yàn),最終把這些都轉(zhuǎn)化為整個(gè)火山引擎的To B交付產(chǎn)品經(jīng)驗(yàn)”,正是有了不斷地經(jīng)驗(yàn)迭代,才能在下一次新合作中命中客戶的需求點(diǎn)。
To B的業(yè)務(wù)充滿了復(fù)雜性,整體上時(shí)間緊、任務(wù)重,在合作中既要厘清雙方的職責(zé)所在,又要在關(guān)鍵問題上達(dá)成一致,最后能上線一款融合雙方優(yōu)勢(shì)的產(chǎn)品,難度系數(shù)遠(yuǎn)比想象中高。
上汽榮威的智能座艙是火山引擎打造的標(biāo)桿型合作案例,該款車型首個(gè)搭載了“豆包深度思考模型”,雙方共同定義了“帶推理功能”的車端助手產(chǎn)品。在這個(gè)合作中,車企負(fù)責(zé)做產(chǎn)品體驗(yàn)的定義和大方向上的把控,火山引擎主要負(fù)責(zé)大模型賦能交互其中一環(huán)的體驗(yàn)設(shè)計(jì)。
![]()
在上汽榮威案例里面,涉及了大模型車控、大模型閑聊和大模型聯(lián)網(wǎng)問答等諸多場(chǎng)景。從獲得用戶指令到響應(yīng)需求,火山引擎把整個(gè)過程拆解為了模型的理解、推理和表達(dá)三步。用戶提出指令后,模型先得理解清楚意圖,然后針對(duì)用戶行為作出響應(yīng),最后呈現(xiàn)出來的是打開音樂、設(shè)置目的地。
針對(duì)具體的場(chǎng)景化需求,火山引擎提出了很多自己的思考。為了滿足車主的個(gè)性化需求,火山引擎針對(duì)每次固定不變的東西,設(shè)定冷啟動(dòng)推薦和學(xué)習(xí)記憶。用戶一方面可以接受模型提出的建議,另一方面也能糾正模型,模型會(huì)記錄下來用戶的需求,在每次交互中不斷迭代,離理解用戶更近一點(diǎn)。
火山引擎相關(guān)人士還透露,下一代產(chǎn)品將會(huì)構(gòu)建大模型“一對(duì)N”的關(guān)系。國(guó)內(nèi)用車場(chǎng)景有著強(qiáng)烈的家庭屬性,升級(jí)到“一對(duì)N”功能后,模型就能清楚地知道每個(gè)人的身份以及彼此間的關(guān)系屬性。
Tokens流向千行百業(yè)
火山引擎服務(wù)客戶所產(chǎn)生的Tokens還在不斷擴(kuò)大,其他行業(yè)的案例還有很多。
在智能終端領(lǐng)域,火山引擎已與全球Top 10手機(jī)廠商中的9家建立了深度合作關(guān)系,截至目前為止,豆包大模型已覆蓋超過5億臺(tái)終端設(shè)備。
其核心邏輯在于,以豆包大模型為統(tǒng)一基座,為手機(jī)廠商提供模塊化、可定制的AI能力菜單,而近期備受關(guān)注的“豆包手機(jī)助手”正是該能力在終端體驗(yàn)上的實(shí)驗(yàn)性產(chǎn)品,做出了“天花板”級(jí)示范。
![]()
合作成功的關(guān)鍵在于火山引擎提供的并非單一產(chǎn)品,而是靈活的“能力組合”。廠商可按需接入多模態(tài)模型、聯(lián)網(wǎng)搜索插件、角色化智能體及端云協(xié)同安全方案等,從而快速打造具備AI搜索、屏幕問答、跨應(yīng)用操作等特性的智能助手。例如,vivo、OPPO等品牌已基于此實(shí)現(xiàn)了AI意圖搜索、圈選識(shí)屏、多模態(tài)交互等創(chuàng)新功能。
在金融行業(yè),火山引擎提供營(yíng)銷、投研、信貸等智能體建設(shè)方案,已服務(wù)中信證券、國(guó)泰海通、華泰證券等八成頭部券商,及招商銀行、民生銀行等八成系統(tǒng)重要性銀行。
華泰證券基于豆包大模型打造了國(guó)內(nèi)證券行業(yè)第一個(gè)AI原生應(yīng)用——“AI漲樂”。在豆包大模型的加持下,解決了功能堆砌的問題,AI得以深度融入選股、分析、交易等核心場(chǎng)景中,幫助用戶執(zhí)行選股、盯盤、下單、提醒等一系列復(fù)雜的操作。
進(jìn)一步,搭配豆包的播客模型,AI漲樂還可以根據(jù)用戶興趣和需求生成個(gè)性化對(duì)話的AI播客,讓用戶在通勤路上以聽的方式,就能獲得最新的市場(chǎng)信息。一套“組合拳”下來,AI漲樂不再是一個(gè)被“閑置”的應(yīng)用,而是成為高粘性的投資理財(cái)工具。
對(duì)于合作,火山引擎的態(tài)度更加開放,一個(gè)典型例子就是客戶不僅能選擇豆包大模型,還能接入DeepSeek等開源模型。火山引擎認(rèn)為,圍繞客戶的需求解決問題才是關(guān)鍵。基于此,火山引擎目前的商業(yè)模式也更多元化。
輕量化模式,就是火山引擎方提供大模型API,客戶直接調(diào)用,自己來做產(chǎn)品包裝研發(fā),這種模式按Tokens量付費(fèi)即可,比較容易計(jì)算。
第二種,如果有客戶想用使用火山引擎的一些標(biāo)準(zhǔn)化產(chǎn)品,這里面可能就涉及一些定制費(fèi)用和使用授權(quán)費(fèi)用。
第三種,在一些新興場(chǎng)景中,火山引擎更傾向于深度的戰(zhàn)略合作,聚焦在雙方怎么能夠相互賦能,共同打磨出標(biāo)桿型產(chǎn)品。
火山引擎曾憑借一己之力推動(dòng)大模型價(jià)格進(jìn)入“厘時(shí)代”,為企業(yè)降本增效的服務(wù)理念貫穿始終。去年5月份,火山引擎平臺(tái)上的主流模型降價(jià)99%。今年,火山引擎首創(chuàng)按模型思考長(zhǎng)度、分段計(jì)費(fèi)的方式,為企業(yè)節(jié)約成本。
剛過去的發(fā)布會(huì)上,針對(duì)企業(yè)想跑更多新模型的心態(tài),火山引擎又推出了“AI節(jié)省計(jì)劃”。該計(jì)劃涵蓋了豆包大模型和各類三方開源模型,凡是參與的企業(yè),各個(gè)部門都能享受統(tǒng)一的價(jià)格優(yōu)惠,且不同模型之間用量可以互相累計(jì)。以此計(jì)算下來,最高可節(jié)省47%的使用成本。
Tokens不止,流向千行百業(yè),火山引擎正在以開放、靈活的姿態(tài),成為AI與產(chǎn)業(yè)深度融合的關(guān)鍵推動(dòng)者。
微信號(hào)|TMTweb
公眾號(hào)|光子星球
別忘了掃碼關(guān)注我們!





京公網(wǎng)安備 11011402013531號(hào)