
一個原生自帶幻覺的新技術,能用到企業的生產環境么?起初,這是行業所有人對大模型的疑慮。
火爆的ChatGPT本質上是chatbox,聊天機器人和C端用戶的互動不需要百分百的準確,但是企業生產環境能有多少聊天場景,把其他場景全改為chatbox也不現實,幻覺問題更是死穴,企業生產更需要確定性。
當模型層面的問題不再是問題,大模型進入生產場景就有了前提條件。2025年6月11日,字節跳動旗下火山引擎舉辦Force原動力大會,發布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型。

結合行業趨勢來看,包括字節跳動在內的所有模型廠商都認為,大模型的“死穴”已經盡數消失,而產業正從卷模型轉向卷應用,大模型產業的勝負手既在大模型本身,更在于誰能構建一條讓Agent進入核心場景的通路。
火山引擎總裁譚待表示,深度思考、多模態和工具調用等模型能力提升,是構建Agent的關鍵要素。同時,由于Agent每次執行任務都會消耗大量tokens,模型使用成本也要降下來,才能推動Agent的規模化應用。
大模型的效果和性價比都很重要,本次大會上,豆包1.6宣布按“輸入長度”區間定價,深度思考、多模態能力與基礎語言模型統一價格。在企業使用量最大的0-32K輸入區間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為行業最低。
與此同時,大模型要進入企業核心生產場景,還有大量的工程化實踐,以及超出Agent本身的工作要做。一年多之前,HiAgent企業級智能體開發平臺就推出了第一個版本,如今HiAgent再更新大版本,如何進一步補全企業級Agent的版圖,鈦媒體App和火山引擎副總裁張鑫聊了聊。
2025年,Agent上生產線元年
如果參照互聯網,應用繁榮才意味著大模型產業真正的繁榮,沒有企業想要擁有一個“互聯網”,但所有企業都想擁有互聯網化生出的各種能力,這些能力就以軟件應用的形式呈現。
大模型產業的蔓延同樣有跡可循,從預訓練到精調,從算力基礎設施到工具鏈,大模型產業行至應用層是一種必然,相比于又厚又重的底層基礎設施,上層應用是一條更好、更快擁抱新技術的路徑。此外,自上而下由業務到技術的驅動模式,企業也往往更愿意為看得見的價值付費。
火山引擎的認知也經歷了變化,張鑫談到,早期火山引擎看到,應用效果很大程度由大模型本身決定,所以字節跳動加大基礎模型的投入,想通過好的模型讓大家能夠更容易地構建出好的應用。
之后火山引擎發現,有了好的模型并不和應用直接畫等號,中間有一系列工程化實踐,從提示詞工程到知識庫到工作流等,火山引擎要提供一個足夠好的智能體的開發平臺,要把新技術的鏈路補全,扣子和HiAgent這樣的平臺隨之誕生。
一年多之前,張鑫發布了HiAgent第一個版本。當時聊大模型的算力、算法、Token的很多,聊Agent的人不多,只有一小部分企業選擇開始使用HiAgent。隨后大模型演變比大多數人預料的還要快速且劇烈,似乎之前的問題已經不是問題。
“2025年是Agent元年”,幾乎所有人都這么說,但問題是,Agent元年是什么樣的?在張鑫看來,Agent元年是一個樂觀的預期,智能體可能會“遍地開花”,但智能體爆發需要在幾個不同維度都達到臨界點。
例如技術臨界點,大模型能力的上限,決定了智能體應用效果的下限,今天的大模型已經達到博士生的水平;在商業和生態的角度,智能體最大的一個變化是使用工具,不管是通過MCP,還是谷歌提出的A2A協議,真正能夠把智能體的價值放大,還需要生態體系更加完善。
“大模型商業模式至今也分了幾個階段,初級階段賣算力,收費單位是卡時,下一個階段按token收費, 其實是在算力基礎上疊加了一部分大模型能力,再到下一個階段是按使用量或者按訂閱制來收費,但最終智能體要在元年爆發,我認為應該按效果、按價值收費,比如營銷額外產生了多少收益,節省了多少成本。”張鑫說。
一個新的共識是,上一輪所有的應用都會被AI重構。
咨詢機構IDC預計,2025年生成式AI在企業的落地仍將優先聚集在辦公助手等提升生產力的場景,其次是行業垂直業務場景。金融、能源、零售、制造是最值得關注的傳統行業。從另一個角度,智能體將是大模型應用的重要方向,流程自動化,RPA,CRM,數字員工將優先受益于智能體升級。
從企業視角觀察,大體路徑先是企業研發、生產、供應鏈、銷售服務等環節所依賴的軟件、硬件工具,都通過AI不斷迭代升級;未來全面AI化的企業,將發生業務流程、商業模式乃至組織形態的變化。
“有通用大模型,但很難有通用智能體,智能體非常依賴于場景,”張鑫說。面對一個完全陌生的新技術,哪怕它具有足夠的革命性、足夠的勢能,開端總是磕磕絆絆且不盡如人意的。這些現象背后的本質問題包括了模型能力邊界的探索、To B場景的復雜多變、工程最佳實踐的缺乏,以及數據知識質量參差不齊等。
目前企業客戶認知存在兩個極端,企業高層大多高估AI Agent,一線人員則很容易低估AI Agent,同時很多企業把AI Agent當作傳統的軟件工程,交付驗收即結束,但是企業的業務場景在變,數據在變,領域知識在變,智能體和真人一樣需要不斷地學習和調教,AI Agent不是一次搭建的靜態結果,而是持續調優的動態過程。
此外,某種意義上,在大模型產業和技術尚不成熟的階段,企業要真正發揮新技術價值,需要付出的精力并不比技術服務商少,從0到1、從無到有的拓荒,只有企業本身才能實現。對比之下,互聯網產業分工明確,是因為產業基礎盡數具備,技術供應商只需完成“最后一公里”的服務,大模型生態還早得很。
跳出Agent,才能做好Agent
大模型的演化有一個特點,在技術發展的極早期,大部分技術都沒到成熟的穩定態,所以大模型的優化必須做端到端的把控,典型代表就是現在還留在大模型牌桌的廠商,從底層芯片到云基礎設施到大模型本身,都不能有短板。
如前所述,企業Agent的技術棧同樣不成熟,這就要求技術服務商向前一步,做更多端到端的服務。
對于當下智能體開發平臺的啟示是,企業不愿意為工具付費,但愿意為結果付費,想做好企業級Agent,不能只做一個應用開發平臺,而是沿著企業Agent的鏈條延展,最大程度降低企業的門檻、提高企業Agent的價值。
如果大模型是縱向的端到端,那么,AI Agent更像是另一個橫向的端到端,當然,大模型的縱向能力也可以引入其中。
火山引擎也看到了企業的顧慮,張鑫將HiAgent智能體構建平臺本次大版本的更新,定義為“上下左右”的迭代,核心是基于Agent DevOps理念,HiAgent提供策略規劃、能力開發、評測、發布、觀測、優化全生命周期管理,實現從模型到應用的全鏈路打通。
具體來看,向右意味著開發和運營一體化,智能體不是一次開發的交付,而是一個數據不斷產生、經驗不斷積累、知識不斷豐富的過程,因此Agent需要持續運營,HiAgent從原來智能體開發加上了智能體運營, 包括評估評測、應用發布、線上觀測、會話管理、品質調優、數據回流等一系列全生命周期管理。

火山引擎副總裁 張鑫
類比云原生的DevOps理念,將開發(Dev)、運維(Ops)和測試(Test)等團隊緊密結合,通過自動化流程和工具鏈的整合,實現軟件從開發到運維的快速、高效交付。DevOps不僅僅是開發團隊和運維團隊的結合,而是涵蓋了從需求分析、產品設計、開發、測試、部署到運維的全過程協作。
向上,除了智能體開發平臺以外,很多企業還是要面臨“最后一公里”的問題,火山引擎也提供了行業樣板間和模板庫,面向常見的一些場景,包括客服、營銷、招聘、辦公類等,進一步細分成教育行業、醫療行業、金融行業等。“如果說智能體開發是從0到1,有了模板以后企業就從0.8到1,企業可以基于模板補充符合自己需求的最后20%,小修小改就能快速完成。”張鑫說。
向下則是模應一體,模型和應用一體,除了提示詞工程、知識庫,大模型能力本身就是應用能力很重要來源。很多行業免不了要做自己的模型,把通用模型通過精調、強化學習,甚至通過精蒸餾達到一個非常專業的領域模型成都,然后再基于它做上層的智能機搭建,以期實現更好的效果。
在HiAgent 新版本中,智能體效果的深度優化可以下鉆到模型層。HiAgent 2.0 融合一站式模型訓推平臺,提供模型后訓練以及多模型的管理和評測,從數據標注到參數調優,讓專業開發者能針對行業場景定制專屬模型,告別‘通用模型水土不服’的痛點;同時,HiAgent 2.0提供私有化部署引擎,讓推理服務嵌入企業內網,數據不出企業防火墻,既滿足合規要求,又能在工廠、銀行等網絡敏感環境中穩定運行。
向左,一個統一的智能體入口。張鑫表示,跟企業合作多了以后就會發現,大家會遇到一個共同問題,基于HiAgent確實可以很方便地創建智能體,企業員工群策群力,一個企業內部往往會有幾百個不同的智能體,但是所有智能體的使用非常零散,所有智能體分布在不同的入口。
這時企業就需要統一的交互入口,讓員工可以在日常工作中更容易地和智能體協作,同時沉淀更多企業用戶數據和偏好記憶。HiAgent 2.0就發布了這樣一個Canvas統一交互門戶,在HiAgent上搭建的智能體可以直接發布到Canvas門戶,員工與多智能體可以通過“千人千面”的動態“畫布卡片”的方式,協同作業。HiAgent通過閉環智能體從搭建到使用的鏈路,可以讓企業更容易地使用多個智能體,讓“數字員工”真正融入到日常業務中,更好推動業務的AI轉型。

張鑫表示,“飛書和釘釘本質上更多解決了人人協同的問題,和飛書和釘釘不一樣,火山引擎更想成為解決人機協同的入口,這個入口專屬于一個用戶,甚至可以千人千面的呈現,研發、銷售和管理人員看到的界面都不同,通過這個入口可以喚醒幾十個甚至上百個自己的專屬智能體。”
他還提到,互聯網應用看重流量和生態能力,類比到企業領域,企業內部智能體一定不是孤立存在,新技術和老技術有相對長的共存期,企業內部已有的CRM、OA以及API、各種算法等工具還是會存在的,如何讓智能體更好和企業已有系統打通,火山引擎也希望通過統一端能夠完成,比如存量系統是否可以通過工具的形式發布到HiAgent平臺,讓智能體可以自由調動,這也是HiAgent要做端到端的核心之一。
Agent繁榮,大模型才是真繁榮
除了負責火山引擎企業級智能體開發平臺之外,字節跳動的智能體開發平臺,還有更被開發者和普通用戶所熟知的扣子,有了扣子,為什么字節跳動還要做HiAgent?
“在字節內部,我們特別不提倡內卷。”張鑫一言以蔽之。
從本質上看,扣子的產品確實在企業業務市場有需求,從客戶視角看,扣子有自己的定位,面向開發者和C端用戶,追求開發者的廣度和深度。此外,企業級客戶,尤其是大型客戶的“人事物”更復雜,需求也更個性化,需要HiAgent這樣的平臺來滿足。
但是扣子和HiAgent也算“同出一門”,兩大產品之間既有交叉的部分,譬如智能體開發的通用能力未來也會做到復用,類似低代碼、寫提示詞、做自動優化、工作流編排、知識庫建設等。不交叉的部分兩邊會各自投入大的資源,HiAgent的投入就是企業級客戶的所需。
簡而言之,扣子和HiAgent走出了差異化的路徑,但共同目標都是大模型產業的繁榮,前者聚焦于低門檻、場景化的智能體搭建平臺,賦能個體開發者和中小企業快速落地AI應用;后者則深耕企業級復雜流程自動化與深度集成,為大型組織提供端到端的高可靠智能解決方案。
結合行業來看,企業市場的Agent有時會滯后于消費市場,但是在垂直領域的縱深要遠遠超過消費級應用。例如某企業基于其他開源平臺開發了Agent并應用于生產系統,但是并發只能做到200個,遠遠低于該企業所需,改換HiAgent之后才滿足了生產環境的大規模并發。
更有趣的是,比如在企業AI工作臺,用戶想總結一個會議,此時企業沒有會議總結助手,AI工作臺就會自動調用一個特殊的工具HiAgent-Browser-Use,像manus那樣在線用HiAgent搭建出一個會議總結助手智能體,搭建完成后自動注冊成超級App背后的子智能體并執行會議總結,然后把結果渲染到畫布上。這就好像是,HiAgent能讓Agent自我繁衍了,一個更高階的Agent創建了新的Agent。
這也表明,HiAgent不只是一個開發工具,甚至不只是一個平臺產品,越來越多的客戶把HiAgent視為一個完整的AI能力中心,有別于以往的軟件應用,HiAgent沉淀了客戶的數據和知識,云基礎設施、大模型、中間件等產品和服務都是過程,最終交付給企業的AI能力,這應當是AI Agent之于企業的意義。
張鑫還記得,廣州公交集團的數字人,在內部居然有了自己的工號,在合同審核、車輛維修等多個領域持證上崗,且有自己的考評體系,硅基員工似乎真的成了企業生產環境的一部分,這也是他眼中Agent上生產線的實證。
基于行業視角觀察,張鑫認為,現在還是智能體開發平臺的發散階段,就像早期模型架構不統一的“百模大戰”,最終MoE架構成為主流,大模型玩家自此收斂。目前Agent的標準也并不統一,缺少公認的Agent成熟度體系,所有人都認可Agent的戰略方向,只是在落地和關鍵能力上有所不同。
火山引擎認為,除了開發平臺以外,還有幾個關鍵因素,首先是模型的能力,其次是極致的推理性價比,因此字節跳動在豆包大模型本身的投入上不遺余力,更注重自身模型的效果。同時在AI推理能力上,火山方舟加大更多投入,讓Agent跑起來的時候性價比更高,這也是未來Agent繁榮很重要的一個因素。
基于云計算的軟件開發模式已經成為主流,但是開發者使用容器等理念反而減少了對云廠商的依賴,張鑫在加入字節跳動之前,曾在谷歌深度參與K8s的開發,之后回國創立才云科技,親歷了云計算時代的軟件開發。
“K8s讓應用太容易遷移,這是開源的勝利,我們曾在谷歌內部開玩笑說,某種程度它反而有損于公有云廠商的價值,因為開發者可以將應用遷移到任何合適的環境,但是Agent可能不一樣”張鑫表示。
在他看來,對企業或者開發者來說,Agent真正的黏性在于更具性價比的全棧基礎設施,以及越用越好用的數據沉淀。
“Agent更依賴于基礎設施,就像DeepSeek出來之后各家的推理成本差距很大,很多云廠商托管的DeepSeek服務也不可用,火山引擎提供了更好的服務。另外,Agent天然對用戶有黏性,因為它有長期記憶,用戶使用同一個平臺,用同一個產品構建了Agent以后,用得越多Agent越好用,數據可能是以長期記憶或者知識庫的形式存在,這些知識和數據沒有辦法帶走的話,Agent的效果也會大打折扣。”





京公網安備 11011402013531號