![]()
圖片由AI生成
在歷經(jīng)“卷”價格爭議、DeepSeek沖擊波、Agent元年、端側(cè)AI爆發(fā)后,豆包大模型又迎來了一次重要更新。
12月18日,火山引擎正式發(fā)布豆包大模型1.8及音視頻創(chuàng)作模型Seedance 1.5 pro。
據(jù)火山引擎總裁譚待介紹,截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業(yè)客戶累計token使用量超過一萬億。
火山引擎稱,權(quán)威評測數(shù)據(jù)顯示,最新版大模型在Agent能力、多模態(tài)理解等方面已躋身全球第一梯隊。
針對日益增長的視頻創(chuàng)作需求,火山引擎推出了Seedance 1.5 pro音視頻創(chuàng)作模型。據(jù)其介紹,該模型具備影視級的敘事張力,能夠精準(zhǔn)捕捉運動細節(jié)并細膩呈現(xiàn)人物情緒,更在音畫同步技術(shù)上取得了突破性進展。
目前,個人用戶已可在豆包、即夢AI等平臺體驗該模型;企業(yè)用戶則可通過火山引擎API接入Seedance 1.5 pro模型服務(wù)。
多模態(tài)能力增強,Agent進入“真干活”階段
盡管多模態(tài)大模型需求旺盛,但行業(yè)仍處于早期,技術(shù)限制尚未完全突破,譚待也在會后的媒體采訪中表示,需保持耐心,模型會持續(xù)進化并逐步解鎖新領(lǐng)域,這是模型成為“復(fù)雜智能體”的必經(jīng)之路。
“Agent能力”則是這場發(fā)布的重頭戲,幾乎貫穿了這次豆包大模型的發(fā)布全程。
在譚待看來,多模態(tài)意味著模型開始真正進入復(fù)雜應(yīng)用場景,特別是企業(yè)場景,這是Agent成立的前提條件。
作為豆包家族的最新旗艦?zāi)P停拱竽P?.8(Doubao-Seed-1.8)面向多模態(tài)Agent場景進行了定向優(yōu)化。
豆包1.8在Agent方面的“工具調(diào)用”能力進步顯著,可一次性調(diào)用20多個工具,完成跨平臺比價、OA審批、數(shù)據(jù)填報等長鏈條任務(wù),平均規(guī)劃步驟降低37%,執(zhí)行成功率提升21%。
另外,最新的豆包大模型在復(fù)雜指令遵循能力和OS Agent能力都實現(xiàn)了大幅增強。
在多模態(tài)理解方面,豆包1.8大幅提升了視覺理解的基礎(chǔ)能力,可以低幀率理解超長視頻;在視頻運動理解、復(fù)雜空間理解、文檔結(jié)構(gòu)化解析能力上也都有所提升。
豆包1.8還原生支持智能上下文管理。用戶可以配置上下文策略,當(dāng)任務(wù)輪次過長時,模型會根據(jù)策略智能清除低價值的歷史工具調(diào)用信息,確保多步驟任務(wù)穩(wěn)定完成。
在火山引擎公布的Agent能力公開測評中,豆包1.8在數(shù)學(xué)、推理、復(fù)雜指令遵循、通用體智能、智能體編程等多項測試上都與GPT-5High、Gemini 3 Pro、Cloude Sonnet 4.5等全球領(lǐng)先的大模型在同一水平線上。
其中,在通用體智能BrowseComp-en方面,豆包1.8得到67.6分,不僅較上一代豆包1.6的16.7分大幅提升,也高于其他大模型。
![]()
圖片來自火山引擎官方
Agent規(guī)模化爆發(fā)后,需要新運營和管理系統(tǒng)
自去年起,AI產(chǎn)業(yè)一度迷茫于找不到除了聊天機器人外的能提供實際價值的應(yīng)用場景,呼喚“Agent時代”的聲音愈發(fā)高漲。
在譚待看來,從中國的視角出發(fā)觀察,“今年算是Agent元年,明年肯定還會繼續(xù)爆發(fā)”。他還提到,目前AI幫助人們?nèi)プ鯬PT甚至短劇、漫劇的嘗試已經(jīng)非常多,只是品質(zhì)還不夠,預(yù)計明年品質(zhì)會很快得到提升。
在Agent的行業(yè)應(yīng)用與客戶拓展上,譚待發(fā)現(xiàn),互聯(lián)網(wǎng)、零售、汽車、教育等領(lǐng)域進展較快,而傳統(tǒng)行業(yè)起步慢但天花板高。企業(yè)客戶消耗大部分token,但個人用戶數(shù)量占主導(dǎo)。
“Agent不只是開發(fā)問題,而是一個需要長期運營和管理的新系統(tǒng)。”譚待表示,而目前來說,最大的挑戰(zhàn)不是模型能力,而是Agent的開發(fā)和迭代速度遠遠跟不上模型能力的提升。
實際上,在今年的大模型競賽中,尤其是年底階段,Agent能力已是重中之重,“從會聊天到會干活”“有高智商也要有高情商”的特質(zhì),愈發(fā)受到關(guān)注。
各大主流玩家中,Anthropic的Cloude不斷打磨精進著編程能力,已成為實際場景應(yīng)用的典型案例之一。11月,谷歌重磅發(fā)布的Gemini 3也在實用性、性價比方面大受好評。
年初引發(fā)全球追逐的DeepSeek,在12月初最新發(fā)布的DeepSeek-V3.2中,著重強調(diào)了其在通用Agent任務(wù)中的表現(xiàn),其更新的API還首次支持了在思考模式下使用工具調(diào)用能力,大大提升了用戶獲取到的答案的豐富度和適用性。
上周,OpenAI在公司十周年之際發(fā)布的“翻身之作”GPT-5.2,雖然從反饋來說褒貶不一,但其聚焦實際應(yīng)用場景、專業(yè)用途,著力于凸顯“經(jīng)濟價值”的方向仍然引發(fā)關(guān)注,一度獲封“最強打工人”,從這家最初推動大模型浪潮的公司押注的方向,也能看出產(chǎn)業(yè)的風(fēng)向所在。
“大模型最大的價值肯定不只是幫人寫打油詩,合成一些照片。它最大的價值還是在教育、醫(yī)療、科研等方面,更好地幫助人成長,這也是大家對AI最大的期許。”譚待對媒體表示。
Agent即將爆發(fā)已經(jīng)是行業(yè)共識,譚待關(guān)心的是,后續(xù)Agent的管理問題。![]()
火山引擎總裁譚待,圖片來自火山引擎官方
他稱,2024年,一個企業(yè)可能有50多個Agent,2025年增加到200多個,明年肯定會更多,這就需要提高管理、運營尤其是協(xié)同的能力。他也表示,助力企業(yè)管理好Agent也是火山引擎相關(guān)產(chǎn)品的關(guān)注和發(fā)力重點。
火山引擎已升級了企業(yè)級AI Agent平臺AgentKit,覆蓋了Agent從開發(fā)、部署到管控的生命周期,解決企業(yè)在Agent落地中面臨的身份權(quán)限管理、模型確定性及系統(tǒng)集成等核心挑戰(zhàn)。
在Agent運營層面,火山引擎推出了HiAgent智能體工作站,構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心、提供一系列開箱即用的通用智能體,并支持個性化定制。
2025年,關(guān)于“Agent元年”的爭論和實踐,已收官在即,如果明年Agent爆發(fā)進一步爆發(fā),能帶來直接收益的實用場景和企業(yè)訂單大幅增長,想必各家大模型廠商的競爭也將愈發(fā)激烈。(作者|胡珈萌,編輯|李程程)





京公網(wǎng)安備 11011402013531號