編輯部 整理自 MEET2026
量子位 | 公眾號(hào) QbitAI
“每個(gè)人每天使用最高頻的三個(gè)APP中有兩個(gè)是Agent時(shí),才意味著AI Agent進(jìn)入新發(fā)展階段。”
“一個(gè)好Agent的衡量指標(biāo),包括可控性、可解釋性以及持續(xù)穩(wěn)定執(zhí)行任務(wù)的能力。”
“多數(shù)Agent存在負(fù)毛利問題,完成任務(wù)的代價(jià)高于用戶支付意愿,這對(duì)創(chuàng)業(yè)者來說是巨大挑戰(zhàn)。”
在量子位MEET2026智能未來大會(huì)的圓桌環(huán)節(jié),三位來自產(chǎn)業(yè)一線的嘉賓圍繞AI Agent的革新進(jìn)程展開深入討論。他們分別是:
聯(lián)匯科技CEO兼首席科學(xué)家趙天成博士小宿科技聯(lián)合創(chuàng)始人兼CEO杜知恒先生螞蟻集團(tuán)平臺(tái)體驗(yàn)技術(shù)部負(fù)責(zé)人徐達(dá)峰先生
2025年普遍被視為“Agent元年”。從客服、理賠等相對(duì)標(biāo)準(zhǔn)化的場(chǎng)景開始,Agent已經(jīng)完成了初步落地,并驗(yàn)證了技術(shù)可行性與階段性價(jià)值。
但真正的難題才剛剛顯現(xiàn)——
如何讓Agent同時(shí)跑通技術(shù)、產(chǎn)品與商業(yè)三條曲線,形成可持續(xù)的正向閉環(huán),仍是擺在整個(gè)行業(yè)面前的共同挑戰(zhàn)。
而在這場(chǎng)圓桌討論中,三位嘉賓從產(chǎn)品形態(tài)、技術(shù)演進(jìn)與商業(yè)現(xiàn)實(shí)等多個(gè)維度出發(fā),分享了他們對(duì)Agent下一程的判斷。
透過這些觀點(diǎn),我們或可窺見Agent從技術(shù)概念走向規(guī)模應(yīng)用的關(guān)鍵路徑,以及產(chǎn)業(yè)先行者們?cè)谔剿髦兴媾R的思考與抉擇。
![]()
本次圓桌環(huán)節(jié)由量子位智庫首席分析師劉萌媛主持。在不改變?cè)獾幕A(chǔ)上,本文對(duì)內(nèi)容進(jìn)行了編輯整理。希望能夠給你帶來更多的啟發(fā)與思考。
MEET2026智能未來大會(huì)是由量子位主辦的行業(yè)峰會(huì),近30位產(chǎn)業(yè)代表與會(huì)討論。線下到場(chǎng)參會(huì)觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。
話題要點(diǎn)
目前在AI Agent及相關(guān)領(lǐng)域重點(diǎn)從事哪些工作?各自落地效果最好的案例是什么?真正好用的AI Agent產(chǎn)品應(yīng)該關(guān)注哪些指標(biāo)?未來還有哪些對(duì)于AI Agent發(fā)展比較關(guān)鍵的卡點(diǎn)?AI Agent的下一步關(guān)鍵演進(jìn)方向是什么?進(jìn)入新階段的標(biāo)志性節(jié)點(diǎn)是什么?以下為圓桌對(duì)話全文:
圓桌實(shí)錄
量子位
無論是在前面各位嘉賓的演講中,還是在整個(gè)2025年的討論里,相信大家已經(jīng)多次聽到“AI Agent”這一關(guān)鍵詞。
無論是技術(shù)迭代還是產(chǎn)品涌現(xiàn),AI Agent確實(shí)屢屢讓人眼前一亮。今天,我們將從更加理性、務(wù)實(shí)的角度來探討:千行百業(yè)距離廣泛應(yīng)用AI Agent究竟還有多遠(yuǎn)?
為此,我們邀請(qǐng)到三位嘉賓,他們分別代表AI Agent產(chǎn)業(yè)鏈上不同領(lǐng)域的最前沿產(chǎn)品與技術(shù),來為大家?guī)砬袑?shí)的分享。
首先,請(qǐng)三位嘉賓簡要介紹一下自己,以及目前在AI Agent相關(guān)領(lǐng)域所從事的工作
趙天成
大家好,我是來自聯(lián)匯科技的趙天成。在過去的五年里,我們團(tuán)隊(duì)一直在做的事情是:
第一,研發(fā)信號(hào)終端側(cè)的多模態(tài)模型;
第二,探索如何讓智能體從在虛擬世界做PPT、寫寫畫畫,走向物理世界,真正操控終端設(shè)備,也就是實(shí)現(xiàn)所謂的“物理智能體”
目前我們?cè)趦蓚€(gè)方向做了很多工作,一是致力于讓多模態(tài)智能體本地化運(yùn)行,不完全依賴云端強(qiáng)大算力。例如,讓它在端側(cè)設(shè)備(如AI PC)上,甚至在飛機(jī)等無網(wǎng)絡(luò)環(huán)境中,也能高效處理海量多模態(tài)數(shù)據(jù),并轉(zhuǎn)化為真正實(shí)用、能幫用戶解決實(shí)際問題的智能體。
更進(jìn)一步,我們致力于將無人機(jī)、機(jī)器人、攝像頭等具備真正執(zhí)行能力的智能終端串聯(lián)起來,形成協(xié)同工作的智能體網(wǎng)絡(luò)。這是一個(gè)非常有意思的課題。目前大家熟悉的智能體,或許更多體現(xiàn)在處理工作流或特定查詢場(chǎng)景中。而我們探索的是更系統(tǒng)的物理聯(lián)動(dòng)
舉個(gè)例子,一個(gè)智能攝像頭探測(cè)到火災(zāi),它可以自動(dòng)通知另一個(gè)終端——比如一臺(tái)配備滅火裝置的機(jī)器狗。機(jī)器狗收到指令后前往現(xiàn)場(chǎng)撲滅火情,并在任務(wù)完成后返回基地,自動(dòng)生成一份報(bào)告給管理員,說明“火災(zāi)已發(fā)生并被撲滅,問題已解決”。
這樣一個(gè)從感知、決策、執(zhí)行到反饋的完整閉環(huán),能否通過智能體流暢地串聯(lián)與調(diào)度,從而實(shí)現(xiàn)智能體從數(shù)字世界走向物理世界的跨越?這正是我們團(tuán)隊(duì)過去兩年來持續(xù)深耕的核心方向。
![]()
徐達(dá)峰
大家好,我是來自螞蟻平臺(tái)體驗(yàn)技術(shù)團(tuán)隊(duì)的徐達(dá)峰。我們目前主要聚焦在兩個(gè)方向:
一是重構(gòu)軟件的研發(fā)方式。我們正在構(gòu)建一套完整的智能研發(fā)體系——WeaveFox,其中包含WeaveFox-Coder、Vibe-Coding、Spec-Coding等模塊,并打造了面向工程體系的Coding-Agent基礎(chǔ)設(shè)施和軟件工程-Agent基礎(chǔ)設(shè)施。
我們的核心目標(biāo),不僅僅是“讓模型能夠?qū)懘a”,更是要將多模態(tài)生成代碼、任務(wù)自動(dòng)拆解、工具鏈智能協(xié)同等能力,真正融入到生產(chǎn)環(huán)境中。我們致力于讓AI從輔助工具,轉(zhuǎn)變?yōu)檠邪l(fā)體系的原生能力,從而推動(dòng)整個(gè)工程鏈路實(shí)現(xiàn)更高水平的自動(dòng)化。
二是致力于將多智能體能力帶給大眾用戶
為此,我們推出了“螞蟻百寶箱”以及“百寶箱超級(jí)智能體”。我們的愿景是將其打造成一個(gè)“通用Agent平臺(tái)”——無需任何代碼依賴,也不要求使用者具備技術(shù)背景,真正做到開箱即用。用戶只需用自然語言描述需求,就能輕松構(gòu)建并發(fā)布屬于自己的智能體應(yīng)用。
無論是內(nèi)容創(chuàng)作類的需求,如生成文案、制作PPT、撰寫報(bào)告、設(shè)計(jì)網(wǎng)頁,還是通過多Agent協(xié)作完成更復(fù)雜的工作流任務(wù),都可以通過這個(gè)平臺(tái)實(shí)現(xiàn)。我們的目標(biāo),是將AI智能體從高門檻的“專業(yè)工具”,轉(zhuǎn)變?yōu)槿巳硕寄苡闷饋淼摹肮ぞ呦洹薄?/p>
![]()
杜知恒
我是杜知恒,小宿科技打造的是面向Agent的一站式基礎(chǔ)設(shè)施平臺(tái)
我們認(rèn)為,其中尤為重要的一個(gè)產(chǎn)品是為Agent設(shè)計(jì)的搜索引擎。這里我們也呼應(yīng)一下螞蟻的觀點(diǎn):我們相信,優(yōu)秀的Agent能夠勝任人類可以完成的工作。
過去,搜索引擎和信息獲取一直是人們工作、學(xué)習(xí)乃至日常生活中最主要的信息獲取工具。我們提供的正是一個(gè)多語言、全球化的搜索引擎工具,專門服務(wù)于Agent。
除了搜索能力,我們還提供模型服務(wù)、AI沙盒等多樣化的Agent工具集,致力于為大家打造一站式的Agent Infra平臺(tái)。
![]()
各自落地效果最好的案例是什么?
量子位
在三位做的Agent相關(guān)的產(chǎn)品里面,效果最好的Agent落地案例是什么?能否結(jié)合具體數(shù)據(jù)和觀眾分享一下,讓大家對(duì)Agent落地價(jià)值有更直觀的感受?
趙天成
今年有兩個(gè)點(diǎn)帶來的ROI(投資回報(bào)率)提升還是非常明顯的。
第一個(gè)是有了多模態(tài)。今年的確是VLM(視覺語言大模型)大幅度成熟的一年,之前大家用ChatGPT、GPT-4比較多,今年GPT-4o、Gemini 3這些新出來的多模態(tài)模型對(duì)于圖像和視頻的理解能力其實(shí)有質(zhì)的飛躍。
有了這個(gè)能力之后,我們的智能體可以算是打開了新的窗戶。之前Agent只能處理文本,要做圖片任務(wù)還需要一段描述,再給到模型去理解執(zhí)行,現(xiàn)在有了端到端模型之后,直接給視頻、給掃描件、給一張圖片甚至混合在一起都可以直接做(任務(wù)),很多以前不敢想的場(chǎng)景瞬間打開。
我們?cè)诙嗄B(tài)領(lǐng)域扎根很久,之前就在做很多探索,今年的確感受到建模本身的提升,多模態(tài)能力可以讓我們的智能體即使在數(shù)字空間場(chǎng)景中,也可以做很多以前不可能做到的事情。
第二個(gè)是有了執(zhí)行智能體。以前的AI即使可以理解視頻、理解圖像,也只能給你一個(gè)提醒“這邊發(fā)生事故趕快修復(fù)”、“這邊有問題趕快派人去吧”,現(xiàn)在有了執(zhí)行智能體,無論是操控機(jī)械臂還是執(zhí)行其他操作,現(xiàn)場(chǎng)就能直接解決問題。
這對(duì)于用戶來說,投資回報(bào)率和價(jià)值完全不在一個(gè)量級(jí),比如以前一個(gè)終端最多付一千塊錢,有了智能執(zhí)行端之后愿意付十萬塊錢,這是一百倍的本身價(jià)值的提升。
智能體核心邏輯在于結(jié)果即服務(wù),提供的是一個(gè)結(jié)果,這個(gè)結(jié)果的價(jià)值定義了產(chǎn)品有多大的能力邊界,一個(gè)是幫你看著,提醒你趕快滅火吧;第二個(gè)是直接告訴你已經(jīng)幫你把火撲滅了,比人撲的更快一些,這個(gè)對(duì)客戶來說價(jià)值是100倍的提升,這也是為什么我們非常篤定地相信多模態(tài)+執(zhí)行是智能體在后續(xù)發(fā)展中非常重要的板塊和體現(xiàn)。
杜知恒
過去這一年Agent進(jìn)化還是很明顯的,從大家只會(huì)用Chatbot到真正開始用AI做各種各樣的任務(wù)、工作,包括陪伴式的娛樂、學(xué)習(xí)。
我觀察到在這幾個(gè)場(chǎng)景中,Agent能做越來越多智能化的工作。
第一個(gè)就是剛才說的做PPT、寫產(chǎn)品文檔,包括Coding,在核心工作流中Agent開始能交付實(shí)習(xí)生水平的結(jié)果,這是過去一年中Agent領(lǐng)域非常明顯的進(jìn)步和進(jìn)化。
另外可以看到,各種各樣的垂類軟件正在越來越多地采用AI技術(shù),無論是客服系統(tǒng)、數(shù)據(jù)平臺(tái)還是其他各類軟件工具。我的觀察是,上一代SaaS公司正在快速引入AI能力,這顯著提升了它們服務(wù)客戶的效率與質(zhì)量。
徐達(dá)峰
前面老師提到智能客服,還有端到端多模態(tài)+執(zhí)行,我補(bǔ)充一個(gè)Coding Agent能力方面的個(gè)人觀察。
Coding Agent已經(jīng)從寫一段代碼進(jìn)化為跑一段流程。在WeaveFox的實(shí)踐中,Agent能看懂設(shè)計(jì)稿、理解上下文和組件規(guī)范,然后自動(dòng)生成可上線代碼。過去通常需要工程師在IDE中花半天時(shí)間調(diào)試,現(xiàn)在Agent幾十秒就能跑完。而且這是在多個(gè)規(guī)模化項(xiàng)目里,我們穩(wěn)定看到了3~5倍的效率提升。
![]()
這說明,只要工具鏈和上下文足夠清晰,Agent的能力是可以被“工程化復(fù)制”的
真正好用的AI Agent產(chǎn)品應(yīng)該關(guān)注哪些指標(biāo)?
量子位
今天邀請(qǐng)到的三位嘉賓在AI Agent里面處于不同的生態(tài)位,小宿處于基礎(chǔ)設(shè)施層,另外兩位老師偏向于產(chǎn)品層,請(qǐng)各位在不同的生態(tài)位上定義真的好用、或者有價(jià)值的AI Agent產(chǎn)品,你們覺得現(xiàn)在更應(yīng)該關(guān)注哪些指標(biāo)?有哪些指標(biāo)大家沒有關(guān)注?下一步應(yīng)該在哪些方面投入更多技術(shù)和精力呢?
杜知恒
我的觀點(diǎn)還是一樣的,(如果AI)能更像人一樣,交付一個(gè)從高中生到大學(xué)生到博士生能交付的結(jié)果,這就是好場(chǎng)景。
企業(yè)愿意為這類AI支付更高成本,背后的邏輯很明確:過去,大家把AI當(dāng)作普通軟件看待,關(guān)注點(diǎn)局限在軟件訂閱費(fèi)的高低;而現(xiàn)在,大家會(huì)將其價(jià)值與實(shí)習(xí)生、全職員工的人力價(jià)值做對(duì)比。
即便目前存在堆砌Token完成任務(wù)的爭(zhēng)議,包括我們公司在內(nèi),許多企業(yè)在高頻使用AI進(jìn)行代碼編寫(Coding)、撰寫產(chǎn)品需求文檔(PRD)、搭建各類工作流以優(yōu)化效率的過程中,通過AI節(jié)省的人工成本,也遠(yuǎn)遠(yuǎn)超過了在Token上投入的費(fèi)用,即使Claude Code很貴。
我覺得我們內(nèi)部對(duì)Agent可用性最主要的評(píng)判標(biāo)準(zhǔn),就是它能不能在特定場(chǎng)景交付一個(gè)相對(duì)完整的結(jié)果
Agent在中國被叫智能體,但其實(shí)我覺得“代理人”這個(gè)翻譯是更好的,一個(gè)Agent不能給你交付結(jié)果,你肯定不會(huì)花錢雇他,包括Coding這些場(chǎng)景在內(nèi),AI越來越能夠真正交付結(jié)果。
現(xiàn)在Coding還有抽卡的情況,但即使是抽卡抽三次性價(jià)比依然很高。
趙天成
我們從時(shí)間上來看,有兩方面是整個(gè)業(yè)界要慢慢接受和改變的,因?yàn)橹悄荏w跟以前信息化系統(tǒng)和純粹軟件還是不太一樣的。
第一個(gè)是之前很多人說做AI原生的Agent,我們發(fā)現(xiàn)以前軟件系統(tǒng)有很多UI式、表單式結(jié)構(gòu),很多時(shí)候AI就是把表單的某些環(huán)節(jié)換成模型,這是比較方便的方式,但也有很多時(shí)候換湯不換藥,還是原來的工作流做的事情。
其實(shí)可以把一個(gè)環(huán)節(jié)徹底用Agent代替,這時(shí)候可能會(huì)有一些更加創(chuàng)新型的產(chǎn)品并落地應(yīng)用,這樣才真正能把智能體的優(yōu)勢(shì)發(fā)揮出來,而不是受限于很條條框框的地方,只能做以前一些環(huán)節(jié)的替代。大家(才)會(huì)接受智能體可以真正替代一個(gè)流程一個(gè)環(huán)節(jié),真正用AI的方式做這個(gè)事情。
第二個(gè)是Agent本身是可以進(jìn)化的,在以往的AI應(yīng)用中,包括我們的不少甲方客戶在內(nèi),很多人會(huì)陷入一種認(rèn)知誤區(qū):認(rèn)為采購AI本質(zhì)上就是采購一套算法,并且對(duì)算法的準(zhǔn)確率、召回率有明確要求,若初始階段無法達(dá)到既定指標(biāo),就不會(huì)驗(yàn)收。
但實(shí)際上,Agent的價(jià)值體現(xiàn)在實(shí)際應(yīng)用過程中,Context(上下文信息)會(huì)不斷豐富,它自身具備記憶能力,再結(jié)合用戶給出的反饋,會(huì)逐漸熟悉用戶的業(yè)務(wù)流程,最終真正幫用戶解決實(shí)際問題。然而當(dāng)前許多場(chǎng)景下,用戶并不能接受這種漸進(jìn)式優(yōu)化的模式,他們往往期望一步到位,要求AI在初始階段就達(dá)到95%的準(zhǔn)確率。
這就陷入了“雞生蛋還是蛋生雞”的矛盾問題。如果用戶不使用AI、不提供反饋、不補(bǔ)充Context,不給AI學(xué)習(xí)和適應(yīng)的機(jī)會(huì),AI自然無法達(dá)到理想的使用效果;可用戶又因AI初始效果未達(dá)預(yù)期而不愿啟用,形成了惡性循環(huán)。
不過這種情況也在逐漸改變,越來越多人也正在接受,說明大家用豆包、用GPT,已經(jīng)習(xí)慣了越聊越聰明的交互模式,慢慢(把它)變成自己想要的數(shù)字員工。
這個(gè)可進(jìn)化性也是我們內(nèi)部衡量智能體的非常重要的指標(biāo)。假如一個(gè)智能體做出來就是這樣了,你再跟它聊它都不會(huì)有變化,那就不是好的智能體,如果通過一天、一周、一個(gè)月使用變得更加個(gè)性化了,就是好的智能體。
![]()
量子位
我想再追問一下趙總,您剛剛提到用Agent徹底替代某一部分工作流,或者某一部分工作場(chǎng)景,那讓你暢想一下在未來6個(gè)月或者一年之內(nèi),您覺得會(huì)有哪些行業(yè)或者場(chǎng)景率先有可能被徹底改變工作流呢?
趙天成
假如是6個(gè)月的時(shí)間,在那些失敗結(jié)果沒有那么災(zāi)難性的地方,相關(guān)問題或許可以得到徹底解決。(這些場(chǎng)景的容錯(cuò)空間相對(duì)較大),AI一次沒做好,大不了再做一次,而且如果做三次的成本,比我自己干整個(gè)過程的成本還是低很多,那這類工作就可以被替換掉。
量子位
也就是說結(jié)果不夠致命,有一點(diǎn)容錯(cuò)空間的任務(wù)基本可以實(shí)現(xiàn)AI替代人。
那么徐總,螞蟻目前在做的這些產(chǎn)品,包括您剛才提到的Coding Agent,以及面向群眾的產(chǎn)品,從您的角度來說,一款A(yù)I Agent產(chǎn)品最值得關(guān)注的指標(biāo)是什么呢?
徐達(dá)峰
在我看來,判斷一款A(yù)gent是否優(yōu)秀,可以從以下幾個(gè)角度界定標(biāo)準(zhǔn),比如可控性、可解釋性,乃至于穩(wěn)定性,這是基礎(chǔ)要求,在此就不贅述了。
需要明確的是,Agent一定是基于某一類特定任務(wù)去設(shè)計(jì)的,很多場(chǎng)景里,任務(wù)本身就是開放型問題、還存在各種例外情況,模型也不可能100%完美解決所有問題。所以我認(rèn)為優(yōu)秀的標(biāo)準(zhǔn)是看Agent產(chǎn)品有沒有設(shè)計(jì)人機(jī)協(xié)作的流程
企業(yè)真正需要的不是“永不犯錯(cuò)”,而是犯錯(cuò)時(shí)能暴露不確定性,是否具有回滾的能力,能不能回溯回去找到問題。另外在這個(gè)過程中,在出現(xiàn)問題后,能順暢地將任務(wù)交由人工接管。
也就是說,它要像一位可靠的同事,而不是像一名(缺乏協(xié)作性的)天才小學(xué)生。如果沒有如上指標(biāo),即便效果再驚艷,也很難真正落地,我覺得這是一個(gè)好的Agent的標(biāo)準(zhǔn)指標(biāo)。
量子位
如果把剛剛給趙總的問題再拋給您,目前您涉及的所有用戶場(chǎng)景里,未來6個(gè)月,您覺得哪一個(gè)是被改寫最徹底的?
徐達(dá)峰
徹底不敢談。我認(rèn)為軟件工程可能仍會(huì)面臨較大的沖擊和變革。
這主要是因?yàn)槠涔ぞ哝溝鄬?duì)成熟,有上一代數(shù)字基建作為基礎(chǔ),且任務(wù)本身偏向結(jié)構(gòu)化。
同時(shí),進(jìn)一步自動(dòng)化的收益非常高。這些因素共同作用,將推動(dòng)整個(gè)流程越來越自動(dòng)化,通過輔助編碼和自動(dòng)化流程,研發(fā)團(tuán)隊(duì)也會(huì)更容易接受。因此,我認(rèn)為是軟件工程。
量子位
我們把這個(gè)問題換一個(gè)方向問杜總,您作為基礎(chǔ)設(shè)施層的代表,您認(rèn)為基礎(chǔ)設(shè)施層究竟是如何影響不同AI Agent產(chǎn)品最終呈現(xiàn)的任務(wù)水平呢?能否結(jié)合小宿或其他具體案例,為我們解析一下具體的影響鏈路?
杜知恒
其實(shí)我們很難直接影響到Agent本身,更多是客戶基于自身場(chǎng)景對(duì)基礎(chǔ)設(shè)施提出更高要求,我們?nèi)ロ憫?yīng)和滿足。
回到搜索本身,從ToC時(shí)代到ToAgent時(shí)代,三十年來它的核心標(biāo)準(zhǔn)——相關(guān)性、權(quán)威性、時(shí)效性,本質(zhì)上沒有改變。變化的是這些標(biāo)準(zhǔn)的重要程度。
過去,用戶搜索時(shí)前三條結(jié)果必須吸引點(diǎn)擊,所以相關(guān)性是最重要的指標(biāo)。(但僅有相關(guān)性還不夠)即使內(nèi)容相關(guān)但質(zhì)量很差,排到前面用戶接受的概率,也比展示不相關(guān)信息要低得多。
但對(duì)于AI而言,調(diào)用搜索的核心原因在于消除信息幻覺與獲取時(shí)效內(nèi)容。
對(duì)AI Agent來說,搜索的首要要求是權(quán)威性——信息必須準(zhǔn)確、全面。即便在前十條結(jié)果中,哪怕極端情況下有兩條不相關(guān),也遠(yuǎn)比“十條看似相關(guān)、卻缺乏精準(zhǔn)性和時(shí)效性的信息”要好,后者帶來的后果反而更加災(zāi)難性。
未來還有哪些對(duì)于AI Agent發(fā)展比較關(guān)鍵的卡點(diǎn)?
量子位
我們剛剛幾個(gè)問題都聊的是Agent今天有怎么樣的成就和價(jià)值,那我們現(xiàn)在從批判的角度聊一聊。
首先想問一下,從各位的角度來看,除了現(xiàn)在常說的推理大模型,或者語言大模型,還有哪些對(duì)于AI Agent未來發(fā)展比較關(guān)鍵的卡點(diǎn)?
既可以是技術(shù)方面,也可以是生態(tài)運(yùn)營方面的,不知道各位是怎么看待這個(gè)問題的?
趙天成
我最近比較關(guān)注的是智能體的雙腦架構(gòu)
剛才提到的代碼生成這些創(chuàng)新都是用大語言模型做快速的處理,但是到我們這種物理場(chǎng)景之后,有時(shí)候你逃不掉,必須做雙腦架構(gòu)。
什么叫雙腦?比如大語言模型給出一個(gè)指令,說無人機(jī)幾點(diǎn)幾分到這個(gè)地方去,但是在飛行過程中怎么飛?假如還是依賴云端語言模型思考的話,這個(gè)飛機(jī)干脆不要飛了,每飛5米就要想一想再飛一下,不太現(xiàn)實(shí)。
所以必須在端側(cè)要有快速的、類似于小腦的模型做飛行這一塊的執(zhí)行,這個(gè)就跟常規(guī)的MCP模式還不太一樣,以往云端模型調(diào)用工具,可能只是完成一次搜索、查詢或簡單指令下發(fā);但在雙腦架構(gòu)里,云端大腦調(diào)用的不是普通工具,而是要驅(qū)動(dòng)端側(cè)小腦模型,讓它把飛機(jī)飛過去。
這其實(shí)和目前主流智能體架構(gòu)有區(qū)別,跟學(xué)術(shù)界研究的問題也不太一樣。這里面得有一個(gè)框架,方便把各種小腦和大腦集成在一起,真正形成一個(gè)指揮官和類似于行動(dòng)單元的組合的形態(tài)。
這個(gè)是我們近期一直在看的點(diǎn),因?yàn)楝F(xiàn)在的確碰到了這樣的現(xiàn)實(shí)問題,而且需要解決這些問題。
徐達(dá)峰
我可以補(bǔ)充一個(gè)企業(yè)視角下的觀點(diǎn),Agent如果要在企業(yè)中落地,可能還會(huì)有一些挑戰(zhàn)。尤其是大規(guī)模用在企業(yè)端時(shí),首當(dāng)其沖的可能是會(huì)面臨訪問核心資產(chǎn)數(shù)據(jù),以及隱私和安全審計(jì)問題。
怎么樣能夠讓這樣的Agent可以被安全地運(yùn)行?它訪問數(shù)據(jù)是否有權(quán)限?能不能被審計(jì)?這些都是關(guān)鍵命題。
以往很多流程設(shè)計(jì)更多是針對(duì)常規(guī)系統(tǒng)和人類操作場(chǎng)景設(shè)計(jì)的,很少有為Agent設(shè)計(jì)的,這是很關(guān)鍵的基礎(chǔ)設(shè)施的缺漏。這樣的安全基礎(chǔ)設(shè)施建立起來之后,才可能會(huì)為Agent大規(guī)模落地鋪好前提。
面向Agent的設(shè)計(jì),很可能是權(quán)限體系的重新設(shè)計(jì)和重塑。
![]()
杜知恒
我也說一個(gè)非常現(xiàn)實(shí)的問題,我們看Agent,特別是ToC的Agent最大的挑戰(zhàn)就是成本和ROI的問題。
因?yàn)榧词巩?dāng)下的Agent可以幫你完成一些任務(wù),但其實(shí)它完成任務(wù)所付出的代價(jià)和用戶愿意付的成本還是有一個(gè)很明顯的差距,目前市場(chǎng)上絕大多數(shù)的Agent都是以負(fù)毛利在運(yùn)營,這在長期看來是一個(gè)很大的挑戰(zhàn),因?yàn)槟愫茈y在一個(gè)負(fù)毛利商業(yè)模式下做大規(guī)模的用戶滲透。
除非像螞蟻、字節(jié)這樣的巨頭,可以為獲取客戶長期承擔(dān)非常大規(guī)模的虧損,這個(gè)對(duì)于大部分的Agent創(chuàng)業(yè)者來說可能也是一個(gè)挑戰(zhàn)。所以核心問題就是怎么能把商業(yè)模式跑通,能夠把用掉的Token和工具的錢賺回來?
對(duì)于一個(gè)基礎(chǔ)設(shè)施提供方來說,對(duì)客戶健康度的判斷很重要,如果我的客戶都很賺錢,那我大概率收取的價(jià)格是比較合理且可持續(xù)的,如果所有人都在虧錢,或者說大家都是期待下一輪的融資再來付今天用的基礎(chǔ)設(shè)施的錢,(那么整個(gè)生態(tài)的健康度就會(huì)存疑),對(duì)于我們來說也非常關(guān)心這個(gè)問題。
量子位
有關(guān)產(chǎn)品線的ROI,也想再問一下徐總,您剛剛提到咱們有做一些面向大眾普惠型的產(chǎn)品,像剛剛提到收費(fèi)方面的問題,會(huì)不會(huì)從您的角度來看,為了讓大眾使用AI Agent的產(chǎn)品,除了技術(shù)上要達(dá)成一些目標(biāo),是不是還有其他的要素也需要注意的?
徐達(dá)峰
說一點(diǎn)個(gè)人的粗淺判斷。
首先,使用門檻在產(chǎn)品設(shè)計(jì)上必須足夠低,不能預(yù)設(shè)用戶具備專業(yè)知識(shí)背景,更不能假定他們本身就懂代碼。現(xiàn)實(shí)中,這樣的前提不太可能成立。
其次,更高頻的使用場(chǎng)景,可能集中在文案、PPT等內(nèi)容創(chuàng)作上,其本質(zhì)是信息的聚合、創(chuàng)作過程的協(xié)助,以及后續(xù)內(nèi)容排版等工作。這類場(chǎng)景天然更適合大眾用戶。
此外,還會(huì)出現(xiàn)許多新的特色玩法。比如螞蟻?zhàn)罱l(fā)布的“靈光”產(chǎn)品,就是一款很有意思的App,用戶可以用它制作小游戲、小應(yīng)用,實(shí)用性很強(qiáng)。大致會(huì)是這類產(chǎn)品設(shè)計(jì)方向。
Agent的下一步關(guān)鍵演進(jìn)方向是什么?
量子位
眾所周知,2025年已被視為AI Agent的元年。那么,元年之后下一個(gè)關(guān)鍵的演進(jìn)方向是什么?剛才趙總提到了“雙端”和“多模態(tài)”,我們想請(qǐng)各位具體展望一下,對(duì)于Agent而言,下一步的關(guān)鍵方向是什么?
趙天成
雖然2025年被稱為“智能體元年”,但可能現(xiàn)實(shí)生活中還沒有那么多智能體。今年更像是iPhone 1的階段,距離真正成熟、普及的iPhone 4,還有很多要做的事情
就我個(gè)人在C端的使用體驗(yàn)而言,日常可能會(huì)用一個(gè)類似豆包的智能體,來替代部分搜索類工作,我覺得已經(jīng)達(dá)到了“可用”的水平。但如果是下一輪融資的PPT,讓智能體來完成,即便是現(xiàn)在最好的智能體也做不到,這仍然需要我自己完成大量策略層面的思考,才能有比較好的結(jié)果。
所以在我看來,即使是目前定義已經(jīng)相當(dāng)成熟的智能體,在可靠性和實(shí)際效果上,依然有大量提升空間。
這種提升可能來自基礎(chǔ)模型能力的增強(qiáng),也可能來自工程化能力的改進(jìn),也可能正如前面幾位所提到的,是多個(gè)層面的共同進(jìn)步。
只有這些條件都到位,智能體才能真正把哪怕是“做PPT”這樣看似簡單的功能,提升到一個(gè)全民都能夠使用的水平——這是第一個(gè)方面。
第二個(gè)方面,是我們自己正在做的事情。我們一直相信,如果未來的AI只停留在替代一部分?jǐn)?shù)字化工作,那一定是不夠的。它最終必須能夠替代部分藍(lán)領(lǐng)工作,走向現(xiàn)實(shí)世界,幫我們?cè)谖锢硎澜绺苫睢?/p>
(而要實(shí)現(xiàn)這一點(diǎn)),需要解決的問題依然非常多,包括前面多位老師提到的VLA、世界模型等,這些很可能都是不可或缺的組成部分,只有在它們被有效拼合之后,智能體才有可能真正走向物理世界。
在這里有兩個(gè)關(guān)鍵問題。第一,未來是否會(huì)一直是“大語言模型+其他模型”的組合形式?短期來看大概率如此,但從長期看并不一定——完全有可能被一種全新的架構(gòu)徹底取代,這并非不可能。其實(shí)早兩年我們看待大語言模型時(shí),也曾覺得這條路徑不太可能,但現(xiàn)在它已經(jīng)成為主流。
第二,還是可靠性的問題。(當(dāng)智能體進(jìn)入物理世界),可靠性就變得更加嚴(yán)肅,不能說一下子把桌子砸了,那會(huì)是災(zāi)難性的后果——在電腦里最多是誤刪文件,雖然也很嚴(yán)重,但相比之下還是要輕一些。
因此我認(rèn)為,可靠性是所有智能體真正成為“每個(gè)人每天都在使用”的工具之前,必須解決的核心問題之一
杜知恒
我可能更多是從商業(yè)視角來看這個(gè)問題。對(duì)于2026年,我有幾個(gè)基本預(yù)期。
第一會(huì)是巨頭的大規(guī)模下場(chǎng)
無論是在B端還是C端,都會(huì)出現(xiàn)真正意義上的重投入,去爭(zhēng)奪DAU、ARR和核心客戶。2025年我們已經(jīng)看到,超大規(guī)模投入主要來自字節(jié)的豆包,BAT其他幾家以及螞蟻更多是在下半年才逐漸發(fā)力。
我認(rèn)為到明年,這一趨勢(shì)會(huì)變得非常清晰且激烈——所有Tier 1、Tier 2的傳統(tǒng)大型互聯(lián)網(wǎng)公司,都會(huì)在Agent方向上加大投入,圍繞“入口”展開競(jìng)爭(zhēng)。
第二個(gè)預(yù)期也由此引出:在這種大規(guī)模投入的推動(dòng)下,AI的整體滲透率會(huì)顯著提升
包括現(xiàn)場(chǎng)各位的手機(jī)和電腦,其AI含量也都會(huì)大幅上升。頭部Agent會(huì)開始真正進(jìn)入二線、三線城市,被非專業(yè)用戶廣泛使用,甚至包括我們父母這一代人,也會(huì)逐步開始接受和使用。
因此,在我看來,Agent的大規(guī)模滲透將是2026年我比較期待的事情。
![]()
徐達(dá)峰
如果說未來一年的Agent的話,我可能會(huì)分幾個(gè)層次看。
第一層次是數(shù)據(jù)和算法,再上層是模型能力,可以看到,這兩層的技術(shù)能力呈現(xiàn)慢慢收斂的趨勢(shì)。第三層是Agent的框架,以及和系統(tǒng)交互和集成,無論是C端還是B端,都可以看到有更多的數(shù)據(jù)管控、權(quán)限管控、接入集成等多方面的實(shí)踐。
另外再往上延伸至產(chǎn)品側(cè)與行業(yè)應(yīng)用層面。目前可以看到越來越明顯的趨勢(shì)。
除了能解決一些日常小工具類的任務(wù),或者一些小型的效率場(chǎng)景,也可以看到有一些Killer App(現(xiàn)象級(jí)應(yīng)用)出現(xiàn)。這類應(yīng)用往往會(huì)錨定泛娛樂賽道,給用戶提供很多情緒價(jià)值,甚至慢慢App擴(kuò)展到智能硬件上,這些是能看到的趨勢(shì)。
當(dāng)然,也期待2026年這樣的趨勢(shì)逐步爆發(fā),可以給大家?guī)砀嗟腁I Agent在各行業(yè),各領(lǐng)域的體驗(yàn)。
AI Agent進(jìn)入新發(fā)展階段的標(biāo)志節(jié)點(diǎn)
量子位
最后一個(gè)問題,再替公眾朋友們?cè)噲D向三位嘉賓詢問一下不確定中的確定性。
像剛剛提到,不管是從技術(shù)需要的基礎(chǔ)設(shè)施,還是未來的產(chǎn)品形態(tài),其實(shí)都有可能還有很多新的內(nèi)容出現(xiàn)。
如果從三位嘉賓的角度來看,有沒有哪個(gè)節(jié)點(diǎn)是你們覺得如果看到了就意味著AI Agent已經(jīng)進(jìn)入新的發(fā)展階段了,不是像現(xiàn)在這樣只是從無到有,而是真正徹底改寫,而且普惠大眾的,有沒有哪個(gè)標(biāo)志性的節(jié)點(diǎn)是各位現(xiàn)在最期待的?
杜知恒
可能是我媽媽開始用Manus開始畫PPT或者做一個(gè)什么事情的時(shí)候開始。
我覺得當(dāng)前Agent的滲透率雖然看起來如火如荼,但是在三、四線城市和人們?nèi)粘I钪羞€是一個(gè)超級(jí)低的狀態(tài)。
可能我自己的觀察指標(biāo)是身邊的年長,或者非技術(shù)行業(yè)的人真正開始在用一些Agent,改變他的生活方式,或者提升他的生活體驗(yàn)。
趙天成
我覺得就是當(dāng)你每天最高頻使用的三個(gè)APP里面有兩個(gè)是Agent,到那天可能就差不多了。
徐達(dá)峰
我比較贊同趙天成老師的看法,如果你每天用的軟件都已經(jīng)是Agent,那就已經(jīng)產(chǎn)生質(zhì)變了。
量子位
確實(shí),今年我們看到很多Agent產(chǎn)品出現(xiàn),無論是現(xiàn)場(chǎng)和線上的觀眾可以多去嘗試嘗試不斷出現(xiàn)的新的Agent產(chǎn)品,看這些產(chǎn)品能不能帶來一些新的收獲和新的價(jià)值。
再次感謝三位嘉賓今天來到圓桌,跟我們從一線視角聊一聊AI Agent還需要進(jìn)步的地方,以及現(xiàn)在明確能夠帶給我們的價(jià)值,謝謝大家。
— 完 —





京公網(wǎng)安備 11011402013531號(hào)