文 | 佘宗明
PC互聯網時代的技術主要呈現界面是Web(網頁),移動互聯網時代的是App(客戶端),那AI時代的呢?
比爾·蓋茨兩年前的預言,就給出了答案:AI Agent將是AI最大的賽道,“Agent(智能體)不僅將改變人們與計算機的互動方式,還將顛覆軟件行業,引發自鍵入命令到點擊圖標以來計算機領域最大的革命。”
如果說彼時他的這番斷言還有些超前,那如今“AI Agent時代已來”漸成共識的現實,就是跟他打了個響指。
3個月前,微軟CEO納德拉就在微軟2025年Build大會上表示:“我們已經進入了AI Agent時代,正在見證AI系統如何以全新方式幫助我們解決問題。”
有意思的是,當時還跟納德拉進行了連線的馬斯克,旗下AI公司xAI前不久還準備籌建名字內涵微軟(Microsoft)的子公司巨硬(MacroHard),定位于打造AI Agent生態。
在硅谷掀起“最炫Agent風”之際,大洋彼岸的中國科技企業也正以前瞻的技術布局與獨特的技術路徑,在這場決定未來若干年AI應用生態格局的賽道上積極卡位,努力將身位從追趕者變為領跑者。
01
回顧現代技術演進史,技術發展總是遵循著“技術突破-產業聚焦-場景落地”的路徑,AI也不例外。
2023年初,ChatGPT出圈揭開了AI大模型軍備競賽的序幕,兩年多過去了,在“Agent元年”說法的掩映下,全球科技巨頭競爭焦點正從大模型參數轉向Agent。
原因很簡單:隨著大模型參數規模擴大帶來的邊際效益遞減,如何讓AI從“被動響應工具”變成“主動規劃執行者”,已成行業新命題。而Agent就是AI從“感知智能”邁向“認知智能”的關鍵載體,也是連接大模型技術與真實場景的核心橋梁。
作為能自主理解任務、規劃步驟、調用工具的AI應用形態,Agent可以讓AI不再是孤立的技術模塊,而是能深度嵌入企業運營系統的“生產力單元”,解決傳統AI應用場景碎片化、投入產出比低等問題,推動AI技術在產業側的應用落地。
在硅谷,OpenAI在GPT-4之后,迅速推出GPT-4o Agent,試圖通過連接代碼解釋器、網頁瀏覽器等工具,打破大模型“只能對話不能行動”的局限;微軟則將Copilot深度集成于Windows系統與Office全家桶,提出“Agent for Everyone”戰略;谷歌則押注“多智能體協作”,發布了Gemini Agent Suite。
▲國內外科技巨頭們都在發力AI Agent。
在國內,科技企業也在加碼發力。動作最大的,當數百度:從2024年發布文心智能體平臺AgentBuilder,到今年4月推出全球首個內容操作系統“滄舟OS”、先發在行業內率先實現全場景滿足、全鏈路覆蓋的AI Agent GenFlow1.0、上線通用超級智能體App心響,百度在Agent賽道的深耕軌跡清晰可見。
8月18日的百度AIDAY上,百度文庫與百度網盤又聯合發布了全球首個全端通用AI Agent GenFlow2.0,以“全端通用”“并行任務”“記憶可溯”等突破性進展,為國產AI在全球Agent領域的競爭注入了強勁動力。
這極具默契的轉向背后,是AI產業對AI價值的認知再校準:AI的價值不在于炫技,而在于應用。AI時代,企業需要的是能自動生成財報、拆解項目計劃的AI助手,個人需要的是能同步處理郵件、整理資料的AI助力,這些都在倒逼AI從“能說會道”向“能做會干”進化。
02
盡管被寄予厚望之下,AI Agent迎來了爆發之勢,但不得不說,當前行業仍面臨著理想與現實的鴻溝:市面上多數Agent產品還停留在“單輪對話+插件”階段,并沒邁過從實驗室玩具到生產力工具的那道門檻。
今年4月,Gartner就發布報告稱,市場上正充斥著所謂的“智能體洗牌”現象,即廠商將普通AI助手或ChatBot重新包裝為“智能體”,但這些產品實際缺乏真正的自主智能能力。
揆諸現實,當下很多Agent跟用戶現實期待仍有不小差距,這具體反映在幾個方面:
1,任務拆解能力不足。許多Agent在處理復雜任務時,會出現邏輯斷裂。
你讓它“生成新能源汽車市場季度分析報告,需包含政策分析、競品數據和趨勢預測”,它可能要么遺漏“政策分析”等關鍵模塊,要么將“競品數據”局限于單一品牌,最終產出的結果經常需要人工大幅修改。
這是因為當前很多Agent的任務規劃算法仍依賴簡單的規則匹配,缺乏對復雜需求的深度理解與動態調整能力,無法像人那樣將復雜目標拆解為“數據采集—分析建模—內容生成—格式轉換”等有序子任務。
2,結果質量不可控。不少Agent生成的內容,動輒存在低級錯誤。
我曾用某教育類Agent幫我生成講座課件,結果PPT中出現了“媒介即訊息是尼爾·波茲曼提出”的結論。
根源在于,這些Agent缺乏專業知識庫,無法安全訪問私域資源(導致內容片面),只能依賴自身大模型訓練數據(導致信息滯后)。
3,效率與協作存在瓶頸。有些Agent處理跨領域復雜任務,非但耗時久還易卡殼,有些還無法與用戶現有工具(如文檔、云盤、專業軟件)無縫對接,儼然成了信息孤島。
說白了,是因為這些Agent太依賴單個模型能力和串行工作模式,難以應對多任務并行、動態調整等需求。
▲市面上的大多數Agent都存在諸多能力的不足。
理論上講,Agent應該像擁有超能力的AI管家,接到任務后會先畫思維導圖(規劃),再檢查步驟對不對(驗證),然后有條不紊地執行。它長著數字眼睛,能“認路避障”(環境感知),帶著AI大腦,能權衡利弊(自主決策),揣著工具百寶箱,能“訂票叫車”(工具調用),還能有始有終(完成任務閉環)。
可太多Agent不是視障就是智障,可用性、穩定性都不如人意。這就導致,企業將核心業務、重要任務交給Agent處理的意愿不足。
諸如此類的痛點,對應的其實是行業的機會窗口。在Agent競速進入深水區的背景下,誰能率先解決可用性、穩定性、資源整合等問題,誰就能在Agent時代建立起技術與生態的雙重壁壘,掌握定義行業標準的主動權。而GenFlow2.0的解決痛點導向,就來得很明晰。
03
跟時下那些只能跑在網頁或客戶端上,還得有邀請碼或內測資格才能用的Agent有別,百度文庫GenFlow2.0有兩個典型特征:一是全端通用;二是現貨可用。
目前它已同步上線百度文庫網頁端、百度文庫APP,用戶無需排隊等待,就能開箱即用。
我在移動端試用時,發現它還有個很人性化的地方——將傳統“瀑布流”任務展示改為“并列式”進度可視化,我下達指令后,能直觀看到每個Agent的分工(如A Agent負責數據搜索、B Agent負責PPT生成)。
我體驗完后的內心os是:百度該給產品經理加雞腿了。比起滾動條沒完沒了地下拉,這樣操作才更切合普通用戶日常習慣吧?
值得注意的是,全球“首個全端通用Agent”并非GenFlow2.0的唯一優點——它直接來了幾個行業首發,包括并行模式、記憶模式和全程可干預模式。
▲我使用GenFlow分析2024年至2025年Agent市場格局演變時,中途就暫停補充了新要求。
先說并行模式。我讓GenFlow2.0分析2025年Agent市場格局,生成對比表格并制作競品分析PPT,它會自動調度“市場分析Agent”“數據可視化Agent”“PPT生成Agent”“網盤檢索Agent”等多個專家級Agent并行工作,而非逐一處理。
據了解,GenFlow2.0依托百度文庫、網盤自研的Multi-Agent基礎架構,可開啟“100+專家Agent并行處理”式的多智能體協同作戰,讓AI執行任務從得慢慢等變成立等可取,實現了分鐘級交付(多項復雜任務3分鐘就可完成),提升了效率天花板。
再說記憶模式。我前幾天就讓GenFlow2.0幫我生成過Agent技術發展路徑分析,今天又要求它“分析2025年Agent市場格局”,它會自動調用歷史數據,無需再次闡述問題背景,避免重復勞動。
這背后是GenFlow2.0首創了“長-短-臨”三級記憶中樞,可在多輪任務中記住用戶對話、操作偏好、文件交互記錄、修改痕跡等,實現“越用越懂你”。
接著說全程可干預模式。我在GenFlow2.0生成內容時,中途提出“加入2024年Agent市場格局情況”,它會立即調整,把我說的“聽”進去。
這也是文庫GenFlow2.0跟其他Agent的區別所在:一般Agent都是“寫 prompt(提示詞)→漫長等待→發現不對→重寫 prompt→新一輪等待”,它是“說一句→看著它干→隨時改→立等可取”,其實時干預功能允許用戶在任務流任何節點暫停、回退、補充指令或追加文件。
這些突破,顯然不只是單點技術升級。
04
AI技術進步固然不是線性化的,而是指數級的,但絕不會是平地起高樓。GenFlow2.0能攬下Agent領域的很多“首個”,離不開“專項積累+生態協同+全棧布局”三個維度的支撐。
從專項積累看,百度對Agent的探索早已形成累進式突破。
百度文庫中PPT、繪本、生圖、研究報告等單一Agent在垂直場景的成功,為滄舟OS和GenFlow1.0首次實現多Agent基礎調度做了鋪墊,也讓GenFlow2.0實現“從可用到好用”的跨越有了支點。
可以說,GenFlow2.0 的發布并非“從 0 到 1”,而是“從 100 到 1”——把上百個經過市場驗證的成熟 Agent 裝進同一個“航母戰斗群”,“專項突破—系統整合—體驗升級”的路徑也由此成型。
從生態協同看,GenFlow2.0構建起“百度自有生態+第三方合作生態”的雙循環。
在百度體系內,它跟文庫網盤的“三庫(文庫公域專業資料庫+經用戶授權的網盤私域數據庫+用戶記憶庫)一平臺(百度學術平臺)三器(閱讀器、編輯器、播放器)”充分打通,跟蘿卜快跑(智能出行)、數字人直播(內容創作)、秒噠(無代碼開發)等產品深度聯動。
你讓它生成“十一假期出游計劃”,系統可自動調用百度地圖生成可交互的行程H5,同步通過蘿卜快跑預約接送機服務。
▲FenFlow2.0離不開百度AI全棧布局的支撐,又跟百度其他AI產品形成了聯動。
在外部生態上,GenFlow2.0兼容MCP協議,榮耀 MagicOS 已原生接入,用戶可在手機負一屏一鍵調用其能力,實現“手機端生成PPT—平板端編輯—電腦端演示”的全場景流轉;WPS、釘釘、飛書也在灰度測試。
MCP協議的開放性,讓 GenFlow2.0 能像樂高積木那樣被嵌入任何應用,讓其多重能力不再局限于單一應用,而是滲透到用戶的生活與工作全場景中。
從全棧布局看,百度的全棧AI能力為GenFlow2.0提供了底部支撐。
從芯片層的昆侖芯(能提供算力支持),到框架層的飛槳(保障多Agent調度效率),再到模型層的文心大模型(有混合專家模型架構、有多模態理解能力),百度是全球少數實現AI全棧自研的企業。全棧技術沉淀,托起了“端到端優化”的閉環。
05
歷史不會重復,但總會押韻。二十多年前,Windows把DOS從命令行變成圖標;十多年前,iOS/Android把鍵盤變成觸控;而在今天,Agent又帶來了新人機交互方式與任務執行模式。
接下來,誰能用兼具可用性、穩定性的Agent產品更好地解決用戶需求、占領用戶心智,誰就能拿到下個十年的門票。
而今,GenFlow2.0就有了Android昔日的模樣:Android早些年就把硬件、應用、服務統一在 Linux 內核之上,形成了深厚生態壁壘,GenFlow2.0現在則是把算力、模型、數據、Agent、人統一在自然語言這個最樸素接口之上。
對用戶而言,當辦成很多任務只用一句語音而非復雜操作,那AI的實用價值也就能得到最大化發掘。這里的實用性,本是立足于對用戶需求的深刻洞悉,最終會落腳于對用戶體驗的深層革新。
▲AI Agent,最重要的是實用好用。
這類革新,既會形塑用戶對Agent的新期待,也會重塑中國在Agent領域的競爭力。
全球Agent競爭已陷入白熱化境地,硅谷巨頭們就在試圖將PC、移動互聯網時代的卡位優勢復制到Agent中。
在此形勢下,GenFlow2.0多重突破的價值已超出技術升級本身,為國產AI在Agent領域實現能力趕超、標準引領提供了參照系,也積攢了籌碼。
跟OpenAI的Agent生態側重于通用能力、微軟的側重于辦公體系不同,百度GenFlow2.0全端通用帶來的多場景無縫切換便利+公私域知識融合帶來的數據安全可控特點+并行處理、記憶可溯、全程可干預帶來的效率提升效果,證明了國產Agent可以有自己的創新引領點和差異化優勢,具備變成跟OpenAI、微軟和谷歌們抗衡的全球生產力平臺。
可以預見,在不久的將來,超級好用的Agent在改變那塊名叫“AI應用”的大洋地殼彈性后,AI的潮汐會以新節奏漫過每一道我們習以為常的堤岸。讓我們且看,且期待。





京公網安備 11011402013531號