![]()
機器之心報道
編輯:澤南
從「執(zhí)行者」到「發(fā)明家」,AI 進化的幅度又加快了。
這就是未來解決難題的方式?
只要你輸入自然語言指令和必要的數(shù)據(jù),一群智能體就可以針對復(fù)雜問題設(shè)立項目進行研究,自己去尋找解法。

不論是金融、交通還是港口物流領(lǐng)域,人類專家需要幾十天才能完成的工作,使用 AI 智能體只需要幾天甚至幾小時,還能找出更優(yōu)的解法。


這一系列效率的提升,都來自于昨天百度世界大會上新發(fā)布的全球首個可商用、自我演化超級智能體百度伐謀,由百度智能云團隊打造。目前,伐謀已正式對外開放,并通過邀請碼的形式提供服務(wù)。
在大會現(xiàn)場,李彥宏表示,這是一個全新的、能自我進化的智能體,能夠在各種重要工業(yè)應(yīng)用場景中自動找出全局最優(yōu)解,「只要問題的解法是明確可驗證的,伐謀就可以模擬甚至超越頂尖的算法專家。」

從入門的代碼生成,到高階的全業(yè)務(wù)流程優(yōu)化,ChatGPT 出現(xiàn)還沒滿三年,AI 就已經(jīng)實現(xiàn)了能力維度上的擴展,實現(xiàn)了從「執(zhí)行指令」到「自主發(fā)現(xiàn)」的跨越,甚至還能發(fā)現(xiàn)人類無法想到的解決方案。
四大核心技術(shù)
打造 AI 優(yōu)化引擎標(biāo)桿
伐謀是一個讓 AI 算法自主進化、尋找全局最優(yōu)的多智能體系統(tǒng),可以高效率地解決高難度的問題。它結(jié)合了大語言模型和進化搜索算法,旨在通過大語言模型的推理能力與大規(guī)模進化搜索來解決復(fù)雜的現(xiàn)實世界問題。
面對現(xiàn)實世界的復(fù)雜問題,如何能讓 AI 代替算法工程師來尋找解法,并進行調(diào)優(yōu),是一個很有挑戰(zhàn)的任務(wù)。
百度智能云團隊發(fā)布了伐謀(FM Agent)的技術(shù)報告,我們可以從中了解其主要的技術(shù)特點。
![]()
伐謀系統(tǒng)在處理復(fù)雜算法問題時的工作流程。
技術(shù)報告鏈接:https://arxiv.org/abs/2510.26144
整體來看,伐謀具備跨領(lǐng)域、端到端的自動化問題求解能力,涵蓋以下四大場景:
機器學(xué)習(xí)——包括自動化特征工程、特征組合、模型融合;可實現(xiàn)端到端構(gòu)建機器學(xué)習(xí)流程,無需人工干預(yù)。組合優(yōu)化——可以自主設(shè)計啟發(fā)式算法、增強傳統(tǒng)求解器(如 MIP、CP)的能力,直接生成高質(zhì)量解。GPU 內(nèi)核生成——能自動優(yōu)化 CUDA 內(nèi)核,提升計算效率,在 KernelBench 上實現(xiàn) 2 倍到 20 倍的加速。數(shù)學(xué)問題求解——在圓填充、不確定性不等式、距離比最小化等問題中達到 SOTA;可以結(jié)合符號推理與進行數(shù)值優(yōu)化。
在工作的整體邏輯上,伐謀在收到指令后首先使用智能體尋找算法,選擇優(yōu)勢品種進行進化,在這其中應(yīng)用的方法既包括經(jīng)典的專家策略,也有 AI 搜索,在這之后,生成的方法會被組合成為一個復(fù)雜的 prompt 交給大模型,形成一個新算法。新的算法會交給到人類寫好的評估器上判斷質(zhì)量,打分會作為依據(jù)交給下一輪的再采樣生成。
在技術(shù)方面,伐謀具有四大核心技術(shù)特點:
首先是冷啟動初始化,伐謀使用多個生成智能體并行構(gòu)建高質(zhì)量、多樣化的初始解集,可以利用「專家引導(dǎo)」模式加速收斂。其次是自適應(yīng)多樣性采樣,伐謀的 Agent 會使用多島嶼并行的方式進化模型,每個島嶼獨立演化,通過動態(tài)調(diào)整探索與利用的平衡,避免早熟收斂。這是關(guān)鍵的一步,可以快速生成多樣性的方法。在生成解法后,領(lǐng)域?qū)S迷u估器會對生成功能的正確性、運行效率、LLM 質(zhì)量進行判斷,支持多維度的反饋。最后,伐謀依托的分布式異步基礎(chǔ)設(shè)施基于 Ray 框架,支持大規(guī)模的并行演化。
使用昆侖芯一體機進行運算,難度較大的任務(wù)可能需要數(shù)十小時、幾天的求解時間,簡單的任務(wù)可能只需要幾小時。
報告顯示,伐謀在多個領(lǐng)域都有出色的表現(xiàn),在多個權(quán)威基準(zhǔn)測試中都取得了領(lǐng)先的性能。在 MLE-Bench 上達到了 43.56% 的獎牌率,比人類中位數(shù)高出 51.56%;在 ALE-Bench 上得分為 1976.3,比專門設(shè)計的 ALE-Agent 高出 5.2%;在 KernelBench 上則實現(xiàn)了 2.08 到 20.77 倍的加速比。
![]()
需要注意的是,所有實驗均是全自動運行的,沒有人類干預(yù)。伐謀在打榜時也沒有針對 Benchmark 進行針對性的優(yōu)化。
目前能看到一些學(xué)術(shù)上的同類工作,大多集中于單點問題上,而如何在實際場景中解決問題、提升效率,才是伐謀關(guān)注的重點。伐謀的產(chǎn)品負責(zé)人表示,伐謀在很多一個月才能解決的復(fù)雜問題上優(yōu)勢更大。
如果做一個比喻的話,在各行各業(yè)的專家團隊中,應(yīng)用 AI 以前需要專家團隊自己來寫算法,應(yīng)用伐謀之后,相當(dāng)于有了數(shù)倍的算法工程師一起來寫算法,他們能夠生成的算法水平更好。
另外,隨著業(yè)務(wù)的落地,AI 生成的方法可以持續(xù)進行動態(tài)調(diào)整,打磨出更好的效果。可以說,伐謀不僅推動了智能體的技術(shù)發(fā)展,也為企業(yè) AI 技術(shù)落地提供了可行的工程范本。
面向產(chǎn)業(yè)級應(yīng)用
AI 自主優(yōu)化引擎,已在大規(guī)模落地
作為面向?qū)嶋H的 AI 優(yōu)化引擎,伐謀在很多行業(yè)生產(chǎn)、研發(fā)場景中的重要環(huán)節(jié)上都能展現(xiàn)能力,它能夠自動將實際問題抽象成數(shù)學(xué)算法問題進行解決。
在這個過程中,AI 提出的評估指標(biāo)明確,產(chǎn)生的解決方案價值很高,而且可以持續(xù)迭代優(yōu)化。伐謀能夠搞定的領(lǐng)域包括但不限于:路徑規(guī)劃、過程控制、排產(chǎn)調(diào)度、資源優(yōu)化、機器學(xué)習(xí)和性能優(yōu)化。
![]()
輸入必要的數(shù)據(jù)并使用自然語言給出指令,伐謀就可以對問題進行準(zhǔn)確的理解,自行提出思路進行解決和優(yōu)化。伐謀利用大語言模型作為核心,并支持代碼生成,可以修改代碼文件。在生成解決路徑的過程中,伐謀擅長于平衡對新算法的探索,在生成解法的過程中鼓勵多樣性。
它會使用自動化評估機制對生成的程序進行評分,這些評估結(jié)果也會被用于指導(dǎo)后續(xù)的代碼生成。這樣,就形成了一個「抽象 - 建模 - 演化」的智能閉環(huán)。
百度的工程師表示,伐謀旨在解決那些難度極大、人類解決得不太好的問題。基于人類專家們的知識,伐謀的自動輸出就像是給人類智慧進行了 Scaling Up。
目前,伐謀已經(jīng)在很多場景中展示了能力:
在金融領(lǐng)域,伐謀在中信百信銀行的風(fēng)控特征挖掘與建設(shè)的過程中獲得了驗證,其提出的方法將風(fēng)險區(qū)分度提升了 2.41%,處理速度還比常規(guī)方法更快,特征挖掘效率提升了 100%。在城市交通領(lǐng)域,伐謀通過對于上千紅綠燈的大規(guī)模優(yōu)化求解,能夠精準(zhǔn)找到紅綠燈配時的「全局最優(yōu)解」,提升了整體交通效率。在超級工程領(lǐng)域,面對海上風(fēng)電「三維迷宮」般的電纜布置難題,伐謀產(chǎn)出高質(zhì)量的優(yōu)化方案,找到了比人工設(shè)計更短的電纜路徑,項目交付節(jié)省數(shù)倍時間。伐謀還正在水務(wù)、物流、能源等領(lǐng)域中進行測試,預(yù)期可以在很多環(huán)節(jié)中實現(xiàn)優(yōu)化,進而降低能耗,提升工作效率。
此外在 AI 的性能優(yōu)化上,百度正在利用伐謀優(yōu)化 LayerNorm、FlashAttention 等 CUDA 算法,據(jù)說比 PyTorch 官方實現(xiàn)的速度還要更快。
隨著大模型分析、推理能力提升,我們可以逐漸地把評估,Coding 等任務(wù)交給 AI。解決復(fù)雜問題的多個步驟,現(xiàn)在可以被智能體加外部環(huán)境構(gòu)成的系統(tǒng)進行接管。
一個新的范式正在逐漸形成 —— 由人類來定義問題,發(fā)現(xiàn)和抽象需求,AI 來負責(zé)進行實踐。
進化式智能體
AI 發(fā)展新趨勢
在 AI 前沿領(lǐng)域,能夠進化式編程的智能體已經(jīng)成為新的發(fā)展方向。利用 AI 大模型的能力,多智能體系統(tǒng)能夠自主生成、測試并迭代優(yōu)化算法,甚至發(fā)現(xiàn)全新的算法,這標(biāo)志著 AI 在算法優(yōu)化和編程領(lǐng)域邁出了突破性的一步。
相比于基于數(shù)學(xué)、運籌學(xué)的求解器與單一大模型系統(tǒng),自主優(yōu)化的智能體可以解決更多、更復(fù)雜的問題,提出創(chuàng)新形式的解法,同時還降低了對于使用者專業(yè)知識的門檻。
其中的典型就是今年 5 月谷歌 DeepMind 發(fā)布的 AlphaEvolve,這是一款用于發(fā)現(xiàn)和優(yōu)化通用算法的平臺,基于 Gemini 大語言模型與進化算法策略開發(fā),具備自主生成和優(yōu)化通用算法的能力。AlphaEvolve 正式發(fā)布之前,谷歌已經(jīng)在內(nèi)部進行了落地,它能把大模型加速注意力算法 FlashAttention 的核心效率提升 32.5%,還優(yōu)化了 50 年沒有改進的矩陣最佳算法。
![]()
AlphaEvolve 幫助谷歌構(gòu)建了更高效的數(shù)字生態(tài)系統(tǒng),從數(shù)據(jù)中心調(diào)度、硬件設(shè)計到 AI 模型訓(xùn)練都有涉足。
上周,著名數(shù)學(xué)家陶哲軒在其新研究中展示了 AlphaEvolve 自主發(fā)現(xiàn)數(shù)學(xué)構(gòu)造的能力,AI 方法推動了人們對長期未解數(shù)學(xué)難題的理解。
可見,在一些真實世界的復(fù)雜任務(wù)上,智能體已經(jīng)可以幫助人們高效率地解決問題了。如果這種技術(shù)大規(guī)模應(yīng)用,可以在很多領(lǐng)域上為人們帶來生產(chǎn)力的提升。
不過,此前我們看到 AI 解決復(fù)雜問題的能力,主要面向的是科學(xué)研究領(lǐng)域,而百度新發(fā)布的伐謀作為全球首個同類商業(yè)化產(chǎn)品,更加面向行業(yè),還做到了更全面、更加自動化。
AI 革新生產(chǎn)力
布局才剛剛展開
李彥宏表示:「當(dāng) AI 能力被內(nèi)化,成為一種原生的能力,智能就不再是成本,而是生產(chǎn)力。AI 能夠提升決策質(zhì)量、發(fā)現(xiàn)新增長點,讓成本更低、利潤率更高、創(chuàng)新周期更短。」
不論是從技術(shù)角度,還是從實用的角度看,伐謀都是一款通用、強大且可擴展的智能體框架,引領(lǐng)了目前 AI 大規(guī)模技術(shù)落地的前沿方向。
如今,智能體正在從與我們「對話」走向幫我們「決策」。從已經(jīng)出現(xiàn)的落地案例來看,還有很多各行各業(yè)的關(guān)鍵生產(chǎn)環(huán)節(jié)有能被 AI 優(yōu)化的潛力。
在百度看來,目前基于 AI 的自主優(yōu)化引擎僅僅處于落地的初期。隨著標(biāo)桿客戶的驗證,AI 的優(yōu)化能力會在業(yè)務(wù)鏈條上的每個環(huán)節(jié)上逐漸顯現(xiàn)。
伐謀的能力,將會服務(wù)于千行百業(yè)。
據(jù)百度介紹,百度伐謀發(fā)布首日已經(jīng)吸引了超 1000 家企業(yè)申請接入測試,覆蓋交通、能源、金融、物流等行業(yè)。目前百度伐謀測試名額持續(xù)開放中,首批將通過邀請碼形式優(yōu)先向具有高復(fù)雜決策需求的企業(yè)開放。





京公網(wǎng)安備 11011402013531號