亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

AI在線強化學習“邊做邊學”,斯坦福團隊讓7B小模型性能飆升

IP屬地 中國·北京 量子位 時間:2025-10-24 14:12:13

允中 發自 凹非寺
量子位 | 公眾號 QbitAI

斯坦福等新框架,用在線強化學習讓智能體系統“以小搏大”,領先GPT-4o——

AgentFlow,是一種能夠在線優化智能體系統的新范式,可以持續提升智能體系統對于復雜問題的推理能力

它由規劃器、執行器、驗證器、生成器四個專業智能體組成的團隊通過共享內存進行協作,利用新方法Flow-GRPO,在系統內部直接對其規劃器智能體進行實時優化。



以Qwen-2.5-7B-Instruct為基座模型的AgentFlow在10個基準測試中表現突出:

搜索任務提升14.9%、智能體任務提升14.0%、數學任務提升14.5%、科學任務提升4.1%。

多項任務表現甚至超越比其大50倍的模型,超越GPT-4o、Llama3.1-405B。



AgentFlow發布后,受到業界不少廣泛關注與看好。



網友紛紛表示方向很棒:

多智能體流(multi-agentflow)給人的感覺就像“相位耦合推理”(phase-coupled reasoning)。很期待看到“協同能力”取代“規模”,成為衡量智能的指標。



Flow-GRPO采用共享內存的多智能體架構設計精妙。其中驗證智能體對幻覺化工具調用的阻斷機制尤為關鍵——它能顯著減少智能體工作流中典型的多步推理鏈誤差傳播。



所以,AgentFlow究竟長啥樣?



工具集成的智能體系統+流中強化學習訓練

自“AI下半場”開啟以來,智能體(Agent)在垂直領域與通用場景中呈現出井噴式發展。然而,在復雜決策與持續優化能力方面,當前智能體仍存在一定局限。如何將智能體的推理能力與強化學習的自我進化機制深度融合,成為突破這一瓶頸的關鍵所在。

在今年早些時候,隨著DeepSeek-R1的發布,推理模型的訓練方式迎來了新的啟發。不久之后,伊利諾伊大學香檳分校(UIUC)發布Search-R1,系統揭示了如何通過強化學習,訓練能夠自主推理并調用外部工具的推理模型(Tool-Integrated Reasoning Models)。

而在此之前,智能體系統(Agentic System)的發展也從系統層面推動了智能體協作與可擴展性的提升,為后續相關研究奠定了堅實基礎。

例如,LangGraph、PydanticAI、OWL等框架在智能體通信、任務規劃與工具調用等方面進行了多樣化的探索,為智能體生態的快速演進提供了有力支撐。



而AgentFlow提出了一種新范式,其中由四個具備記憶能力的專門化智能體協同配合:

規劃器負責分析任務并選擇工具,執行器調用工具并整合結果,驗證器基于累積記憶評估中間結果,生成器整合信息生成最終答案。



對于每個新任務,規劃器在智能體交互的“流”中根據環境變化及其他智能體的反饋實時進行on-policy優化,各模塊在推理流中協同演化并不斷調整決策策略。這些優化隨后被整合到系統的記憶中,形成一個閉環的自適應推理過程,使整個智能體系統在復雜環境下實現魯棒的工具調用與持續進化。

其中,AgentFlow包含了以下幾個關鍵組件:

模塊化智能體結構。

AgentFlow采用了四個具備記憶能力的專門化智能體協同配合,共同完成復雜推理,從而實現“即時學習”:

(i)規劃器(Action Planner):分析任務、制定策略并選擇最合適的工具;
(ii)執行器(Tool Executor):調用工具集并整合工具執行結果;
(iii)驗證器(Verifier):基于系統維護的累積記憶評估中間結果是否滿足目標與約束;
(iv)生成器(Generator):整合所有信息與驗證反饋,生成最終答案或行動建議。

AgentFlow流中強化學習。

AgentFlow的關鍵創新在于:規劃器(Planner)并非固定不變,而是能夠在智能體交互的”流”(flow)中實時進行on-policy優化,使決策過程隨著環境變化及其他智能體的反饋不斷自適應進化。集成過程分為三個步驟:(i)環境感知與記憶檢索,(ii)動作規劃與工具選擇,(iii)策略優化與記憶更新。

Flow-GRPO:流中強化學習優化算法。

實現智能體流中強化學習訓練的核心挑戰在于多輪信用分配(multi-turn credit assignment):即如何在長時跨度(long-horizon)且獎勵稀疏(sparse reward)的條件下,穩定且高效地訓練。為此團隊提出動作級別的(Action Level)的多輪推理優化目標。



如圖2所示,通過將軌跡最終結果的成功或失敗信號(outcome reward)廣播至每一步,將原本復雜的多輪強化學習問題轉化為一系列可處理的單輪策略更新。該方法不僅緩解了獎勵稀疏問題,還顯著提升了訓練效率,為智能體在復雜多輪推理中的穩定學習提供了基礎。



實驗結果

為了充分評估AgentFlow的泛化能力與高效性,研究團隊在10個跨各個領域的基準測試上進行了系統評測,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。



以Qwen-2.5-7B-Instruct為基座模型的AgentFlow在各項基準上均超越現有領先方法:

知識檢索(Search):提升14.9%智能體推理(Agentic Reasoning):提升14.0%數學推理(Math):提升14.5%科學推理(Science):提升4.1%

值得注意的是,AgentFlow的表現甚至超過了大規模的專有模型,如GPT-4o(~200B)。





表1、2展示了AgentFlow在不同類型任務上的評估結果,表明了在有效性(相對提高高達14.9%)和效率(平均推理步數優化)上均優于基準方法。

研究團隊在10個基準測試上進行了評估,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。一些有趣的發現:

1、模型規模不是唯一答案

使用7B參數的AgentFlow在多個任務上超過了約200B參數的GPT-4o,Llama3.1-405B,在搜索任務上領先8.2%,在智能體任務上領先15.8%。這再一次展現了,合理的系統設計和訓練方法可能比單純堆砌參數訓練All in one的大模型更有效。

2、“在流中學習”至關重要

對比實驗顯示,若采用離線監督學習(SFT)方式訓練規劃器,性能反而顯著下降,平均降低19%。

這表明,智能體在真實交互環境“流”中進行在線學習是實現高效推理的必要條件。

此外,盡管AgentFlow的推理流本身能夠利用其強大的任務分解能力帶來顯著性能提升,但仍可能出現循環錯誤或卡頓問題。通過在真實環境中的訓練,智能體系統展現出快速修正錯誤的工具調用、更精細的子任務規劃,以及全局任務解決性能的提升。

這些結果進一步證明了模塊協作機制以及流中強化學習在提升多輪智能體系統穩定性與效率方面的顯著作用。





3、自主發現新的解決路徑

有意思的是,經過Flow-GRPO的強化訓練規劃器,系統學會了根據任務特點選擇合適的工具組合;同時,經過訓練的系統會自發探索出新的工具使用模式,比如組合使用維基百科搜索(Wikipedia Search)和特定網頁增強搜索(Web Search)的連招,通過工具鏈獲得更加深入地信息挖掘,而這些模式幾乎沒有在未訓練的推理流中出現。



4、動態推理深度與性能提升

對于相同的數據集下的不同難度任務:譬如說多跳搜索(Multihop Search),智能體任務中的密集長鏈推理任務,AgentFlow在經過 FlowGRPO訓練后能夠隨著最大限制推理步數的上升穩步提升性能,同時又不會大幅提升平均推理步數——這表示對于長難任務會增加有效的推理步數來提升正確率,而不會一味地所有任務都隨著最大輪數限制而延長推理步數。





總之,AgentFlow為智能體訓練提供了一種全新的思路:

與其追求一個功能完備的單一大語言模型或“一次性完美”的智能體系統,不如讓智能體在系統中自我適應與持續學習。

通過將群體智能與“邊做邊學”的范式相結合,AgentFlow使智能體系統能夠在協同演化中不斷優化,從而高效應對復雜任務。

盡管從研究探索到實際應用仍有較長的距離,但這讓團隊看見Agentic AI依然蘊藏著巨大的潛力與想象空間。

論文地址:https://arxiv.org/abs/2510.05592
項目主頁:https://agentflow.stanford.edu/
Github倉庫:https://github.com/lupantech/AgentFlow
在線Demo:https://huggingface.co/spaces/AgentFlow/agentflow
YouTube視頻:https://www.youtube.com/watch?v=kIQbCQIH1SI

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

日韩在线播放一区| 高清一区二区三区视频| 国产破处视频在线观看| 亚洲免费在线视频| 欧美一级日本a级v片| 韩国av在线免费观看| 中文字幕欧美国内| 超碰人人干人人| 国产真实乱子伦| 国产精品无码一区| 亚洲高清中文字幕| 成人免费视频网| 香蕉视频xxx| 日本va欧美va精品| 97色在线视频| 色婷婷国产精品综合在线观看| 亚洲专区在线视频| av老司机久久| 久久久这里只有精品视频| 久草成人在线视频| 精品亚洲国产视频| 亚洲一级片在线播放| 91麻豆精品国产91久久久使用方法| 污污网站在线观看视频| 一区二区三区久久| 欧美黄色一级片视频| 久久精品人人做人人爽人人| 少妇免费毛片久久久久久久久| 国内精品自线一区二区三区视频| 亚洲一区免费网站| 丝袜亚洲另类丝袜在线| 91超碰在线免费观看| 囯产精品久久久久久| 欧美亚洲国产日本| 国产麻豆精品一区| 日本不卡高字幕在线2019| 亚洲性猛交富婆| 欧美国产日韩一区二区| 日本中文字幕久久| 欧美国产精品va在线观看| 精品成人无码久久久久久| 久久99精品久久久久久噜噜 | 97超视频免费观看| 欧美主播一区二区三区| 好吊色欧美一区二区三区视频| 亚洲一级片免费看| 中文字幕国产亚洲| 在线看黄色的网站| 午夜精品久久久久久久久久久 | 精品国产一区二区三区无码| 亚洲国产av一区二区| 91精品国产91久久久久| 国产三级小视频| 国产精品九九九| 久热精品视频| 久久精品国产一区二区三区日韩| 国产精品一区二区久久不卡| 亚洲午夜高清视频| 中文字幕的久久| 秋霞无码一区二区| 一区二区三区免费在线观看| 午夜激情av在线| 色婷婷综合久久久中文一区二区| 无码av免费精品一区二区三区| 日韩欧美精品在线| 亚洲a∨无码无在线观看| 中文字幕不卡在线视频极品| 日本黄色中文字幕| 国产女同一区二区| 国产剧情一区二区三区| 一级性生活视频| 亚洲精品国产高清久久伦理二区| 午夜剧场高清版免费观看 | 欧美人狂配大交3d怪物一区| 国产一区二区三区视频播放| 久久国产精品视频| 精品欧美一区二区精品少妇| 国产精品果冻传媒潘| 99视频一区二区| 欧美黄网站在线观看| 日本黄色一区二区| 在线观看天堂av| 欧美激情aaaa| 男人的j进女人的j一区| 成人在线免费观看网址| 婷婷久久综合九色综合绿巨人| 日韩精品国产一区| 永久555www成人免费| 国产色综合视频| 欧美另类视频在线| 亚洲免费观看在线视频| 成人手机在线免费视频| 久久久av一区| 日本不卡一二三区黄网| 屁屁影院ccyy国产第一页| 日本韩国欧美一区| 精品视频久久久久| 国产精品中文字幕在线| 99久久国产综合色|国产精品| www黄色在线| 日韩免费电影一区| 中文字幕一区二区人妻痴汉电车| 国内精品久久国产| 亚洲久草在线视频| 欧洲美一区二区三区亚洲| 欧美激情视频播放| 国产一区二区三区黄视频 | www一区二区www免费| 欧美久久免费观看| 亚洲精品国产精品乱码视色| 久久久www免费人成黑人精品| 亚洲精品日韩专区silk| 三级黄色在线观看| 国产在线精品一区免费香蕉 | 午夜视频久久久久久| 九九热视频精品| 91在线无精精品一区二区| 中文字幕一区不卡| 欧日韩不卡视频| 成人国产在线视频| 高清在线观看免费| 欧美片在线播放| 男人插女人视频在线观看| 久久亚洲综合网| 欧美视频精品一区| 国产福利在线观看视频| 久久久亚洲国产| 国产精品一区二区无线| 欧美一级视频在线播放| 欧美精品一区二区在线播放| www视频在线| 在线成人av电影| 欧美日韩美女一区二区| 少妇影院在线观看| 欧美诱惑福利视频| 亚洲精品网站在线| 91天堂在线视频| 亚洲一线二线三线久久久| 国产精品久久久久久久久久久久久久久久久| 国产精品久久国产精品| 欧美人xxxx| 在线精品免费视| 人妻av中文系列| 亚洲欧美日韩久久久久久| 色婷婷国产精品| 国产69精品久久99不卡| 人禽交欧美网站| 青娱乐精品视频| 久久久久99人妻一区二区三区 | 在线精品国产欧美| 精品视频在线观看日韩| 日韩国产精品视频| 国产亚洲一级高清| 在线播放91灌醉迷j高跟美女| av成人老司机| 美女国产一区二区三区| 亚洲一二区在线观看| 7777精品久久久大香线蕉小说| 亚洲人成亚洲人成在线观看| 精品国产sm最大网站免费看| 美女高潮久久久| 激情无码人妻又粗又大| 麻豆91av| 欧美高清第一页| 亚洲精品国产成人久久av盗摄| 中文字幕av网站| 亚欧美在线观看| 成人午夜一级二级三级| 日韩电影网在线| 中文字幕日韩av资源站| 久久午夜免费视频| 中文字幕1区2区| 国产成人精品久久久| 欧美精选午夜久久久乱码6080| 精品美女www爽爽爽视频| 好色先生视频污| 色小说视频一区| 亚洲国产精品久久人人爱蜜臀| 日韩精品电影在线观看| 中国毛片直接看| 国产97色在线 | 日韩| 国产精品扒开腿做| 亚洲人成在线观看| 亚洲欧美精品午睡沙发| 色综合久久中文字幕综合网| 久久五月天综合| 水蜜桃色314在线观看| 国产一级二级毛片| 中文字幕第一区第二区| 久久精品久久久久| 成人在线中文字幕| 香蕉视频免费版| 午夜诱惑痒痒网| 日韩成年人视频| 尤蜜粉嫩av国产一区二区三区| 国产国语老龄妇女a片| 国产av人人夜夜澡人人爽麻豆| 亚洲韩国在线| 久久国产视频精品| 高清在线不卡av| 亚洲一区免费观看| 国模一区二区三区白浆| 欧美电影一区二区三区| 狠狠色狠狠色综合日日五| 风间由美性色一区二区三区| 99久久一区二区| av大片免费在线观看| 亚洲第九十七页| 天天躁日日躁狠狠躁av| 国产成人综合一区| 9l视频自拍9l视频自拍| 成人一区二区在线| 亚洲sss综合天堂久久| 国产精品第8页| 欧美成人精品xxx| 午夜精品久久久久久久男人的天堂 | 午夜精品www| 亚洲精品视频自拍| 国产精品网站导航| 亚洲一二三区视频在线观看| 日韩中文字幕av| 中文字幕在线观看一区二区三区| 99久久综合网| 国产jzjzjz丝袜老师水多| 国产精品一二二区| 成人福利视频在线| 蜜臀av亚洲一区中文字幕| 亚洲图片欧洲图片av| 成人精品久久久| 国产精品自拍偷拍| 国产精品久久久久久免费观看| 成人黄色免费片| 国产伦精品一区二区三区免费视频 | 欧美视频观看一区| 丝袜一区二区三区| 91精品国产色综合久久不卡98口| 欧美激情按摩在线| 日本一区二区精品视频| 制服国产精品| 国产精品视频网站在线观看| 91香蕉视频免费看| 中文字幕人妻一区二| 888奇米影视| 国产精品一二一区| 国产一区二区三区在线看麻豆| 国产精品情趣视频| 欧美成人合集magnet| 91超薄肉色丝袜交足高跟凉鞋| 久久99精品久久久久| 国产一区二区三区在线观看视频 | 久久精品三级视频| 国产剧情一区在线| 亚洲国产成人精品久久| 国产精品网红直播| 一起操在线视频| 国产午夜麻豆影院在线观看| 国产日韩欧美高清在线| 欧美成人精精品一区二区频| 一本久久精品一区二区| 日韩一区二区欧美| 欧美一区二区三区电影在线观看 | 一本一道综合狠狠老| 精品久久久久一区| 91国产美女视频| 亚洲一区二区三区香蕉| 欧美视频免费播放| 青青青视频在线免费观看| 亚洲最大成人网站| aaa国产视频| 色悠悠久久综合| 欧美激情久久久久| 亚洲免费看av| 91精品国产乱码久久久久| 亚洲一区成人在线| 国产成人亚洲精品| 中文字幕一二三区| 亚州av在线播放| 亚洲国语精品自产拍在线观看| 成人午夜免费剧场| 91香蕉视频在线播放| 国产麻豆91精品| 亚洲精品videossex少妇| 国产精品亚洲激情| 一区二区av| 欧美成人精品欧美一级| 国产伦精品一区二区三区在线观看| 欧美私人免费视频| 色一情一乱一伦一区二区三区丨| 国产精品久久久久久久久久久久久久久久久久| 亚洲第一区在线| 欧美少妇一级片| 秋霞欧美在线观看| 日韩成人高清视频| 精品人妻伦一区二区三区久久| 成人av在线影院| 麻豆国产va免费精品高清在线| 男女啪啪免费视频网站| 国产精品久久久久精| 一区二区三区视频在线看| 91免费看蜜桃| 亚洲不卡的av| 久久美女高清视频| 欧美猛男性生活免费| jizzjizz国产精品喷水| 国产99对白在线播放| 6080yy午夜一二三区久久| 日韩成人在线资源| 波多野结衣电影在线播放| 日本韩国一区二区| 亚洲精品高清视频| 国产免费不卡av| 日韩你懂的电影在线观看| 日韩啊v在线| 人人干人人干人人干| 欧美午夜无遮挡| 久久精精品视频| 久久艹免费视频| 欧美男生操女生| 日本a在线天堂| 天天干,夜夜爽| 日韩一区二区福利| 精品国产乱码久久久久久1区二区| 国产在线国偷精品免费看| 操日韩av在线电影| 亚洲 欧美 日韩在线| 91视视频在线观看入口直接观看www| 78m国产成人精品视频| 蜜臀久久99精品久久久久久| 中文字幕日韩欧美一区二区三区| 国产精品久久网| 啦啦啦免费高清视频在线观看| 91精品啪在线观看国产60岁| 黄色免费视频大全| 国产电影一区二区三区| 中文字幕无线精品亚洲乱码一区 | 五月天六月丁香| 一区二区三区在线不卡| 中文字幕制服丝袜在线| 国产一区二区美女诱惑| 91天堂在线观看| av中文字幕第一页| 欧美高清第一页| 在线观看免费av片| 亚洲色图18p| 免费看一级黄色| 69成人精品免费视频| jizzjizzxxxx| 中文字幕日韩av资源站| 99re99热| 91免费在线视频观看| 日韩一区不卡| 成人丝袜18视频在线观看| 欧美中日韩一区二区三区| 国产美女久久久久| 激情五月综合色婷婷一区二区 | 亚洲精品在线观看免费| 久久国产精品99久久久久久老狼 | 午夜视频网站在线观看| 久久久久久久久中文字幕| 亚洲 欧美 成人| 美女视频黄免费的亚洲男人天堂| 午夜精品三级久久久有码| 日韩专区中文字幕| 亚洲欧美综合另类| 欧美成人久久久| 久久久黄色大片| 欧美最猛黑人xxxx黑人猛叫黄| jlzzjlzz亚洲女人18| 91久久嫩草影院一区二区| 经典三级在线一区| 日本成人性视频| 亚洲成av人片在www色猫咪| 丝袜老师办公室里做好紧好爽| 亚洲一区免费观看| 亚洲av无码一区二区三区观看| 亚洲电影天堂av| 中文字幕av影院| 91欧美日韩一区| 久久精品视频在线看| 黄色片久久久久| 欧美巨大另类极品videosbest| 精品无码在线观看| 欧美激情va永久在线播放| 日韩高清中文字幕一区| 中文字幕欧美日韩一区二区| 欧美激情一二三区| 师生出轨h灌满了1v1| 亚洲精品在线91| 石原莉奈在线亚洲三区| 欧美这里只有精品| 日韩一区二区三区在线观看 | 99re在线观看视频| 亚洲欧美在线视频| www.日本高清视频| 国产精品久久久91| 国产精品久久久久久久蜜臀| theav精尽人亡av| 国内精久久久久久久久久人| 国产99久久精品| 亚洲图片综合网| 国产99久久精品一区二区| 久久免费视频色| 人妻av无码一区二区三区| 亚洲18私人小影院| 久久久精品国产免费观看同学| 一级黄色性视频| 91视频在线免费观看| 精品久久久久久亚洲国产300| 在线视频一区二区三区四区| 亚洲v日韩v欧美v综合|