亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

斯坦福7B智能體全面超越GPT-4o,推理流登頂HF

IP屬地 中國·北京 新智元 時間:2025-11-03 18:18:33


新智元報道

編輯:LRST

傳統智能體系統難以兼顧穩定性和學習能力,斯坦福等學者提出AgentFlow框架,通過模塊化和實時強化學習,在推理中持續優化策略,并使小規模模型在多項任務中超越GPT-4o,為AI發展開辟新思路。

當前AI Agent的發展正陷入兩難的境地:

一方面,訓練「全能型」大模型讓其同時承擔推理、規劃與工具調用,雖具一體化優勢,但在長鏈推理中往往訓練不穩定、擴展性受限;

另一方面,基于prompt的智能體系統雖具靈活性,卻缺乏學習與自我優化能力,無法從交互中持續進化。

如何突破這一瓶頸?

斯坦福大學聯合德州農工大學(Texas A&M)、加州大學圣地亞哥分校(UC San Diego)和Lambda的研究團隊給出了新答案:讓智能體系統在推理「流」中進行在線強化學習,從而實現持續的自我提升與能力進化。


論文地址:https://arxiv.org/abs/2510.05592

項目主頁:https://agentflow.stanford.edu/

開源代碼:https://github.com/lupantech/AgentFlow

在線展示:https://huggingface.co/spaces/AgentFlow/agentflow

視頻教程:https://www.youtube.com/watch?v=kIQbCQIH1SI

他們提出AgentFlow框架采用模塊化架構,通過4個專門化智能體協同工作,配合專門設計的Flow-GRPO算法,使系統能夠在真實交互環境中持續優化決策策略。


實驗結果顯示,僅7B參數的AgentFlow在搜索、數學、科學等多個任務上全面超越GPT-4o(約200B參數)和 Llama-3.1-405B。

團隊負責人在推特上分享了工作,獲得了極大的關注。





該工作目前已登上HuggingFace Paper日榜第二名,以及周最火Huggingface 項目。



長鏈推理中的信用分配難題

訓練智能體系統面臨的核心挑戰是多輪信用分配(multi-turn credit assignment)問題:在長時跨度、獎勵稀疏的環境中,如何準確判斷每一步決策對最終結果的貢獻?


傳統的單一模型方法將所有功能集成在一個LLM中,通過特殊標簽(如 )一體化輸出思考、工具調用和回復。

這種方式在短鏈任務中有效,但在復雜場景下容易出現:推理鏈過長導致訓練不穩定、工具選擇錯誤難以追溯、無法根據環境反饋動態調整策略。

而現有的智能體系統(如 LangGraph、OWL、Pydantic、AutoGen)雖然實現了模塊化,但大多依賴固定的 prompt 工程,缺乏從經驗中學習的機制。

AgentFlow多模塊實時交互

在「流」中學習

AgentFlow的設計思路是:將復雜的推理任務分解給專門化的智能體模塊,同時讓核心決策模塊能夠在交互中持續學習。


四模塊協同架構

系統由四個具備記憶能力的專門化智能體組成:

規劃器(Action Planner):分析任務需求,制定執行策略,選擇最合適的工具。這是系統的核心決策模塊,也是唯一需要訓練的部分。

執行器(Tool Executor):負責實際調用工具API,整合工具返回結果。

驗證器(Verifier):基于系統累積的歷史記憶,評估中間結果是否符合任務目標和約束條件。

生成器(Generator):整合所有信息和驗證反饋,生成最終答案或下一步行動建議。

關鍵創新在于:規劃器不是靜態的,而是通過在線(on-policy)強化學習在推理流中實時優化。

每輪交互后,系統會根據最終結果的成功或失敗,更新規劃器的決策策略,并將優化結果整合到系統記憶中,形成閉環的自適應學習過程。

Flow-GRPO算法

解決信用分配問題

團隊提出Flow-GRPO(Flow-based Group Relative Policy Optimization)算法,專門針對多輪推理場景設計。核心思想是將軌跡最終的獎勵信號(成功/失?。V播到每一步動作,把復雜的多輪強化學習問題轉化為一系列單輪策略更新。



具體做法是:

1. 收集完整的推理軌跡(從初始任務到最終結果);

2. 根據最終結果計算 outcome reward;

3. 將這個 reward 分配給軌跡中每個規劃動作;

4. 使用相對優勢函數計算每個動作的優勢,進行策略梯度更新。

這種方法有效緩解了獎勵稀疏問題,同時保持了訓練的穩定性。

在線學習使系統能夠:快速糾正錯誤的工具調用、探索更優的子任務分解方式、根據環境反饋動態調整推理深度。

實驗結果:小模型的逆襲

研究團隊在10個跨領域基準上進行了系統評測,覆蓋知識檢索、智能體任務、數學推理和科學推理四大類。

性能對比

以Qwen-2.5-7B-Instruct為基座模型,AgentFlow 在所有類別中均顯著領先。

知識檢索:相比基線提升14.9%

智能體推理:提升14.0%

數學推理:提升14.5%

科學推理:提升4.1%

更令人驚訝的是跨規模對比結果:

7B的AgentFlow在搜索任務上比GPT-4o(約200B)高8.2%

在智能體任務上比Llama-3.1-405B高15.8%

3B模型的AgentFlow也能在多項任務中超越405B的基線模型



消融實驗的關鍵發現

1. 在線學習 vs 離線學習

對比實驗顯示,如果用傳統SFT方式訓練規劃器,性能反而會平均下降19%。這證明在真實交互環境中的在線學習是實現高效推理的必要條件。


2. 自主探索新策略

根據任務特點選擇合適的工具組合;同時,經過訓練的系統會自發探索出新的工具使用模式,比如組合使用維基百科搜索(Wikipedia Search) 和特定網頁增強搜索(Web Search)的連招,通過工具鏈獲得更加深入地信息挖掘,而這些模式幾乎沒有在未訓練的推理流中出現。


3. 動態推理深度

在多跳搜索等密集推理任務中,訓練后的AgentFlow展現出「智能的懶惰」:對簡單任務保持較少的推理步數,對復雜任務才會增加推理深度。

隨著最大步數限制的提升,性能穩步上升但平均步數不會同比例增長。



4. 模塊協作的價值

雖然推理流本身就能帶來性能提升,但未經訓練的系統容易出現循環錯誤或卡頓。

通過強化學習訓練后,系統在工具調用準確性、子任務規劃精細度和全局性能上都有明顯改善。作者團隊提供過了一個例子來生動展示了在實驗中的有趣發現。


在這個例子中,在經過Flow-GRPO訓練前的推理系統,一旦遇到了諸如這里的python變量定義錯誤,便會反復輸出相同的子目標和工具調用,極大地浪費時間和推理效率。

在經過Flow-GRPO在線更新后,動作規劃器能夠根據之前的錯誤自動調整用更確切的子目標和任務描述來指導后續步驟,并且經過這樣的隨機應變后,一步成功。

這個例子也極大程度展現了,在智能體系統真實推理中進行強化學習的極大潛力。

技術意義與未來展望

AgentFlow的工作價值在于:

1. 提供了新的訓練范式證明了智能體系統可以通過在線強化學習獲得類似大模型的學習能力,且在特定任務上效率更高。

2. 驗證了「小而精」的可行性在合理的系統設計下,小模型通過模塊化協作和持續學習,可以在復雜推理任務中超越大規模通用模型。

3. 為可擴展AI提供思路模塊化架構使得系統可以靈活添加新工具、調整模塊功能。

AgentFlow至少讓我們看到:Agentic AI的發展不必完全依賴模型規模的堆砌,系統架構創新+高效訓練方法可能是更值得探索的方向。

參考資料:

https://arxiv.org/abs/2510.05592

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

亚洲电影第1页| 中文字幕55页| 亚洲色偷精品一区二区三区| 中文字幕亚洲综合| 在线观看国产网站| 亚洲国产日韩在线一区模特| 一区二区三区四区五区精品| 日韩av一区二区在线影视| 中文字幕一区电影| 免费视频91蜜桃| 午夜精品久久久久久久久| 国产欧美综合一区| 国产精品亚洲一区二区三区在线 | 国产精品无码乱伦| 激情综合亚洲精品| 国产不卡在线观看| 貂蝉被到爽流白浆在线观看| 欧美视频日韩视频| 国产免费xxx| 99视频有精品| 91视频婷婷| 亚洲精华国产精华精华液网站 | 亚洲字幕在线观看| 欧美性猛交xxxx乱大交hd | 九色成人免费视频| 黄色一级片在线| 亚洲成人999| 亚洲天堂网站在线| 国产精品久久久久久久久免费丝袜| 国产亚洲欧美一区二区| 无码视频一区二区三区| 在线日韩第一页| 欧美三级 欧美一级| 日韩一区二区精品葵司在线| 香港三日本8a三级少妇三级99 | 欧美大片顶级少妇| 亚洲男人天堂2021| 色94色欧美sute亚洲线路二| 日韩久久一级片| 久久一二三国产| 欧美日韩视频免费在线观看| 青青青伊人色综合久久| 国产精品一区二| 日本激情视频网站| 国产精品一区二区女厕厕| 亚洲精品一区二区三区蜜桃| 久久久久九九九九| 国产污污视频在线观看| 九九热精品视频国产| 久久精品一二区| 亚洲视频在线免费观看| 人妻熟人中文字幕一区二区| 亚洲激情免费观看| 久操免费在线视频| 欧美国产日韩精品| 在线观看亚洲天堂| 上原亚衣av一区二区三区| 99久久精品国产亚洲| 久久久成人精品| 一级黄色片在线| 午夜精品久久久久久99热| 国产av精国产传媒| 99九九电视剧免费观看| 视频一区二区中文字幕| 久久天堂国产精品| 美女一区二区三区| 一区二区三区四区不卡| 久久久久国产精品免费免费搜索| 欧美极品少妇无套实战| 国产精品午夜免费| theporn国产精品| 亚洲成在人线av| 欧美日韩三级在线观看| 久久久久久久香蕉网| 好吊色视频一区二区| 亚洲综合成人婷婷小说| 国产精品99久久久久久久vr| 久久人人爽人人爽人人av| 色综合中文综合网| 中国xxxx性xxxx产国| 337p亚洲精品色噜噜狠狠| 欧美人妻一区二区| 欧美成人激情视频| 亚洲色图欧美视频| 国产日产精品一区二区三区四区| 精品午夜久久福利影院| 国产成人亚洲综合无码| 亚洲欧洲日本在线| 操人视频免费看| 精品久久五月天| 日本三级一区二区三区| 国产亚洲精品美女久久久m| 成人晚上爱看视频| 午夜久久久精品| 日韩av在线免费看| 一级片免费在线播放| 国产精品白嫩初高中害羞小美女| 日韩中文字幕1| 亚洲人精品午夜射精日韩| 狠狠躁夜夜躁久久躁别揉| 婷婷伊人五月天| 国产精品日韩在线观看| 国产精品亚洲一区二区三区妖精| 国产精品亚洲a| 亚洲成色777777在线观看影院| 免费中文字幕视频| 亚洲一区二区自拍| 亚洲色图.com| 中文字幕xxx| 午夜精品久久久久久久久久久久| 国产伦精一区二区三区| 国产婷婷一区二区三区| 精品久久久久久综合日本欧美| 欧美黑人一区二区| 久久影院理伦片| 一区二区三区丝袜| 麻豆成人在线视频| 国产一区高清视频| 一区二区三区精品在线观看| 国产一区二区视频在线观看免费| 91中文精品字幕在线视频| 久久亚洲捆绑美女| 亚洲黄色小说视频| 热久久99这里有精品| 国产精品热久久久久夜色精品三区 | 亚洲国内精品视频| 视频一区视频二区中文| www午夜视频| 欧美高清视频免费观看| 韩日av一区二区| av漫画在线观看| 国产成人高潮免费观看精品| 成人免费毛片嘿嘿连载视频| 欧美一级片黄色| 国产精品一香蕉国产线看观看| 久久麻豆一区二区| 国产精品无码专区| 国产美女搞久久| 香蕉加勒比综合久久| 东方av正在进入| 欧美一区二区视频17c | 久久精品国产欧美亚洲人人爽| 激情六月婷婷久久| 国产一级二级在线观看| 91在线免费视频| 精品国产鲁一鲁一区二区张丽| 无码人妻av免费一区二区三区| 日韩亚洲视频| 日韩av在线免播放器| 国产成人亚洲精品狼色在线| 朝桐光av一区二区三区| 2021国产精品视频| 一级精品视频在线观看宜春院| 日本少妇aaa| 亚洲国产欧美日韩| 日韩免费高清视频| 经典一区二区三区| 性xxxxxxxxx| 99久久综合狠狠综合久久止| 6080日韩午夜伦伦午夜伦| 99久久久无码国产精品免费| 一路向西2在线观看| 久久久久久久久久久成人| 亚洲色图欧美在线| 国产深喉视频一区二区| 女人扒开屁股爽桶30分钟| 欧美专区第一页| 一区二区三区影院| 国产无码精品在线播放| 亚洲熟妇无码av在线播放| 亚洲人av在线影院| 夫妻av一区二区| 亚洲一级片在线播放| 一区二区精品在线| www.日韩免费| 一区二区三区鲁丝不卡| 日本成人一级片| 第四色婷婷基地| 91在线精品视频| 精品国产一二三区| 久久久五月婷婷| av免费观看国产| 亚洲精品高清在线| 亚洲在线观看av| 国产精品97在线| 国产精品嫩草影院一区二区| 欧美日韩在线直播| 日本免费新一区视频| 亚洲色图第四色| 成年在线观看视频| 欧美激情一级二级| 亚洲欧美激情视频在线观看一区二区三区 | 日韩精品在线播放| 久久色在线视频| 一本色道久久综合精品婷婷| 男人网站在线观看| 一本色道婷婷久久欧美| 韩国一区二区电影| 欧美精选一区二区| 91免费观看在线| 欧美日韩综合一区二区三区| 香蕉视频xxxx| 中文字幕99| 91精品国产色综合久久不卡98| 欧美色老头old∨ideo| 国产一区二区三区在线观看免费| 五月婷婷开心网| 亚洲精品无码久久久久久久| 欧美精品v日韩精品v国产精品| 最近2019年日本中文免费字幕| 中文字幕一区二区三区在线播放 | 97netav| 久久视频在线视频| 欧美日韩精品免费| 国产精品女主播av| 日本黄色一区二区三区| 我不卡一区二区| 50路60路老熟妇啪啪| 成人中文字幕+乱码+中文字幕| 亚洲人成电影网站色xx| 亚洲一区二区三区视频在线| 国产精品综合av一区二区国产馆| 免费视频一二三区| 国产小视频精品| 亚洲一区三区视频在线观看| 国产美女精彩久久| 在线精品播放av| 欧美日韩视频第一区| 日韩一区在线播放| 粉嫩av一区二区三区| 二区三区在线视频| 粉嫩aⅴ一区二区三区| 欧美性生交xxxxx| 亚洲 欧美 日韩 国产综合 在线| 国产在线视频欧美| 欧美丰满少妇xxxxx| 欧美一级一区二区| 亚洲成人在线观看视频| 国产亚洲污的网站| 久久久久99| 亚洲一区二区色| 精品视频久久久久| 无码人妻丰满熟妇啪啪网站| 中文字幕日韩一区二区三区不卡| 91福利入口| 日韩av理论片| 欧美国产日韩在线| 伊人久久久久久久久久久| 欧美日韩国产综合久久| 亚洲精品写真福利| 久久久青草青青国产亚洲免观| 精品一区免费av| 久久中文在线| 99久久国产免费| 欧美日韩a v| 欧美三级韩国三级日本三斤在线观看 | 欧美贵妇videos办公室| 日韩电影中文字幕av| 欧美一区二区视频观看视频 | 国产麻豆日韩| 国产一区二区在线免费| 性色av一区二区三区在线观看| 亚洲国产女人aaa毛片在线| 欧美卡1卡2卡| 亚洲1区2区3区视频| 亚洲激情在线激情| 亚洲特黄一级片| 国产精品久久久久久妇女6080 | 成人一区二区三区仙踪林| 亚洲36d大奶网| www在线观看免费| 女人被男人躁得好爽免费视频| 波多野结衣三级在线| 日韩aⅴ视频一区二区三区| 精品国产乱码久久久久软件| 国产精品免费区二区三区观看 | 九九热视频在线免费观看| 精品无码在线观看| 成人在线手机视频| 99久久99久久精品免费| www.色天使| 亚洲黄色小说视频| 中文在线永久免费观看| 久久一区二区电影| av网站免费在线看| 国精产品视频一二二区| 国产三级视频网站| www色com| 久久午夜鲁丝片午夜精品| 可以免费看的av毛片| 成人黄色激情视频| 国产免费无遮挡| 国产美女www爽爽爽视频| 中文字幕一级片| 国产丰满美女做爰| 亚洲色图欧美视频| 久久久久久夜| 国产毛片精品视频| 成人免费福利片| 中文成人av在线| 尤物在线观看一区| 一本色道久久综合亚洲精品按摩| 欧美午夜片在线观看| 91极品美女在线| 精品免费国产二区三区| 中文字幕亚洲无线码a| 欧美激情一区二区三区在线视频观看| 国模吧一区二区三区| 国产精品综合久久久| 亚洲已满18点击进入在线看片| 亚洲综合大片69999| 色之综合天天综合色天天棕色| 日本人妻伦在线中文字幕| 秋霞无码一区二区| 黄色片免费网址| 成人无码www在线看免费| 9999热视频| 亚洲午夜精品久久久| 不卡的日韩av| 免费高清视频精品| 久久影院午夜论| 亚洲人成网站影音先锋播放| 狠狠做深爱婷婷久久综合一区| 欧美刺激脚交jootjob| 在线观看欧美日韩| 欧美性视频网站| 精品蜜桃一区二区三区| 免费超爽大片黄| 日本五十肥熟交尾| 男女啊啊啊视频| 国产伦理吴梦梦伦理| 国产一区二区免费视频| 亚洲免费在线看| 日韩三级中文字幕| 欧美二区在线播放| 国产一区二区丝袜高跟鞋图片| 亚洲三级一区| 亚洲一级片av| 九九视频免费在线观看| 亚洲av无码片一区二区三区| 波多野结衣视频一区| 夜夜嗨av一区二区三区四季av | 狠狠狠色丁香婷婷综合久久五月| 国产午夜精品久久| 欧美日韩中文字幕日韩欧美| 亚洲欧美日本精品| 国产精品美女无圣光视频| 免费av一区二区三区| 天堂网在线免费观看| 久久黄色小视频| 亚洲a视频在线| 波多野结衣中文一区| 在线观看区一区二| 色悠悠久久88| 成人免费网站在线观看| 蜜臀av色欲a片无码精品一区 | 99久久er热在这里只有精品15| 色婷婷av一区二区三区gif| 亚洲欧美在线看| 成人在线视频福利| 激情五月开心婷婷| 婷婷社区五月天| 日韩国产欧美在线视频| 亚洲黄色片在线观看| 在线视频中文亚洲| 亚洲aa在线观看| 免费在线观看亚洲视频| 久久久久久视频| 亚洲av片在线观看| 亚洲图片欧美一区| 欧美精品免费在线| 欧美精品欧美精品| 国产黑丝一区二区| 国产精品高潮呻吟久久久| 日本一区免费视频| 亚洲欧美www| 快播亚洲色图| 欧美一级免费在线| 国产又黄又爽视频| 中文字幕一区二区三区不卡 | 成人av在线天堂| 天堂视频免费看| 亚洲最新av网站| 91丨porny丨蝌蚪视频| 91精品在线免费| 日本久久精品视频| 精品人妻一区二区三区四区在线| 国产精品2020| 99精品桃花视频在线观看| 亚洲精品电影久久久| 95av在线视频| 国产伦精品一区三区精东| 欧美一级做性受免费大片免费| 国产精品视频一区二区三区不卡| 亚洲成人精品视频在线观看| 国产综合欧美在线看| 影音先锋资源av| 成人激情四射网| 欧美视频13p| 国产欧美精品久久久| 亚洲欧美日韩一级| www.色播.com| 日本高清免费不卡视频| 日本亚洲精品在线观看| 丝袜制服一区二区三区| 国产情侣一区二区| 色一情一伦一子一伦一区| 国产成人a亚洲精品| 农村末发育av片一区二区| 日韩中文字幕一区二区三区|