亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

全面戰勝ReAct!斯坦福全新智能體推理框架,性能提升112.5%

IP屬地 中國·北京 新智元 時間:2025-12-02 12:19:14


新智元報道

編輯:LRST

斯坦福和MIT的研究團隊推出了一種新的AI智能體推理框架ReCAP,在長上下文任務中全面超越了現有的主流框架ReAct,性能提升顯著。ReCAP通過獨特的遞歸樹結構和三大機制,解決了大語言模型在復雜任務中常見的目標漂移、上下文斷層和成本爆炸等問題。在多項基準測試中,ReCAP均取得了大幅領先的成績,展現出強大的通用性和穩定性。盡管計算成本略有增加,但其在關鍵任務中的表現使其成為極具潛力的新一代通用推理架構。

自2022年ReAct框架提出以來,AI智能體推理領域便進入了百家爭鳴的時代,各種復雜架構如雨后春筍般涌現。

然而,這些架構大多曇花一現,因其復雜的結構導致在更換評測基準時需要大幅修改示例,表現遠不如ReAct穩定泛用,這也使得ReAct在過去三年中,成為了該領域事實上的主流與標桿。

但是,我們真的不能再做得更好了嗎?

面對大模型在長上下文任務中走幾步就忘的短期記憶頑疾,業界是否只能止步于此?

來自斯坦福大學與MIT的研究團隊給出了肯定答案,正式發布的AI Agent推理新框架——ReCAP(遞歸上下文感知推理與規劃),從真正意義上統一了序列推理和層級推理,在多種任務中全面戰勝了ReAct,且繼承了ReAct示例簡單、高通用性,和即插即用的優勢。


論文鏈接:https://arxiv.org/pdf/2510.23822

在嚴格遵循 pass@1(一次通過)的評測原則下,ReCAP在長序列具身任務Robotouille上相比ReAct基線取得了84.2%(同步)和112.5%(異步)的巨大性能提升。

長上下文任務的三大「死穴」

團隊指出,當今大語言模型在執行復雜任務時普遍有三種問題:

目標漂移(Goal Drift):執行幾步后就逐漸忽略了原本的目標,使得執行結果與期望不符。

上下文斷層(Context Loss):高層的規劃信息在長序列執行中丟失,導致高層思考與低層執行不協調。

成本爆炸(prompt Explosion):每次遞歸都重新鋪開上下文示例和提示詞,推理成本指數增長。


簡單說,LLM就像一個短期記憶型天才,而主流推理框架各有局限:

序列推理(例如Chain of Thoughts,ReAct)雖然上下文連貫,但常常因為任務太長導致目標漂移;

層級推理(例如ADaPT,THREAD)將任務分解為子任務來明確目標,但給子任務單獨分配上下文示例和提示詞,導致上下文斷層和成本爆炸。


ReCAP

讓序列推理和層級推理有機結合


ReCAP的核心在于將一個有記憶、有反饋的遞歸樹結構作為模型的工作記憶區,其三大機制環環相扣:

計劃前瞻分解(Recursive Task Decomposition with Plan-Ahead):模型首先生成一個完整的子任務列表,但只執行第一個子任務,完成后再動態優化后續計劃。

結構化父任務再注入(Consistent Multi-level Context and Structured Injection):整個執行流程只有一個上下文,由所有任務共享。每次子任務遞歸返回時,父任務會將自身的思考和計劃再次注入上下文,使父任務在重新計劃時可以參考上次的思維和執行結果,規劃出能真正達成任務目標的底層操作。

滑動窗口記憶(Sliding Window and Scalable Memory Efficiency):通過滑動窗口機制,在統一上下文中只保留最新關鍵歷史,實現了內存占用可控的深度遞歸,從根本上杜絕了成本爆炸。


實驗結果

長上下文任務性能大幅躍升


團隊在多個典型長上下文推理基準上驗證了ReCAP的效果。結果令人矚目:

在Robotouille(同步)上取得70%成功率,較ReAct(38%)提升84.2%

在Robotouille(異步)上取得53%成功率,較ReAct(24%)提升112.5%

在ALFWorld上取得91%成功率,穩定優于ReAct(84%)

在SWE-bench Verified取得44.8%的成功率,優于ReAct基線(39.58%)

值得注意的是,團隊在實驗中始終秉持pass@1的實驗原則,即不使用樣本層面的重試、多數投票或者束搜索。這意味著ReCAP能在真實多步環境中,更好地保持目標一致性與執行連貫性——不僅「想得對」,還能「做得穩」。

ReCAP是除ReAct之外,又一個能夠在具身推理、以及代碼編輯這兩種截然不同的任務上都取得穩健表現的通用推理架構。

論文中排除了THREAD、Reflexion等其他基線,因其在實驗設置中難以穩定復現或與 pass@1 協議不兼容,這進一步凸顯了ReCAP作為新一代通用推理基線的潛力。

優勢與成本的權衡

任何強大的能力都伴隨著成本。團隊對此進行了透明分析:ReCAP的總計算成本約為ReAct的三倍。這主要來自于其核心的計劃前瞻分解機制所額外需要的LLM調用。

然而,考慮到其在關鍵任務上帶來的性能巨幅提升與目標一致性,這種成本的增加在對準確性要求高的實際應用中是可以接受的。這為開發者提供了一個清晰的性價比權衡選項。

遞歸,是通往通用智能的鑰匙?

從人類思維到圖靈機,遞歸始終是智能的底層邏輯。ReCAP的提出,可視為AI邁向通用推理系統的關鍵一步。

其潛力遠不止于論文所驗證的任務范疇。任何依賴復雜決策回路與長期上下文記憶的大型任務,都是ReCAP的理想應用場景。

例如在深度研究中自主遍歷文獻、整合多源信息并生成洞察報告;或在復雜軟件工程中管理龐大代碼庫與依賴關系,推進需多步驗證的系統項目。

長遠來看,ReCAP的遞歸規劃能力可以與空間智能相結合,解決更為復雜的現實世界問題。李飛飛教授近日指出,空間智能——即理解、推理并與三維世界交互的能力,是AI的下一個前沿。

ReCAP可以為具身智能機器人規劃復雜的長期任務序列,而空間智能模型則負責處理實時感知與動作控制,二者結合實現機器人在動態環境中的自主規劃與可靠執行。

隨著代碼的開源,一個更擅長長期規劃、穩健執行的AI時代或許即將到來。

作者介紹

共同一作 Zhenyu Zhang, Tianyi Chen, Weiran Xu 均為斯坦福大學工程學院計算機系碩士研究生

Alex Pentland教授,麻省理工學院媒體實驗室 創始人之一,美國國家工程院院士,Toshiba Professor at MIT,斯坦福大學 HAI Fellow。

Jiaxin Pei博士,斯坦福大學博士后研究員,研究興趣集中在大語言模型、人機交互、Agentic AI,即將前往得克薩斯大學奧斯汀分校任教。

參考資料:

https://arxiv.org/pdf/2510.23822

秒追ASI

?點贊、轉發、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

日韩1区2区日韩1区2区| 国产91丝袜在线播放九色| 午夜精品久久久久久久久久| 日本xxx免费| 狠狠色丁香婷婷综合| 欧美国产日韩一区二区在线观看| a级在线免费观看| 人妻无码中文字幕| 欧美激情国产高清| 五月天丁香激情| 日韩激情av在线免费观看| 国产成人一区二区三区影院在线| 8090成年在线看片午夜| 一级做a爱片性色毛片| 国产啪精品视频网站| 国产一区二区在线视频聊天| 亚洲毛片在线看| 在线国产视频一区| 欧美亚洲国产一区二区三区va | 久国产精品韩国三级视频| 国产一区免费视频| 99热这里都是精品| 精品乱色一区二区中文字幕| 欧洲成人一区二区三区| 在线精品国产欧美| 中文字幕乱妇无码av在线| 亚洲最新视频在线观看| 妞干网在线播放| 伊人网综合在线| 亚洲一区二区三区香蕉| 国产色在线视频| 日本老师69xxx| 一个人看的www日本高清视频| 7777精品伊人久久久大香线蕉| 北条麻妃69av| 久久色成人在线| 91在线观看免费| 日韩乱码一区二区| 日韩美女一区二区三区四区| 国产一级精品毛片| 成人动漫在线视频| 天堂成人免费av电影一区| 国产日韩在线一区| 97精品人人妻人人| 日韩一级免费观看| 亚洲黄色在线网站| 欧美性三三影院| 久久久久久免费看| 国产精品女主播在线观看| 天天综合色天天综合色hd| 中文文字幕一区二区三三| 色妞在线综合亚洲欧美| 精品国产av 无码一区二区三区| 成人性生交大片免费观看嘿嘿视频| 亚洲色图狠狠干| 国产一级特黄a大片99| 日本视频免费在线| 国产精品99导航| 日韩激情av在线| 亚洲国产精品久久久久爰色欲| 亚洲香蕉成人av网站在线观看| 五月天婷婷视频| 糖心vlog在线免费观看| 色久综合一二码| 免费看污片的网站| 亚洲乱码国产乱码精品精| 日本不卡一二区| 亚洲精品一二区| 一级黄色av片| 性欧美视频videos6一9| 色噜噜在线观看| 一区二区成人在线视频| 欧美视频小说| 成人三级在线视频| 91看片在线免费观看| 国产精品视频第一区| 日韩视频在线免费看| 欧美一区二区三区视频在线观看 | 人妻激情另类乱人伦人妻| 色偷偷88欧美精品久久久| 中文成人无字幕乱码精品区| 日韩一区二区三区视频| 神马久久精品综合| 久久九九全国免费精品观看| 婷婷激情五月网| 欧美精品久久久久久久久老牛影院 | 久久精品国产亚洲一区二区三区| 小泽玛利亚av在线| 色综合欧美在线视频区| 国产伦精品一区二区三区妓女下载| 日韩精品高清在线观看| 中文字幕久久熟女蜜桃| 欧美深夜福利视频| 欧美激情视频网站| 亚洲制服丝袜av| √资源天堂中文在线| 成人免费视频91| 亚洲精品一区二区三区婷婷月| 久久精品国产av一区二区三区| 欧美精品日韩三级| 特黄aaaaaaaaa真人毛片| 日韩久久在线| 一区二区成人在线| 久久亚洲精品无码va白人极品| 欧美国产精品一区| 男人天堂资源网| 日韩免费av电影| 欧美性猛交视频| 欧美黄色免费看| 国产一区二区中文字幕免费看| 精品国产av鲁一鲁一区| 97免费视频观看| 国产丝袜视频一区| 99精品视频在线播放观看| 精品少妇一二三区| 伊人精品久久久久7777| 中文字幕v亚洲ⅴv天堂| 日本黄视频在线观看| 一区二区免费电影| 亚洲成人你懂的| 国产无遮挡裸体免费视频| 国产精品久久久久久久久| 蜜桃av一区二区在线观看| 亚洲欧美日韩精品久久久| 欧美艳星brazzers| 少妇av在线播放| 亚洲区 欧美区| 一区二区三区视频免费| 免费观看日韩av| 亚洲a级在线观看| 最新国产精品久久精品| jizz18女人高潮| 日韩精品最新在线观看| 中文字幕欧美日韩| 亚洲精品国久久99热| 国产88在线观看入口| 亚洲a v网站| 青娱乐国产91| 俺去啦;欧美日韩| 东方欧美亚洲色图在线| 久久中文字幕人妻| 91精品国产91久久久久久久久| a级高清视频欧美日韩| 欧美夫妇交换xxx| 日韩在线观看免费网站| 香蕉视频911| 超碰在线97免费| 97视频热人人精品| 3atv一区二区三区| 色窝窝无码一区二区三区成人网站| 国产a级片网站| 精品人伦一区二区三区蜜桃免费| 亚洲精品久久久久久久蜜桃| 自拍偷拍视频在线| 中文字幕亚洲欧美日韩高清 | 制服丝袜av成人在线看| 最新不卡av在线| 久久99精品国产| 欧美日韩在线国产| 91国内在线播放| 91手机视频在线观看| 欧美日韩国产专区| 这里只有久久精品视频| 久久久久久久久久久久91| 久久影视电视剧免费网站| 国产精品看片你懂得| 久久人妻一区二区| 欧美成人久久久| 精彩视频一区二区三区| 国产精品成人69xxx免费视频| 国产精品333| 久久99视频精品| 亚洲青青青在线视频| 欧美性受xxx黑人xyx性爽| 日韩亚洲欧美一区二区| 日韩欧美综合在线视频| 亚洲人在线观看视频| 亚洲一区二区自偷自拍| 国产一级不卡毛片| 粉嫩av免费一区二区三区| 97在线看福利| 国产亚洲激情在线| 欧美精品一二三区| 1区2区3区精品视频| 免费在线看成人av| 最近中文字幕免费视频| 精品久久久久久中文字幕动漫| 欧美年轻男男videosbes| 国内一区二区在线| 战狼4完整免费观看在线播放版| 色综合666| 亚洲最新av网址| 久久九九免费| 日韩有码免费视频| 中文字幕av一区二区三区谷原希美| 日韩极品在线观看| 日本aaa视频| 国产美女在线一区| 欧美专区在线播放| 91久久免费观看| 看电视剧不卡顿的网站| 久久国产高清视频| 理论片大全免费理伦片| 五月婷婷六月丁香激情| 国产毛片视频网站| 春日野结衣av| 亚洲国产一二三精品无码| 欧美精品免费观看二区| 成人免费自拍视频| 亚洲国产精品国自产拍av秋霞| 99re热视频精品| 精品无码一区二区三区的天堂| 蜜臀一区二区三区精品免费视频 | 欧美另类高清videos| 精品久久中文字幕久久av| 久久综合色综合| 日韩成人在线资源| 亚洲高清一区二| 韩国精品免费视频| 亚洲自拍偷拍一区二区| 成品人视频ww入口| 91在线网站视频| 在线视频欧美日韩| 综合久久国产九一剧情麻豆| 日本sm残虐另类| 成人免费视频网站入口::| 成人亚洲精品777777大片| 欧美日韩国产高清视频| 久久精品国产综合| 亚洲精品国产精品乱码不99 | 国产美女精品视频国产| 91丝袜在线观看| 欧美三级中文字幕在线观看| 欧性猛交ⅹxxx乱大交| 少妇极品熟妇人妻无码| 国产精品国产精品国产专区蜜臀ah| 欧美一区二区三区免费大片| 亚洲精品一二三| 国产在线播放一区三区四| 黄色一区二区视频| 91视频在线网站| 亚洲国产精品久久久久爰色欲| 无码免费一区二区三区免费播放| 99高清视频有精品视频| 国产精品精品久久久久久| 欧美激情视频在线免费观看 欧美视频免费一| 欧美人狂配大交3d怪物一区| 久久蜜桃香蕉精品一区二区三区| 国产精品视频一二区| 可以直接看的黄色网址| 亚洲最大视频网| www.av毛片| 91久久精品美女| 一区二区三区天堂av| 欧美日韩免费看| 中文字幕一区二区三区四区| 亚洲激情图片qvod| 亚洲国产日韩在线一区模特| 成人激情校园春色| 六月丁香色婷婷| 精品国自产在线观看| 好吊妞视频一区二区三区| 欧美视频免费看欧美视频| 91色精品视频在线| 欧日韩在线观看| 欧美激情a∨在线视频播放| 午夜欧美不卡精品aaaaa| 秋霞av国产精品一区| 国产午夜精品一区| 一道本在线观看视频| 中文字幕成人在线视频| 2一3sex性hd| 任你操精品视频| 97久久久久久久| 国产一级片毛片| 亚洲日本韩国在线| 中文字幕av免费在线观看| 日韩精品一区二区三区高清免费| 男人女人黄一级| av动漫在线播放| 中文字幕久精品免| 日本男女交配视频| 高清一区二区视频| 亚洲黄色片免费看| 国产视频一区二区视频| 国产91porn| 天天想你在线观看完整版电影免费| 国产一区视频在线| 欧美成人在线免费| 日韩在线观看免费av| 在线观看欧美日韩国产| 亚洲成人黄色网址| 69堂精品视频| 午夜久久久久久| 中文无字幕一区二区三区| 免费视频一区二区| 日本vs亚洲vs韩国一区三区二区| thepron国产精品| 国产日韩欧美在线一区| 国产色91在线| 91丨九色丨国产丨porny| 久久99国产精品麻豆| 久色婷婷小香蕉久久| 蜜桃久久一区二区三区| 中文字幕激情视频| 999久久久久| 日韩专区中文字幕一区二区| 久久激情综合| 奇米影视第四色777| 三级视频在线观看| 中文字幕 自拍偷拍| 久久久国产高清| 日本爱爱小视频| 国产精品一区二区av白丝下载| 国产一区二区三区四区在线观看| 国产精品久久久久久久蜜臀| 欧美电影免费提供在线观看| 欧美—级a级欧美特级ar全黄| 91麻豆国产精品| 中文字幕色一区二区| 国产成人a亚洲精v品无码| 少妇人妻互换不带套| 中文字幕无人区二| 婷婷中文字幕在线观看| 亚洲做受高潮无遮挡| 永久免费看mv网站入口| 日本熟伦人妇xxxx| 国产免费嫩草影院| 亚欧洲乱码视频| 波多野结衣av在线观看| 亚洲午夜精品久久久久久高潮| 日韩视频在线观看免费视频| 波多野结衣视频网站| 欧美在线 | 亚洲| 国产精品伦一区| 欧美日韩性视频在线| 欧美一级高清大全免费观看| 久久九九热免费视频| 成人免费视频97| 视频在线99| 九色视频成人porny| 精品人妻大屁股白浆无码| 15—17女人毛片| 天堂www中文在线资源| 亚洲天堂狠狠干| 国产精品色婷婷| 原创国产精品91| 牛人盗摄一区二区三区视频| 亚洲av永久无码精品| 精品国自产拍在线观看| 亚洲精品日产精品乱码不卡| 精品国产一区二区三区av性色| 国产精品久久久久影院日本| 久久久久久久久久久福利| 超碰男人的天堂| 波多野结衣电车痴汉| 国产**成人网毛片九色| 国产婷婷色一区二区三区四区 | 国产精品视频久久久久| 亚洲精品一区二区三区蜜桃久 | 含羞草久久爱69一区| 99在线免费视频观看| 麻豆tv在线观看| 无码国产精品高潮久久99| 一区二区三区精密机械公司| 日韩中文视频免费在线观看| 国产精品久久一区主播| 午夜精品一区二区三区在线观看| 国内精品国产三级国产aⅴ久| 亚洲视频免费播放| 亚洲欧美综合一区二区| 美女mm1313爽爽久久久蜜臀| 成人欧美一区二区三区视频网页| 91精品国产欧美一区二区成人| 欧美激情乱人伦一区| 久久99久久精品国产| 精品人妻伦一二三区久| 国产av精国产传媒| 久久久噜噜噜久久中文字幕色伊伊| 日韩视频免费观看高清完整版| 欧美最顶级丰满的aⅴ艳星| 日韩视频专区| 老牛影视av老牛影视av| 国产五月天婷婷| 成人免费毛片aaaaa**| 在线观看精品一区| 日韩中文娱乐网| 欧美一级日本a级v片| 波多野结衣作品集| 黑人巨大精品欧美| 99久久夜色精品国产亚洲| 久久久精品中文字幕麻豆发布| 欧美成人官网二区| 国产精品夜夜夜一区二区三区尤| 亚洲欧美日韩偷拍| 蜜桃在线一区二区三区| 在线精品视频小说1| 欧美成人激情视频| www.亚洲成人网| 久久精品国产亚洲av无码娇色 | 日本亚洲欧洲精品| 波多野结衣av在线免费观看| 久久这里有精品15一区二区三区| 亚洲一区二三区| 欧美精品久久久久久久久久| 美女一区二区三区视频| 午夜视频www| 亚洲第一区第一页| 国产视频在线观看网站| 在线观看亚洲黄色|