亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

螞蟻安全團隊新范式Agentic Deep Research,推理能力顯著提升

IP屬地 中國·北京 編輯:鐘景軒 機器之心Pro 時間:2025-08-27 16:22:53



盡管 LLM 的能力與日俱增,但其在復雜任務上的表現仍受限于靜態的內部知識。為從根本上解決這一限制,突破 AI 能力界限,業界研究者們提出了 Agentic Deep Research 系統,在該系統中基于 LLM 的 Agent 通過自主推理、調用搜索引擎和迭代地整合信息來給出全面、有深度且正確性有保障的解決方案。

OpenAI 和 Google 的研究者們總結了 Agentic Deep Researcher 的幾大優勢:(1)深入的問題理解能力(Comprehensive Understanding):能夠處理復雜、多跳的用戶提問;(2)強大的信息整合能力(Enhanced Synthesis):能夠將廣泛甚至沖突的信息源整合為合理的輸出;(3)減輕用戶的認知負擔(Reduced User Effort):整個 research 過程完全自主,不需要用戶的過多干預。

現存最先進的 Agentic Deep Research 系統往往基于由可驗證結果獎勵指導的強化學習訓練,盡管該訓練范式帶來了顯著的性能收益,但仍存在以下核心問題:

梯度沖突(Gradients Conflicts):在基于可驗證結果獎勵的強化學習范式中,即使中間的推理過程或研究策略是有效的,只要最終答案錯誤,整個推理軌跡都會受到懲罰。這種粗粒度的獎勵設計在中間推理步驟與最終答案之間引入了潛在的梯度沖突,阻礙了模型發現更優的推理能力和研究策略,從而限制了其泛化能力獎勵稀疏(Reward sparsity):基于結果的強化學習僅依賴最終答案生成獎勵,導致每個訓練樣本只能提供稀疏的反饋信號。這嚴重限制了策略優化的效率,因為它增加了對更大規模訓練數據和更長訓練周期的依賴。

以上兩個限制限制了 Agentic Deep Research 系統的性能上線,為決解這兩大限制,來自螞蟻安全與智能實驗室團隊提出了 Atom-Searcher,進一步推動了 Agentic Deep Research 系統的性能邊界。



論文標題:Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward論文:https://arxiv.org/abs/2508.12800Github: https://github.com/antgroup/Research-VenusHuggingface: https://huggingface.co/dikw/Atom-Searcher



方法介紹

本研究提出了一種創新性的 Agentic Deep Research 系統訓練框架 Atom-Searcher,結合監督微調(SFT)與基于細粒度獎勵的強化學習構建強大的 Agentic Deep Research 系統。

與現存 Agentic Deep Research 訓練框架相比,Atom-Searcher 創新地提出了 Atomic Thought 推理范式,引導 LLM 進行更加深入、可信和可解釋的推理;然后引入 Reasoning Reward Model(RRM)對 Atomic Thought 式的推理過程進行監督,構建細粒度的 Atomic Thought Reward(ATR);進而提出一種課程學習啟發的獎勵融合策略將 ATR 與可驗證結果獎勵進行聚合;最后基于聚合獎勵進行強化學習訓練。



Atomic Thought 推理范式





細粒度 Atomic Thought Reward 構建



課程學習啟發的獎勵聚合策略

基于可驗證結果的獎勵的 Agentic Deep Research 系統之所以存在梯度沖突問題,是由于基于結果的獎勵在 token 級別的獎勵分配上過于粗糙。具體來說,它將中間推理步驟的正確性完全歸因于最終答案,常常在不考慮各步驟實際貢獻的情況下對其進行獎勵或懲罰。這種錯位在優化過程中會引發梯度沖突。為解決這一問題,我們將 ATR 與結果獎勵相結合,利用 ATR 作為輔助信號來校準結果獎勵,從而緩解梯度沖突。

然而,使用靜態的獎勵加權系數無法與訓練動態保持一致。具體而言,在訓練初期,模型能力尚有限,難以生成完全正確的答案,但更有可能探索出對最終正確解有貢獻的有用 “原子思維”。如果此階段僅依賴基于結果的獎勵,這些有益的原子思維可能因最終答案錯誤而遭到不公正的懲罰;相反,一些有害的原子思維也可能被錯誤地強化,導致嚴重的梯度沖突,因而需要 ATR 進行較強的校準。隨著訓練的推進,模型能力逐步提升,其推理軌跡與正確答案的對齊程度也日益提高。因此,梯度沖突逐漸減弱,而來自 ATR 的過度校準可能會引入不必要的噪聲,反而損害最終的準確性。

強化學習訓練

基于混合獎勵,本文采用了 GRPO 算法進行強化學習訓練。并使用了 Loss Masking 策略保證訓練的穩定性。具體而言,在原始的 GRPO 框架中,損失函數會計算整個推理路徑中所有 token 的梯度。但在 Atom-Searcher 中,模型的輸出路徑包含由外部環境檢索得到的內容(如搜索結果),這些內容不是模型生成的,也不可訓練。為了避免模型在訓練時被這些靜態、不可控的內容誤導,本文采用了 Loss Masking 機制,將檢索結果部分的 token 排除在損失計算之外。

實驗效果

主實驗

Atom-Searcher 在 In-Domain 和 Out-of-Domain 上的性能表現均十分亮眼。在 In-Domain Benchmarks (NQ、 TQ、HotpotQA、2Wiki)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 8.5% 的平均性能提升,在 Out-of-Domain Benchmarks(Musique、 Bamboogle、 PopQA)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 2.5% 的性能提升。



消融實驗

作者們證明了 Atom-Searcher 中 Atomic Thought 范式和 ATR 的貢獻,并證明了相較于傳統的 < think > 推理范式 Atomic Thought 范式為 RRM 提供了有效的監督錨點,從而帶來了性能提升



案例分析

作者們通過案例分析對比了 Atom-Searcher 與最優 baseline——DeepResearcher 的推理過程。展示了 Atom-Searcher 的優勢:(1)Atom-Searcher 在其推理過程中自主生成了 Atomic Thoughts,展現出更接近人類的認知行為,例如問題分析、提出解決方案假設、預測錯誤以及規劃下一步操作,使其推理過程更加深入且清晰;(2)Atom-Searcher 會觸發更多的搜索調用,從而獲取更豐富的外部信息,以確保答案的正確性。這些優勢表明,Atom-Searcher 在更復雜的 Deep Research 任務中具有巨大潛力。



免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

亚洲国产毛片完整版| 亚洲国产91色在线| 狠狠人妻久久久久久| 久久综合毛片| 欧美熟乱第一页| 在线视频 中文字幕| 裸体大乳女做爰69| 亚洲成人av中文字幕| 亚洲人午夜射精精品日韩| 久久久久久久中文| 色999日韩欧美国产| 国产麻豆视频一区二区| 亚洲精品一区二区18漫画 | 96精品久久久久中文字幕| 亚洲精选视频在线| 中文字幕一区二区人妻电影| 亚洲国产精品影视| 成人动漫在线一区| 日韩国产精品久久久久久亚洲| 不卡影院一区二区| 久久精品视频16| 国产尤物av一区二区三区| ww国产内射精品后入国产| 国产精品主播视频| 亚洲国产古装精品网站| 在线观看av不卡| 亚洲欧美偷拍另类a∨色屁股| 自拍偷拍18p| 五月婷婷亚洲综合| 久久99热狠狠色一区二区| 色噜噜在线播放| 免费看av在线| 老司机免费视频| 老司机午夜性大片| 你懂的在线观看网站| 91玉足脚交白嫩脚丫| 超碰91在线播放| 9色视频在线观看| 电影午夜精品一区二区三区| 国产成人精品a视频一区www| 欧美日本高清视频| 亚洲三级视频在线观看| av中文字幕第一页| 最新在线黄色网址| 日本aa在线观看| 亚洲视频第二页| 成人黄色av片| 欧美深性狂猛ⅹxxx深喉| 91丝袜一区二区三区| 国产午夜精品在线观看| www.色综合| 亚洲资源在线网| 永久免费看mv网站入口| 亚洲手机在线观看| 午夜免费福利视频| 青青国产91久久久久久| 美女视频黄免费的久久 | 91精品国模一区二区三区| 成人av先锋影音| 中文字幕人妻一区二区在线视频| 91亚洲大成网污www| 久久精品一区二区三区四区| 亚洲精品国产一区二区精华液| 精品久久一二三区| 亚洲丰满在线| 小泽玛利亚一区二区三区视频| 懂色av影视一区二区三区| 88国产精品欧美一区二区三区| 日本高清不卡三区| 青青草综合在线| 亚洲国产成人va在线观看麻豆| www.四虎在线| 中国一级片黄色一级片黄| 黄色国产在线观看| 欧美一区二区三区爽大粗免费| 国产在线欧美日韩| 国产精品视频一区国模私拍| 国产欧美日韩91| 国产精品美女主播| 日本视频久久久| 国产欧美一区二区三区不卡高清| 日本高清免费观看| 紧缚捆绑精品一区二区| 久久久爽爽爽美女图片| jizzzz日本| 国产中文一区二区三区| 亚洲国产99精品国自产| 国产精品手机播放| 中文字幕中文字幕在线中心一区 | 亚洲欧洲精品一区二区三区波多野1战4| 一二三区视频在线观看| 国产成人黄色片| 一区二区三区四区视频在线 | 国产精品国产三级国产a| 一本一道人人妻人人妻αv| 日本中文字幕在线免费观看| 杨钰莹一级淫片aaaaaa播放| 超碰在线观看av| 国产成人一区二区精品非洲| 91麻豆福利精品推荐| 欧美日韩综合不卡| 91影视免费在线观看| 成人涩涩小片视频日本| 欧美日韩在线视频一区二区| 国产欧美韩日| 久草视频在线资源| 国产盗摄女厕一区二区三区| 欧美高清在线精品一区| 欧美日韩成人综合在线一区二区| 欧美激情奇米色| 亚洲午夜精品一区二区三区| 国产精品xxxx| 免费看国产精品一二区视频| 欧美日韩综合另类| 91免费视频黄| 久久久久久久黄色片| 欧美国产视频在线| 色诱视频网站一区| 91精品久久久久久久久青青| 三大队在线观看| 2欧美一区二区三区在线观看视频| 91视频在线免费观看| 136福利视频导航| 亚洲第一中文字幕| 亚洲日本黄色片| 国产露脸国语对白在线| 色综合久久中文字幕| 国内精品美女av在线播放| 正在播放一区二区三区| 久久影视中文字幕| 一卡二卡三卡日韩欧美| 五月天激情综合| 精品国产麻豆免费人成网站| 最近2019年手机中文字幕| 国产精品成人av在线| 国产全是老熟女太爽了| 久久精品一区八戒影视| 亚洲另类欧美自拍| 春日野结衣av| 日日夜夜免费精品| 一区二区三区视频免费在线观看| 日本阿v视频在线观看| 国产成人麻豆精品午夜在线| 亚洲国产精品一区二区久久| 午夜伦理精品一区| 中文字幕久久av| 久久一区国产| 日韩精品视频在线观看网址| 欧美精品在线观看91| 久久99久久精品国产| the porn av| 国产午夜视频在线播放| 亚洲 另类 春色 国产| 久久视频免费在线播放| 国产精品果冻传媒| 精品无人区卡一卡二卡三乱码免费卡| 久久精品电影一区二区| 中文字幕在线播放一区二区| 欧美一区二区三区婷婷月色| 国产精品815.cc红桃| 亚洲精品电影网| 一级性生活毛片| 欧美三区在线观看| 亚洲成人午夜在线| 国产精品视频无码| 亚洲欧洲国产精品| 色噜噜狠狠一区二区| 国产欧美精品区一区二区三区| 亚洲国产精彩中文乱码av在线播放| 国产一区免费观看| 久久精品美女视频| 久久亚洲精品国产亚洲老地址| 日本黄色福利视频| 久久丁香综合五月国产三级网站| 国内精品视频久久| 国产精品久久久毛片| 亚洲AV无码成人片在线观看 | 成年网站在线播放| 在线播放国产精品二区一二区四区| 国产精品久久国产精麻豆96堂| 欧美成人艳星乳罩| 女人被狂躁c到高潮| 国产精品传媒在线| 性欧美精品一区二区三区在线播放 | 战狼4完整免费观看在线播放版| 青青草国产精品97视觉盛宴 | 在线精品国产欧美| 在哪里可以看毛片| 欧美色倩网站大全免费| 久久国产精品久久精品国产| 美女爽到高潮91| 欧美激情免费视频| 91麻豆国产香蕉久久精品| 国产成人综合网| 国产91综合网| 成人天堂资源www在线| 波多野结衣中文字幕一区| av福利精品导航| 91丨porny丨国产| 久久久久久久久免费| 国产婷婷色一区二区三区| 日本一区二区免费在线| 国产精品理论片| 一区二区三区四区高清精品免费观看| 一区二区日韩av| 午夜av电影一区| 欧美性一区二区| 日韩一区二区在线观看视频| 精品粉嫩aⅴ一区二区三区四区| 亚洲丁香久久久| 亚洲天堂久久av| 久热在线中文字幕色999舞| 欧美激情18p| 欧美伊久线香蕉线新在线| 国产精品久久久久久久9999| 91中文精品字幕在线视频| 96久久精品| 欧美在线视频二区| 四虎免费在线观看视频| 国产日本在线播放| 污污网站免费看| 日本精品一二三区| 日韩欧美在线视频播放| 精品少妇久久久久久888优播| 亚洲不卡视频在线观看| 国产丰满美女做爰| 男人的天堂亚洲一区| 成人激情综合网站| 一区免费观看视频| 色综合激情五月| 亚洲国产成人精品久久久国产成人一区| 在线观看日韩www视频免费| 欧美黑人视频一区| 91久久中文字幕| 少妇免费毛片久久久久久久久| 精品无码一区二区三区爱欲| www.涩涩涩| 熟女高潮一区二区三区| 日产精品久久久久| www.日韩在线观看| 国产精品99久久久久久久vr | 中文字字幕在线中文乱码| 日本人妻丰满熟妇久久久久久| 国产精品123| 亚洲欧洲日韩综合一区二区| 91久久精品一区二区三区| 亚洲高清免费观看高清完整版| 欧美精品亚州精品| 亚洲一区二区三区香蕉| 在线观看国产一区| 国产成人美女视频| 五月天色婷婷丁香| 国产露脸无套对白在线播放| 看片网站欧美日韩| 国产亚洲人成网站| 色94色欧美sute亚洲线路一久| 日韩精品视频在线观看网址| 97超碰蝌蚪网人人做人人爽| 鬼打鬼之黄金道士1992林正英| 奇米777四色影视在线看| 国产探花一区二区三区| 欧美精品久久久久性色| 亚洲精品一区二区三区新线路| 成人ar影院免费观看视频| 亚洲一区二区三区国产| 精品国产伦理网| 91精品国产九九九久久久亚洲| 国产一区二区三区高清视频| 日日橹狠狠爱欧美超碰| 国产免费看av| 911美女片黄在线观看游戏| 国产精品一区专区| 天天综合色天天综合色h| 精品视频久久久久久久| 国产精品久久久久久久久免费看| 一区二区视频国产| 一区二区三区四区影院| 免费在线不卡视频| 理论电影国产精品| 亚洲午夜精品网| 日韩激情在线视频| 国产精品视频地址| 国产 日韩 欧美在线| 欧美激情亚洲色图| 精品久久在线观看| 欧美国产精品久久| 欧美一区二区三区四区视频| 97精品一区二区三区| 亚洲欧洲一区二区福利| wwwxx日本| 黄色一区二区视频| 91欧美一区二区| 日韩一区二区免费在线观看| 国产69久久精品成人| 亚洲图片都市激情| 亚洲熟妇无码av| xxxx国产精品| 中文字幕第一页久久| 精品国产乱码久久久久久1区2区| 国产精品成人v| 男的插女的下面视频| 黄色一级大片在线免费观看| 久久天天综合| 午夜视频一区在线观看| 裸体女人亚洲精品一区| 日韩精品久久一区二区三区| 在线中文字日产幕| 国产精品女同一区二区| 国产精品久久久久久久裸模| 亚洲美女视频网站| 国产日韩欧美二区| 国产精品嫩草69影院| 国产美女免费看| 国产精品人人做人人爽人人添| 精品亚洲精品福利线在观看| 风间由美久久久| √天堂资源在线| 中文字幕日本人妻久久久免费| 91美女蜜桃在线| 亚洲激情在线观看| 精品午夜一区二区| 国产精品伦子伦| 久久精品一区| 在线精品视频一区二区| 国产精品91久久久| 91蝌蚪视频在线观看| 国产精品久久久久久久久夜色| 久久女同性恋中文字幕| 精品亚洲aⅴ在线观看| 欧美日韩亚洲一区二区三区在线观看 | 欧美亚洲一级片| 青青草国产精品视频| 日韩欧美激情视频| 久久这里只有精品视频网| 亚洲福利视频网| 蜜桃久久精品乱码一区二区| 91成年人网站| 奇米影视在线99精品| 欧美精品免费视频| 波多野结衣精品久久| jlzzjizz在线播放观看| 日本不卡123| 在线综合视频播放| 国产精品一 二 三| 亚洲国产无码精品| 精品亚洲欧美一区| 日韩精品中文字幕一区二区三区| 国产成人亚洲欧美| 一区二区不卡免费视频| 久久www免费人成看片高清| 91精品国产免费| 韩国成人av| 亚洲aaa视频| 成人av午夜影院| 亚洲欧美日韩国产成人| 亚洲欧美日韩另类精品一区二区三区| 久久久99999| 91视频免费看| 久久亚洲精品一区二区| 精品国产一区三区| 一区二区小视频| 激情懂色av一区av二区av| 国产美女精彩久久| 波多野结衣加勒比| 狠狠狠色丁香婷婷综合激情 | 91传媒视频在线观看| 亚洲av无码国产精品久久| 国产综合久久久久影院| 亚洲电影av在线| 男女裸体影院高潮| 欧美 亚洲 另类 激情 另类 | 国产成人鲁色资源国产91色综| 亚洲精品理论电影| 日本黄色播放器| 男人天堂2024| 黄色精品一区二区| 999在线观看免费大全电视剧| 波多野结衣办公室33分钟| 成人一区二区三区中文字幕| 中文字幕国产精品| www.浪潮av.com| 亚洲精品久久久蜜桃动漫| 8v天堂国产在线一区二区| 欧美日韩一区二区三区在线观看免| 免费日韩在线视频| 亚洲精品福利视频网站| 国产综合在线观看视频| 这里只有久久精品| 久久婷婷成人综合色| 韩国精品久久久999| 激情小说欧美色图| 高清shemale亚洲人妖| 日韩视频永久免费观看| 日本中文字幕高清| 免费不卡在线视频| 亚洲无线码在线一区观看| 91专区在线观看| 色综合免费视频| 亚洲国产中文字幕久久网| 久久综合久久久久| 国产精品视频一区二区三区,| 欧美精选一区二区| 亚洲免费视频播放| а√中文在线资源库| 日韩一区二区在线免费观看| 91免费版看片| 成人免费视频国产| 亚洲欧美成人在线| 五月天av在线播放| 国产成人av一区二区三区在线 |