亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

通義實驗室大火的 WebAgent 續(xù)作:全開源模型方案超過GPT4.1

IP屬地 中國·北京 編輯:朱天宇 機器之心Pro 時間:2025-07-29 20:18:54



WebAgent 續(xù)作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中,作者們首次提出了對 information-seeking(IS)任務(wù)的形式化建模并基于該建模設(shè)計了 IS 任務(wù)訓(xùn)練數(shù)據(jù)合成方法,并用全開源模型方案取得了GAIA 評測最高 60.1 分的 SOTA 表現(xiàn)

WebShaper 補足了做 GAIA、Browsecomp 上缺少高質(zhì)量訓(xùn)練數(shù)據(jù)的問題,通義實驗室開源了高質(zhì)量 QA 數(shù)據(jù)!

WebShaper 體現(xiàn)了通義實驗室對 IS 任務(wù)的認(rèn)知從前期的啟發(fā)式理解到形式化定義的深化。



GitHub 鏈接:https://github.com/Alibaba-NLP/WebAgenthuggingface 鏈接:https://huggingface.co/datasets/Alibaba-NLP/WebShapermodel scope 鏈接:https://modelscope.cn/datasets/iic/WebShaper



圖表 1:WebShaper 在 GAIA 上取得開源方案 SOTA。

WebShaper —— 合成數(shù)據(jù)范式的轉(zhuǎn)變

在大模型時代,「信息檢索(Information Seeking, IS)」早已不是簡單的 「搜索 + 回答」 那么簡單,而是 AI 智能體(Agent)能力的重要基石。無論是 OpenAI 的 Deep Research、Google 的 Gemini,還是國內(nèi)的 Doubao、Kimi,它們都把 「能不能上網(wǎng)找信息」 當(dāng)作核心競爭力。

系統(tǒng)性地構(gòu)造高質(zhì)量的信息檢索訓(xùn)練數(shù)據(jù)成為激發(fā)智能體信息檢索能力的關(guān)鍵,同時也是瓶頸。當(dāng)前主流方法依賴 「信息驅(qū)動」 的合成范式 —— 先通過網(wǎng)絡(luò)檢索構(gòu)建知識圖譜,再由大模型生成問答對(如 WebDancer、WebWalker 等方案)。這種模式存在兩大缺陷:知識結(jié)構(gòu)與推理邏輯的不一致性,以及預(yù)檢索內(nèi)容的局限導(dǎo)致的任務(wù)類型、激發(fā)能力和知識覆蓋有限。



圖表 2:WebShaper 從 「信息驅(qū)動」到 「形式化驅(qū)動」 的范式轉(zhuǎn)變。

WebShaper 系統(tǒng)開創(chuàng)性提出 「形式化驅(qū)動」 新范式,通過數(shù)學(xué)建模 IS 任務(wù),并基于該形式化,檢索信息,合成訓(xùn)練數(shù)據(jù)。形式化驅(qū)動的優(yōu)點包括:

1. 全域任務(wù)覆蓋 :基于形式化框架的系統(tǒng)探索,突破預(yù)檢索數(shù)據(jù)邊界,實現(xiàn)覆蓋更廣任務(wù)、能力、知識的數(shù)據(jù)生成。

2. 精準(zhǔn)結(jié)構(gòu)控制 :通過形式化建模,可精確調(diào)控推理復(fù)雜度與邏輯結(jié)構(gòu)。

3. 結(jié)構(gòu)語義對齊 :任務(wù)形式化使信息結(jié)構(gòu)和推理結(jié)構(gòu)一致,減少數(shù)據(jù)合成中產(chǎn)生的錯誤。

Information Seeking 形式化建模



圖表 3: 形式化建模

WebShaper 首先提出基于集合論的 IS 任務(wù)形式化模型。

該模型包含核心概念「知識投影(Knowledge Projection)」,他是一個包含實體的集合:

每個 IS 任務(wù)都由 KP 的 R - 并集(R-Union)、交集(Intersection)、遞歸操作構(gòu)成,能夠精準(zhǔn)控制推理路徑和任務(wù)復(fù)雜度;每個 IS 任務(wù)旨在確定一個復(fù)雜的由 KP 組合而成的目標(biāo)集合 T 中包含的實體。

該形式化建模讓 WebShaper 不再依賴自然語言理解的歧義,而是可控、可解釋、可擴展的數(shù)據(jù)合成方案。

智能體式擴展合成:讓 Agent 自己 「寫題」

為了與形式化建模保持一致,WebShaper 整個流程開始于預(yù)先構(gòu)建且形式化的基礎(chǔ)種子任務(wù),然后在形式化的驅(qū)動下,將種子問題多步擴展為最終的合成數(shù)據(jù)。此過程采用專用的代理擴展器 (Expander) 模塊,旨在通過關(guān)鍵過程 (KP) 表征來解釋任務(wù)需求。在每個擴展階段,系統(tǒng)都會實現(xiàn)逐層擴展機制,以最小化冗余,同時通過控制復(fù)雜度進程來防止推理捷徑。

種子任務(wù)構(gòu)建

為了構(gòu)建種子任務(wù),作者下載了全部 WikiPedia,并在詞條中隨機游走檢索信息,合成基礎(chǔ)的種子 IS 任務(wù)。

KP 表示

IS 任務(wù)形式化模型是復(fù)雜度的,其中包含大量的交、R - 并和遞歸操作。為了在 Expander 中表示和使用該模型,作者提出了一種 KP 表示。其中通過引入 「變量」 和 「常量」,以及 R - 并的可交換性質(zhì),表示了 IS 形式化模型。

如,將如下的問題:

「Which player of a team in the 2004-05 season, who was born in 90s? This team is founded in 1966 and is an East German football team.」

表示為:



圖表 4 :形式化表示。

逐層擴展結(jié)構(gòu)

數(shù)據(jù)擴展的策略是數(shù)據(jù)合成的關(guān)鍵。之前的方法在我們的形式化模型中將得到下圖中的 Random Structure 和 Sequential Structure:



圖表 5 :擴展策略對比。

這樣的結(jié)構(gòu)存在兩個問題:

冗余性: 如上圖中的 Random Structure 所示,存在一些已知常量與其他已知常量相聯(lián)系。在這種情況下,諸如 「柏林迪納摩是一家位于柏林的足球俱樂部」這樣的句子會存在于問題中。然而,這并沒有增加任務(wù)解決的推理鏈。推理捷徑: 如上圖中的 Sequential Structure 所示,存在一個將常量直接連接到目標(biāo)的推理鏈條。如果發(fā)生這種情況,模型可能會通過僅推理較近的常量而忽略較深的序列來猜測答案。

為此,作者提出如上圖所示的逐層結(jié)構(gòu),每次擴展都選擇葉結(jié)點常量進行擴展,有效地解決了上述的兩個問題。

擴展智能體

具體擴展是由 Expander 智能體負(fù)責(zé)執(zhí)行,他接受當(dāng)前問題的形式化表示:

根據(jù)圖結(jié)構(gòu)層次遍歷找到可擴展常量節(jié)點;調(diào)用搜索、網(wǎng)頁摘要、驗證等工具;自動生成形式化任務(wù)、并進行答案驗證和復(fù)雜度過濾。

這一步,使得我們不僅能構(gòu)建覆蓋度廣的任務(wù),更能確保任務(wù)正確性和推理鏈條的嚴(yán)謹(jǐn)性,大幅減少錯誤傳播。

Agent 訓(xùn)練

基于形式化生成的高質(zhì)量任務(wù)和完整的行為軌跡,作者使用監(jiān)督微調(diào)(SFT)+ GRPO 強化學(xué)習(xí)策略來訓(xùn)練 Agent。WebShaper 最終得到 5k 的訓(xùn)練軌跡。

訓(xùn)練后,模型在 GAIA 基準(zhǔn)任務(wù)中獲得:

60.1 分,超越所有開源方案閉源模型 GPT4.1 只有 40.7 分、Claude Sonnet4 58.2 分、O4 mini 66.99

我們在全使用開源模型方案下拉近了用最強閉源模型 o4 mini 的差距,大幅領(lǐng)先第二名的開源方案。



圖表 6 :與最新基線方法的對比。

進一步分析

論文中,作者還進一步分析了數(shù)據(jù)和訓(xùn)練模型,發(fā)現(xiàn):

1. WebShaper 數(shù)據(jù)領(lǐng)域覆蓋充分。

2. 在 WebShaper 數(shù)據(jù)上,通過 RL 訓(xùn)練能大幅激發(fā)模型的 IS 能力。

3. 消融實驗驗證了形式化建模和逐層擴展策略的有效性。

4. 求解 WebShaper 任務(wù),相比于基線數(shù)據(jù)要求更多的智能體 action。

為什么這件事重要?

任務(wù)形式化= WebShaper 是基于形式化任務(wù)合成數(shù)據(jù)的開端。該思想可以擴展于相比 IS 更為復(fù)雜的任務(wù)。數(shù)據(jù)質(zhì)量 = Agent 能力上限。好的智能體,先要有好的訓(xùn)練任務(wù)。Agentic 數(shù)據(jù)合成 = 智能體數(shù)據(jù)構(gòu)建需要結(jié)合推理和信息檢索,使用 agent 合成數(shù)據(jù)可以大幅減少中間過程開銷和誤差傳遞開源共享 = 社區(qū)生態(tài)繁榮。我們相信,用最開放的方式推動最前沿的研究,是 AI 發(fā)展的正路。

用開源數(shù)據(jù) + 模型做到 GAIA 60 分,你也可以。

現(xiàn)在就來試試:https://github.com/Alibaba-NLP/WebAgent

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

全站最新
欧美一区二三区| 国产一区二区0| 国产视频911| 日本一区二区不卡高清更新| 蜜桃一区二区三区在线| 3d动漫啪啪精品一区二区免费 | 久久资源在线| 美女久久久久久久久久| 国产成人av在线播放| 成人av免费在线| 欧美高清中文字幕| 成人综合婷婷国产精品久久蜜臀 | 午夜啪啪免费视频| 久青草免费视频| 亚洲精品成a人| 成人在线免费观看av| 午夜影院在线观看欧美| 日本男人操女人| 91精品国产综合久久福利| 波多野结衣一区二区三区四区| 亚洲三级视频网站| 日本亚洲导航| 在线成人激情视频| 一级黄色大片免费观看| 51精品国产黑色丝袜高跟鞋| 精品人妻一区二区三区四区不卡 | 激情图区综合网| 色偷偷亚洲男人天堂| 四季av一区二区三区| 麻豆freexxxx性91精品| 精品日本一线二线三线不卡| 欧美精品亚洲| 亚洲一区二区三区四区在线免费观看 | 青青草综合在线| 国产精品美女久久久久高潮| 国产成人艳妇aa视频在线| 一区二区三区在线观看动漫| 免费看一级一片| 日韩视频123| 成人免费在线网| 六月丁香婷婷色狠狠久久| 欧美xxxx18性欧美| 久久综合av免费| 韩国精品久久久| 日韩中文字幕在线不卡| 日韩一区二区在线看| 无套白嫩进入乌克兰美女| 成人激情免费在线| 欧美一区日韩一区| 国产精品99久久久久久成人| 久热99视频在线观看| 蜜臀av免费在线观看| 国内精品久久久久久中文字幕| 黄色短视频在线观看| 色999日韩欧美国产| 午夜激情小视频| 18禁男女爽爽爽午夜网站免费| 污污视频网站在线| 精品国产乱码久久| 日韩欧美999| 亚洲一二三四在线观看| 波多野结衣中文字幕一区 | 午夜视黄欧洲亚洲| 国产免费人做人爱午夜视频| 日韩亚洲精品电影| 国产精品激情偷乱一区二区∴| 在线免费观看毛片| 亚洲国产另类久久精品| 久久超碰亚洲| 9.1国产丝袜在线观看| 欧美日韩国产三级| 精品人妻少妇AV无码专区| 丝袜老师办公室里做好紧好爽 | 欧美最顶级丰满的aⅴ艳星| 亚洲一区二区三区影院| 伊人av在线播放| 欧美日韩一区二| 日本免费高清不卡| 在线观看日本一区| 亚洲自拍中文字幕| 国产精品爱啪在线线免费观看 | 日韩av免费在线| 亚洲精选视频免费看| 色网站免费观看| 免费大片在线观看| 亚洲精品wwwww| 蜜臀av一区二区| 免费在线观看日韩欧美| 久久久久久天堂| 91亚洲精品久久久蜜桃借种| 精品亚洲欧美日韩| 播五月开心婷婷综合| 精品人妻伦一区二区三区久久| 久久无码精品丰满人妻| 亚洲成人福利在线观看| 成人欧美一区二区三区白人 | 一本一道波多野结衣一区二区| 久久精品久久精品| 国产毛片久久久久| 亚洲精品不卡在线| 久久久久国产精品一区二区| 91深夜福利视频| 欧美高清激情brazzers| 一级成人免费视频| 亚洲永久无码7777kkk| 精品无码人妻一区| aa免费在线观看| 成人欧美一区二区三区在线湿哒哒| 久久精品国产2020观看福利| 夜夜狠狠擅视频| 欧美人与性囗牲恔配| 水蜜桃av无码| 久久影院一区二区| 久久免费黄色| 中文字幕av一区二区三区| 国产日韩三级在线| 狠狠色狠狠色合久久伊人| 国产九色91回来了| 国产精品无码专区av在线播放| 亚洲free性xxxx护士白浆| 色综合天天狠天天透天天伊人| 中文字幕永久在线不卡| 999免费视频| 一本在线免费视频| 中文字幕观看视频| 日韩手机在线观看| 亚洲一区视频在线播放| 大波视频国产精品久久| 亚洲女人久久久| 蜜桃av乱码一区二区三区| 丰满少妇久久久| 极品校花啪啪激情久久| 亚洲综合在线小说| 久久久久久12| 欧美日韩激情一区| 亚洲色图20p| 狠狠色丁香久久婷婷综合_中| 熟妇女人妻丰满少妇中文字幕| 欧洲精品在线视频| 欧美三日本三级少妇三99| 亚洲欧美日韩国产成人综合一二三区 | 久久露脸国语精品国产91| 成人在线观看毛片| 韩国成人一区| 91香蕉亚洲精品| 日韩中文字幕在线不卡| 亚洲精品天堂网| 99久久99久久免费精品蜜臀| 欧美日韩精品一区二区在线播放| 亚洲性日韩精品一区二区| 亚洲精品一区在线观看| 91精品蜜臀在线一区尤物| 欧美日韩国产黄| 日韩欧美国产一区二区| 欧美日韩国产一级| 国产日韩欧美一区二区三区乱码 | 蜜桃无码一区二区三区| 波多野结衣加勒比| 丰满少妇一区二区| 国产大片中文字幕| 在线视频福利一区| 日韩av片网站| 在线黄色免费网站| 国产chinasex对白videos麻豆| 亚洲欧美偷拍三级| 欧美二区在线播放| 精品无码av无码免费专区| 精品无码一区二区三区蜜臀| 欧美视频www| 中文在线最新版天堂| 精品国产av一区二区| 美女久久一区| 26uuu亚洲| 国产精品1区2区| 国产精品久久久久久久99| 日本三级日本三级日本三级极| 色老头一区二区| 粉嫩av性色av蜜臀av网站| 成人毛片一区二区三区| 久久国产日韩欧美精品| 永久免费看黄网站| 成人1区2区3区| 成人av在线资源| 欧美电视剧在线看免费| 日韩av电影免费在线观看| www.av免费| 91麻豆精东视频| 亚洲天堂av在线播放| 日本不卡免费新一二三区| 亚洲人精品午夜射精日韩| 向日葵污视频在线观看| av片在线免费看| 永久免费看片在线播放| 久久超碰97中文字幕| www.国产.com| 五月激情丁香婷婷| 久久综合九色综合97婷婷女人 | 色哟哟中文字幕| 专区另类欧美日韩| 欧美日韩精品免费| 国产精品久99| 这里只有精品丝袜| 久久一区二区三区av| 波多野结衣不卡视频| 亚洲香肠在线观看| 一区二区三区不卡在线| 国产av无码专区亚洲av| 欧美日韩一级片在线观看| 亚洲www永久成人夜色| 激情综合激情五月| 中文字幕一区在线播放| 日本怡春院一区二区| 一区二区三区在线观看网站| 欧美极品少妇xxxxⅹ喷水 | 日本免费一区视频| 国产99一区视频免费| 欧美第一页在线| 国产午夜伦鲁鲁| 污网站免费观看| 国产欧美综合视频| 亚洲女厕所小便bbb| 亚洲天堂久久久久久久| 欧美在线你懂得| 亚洲va电影大全| 国产大片中文字幕在线观看| 色婷婷精品大在线视频 | 性视频1819p久久| 亚洲qvod图片区电影| 久久国产高清视频| 国产精品国产自产拍高清av | 欧美视频国产视频| 欧美一区二区激情视频| 日本一区二区三区四区| 在线不卡一区二区| 中文字幕日本精品| 欧洲亚洲一区二区| 久久免费看少妇高潮v片特黄| 在线观看日韩高清av| 久久96国产精品久久99软件| 黄色片视频免费观看| 日本成人在线免费观看| 久久看片网站| 免费人成网站在线观看欧美高清| 欧美一三区三区四区免费在线看 | 国产色婷婷亚洲99精品小说| 蜜桃视频在线观看成人| 日韩成人免费电影| 国产精品成人aaaaa网站| 天天天天天天天干| 欧美sm美女调教| 亚洲免费久久| 青青草免费av| 一区二区三区精密机械公司| 国产精品久久久久久久久影视 | 91蝌蚪porny九色| 欧美性少妇18aaaa视频| 国产69精品99久久久久久宅男| 一区二区传媒有限公司| 99精品视频一区二区三区| 激情小说网站亚洲综合网| 中文字幕免费在线看线人动作大片| 大白屁股一区二区视频| 日韩av高清不卡| 日韩女优在线视频| 国产精品999久久久| 色综合天天综合狠狠| 亚洲ai欧洲av| 精品制服美女久久| 影音先锋成人资源网站| 亚洲国产三级在线| 欧美精品色视频| 欧美精品日韩一本| 成年人免费视频播放| 在线免费观看不卡av| 亚洲美女搞黄| 天天综合天天干| 欧美一区二区免费视频| 亚洲一区在线直播| 人妻有码中文字幕| 国产亚洲精品bt天堂精选| 国产97在线观看| 波多野结衣免费观看| 日韩中文字幕不卡| 欧美女孩性生活视频| 日本黄网免费一区二区精品| 欧美卡一卡二卡三| 香蕉影视欧美成人| 免费国产成人av| 亚洲欧美区自拍先锋| 亚洲一区二区三区久久 | 亚洲免费福利视频| 国产中文av在线| 欧美高清自拍一区| 麻豆精品精品国产自在97香蕉| 美女黄色片网站| 亚洲免费观看高清完整版在线观看 | 亚洲人成亚洲人成在线观看图片| 久久亚洲综合网| 国产一级二级三级视频| 亚洲乱码中文字幕| 国产精品毛片va一区二区三区| 欧美风情第一页| 亚洲国产精品嫩草影院| 国产精品嫩草在线观看| 91视频最新入口| 亚洲欧洲av一区二区三区久久| 亚洲自拍偷拍一区| 国产农村妇女毛片精品久久| 成人黄色网免费| 久久亚洲欧洲| 国产玉足脚交久久欧美| 日韩欧美在线视频观看| 国产精品九九九九九九| 国产精品久久久一区二区三区| 91原创在线视频| 中文字幕第3页| 欧美一区二区精品在线| 五级黄高潮片90分钟视频| 亚洲另类在线一区| 国产视频一区二区视频| 精品美女久久久久久免费| 成人性做爰aaa片免费看不忠| 一区二区三区视频在线看| 国产性生交xxxxx免费| 最新欧美精品一区二区三区| 成人av资源在线播放| 精品久久久久久久久久久久久久久久久久 | 老太脱裤子让老头玩xxxxx| 亚洲成人一区二区| 亚洲精品成人在线播放| 午夜国产精品影院在线观看| 久久久久久久久久久久久国产精品 | www.av欧美| 国产精品一久久香蕉国产线看观看| 欧美高清在线精品一区| 日韩女优一区二区| 日韩av在线电影观看| 欧美日韩一区成人| 岳乳丰满一区二区三区| 国产精品电影观看| 免费在线看一区| 久久久久久久久久久久久久久久av | 日韩精品在线视频美女| 久久精品女人毛片国产| 欧美电影一区二区| 中国av免费看| 日韩欧美电影一二三| 999久久久国产| 亚洲石原莉奈一区二区在线观看| 一区二区视频免费看| 欧美一级成年大片在线观看| 激情深爱一区二区| 国产精品亚洲αv天堂无码| 国产精品国产三级国产aⅴ入口 | 熟女少妇一区二区三区| 亚洲视频第一页| 亚洲第一在线播放| 在线中文字幕日韩| 亚洲天堂999| 国产不卡一区二区在线观看| 久久久无码精品亚洲日韩按摩| 亚洲制服中文字幕| 亚洲福中文字幕伊人影院| 蜜臀一区二区三区精品免费视频| 精品日韩欧美在线| 天堂av在线免费| 国内av一区二区| 视频直播国产精品| 日日噜噜夜夜狠狠视频欧美人| 红桃av在线播放| 日韩在线免费视频| 国产www免费观看| 欧美亚洲日本网站| 伊人色综合久久天天人手人婷| 久久中文免费视频| 91精品国产综合久久香蕉最新版 | 欧美视频1区| 欧美日韩国产中文| 91亚洲国产成人久久精品麻豆| 亚洲xxx自由成熟| 综合中文字幕亚洲| 丰满少妇高潮久久三区| 国产成人精品日本亚洲11| 在线影视一区二区三区| 人成网站在线观看| 99er在线视频| 精品国产91亚洲一区二区三区婷婷| www天堂在线| 亚洲天堂国产视频| 国产精品自拍小视频| 欧美三级一区二区| 精品亚洲porn| 亚洲最大视频网| 国产精品高潮呻吟久久av无限| 一区二区三区国产豹纹内裤在线| 一级特黄aaa大片| 午夜精品久久久内射近拍高清| 欧美性xxxxxxxxx| 国产91免费看| 中文字幕一区二区在线观看视频 | 亚洲欧美精品久久| 青春草国产视频| 日本久久久久久| 日韩三级免费观看| 成人一级黄色片| 中国特黄一级片| 中文字幕中文字幕一区三区| 亚洲国产精品推荐| 国产精品美女视频| 亚洲在线视频播放|