亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 新科技 ? 正文

谷歌發(fā)布智能體Scaling Law:180組實(shí)驗(yàn)打破傳統(tǒng)煉金術(shù)

IP屬地 中國(guó)·北京 機(jī)器之心Pro 時(shí)間:2025-12-12 12:23:59




機(jī)器之心報(bào)道

編輯:Panda

智能體(Agent),即基于語(yǔ)言模型且具備推理、規(guī)劃和行動(dòng)能力的系統(tǒng),正在成為現(xiàn)實(shí)世界 AI 應(yīng)用的主導(dǎo)范式。

盡管其已被廣泛采用,但決定其性能的原則仍未被充分探索,導(dǎo)致從業(yè)者只能依賴啟發(fā)式經(jīng)驗(yàn),而非有原理依托的設(shè)計(jì)選擇。

現(xiàn)在,谷歌的一篇新論文填補(bǔ)了這一空白!

他們通過(guò)大量實(shí)驗(yàn)找到了智能體的 Scaling Law,只不過(guò)他們將其稱為quantitative scaling principles,即定量擴(kuò)展原則。



論文標(biāo)題:Towards a Science of Scaling Agent Systems論文地址:https://arxiv.org/abs/2512.08296

具體來(lái)說(shuō),他們將這種擴(kuò)展定義為智能體數(shù)量、協(xié)作結(jié)構(gòu)、模型能力和任務(wù)屬性之間的相互作用。

他們?cè)谒膫€(gè)不同的基準(zhǔn)測(cè)試中對(duì)此進(jìn)行了評(píng)估:Finance-Agent(金融推理)、BrowseComp-Plus(網(wǎng)絡(luò)導(dǎo)航)、PlanCraft(游戲規(guī)劃)和 Workbench(工作流執(zhí)行)。



利用五種典型的智能體架構(gòu)(單智能體系統(tǒng)以及四種多智能體系統(tǒng):獨(dú)立型、中心化、去中心化、混合型),并在三個(gè) LLM 家族(OpenAI, Google, Anthropic)中進(jìn)行實(shí)例化,谷歌這個(gè)團(tuán)隊(duì)對(duì) 180 種配置進(jìn)行了受控評(píng)估,標(biāo)準(zhǔn)化了工具、提示結(jié)構(gòu)和 token 預(yù)算,以將架構(gòu)效應(yīng)從實(shí)施混雜因素中隔離出來(lái)。



他們使用經(jīng)驗(yàn)性的協(xié)作指標(biāo)(包括效率、開銷、錯(cuò)誤放大和冗余)推導(dǎo)出了一個(gè)預(yù)測(cè)模型,該模型實(shí)現(xiàn)了交叉驗(yàn)證 R2=0.513,通過(guò)對(duì)任務(wù)屬性建模而非過(guò)度擬合特定數(shù)據(jù)集,實(shí)現(xiàn)了對(duì)未見任務(wù)領(lǐng)域的預(yù)測(cè)。

是的,智能體的 Scaling Law 找到了!并且準(zhǔn)確度還相當(dāng)高,谷歌表示:「我們的框架在預(yù)測(cè)保留任務(wù)的最佳架構(gòu)方面實(shí)現(xiàn)了 87% 的準(zhǔn)確率。」這樣一來(lái),智能體的部署決策將第一次獲得強(qiáng)有力的原則支撐。



實(shí)驗(yàn)與結(jié)果:打破「人多力量大」的迷思

為了找到這套定量原則,谷歌團(tuán)隊(duì)沒(méi)有僅僅停留在理論推導(dǎo),而是進(jìn)行了一場(chǎng)堪稱暴力窮舉的實(shí)證研究。

他們動(dòng)用了三大模型家族(Google Gemini、OpenAI GPT、Anthropic Claude),在金融、網(wǎng)購(gòu)、游戲規(guī)劃等不同場(chǎng)景下進(jìn)行了 180 組受控實(shí)驗(yàn)。

實(shí)驗(yàn)結(jié)果不僅令人意外,甚至顛覆了許多開發(fā)者的直覺。簡(jiǎn)單來(lái)說(shuō),他們發(fā)現(xiàn)了一些規(guī)律。

任務(wù)決定成敗:有的場(chǎng)景是神助攻,有的是豬隊(duì)友

過(guò)去人們常說(shuō)「三個(gè)臭皮匠,頂個(gè)諸葛亮」,但這篇論文告訴我們:這完全取決于你們?cè)诟墒裁慈蝿?wù)。



紅榜(適合組團(tuán)): 在金融分析(Finance-Agent)這類任務(wù)中,多智能體協(xié)作是大殺器。中心化架構(gòu)(有一個(gè)「指揮官」分派任務(wù))能讓性能暴漲 80.9%。為什么?因?yàn)檫@類任務(wù)可以拆分 —— 你查財(cái)報(bào),我算匯率,他做總結(jié),大家并行工作,效率極高。

黑榜(切忌組團(tuán)): 在游戲規(guī)劃(PlanCraft)這類任務(wù)中,所有多智能體架構(gòu)都翻車了,性能慘跌 39% 到 70%。原因在于這類任務(wù)環(huán)環(huán)相扣(必須先砍樹,才能做木板),強(qiáng)行把流程拆給不同的人,光是溝通成本就把推理能力消耗殆盡了。

三大隱形殺手:什么在阻礙智能體變強(qiáng)?

通過(guò)對(duì)數(shù)據(jù)的深度挖掘,谷歌團(tuán)隊(duì)量化了阻礙智能體擴(kuò)展的三大核心因素:

第一,工具越多,協(xié)作越難(工具-協(xié)作權(quán)衡)

如果任務(wù)需要用到大量工具(比如 16 個(gè)以上的 API),再引入多智能體協(xié)作就是一場(chǎng)災(zāi)難。實(shí)驗(yàn)數(shù)據(jù)顯示,工具密集的任務(wù)會(huì)因巨大的溝通開銷而不僅沒(méi)變快,反而變慢、變笨。

第二,能力有天花板(能力飽和效應(yīng))

這是最反直覺的一點(diǎn):如果單個(gè)智能體已經(jīng)夠聰明了,就別再給它找?guī)褪至恕?數(shù)據(jù)表明,當(dāng)單智能體的基線準(zhǔn)確率超過(guò) 45% 時(shí),再增加智能體進(jìn)行協(xié)作,收益往往是負(fù)的。所謂「幫倒忙」,在 AI 世界里是真實(shí)存在的。

第三,沒(méi)有指揮官,錯(cuò)誤會(huì)指數(shù)級(jí)放大

如果你讓一群智能體各自為戰(zhàn)(獨(dú)立型架構(gòu)),錯(cuò)誤會(huì)被放大 17.2 倍 —— 因?yàn)闆](méi)人檢查,一個(gè)人的錯(cuò)會(huì)傳給所有人。但如果引入一個(gè)「指揮官」進(jìn)行中心化管理,錯(cuò)誤放大率能被控制在 4.4 倍。這證明了在多智能體系統(tǒng)中,架構(gòu)設(shè)計(jì)比單純堆人數(shù)更重要。

模型性格測(cè)試:誰(shuí)是最佳指揮官?

除了任務(wù)和架構(gòu),論文還發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:不同廠商的模型有不同的協(xié)作性格。在選擇團(tuán)隊(duì)成員時(shí),你不能只看智商(IQ),還要看它們合不合群。

Google Gemini:擅長(zhǎng)「層級(jí)管理」的執(zhí)行官。Gemini 模型在中心化架構(gòu)下表現(xiàn)出了驚人的適應(yīng)性。在金融任務(wù)中,Gemini 的中心化協(xié)作帶來(lái)了 +164.3% 的恐怖提升。數(shù)據(jù)表明,它最聽指揮,執(zhí)行力最強(qiáng),且在不同架構(gòu)下的性價(jià)比最為平衡。

OpenAI GPT:擅長(zhǎng)「復(fù)雜溝通」的交際花。GPT 系列在混合型架構(gòu)(Hybrid)中表現(xiàn)最佳 。雖然混合架構(gòu)的溝通成本很高,但 GPT 似乎擁有獨(dú)特的「通信協(xié)同效應(yīng)」(Communication Synergy),能駕馭復(fù)雜的交互網(wǎng)絡(luò),不僅能聽指揮,還能搞定同級(jí)之間的橫向溝通 。

Anthropic Claude:穩(wěn)健但敏感的保守派。Claude 對(duì)協(xié)作開銷非常敏感,一旦溝通太復(fù)雜,成本就會(huì)飆升(每提升 1% 性能的成本是 Google 的 2 倍)。因此,它最適合簡(jiǎn)單直接的中心化架構(gòu),表現(xiàn)最穩(wěn)(方差最小)。更有趣的是,它是唯一一個(gè)在「弱指揮官帶強(qiáng)兵」(異構(gòu)混合)模式下還能提升性能的模型,展現(xiàn)出了獨(dú)特的容錯(cuò)性



結(jié)果:這就是我們要找的「預(yù)測(cè)公式」

最終,基于上述發(fā)現(xiàn),谷歌推導(dǎo)出了一個(gè)預(yù)測(cè)模型。這個(gè)模型不依賴玄學(xué),而是基于效率、開銷、錯(cuò)誤放大率等硬指標(biāo)。





它的威力如何?在預(yù)測(cè)完全沒(méi)見過(guò)的任務(wù)配置時(shí),這套理論能以 87% 的準(zhǔn)確率告訴你:對(duì)于當(dāng)前的任務(wù)和模型,到底該用單打獨(dú)斗,還是團(tuán)隊(duì)協(xié)作,亦或是某種特定的組隊(duì)方式。

這標(biāo)志著智能體系統(tǒng)設(shè)計(jì)正式告別了「煉金術(shù)」時(shí)代,進(jìn)入了可計(jì)算、可預(yù)測(cè)的「化學(xué)」時(shí)代。

更多詳情請(qǐng)?jiān)L問(wèn)原論文。

免責(zé)聲明:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
亚洲男人天堂av| 欧美日韩精品福利| 韩国三级在线一区| 国产91高潮流白浆在线麻豆| 中文字幕乱码视频| 婷婷色一区二区三区| 中文字幕在线观看第三页| 欧美午夜免费| 国产精品入口免费视| 久久视频在线看| 精品精品国产高清a毛片牛牛 | 欧美成人中文字幕在线| 欧美一区二区三区爱爱| 亚洲成人1区2区| 中文字幕日本不卡| 中文久久乱码一区二区| 99久久er热在这里只有精品15| 老牛嫩草一区二区三区日本| 国产一级特黄aaa大片| 日本va中文字幕| 日韩网站在线免费观看| 给我免费播放片在线观看| 日韩有码在线电影| 精品国产制服丝袜高跟| 欧美日韩亚洲综合一区二区三区| 亚洲国产日日夜夜| 亚洲精品亚洲人成人网在线播放| 国产精品乱人伦中文| 日韩成人伦理电影在线观看| 亚洲国产中文字幕在线| 久久精品视频6| 国产精品二区视频| 二级片在线观看| 蜜桃传媒视频麻豆第一区免费观看| 91在线免费视频| 精品国产一区二区三区四区vr | 国产亚洲一区二区三区| 丁香激情综合国产| 99精品视频在线播放观看| 国产在线国偷精品产拍免费yy| 首页国产欧美日韩丝袜| 亚洲人妻一区二区三区| 亚洲精品久久久狠狠狠爱| 99在线小视频| 97人妻一区二区精品免费视频 | 亚洲一区二区欧美| 亚洲小说欧美激情另类| 日本一区二区三级电影在线观看| 国产亚洲短视频| 久久精品无码一区二区三区| 久久美女艺术照精彩视频福利播放| va亚洲va日韩不卡在线观看| 成人午夜视频在线| 国产午夜精品一区二区三区嫩草| 91麻豆精东视频| 一区二区理论电影在线观看| 亚洲美女一区二区三区| 一区二区三区欧美视频| 精品成人国产在线观看男人呻吟| 五月激情六月综合| 在线精品视频一区二区| 欧美精品一二三| 日韩精品一区二区三区在线| 亚洲精品在线不卡| 最新亚洲国产精品| 欧洲中文字幕国产精品| 国产精品久久综合av爱欲tv| 国产精品一区二区三区四区五区| 精品蜜桃一区二区三区| 国产精品av免费观看| 久热免费在线观看| 魔女鞋交玉足榨精调教| 国产成人自拍网站| 97超碰资源站| 激情综合网av| 国产丝袜在线精品| 亚洲国产视频在线| 日韩免费看网站| 性色av一区二区三区| 精品视频在线观看| 亚洲欧洲国产日韩精品| 美女一区二区三区视频| 中文字幕一区二区人妻在线不卡| 青青草av在线播放| 精品一区二区国语对白| 欧美国产日产图区| 7777精品伊人久久久大香线蕉完整版 | 精品福利樱桃av导航| 精品国精品国产| 欧美中文字幕精品| 欧美日韩精品不卡| 天天躁日日躁狠狠躁免费麻豆| 一级片手机在线观看| 最近中文字幕免费在线观看| 国产一区二区三区综合| 亚洲www啪成人一区二区麻豆| 中文字幕精品—区二区| 国产日韩在线观看av| 国产精品69久久久| 91资源在线播放| 亚洲精品中文字幕成人片| 亚洲欧美另类综合偷拍| 欧美大片一区二区| 国产精品www网站| 好吊妞无缓冲视频观看| av资源在线免费观看| 精品无人码麻豆乱码1区2区| 亚洲成人1区2区| 欧美成年人在线观看| 久久久久se| 丰满少妇中文字幕| 亚洲精品一区二区三区四区| 国产精品每日更新在线播放网址| 亚洲国产精品悠悠久久琪琪| 国产欧美精品在线| 日本va中文字幕| 最近日韩免费视频| 91理论电影在线观看| 亚洲电影免费观看高清完整版在线观看 | 久久99久久精品国产| 中文字幕第66页| 国产在成人精品线拍偷自揄拍| 中文字幕乱码日本亚洲一区二区| 日韩av网站大全| 高清日韩一区| 少妇被狂c下部羞羞漫画| 亚洲欧美高清视频| 午夜亚洲国产au精品一区二区| 97精品国产91久久久久久| 中文字幕一区综合| 天堂网中文在线观看| 国产成人aaa| 国产一区二区三区精品久久久 | a天堂中文字幕| 国产真实乱子伦精品视频| 欧美日本一区二区三区| 91精品在线看| 亚洲精品视频久久久| 天天躁日日躁狠狠躁喷水| 在线亚洲一区二区| 91精品天堂| 欧美做受高潮6| 99久久久国产精品免费蜜臀| 日韩精品丝袜在线| 宅男一区二区三区| 日韩久久久久久久久| 欧美国产精品一区二区| 麻豆国产va免费精品高清在线| 成年人免费大片| 国产精品乱码一区二区| 午夜不卡在线视频| 91九色蝌蚪成人| 亚洲自拍偷拍图| 亚洲欧美另类综合偷拍| 亚洲a在线观看| 欧美xxxooo| 亚洲欧美激情一区二区| 国产自摸综合网| 很污很黄的网站| 亚洲另类在线视频| 国产精品免费久久久久久| 亚洲综合自拍网| 国产色综合久久| 成人激情免费在线| 婷婷激情五月综合| 天天综合网天天综合色| 精品一区二区三区免费毛片| 午夜精品一区二区三区视频| 亚洲激情在线激情| 99理论电影网| 亚洲中文字幕一区二区| 欧美日韩在线亚洲一区蜜芽| 亚洲制服欧美久久| 91精品国产乱码久久| 欧美日韩视频在线一区二区| 韩国黄色一级大片| 精品国产av一区二区三区| 欧美一激情一区二区三区| 可以在线看的av网站| 爽好久久久欧美精品| 精品福利在线导航| 久久久久久久激情| 国内成人精品2018免费看| 欧美激情极品视频| 波多野结衣福利| 中文字幕va一区二区三区| 国产福利精品av综合导导航| 亚洲一级生活片| 欧洲一区在线观看| 波多野结衣家庭教师视频| 国产一区二区91| 国产xxx69麻豆国语对白| 婷婷激情四射网| 一本大道综合伊人精品热热 | 激情内射人妻1区2区3区| 国产精品一品二品| 国产精品久久久久久久久久99 | 久久久国产亚洲精品| 欧美大片在线免费观看| 高清国产在线观看| 黑丝美女久久久| 69sex久久精品国产麻豆| 蜜臀av性久久久久蜜臀aⅴ四虎| 777777777亚洲妇女| 久久综合激情网| 欧美成人欧美edvon| 久久久精品视频国产| 欧美激情一区二区三区四区| 欧美午夜精品久久久久免费视 | 99久久国产宗和精品1上映| 久久蜜桃av一区二区天堂| 国产精品久久国产三级国电话系列| 一级黄色大片免费| 在线看国产精品| 欧美狂猛xxxxx乱大交3| 7777精品伊人久久久大香线蕉的| a在线观看免费视频| 亚洲欧美激情一区二区| 日本男女交配视频| 北岛玲一区二区三区四区| 91精品国产综合久久久久久丝袜| 国产精品久久久久久69| 欧美高跟鞋交xxxxhd| 久久国产精品免费看| 国产成人一区三区| 人人妻人人玩人人澡人人爽| 91福利入口| 日本在线不卡一区| 欧美亚洲色图视频| 国产成人精品一区二区三区四区| 久久久综合亚洲91久久98| 大胆亚洲人体视频| 久久综合久久久久| 性欧美疯狂xxxxbbbb| 中文字幕无码人妻少妇免费| 亚洲精品国产精品国产自| 国产精品99re| 日韩在线播放一区| 精品在线视频观看| 久久亚洲私人国产精品va| 337p粉嫩色噜噜噜大肥臀| 成人性生交xxxxx网站| 国产一区二区中文字幕| 蜜桃精品久久久久久久免费影院 | 尤物yw午夜国产精品视频| 久久久美女视频| 欧美日韩成人在线视频| 一本大道久久a久久精二百| 粉嫩aⅴ一区二区三区| 美女一区二区三区视频| 韩日午夜在线资源一区二区| 亚洲香蕉伊综合在人在线视看| 久久网站热最新地址| 国产成人无码精品久久久久| 久久综合久久色| 亚洲毛片在线免费观看| 国产精品18久久久久久久久久久久 | 96精品视频在线| 人人精品人人爱| 国产成人精品视频免费看| 亚洲乱码一区av黑人高潮 | 激情视频在线观看一区二区三区| 亚洲成a人v欧美综合天堂下载| 日韩污视频在线观看| 久久99久久久久久| 一区二区三区**美女毛片| 91高清免费看| 国产资源第一页| 尤物yw午夜国产精品视频| 亚洲一卡二卡三卡四卡| 国产激情视频一区二区三区欧美| 中文字幕在线视频第一页| 亚洲av网址在线| 欧洲黄色一级视频| 日本成人精品在线| 亚洲第一免费播放区| 99麻豆久久久国产精品免费优播| wwwwww日本| 日韩欧美国产二区| 国产激情精品久久久第一区二区| 亚洲乱妇老熟女爽到高潮的片| 91精品国产高清久久久久久91裸体 | xxxx在线免费观看| 92国产精品视频| 亚洲天堂av综合网| 成人免费观看视频| 久久国产精品国语对白| www.av91| 日韩免费观看高清完整版| 国产丰满果冻videossex| 深夜福利网站在线观看| 精品乱子伦一区二区三区| 久久九九国产精品怡红院| 亚洲精品美女久久久| 在线观看国产91| 国产三级精品三级| 麻豆国产欧美日韩综合精品二区| 免费观看日批视频| 国产精品1000部啪视频| 免费看污久久久| 久久亚洲一区二区三区四区五区高| 97aⅴ精品视频一二三区| www欧美com| 在线观看成人av电影| 精品国产一区二区三区四区在线观看| 亚洲精品国产a| 国产 日韩 欧美 在线| 日韩欧美激情一区二区| 久久精品久久久久久| 亚洲精品久久7777| 国产亚洲精品bt天堂精选| 国产精品一区二区在线播放 | 黄色成人在线免费观看| 77777亚洲午夜久久多人| 欧美日韩国产片| 日本不卡123| 日本a√在线观看| 欧美精品欧美精品| 欧美激情综合色| 91视频观看视频| 久久精品国产亚洲AV无码男同| 在线视频一二三区| 色噜噜狠狠狠综合曰曰曰88av| www国产成人| 无码人妻久久一区二区三区不卡| 免费国产黄色网址| 91精品国产91久久久久久吃药| 亚洲一区欧美一区| 色婷婷av一区二区三区之e本道| 日本少妇xxxx软件| 久久精品二区| 综合欧美国产视频二区| 一区二区久久久久久| 国内爆初菊对白视频| 国产成人无码精品久久二区三| 欧美日韩精品免费观看| 中文字幕一区二区三区电影| 亚洲免费观看在线视频| 成人性生交大片免费看视频在线| 日韩精品一区二区亚洲av观看| 手机视频在线观看| 国产成人jvid在线播放| 亚洲人吸女人奶水| 国产黄色高清视频| 性囗交免费视频观看| 国产日韩一区二区| 日韩精品中文字幕一区二区三区| 成人综合婷婷国产精品久久| 国产第100页| 色婷婷狠狠18| 国产欧美韩日| 日韩在线视频导航| 91精品综合久久久久久| 国产精品888| 国产精品三区在线观看| 天天成人综合网| 欧美精品久久久久久久| 亚洲猫色日本管| 国产精品51麻豆cm传媒| 日本中文字幕精品| 日韩av电影免费在线| 欧美大片免费观看在线观看网站推荐| 色综合视频一区二区三区高清| 国产激情视频一区二区三区欧美| 国产偷人爽久久久久久老妇app| 99九九99九九九99九他书对| 91欧美激情另类亚洲| 色噜噜国产精品视频一区二区| 欧美日韩亚洲一区二区| 裸体一区二区三区| 少妇一级淫片日本| 激情五月激情综合| 一级网站在线观看| 日韩欧美视频一区二区| 国产精品免费观看在线| 精品国模在线视频| 日韩一级高清毛片| 午夜国产精品影院在线观看| www.色精品| 男女男精品视频| 国产情侣激情自拍| 国产精品夜夜夜爽阿娇| 在线视频日韩一区| 国产911在线观看| 精品一区久久久久久| 久久久噜噜噜久噜久久| 中文字幕久热精品视频在线| 91精品国产免费| 欧美性极品少妇| 欧美日韩中文在线| 一区二区三区欧美| 国产精品高潮呻吟| 国产成人综合精品三级| 免费亚洲电影在线| 久久男女视频| 亚洲无码精品在线播放| 91美女免费看| 日韩经典在线观看| 久草视频免费在线播放| 欧美bbbbb性bbbbb视频| 精品国产免费久久久久久婷婷| 日韩av卡一卡二| 北条麻妃av高潮尖叫在线观看| av之家在线观看| 国产精品333| 欧美一级黄色片视频| 91日韩视频在线观看| 国产一级特黄a大片免费| 经典三级在线视频| 精品无码一区二区三区爱欲|