谷歌Agent正在憋大招：AI科學(xué)家內(nèi)測，錦標(biāo)賽制“煉”想法，一次跑40分鐘

IP屬地中國·北京 AI寒武紀(jì) 時間：2025-11-18 08:10:13

谷歌正秘密為其企業(yè)級產(chǎn)品Gemini Enterprise開發(fā)一項新功能：一個多智能體（multi-agent）系統(tǒng)，它能夠扮演聯(lián)席科學(xué)家或研究員的角色，幫助用戶提煉想法，實(shí)現(xiàn)研究自動化
具體來說，該系統(tǒng)的工作流程是：接收一個主題和一套評估標(biāo)準(zhǔn)，生成大量想法，然后啟動一個智能體團(tuán)隊，以錦標(biāo)賽（tournament-style）的形式對這些想法進(jìn)行評估
值得注意的是，該系統(tǒng)能夠讓Gemini就單個問題持續(xù)運(yùn)行約40分鐘，這對于一個面向用戶的產(chǎn)品而言，是一次非常長的連續(xù)運(yùn)行
在運(yùn)行結(jié)束后，用戶會收到一份根據(jù)所選標(biāo)準(zhǔn)從優(yōu)到劣排序的想法列表，一次運(yùn)行可產(chǎn)出約100個想法

對于每個想法，用戶會得到概述、詳細(xì)描述、評審摘要、完整評審報告以及專門的錦標(biāo)賽表現(xiàn)報告。這份錦標(biāo)賽表現(xiàn)報告會作為一項獨(dú)立輸出，可供單獨(dú)瀏覽。所有生成的想法都是可選的，方便用戶專注于特定選項并進(jìn)行更深入的探索

兩款核心智能體：“想法生成”與“聯(lián)席科學(xué)家”
在目前的預(yù)覽版中，谷歌準(zhǔn)備了三款預(yù)置智能體，其中兩款建立在這一多智能體錦標(biāo)賽系統(tǒng)之上

一款名為“想法生成”（Idea Generation）。用戶提供一個主題，該智能體便會啟動多智能體工作流，通過錦標(biāo)賽式評估來生成與該主題相關(guān)的想法并進(jìn)行排序
另一款名為“聯(lián)席科學(xué)家”（Co-scientist），更側(cè)重于科學(xué)家和研究人員。它允許用戶指定一個研究課題，提供額外數(shù)據(jù)，然后由一個智能體團(tuán)隊通過相同的錦標(biāo)賽機(jī)制來生成和評估想法，但更聚焦于研究和科學(xué)用例
L3級AI的體現(xiàn)：強(qiáng)大的算力投入
這一設(shè)置最引人注目的方面之一，是其背后巨大的算力投入。
讓智能體就單個任務(wù)工作約40分鐘，與典型的智能體工具相比，算力消耗相當(dāng)大。在整個運(yùn)行期間，系統(tǒng)會持續(xù)對問題進(jìn)行迭代

與現(xiàn)有的智能體實(shí)現(xiàn)相比，這似乎是一個重要的進(jìn)步。即使是像ChatGPT中那些能夠使用瀏覽器模式的高級智能體，通常也受到有限的上下文窗口和時間預(yù)算的限制。相比之下，谷歌的這種方法被設(shè)計成一個面向用戶的產(chǎn)品，直接向企業(yè)客戶開放了非常高的算力

這也與“L3級AI”的理念相符，即智能體能夠持續(xù)較長時間處理一個問題。在這種背景下，單任務(wù)運(yùn)行40分鐘是一個有力的例證
目前，所有這些功能都出現(xiàn)在開發(fā)中的Gemini Enterprise內(nèi)部，尚未對普通用戶開放
不止于原始建議，輸出結(jié)構(gòu)化研究方向
在實(shí)踐中，其主要輸出是一套經(jīng)過提煉的想法
但這些不僅僅是原始建議，而是結(jié)構(gòu)化的研究方向。考慮到輸入的數(shù)據(jù)和原始問題，這些方向可能帶來極具價值的洞見。這體現(xiàn)了谷歌正致力于為組織、企業(yè)和研究團(tuán)隊提供極其強(qiáng)大的智能體

當(dāng)該功能最終發(fā)布時，可能會是一次重大飛躍，特別是如果這些智能體最終由尚未發(fā)布的Gemini 3 Pro驅(qū)動。目前，Gemini 3 Pro尚未在Gemini Enterprise中可用，因此尚不清楚驅(qū)動這些實(shí)驗(yàn)性智能體的具體模型。
此外，該系統(tǒng)還有一個工作流程細(xì)節(jié)：當(dāng)用戶提交提示時，系統(tǒng)會首先展示一份計劃中的評估和想法維度的摘要。用戶在審查并批準(zhǔn)該摘要后，才能啟動實(shí)際任務(wù)，以確保在投入大量算力之前，初始提示被正確理解
另一項新功能：與文檔對話
除了多智能體錦標(biāo)賽流程外，還有另一款名為“與文檔對話”的智能體，它擁有一個獨(dú)立的UI
該智能體允許用戶上傳最大30MB的PDF文件，并與這些文檔進(jìn)行明確的對話。其目標(biāo)是讓模型能夠分析和整合多達(dá)30MB的PDF內(nèi)容到上下文，以便用戶從現(xiàn)有文檔中提取更有意義的信息。
該功能同樣是Gemini Enterprise的一部分，尚未發(fā)布，且目前在生產(chǎn)環(huán)境中無法使用。
在Gemini Enterprise正在開發(fā)的多項功能中，多智能體錦標(biāo)賽工作流和專注于文檔的智能體最為突出。
特別是基于錦標(biāo)賽的多智能體設(shè)置，看起來是一個突破性的產(chǎn)品方向，其他LLM提供商尚未真正提供達(dá)到這種水平的服務(wù)。多智能體錦標(biāo)賽在面向用戶的工具中仍然很少見
一旦這些智能體更加成熟，看到它們正式的評估和基準(zhǔn)測試將非常有價值。僅從描述來看，“聯(lián)席科學(xué)家”智能體對于那些積極探索新科學(xué)方向的大型組織和研究團(tuán)隊來說，已經(jīng)像一個非常有吸引力的工具。
目前尚不清楚這些智能體將于何時發(fā)布，也不確定是否會向企業(yè)客戶之外的用戶提供，但這絕對是值得關(guān)注的動向
參考：
https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

上海電信回應(yīng)羅永浩網(wǎng)速慢投訴

羅永浩被大金空調(diào)售后整破防：清洗需要1.5萬，摳個濾網(wǎng)收283元

字節(jié)跳動全年利潤500億美元？知情人士回應(yīng)

vivo X200T手機(jī)規(guī)格曝光：天璣9400+芯片，5000萬主攝

微軟商城Surface獨(dú)家好價，支付寶付款額外補(bǔ)貼、至高優(yōu)惠6000+

圍墻倒塌前夜：iOS 與 Android 迎來“世紀(jì)大和解”

全站最新

上海電信回應(yīng)羅永浩網(wǎng)速慢投訴

羅永浩被大金空調(diào)售后整破防：清洗需要1.5萬，摳個濾網(wǎng)收283元

字節(jié)跳動全年利潤500億美元？知情人士回應(yīng)

vivo X200T手機(jī)規(guī)格曝光：天璣9400+芯片，5000萬主攝

熱門推薦

上海電信回應(yīng)羅永浩網(wǎng)速慢投訴

羅永浩被大金空調(diào)售后整破防：清洗需要1.5萬，摳個濾網(wǎng)收283元

字節(jié)跳動全年利潤500億美元？知情人士回應(yīng)

羅永浩錘子軟件在上海成立分公司

一加Turbo系列電池突破9000mAh 李杰：強(qiáng)得可怕

全球大模型第一股要來了智譜發(fā)布IPO招股書：代碼能力并列全球第一

行業(yè)唯一闊折疊！華為Pura X最高優(yōu)惠800元：6899元起

vivo X200T手機(jī)規(guī)格曝光：天璣9400+芯片，5000萬主攝

微軟商城Surface獨(dú)家好價，支付寶付款額外補(bǔ)貼、至高優(yōu)惠6000+

《互聯(lián)網(wǎng)平臺價格行為規(guī)則》印發(fā)

圍墻倒塌前夜：iOS 與 Android 迎來“世紀(jì)大和解”

阿里字節(jié)騰訊的CEO身旁都有了一個AI科學(xué)家

《互聯(lián)網(wǎng)平臺價格行為規(guī)則》印發(fā)

《互聯(lián)網(wǎng)平臺價格行為規(guī)則》印發(fā)：不得以低于成本的價格銷售商品或者提供服務(wù)，擾亂市場競爭秩序

AI處理簡歷、智能體面試，未來人力資源科技在這場大會上“扎堆兒”