![]()
谷歌正秘密為其企業(yè)級產(chǎn)品Gemini Enterprise開發(fā)一項新功能:一個多智能體(multi-agent)系統(tǒng),它能夠扮演聯(lián)席科學(xué)家或研究員的角色,幫助用戶提煉想法,實(shí)現(xiàn)研究自動化
具體來說,該系統(tǒng)的工作流程是:接收一個主題和一套評估標(biāo)準(zhǔn),生成大量想法,然后啟動一個智能體團(tuán)隊,以錦標(biāo)賽(tournament-style)的形式對這些想法進(jìn)行評估
值得注意的是,該系統(tǒng)能夠讓Gemini就單個問題持續(xù)運(yùn)行約40分鐘,這對于一個面向用戶的產(chǎn)品而言,是一次非常長的連續(xù)運(yùn)行
在運(yùn)行結(jié)束后,用戶會收到一份根據(jù)所選標(biāo)準(zhǔn)從優(yōu)到劣排序的想法列表,一次運(yùn)行可產(chǎn)出約100個想法
![]()
對于每個想法,用戶會得到概述、詳細(xì)描述、評審摘要、完整評審報告以及專門的錦標(biāo)賽表現(xiàn)報告。這份錦標(biāo)賽表現(xiàn)報告會作為一項獨(dú)立輸出,可供單獨(dú)瀏覽。所有生成的想法都是可選的,方便用戶專注于特定選項并進(jìn)行更深入的探索
![]()
兩款核心智能體:“想法生成”與“聯(lián)席科學(xué)家”
在目前的預(yù)覽版中,谷歌準(zhǔn)備了三款預(yù)置智能體,其中兩款建立在這一多智能體錦標(biāo)賽系統(tǒng)之上
![]()
一款名為“想法生成”(Idea Generation)。用戶提供一個主題,該智能體便會啟動多智能體工作流,通過錦標(biāo)賽式評估來生成與該主題相關(guān)的想法并進(jìn)行排序
另一款名為“聯(lián)席科學(xué)家”(Co-scientist),更側(cè)重于科學(xué)家和研究人員。它允許用戶指定一個研究課題,提供額外數(shù)據(jù),然后由一個智能體團(tuán)隊通過相同的錦標(biāo)賽機(jī)制來生成和評估想法,但更聚焦于研究和科學(xué)用例
L3級AI的體現(xiàn):強(qiáng)大的算力投入
這一設(shè)置最引人注目的方面之一,是其背后巨大的算力投入。
讓智能體就單個任務(wù)工作約40分鐘,與典型的智能體工具相比,算力消耗相當(dāng)大。在整個運(yùn)行期間,系統(tǒng)會持續(xù)對問題進(jìn)行迭代
![]()
與現(xiàn)有的智能體實(shí)現(xiàn)相比,這似乎是一個重要的進(jìn)步。即使是像ChatGPT中那些能夠使用瀏覽器模式的高級智能體,通常也受到有限的上下文窗口和時間預(yù)算的限制。相比之下,谷歌的這種方法被設(shè)計成一個面向用戶的產(chǎn)品,直接向企業(yè)客戶開放了非常高的算力
![]()
這也與“L3級AI”的理念相符,即智能體能夠持續(xù)較長時間處理一個問題。在這種背景下,單任務(wù)運(yùn)行40分鐘是一個有力的例證
目前,所有這些功能都出現(xiàn)在開發(fā)中的Gemini Enterprise內(nèi)部,尚未對普通用戶開放
不止于原始建議,輸出結(jié)構(gòu)化研究方向
在實(shí)踐中,其主要輸出是一套經(jīng)過提煉的想法
但這些不僅僅是原始建議,而是結(jié)構(gòu)化的研究方向。考慮到輸入的數(shù)據(jù)和原始問題,這些方向可能帶來極具價值的洞見。這體現(xiàn)了谷歌正致力于為組織、企業(yè)和研究團(tuán)隊提供極其強(qiáng)大的智能體
![]()
當(dāng)該功能最終發(fā)布時,可能會是一次重大飛躍,特別是如果這些智能體最終由尚未發(fā)布的Gemini 3 Pro驅(qū)動。目前,Gemini 3 Pro尚未在Gemini Enterprise中可用,因此尚不清楚驅(qū)動這些實(shí)驗(yàn)性智能體的具體模型。
此外,該系統(tǒng)還有一個工作流程細(xì)節(jié):當(dāng)用戶提交提示時,系統(tǒng)會首先展示一份計劃中的評估和想法維度的摘要。用戶在審查并批準(zhǔn)該摘要后,才能啟動實(shí)際任務(wù),以確保在投入大量算力之前,初始提示被正確理解
另一項新功能:與文檔對話
除了多智能體錦標(biāo)賽流程外,還有另一款名為“與文檔對話”的智能體,它擁有一個獨(dú)立的UI
該智能體允許用戶上傳最大30MB的PDF文件,并與這些文檔進(jìn)行明確的對話。其目標(biāo)是讓模型能夠分析和整合多達(dá)30MB的PDF內(nèi)容到上下文,以便用戶從現(xiàn)有文檔中提取更有意義的信息。
該功能同樣是Gemini Enterprise的一部分,尚未發(fā)布,且目前在生產(chǎn)環(huán)境中無法使用。
在Gemini Enterprise正在開發(fā)的多項功能中,多智能體錦標(biāo)賽工作流和專注于文檔的智能體最為突出。
特別是基于錦標(biāo)賽的多智能體設(shè)置,看起來是一個突破性的產(chǎn)品方向,其他LLM提供商尚未真正提供達(dá)到這種水平的服務(wù)。多智能體錦標(biāo)賽在面向用戶的工具中仍然很少見
一旦這些智能體更加成熟,看到它們正式的評估和基準(zhǔn)測試將非常有價值。僅從描述來看,“聯(lián)席科學(xué)家”智能體對于那些積極探索新科學(xué)方向的大型組織和研究團(tuán)隊來說,已經(jīng)像一個非常有吸引力的工具。
目前尚不清楚這些智能體將于何時發(fā)布,也不確定是否會向企業(yè)客戶之外的用戶提供,但這絕對是值得關(guān)注的動向
參考:
https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/



京公網(wǎng)安備 11011402013531號