環(huán)球網(wǎng)
12月12日消息,據(jù)TechCrunch報道,在OpenAI發(fā)布GPT-5.2之后,谷歌迅速推出Gemini Deep Research深度研究智能體,同步發(fā)布全新Interactions API并首次面向開發(fā)者開放,同時開源深度搜索評估基準(zhǔn)DeepSearchQA。此次升級標(biāo)志著AI自主研究能力正式邁入工業(yè)化應(yīng)用階段,為各行業(yè)復(fù)雜研究任務(wù)提供了新的技術(shù)解決方案。
![]()
Gemini Deep Research基于Gemini 3 Pro構(gòu)建,專為長周期內(nèi)容收集與綜合任務(wù)優(yōu)化打造,其幻覺率較此前模型降低40%,是谷歌迄今“最具事實性”的智能模型。該智能體通過擴(kuò)展面向搜索的多步驟強(qiáng)化學(xué)習(xí),能夠在復(fù)雜信息環(huán)境中以更高精度自主導(dǎo)航,通過反復(fù)規(guī)劃研究路徑——包括形成搜索查詢、閱讀結(jié)果、識別信息缺口并再次搜索,實現(xiàn)深度信息挖掘。谷歌DeepMind產(chǎn)品經(jīng)理路卡斯·哈斯透露,該智能體已達(dá)成行業(yè)領(lǐng)先水平,在谷歌新基準(zhǔn)測試中得分46.4%,在BrowseComp基準(zhǔn)上表現(xiàn)與GPT-5 Pro相當(dāng),而價格僅為后者的十分之一左右。在Humanity's Last Exam(HLE人類終極考試)、DeepSearchQA及BrowseComp等多項權(quán)威評測中,該智能體均取得最新最優(yōu)成績,可在顯著降低成本的同時生成高質(zhì)量深入研究報告。谷歌表示,這項能力未來將逐步應(yīng)用于Google Search、NotebookLM、Google Finance及Gemini App等核心產(chǎn)品。
為解決現(xiàn)有評測難以體現(xiàn)真實世界多步驟研究復(fù)雜性的問題,谷歌同步開放DeepSearchQA數(shù)據(jù)集與工具。該基準(zhǔn)涵蓋17個領(lǐng)域、900個“因果鏈”任務(wù),每個任務(wù)的每一步均依賴前序分析,要求智能體生成詳盡答案集,以此精準(zhǔn)衡量其研究精度與檢索全面性。此外,DeepSearchQA還可作為“思考時間”效益的診斷工具,谷歌內(nèi)部測試顯示,增加智能體的搜索與推理步驟可顯著提升其任務(wù)表現(xiàn),這一方向?qū)⒃谖磥戆姹局谐掷m(xù)探索。目前,開發(fā)者可訪問該數(shù)據(jù)集、排行榜與Colab示例,并查閱相關(guān)技術(shù)報告。
在實際應(yīng)用場景中,Gemini Deep Research已在多個對精度和上下文理解要求較高的行業(yè)展現(xiàn)出顯著價值。在金融服務(wù)領(lǐng)域,企業(yè)借助該智能體自動化完成盡職調(diào)查中的早期信息收集工作,整合市場信號、競爭格局與合規(guī)風(fēng)險等關(guān)鍵信息,大幅提升研究效率;在生物技術(shù)領(lǐng)域,Axiom Bio利用其處理藥物毒性預(yù)測相關(guān)的文獻(xiàn)分析,獲得了更高的研究深度與顆粒度,有效加速了藥物開發(fā)流程;在市場研究等領(lǐng)域,該智能體也憑借其強(qiáng)大的信息整合能力助力企業(yè)提升決策科學(xué)性。
通過此次推出的Interactions API,開發(fā)者可調(diào)用Gemini Deep Research構(gòu)建下一代自動化研究工具,該API具備多項核心特性:統(tǒng)一信息綜合功能可整合上傳文件(PDF、CSV等格式)與公共網(wǎng)頁數(shù)據(jù),且能處理大上下文量信息;支持通過提示詞定義輸出結(jié)構(gòu)、標(biāo)題、表格格式等,實現(xiàn)可控的報告生成;可為報告中各項事實提供細(xì)粒度來源引用,保障信息可信度;支持JSON schema結(jié)構(gòu)化輸出,方便下游環(huán)節(jié)處理。開發(fā)者可通過Google AI Studio的Gemini API Key使用該API構(gòu)建應(yīng)用。
谷歌方面表示,未來將持續(xù)升級相關(guān)功能,計劃加入原生圖表輸出能力,擴(kuò)展Model Context Protocol(MCP)支持以接入更多自定義數(shù)據(jù)源,并將在企業(yè)服務(wù)平臺Vertex AI上推出Deep Research服務(wù),為企業(yè)用戶提供更全面的技術(shù)支持,推動AI深度研究能力在更多行業(yè)場景的落地應(yīng)用。(純鈞)





京公網(wǎng)安備 11011402013531號