近日,OpenAI 宣稱要在 2028 年實現讓 AI 完全自主做研究,一下子又把焦點聚在了AI 科學家。
過去,AI 只是作為“助理”輔助研究者們進行科學研究。現在,美國哈佛大學與美國麻省理工學院聯合團隊宣布,他們開發了一套能讓 AI 真正“做科研”的通用生態系統 ToolUniverse,涵蓋構建科研環境、發現工具與優化、自動化組合科研流程等功能來支持探索科學問題、執行實驗并完成分析。
其相當于 AI 用于科研的“Linux 操作系統”:將 AI 可執行的科研操作抽象為統一的協議接口,使 AI 能夠以標準化方式調用、組合、優化超過 600 種科研工具(最新數據已增長到 700+種)。
基于 ToolUniverse 系統,研究人員無需具備 AI 背景,可以極低成本將任意大語言模型、推理模型或智能體在幾分鐘內快速生成特定領域的、懂科研的 AI 科學家,特別值得關注是,其無需額外的訓練或微調。
相較于現有框架,ToolUniverse 的獨特優勢在于對科學研究領域的專門優化,包括為各類 AI 科學家所需的科研活動設計了統一的“AI-工具交互協議”,并基于該協議衍生出專為科研領域打造的工具生態系統,以及配套的科研工具生成、集成、選擇、組合與優化功能,從而提升具體科研任務中的能力水平。
并且,可進一步在 ToolUniverse 生態中集成領域專用的科研環境。該系統所提供的科學環境不僅支持 AI 科學家執行科研任務,還可作為強化學習環境,用于訓練特定科研領域的 AI 科學家。
![]()
圖丨高尚華(高尚華)
高尚華在南開大學獲得博士學位,目前在哈佛醫學院從事博士后研究,致力于開發基礎模型和通用表征學習方法,以增強對現實世界的理解和交互。他的研究側重于通用技術,包括 AI 智能體、生成模型、自監督學習以及基礎模型的設計。
如果將科研世界看作是一臺電腦,那么 ToolUniverse 就是讓 AI 學會使用鍵盤和鼠標的系統。高尚華對 DeepTech 表示,ToolUniverse 助力科研人員探索 AI 在科學研究領域的潛力邊界。希望它成為未來 AI 科研的基礎設施,就如同 AI 工具界的“HTTP 協議”和 AI 科學家的“Linux 操作系統”。
為何真正懂科研的 AI 科學家還未真正到來?
AI 科學家因能夠主動推理、自動實驗和協作發現而被人們寄予厚望。但構建 AI 科學家門檻極高,科學研究本身具有高度定制化與專業化的特征,難以用規模化、自動化的方式快速構建。
實際上,每個科學領域都有獨特的研究范式、實驗方法和數據工具,AI 系統往往需要針對具體科研問題進行復雜的、個性化配置與調優。這一過程高度依賴具有 AI 與領域知識雙重背景的研究人員,因此大多數科研工作者難以直接構建或使用真正懂科研的 AI 科學家。
傳統的 AI 智能體通常只能完成如文獻檢索、摘要生成、數據初步分析等輔助性任務,難以勝任跨學科、長周期、動態演化的科研工作。其根本原因在于:現有 AI 智能體缺乏統一的方式理解、操作并與真實科研環境進行深度交互。也就是說,AI 無法像人類科學家一樣,以“通用實驗語言”與實驗設備、仿真平臺或計算資源自由協作。
![]()
(arXiv)
為系統性解決上述問題,研究團隊提出了“AI-工具交互協議”,顯著簡化了 AI 科學家與人類科學家、實驗操作以及科研環境之間的交互與溝通,讓 AI 科學家能夠理解工具的功能和參數,并用自然語言來描述或調用它們。
高尚華表示:“該協議基于通用語言,系統構建了一個可以自由組合的環境,把不同類型、不同來源的工具像搭建積木一樣連接起來。不僅顯著提升了工具之間的互操作性,還能夠輕松構建出符合科研需求的復雜流程。”
![]()
圖丨ToolUniverse 的六項關鍵能力(arXiv)
其中,實現創建和優化工具功能的Tool Discoverer 和 Tool Optimizer是基于這個環境的多智能體系統:
·Tool Discoverer負責把自然語言的功能需求自動轉化為符合“AI–工具交互協議”的結構化工具說明和可執行的程序代碼;
· Tool Optimizer則不斷測試和改進這些工具的說明,使其更準確、更易用。
兩個系統都會通過多輪自動反饋循環來自我糾錯,它們會使用 ToolUniverse 已有的工具進行網絡搜索、分析運行結果、根據測試和專家反饋不斷優化。ToolUniverse 不僅能自動生成新工具,還能讓這些工具被持續改進,從而自動化地提升工具的可靠性和可用性。
為應對不同科研領域中快速演進的工具生態與復雜多樣的科研操作,該團隊還設計了靈活多樣的工具注冊機制,使用戶能夠便捷地添加領域專用工具,并將其轉化為符合協議標準的可調用單元。
探索 AI 在科研領域的潛力邊界
在高膽固醇血癥的案例研究中,ToolUniverse 成功創建了一個 AI 科學家,并能識別具有預測良好特性的藥物的強效類似物。
相比 AI 科學家從靶點識別到候選化合物篩選全程自主完成,更令研究團隊振奮的是,AI 科學家能夠提出具有創新性的可解釋篩選機制,并自主設計實驗驗證路徑,從而推動藥物研發從傳統的“試錯模式”向“機制驅動、自我優化的智能發現體系”轉型。其意義不僅在于篩選化合物,更在于能夠理解其有效的機制。
傳統模型多停留在篩選層面,而 AI 科學家能夠融合多模態數據并與多種工具交互,從中推斷潛在的作用機制,闡明靶點如何影響疾病進程,進而使后續藥物篩選更具靶向性。在傳統流程中耗時數小時的任務,AI 科學家能夠通過設計成本最低、驗證效率最高的實驗組合來完成,從而避免盲目的大規模試錯。
![]()
(arXiv)
需要了解的是,ToolUniverse 與現有框架并非競爭關系,而是互補關系。它既可用于由 LangChain、AutoGen 等構建的智能體,也能將這些智能體轉化為科研環境的一部分,以供科研使用。
ToolUniverse 支持通過模型上下文協議(MCP,Model Context Protocol)向用戶開放工具,并在此基礎上增強了工具搜索等一系列功能。此外,ToolUniverse 能夠將現有的 MCP 工具無縫集成到其生態中,使這些原本獨立的工具能夠被組合與優化,從而實現更復雜的科研功能。
據了解,研究團隊正在與合作伙伴共同探索 ToolUniverse 在多個科學領域的應用。除了生物醫學,他們還在與集成電路領域的研究人員合作,開發用于集成電路芯片設計的 AI 科學家。
不同領域的工具生態構建基本策略,都圍繞連接人類科學家實際使用的工具,并將其轉化為 AI 可訪問的資源展開。各領域既存在許多通用工具(如文獻檢索與科學計算工具),也涉及領域特有的工具與集成策略。例如,在生物醫學領域,ToolUniverse 涵蓋數百個豐富的數據庫信息,以及針對藥物、蛋白質、單細胞等領域的大量計算模型。
而在集成電路設計這樣高度集成和流程化的領域中,行業主要依賴幾家公司提供的功能強大的電子設計自動化(EDA,Electronic design automation)工具。ToolUniverse 將優先完成 EDA 工具等專業設計軟件的適配,使 AI 能夠借助領域專有數據格式使用相關設計工具,在不改變原有設計流程的前提下,提升設計效率。此外,ToolUniverse 憑借其基于多智能體的工具發現系統,能根據領域用戶需求自動集成新工具,從而迅速拓展至新的科研領域。
總結來說,ToolUniverse 的關鍵能力體現在:標準化科研操作、工具互操作性、跨領域適配性。相關論文以《通過 ToolUniverse 實現 AI 科學家的民主化》(Democratizing AI scientists using ToolUniverse)為題發表在預印本網站 arXiv[1]。
![]()
圖丨相關論文(arXiv)
AI 科學家的終極目標:成為人類的科研導師
研究團隊目前的重點研究方向是進一步提升基于 AI 智能體的 AI 科學家在解決科學問題方面的能力,并持續構建開放的 ToolUniverse。在產業化層面,他們專注于開源社區的建立和發展。
研究團隊認為,實現 AI 科學家的產業化首先要解決普及和認可的問題,即讓科研人員能夠通過 ToolUniverse 接觸并使用 AI 科學家,從而提升工作效率,同時打通各類科研環境與 AI 科學家之間的連接。
在接下來的研究階段中,該團隊計劃繼續探索具備自主學習與迭代進化能力的 AI 科學家模型,使其能夠在復雜實驗環境中實現高度自主化,并可持續地長時間工作。
理想的 AI 科學家終極形態是能夠自主提出全新的科學假說,完成復雜的實驗驗證,并最終取得諾貝爾獎級別的科學發現。AI 科學家將不僅是人類科學家的合作伙伴,而是進一步成為指引人類科學家探索的“導師”。在科學發現的過程中,它有望為人類對世界的認知貢獻全新知識。
“目前,我們已與國內外相關領域的公司及研究機構建立聯系與合作,共同推動開放科研環境平臺的構建與廣泛應用。我們也歡迎產業界和學界的朋友加入我們,共同推進這一進程。”高尚華表示。
核心團隊介紹:
![]()
圖丨Richard Zhu(資料圖)
Richard Zhu 是哈佛大學的本科生,對人工智能、統計學、神經科學和生物醫學的交叉領域感興趣,研究經驗涵蓋生物信息學、神經退行性疾病、分子生物學、人工智能以及運動功能臨床評估。
![]()
圖丨隋芃瑋(資料圖)
隋芃瑋擁有哥倫比亞大學計算機科學碩士學位,專注于圖學習和大語言模型智能體在生物醫學和基因組學中的應用,研究重點是利用基于 LLM 的多智能體系統來推進治療科學,并對開發基于 LLM 的工作流引擎以用于治療學中的各種下游任務感興趣。
![]()
圖丨孔正倫(資料圖)
孔正倫是哈佛大學的博士后研究員,本科畢業于華中科技大學,曾在微軟研究院、ARM 和三星研究院擔任研究實習生,研究重點是開發適用于實際場景的高效深度學習方法,包括計算機視覺和自然語言處理。
![]()
圖丨黃曄鵬(資料圖)
黃曄鵬是哈佛醫學院的博士生,本科畢業于南京大學,研究方向是開發人工智能方法,用于研究多尺度擾動,涵蓋從細胞系統中的遺傳和化學干預到全腦神經調控。
參考資料:
1.相關論文:https://arxiv.org/pdf/2509.23426
2.項目主頁:https://aiscientist.tools
3.項目代碼:https://github.com/mims-harvard/ToolUniverse
4.Python 包:https://pypi.org/project/tooluniverse
運營/排版:何晨龍





京公網安備 11011402013531號