當 meta 創始人扎克伯格的“AI 挖人大戰”正在進行之時,其妻子普莉希拉·陳(Priscilla Chan)也在 AI 大模型領域做出了新成績。
![]()
圖丨扎克伯格與其妻子普莉希拉·陳(資料)
十年前,扎克伯格和美國哈佛大學生物學專業畢業的妻子共同創立了名為陳?扎克伯格倡議(CZI,Chan Zuckerberg Initiative)的慈善組織,該組織是一個致力于通過科技手段、戰略性投資以及跨領域合作,推動人類健康、教育公平和社會正義的長期項目。當時,扎克伯格還承諾捐出其在臉書 99% 的股份來支持這一組織[1]。在 CZI 的日常運營管理中,普莉希拉·陳擔任主要負責人。
近日,該組織發布一款名為 rBio 的推理模型,這是一個基于預訓練大模型的、通過強化學習后訓練的生物學推理模型。這也是一款基于虛擬細胞(Virtual Cell)模型模擬結果訓練的模型,能從虛擬細胞模型中學習推理能力,相關論文也已發表在bioRxiv。需要說明的是,虛擬細胞是一種通過計算模型和數學模擬來模擬真實細胞結構、功能和行為的研究工具。
![]()
(資料圖)
在訓練過程中,rBio 將從虛擬細胞模型中提取的信息,蒸餾為統一的自然語言模型,使用戶能夠輕松地針對復雜生物學問題展開縝密的逐步推理。這一過程將虛擬細胞模型轉變為推理模型的“生物學老師”,避開了僅依賴實驗數據作為訓練依據的局限。將一個或多個虛擬細胞模型的能力與大模型的對話式界面相結合,有望讓人們基于豐富的生物學基礎模型開展生物學問題研究,同時還能在熟悉的交互界面中進行操作。
與此同時,rBio 無需依賴非對即錯的硬性標簽,而是將與模型輸出的一致性作為反饋,在生物學的不確定性中學習推理。它能夠整合多個生物學模型的知識,實現對于復雜、多尺度系統的推理,從而幫助科研人員預測、解釋和設計生物學研究,并且無需依賴直接的實驗數據。
在訓練過程中,該模型利用生物學習模型獲取生物學知識進行驗證。研究人員表示,其所采用的軟驗證的方式能夠將生物學世界模型蒸餾至 rBio 中。以擾動預測為例,相比現有的最先進模型,rBio 在 PerturbQA 基準測試中表現出領先性能。與此同時,他們還驗證了組合式驗證器對于構建更通用 rBio 模型的優勢。其認為,rBio 提供了一個很好的概念驗證。它表明利用生物模型的預測結果,在無需使用實驗數據的前提之下,通過模擬的方式就能訓練出性能強大的推理模型,而這無疑代表了一種全新的訓練范式。
總的來說,rBio 顛覆了傳統模式——它將生物學世界模型的模擬結果用作“軟驗證器”,把虛擬細胞模型轉化為強化學習式推理的訓練環境,從而能夠吸收上述模型的核心知識。
就 rBio 的功能來說:
首先,在 PerturbQA 基準測試上,rBio 能夠通過語言提示來預測基因擾動效應。
其次,在跨任務泛化能力上,即便在不相關的模擬數據上訓練,它也能提升對未見過的擾動任務的性能。例如,研究人員基于 Transcriptformer(陳·扎克伯格倡議旗下的虛擬細胞模型之一)的基因表達共現模擬數據進行訓練。
再次,實現了具有競爭力的結果:通過思維鏈(COT,chain of thought)方法,僅使用模型生成的數據(測試時不依賴工具或檢索),rBio 在 PerturbQA 上的性能便達到了最先進水平(該水平由研究人員基于硬性實驗數據訓練的消融模型定義)。
![]()
(https://www.biorxiv.org/content/10.1101/2025.08.18.)
值得注意的是,北京大學本碩校友、英國劍橋大學博士畢業生 Donghui Li 是相關論文的共同作者之一。領英資料顯示,他在陳?扎克伯格倡議工作已有八年之久。
![]()
圖 | Donghui Li 是相關論文的共同作者之一(資料圖)
![]()
rBio 的核心構成
一般來說,推理模型在代碼或符號數學等形式化系統中針對驗證機制進行訓練。然而,在生物學等領域,人們通常無法獲得能夠支持大規模形式化驗證的精確規則,以至于往往需要通過在實驗室中檢驗假設來評估預測的有效性。通過真實實驗進行驗證不僅速度慢、成本高,而且無法隨計算規模進行擴展。rBio 的成功問世證明了這一事實,即人們可以利用生物學世界模型或其他先驗知識作為生物知識的近似驗證機制,通過軟驗證的方式來訓練推理系統,全程完全無需額外的實驗數據。
![]()
(資料圖)
在設計 rBio 的過程中,研究人員攻克了向大模型傳授生物學知識的一項根本性難題。對于此前的大模型來說,它們的設計初衷是從結果明確的問題中學習,例如“2+2=?”或“水是否由氫和氧組成”。但生物學問題必須納入不同程度的不確定性,比如一種新藥是否可能治愈某種特定癌癥。
以 TranscriptFormer 為基礎,研究人員針對大模型的訓練方法進行了創新。他們以一款現成的語言模型為框架,通過強化學習對 rBio 進行訓練。事實上,這也是一種 AI 領域的常見技術,模型會因給出正確答案而獲得獎勵。但是,本次研究人員并未采用“是非題”的形式,而是根據模型答案的正確概率來調整獎勵比例。這種新穎的方法讓 rBio 能夠學會提出與生物學現實相符的假設,從而提高了準確性、連貫性和科學價值。
![]()
一款借助虛擬細胞之力的大模型
據了解,TranscriptFormer 接收指令后返回的結果是復雜數據,而 rBio 則允許用戶使用通俗語言進行交互。例如,在訓練過程中,研究人員向 rBio 提出的問題結構如下:“基因 A 和基因 B 是否可能共表達?僅給出‘是/否’的二元答案。”而作為一款推理模型,rBio 能夠回答那些表述不同但本質相同的問題。
但是,假如采用“軟性”評估指標來訓練大模型,可能導致模型輸出失準。為了確保 rBio 不被誤導,研究團隊將其性能與多個基準大模型進行了對比。在各類細胞標記和擾動預測任務中,rBio 的表現均優于基準模型,這表明虛擬細胞模型能夠訓練出來“能對生物學問題進行推理”的可靠大模型。具體而言,rBio 的首個版本在 PerturbQA 基準測試中,性能超過了一些同類模型和 QWEN2.5 這樣的基準大模型。在使用思維鏈的時候,其性能與直接基于實驗數據訓練的高性能 rBio 消融模型相當。與此同時,rBio 通過從與擾動任務無關的 TranscriptFormer 模型進行零樣本學習,能夠顯著提升對于基因激活/抑制等擾動任務的理解能力。這一結果表明,虛擬細胞模型中蘊含的可遷移知識具有重要的后續研究價值。
盡管 rBio 有潛力從多種細胞生物學研究方法中學習,但是該模型首先是基于擾動模型、基因共表達模式以及從 TranscriptFormer 中提取的基因調控通路信息進行訓練的。這種多功能模型能夠針對不同物種和發育階段的多種細胞類型及狀態進行分類。用戶在使用時可以向 rBio 提出諸如“抑制基因 A 的作用是否會導致基因 B 的活性增強?”之類的問題。作為回應,模型會提供有關細胞后續變化的信息,例如從健康狀態向疾病狀態的轉變。
當面對全新的數據和假設時,rBio 能通過預測研究結果,從而能為研究人員節省時間,避免他們在成本高昂的實驗室研究中投入時間和資源去測試和排除多個假設。而針對這些問題的答案將深化我們對于阿爾茨海默病等神經退行性疾病相關基因互作機制的理解,進而有望推動早期干預手段的發展,甚至有朝一日實現這些疾病的徹底阻斷。
![]()
“讓 AI 像科學家一樣思考”
據了解,rBio 是陳·扎克伯格倡議在構建“能像科學家一樣思考”的 AI 系統愿景中的又一重要進步,類似于 rBio 這樣的 AI 系統旨在通過從虛擬細胞模型和數據中學習來產生新知識。在開發 rBio 的過程中,陳·扎克伯格倡議還構建了一個更廣泛的框架,以用于整合虛擬細胞模型的海量知識,這將有助于在未來幾年打造一系列易于獲取的生物學 AI 工具。
如今,rBio 已在陳·扎克伯格倡議的虛擬細胞平臺上線,能夠幫助研究基因擾動的研究人員加速研究進程。機器學習從業者也可利用 rBio 框架訓練自己的大模型,或者直接使用 rBio 對其模型進行基準測試。
目前,rBio 的專長僅限于基因擾動領域,但 TranscriptFormer 所涵蓋的所有細胞生物學領域知識都可傳授給 rBio。未來,虛擬細胞平臺上的一系列虛擬細胞模型都可用于訓練類似的推理模型,實現對細胞從最小分子到最大系統的全方位理解。
盡管 rBio 已經具備科研應用條件,但是本次研究人員仍在持續優化用戶體驗。因為這種“賦予推理模型對話能力的問題解決靈活機制”,也會帶來一系列挑戰。其中一項關鍵挑戰在于:必須為模型設置適當的防護機制,防止 rBio 對超出其專業領域的問題作出應答,而這類安全措施也是所有“大模型負責任開發”的通用環節之一。
毫無疑問,AI 已在加速生物學研究的步伐。虛擬細胞模型能夠讓研究人員避免了徒勞的實驗,而大模型則提供了通過對話積累知識的便捷方式。rBio 融合了這些優勢,展示了一種無需領域專業知識即可借助 AI 解答生物學難題的框架。隨著陳·扎克伯格倡議的虛擬細胞模型家族不斷壯大,rBio 等推理模型將助力科學家開展研究、開發療法,并有望實現相關疾病的預防。
參考資料:
1.https://web.shobserver.com/wx/detail.do?id=8061
https://virtualcellmodels.cziscience.com/model/rBio
https://www.biorxiv.org/content/10.1101/2025.08.18.670981v2
https://github.com/czi-ai/rbio
https://www.linkedin.com/in/donghui-li/details/education/
https://www.linkedin.com/posts/theofanis-karaletsos-57479262_rbio1-training-scientific-reasoning-llms-activity-7364311052425072646-pZ6x/
運營/排版:何晨龍、劉雅坤





京公網安備 11011402013531號