![]()
日前,上海人工智能實驗室聯合崖州灣國家實驗室和中國農業大學等單位,推出生物育種領域首個自主科學發現系統“豐登·基因科學家”。該系統基于首個種業大模型“豐登”研發,能模擬分子生物學家自主開展作物基因功能研究。在它的輔助下,科研人員在主糧作物中成功發現了數十個此前未被報道的基因功能,并獲得實驗證實。
“豐登·基因科學家”的誕生,填補了我國在生物育種領域自主科學發現系統的技術空白,有望提高作物分子設計育種效率,縮短育種周期,提升作物品質,為我國種業創新提供有力支撐。
作物育種的核心是精準改造基因組以優化農藝性狀,這需要系統理解基因與性狀的關系。然而,傳統基因功能研究高度依賴專家經驗,周期長且效率低。以水稻育種為例,自2005年全基因組測序完成以來,全球已投入大量資金用于其基因功能研究。但根據“豐登”大語言模型對全球文獻的系統分析,目前仍有約90%的水稻基因功能尚未明確。而玉米、大豆等主要作物的未知功能基因比例更高。
![]()
圖源上海人工智能實驗室
如何高效破譯從基因到性狀的“黑盒”?聯合團隊基于“豐登”大語言模型研發了可進行自主科學發現的科研智能體“豐登·基因科學家”。為幫助這位AI科學家快速學習,研發團隊繪制了兩套全新“思維導圖”:一套是基于全球學術論文、專業著作和實驗數據的“基因-性狀-環境”三維知識圖譜;另一套則是包含30萬條“假設-實驗-結論”推理鏈的科研路徑圖譜——據此,不光告訴AI科學家基因與性狀、基因與環境之間的關系,還把人類科學家預測推理作物基因功能的方法傳授給它。
通過強化學習,“豐登·基因科學家”可模擬專家推理過程,自動完成從提出假設到設計實驗、再到分析結果的完整科研流程,由此構建高效、可擴展的基因功能發現體系。
這位“學有所成”的AI科學家究竟靠不靠譜?研究團隊選取了水稻、玉米等數十個未報道的功能基因,除具體實驗操作外,知識歸納總結、性狀關聯預測、研究方案設計及路線規劃等科研決策環節均由智能體完成。測試結果顯示,“豐登·基因科學家”在知識整合、功能推斷與實驗設計等環節表現突出,多項量化指標優于國際主流OpenManus智能體與DeepSeek-R1語言模型。
在水稻研究中,科研人員依據“豐登·基因科學家”設計的多輪實驗方案開展實驗,發現了多個基因的新功能。比如,有基因可通過調控植物激素平衡影響株高,另有多個基因與光合效率密切相關。在玉米研究中,智能體精準預測出多個與株高、穗位等關鍵農藝性狀緊密相關的候選基因,相關結論與連續三年獨立開展的田間試驗結果高度一致。





京公網安備 11011402013531號