12月11日,全球健康藥物研發中心(GHDDI)發布了其自研的藥物研發全流程智能設計AI平臺:“AI孔明”。據稱,該平臺融合了生成式人工智能技術與多模態大模型技術,能針對不同疾病,有效精準生成設計潛在的候選藥物分子,已在結核病、瘧疾及罕見病等數十條真實研發管線中完成系統驗證。這家位于北京的非營利研究機構宣布,目前該平臺免費開放使用,對于瘧疾、結核等“被商業忽略的疾病”,平臺的分子庫已經免費開放。
![]()
全球健康藥物研發中心成立于2016年,是由北京市政府、清華大學和蓋茨基金會三方共同發起、獨立運營的非營利研究機構。此次發布的“AI孔明”藥物研發平臺從2017年開發至今,已實現從“靶點結構分析→AI分子生成與優化→活性篩選→成藥性評估”的藥物設計全流程無縫覆蓋,打通了早期藥物發現的關鍵技術鏈條。“AI孔明具備普惠性,希望它能真正打破傳統藥物研發中的流程壁壘和技術的壟斷,打造一個提升藥物研發效率,提高成功率的關鍵節點。”GHDDI首席運營官陸漫春博士說。
傳統的藥物開發模式被形容為10年10億美元,成功率極低。GHDDI數據科學部負責人郭晉疆博士解釋,藥物研發過程類似走迷宮和大海撈針,需要不斷試錯才能找到滿足安全、有效等要求的候選分子,這個過程循環往復導致開發周期和成本極高。也因此,近些年來業內正在探索使用AI技術幫助研發人員定位最優研發路徑、提高研發效率。隨著以大模型為代表的新一代人工智能技術走紅,這一技術路徑也被納入醫藥行業探索范圍。
郭晉疆解釋,此前使用AI參與藥物研發,研究人員仍需要在已知化合物庫內“大海撈針”,通過搜索篩選出可能的活性分子再開展后續試驗,效率仍然偏低且存在專利保護矛盾。相比之下,新發布的“AI孔明”平臺融合了生成式人工智能技術與多模態大模型技術,能針對不同疾病有效且精準生成并優化潛在分子,幫助生物化學家更快速設計出兼具有效性、安全性與結構新穎的潛在候選藥物。
GHDDI數據科學團隊以開發結核病藥物為例介紹了“AI孔明”的使用方式。現有結核病藥物用藥時間長、不良反應明顯,患者依從性和疾病負擔都很大,亟須新一代藥物。然而考慮到開發成本與市場前景,業內開發新藥的意愿并不大。此類藥物也是全球健康藥物研發中心的主攻方向。
現場演示針對關鍵靶蛋白Mtb PheRS進行新藥設計。首先平臺的“連弩”模塊基于大量學習已有化合物與蛋白質結合的數據,具備了生成新分子的能力。用戶上傳靶點蛋白質結構后,模塊會搜尋小分子可能的結合位點,進而生成能與目標靶點蛋白結合的新分子。該模塊還可以針對蛋白質口袋和已有分子骨架進行分子片段生成,從而實現先導化合物的優化。現場發布的數據稱,連弩模塊在GHDDI多條藥物研發管線中完成了實驗測試與應用,對于病毒的關鍵靶點,依托連弩合成的苗頭化合物經過兩輪迭代,活性分子的比例成功提高了43%;在瘧疾靶點上,連弩在一輪和二輪幫助合成的活性化合物占比分別為17%和21%,總計5個活性化合物,展現出了連弩模塊在加速迭代流程和提高早期藥物研發效率上的潛能。
“AI孔明”的另一個功能模塊稱為“星象”,其作用是在“連弩”模塊生成的龐大候選分子中,找出最有藥效開發潛力的分子,提高篩選速度。“我們可以想象一下,星象就像一臺分子巡天望遠鏡,過去需要數周才能完成的初篩工作,現在能在一次巡天式掃描中快速完成。讓我們立即聚焦最值得投入的那一批候選分子,大幅提高篩選的效率和命中率。”據介紹,該模塊通過預測模型預測分子的親和力與可能性,前者(親和力)用于評估與靶點的結合程度,后者(可能性)則是用于篩選出最可能的分子。據稱,該模塊運行速度極快,通過分布式并行計算百萬分子庫評估只需要數小時到數十小時就能完成,它在計算效率上較傳統自由能評估方法實現了數量級提升。
下一個功能是稱作“八陣”的模塊,用于快速評估候選分子在人體內的安全性風險與成藥潛力,其集成了近70種藥代毒理性質的快速預測和在線系統的綜合成藥評估功能。“這是一個多目標優化的復雜任務,任何一個性質不達標,再好的化合物也很難進入臨床。相較于實驗測定,八陣可以快速的篩選出具備安全性與有效性的‘好苗子’,讓實驗資源投入真的值得被投入的化合物上,縮短實驗周期,降低研發成本。”
此外,研發人員還展示了名為“錦囊”的新穎化合物數據庫。該數據庫目前主要公布了結核病和瘧疾的相關數據信息。據介紹,科學家從基因庫中挑選了約400個靶點,通過“連弩”為每個靶點生成約3,000個分子,相當于每個疾病有了百萬級別的分子庫,隨后通過“星象”預測其結合強度,再用“八陣”全方位預測性質,大大縮短了早期的藥物研發過程。研究團隊用肺結核相關實驗驗證顯示,傳統高通量篩選模式下,42萬的小分子庫需耗時6-12個月,獲得818個能抑制結核菌的活性分子,命中率為0.19%;錦囊數據庫僅合成13個分子,耗時1-2個月,其中就有5個活性分子,命中率大約為38.5%。相較于高通量篩選模式,在研發時間時間縮短6倍的同時,顯著提升了早期活性分子的命中率。
“我們已經將錦囊數據庫以公益方式,向全球科研人員免費開放,提供面向瘧疾和結核病的高質量新穎候選化合物資源,持續賦能全球健康領域的新藥創新。”研究者說。
![]()
討論會現場。
不過,現場討論中還提出,當前人工智能賦能科研仍然面臨數據量不足的問題。北京中關村學院首席科學家、科研部主任劉海廣談到,相比于文字、圖像生成等領域,開發科研AI最困難的就是數據稀缺,制藥領域雖然化合物很多,但“真正有把握的、有標注的數據是比較少的”,且大量數據還沒有在公共平臺實現共享,限制了人工智能方法進一步提升藥物研發的空間。
“趁這個機會,我也呼吁各個領域的科研團隊、科學家和研究員們,科學是智能發展的一個必然之路,也是全人類的事業。”他說,“我們需要全社會和整個科學界一起努力,把我們的知識綜合到一起,像一個雪球一樣滾起來,可能就會滾的越來越大。如果這個雪球還沒有足夠大,一直滾不起來,最終可能就會散掉。”
采寫:南都N視頻記者宋承翰 發自北京





京公網安備 11011402013531號