轉自:藥明康德
10月9日,諾貝爾基金會宣布授予DeepMind公司的Demis Hassabis博士和John Jumper博士,和華盛頓大學的David Baker教授諾貝爾化學獎。這三名科學家分別誕生于60、70、和80年代,他們沿著不同的人生軌跡,分別在利用人工智能預測蛋白結構和計算蛋白設計方面完成了造福全人類的研究突破。在今天的這篇文章里,讓我們一同來看一看他們的故事。
Demis Hassabis:打游戲神童的諾貝爾獎之旅
神童:出道即是巔峰
Demis Hassabis出生于英國倫敦的一個富有多元文化的家庭,有著希臘和華人血統的他由于父親生意的關系經常搬家,但這也在無形中培養了他在商業和研究上的冒險精神。Hassabis自小便展現出“神童”級的天賦。當年僅四歲的他看見父親和叔叔下棋時便請教他們該怎么玩,他不僅迅速地上手還很快擊敗了他們兩個。他在八歲時便在他人生當中的第一臺電腦進行編程,開發了棋盤游戲奧賽羅(Othello)。到了13歲時,他便已經成為國際象棋大師,在那個年齡組中排名世界第二。在他享受象棋帶給他的智力沖擊的同時,他也決定將這樣的天賦應用到更廣的領域。他在17歲時加入了電腦游戲公司牛蛙制作(Bullfrog Productions),并參與設計了戰略游戲《極道梟雄》(Syndicate)的設計,并在后來擔任極具影響力電子游戲《主題公園》(Theme Park)的首席程序員。這款游戲的暢銷催生出一系列管理模擬游戲的誕生。
玩游戲是為了創立人工智能(AI)公司
1997年,Hassabis以計算機科學專業最高榮譽自劍橋大學畢業,并在隔年創建自己的游戲公司Elixir Studios。在經營Elixir期間,他繼續參加游戲比賽,他從1998年到2003年連續五年奪得Pentamind國際象棋錦標賽冠軍。此外,他還是世界撲克系列賽六個不同賽季的冠軍。然而,拿遍無數游戲、智力競賽的他始終離不開這些令他魂牽夢縈的問題:“大腦是如何學會掌握復雜任務的?”、“電腦也能做到同樣的程度嗎?”在2015年接受采訪時他便這么說:“事實上我的整個職業生涯,包括我開發游戲的時候,都是為了最終成立AI公司。少年的時候我就決定,AI會是最有趣和最重要的事業。”
獲得神經學博士學位
為了回答他心中的問題,28歲的他在2005年重返校園,開始了他在倫敦大學學院(UCL)認知神經科學的博士學程,并在2009年拿到學位。他的博士研究專注于自傳體記憶(autobiographical memory)和失憶癥領域。他在該主題上參與了多篇發表在《自然》、《科學》和PNAS的論文。他在PNAS上的論文首次證實,大腦海馬區損傷(導致失憶癥)也會損害患者想象其他情況的能力。Hassabis證明了想象功能和情景記憶之間的神經學聯系——兩者都需要在腦海中構建場景的能力,這項發現被《科學》雜志評為“年度十大科學突破”之一。
DeepMind的誕生到谷歌的收購
2011年,Hassabis創立了人工智能公司DeepMind Technologies。他將公司的使命定義為解決“智能問題”,然后利用人工智能“解決其他一切問題”。Hassabis將神經科學和機器學習的見解與計算機硬件的最新發展相結合,尋求構建一種通用學習機制——“通用人工智能”(AGI)。
Hassabis和他的DeepMind同事最初專注于創建學習算法來掌握游戲。到2013年,他們創建了一種名為Deep Q-Network(DQN)的算法,可以“以超越人類的水平”玩電腦游戲。除了屏幕上可見的像素外沒有其他輸入,除了“獲得最高分”外沒有其他指示。測試結果顯示,DQN在引入游戲30分鐘內就成為了游戲太空侵略者(Space Invaders)世界上最優秀的玩家。而DeepMind的研究也引起了谷歌的注意,谷歌于2014年以超過6.5億美元的價格收購了DeepMind,而Hassabis仍然擔任DeepMind的首席執行官。而谷歌對DeepMind的收購也很快被證明是一項明智之舉。谷歌在2016年發表聲明,DeepMind所開發的AI算法已經協助降低用于冷卻谷歌數據中心的電費達40%。這可能為谷歌未來的電費省下數億美元。
▲DeepMind所開發的AI算法顯著減少谷歌的用電量(圖片參考資料[6])
AlphaFold:蛋白質結構預測的革命
然而DeepMind團隊并不止步于此。他們開發了能夠以近原子級的水平預測蛋白形狀的AI算法AlphaFold。2018年12月,AlphaFold在第13屆國際蛋白質結構預測競賽(CASP)的總體排名中名列第一。盡管取得了成功,但DeepMind的研究人員并不滿意:他們希望得到一種對于實驗人員更加有用的工具,誤差小于1埃米(原子的大小)。經過多輪的調試和集思廣益,DeepMind的研究團隊在原來的算法基礎上成功構建出了AlphaFold2。
在2020年的CASP上,DeepMind的AlphaFold2系統表現驚艷,在接受檢驗的近100個蛋白靶點中,AlphaFold2對三分之二的蛋白靶點給出的預測結構與實驗手段獲得的結構相差無幾。有些情況下,已經無法區分兩者之間的區別是由于AlphaFold2的預測出現錯誤,還是實驗手段產生的假象。這項成就被公認為解決了50年的“蛋白質折疊問題”。2021年7月,DeepMind發表了該系統工作原理的詳細描述,并向全世界免費發布了源代碼。它還與歐洲生物信息學研究所建立了一個公共數據庫,該數據庫正在用人工智能預測的新蛋白質結構填充它們。全球有部分團隊已開始使用AlphaFold研究抗生素耐藥性、癌癥、新冠病毒等問題。
新征途:人工智能跨入生物醫學
2021年11月,Hassabis宣布,他在擔任DeepMind領導職務的同時也將任職初創公司Isomorphic Labs的首席執行官。Isomorphic Labs是Alphabet旗下的新姊妹公司,將專注于將人工智能應用于生物技術和醫學領域。2022年7月,DeepMind人工智能實驗室的研究人員表示,他們已經預測了幾乎所有已知蛋白質的結構,這是生物學上的一項重大進步,將加速藥物發現并幫助解決可持續性和糧食不安全等問題。他們還擴展了AlphaFold數據庫,以包含2.14億種預測蛋白質,或幾乎所有科學已知的蛋白質。這包括人體中的所有蛋白質,以及動物、植物、細菌和許多其他生物體中的蛋白質。而最新版本的AlphaFold3大大擴展了其功能,包括對DNA和RNA相互作用進行建模,這標志著我們對分子生物學的理解有了重大飛躍。

▲AlphaFold 3預測的7R6R-DNA結合蛋白(藍色)與DNA雙螺旋(粉色)結合的分子復合物結構與通過實驗發現的真實分子結構(灰色)幾乎完全匹配(圖片參考資料[9])
雖然人工智能毫無疑問地已在生物醫學界帶來顯而易見的突破,但Hassabis在接受諾獎通知采訪時仍十分強調人類科學家的重要性。他表示至少在可預見的未來,這些人工智能算法能讓個體科學家做更多的事情。然而因為這些系統是工具,它們非常適合分析數據并在數據中尋找模式和結構。但是它們無法弄清楚應該問什么是正確的問題,正確的假設或正確的猜想。所有這些都必須來自人類科學家。“最好的科學家與這些工具配合使用將能夠做出令人驚嘆的科學成就,甚至在比以前更小的團隊中也能做到,因為他們可以依靠這些工具來完成很多基礎工作。”Hassabis說道。
John Jumper:超過70年來最年輕的諾貝爾化學獎得主
在提到AlphaFold在蛋白結構預測的重大突破時,就不得不提同與Hassabis一同獲得今年諾貝爾化學獎的John Jumper博士。他是DeepMind公司AlphaFold項目的首席高級研究員。他和Hassabis共同主導開發了AlphaFold以及后來的AlphaFold2。然而就如同Hassabis“崎嶇”多變的職業生涯一般,Jumper最初對蛋白質結構并不感興趣,相反地,他立志做個理論物理學家...
跨足蛋白設計的“物理學家”
Jumper在2007年自范德堡大學獲得物理和數學雙學位后,Jumper打算成為一名理論物理學家。他獲得了著名的馬歇爾獎學金,并被劍橋大學的博士課程錄取。然而他很快意識到,研究量子力學的計算方法并不適合他,因此他在獲得碩士學位后便重返美國。然后,他在D.E. Shaw Research找到了一份工作,負責開發用于蛋白質模擬的超級計算機,這段經歷開啟了他進入生物化學學的大門。三年后,他回到芝加哥大學,在Karl Freed與Tobin Sosnick教授的指導下完成理論化學博士學位。Jumper的博士研究方向是蛋白質模擬的統計和機器學習方法,他隨后便進入DeepMind從事蛋白質結構預測工作。
Jumper作為AlphaFold項目的負責人,他的角色是多方面的。除了自己進行研究之外,他還積極促進他與旗下團隊以及與其他DeepMind團隊的研究討論。他發現在團隊環境中,為了共同的目標而努力,研究會更有趣。他特別喜歡機器學習的快速發展,他說:“在不同的時間,新的想法和結果來得如此之快,以至于我覺得我們每周都在重新評估我們解決問題的方法。”
Jumper曾指出對于深度學習系統如何工作的直覺和理解對于開發模型非常重要,而使用直覺來評估結果和發現錯誤的重要性,是他在范德堡大學接受教育時學到的重要一課。他對當前科學家的建議是找到“好問題”來研究,并指出“好問題需要重要性和可處理性的完美結合。”
拿到博士后7年便囊獲諾貝爾獎
值得一提的是,Jumper是超過70年以來最年輕的諾貝爾化學獎得主,自他2017年拿到博士學位以來,在約7年的時間便囊獲諾獎殊榮。然而當他在接受諾獎得主采訪時表示,他之前認為自己只有10%的機會獲獎,這讓他感覺有點難受,這像是自己有10%的幾率中彩票,但有90%的幾率會感到失望。所以他的計劃是在頒獎當天睡個懶覺,然后等到他睡醒時就自然會知道自己有沒有獲得諾獎,不過他的計劃并沒有奏效,因為他當天沒法睡那么久。
在采訪當中,Jumper也表示他很高興計算生物學很快地獲得認可。“我喜歡這一切的原因是,我們可以清楚地看到,我們所做的工作與改善人類健康之間有著直接的聯系。”他說道。
David Baker:從解決蛋白折疊難題到設計全新蛋白
在接受諾貝爾獎委員會采訪時,David Baker教授表示,蛋白折疊的難題從來都具有兩面性:一方面是已經知道蛋白的氨基酸序列,如何基于序列預測蛋白的三維結構,而另一面是如果已經知道預想的蛋白結構,能否設計出氨基酸序列來折疊成這樣的結構。而今年的諾貝爾化學獎完美地表彰了這兩個方向的研究。
曾主修哲學和社會學,對蛋白結構感興趣卻被“潑冷水”
1962年,David Baker出生在美國西雅圖,父親是一名物理學家,母親研究天體物理和大氣科學。但是從小在科學家庭中長大David Baker最初對科學卻沒有什么興趣。在哈佛大學讀本科時,他主修的專業是哲學和社會學,想了解人類的大腦如何做出決定。直到最后一年上發育生物學的時候,名為《細胞分子生物學》的教科書讓他對生物學產生了興趣。Baker博士回憶到,做本科時有一次需要寫論文,他問教授能不能寫蛋白結構的課題,卻被教授潑了一頭冷水,“沒人搞明白了其中的機理”。想不到的是多年之后他卻解答了這個問題。

最初對大腦感興趣,卻被蛋白折疊所吸引
因為對大腦的興趣,David Baker在攻讀博士時覺得自己會研究神經生物學或發育生物學。他加入了加州大學伯克利分校細胞生物學家Randy Schekman教授的實驗室研究細胞的構成(Schekman教授在2013年獲得諾貝爾生理學或醫學獎)。獲得博士學位后,他加入結構生物學家David Agard教授的實驗室,原本想花一年時間學些結構生物學,幫助自己建立獨立實驗室時進行的細胞生物學研究。
然而,結構生物學的魅力深深吸引了他。Baker教授回顧道:“我當時覺得蛋白結構是生物自我組裝最簡明的例子。”因此當他在華盛頓大學建立自己的實驗室時,解決蛋白折疊的結構生物學成為了主要研究方向。
讓普通人也能參與蛋白折疊研究
上世紀90年代,Baker教授的實驗室開發出名為Rosetta的程序軟件,基于蛋白質的生物物理特征,根據氨基酸序列預測蛋白的三維結構。然而,預測蛋白三維結構需要大量的計算力和時間,Baker教授在哲學和社會學方面的經驗讓他想到了利用團體的力量來解決這個問題。“我的理想是全球各地的人們都可以同心協力,為科學和全球健康做出重要的貢獻。”Baker教授說。在2004年,他的實驗室開發出一款名為Rosetta@home的軟件,任何人都可以在自己家里的計算機上下載這款軟件,為解析某些蛋白結構的運算出一份力。截至2008年,接近20萬志愿者在自己的計算機上裝載了這款軟件。
在2008年,Baker教授與合作者又推出了蛋白折疊游戲Foldit,讓大眾以游戲的方式來解決蛋白折疊的問題。值得一提的是,在2011年,Foldit的玩家幫助成功破解了一款逆轉錄病毒蛋白酶的晶體結構,成果在《自然》雜志子刊上發表。

競爭對手是重要的啟迪人
2000年,DeepMind公司開發的AlphaFold2在國際蛋白質結構預測競賽(CASP)上驚艷亮相,不但擊敗了所有其它參賽選手,而且基于氨基酸序列預測的蛋白質三維結構可與使用冷凍電子顯微鏡(CryoEM)、核磁共振或X射線晶體學等實驗技術解析的三維結構相媲美。Baker教授實驗室開發的Rosetta軟件也是CASP比賽的常客并一直名列前茅,表面上看,DeepMind是他實驗室的競爭對手,AlphaFold2也在比賽中壓過Rosetta一頭。不過Baker教授并不這樣看,在接受諾貝爾委員會的采訪時,Baker教授表示,AlphaFold2的橫空出世讓他真正意識到了深度學習的威力。Baker教授的實驗室也迅速將AlphaFold2的深度學習策略應用到Rosetta軟件上,推出的RoseTTAFold系統在預測蛋白質結構上達到了和AlphaFold2相當的水平。
“與其說是競爭對手,我真心認為他們是啟迪我認識深度學習威力的人。”Baker教授說。
從預測蛋白結構到設計全新蛋白
早在使用最初的Rosetta軟件預測蛋白三維結構后不久,Baker教授就意識到了解決蛋白折疊問題的兩面性,不但可以基于氨基酸序列預測蛋白的三維結構,還可以基于想要得到的三維結構設計氨基酸序列。利用Rosetta軟件,他的實驗室在2003年設計出第一個在自然界中不存在的蛋白,名為Top7。

▲用Baker教授團隊設計的軟件Rosetta開發出的蛋白(圖片諾貝爾委員會官網)
基于在蛋白設計領域的深厚經驗積累和深度學習算法帶來的計算模式突破,Baker實驗室近年在蛋白設計領域的突破可以用日新月異來形容。從開發出一秒設計全新蛋白的工具,到設計可靶向任意蛋白的抗體,他的團隊一次又一次地顛覆蛋白設計的規則。這些在基礎科學領域的突破也正在通過初創公司的創建改變新藥發現和開發的模式。Baker教授參與創建了超過10家生物技術公司,其中今年浮出水面的Xaira Therapeutics公司由ARCH Venture Partners和Foresite Labs共同孵化,獲得啟動融資金額超過10億美元。
諾貝爾委員會在發布的新聞稿中表示,David Baker、Demis Hassabis、和John M. Jumper博士解開了蛋白結構的密碼。雖然這三位獲獎者擁有不同的人生軌跡,但是殊途同歸,共同解決了讓科學家困惑了半個世界的蛋白結構預測難題。
(轉自:藥明康德)





京公網安備 11011402013531號