日期:2024/10/09
他們破解了蛋白質驚人結構的密碼
2024 年諾貝爾化學獎是關於蛋白質,生命巧妙的化學工具。大衛貝克成功地建構了全新的蛋白質,幾乎是不可能的壯舉。 Demis Hassabis 和 John Jumper 開發了一種人工智慧模型來解決 50 年前的問題:預測蛋白質的複雜結構。這些發現具有巨大的潛力。

2024 年諾貝爾化學獎得主 David Baker、Demis Hassabis 和 John M. Jumper
2024 年化學獎得主
2024 年諾貝爾化學獎一半授予 David Baker,“因計算蛋白質設計”,另一半則共同授予 Demis Hassabis 和 John M. Jumper,“因蛋白質結構預測”。
Demis Hassabis 和 John Jumper 已成功利用人工智慧來預測幾乎所有已知蛋白質的結構。大衛貝克學會如何掌握生命的建造模組並創造全新的蛋白質。
2024 年諾貝爾化學獎授予 David Baker、Demis Hassabis 和 John M. Jumper,以表彰他們在理解蛋白質結構方面所做的工作,蛋白質在所有生物體中發揮著至關重要的作用。 Google DeepMind 的 Hassabis 和 Jumper 開發了一種可以預測蛋白質結構的人工智慧。華盛頓大學的貝克因其在設計新蛋白質方面的工作而受到認可。
2024 年諾貝爾化學獎
化學家長期以來一直夢想著完全理解和掌握生命的化學工具——蛋白質。這個夢想現在已經觸手可及。 Demis Hassabis 和 John M. Jumper 已成功利用人工智慧來預測幾乎所有已知蛋白質的結構。大衛貝克學會如何掌握生命的建造模組並創造全新的蛋白質。他們的發現潛力巨大。 (↑詳細內容 敬請點入)
他們透過計算和人工智慧揭示了蛋白質的秘密
生命的旺盛化學反應如何可能?這個問題的答案就是蛋白質的存在,而蛋白質可謂是絕妙的化學工具。它們通常由 20 種氨基酸組成,可以以無數種方式組合。以 DNA 中儲存的資訊為藍圖,胺基酸在我們的細胞中連接在一起形成長串。
然後蛋白質的魔力發生了:一串氨基酸扭曲並折疊成一種獨特的——有時是獨特的——三維結構(圖 1)。這種結構賦予了蛋白質功能。有些成為可以創造肌肉、角或羽毛的化學構件,而有些則可能成為荷爾蒙或抗體。其中許多會形成酶,以驚人的精度驅動生命的化學反應。位於細胞表面的蛋白質也很重要,它們充當細胞與周圍環境之間的溝通管道。
這 20 種胺基酸是生命的化學組成部分,其潛力怎麼強調都不為過。 2024 年諾貝爾化學獎旨在讓人們在全新的水平上理解和掌握它們。一半的獎金授予 Demis Hassabis 和 John Jumper,他們利用人工智慧成功解決了化學家 50 多年來一直困擾的問題:根據氨基酸序列預測蛋白質的三維結構。這使得他們能夠預測幾乎所有 2 億種已知蛋白質的結構。獎金的另一半則頒給大衛貝克。他開發了電腦化方法來實現許多人認為不可能的事情:創造以前不存在的蛋白質,並且在許多情況下具有全新的功能。
2024 年諾貝爾化學獎表彰了兩項不同的發現,但正如您將看到的,它們密切相關。為了了解今年的獲獎者克服的挑戰,我們必須回顧現代生物化學的黎明。
第一張蛋白質的顆粒狀圖片
自 19 世紀起,化學家就知道蛋白質對於生命過程很重要,但直到 20 世紀 50 年代化學工具才足夠精確,研究人員才開始更詳細地探索蛋白質。劍橋研究人員 John Kendrew 和 Max Perutz 在本世紀末取得了突破性的發現,他們成功地使用一種稱為 X 射線晶體學的方法提出了第一個蛋白質的三維模型。為了表彰這項發現,他們於 1962 年獲得了諾貝爾化學獎。

圖 1. 蛋白質可以由從數十個到數千個氨基酸的各種氨基酸組成。這串氨基酸折疊成三維結構,這對於蛋白質的功能至關重要。 ©Johan Jarnestad/瑞典皇家科學院 © Johan Jarnestad/瑞典皇家科學院
隨後,研究人員主要使用 X 射線晶體學(通常需要付出巨大的努力)成功產生約 20 萬種不同蛋白質的圖像,這為 2024 年諾貝爾化學獎奠定了基礎。
謎語:蛋白質如何找到其獨特的結構?
美國科學家克里斯蒂安·安芬森還有另一個早期發現。他利用各種化學技巧,成功地使現有的蛋白質展開,然後再次折疊起來。有趣的觀察是蛋白質每次都呈現完全相同的形狀。 1961年,他得出結論:蛋白質的三維結構完全由蛋白質中的胺基酸序列決定。這使他於 1972 年榮獲諾貝爾化學獎。
然而,安芬森的邏輯中存在一個悖論,另一位美國人賽勒斯·萊文塔爾(Cyrus Levinthal)在1969年指出,他計算出即使蛋白質僅由100個氨基酸組成,理論上該蛋白質也可以呈現至少1047種不同的三維結構。如果氨基酸鏈隨機折疊,則需要比宇宙年齡更長的時間才能找到正確的蛋白質結構。在細胞中,只需要幾毫秒。那麼這串氨基酸實際上是如何被折疊的呢?
安芬森的發現和萊文塔爾的悖論暗示折疊是一個預定的過程。而且重要的是,有關蛋白質如何折疊的所有資訊都必須存在於氨基酸序列中。
迎接生物化學的巨大挑戰
上述見解導致了另一個決定性的認知——如果化學家知道蛋白質的胺基酸序列,他們應該能夠預測蛋白質的三維結構。這是一個令人興奮的想法。如果他們成功了,他們將不再需要使用繁瑣的 X 射線晶體學,並且可以節省大量時間。他們還能夠產生 X 射線晶體學不適用的所有蛋白質的結構。
這些合乎邏輯的結論向生物化學面臨的巨大挑戰提出了挑戰:預測問題。為了鼓勵該領域更快速的發展,研究人員於 1994 年啟動了一個名為「蛋白質結構預測批判性評估」(CASP) 的項目,該項目後來發展成為一項競賽。每隔一年,來自世界各地的研究人員就可以獲得結構剛剛確定的蛋白質中的胺基酸序列。然而,這些結構對參與者保密。挑戰是根據已知的氨基酸序列預測蛋白質結構。
CASP 吸引了許多研究人員,但事實證明解決預測問題極為困難。研究人員在競賽中輸入的預測與實際結構之間的一致性幾乎沒有任何改善。這一突破直到 2018 年才出現,當時一位國際象棋大師、神經科學專家和人工智慧先驅進入了這個領域。
桌遊高手進入蛋白質奧林匹克
讓我們快速了解 Demis Hassabis 的背景:他四歲開始下棋,13 歲達到大師水平。在他十幾歲的時候,他開始了程式設計師和成功的遊戲開發人員的職業生涯。他開始探索人工智慧並研究神經科學,並取得了多項革命性的發現。他利用自己對大腦的了解為人工智慧開發了更好的神經網路。 2010 年,他與他人共同創立了 DeepMind 公司,該公司為流行的棋盤遊戲開發精湛的人工智慧模型。該公司於 2014 年出售給谷歌,兩年後,當該公司實現了當時許多人認為的人工智慧聖杯:擊敗世界上最古老的棋盤遊戲之一圍棋的冠軍選手時,DeepMind 引起了全球關注。
然而,對 Hassabis 來說,Go 並不是目標,而是開發更好的 AI 模型的手段。這場勝利之後,他的團隊已經準備好解決對人類更重要的問題,因此在 2018 年,他報名參加了第十三屆 CASP 競賽。
Demis Hassabis 的人工智慧模型意外獲勝
前幾年,研究人員預測的 CASP 蛋白質結構的準確度最多只有 40%。借助 AI 模型 AlphaFold,Hassabis 的團隊達到了近 60%。他們贏了,優異的成績讓很多人都大吃一驚——這是意想不到的進步,但解決方案仍然不夠好。為了獲得成功,與目標結構相比,預測的準確度必須達到 90%。

AlphaFold2 運作方式圖解
圖 2.AlphaFold2 是如何運作的? © Johan Jarnestad/瑞典皇家科學院
哈薩比斯和他的團隊繼續開發 AlphaFold——但是,無論他們如何努力,演算法從未完全成功。殘酷的事實是,他們已經走進了死胡同。團隊很疲憊,但一位相對較新的員工對如何改進人工智慧模型有決定性的想法:約翰詹珀 (John Jumper)。
約翰詹珀接受了生物化學的巨大挑戰
約翰·詹珀對宇宙的迷戀促使他開始學習物理和數學。然而,2008 年,當他開始在一家使用超級電腦模擬蛋白質及其動力學的公司工作時,他意識到物理知識可以幫助解決醫學問題。
2011 年,當詹珀開始攻讀理論物理學博士學位時,他對蛋白質產生了新的興趣。為了節省電腦容量(大學裡緊缺的東西),他開始開發更簡單、更巧妙的方法來模擬蛋白質動力學。很快,他也接受了生物化學這項巨大挑戰的挑戰。 2017 年,當他剛完成博士學位時,他聽到了Google DeepMind 已經開始秘密預測蛋白質結構的傳言。他向他們發送了一份工作申請。他在蛋白質模擬方面的經驗意味著他對如何改善 AlphaFold 有創造性的想法,因此,在團隊開始停滯不前後,他得到了晉升。 Jumper 和 Hassabis 共同領導了從根本上改革人工智慧模型的工作。
改革後的人工智慧模型取得了驚人的結果
新版本——AlphaFold2——是根據 Jumper 對蛋白質的了解而著色的。該團隊也開始使用人工智慧最近的巨大突破背後的創新:稱為 Transformer 的神經網路。這些可以比以前更靈活的方式在大量數據中找到模式,並有效地確定應該關注什麼來實現特定目標。
團隊利用所有已知蛋白質結構和胺基酸序列資料庫中的大量資訊對 AlphaFold2 進行了訓練(圖 2),新的 AI 架構開始及時為第十四屆 CASP 競賽提供良好的結果。
2020 年,當 CASP 的組織者評估結果時,他們明白生物化學長達 50 年的挑戰已經結束。在大多數情況下,AlphaFold2 的表現幾乎與 X 射線晶體學一樣好,這令人震驚。當 CASP 創辦人之一 John Moult 於 2020 年 12 月 4 日結束比賽時,他問道:現在怎麼辦?
我們將回到這一點。現在我們要回到過去,了解 CASP 的另一位參與者。讓我們介紹 2024 年諾貝爾化學獎的另一半,它涉及從頭開始創造新蛋白質的藝術。
一本關於細胞的教科書讓大衛貝克改變了方向
當大衛貝克開始在哈佛大學學習時,他選擇了哲學和社會科學。然而,在演化生物學課程中,他偶然發現了現在經典教科書《細胞分子生物學》的第一版。這導致他改變了人生的方向。他開始探索細胞生物學,最終對蛋白質結構著迷。 1993 年,當他開始擔任西雅圖華盛頓大學的小組組長時,他接受了生物化學領域的巨大挑戰。透過巧妙的實驗,他開始探索蛋白質如何折疊。當他在 20 世紀 90 年代末開始開發可以預測蛋白質結構的電腦軟體:Rosetta 時,這為他提供了深刻的見解。
Baker 在 1998 年使用 Rosetta 首次參加 CASP 比賽,與其他參賽者相比,表現非常好。這一成功引發了一個新想法——大衛貝克的團隊可以反向使用該軟體。他們應該能夠輸入所需的蛋白質結構並獲得有關其氨基酸序列的建議,而不是在 Rosetta 中輸入氨基酸序列並得出蛋白質結構,這將使他們能夠創造出全新的蛋白質。
改革後的人工智慧模型取得了驚人的結果
新版本——AlphaFold2——是根據 Jumper 對蛋白質的了解而著色的。該團隊也開始使用人工智慧最近的巨大突破背後的創新:稱為 Transformer 的神經網路。這些可以比以前更靈活的方式在大量數據中找到模式,並有效地確定應該關注什麼來實現特定目標。
團隊利用所有已知蛋白質結構和胺基酸序列資料庫中的大量資訊對 AlphaFold2 進行了訓練(圖 2),新的 AI 架構開始及時為第十四屆 CASP 競賽提供良好的結果。
2020 年,當 CASP 的組織者評估結果時,他們明白生物化學長達 50 年的挑戰已經結束。在大多數情況下,AlphaFold2 的表現幾乎與 X 射線晶體學一樣好,這令人震驚。當 CASP 創辦人之一 John Moult 於 2020 年 12 月 4 日結束比賽時,他問道:現在怎麼辦?
我們將回到這一點。現在我們要回到過去,了解 CASP 的另一位參與者。讓我們介紹 2024 年諾貝爾化學獎的另一半,它涉及從頭開始創造新蛋白質的藝術。
一本關於細胞的教科書讓大衛貝克改變了方向
當大衛貝克開始在哈佛大學學習時,他選擇了哲學和社會科學。然而,在演化生物學課程中,他偶然發現了現在經典教科書《細胞分子生物學》的第一版。這導致他改變了人生的方向。他開始探索細胞生物學,最終對蛋白質結構著迷。 1993 年,當他開始擔任西雅圖華盛頓大學的小組組長時,他接受了生物化學領域的巨大挑戰。透過巧妙的實驗,他開始探索蛋白質如何折疊。當他在 20 世紀 90 年代末開始開發可以預測蛋白質結構的電腦軟體:Rosetta 時,這為他提供了深刻的見解。
Baker 在 1998 年使用 Rosetta 首次參加 CASP 比賽,與其他參賽者相比,表現非常好。這一成功引發了一個新想法——大衛貝克的團隊可以反向使用該軟體。他們應該能夠輸入所需的蛋白質結構並獲得有關其氨基酸序列的建議,而不是在 Rosetta 中輸入氨基酸序列並得出蛋白質結構,這將使他們能夠創造出全新的蛋白質。
貝克成為蛋白質構建者
蛋白質設計領域——研究人員創造具有新功能的客製化蛋白質——於 20 世紀 90 年代末期開始起飛。在許多情況下,研究人員對現有的蛋白質進行了調整,這樣它們就可以做一些事情,例如分解有害物質或充當化學製造業的工具。
然而,天然蛋白質的範圍是有限的。為了增加獲得具有全新功能的蛋白質的潛力,貝克的研究小組希望從頭開始創造它們。正如貝克所說:“如果你想製造一架飛機,你不是從改造一隻鳥開始;而是從改造一隻鳥開始。”相反,你了解空氣動力學的首要原理,並根據這些原理建造飛行器。
一種獨特的蛋白質重見天日
建構全新蛋白質的領域稱為從頭設計。研究小組繪製了一種具有全新結構的蛋白質,然後讓 Rosetta 計算哪種類型的胺基酸序列可以產生所需的蛋白質。為此,Rosetta 搜尋了所有已知蛋白質結構的資料庫,並尋找與所需結構相似的蛋白質短片段。 Rosetta 利用蛋白質能量景觀的基礎知識優化了這些片段並提出了胺基酸序列。
為了研究該軟體的成功程度,貝克的研究小組在產生所需蛋白質的細菌中引入了建議氨基酸序列的基因。然後他們使用 X 射線晶體學確定了蛋白質結構。
事實證明,羅塞塔真的可以建造蛋白質。研究人員開發的蛋白質 Top7 幾乎與他們設計的結構完全相同。
貝克實驗室的精彩創作
對於從事蛋白質設計的研究人員來說,Top7 是晴天霹靂。那些以前從頭創造蛋白質的人只能模仿現有的結構。 Top7的獨特結構在自然界中並不存在。此外,該蛋白質含有 93 個氨基酸,比以前使用從頭設計生產的任何蛋白質都要大。
貝克於 2003 年發表了他的發現。 Baker 實驗室創造的眾多令人驚嘆的蛋白質中的一些如圖 4 所示。
是時候解決 2024 年諾貝爾化學獎的懸而未決的事情了。

圖 4. 使用 Baker 的 Rosetta 程式開發的蛋白質。 ©Terezia Kovalova/瑞典皇家科學院
曾經需要花費數年時間的工作現在只需幾分鐘
當 Demis Hassabis 和 John Jumper 確認 AlphaFold2 確實有效後,他們計算了所有人類蛋白質的結構。然後,他們預測了研究人員迄今為止在繪製地球生物圖時發現的幾乎所有 2 億種蛋白質的結構。
Google DeepMind 也公開了 AlphaFold2 的程式碼,任何人都可以存取它。人工智慧模型已成為研究人員的金礦。截至 2024 年 10 月,AlphaFold2 已被來自 190 個國家的超過 200 萬人使用。以前,如果有的話,通常需要數年時間才能獲得蛋白質結構。現在只需幾分鐘即可完成。人工智慧模型並不完美,但它估計了其產生的結構的正確性,因此研究人員知道預測的可靠性。圖 5 顯示了 AlphaFold2 如何幫助研究人員的眾多範例中的幾個。
2020 年 CASP 競賽結束後,當 David Baker 意識到基於 Transformer 的 AI 模型的潛力時,他在 Rosetta 中加入了一個模型,這也促進了蛋白質的從頭設計。近年來,貝克實驗室不斷創造出令人難以置信的蛋白質(圖 4)。

圖 5. 使用 AlphaFold2 確定的蛋白質結構。 ©Terezia Kovalova/瑞典皇家科學院
令人眼花撩亂的發展,造福人類
蛋白質作為化學工具的驚人多功能性體現在生命的巨大多樣性上。我們現在可以如此輕鬆地想像這些小分子機器的結構,這真是令人難以置信。它使我們能夠更好地了解生命的運作方式,包括為什麼會出現一些疾病、抗生素抗藥性是如何發生的或為什麼一些微生物可以分解塑膠。
創造具有新功能的蛋白質的能力同樣令人震驚。這可以帶來新的奈米材料、標靶藥物、更快速的疫苗開發、最小的感測器和更綠色的化學工業——僅舉幾個為人類帶來最大利益的應用。
進一步閱讀
有關今年獎項的更多信息,包括英語科學背景,請訪問瑞典皇家科學院網站 www.kva.se 和 www.nobelprize.org,您可以在其中觀看新聞發布會的視頻、諾貝爾講座等等。有關諾貝爾獎和經濟科學獎相關展覽和活動的信息,請訪問 www.nobelprizemuseum.se。
瑞典皇家科學院決定頒發2024年諾貝爾化學獎
與二分之一
大衛貝克
1962 年出生於美國華盛頓州西雅圖。 1989年獲得美國加州大學柏克萊分校博士學位。美國華盛頓州西雅圖華盛頓大學教授,美國霍華休斯醫學研究所研究員。
“用於計算蛋白質設計”
和另一半共同
德米斯·哈薩比斯
1976 年出生於英國倫敦。 2009年獲得英國倫敦大學學院博士學位。 Google DeepMind 首席執行官,英國倫敦。
約翰·M·跳躍
1985 年出生於美國阿肯色州小石城。 2017年獲得美國伊利諾州芝加哥大學博士學位。英國倫敦 Google DeepMind 資深研究科學家。
“用於蛋白質結構預測”
科學編輯:Peter Brzezinski、Heiner Linke、Johan Åqvist,諾貝爾化學委員會
文字:安·芬霍姆
譯者:克萊爾‧巴恩斯
插圖:Johan Jarnestad、Terezia Kovalova
編輯:文森·馮·西多
© 瑞典皇家科學院