AI設計精準抗疫蛋白

醫學

AI設計精準抗疫蛋白
AI設計精準抗疫蛋白

2021-08-01 賈可布森(Rowan Jacobsen)

天然蛋白質包辦了人體中的各種功能。現在科學家運用人工智慧技術設計合成蛋白質,打造新的冠狀病毒疫苗,在生物工程學界掀起革命。

去年4月某個星期五深夜,華爾斯(Lexi Walls)獨自待在美國華盛頓大學的實驗室中,焦急地等待自己研究生涯中最重要的實驗結果。她是年輕的結構生物學家,研究主題是冠狀病毒,這三個月來她夜以繼日工作,為的是研發出新疫苗,以對抗這類席捲全世界的病毒。她希望自己的研究成功之後,不只能對抗冠狀病毒,還能在疫苗學界掀起革命浪潮,讓人們得以應付流感以至愛滋病等各種傳染病。華爾斯所研發的疫苗不同以往,並非從天然成份衍生而來,而是先在電腦上設計微小的人工蛋白,再把這些蛋白質組合而成。這種疫苗的誕生,代表了人類在重新設計生物性功能上跨出了非凡的一步。

蛋白質是精巧的奈米機器,彼此持續互動,完成生物體內絕大部份的任務。蛋白質能夠消化食物、對抗入侵者、修復損傷、感覺周圍環境、攜帶訊息、產生力氣、協助思想形成,以及複製。蛋白質由許多稱為胺基酸的簡單分子串接起來、扭轉摺疊成為立體形狀,這是由構成蛋白質的胺基酸種類、數量與排列順序所決定。不同的胺基酸彼此會相吸或相斥,交互作用非常複雜,但是作用的尺度又非常小(平均每個細胞中有4200萬個蛋白質),以致於我們長久以來都無法釐清長串胺基酸彼此自動扭曲成立體形狀的規則,許多專家甚至認為不可能辦得到。

但是人工智慧(artificial intelligence, AI)領域的突破與見解,揭露了蛋白質的秘密。科學家正在打造能改變世界的生化工具,有了這些工具,就能利用蛋白質建造奈米機器人,一對一去對抗造成傳染病的病原體,或是把訊息傳遍身體各處,也能拆解有毒分子,還可吸收光線。科學家能依照目的,創造出所需的生物特性。

華爾斯身處這個領域的最前緣,她在2019年12月取得博士學位,研究的是冠狀病毒結構,成為當時這個超小眾領域中的一員。她說:「五年來我一直想讓人們相信,冠狀病毒很重要。我在博士學位口試一開始時便說:『我要告訴諸位這類病毒可能造成大流行的原因,而我們將無力面對這種大流行。』結果不幸言中。」

2019年12月,當中國武漢有神秘新型肺炎的消息傳出後,華爾斯便猜測那是由冠狀病毒引起。去年1月20日,新型冠狀病毒(簡稱新冠病毒)的基因組序列公佈,華爾斯和自己所在華盛頓大學實驗室的主持人、生物化學家韋斯勒(David Veesler)熬夜分析這個基因組。華爾斯說,覺得當時有無比的專注力:「感覺像是:『好,我們知道罪魁禍首了,來解決它吧!』」

人工合成病毒躍升潛力疫苗

新冠病毒一如其他冠狀病毒,長得像是表面插滿棘狀蛋白的球。每根棘的末端都是一群胺基酸,此部位是蛋白質的受體結合區(receptor-binding domain, RBD),具備的形狀和電荷都能夠與人類細胞表面某一種蛋白質完美契合。冠狀病毒就如同太空船,精準與受體對接,接著進入細胞中複製。

RBD扮演著如此危險的角色,成為免疫系統中抗體的頭號目標。抗體也是一種蛋白質,體內細胞製造抗體,與RBD結合,讓RBD失去功能。但是那些特殊的細胞需要花點時間才能夠製造出足夠的有效抗體,在此之前,病毒往往已經造成相當大的破壞。

包括信使RNA(mRNA)疫苗在內的第一代新冠肺炎疫苗保護了許多生命,它們能讓人體只出現病毒的棘蛋白而不是完整的病毒,人體的免疫系統能夠辨認出RBD,然後集結攻擊病毒棘蛋白部隊。但是RBD有時藏在棘蛋白的其他部位中,抗體表面本該與RBD結合的部位就找不到它,無法引起免疫反應。除此之外,自由流動的棘蛋白和天然病毒不同,除非接種高劑量的疫苗,否則不一定會引發強烈的免疫反應。但是增加劑量會使得疫苗成本增加,副作用也跟著增強。

目前的新冠肺炎疫苗雖然成功,但許多專家認為,接種天然蛋白質只是過渡時期的權宜之計。英國製藥巨擘葛蘭素史克(GlaxoSmithKline)的首席科學家兼疫苗發展主任拉普歐里(Rino Rappuoli)說:「顯然光是接種天然或減毒蛋白質是不夠的。」絕大部份的現行疫苗,不論是兒童常接種的,或是成年人接種的流感疫苗,主要成份都是天然蛋白質,疫苗學家稱之為「免疫抗原」(immunogen)。葛蘭素史克開發了很多這類疫苗,拉普歐里說:「我們需要設計出比天然分子效果更強的免疫抗原。」

華爾斯和韋斯勒想到,如果呈現給免疫系統的不是整個棘蛋白,而是完全無遮蔽的RBD,效果會怎樣?華爾斯說:「我們想把關鍵部位直接呈現出來,告訴免疫系統,『嗨,這就是你該產生反應的東西。』」

這個想法馬上遭遇難題:生物並不會製造單獨的RBD,而且這個部位太小了,也不是免疫系統習於產生反應的對象。不過華爾斯和韋斯勒知道有人能解決這個問題。就在同一條街上,有一間堪稱蛋白質創新領域中的貝爾實驗室(Bell Labs):華盛頓大學蛋白質設計研究所(Institute for Protein Design),該研究所在蛋白質摺疊和設計上經驗豐富,已經製造100多種構造簡單的小型蛋白質,沒有一種像是在生物體中會見到的,這些蛋白質摺疊成固定形狀,且具備預期中的功能。

2019年,蛋白質設計研究所中一個由金恩(Neil King)領導的團隊,設計了兩種小型蛋白質,彼此的表面可以互補,當放在溶液中混合時,會馬上自動集結成奈米顆粒,這些顆粒球大小如同病毒,只要改變蛋白質的遺傳密碼,就能夠隨之改造成新蛋白質。在初期測試中,科學家把來自於呼吸道融合病毒(造成嬰兒死亡的第二號殺手)的20個棘蛋白接到這個顆粒上,結果引發強烈的免疫反應。

華爾斯和韋斯勒尋思,為何不製造類似新冠病毒的顆粒來當成疫苗?把整個棘蛋白換成RBD。這種方式還有另一個好處:比起製造死病毒或是減毒病毒,製造蛋白質奈米顆粒的成本更低、速度更快,而且在室溫下也穩定,容易接種,不像mRNA疫苗需要低溫冷藏。

華爾斯連絡上蛋白質設計研究所,並且和金恩的同事、奈米顆粒專家費亞拉(Brooke Fiala)展開合作。這兩位科學家設計出表面具有60個RBD複本的球狀奈米顆粒原型,而且還嘗試了很不一樣的事:她們不把RBD直接安置在顆粒表面,而是在其上連接一小串胺基酸鏈,就像放風箏一般。這個小改變有利於免疫系統更全面接觸RBD的各個角度,從而製造出能夠攻擊其不同部位的抗體。

沒有人知道實際的情況將會如何。去年4月的那個星期五,在實驗室等待結果的華爾斯,只能祈禱一切順利。在那之前的三個星期,她和同事把這種人工奈米顆粒病毒注射到小鼠體內,另有一些小鼠則注射單純的棘蛋白,也就是現行某些疫苗的成份。現在研究人員把小鼠的血液抽取出來,和新冠肺炎偽病毒(pseudovirus)混合在一起。偽病毒是人工製造的病毒,不具備複製能力,能夠在實驗室中安全使用。這個實驗的目的是觀察接種過的小鼠,能否產生與偽病毒結合並且抵消其作用能力(即具中和能力)的抗體。

抗體的作用需要一點時間才會顯現出來,所以華爾斯那個星期五才會待得比較晚,她可不想整個週末都掛記著結果。她的同事離開實驗室時都祝她好運,韋斯勒還叮嚀她一有結果就馬上通知。夜幕降臨,實驗室中一片寂靜。揭曉研究結果的時間終於到了,華爾斯啟動一台專門用來偵測並計算有多少抗體連接到病毒顆粒的儀器,深吸一口氣,盯住儀器上呈現的數字。

有些小鼠接種少量棘蛋白,完全沒產生免疫作用,牠們對偽病毒的反應是零。接種高劑量棘蛋白的小鼠則表現出效果普通的中和反應,類似其他疫苗的作用。但是接種奈米顆粒疫苗的小鼠,抗體幾乎完全覆蓋偽病毒,產生的中和效果是高劑量棘蛋白的10倍。這種程度還只是微量接種的結果,華爾斯彷彿看見低成本、易保存、高效能的疫苗就在眼前。

華爾斯火速發簡訊給韋斯勒:「有中和能力!」韋斯勒馬上回覆:「新一代冠狀病毒疫苗就在你手中!」

這只是疫苗測試的第一關,之後還得經歷數項測試,證明疫苗能夠保護小鼠不受病毒感染、保護非人靈長類,以至保護人類。今年初,這種奈米顆粒進入最後的測試階段,此時的疫苗已然成功展示了設計蛋白的威力。一種以前不在掌握之中的能力,突然到了手中,我們可以用製造自己生命的原料,猶如黏土般進行雕塑。

AI設計蛋白成疾病新解

數十年前展開的這場遺傳學革命帶來巨大的變化,而其核心始終都是神秘難解的蛋白質。一個基因中有一個蛋白質的密碼。在基因中,以英文字母表示的DNA核?酸,三個為一組,合併組成一種胺基酸的密碼,另一組字母組成的密碼則代表另一種胺基酸。細胞中能用來拼成蛋白質的胺基酸共有20種,每一種都有獨特的形狀和功用,有些比其他的更具彈性;有些帶正電,有些帶負電;有些親水,有些則疏水。

細胞整天經由解析遺傳密碼,精確排列胺基酸順序,製造出新蛋白質。蛋白質會自行摺疊,最終呈現的形狀及其表面原子所帶的電荷會決定蛋白質的功能,包括在不同情況下如何產生反應、連接至何種特定物質,以及能進行什麼樣的作用。當我們說:「這位男性具有紅髮的基因。」意思是他體內有某種特殊色素蛋白質的基因藍圖。而當我們說:「那位女性具有會造成乳癌的基因。」意思是她體內有個基因發生突變,所形成的蛋白質中存在不正確的胺基酸,使得蛋白質的功能受到影響,導致癌症。

了解蛋白質的摺疊機制有助於設計新類型藥物,用來阻止或代替出錯的蛋白質,以及找出阿茲海默症、帕金森氏症、杭丁頓氏症和囊腫性纖維化(cystic fibrosis)等疾病的原因,這些疾病都和形狀異常的蛋白質有關。

不幸的是,蛋白質很小,我們幾乎不可能知道奈米世界中發生了哪些事,就算用放大倍率最高的顯微鏡也辦不到。我們無法精確知道這些蛋白質是如何正確摺疊,更不知道摺疊錯誤時是哪裡出問題。利用專門設計的儀器,也得花費一整年和12萬美元才能得到一個蛋白質的一幅高解析度照片。目前已知結構的蛋白質僅佔所有蛋白質的千分之一,其餘只能猜測。這就是為什麼我們說蛋白質結構是遺傳學革命難解之謎:遺傳序列與生心理效應有關,但我們通常不知道其中的來龍去脈。我們缺乏解析蛋白質結構的羅塞塔碑(Rosetta stone),得以去解讀從一開始的基因到最後的身體功能之間發生的事。

理論上,從遺傳序列推估蛋白質最後的結構是有可能的。2005年,《科學》125週年紀念特刊上,列舉各項最重要的未解科學問題中就有這一項。但實際上,只有對於構造非常簡單的蛋白質才辦得到。例如要製造一根直棒狀螺旋(外觀有如彈簧,能夠增加蛋白質的穩定性),要使用白胺酸、丙胺酸和麩胺酸,這些胺基酸具有特殊的彎曲與互補結構,能夠牢牢連接其上下方的胺基酸,形成固定形狀的螺旋。如果科學家想扭轉螺旋,會加入脯胺酸,這種胺基酸不會和其他胺基酸連接,螺旋因此就彎曲了。

華爾斯和韋斯勒的奈米顆粒是在蛋白質設計研究所製造出來,該研究所的創立者是結構生物學家貝克(David Baker),他和同行已推導出一些基本法則。貝克團隊把這些法則納入預測蛋白質結構的電腦程式「羅塞塔」,製造出一些小型蛋白質,通常只包含幾十個胺基酸。其中有些蛋白質成功展現深具應用潛力的性質:組成微小的「奈米籠」,用來包裝藥物、送進身體,甚至可以進一步連接偵測分子,當接觸到疑似癌細胞表面特殊的胺基酸組合時,就會釋出藥物。

但是生物體內大部份重要的蛋白質含有數千個胺基酸,都比這裡舉例的要大得多,每個胺基酸都會和周遭其他十多個胺基酸互動,有的會牢牢連接,有的會推得遠遠。這些關係的變化取決於周遭環境,各種可能性加總起來如同天文數字,最聰明的人類和最快速的超級電腦都無法據此推測出蛋白質最終的結構。

早從1994年就有人因為這個問題而受挫,有一群電腦生物學家認為良性競爭或許能夠刺激進展。他們在任職於馬里蘭大學的摩爾特(John Moult)號召下,展開了「蛋白質結構預測技術關鍵測試」(CASP)競賽活動。摩爾特手中握有某些蛋白質的詳細資料,這些蛋白質的結構都已鑑定出來,只是尚未發表。他把這些蛋白質的基因序列寄給來自各實驗室的團隊,請他們設法推導出最符合實際模樣的蛋白質結構。

評分標準依據的是預測結構與真實結構的相似程度,而相似程度取決於有多少分子落在正確位置。基本結構正確,大概可拿50分;主要部位的角度和連結正確,可能有70分;如果連如毛髮般伸出蛋白質的小分子串都預測出來就厲害了,可以得到90分以上。

CASP競賽每兩年舉辦一次,長久以來最佳團隊的表現甚至沒有比用猜的好。一直到貝克的蛋白質設計研究所成立的2012年,CASP競賽中最佳的平均分數仍只有20出頭,十年來沒有任何進步。摩爾特說:「幾次CASP競賽之後,我看了結果,深感絕望,心想這是在開玩笑吧,我們幹嘛舉辦比賽?」隨著結構生物學發展所獲致的一些新見解,第11次比賽終於有點起色,最佳平均分數將近30,第12次,甚至提高到約40分。

到了2018年的第13次比賽,由貝克領軍的團隊拿到了比以往還高的分數,將近50。但是有個新參加的黑馬,表現出人意外,就是Google的「深度心智公司」(DeepMind,其AI系統在2017年戰勝了世界最佳圍棋棋王)。在這場比賽中,AI的平均得分約為57。

這個結果撼動了全世界從事蛋白質工程研究的團隊,但現在回頭看,那不過是為下一屆的比賽暖身而已。去年,深度心智團隊做出了完全準確的預測。摩爾特說:「我當時邊看結果邊想,這不可能,我們看下一個預測!沒想到,正確預測結果持續出現。」

總的來說,深度心智團隊針對所有蛋白質的預測平均分數為92。對於結構比較簡單的蛋白質,幾乎能正確預測出每個原子的位置。但讓人印象最為深刻的結果,發生在幾乎所有團隊都無法預測的那些超高難度的蛋白質,特別是其中有個蛋白質,所有團隊的預測得分都低於30,深度心智團隊的分數卻超過80。

這個結果讓摩爾特震驚,他說:「我花了大半職業生涯進行這方面的研究,從來沒想過深度心智竟然連原子的位置都能準確預測。」令他印象最深刻的是,這個結果指出深度心智AI系統找到了一些之前沒有人知道的基本原理,「不只是模式辨認,那個機器以奇異方式『了解』物理原則,計算出各種胺基酸在按照特定順序排列時,其中各個原子將出現在哪些特定位置。」哥倫比亞大學結構生物學家阿卡拉伊西(Mohammed AlQuraishi)也參與了CASP競賽,他同意並說道:「我深受震撼,我一生中從來沒想過能親眼看到科學進展如此快速。」他認為這項突破將會改變生命科學......

【欲閱讀全文或更豐富內容,請參閱〈科學人知識庫〉2021年第234期08月號】