- 專欄
文章專區
2026-01-01藥物設計進化論 加入 AI 從「矇到」走向「精準狙擊」
673 期
Author 作者
童俊維|國家衛生研究院生技與藥物研究所研究員,致力於開發新的 AI 方法來協助藥物設計與安全性評估。
Take Home Message
.傳統藥物像「下游」滅火,緩解症狀;基因藥物(DNARNA)則直攻「上游」,從根本修正致病基因。但這種藥物極度脆弱,一進人體就可能被酵素破壞,且因帶負電被細胞膜「同極相斥」擋在門外。因此,我們必須打造一台「專車」,護送這位「VIP」安全抵達目的地。
.如何打造這臺「攻城專車」?主流技術(如mRNA 疫苗)是利用「脂質奈米顆粒」。它的核心科技是「靜電吸引」:材料帶正電,RNA 帶負電,兩者一拍即合,自動組裝。這臺車不只是保護殼,更像「攻城器」,能與細胞膜裡應外合,進到城內,甚至內建「逃脫機制」,從胞內體中破出並完成任務。
.目前的遞送技術雖強,但藥物仍可能「脱靶」被送往錯誤的細胞,引發副作用。這場「藥物汽車工業」的終極目標,是為專車加裝GPS般的「靶向設計」,讓它能精確辨識並只停靠在病變細胞,讓藥物「上對車」並「精準下車」。
過去,很多藥物的誕生真的只能說是「瞎貓碰上死老鼠」,例如青黴素的發現就是一次黴菌污染的意外。即使到了現代,藥物的誕生依然極其艱難;一個新藥從構想到上市,平均需要10~15年與新臺幣百億以上的投入,而最後只有不到10%的新藥能成功上市。如今,人工智慧(artificial intelligence, AI)能幫助我們擺脫運氣的成分,靠資料與演算法精準狙擊,為藥物設計帶來全新革命。現狀正在改變中⋯⋯
傳統藥物設計難過的檻:資料不足
進入20世紀後,基於科學的進步與對疾病機轉的瞭解,藥物設計開始從疾病的標靶蛋白出發,尋找能與它們結合的小分子。過去半個世紀間,電腦的高超運算能力被用以加速藥物設計,形成電腦輔助藥物設計(computer-aided drug design)技術,包括以蛋白質結構與小分子結構為基礎的計算方法(圖一)。
.jpg)
圖一|傳統電腦輔助藥物設計與 AI 藥物設計的比較
以蛋白質結構為基礎者,透過電腦模擬藥物與生物系統的交互作用,藉以預測藥物療效與潛在副作用。這類技術一般需要已經被解析出的「蛋白質三維結構」,進而模擬小分子藥物是否能結合在正確的位置上。只是,這種結構的解析通常僅限於某個時間點的構型,所以很難評估蛋白質與不同分子結合時可能產生的結構變化,而這些變化又恰巧是許多標靶蛋白能發揮功能的關鍵特性。如同在簡單條件下進行訓練的飛行員,實際飛行時會遇到許多沒有模擬過的狀況,單一時間點蛋白質結構設計下的藥物效果,自然也需考量更多要素。更不用說,近半數蛋白質仍沒有被解析出的三維結構,使得此類藥物設計工具的效用受到進一步限制。
另一種透過小分子配體的方法,則是利用分析小分子結構與活性關係的規律性(也就是不同官能基對活性的影響),來協助瞭解各種官能基如何配置於小分子結構上,以進一步設計出有效的小分子。這類方法仰賴小分子活性資料的數量與品質,但不少潛在藥物標靶蛋白僅有少數已知小分子配體,甚至有許多沒有任何已知小分子配體的標靶蛋白(又稱「孤兒標靶蛋白」),所以儘管它們在藥物設計上極具潛力,卻只能透過傳統藥物篩選實驗逐一測試。
除了上述提到的藥物設計階段(約耗時4年),藥物開發還牽涉後續臨床前試驗(約耗時2年)與臨床試驗(約耗時7年),每個步驟都是大魔王,平均兩千名通過藥物設計階段的「勇者分子」,才可能出現一個通過藥效與安全性等重重考驗,並成功上市的藥品。光是挑選可與標靶蛋白結合的分子,一個藥廠可能就需測試上百萬個候選化合物,整個過程仍是大海撈針。
對臺灣來說,這場遊戲更具挑戰。本土藥廠多為中小型企業,資金與研發能量有限,新藥失敗風險高,臨床試驗資源也難與國際藥廠匹敵。因此,臺灣長年以學名藥〔註 1〕為主,真正投入創新藥設計的廠商或研究團隊仍在少數。
〔註 1〕在用途、給藥途徑、劑型、安全性、療效等特性上,皆無異於原廠藥。當已核准的原廠藥專利權過期後,其他合格藥廠便能以相同成分、製程進行生產。
創造勇者:生成式AI下的藥物設計
好,現在我們有了AI,但它能幫上什麼忙?
AI的強項就是預測,它能從大量資料中學出規律,並對新的資料作出推論。這個能力剛好能解決藥物開發中的最大難題:關於哪些分子有效,AI可以幫我們挑一輪。想像一下,你擁有一臺挑選勇者分子的機器,它讀過百萬筆分子資料與藥效結果,現在你只要輸入新的分子,它就能告訴你「這個可能有效」、「那個可能有毒」、「這個太大無法穿透細胞膜」。這些可不是猜測哦,而是基於過去的實驗資料,透過AI演算法訓練而來的結果。AI幫助我們在藥物設計初期排除掉大多數不適合的分子,讓實驗更聚焦、研發更有效率,不再靠運氣來篩藥。
我們可以把AI看著一個個分子的樣子,想像成算命師看八字排盤;它不是通靈,而是根據原子排列、鍵結方式、電子分布、官能基特性等「命格」預測藥效與副作用。有些模型像圖神經網路(graph neural networks),把分子視為一張圖譜;也有像Transformer模型〔註 2〕,把分子結構當作語言來解讀。這些模型的目的,就是用不同的方法為分子「解讀命盤」,以預測分子的藥理與毒理特性。
〔註 2〕這種模型可透過對序列資料中關係的追蹤,學習上下文之間的脈絡。它用的是一套名為自我注意力(self-attention)的數學技術,可偵測系列中以微妙方式相互影響、依賴的資料元素。
針對結構為基礎的藥物設計領域,2018年Google DeepMind團隊推出了AlphaFold模型,結合序列排比、蛋白質資訊、配體資訊等建立了最準確的結構預測模型,並在國際「蛋白質預測關鍵測試」(Critical Assessment of protein Structure Prediction, CASP)比賽中奪冠,準確預測了不存在資料庫的新蛋白結構,後續版本更強化了準確度與包括多分子的預測能力,開啟了全新的藥物設計領域。也就是說,對於那些缺乏三維結構的標靶蛋白,我們能假AI之手預測它們的結構,並用於藥物設計。
另一方面,多種新穎的AI演算法,如上面提到的圖神經網路與Transformer演算法,更被應用於配體為基礎的藥物設計。舉例來說,2021年輝達(NVIDIA)利用超過14億個分子結構來訓練MegaMolBart〔註 3〕,成功讓AI學會分子結構的語言。生成式AI的導入造就了生成式藥物設計概念,也就是藉由在潛在空間中的相似性,來推估最具潛力的下一個藥物。相較於過去大量試誤的藥物開發過程,生成式藥物設計無疑提供了一個強大的工具──不用猜勇者分子是誰,而是「直接設計一個勇者分子」來對抗疾病。……【更多內容請閱讀科學月刊第673期】
〔註 3〕由阿斯特捷利康(AstraZeneca)與輝達合作開發,是一款為發現新藥而打造、以「簡單分子輸入規範」(Simplified Molecular Input Line Entry System, SMILES)下的化學式所訓練的 Transformer模型。