文章專區

2024-01-15全球最大基因庫再升級 英國生物銀行釋出50萬人完整基因序列 505 期

Author 作者 編譯|羅億庭

世界上規模最大的全基因組數據庫——英國生物銀行(UK Biobank),最近的資料庫再次升級了。英國生物銀行是知名的健康研究計畫,至本次升級共提供科學家近50萬人的完整基因序列進行分析,此數據量也是過往數據集的兩倍以上。研究人員表示,結合多位參與者的長期追蹤健康數據,這個「寶庫」將有望改變生物醫學研究。
 
自2006年成立以來,英國生物銀行已收集了50萬名中老年志願者的生物樣本、全身掃描,以及健康和生活方式等數據。經參與者同意後,它還能透過該國的國家衛生服務部門保存的紀錄,追蹤這些人罹患癌症、失智症和其他疾病的發生率。
 
2012年開始,英國生物銀行便會定期發布這些經過匿名後的健康數據,以及參與者的遺傳訊息,包含DNA標記和外顯子組(exome,僅占人類DNA約2%,但負責編碼出蛋白質)的序列,且來自世界各地的實驗室都可以申請使用這些數據集的存取權。根據英國生物銀行的說法,迄今已有來自約90個國家的三萬多名研究人員獲得使用資料的權利。此外,更有超過9000篇使用英國生物銀行數據並通過同儕審查的研究論文被發表在期刊上。研究領域從影響從阿茲海默症(Alzheimer's disease)的風險、心臟病到性格特徵皆有,甚至也包含容易引發爭議的性取向等各種面相。
 
2021年,英國生物銀行初步釋出約20萬名參與者的全基因組,本次發布的數據集包含49萬1554名參與者全新和修正後的序列測定數據。不同於外顯子,全基因組內含的資訊能使研究人員在基因組的蛋白質編碼和非編碼區域中,尋找關於某些性狀與罕見遺傳變異之間的關聯。雖然目前科學家已經知道非編碼區域參與調節基因活性等功能,但它們對於人類生物學有何種影響/貢獻仍是未知數。過去曾在研究中大量使用英國生物銀行數據的美國麻省總醫院(Massachusetts General Hospital)和哈佛醫學院(Harvard Medical School)基因學家、心臟病學家納塔拉揚(Pradeep Natarajan)認為,本次發布的數據集應該會為此領域帶來實質性的進展。
 
再加上從去(2023)年11月底開始,獲得准許的研究人員將可以透過雲端分析平臺存取數據。有些公司也已經開始在會議和預印本上分享他們的初步分析,例如貝勒醫學院(Baylor College of Medicine)的基因學家,同時也是阿斯特捷利康(AstraZeneca)顧問的丁薩(Ryan Dhindsa),就曾經在11月的美國人類遺傳學學會(American Society of Human Genetics)的會議上展示新數據集中針對特定類型的罕見變異進行分析。他也期待最新版本的英國生物銀行,能夠提供的更好的解析度和統計效力。
 
此消息對世界各國的遺傳學家而言十分令人興奮,像是德國亥姆霍茲轉化基因體學研究所(Institute of Translational Genomics, ITG)的所長澤吉尼(Eleftheria Zeggini)就表示,對於研究人類基因組學領域來說樣本量的大小至關重要,而如此龐大的序列集也將為研究人類健康和疾病的生物學基礎提供獨特且豐富的資源。
 
儘管擁有無可比擬的規模和廣泛的醫療保健數據,但英國生物銀行仍存在一些值得注意的限制。例如該資料庫的參與者往往比英國的總人口更健康、生活更為富裕,且大部分參與者是歐裔,只有約一萬名參與者是非洲裔,南亞裔參與者的數量也僅有約一萬名。相比之下,在美國國家衛生研究院(National Institutes of Health) 生物庫計畫「All of Us」共有超過72.5萬名參與者註冊參加,約有一半人屬於「種族或民族少數群體」。但該平臺只發布了約25萬個全基因組序列,且資料直到去年8月才開始接受國際組織的申請。
 
倫敦大學學院(University College London)遺傳研究所的基因學家科提斯(David Curtis)表示,英國生物銀行目前仍然是一項非常獨特的資源。期望未來此資料庫可以被世界各地的研究人員深入研究,找出令人耳目一新的發現。

 

(Adobe Stock)

 
新聞來源
Offord, C. (29 November 2023). UK Biobank releases half a million wholegenome sequences for biomedical research. Science.