一、從孟德爾的豌豆實驗看遺傳定律

疾病的發生,除了環境、生活形態、飲食可能是影響因素,每個人獨一無二的基因也是關鍵的原因。遺傳性疾病依成因可細分成單一基因缺陷、染色體變異、多重基因共同影響及粒線體基因變異等。其中,單一基因缺陷而引起的遺傳疾病又稱為孟德爾型病症。

或許大家對孟德爾(Gregor Mendel)並不陌生,他被譽為遺傳研究的「神」。他身為天主教修士、當過代課老師,同時也是遺傳學家。在1856年至1863年間,他在修道院旁的小院子裡種滿了豌豆,並觀察這些相互配種的豌豆的植物高度、豆莢形狀、顏色、種子形狀等不同性狀,據此提出了好幾個遺傳定律,奠定遺傳學基礎,因此被稱為遺傳學之父。

孟德爾觀察豌豆時發現,2個親代都是綠色的豆莢,子代出現了3個綠色和1個白色的豆莢,孟德爾覺得很奇怪,「怎麼綠色的豆莢雜交,會生下白色的子代?」他繼續用白色和綠色豆莢的豌豆雜交,結果發現,子代全部都是綠色。另外又以圓種子和扁種子進行實驗,結果發現,親代以圓和扁的種子雜交,會出現四分之三圓的種子、四分之一扁的種子。

這裡顯示孟德爾知名的「顯性原則」,意即綠色是顯性、白色是隱性;圓形是顯性、扁型是隱性,顯性性狀較隱性性狀容易出現。孟德爾經過相當多次的實驗後發現,遺傳分配會以固定比率為下延伸。因此孟德爾相信上帝在生物上設計了「特別程式」,成對因子在雜交過程中會被打散,再重新進行組合。這就是孟德爾的第一定率-分離定律。

孟德爾又進行了更複雜的實驗,他將綠色豆莢、黃色豆莢、圓種子和扁種子等不同特性的豌豆進行雜交,結果發現,綠色跟圓種子發生的機會是9/16、綠跟扁種子是3/16;黃色跟圓種是3/16、黃色跟扁種子是1/16,顯見綠色跟圓形是顯性、黃色跟扁是隱性表現。且顏色和形狀各是獨立事件、可以共同存在而不互相干擾。孟德爾的第二定律-獨立定律與焉成形。

這型基因存在於細胞內的染色體上。人體有23對染色體,包含1對性染色體、22對體染色體,一半來自父親、一半來自母親。人類的疾病就像豌豆的性狀會受到基因的影響。如果是帶有顯性基因體染色體的遺傳者與沒有此疾病者結婚的話,子代有一半的機會得病,另一半正常;若是在體染色體的隱性基因,若父母都是異常基因攜帶者,子女有25%機率得病,有25%正常且無帶基因,另一半則是無症狀的異常基因攜帶者。

舉例來說,當爸爸帶了顯性的致病基因,媽媽基因正常,生下的4個孩子中,有一半會有病、一半正常;其他性狀也是如此,但是如美麗的藍眼珠是隱性基因,就不是這麼常見,只有四分之一的機會。

許多疾病的發生也跟近親通婚有關,讓致病基因更容易被傳承下來,如過去英國皇室有通婚的傳統,有許多人都被傳到血友病基因,這也是為什麼民法要規定,近親不能通婚,為的就是優生學的考量。

現在坊間常見的產前基因檢測,就是根據孟德爾的定律制訂而來。若父母是帶因者,從孟德爾定律,就能推測胎兒有沒有可能帶因,所以孟德爾的遺傳定律對公共衛生而言是非常重要的基礎。

孟德爾式遺傳對後世影響深遠,但有趣的是,孟德爾定律當時只有「短短兩三張紙」紙的內容,那時候又沒有網路可以宣傳,他對一群人演講,聽眾對這些從種豌豆中所領悟的結果也沒大太反應,反而是「束之高閣」,將相關文稿收藏在圖書館中,直到數十年之後,孟德爾定律被3名植物學家各別驗證後才得到肯定。

二、人類基因圖譜的妙用

人體染色體由雙螺旋狀的DNA分子結構組合而成,有4種基本化學物質排列而成,包含ATCG,就是腺嘌呤(Adenine)、胸腺嘧啶(Thymine)、胞嘧啶(Cytosine)及鳥嘌呤(Guanine)。

遺傳疾病根據不同致病成因可分為單一基因突變、染色體變異以及多基因共同影響,單基因突變所引發的遺傳疾病就是前面所提過的孟德爾型病症,如大多數的罕見疾病;而糖尿病心臟病、精神疾病等複雜疾病,就不是單一基因所決定,而是多重基因、基因和基因及基因和環境之間的交互作用而造成的結果。

為了要找到確切的致病基因所在位置,需要按圖索驥,而人類基因圖譜就是這個工作需要的「地圖」。基因圖譜又分為遺傳圖譜和物理圖譜,遺傳圖譜是利用基因的重組率來做分析,單位是分摩根(centimorgan)。遺傳圖譜表現出基因或特定DNA片段之間的相對位置。物理圖譜則是DNA兩點的實際距離,是實際將DNA片段排序而得。

連鎖分析是一種常用來繪制遺傳圖譜的方法,它利用孟德爾獨立定律研究兩個基因標記的相對關係。根據孟德爾定律,如果同一染色體上的位點不連續,那麼兩個基因標記將獨立而分離。如果兩個基因標記離的愈遠,重組發生的機率為1/2;但如果離的愈近,重組發生的機率則小於1/2。科學家又利用LOD Score來推估是否發生連鎖,大致估算基因標記的相對位置。

經過多年的努力,研究人員利用基因的相對位置描繪出基因圖譜。人類基因圖譜的用途,包含找尋致病基因的相關位置,如孟德爾式的單一基因疾病、複雜性疾病;可做全基因體掃描、細部基因分析,且探究基因的功能等等。

以一種罕見疾病亨丁頓舞蹈症為例,這是單一基因突變的顯性遺傳疾病,患者腦細胞神經原持續退化,導致活動失控、智能減退,情緒上也會深受困擾,領悟力和記憶也會受影響。當年找到這個基因突變點就是利用連鎖分析及人類基因圖譜。

我們可透過家庭危險因子比率(L)的計算,理解疾病是否有遺傳性。當家庭危險因子愈高,顯示遺傳性愈高。亨丁頓舞蹈症的L值(家庭關係為兄弟姐妹時)高達5000,意即患者的兄弟姐妹得病的機率比一般人高出5000倍;囊腫性纖維化L值是500、自閉症為75、思覺思調症為8至10、 阿茲海默症為3至4,高血壓則為2至3。L值大於2時,就顯示有遺傳因素。相對的,當L值的數字愈小,顯示該疾病受環境影響愈大。

單一核苷酸多型性(Single Nucleotide Polymorphism, SNP)是存在於人體中很好的基因標記,這是DNA序列中單一鹼基對發生變異,意即DNA中A、T、C、G中的改變。在人類遺傳基因的各種差異,如體質、罹病和藥物反應的差異有9成都可以歸因於SNP的變異。人體中大約有30億個DNA鹼基對,每隔100至300個鹼基就會存在一個SNP。根據美國生物科技資訊中心(NCBI)的資料,已標記出人體約一億多個SNPs。

目前針對SNP已有系統性的檢測,且建立SNP與疾病之間的相關資料庫,促成個人化醫學及精準治療的發展。近年來,SNP篩檢已多方應用在遺傳疾病、複雜性疾病藥物學與腫瘤醫學的研究。成功的因素包含科學家對基因體上比較常見的SNP及其排列方式已有足夠知識,鑑定SNP基因型的技術也非常成熟,正確率達99%以上且成功率也很高,另一個關鍵是,SNP檢測晶片價格近年來大幅下降。

近年來疾病與基因相關性的研究大受重視;在沒有親屬關係的族群裡,透過比較病患與對照組,觀察可能的致病基因出現次數,與期望出現次數之間作比較,用卡方檢定統計該基因與發病是否顯著相關。因為SNP檢測晶片價格便宜,所以以全基因掃描法找尋致病基因非常流行,根據美國國家人類基因研究所(NHGRI),到2019年為止,以全基因體分析與疾病相關的登錄表就有1800種疾病及症狀、超過4000篇以上的論文,這個大數據資料提供研究學者了解致病疾病基因在染色體的相關位置及其可能之致病機制。圖一為人類全基因體關聯性分析目錄。

圖一:人類全基因體關聯性分析目錄

在全基因組關聯研究後,後續要做的是轉譯醫學的應用。在找到相關的SNP後,就有更多的基因資訊,知道SNP的功用、哪些蛋白質會受影響?就能有更多的臨床應用,如發展生物標記,藉此知道哪些人身上攜帶特定的SNP,可發展相關的治療方法和預防模式,對發展精準醫療、個人化醫療有非常大的助益。

對腫瘤醫學來說,比如標靶治療,我們必須先做基因鑑定,才知道有沒有特定基因型、藥物是否會反應;但是,因為目前找到的風險因子效率不強,不太能作為預測工具,如我們尚無法利用SNP來預測會不會得到糖尿病、心臟病或精神疾病。不過,對於藥物不良反應,近年也有許多研究陸續問世,可透過特定基因了解哪些人可能是藥物不良反應的高危險群。圖二為抗甲狀腺藥引起無顆粒性白血球症副作用之全基因組關連分析。

人體的組成非常奧妙,基因研究也浩瀚無垠,後續仍有許多挑戰。如複雜性基因與基因的交互作用、複雜性基因與環境因素的交互作用都有待釐清。新世代基因定序的技術日漸成熟,價格也愈來愈低,但是資料量非常的龐大,儲存與分析資料要花費很多力氣、困難度更為提高。也許藉由機器學習或深度學習來處理基因大數據,將可以柳暗花明把基因研究提升到另一個更高的層次!

圖二:抗甲狀腺藥引起無顆粒性白血球症副作用之全基因組關連分析

  • 深入閱讀
  1. The NHGRI-EBI Catalog of published genome-wide association studies:https://www.ebi.ac.uk/gwas/
  2. Genetic determinants of antithyroid drug-induced agranulocytosis by human leukocyte antigen genotyping and genome-wide association study. (2015), Nature Communications, 6:7633.