如何有效精準地安排基因檢測--基因檢測需要注意的問題
我們從生物學課本裡面已經知道,人類是真核生物,細胞有細胞核和細胞質。右側上方列出了人類的染色體,22對常染色體和1對性染色體。它們就是我們通常所說的人類基因組了。這些染色體平時以DNA的形式存在於細胞核之中。除了這些染色體之外呢,在細胞質裡面也是有遺傳物質的,存在於線粒體之中。右下方這張圖顯示的是一個線粒體,線粒體是雙層膜結構的細胞器,作用是為細胞生產動力也就是ATP。
在線粒體基質之中的DNA與細胞核的DNA有很多的不同。第一個特點就是它是環狀的,沒有內含子。它更類似於細菌的質粒,具體的密碼子與核基因的密碼子也有所不同。第二個特點就是一個細胞都有很多個線粒體,根據細胞的需求,數目有多有少,變異很大。一個線粒體又有數個環狀DNA,所以計算下來,每個細胞都有多個copy的線粒體DNA。第三個特點來自於第二點。我們知道,和卵子巨大的個頭相比,精子的個頭是非常小的。相應的,受精卵的線粒體絕大多數都是來自於母親,也就是說線粒體DNA的遺傳方式是母系遺傳。
我們通常所說的基因檢測往往都是指分子遺傳學的檢測。檢測方式是按照generation來命名的。第一代測序由英國傳奇科學家桑格博士在七十年代發明,所以也叫做桑格測序。進入新世紀之後,數家公司都推出了不同原理的新測序方法,被稱為next generation sequencing,經過一段時間的發展,illumina公司的平台明顯勝出了。現在ngs基本由Illumina平台壟斷著。基於ngs技術,我們又可以細分為全外顯子,全基因組測序,一網打盡的,和基因包,只關注部分重點基因,有的放矢的。
第三代測序技術現在仍然處於發展完善階段,它突破了NGS讀長只有100—300kb的限制,能夠連續閱讀很長的DNA序列,因此前景非常值得期待。
除這幾代測序之外,還有些特殊的檢測方法: 檢測小型的片段缺失與重複的mlpa方法:核苷酸序列重複,甲基化異常等等。
一代的桑格測序應用場景是攜帶者測試,或者對錶型非常明確的某個基因的測序。類似的情況是MLPA,甲基化MLPA,以及repeat
expansion核苷酸重複序列的檢測。它們都是表型非常明確,我們再來看二代測序。NGS目前的應用大概分為兩類,一類是小型的panel基因包,專註於與特定疾病相關的一組基因,也就是「有的放矢」。另外一類是組學測序,全外顯子,全基因組測序,獲得的信息也是非常多非常全的我們為病人進行基因檢測,很經常的是抽取病人的血液送到實驗室,提取DNA分析。您可能會覺得,抽血就能提取DNA的啦,好多檢測公司也接受唾液樣本,材料有很大影響么?是的,一般來說,各個組織的遺傳物質沒有很大差別,是無所謂的。但是有些情況下是有區別的。
血液在胚胎髮育上,是由中胚層發育而來的。中胚層細胞還發育形成間充質幹細胞,形成脂肪細胞,成纖維細胞等等。皮膚,神經是由外胚層發育而來,而內胚層形成肺,胰腺,肝這些器官。
第二個重要的概念是嵌合突變的存在。左上角我們可以看到一個傳統的遺傳方式,母親攜帶有變異,減數分裂形成的卵細胞帶有這個變異,受精卵和受精卵發育的所有細胞都攜帶著一個拷貝的變異。如果父母都不攜帶有致病性變異,是不是說孩子就沒有風險了呢?在受精卵的胚胎髮育的過程中,某個細胞產生了de novo變異。根據這個變異發生的時間點和所在的細胞,最終孩子攜帶的變異量和攜帶變異的組織也有所不同, 可以造成不同的臨床表現。
我們來看兩個具體的疾病。
第一個疾病是Neurofibromatosis,神經纖維瘤,臨床表現主要是皮膚上的這些瘤子。這個病呢,嵌合突變是比較常見的。基因檢查的第一步當然還是我們從病人的血中提取DNA,檢測NF1,NF 2基因。如果血液樣本檢查是陰性的,那麼我們應該從患處取樣,從皮膚組織的成纖維細胞中提取DNA進行檢測,這樣就不會錯過嵌合突變。
第二個疾病是Proteus病,我們大家聽說過的elephant man就是一個病人。這個病是一種複雜的贅生性疾病,主要的特徵包括了大頭、顱骨增生、長骨變形、肢體膨大、皮膚及皮下組織的腫瘤等。這個病的機制就是ALK1基因的嵌合突變。所以我們抽血進行基因檢測一般都是假陰性。對於這個病呢,我們應該進行活檢取材,然後提取DNA進行檢測,這樣的陽性率是比較高的。我自己遇到的一個病例就是這樣。一開始呢,臨床醫生送檢的是血液樣本,要求進行全外顯子檢測。檢測結果是陰性的。溝通之後呢,他們把活檢樣本也送過來了,我要求實驗室同時run了組織DNA和血液DNA,證明了組織中ALK1變異的存在,而血液DNA中是沒有這個變異的。這樣病人的Proteus病得到了確診。
我們來仔細看一下不同的檢測方法,不同的應用場景對檢測報告的不同要求。一代的桑格測序應用場景是攜帶者測試,或者對錶型非常明確的某個基因的測序。這樣的報告呢,我們對結果的要求是,清晰準確,因為這就是一個Yes或No的回答:檢測到了有意義的變異么?如果回答是Yes,檢測到了,那麼實驗室再進行致病性的判讀。類似的情況是MLPA,甲基化MLPA,以及repeat expansion核苷酸重複序列的檢測。它們都是表型非常明確,對結果的要求是Yes或No。
我們再來看二代測序。NGS目前的應用大概分為兩類,一類是小型的panel基因包,專註於與特定疾病相關的一組基因。另外一類是組學測序,全外顯子,全基因組測序,獲得的信息也是非常多非常全的。
小型的基因包針對的病人相對來說表型比較明確,能夠歸類到某一類別中去。那麼這樣的報告,我們對它的要求也是相對來說比較明確的,報告需要告訴我們:檢測了哪些基因,在這些基因中有沒有檢測到可疑的變異,這又是一個yes或no的問題。如果回答是Yes,再來看對變異致病性的判讀。與基因包不同的是,全外和全基因組需要回答,某一個基因是否是病人的致病性基因,也就是基因型是否與臨床表型相匹配。在這個問題之上,我們再來進行變異的致病性判讀。
我們來看一下我們可以從全外報告中獲得哪些信息。首先是檢測方法部分,這一部分會告訴大家,本次分析是針對一個病人還是針對核心家系也就是病人加上父母進行的。方法部分還可以告訴我們,進行的是基因包測序還是全外顯子,或者全基因組測序。臨床癥狀這一部分是由您,也就是接診醫生提供給實驗室的。病人的年齡性別,起病年齡,病情的進展速度,是非常迅速還是特別緩慢,重要的臨床檢查比如酶學檢查,肌活檢,腦部影像學等等的結果,家族史。如果孩子有特徵性面容,那麼照片就是非常重要的記錄資料了。這些內容都能夠幫助實驗室的分析人員精確地進行分析。
結果部分是實驗室報告的基因和變異。這個結果分成兩個部分,第一個部分是genotype和phenotype的相關性。基因型和臨床表型的相關性,換句話來說,其實就是我們的核心問題:捕捉到的基因能否解釋患者的臨床癥狀。那麼我們應該如何來評價以及理解呢?我向大家推薦OMIM資料庫。這個資料庫非常重要,有需要的話,我將在以後的講座時間裡為大家詳細介紹這個資料庫。
在今天有限的時間裡,我們就以這個基因為例,藉助omim來理解核心問題。
第一我們需要確認的是基因的遺傳方式與我們觀察到的相符。在omim中我們看到這個基因PTS標註的是AR,也就是常染色體隱形遺傳方式。而患者從母親那裡遺傳到了一個變異,從父親那裡遺傳到了第二個變異,患者自己是複合雜合子。這個檢測結果是符合隱形遺傳方式的。
然後我們需要查看臨床癥狀。點擊這個Clinical synopsis,我們就可以看到按照各個系統分門別類總結的癥狀。它們與患者的臨床信息是有充分的overlapping的。
所以呢,我們覺得這個基因是可以解釋患者的臨床表現的。
分析完了基因型與臨床表型的相關性之後呢,我們可以進入結果的第二個層次。這一部分是實驗室對變異臨床意義的判讀,判斷一個變異到底是致病性的,可疑致病性的,還是臨床意義未明。這個部分,實驗室會參考各大資料庫,給出的結果是可以信賴的。
推薦閱讀:
※《高通量材料集成計算》誤導《材料基因組》的研究
※生物信息學100個基礎問題 —— 第27題 GENCODE與Ensembl GTF/GFF到底哪裡不同?怎麼下載?
※生物信息神奇網站系列(一):R繪圖Gallery
※關於BBQ100活動與生物信息學Book進度的說明
※生物信息神奇網站系列(十五):R CheatSheets