標籤:

從患者開始談基因檢測的整個流程

題記:幾顆玉米放進爆米花機器,出來便是爆米花;一個智力一般的高中生放到人大附中,三年後出來就是國際一流大學新生;二兩五花肉和幾個青椒交給一名廚師,出來的便是香噴噴的回鍋肉。可是這中間都發生了啥?是什麼重要步驟將初始原料打磨成了成品?10ml的血液或者一塊腫瘤組織,最終變成了一份20頁的檢測報告?這是怎麼實現的?中間都發生了什麼?本文旨在回答這個問題。

基因檢測的整個流程可分為哪幾個大的步驟?

概況性地了解一個事務的框架是很有必要的,因為這樣我們心裡會有「底」。不管別人怎麼分,我簡單粗暴地把它分為四個程序:1,檢測前諮詢部分;2,實驗室部分;3,信息分析部分;4,臨床解讀部分。五臟俱全的基因檢測公司應該包含以上所有的四個程序,除非存在部分業務外包的情況,例如有的公司只做臨床解讀部分。1)檢測前諮詢部分:不是所有的癌症患者都應該檢測,都值得檢測,檢測目的是為了明確是否可以使用靶向藥物,還是僅僅為了玩,選擇哪種產品更加適合,這些都是需要在這部分搞清楚。2)實驗部分:應該取多少組織樣本,測序過程中有哪些細節步驟,這可是個核心環節。3)信息分析:實驗部分做完以後所得到的是一大堆序列,不分析就是一堆垃圾,信息部要做的就是從這些垃圾中挑選黃金。4)臨床解讀:黃金挑選出來不拿去換成大米然後進肚,那也沒什麼用,基因檢測的結果有什麼意義,對臨床實踐又何指導,全在這裡了。

四個程序,每個程序又包含哪些小工序呢?

通過上面的介紹,我們可以大體了解基因檢測分為四個程序,也明白四個程序主要做什麼。可是,每一個程序又具體涉及哪些小程序呢?剖析程序的過程,就是知識差異化的過程。1,檢測前諮詢:患者預期、產品選擇;2,實驗部分:樣本獲取與運輸、DNA製備與文庫構建、質控與上機測序;3,信息分析部分:數據分析、報告初稿;4,臨床解讀部分:檢測報告、臨床實踐、報告解讀/人文關懷。總而言之,簡單來說,從明確患者的檢測目的開始(用藥指導,耐葯後尋找新的方案,僅檢測一個基因或多個基因突變狀態等),到選擇合適的產品,然後獲取規範的樣本(血液,組織,唾液等),然後合適的運輸方式到達實驗室,然後一些列的規範實驗室操作及數據分析,最後到科學的檢測報告與諮詢服務。這就是四個程序所包含的內容。每一個程序分為許多小工序,每一個小工序又有許多學問與講究。下面將會詳細介紹每一個小工序。

程序一:檢測前諮詢部分

1.1:患者預期。銷售經理、產品經理、主治醫生與患者需要充分溝通,明確該基因檢測的目的,知道檢測技術的局限性,做好患者的預期控制。

1.2:產品選擇。對於基因檢測產品來說,產品選擇幾乎等同於檢測基因的選擇。哪些基因需要強行檢測、哪些基因推薦檢測、哪些基因有一定的檢測價值,這些需要闡述清楚。最後,根據患者的經濟情況與病情,綜合選擇(這是理想狀況)。實際操作過程中,銷售經理往往會以經濟利益為導向。

1.3:臨床信息。患者的臨床信息對於基因檢測報告者有重要意義,信息掌握越全面報告越個性化,諮詢解讀也更有針對性。因此,完整詳實的臨床申請單需要提供。

程序二:實驗部分

2.1:樣本類型。需要明確一點,能夠運用無創的盡量用無創(唾液與血液),因為沒有一個患者希望無緣無故的在自己身上打洞。固體:手術樣本,穿刺樣本,石蠟包埋組織,石蠟切片組織;液體:全血,血清+血細胞,胸水,腹水,唾液。1)手術樣本:(腫瘤組織≥50mg,癌旁正常組織≥25mg,收到組織後立即用至少5倍體積的10%中性福爾馬林固定液固定),切片25張以上,厚度5 μm,腫瘤細胞佔比≥50%,壞死組織區域<10%,4-8℃且24h內送達實驗室。2)穿刺樣本:穿刺一針以上,腫瘤細胞佔比≥50%,壞死組織區域<10%,4-8℃且24h內送達實驗室。3)石蠟包埋組織:常溫保存運輸即可,最好是1年以內。4)石蠟切片組織:常溫保存運輸即可,最好是6周以內。5)全血:6ml-10ml for NGS (Streck管,含有保存液,負壓真空抽滿),輕輕垂直平面90°旋轉10次,6-25℃(常溫)運輸,3(7)日內送達,可用乾冰/制熱劑製造維持環境溫度。6)血漿+血細胞 (普通試管):抽血後 2h 內將全血4℃ 1600g離心 10min,分別收集上清和沉澱至離心管中;上清再 4°C 16000g 離心 10min,收集上清血漿轉移至 15mL 離心管中。血漿+血細胞樣品,均封口膜封口,乾冰運輸。7)胸水:8)腹水:這兩個情況比較少,至少我們公司很少遇到這樣的樣本。

2.2:質控。血液樣本是否合格,是否可以進行測序上機,樣本質量怎麼樣?安捷倫2100生物分析儀或者4200 TapeStation核酸分析儀,通過DNA完整值(DIN)來數字化基因組DNA的完整性。如果不用這些儀器,可以通過跑膠來實現這一步。質控不合格,只有重新採樣。標準流程只需要0.1-1μg DNA,DNA的OD 260/280在1.8-2.0之間,RNA的RIN值≥8.0。實驗中發現,只要RIN值大於7,就可以獲得比較滿意的結果。(RIN:RNA完整值)。總的來說,質控兩個指標:1)足夠的DNA量;2)完整的DNA基因組。這個步驟在構建文庫後上機測序前完成。

2.3:文庫構建。簡而言之,獲取足夠量的/目的的/前期適合上機測序而標準處理的DNA。其程序主要有:片段化,連接,擴增。1)片段化:我們總不能直接將那麼長的DNA去測序吧,測序儀就只能一次測幾百bp的DNA,超聲波片段化等方法,獲得DNA片段為正態分布200-500bp,通過一定方法(切割瓊脂糖凝膠電泳條帶)選擇所需長度的DNA片段(150-200bp),其它的片段就扔了(不影響覆蓋範圍)。2)末端修補:上面的方法(物理方法)片段化的DNA,一般來說兩端都被破壞了,不再是平平整整的了,而後續步驟需要在兩端加測序接頭,所以我們得先把這個破壞的兩端修補好。修補所需三種酶:5『端延伸的酶,5』端連接的酶,3『端延伸的酶。3)3』端加A:片段化且兩端修補好的DNA,3『端加上一個鹼基A,而下一步驟的連接接頭3』端有一個鹼基T,這樣就實現了鹼基互補而連接起來了。這樣做還有以下幾個原因:提供連接效率;防止接頭與DNA片段多種方向連接;減少接頭之間的連接。值得一提的是1)2)3)的步驟可以用WGS Framentation Mix搞定。4)兩端加接頭:首先明確接頭3『端有一個突出的鹼基T,插入片段3』端有一個突出的鹼基A;其次,這個工序是在插入片段兩端加入東西;這個東西包括以下幾個部分:測序接頭(P5,P7;測序時用於與種植在Flow Cell上的序列鹼基互補配對用),Barcode(用於標識該條DNA片段屬於哪個樣本,4個鹼基),單分子編碼序列(Index,用於識別是哪條DNA片段,12個隨機鹼基);其中Y型的序列是已經商業化的試劑盒。5)PCR富集:如果樣本不夠,那麼我們就需要擴增它才能上機測序,這就是該環節存在的必要。由於每個經4)處理的片段兩端都有P5與P7,因此PCR引物只需設計與它們配對的就行了。如果樣本足夠,這一步就省了唄。6)文庫定量:這裡才應該是質控,也就是2.2的步驟。7)基因捕獲:我們只將需要的DNA片段去測序,不需要的去測不是浪費錢嗎?於是在測序之前,我們就用這個工序將目的DNA挑選出來(為什麼要捕獲);目前目標序列捕獲方法有3種,NimbleGesn Sequence Capture array,Agilent SureSelect DNA Capture Array,Agilent SureSelect Target Enrichment System,值得注意的是不同捕獲方法可能測序儀器有不同的要求(捕獲的方法有哪些;羅氏和安捷倫);我們捕獲的探針設計可以自己設計,初步設計,需要檢測的位點提交到商業公司,真正的設計還是需要專業的商業公司來干(捕獲探針的由來);例如目標區域為100Kb,好的探針是100%覆蓋這100Kb,而有的商業公司達不到,只能覆蓋到97%,那麼意味著有3%的區域捕獲不到,更談不上對這些區域測序了,所以覆蓋率很重要;對於這100Kb的目標片段,前10Kb探針捕獲了100個片段,第10Kb-20Kb的探針捕獲了10個片段,那麼這樣的話就是均一性不好,最終可能會得出結論10Kb-20Kb這一段突變頻率過高/過低,因此均一性很重要;如果一個探針設計出來想捕獲目標片段,卻捕獲到了別的垃圾片段,我們還對它測序,這不是浪費錢嗎?所以,探針特異性很重要。(好的捕獲是怎麼樣的)8)PCR擴增:PCR再次擴增捕獲的DNA片段,上機前再一次加足樣本量。9)文庫再次定量:相當於上機前的再一次質量檢測

2.4:上機測序。通過前面的步驟,我們從患者身上的一塊腫瘤組織或者一管血開始,然後分離提純我們需要的基因組DNA,再把這些DNA打成小片段,然後再在這些DNA小片段兩頭接上識別標記和測序接頭,最後再通過基因捕獲技術篩選出目的DNA,根據需求PCR擴增。通過這麼多步驟,就是為上機測序做準備。一句話,上機測序的過程就是讀取這些DNA小片段的序列,如ATCTGGCTT...(~160bp),這樣萬級、億級的DNA片段個數。至於這些DNA片段是怎麼樣在機器上被測出來的,這又是個大問題,我在《液體活檢有哪些》這篇文章有簡要說明,這裡不管它,畢竟世界上那麼多事情,哪有想管就管得了的呢?至此,實驗部分結束。

程序三:信息分析部分

3.1:下機數據識別。數以億計的DNA小片段,一大餅,雜亂無章,很多情況是幾十個患者的樣本都一起的,更亂。一句話,這個步驟將屬於不同患者的DNA小片段放進不同的盒子里,分類。這是怎麼實現的呢?我們在構建文庫的加接頭步驟時,同時加上了Barcode序列,同一個患者使用同一個Barcode,不同的患者使用不同的Barcode,那麼計算機通過這個Barcode輕鬆識別然後放進不同的盒子里。值得注意的是,DNA是兩條鏈,有的公司會兩條鏈同時測序以增加準確性,因此一個A患者會有兩個盒子屬於他(A1:正義鏈的DNA小片段集合;A2:反義鏈的DNA小片段集合)。還值得注意的是,如果樣本是血液,有的公司會同時檢測cfDNA和gDNA,那麼一個B患者就會有四個盒子屬於他(B1,B2,B3,B4)。

3.2:圖像轉換。下機的時候那些DNA片段最初其實是圖像格式的,例如紅色表示鹼基A,綠色表示鹼基T,需要用專業工具將圖像格式轉換成序列。Illumina公司提供專業軟體,只需對其調用就可以完成這一步驟。一句話:圖像轉換成序列。

3.3:比對到基因圖上。將這些上以億級的DNA小片段歸位,如果你是1號染色體的第500位到第650位之間的片段,就把你歸到這個位置下面。當然,1號染色體上的這個位置下面一般不止一條DNA片段,畢竟有一個概念叫做測序深度,如果測序深度為10000,那麼理論上該位置下面就應該有10000條DNA片段。怎麼控制是10000條呢?這在上機之前構建文庫時,通過調節PCR擴增來實現。一句話:將散亂的DNA小片段比對到參考基因組上,從而實現它們的定位。這個參考基因組是國際權威資料庫給出的,供給全世界所有人使用。基因組:hgdownload.cse.ucsc.edu;比對軟體BWA:bio-bwa.sourceforge.net

3.4:計算突變頻率。假如1號染色體的500位到第650位有10000個DNA片段,那麼測序深度就真的是10000嗎?在這裡需要做一個辨別,如果這10000條DNA片段有9000條是一模一樣的,那麼我們認為這是一條DNA片段PCR擴增出來的,這9000條只能算作1條,這時候有效測序深度為1001。在某個特定的位點,如果這1001條DNA片段有100條發生同樣的與參考基因組不一樣的變化,我們就認為該點的突變頻率為10%。這10%的突變頻率(血液腫瘤驅動基因突變為例)意味著:血液中的cfDNA有10%是ctDNA,從而反應患者的腫瘤病灶有一部分癌細胞發生了該突變,若有針對該位點的靶向葯,那麼可根據情況推薦使用。值得注意的是,如果有效測序深度只有100,那麼就有可能漏掉一些典型的突變,所以有效測序深度足夠是非常重要的。這裡有一個問題:某個特定位點的變化,怎麼樣才算真正的突變呢?冷泉港實驗室的VarScan軟體來判定SNV和INDEL,順便說一句要判定真正的突變很難,國際上有不同的看法。VarScan:varscan.sourceforge.net

3.5:1)原始數據過濾;2)數據比對BWA;3)比對文件處理;4)去除PCR重複dedup;5)mpileup文件生成samtools;6)體細胞SNV、Indel變異檢測;7)體細胞Fusion檢測;8)體細胞SNV、Indel變異注釋annovar;9)突變質量檢測。

程序四:臨床解讀部分

根據基因檢測報告結果、患者意願、醫生意見綜合判斷,最終決定採取何種臨床決策。例如:開始使用靶向治療、繼續使用化療方案、參加某個特定的臨床試驗、更換化療方案、維持治療、家屬進行基因檢測等。


推薦閱讀:

澳洲絕症女子中國得生,是莆田系軟文太猛還是中國醫療超強?
行業認知
七言·贊13歲抗癌女孩蒙欣
每天吸三盒煙,會有多大概率得肺癌。會對身體造成多大危害???
為什麼喬布斯最初不願接受外科手術治療胰腺癌?

TAG:癌症 |