目前基因組測序最新的方法有哪些?
各自的優缺點是什麼?
--本題已收錄進知乎圓桌 ? 基因解碼,歡迎關注討論。
最新?那就PacBio SMRT吧?別的三代應當還沒到實用程度。這家的特點就是讀長可以巨巨巨巨長,比如幾十K。但是越長質量越差,越短質量越好。另一個缺點是不太好加barcode序列分樣品,因為barcode有可能在滾環的時候測不到。然後,不太便宜。
所以基本上只能用在測基因組上。用來搞難測基因組,或者基因組複雜區域是神器。測結核桿菌基因組,我們用Illumina測完,組裝成一百多乃至幾百個片段,用PacBio測完直接出全圖。TCR基因座位的BAC文庫,Illumina測完只能拼成渣渣,PacBio可以直接拼全。
註明:利益相關——是
最近的消息是,已經有大量的農口客戶(研究所與育種公司)開始對三代測序感興趣了。許多經濟作物的測序正在計劃或進行中。這些基因組的特點是多倍體、重複序列多、基因組為數g至數十g。三代測序用於人類的DNA甲基化修飾也正在研究中。同時,由於二代測序只能對於SNP、INDEL等較小變異做深入分析,而無法對大規模結構變異與重排進行研究,因此這方面也有研究組在跟進。
PacBio Asia Workshop 更新(2015.3.5~2015.3.7)
優勢領域:
微生物基因組測序 (包括公共衛生領域與食品、發酵工業)複雜基因組測序,如多倍體(植物)較多結構變異與重排基因組拼接(癌症)特定應用場景靶向測序check了下,應用部分PacBio 14年11月做過更新。80多頁的PPT我挑幾頁上:
首先是優點:
1. 讀長長。2. 準確率在QV50 (P6C4最新試劑下,約30~40X)下可以達到99.999%。單條序列準確率85%(也可以理解為每個鹼基準確率)3. 錯誤無偏倚。這個性質很可貴。二代錯誤是有序列偏倚的,無偏倚就是指這個錯誤覆蓋度上去即可糾錯。有偏倚就是硬傷了。(但非常可惜,三代的硬傷是通量)4. 可無需擴增,以及測鹼基修飾 (目前軟體只有測微生物的鹼基修飾的,人目前可能是因為訓練數據不足)一些Successful story:剛剛截了一段我在一個科普公眾號發表的文章內容來回答了關於測序原理介紹的問題,其中部分內容涉及講述了第三代的測序技術,覺得用來回答這個問題也是可以的。
因為原文是講整個測序技術的發展史,要閱讀原文可以點擊鏈接 測序技術--從前世到來生(完整加強版)
三代技術主要解決二代測長較短的問題,那麼新一代技術能否將NGS的天下重新洗牌,從而搶佔新的市場都是領域相關人士和資本家們關注的重點。在這個機遇與挑戰並存的時代,幾家公司的產品正吸引著人們的眼球。PacBio 的SMRT 技術,LifeTechnologies 的 IonTorrent 半導體測序技術和 Oxford NanoporeTechnologies 納米孔單分子測序技術就是其中代表。
PacBio SMR
PacBio的SMRT仍然運用邊合成邊測序的策略,但是其超強活性的DNA聚合酶是實現超長讀長(~1000bp)的關鍵。反應在納米管中進行,方便達到超高通量的目的。利用的是ZMW(零模波導孔)原理在超小的納米孔中區別熒光信號的背景。其測序速度很快,每秒約10個dNTP。目前的問題在於測序的錯誤率太高(81-83%),這也是大多數三代技術需要解決的共同問題。不過錯誤隨機,幾乎沒有偏向性,為其通過矯正來減少錯誤率提供了可能。目前這個技術已經投入市場。
Oxford Nanopre MinlON
而Nanopore的MinlON測序儀應用納米孔單分子技術,這是一種基於電信號的測序技術,比起其他的光信號測序技術來說是一個革新。技術核心是一種特殊的內有分子接頭的納米孔,由蛋白質小孔嵌在人造膜上形成。膜兩側加上電壓,使電流通過小孔。當不同的DNA鹼基通過納米孔時,其對電流的阻礙作用短暫地影響流過納米孔的電流強度,不同鹼基影響的程度不同,這種差異被靈敏的電子設備捕捉從而鑒定所通過的鹼基種類。這種技術的優點很多,讀長長(大約在幾十kb,甚至100 kb),錯誤隨機,而不是聚集在讀取的兩端,通量較高,該公司也在努力簡化樣品製備流程。理論上運用這個技術RNA也可以直接測序,還能檢測到甲基化的胞嘧啶。不過不能實現理想的錯誤率控制,或成為其投入市場的阻礙。該公司在2016年12月剛完成其第一輪的一億英鎊的融資。
LifeTechnologies IonTorrent
IonTorrent 使用半導體晶元,在晶元的微孔中固定DNA鏈。依次加入AGCT的鹼基,DNA合成時如果鹼基可以結合到模板鏈則會釋放一個氫離子。這個氫離子導致局部HP值發生變化。離子感測器檢測到PH 變化後,便將化學信號轉變為序列信息。而如果DNA 鏈有兩個連續的相同鹼基,則記錄到的信號翻倍,從而將其識別。如果不匹配,則記錄不到變化。這種技術由於不涉及熒光激發和拍照,則運行時間被大大縮減(僅數小時),無需激光光源,光學系統和照相系統,也不需要熒游標記,規避了這些環節帶來的誤差。但是其讀長不算太長(200bp),並且當遭遇多個連續的相同鹼基時,強烈的PH變化會帶來誤差。
這段回答希望大家希望。有任何建議和意見,請在下面留言。
覺得內容不錯想了解更多的也可以到公眾號閱讀全文和其他相關內容。
http://weixin.qq.com/r/okVRSSnEXnQhrW0q9xCw (二維碼自動識別)
都屬於next generation seq的範疇,老外沒有三代的說法
納米孔和超導體
主流還是Illumina,也就是next generation seq
推薦閱讀:
※一個樣本,為什麼在做de novo文庫需構建不同插入片段的文庫(比如2k 5k 10k 40k)?
※什麼是 Hi-C 技術?為什麼 Hi-C 技術這麼火?
※如何面對DNA測序平民化所帶來的社會倫理問題?
※高通量測序還能火幾年?
※HLA分型基因測序的結果B27陽性,有6%的幾率會患上強直性脊柱炎,該如何預防?