DNA序列是怎麼測量出來的?
一個很長的脫氧核糖核酸分子,是如何被詳細的讀取出來的?
謝邀。
1. 最原始的方法是Sanger法:在分子生物學研究中,DNA的 序列分析是進一步研究和改造目的基因的基礎。目前用於DNA測序的技術主要有Frederick Sanger發明的Sanger雙脫氧鏈終止法(Chain Termination Method)。Sanger法是根據核苷酸在某一固定的點開始,隨機在某一個特定的鹼基處終止,並且在每個鹼基後面進行熒游標記,產生以A、T、C、G 結束的四組不同長度的一系列核苷酸,然後在尿素變性的PAGE膠上電泳進行檢測,從而獲得可見的DNA鹼基序列。
利用一種DNA聚合酶來延伸結合在待定序列模板上的引物。直到摻入一種鏈終止核苷酸為止。每一次序列測定由一套四個單獨的反應構成,每個反應含有所有四種脫氧核苷酸三磷酸(dNTP),並混入限量的一種不同的雙脫氧核苷三磷酸(ddNTP)。由於ddNTP缺乏延伸所需要的3-OH基團,使延長的寡聚核苷酸選擇性地在G、A、T或C處終止。終止點由反應中相應的雙脫氧而定。每一種dNTPs和ddNTPs的相對濃度可以調整,使反應得到一組長几百至幾千鹼基的鏈終止產物。它們具有共同的起始點,但終止在不同的的核苷酸上,可通過高解析度變性凝膠電泳分離大小不同的片段,凝膠處理後可用X-光膠片放射自顯影或非同位素標記進行檢測。
有時候我們在電視上看到測序的圖片,如這樣的:
將PCR反應獲得的總DNA通過毛細管電泳分離,跑到最末端的DNA就可以在激光的作用下發出熒光。由於ddATP, ddGTP, ddCTP, ddTTP(4種雙脫氧核糖核苷酸)熒游標記不同,計算機可以自動根據顏色判斷該位置上鹼基究竟是A,T,G,C中的哪一個
其測序結果就是熒光的峰值,像這樣:
把熒光信號轉化為ATCG就是測序結果2. next generation sequencing
相信大家還記得人類基因組計劃,這計劃從1990年開始到05年基本完成,用的就是sanger測序法。但是這個方法是在是太費時費事,而且消耗巨大的資源。於是各種next generation sequecing方法應勢而生。
具體的方法可以看這篇文章:http://onlinelibrary.wiley.com/doi/10.1111/j.1755-0998.2011.03024.x/abstract
如果不是專業了解,看下這個TED的視頻便可以:
這些技術不但更快捷,更便宜,而且更重要的是它是一種更直接和廣泛地研究生物的方法--
Nathan Wolfe在他的研究中利用了測序技術測得在人體鼻子中的所有DNA序列,發現竟然有20%是未知的----他們不屬於人類以及已知的細菌和病毒。3. third generation sequencing
現在還沒有定論third generation sequencing到底是怎麼樣子,但有興趣的可以看看這篇文章相關介紹http://hmg.oxfordjournals.org/content/19/R2/R227.full謝邀
雖然隔壁就是測序組,但我其實了解不多。而且我對中文名詞不了解,就隨便說說,期待搞這個的專業人出來講講。
傳統的方法 @葉一 說了,我就說新一代,現在正當紅的 nextgen。方法有很多種,本質是強調一個高通路並行處理,就是說同時處理數以億計的序列。
大致步驟是這樣的(手頭沒有更新的圖了):
大致過程也是先把 DNA 切成短序列模板,然後把這些短序列都放固定到要成像的 chip 上,每個短序列都是一個 polony,就是說在 chip 佔據一個位置,在這個位置上固定的是一批通過 PCR 複製的這段序列的克隆。
然後就跟傳統方法一樣,配對生長,每長一個核苷酸,就成像一次,在圖像上看就是無數的小點,每個小點對應一個 polony,回頭通過分析就是這個 polony 對應序列的一個核酸(其實具體的技術還很不同,這麼說太粗了)。這樣生長下去,就能把每個 polony 的序列給測出來了。
好處當然是因為高通量,所以一下子就把一個基因組就測了(理論上)。缺點是,每個序列長度都短:長 polony 時,每一步都會因為種種問題,有些序列模板長不下去了,信號也會變弱。最後得到的序列長度相對傳統方法就短一些。
短的問題是,它很難作 de novo 的測序,就是說,因為短序列之間的交疊太少,就無法從短序列合成出全部基因組(事實上,就是傳統的 sanger 法,在染色體末端,因為有大量的重複序列,也是無法很好的測出的,所以人類基因組推出時,這段是沒有的)。所以只能拿舊方法測出的全基因組作參考序列,把短序列對上去(alignment)。這樣,也是越長,對得越准,出現不確定結果的可能越小。
類似的問題是,測序終歸是要看這序列與已知序列的異同,就要面對有很多不同,短序列對很多基因變異的檢測能力會下降,比如染色體的倍增這樣的。
另外的問題是 coverage,就是說用這種高通路方法,生成的以億計的 polony,看上去看多,但可能還是會錯過部分基因組,而在某些部分有很多的短序列覆蓋。早期的方法,好像是能覆蓋 80%,也就叫全基因組測序了。
另外,各種不同測序方法,也有各自的優缺點。
當然,我想經過這幾年發展,技術應該能提高不少。所以,上面意見僅供參考。我把關於DNA測序的經典方法用中學生能明白的語言告訴你吧!
1. 首先有一段待測的DNA,然後選一個定點作為配對複製的起點.2. 同時外邊還有很多遊離的核苷酸,可一部分核苷酸是不太一樣的的,意思就是當這個核苷酸參加了一個配對反應,之後就不能再接別的核苷酸加入複製鏈的序列,就是說那些"不太一樣"的核苷酸會成為複製鏈的終點3. 和原DNA模板配對的反應無時無刻在進行著,所以會有許許多多不同長度的複製鏈產生.他們都擁有相同的起點,可終點的位置不同,因為那些"不太一樣"的核苷酸可以在任意可以插入的位置4. 不同長度的鏈條就有不同的重量,用膠體電泳方法可以把這些鏈條按照從重到輕(也就是從長到短)來排列 (至於膠體電泳,簡單就是說把一堆DNA鏈條通電,重的跑的慢一些,輕的跑的快一些.然後跑的慢的過 了一段固定的時間就會走的距離比較短,跑得快的就走的距離長.這樣一個根據重量也就是鏈條長短排出的圖譜就出來了)5. 恰好這些"不太一樣"的核苷酸都帶有熒游標記.A/G/C/T都會在激光照射下發出不同顏色的熒光.所以把那一堆排好的DNA鏈條們在激光下照一下,那麼每條鏈末端都會表現出一種顏色.對著一看,就知道每條鏈末端是什麼鹼基6. 因為DNA數量很大,所以一定可以保證一條鏈和下一條鏈只差一個核苷酸.所以顏色排出的鹼基順序就可以直接推出原DNA片段的序列了!來說下單分子測序吧,也就是大家說的第三代測序。現在相對成熟些的是Pacbio的技術,最初的論文發在Science Magazine: Sign In。總的來說相對於前兩代技術,特點是序列超長,可以達到幾千鹼基對,但是錯誤率要超過10%。看圖,圖A是基本的實驗設置,在測序儀上有上千個Zero Mode Waveguide(波導,一種傳輸電磁波的結構,具體請參考Waveguide)。在波導里,有一個被固定的Φ29 DNA聚合酶。在測序時,帶有熒游標記的鹼基被DNA合成酶合成到序列上,底部照射的激光打到熒游標記產生熒光信號,記錄儀記錄不同顏色和強度的熒光信號並翻譯成DNA序列。隨後染料結合的熒游標記會被釋放,導致熒光脈衝信號的中止。隨後DNA模板移動到下一個位置,開始準備結合下一個熒游標記的鹼基。另外一個現在正在開發的技術是利用納米小孔(nanopore)測序(上圖)。基本概念是讓DNA序列穿過納米孔,由於穿過的部位的化學和物理結構不同,所以導致在穿過是導電能力的變化,通過在納米孔兩端施加電壓並測量穿過的電流,就可以推斷出穿過納米孔的鹼基(下圖通過電流的大小來區分ATCG)
- Real-Time DNA Sequencing from Single Polymerase Molecules,Science 2 January 2009: Vol. 323 no. 5910 pp. 133-138, DOI: 10.1126/science.1162986
- The emergence of nanopores in next-generation sequencing, L J Steinbock and A Radenovic 2015 Nanotechnology26 074003
- Automated forward and reverse ratcheting of DNA in a nanopore at 5-? precision, Nature Biotechnology 30, 344–348 (2012), doi:10.1038/nbt.2147
前面知友說的都差不多了,我想根據我自己的知識補充一下。我知道的方法分三種:1、前面提到過的sanger法,也叫化學合成法,通過對DNA末端進行基於化學合成的逐步擴增,在擴增的時候通過熒游標記來確定擴增的核苷酸是什麼,從而得到DNA序列。————————————————————————————2、前面也提到過的ngs(next generation sequencing),具體方法上有點不同,不過大同小異,和talich講的差不多,每個公司有自己的一點特色。方法的思想是通過將DNA碎片化,然後批量的擴增,通過信息學手段比對DNA語料庫里的數據,來得到具體的序列。通俗點說就是把一個字剪開,還原成偏旁部首等,然後通過偏旁部首和其他部分在字典里找到一個字。具體到應用在de novo或者是簡單比對上,其實和不同公司的機子還有重複次數等有關,有的原始碎片長一點有的短一點,有的重複多一點有的少一點,有的就准一點有的就便宜一點,各有不同。————————————————————————————
3、還有一種不知道怎麼分類的,也叫single molecular sequencing。將DNA切成相對較長的片段,先熒光染色,然後在電泳的基礎上然後經由nanorods(不記得是不是這個詞了)拉伸,進入nano pore進行序列讀取,文章說是單分子,其實是比較小的DNA分子(貌似是小麥?),在應用到大的分子時還是會切開的,要不然容易在第一部拉伸的時候卡住進不去。這種方法的好處就是讀取的分子長度長,容易區別出重複區,而且速度也挺快的(沒用過,據稱全序列是和454一個級別),不過不知道價格怎麼樣。
沒學過生物也可以自己查文獻吶
推薦閱讀:
※DNA 為什麼比 RNA 穩定?
※如果地球上有另外一種DNA結構,那麼它對應的生物能作為我們現在DNA結構生物的食物嗎?
※DNA和RNA是什麼味道的?
※如何通俗的理解基因編輯中的脫靶效應?它跟基因編輯的安全風險有著怎樣的聯繫?