ATAC-seq:染色質開放性測序技術

註:本文整理自答案【吳思涵:什麼是「 ATAC-seq 技術」?現在用於哪些生物學研究?】略有調整。


ATAC-seq全稱Assay for Transposase Accessible Chromatin with high-throughput sequencing,即利用轉座酶研究染色質可進入性的高通量測序技術。

要理解這項技術的作用,首先需要認識染色體/質的結構。

真核生物的核DNA並不是裸露的,而是有蛋白質即組蛋白與之相結合的。DNA一圈一圈地纏繞在組蛋白上,形成串珠式的結構。而這樣的結構還能夠進一步摺疊、濃聚,並在其他架構蛋白的輔助下,形成染色體。

這樣做的意義在於,能夠將超長的DNA鏈,摺疊成很小很小的結構,從而塞進小小的細胞核里。比如說,人類的DNA鏈如果完整展開,那麼大概會有2米那麼長。而經過這樣的摺疊,就變成了納米至微米級染色體/質的結構了。

這就好比我們在電腦中,將一個記錄著ATCG四個鹼基的純文本文件,通過演算法將其壓縮成zip文件。

但是我們又知道,DNA的複製,基因的轉錄,是需要將DNA的高級結構解開的。這就類似於,要從zip文件中獲得信息,首先需要解壓縮。但是,這裡的解壓縮並不需要將整個zip全部打開,而只需要打開一部分,即需要表達基因的區域即可。而這一個過程,主要由染色體組蛋白的修飾(尤其是乙醯化)來實現的。

這部分打開的染色質,就叫開放染色質(open chromatin)。而染色質一旦打開,就允許一些調控蛋白(比如轉錄因子和輔因子)跑過來與之相結合。而染色質的這種特性,就叫做染色質的可進入性(chromatin accessibility)。

我們如何去尋找開放的染色質區域呢?

傳統的實驗方法主要是藉助MNase-seq和DNase I hypersensitivity assay。

這兩個實驗的主要思路是一致的:染色質變得開放,就意味著DNA和組蛋白的濃聚程度降低,就會有一部分DNA暴露出來。而一旦失去了蛋白質的保護,這部分DNA就可以被DNA酶(MNase或DNase I)所切割。然後,我們再把切割完的DNA拿來測序,和已知的全基因組序列相比較,就能發現被切掉的是哪些地方,沒有被切掉的地方又在哪裡,從而獲知開放的染色質區域。

不過,這兩個方法都有明顯的缺陷,即耗時費力與重複性差。具體就不展開講,親手做過的就知道這兩個方法有多麼討厭。

2013年,美國Stanford大學的William Greenleaf教授研發了一種全新的方法,利用DNA轉座酶結合高通量測序技術,來研究染色體的可進入性,即ATAC-seq

ATAC-seq原理和結果示例

DNA轉座,是一種把DNA序列從染色體的一個區域搬運到另外一個區域的現象,由DNA轉座酶來實現。這種轉座插入DNA,也是需要插入位點的染色質是開放的,否則就會被一大坨高級結構給卡住。

那麼,如上圖a,我們只要人為地,將攜帶已知DNA序列標籤的轉座複合物(即帶著紅色藍色測序標籤的轉座酶Tn5),加入到細胞核中,再利用已知序列的標籤進行PCR後測序,就知道哪些區域是開放染色質了。而這也就是ATAC-seq的原理。

ATAC-seq出來的結果,和傳統方法出來的結果具有很強的一致性,同時也和基於組蛋白修飾marker的ChIP-seq有較高的吻合程度。也就是說,ATAC-seq中的peak,往往是啟動子、增強子序列,以及一些反式調控因子結合的位點。

相比起來,ATAC-seq的重複性,比MNase-seq和DNase-seq的更強,操作起來也更加簡單,而且只需要很少的細胞/組織量,同時出來的信號更加漂亮。目前已經是研究染色質開放性首選的技術方法。


推薦閱讀:

聊聊轉錄組測序——2.數據分析與解讀(下)
聊聊轉錄組測序——2.數據分析與解讀(上)
illumina 在 2018 年 1 月 8 日發布的 iSeq 100 系統平台潛力如何?
在對線粒體基因測序前為什麼要對患者進行線粒體病評估?

TAG:测序 | 染色体 | 分子生物学 |