十年過去了,離「生命編輯」這個宏大夢想越來越近
最近十年,遺傳學(包括基因組學)有哪些實質性的突破?
Juntao Yu,Biosciences, Junior@USTC
呼,藉此機會回顧一下最近看的和做的一些東西。
這十年 Genomics 的主要變化就是定量化和可編輯,這段時間基因組學的主要任務有以下三種是對基因組進行功能性的注釋 (Functional annotation)、理解表觀遺傳修飾 (Epigenetic modification) 在基因組中的作用以及大量的基於高通量測序技術的相關表徵技術的出現。這三個部分充分融合生命科學和生物技術,聯繫緊密,使得我們可以看到一個多層次的高解析度的基因組 (multi-layer genome in high resolution, 好吧,我自己定義的 2333)
基因組的功能性注釋
關於這個話題,我在將「垃圾 DNA」(非編碼 DNA)全部去掉對生物體會有什麼影響?中有很詳細的闡述,並列舉了許多常見的前期沒有注釋完全的未知基因組成分。這一領域的突破非常的迅速,當然也要歸功於 ENCODE 計劃的持續推進。
這裡再簡單說一下,基因組除了蛋白質編碼成分以外的其他成分功能不明確,因而需要開展更為詳細的研究,其中非編碼 RNA (non-coding RNA, ncRNA) 和順式調控原件 (cis element,例如增強子) 等都是近期研究的熱門。除了發現這些元件在基因組的物理位置以外,更多的功能性研究還在持續深入。
例如,前幾天對一個著名的 Xist ncRNA 的功能性深入研究的論文發表在 Cell 上,這篇文章開發了一種高通量 RNA 雙鏈尋找的實驗技術 (PARIS,psoralen analysis of RNA interactions and structures),並用它對 Xist 的 A-Repeat 等 RNA 課題進行了詳盡的研究。
詳見:Lu et al., RNA Duplex Map in Living Cells Reveals Higher-Order Transcriptome Structure, Cell (2016), http:// http://dx.doi.org/10.1016/j.cell.2016.04.028
而順式作用元件也充滿了未解之謎,關於增強子 (Enhancer),之前人們認為還存在超級增強子 (super-enhancer)這樣的亞型存在,此外今年初,研究人員還發現了一種在幹細胞中存在的短暫作用的增強子 (Temp-enhancer),這一方面的研究還在繼續,尚未定論。但是可以知道的是,基因組中的順式作用元件的功能還有多很多秘密在其中,而且很多順式作用元件是染色質高級結構的作用點,因而會參與更高層面的基因修飾和調控作用,這都是令人興奮的發現!
詳見:A new class of temporarily phenotypic enhancers identified by CRISPR/Cas9-mediated genetic screening
這些新發現都源於技術進步,在後面我們還會詳細說一下這方面的技術突破。
多個層次的表觀遺傳修飾
當然了,我們測序看到了一堆 ATCG 的數據,但是在現實情況下,他們都是化學物質——既然是化學物質,和外界環境的相互作用就是不可避免的。在這一段時間內,我簡單總結有三個層次的基因組序列不變卻導致表觀遺傳修飾改變的現象發生,包括:DNA 層面的表觀遺傳修飾、組蛋白層面的表觀遺傳修飾和染色質的三維拓撲結構。
1) DNA 層面的表觀遺傳修飾:當然了,主要分為兩類過程,一是全基因組層面的甲基化譜的繪製和分析,幫助我們了解其與基因表達的關係,在 2009 年,單個鹼基解析度尺度的人類的 DNA 甲基化組繪製完成。
詳見:http://www.nature.com/nature/journal/v462/n7271/full/nature08514.html
二是,除了甲基化以外的更多的 DNA 修飾成分也被發現,2009 年 Cytosine 的羥甲基化在哺乳動物中被發現,隨即開始了 DNA 層面表觀遺傳修飾代謝過程的研究。同時,研究人員還開發了新的技術用於繪製這些新的化學修飾位點(後面還會講到)
詳見:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3263819/
這一方面了解不多,大致說到這裡
2) 組蛋白層面的表觀遺傳修飾:這裡主要想說的是組蛋白層面的表觀遺傳修飾和順式調控元件之間的關係。2007 年,科學家利用 ChIP-Chip 的方法確認了兩種類型的 Histone Marker分別於啟動子、增強子具有相關性,其中 H3K4me 和增強子信號相關、H3K27me3 和啟動子信號相關,這一研究在今年用超高解析度熒光顯微成像技術得到了驗證。Super-enhancer 的 Histone Marker 也有被發現。
2007 年文章詳見:http://www.ncbi.nlm.nih.gov/pubmed/17277777
2016 年文章詳見:http://www.nature.com/nature/journal/v529/n7586/full/nature16496.html
組蛋白層面還有很多新的發現,例如在 H1 發現和 DNA 修復相關、組蛋白突變與癌症相關都是最近新的重要發現。
Nature 揭示第 5 類組蛋白的功能
Science:組蛋白單點突變可導致罕見兒童癌症
3) 染色質三維拓撲結構:
一個 TAD 大致的物理樣貌,通過 CTCF-Cohesin 組成的 TAD,以及 ChIP-Seq 和 ChIA-PET 的數據表列為背景,圖片來自網路,侵刪
這是這一段時間非常熱門的方向。以往人們都看到的是人類染色體在分裂中期的樣貌,但是真正在轉錄過程中多數處於間期的狀態,其中的三維結構對基因的表達調控影響非常重要,這一領域一直被人忽視,大概 2003 年起,研究人員首次開發出了基於分子生物學手段的染色質相互作用捕獲技術 (Chromatin conformation capture, 3C) 之後,這一個領域逐漸受到大家重視。
基於 3C 的技術在這段時間有著很快的發展,後面有了 4C、5C 直到最後的 Hi-C(全基因組的染色體相互作用捕獲技術),人們可以利用高通量測序技術捕獲染色質的三維結構。至此可以得到大量此前不可得知的信息,彌補顯微鏡障礙一直以來帶來的困擾。
利用 Hi-C 對細胞進行染色質三維構象的分析得出了一些基本的事實:染色質三維構象在生物體內是基本保守的,隨著年齡的變化也不會發生很大的變化;我們可以將染色質分為 Compartment A 和 B,發現恰好與轉錄激活和轉錄沉默相關聯(類似於更為粗略的常染色質、異染色質的分類方法);最重要的一點在於,2012 年發現的其中存在一些很穩定的拓撲相關結構域 (Topologically associated domain,TAD),研究發現在 TAD 中的轉錄一致性相當高,這一領域瞬間爆炸。人們開始利用 Hi-C 陸續繪製細菌的、酵母的、哺乳動物、人類各種細胞株系、細胞分裂期的、人類不同發育階段細胞的染色體三維構象,探索 TAD 在其中的變化。
關於 TAD 的發現:Topological domains in mammalian genomes identified by analysis of chromatin interactions : Nature : Nature Publishing Group
http://www.nature.com/nature/journal/v485/n7398/full/nature11049.html
兩篇文章同期發表
這兩年 TAD 的研究越來越令人興奮,並且有更多發現出爐:
今年 4 月份的研究發現,TAD 演化的複雜性和 TAD 所調控的 Hox 在動物肢體發育的精細化程度中的作用得以發現。
詳見:http://www.ncbi.nlm.nih.gov/pubmed/26829752
去年年底,一篇 Cell 的文章驚人的發現,TAD 失活導致增強子作用異常進而導致了多指症等三種與手指發育異常相關的遺傳病,研究人員在小鼠中利用 CRISPR/Cas9 對 TAD 進行了類似的處理,並驗證了小鼠確實發育出異常手指的事實。這是令人興奮不已的成果。
詳見:http://www.ncbi.nlm.nih.gov/pubmed/25959774
這兩年研究也發現 TAD 的失活與腫瘤密切相關,兩個組相繼發現神經膠質瘤和白血病患者中出現 TAD 的失活導致原癌基因表達異常等其他分子機制,進而對腫瘤做出貢獻。
詳見:http://www.nature.com/nature/journal/v529/n7584/full/nature16490.html
http://science.sciencemag.org/content/early/2016/03/02/science.aad9024
生物信息學研究也發現更多腫瘤的 TAD 異常導致原癌基因的過度表達,進而對癌症發生產生了影響。CTCF 結合位點的高度突變率是導致 TAD 失活的主要原因,現在暫時不清楚為什麼突變會集中於此。
基於高通量測序技術的生物技術發展
基於高通量測序技術的生物技術突破是發現前面的新結果的重要原因,目前看來有三類主要的技術發展:第二代測序技術 (Next Generation Sequencing, NGS)、第二代合成技術 (Next Generation Synthesis) 和基因編輯 (Gene Editing) 技術。其中合成技術暫時還沒有廣泛應用起來,但是可以看到未來將會非常的實用。
基於 NGS 人們開發出了許多方法用於檢測基因組的甲基化圖譜 (Bisulphite-Seq)、羥甲基化圖譜 (TAB-Seq)、各種組蛋白修飾位點 (ChIP-Seq)、PolII 等蛋白質結合位點 (ChIP-Seq)、某種蛋白結合染色質的位點分析 (ChIA-PET)、轉錄讀本數 (RNA-Seq, GRO-Seq)、染色體三維構象 (Hi-C)、ncRNA 作用位點 (ChIRP-Seq)、RNA 雙鏈捕獲技術 (PARIS)、核纖層結合位點捕獲技術、小分子藥物在染色質上的分布 (Chem-Seq) 等等方法,主要的思想都是通過交聯固定相互作用位點、利用酶切或者是超聲破碎等方法把整體打斷、再用酶連連接、加上適配體 DNA 開展高通量測序,最後得到測序讀本之後進行定量的分析。
引用自:3C-based methods : Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data : Nature Reviews Genetics : Nature Publishing Group 侵刪
合成技術的發展主要是體現在今年 4 月人造最小基因組生物的論文中,但是暫時還沒有廣泛應用起來,如果能夠實現高通量的高保真合成,將來生命科學可編輯的程度將會大幅增強。
詳見:http://science.sciencemag.org/content/351/6280/aad6253
關於基因編輯,現在主要是基於 CRISPR-Cas9 的一系列的方法,包括基於這個系統的剪切、修復,把 Cas9 突變沉默成 dCas9 之後,融合 GFP 進行活細胞定位、融合 TF 促進轉錄 (CRISPR-On)、融合沉默轉錄蛋白抑制轉錄活性 (CRISPRi),融合 Cytosine 去氨基酶進行單鹼基的基因編輯等等。大量的創業公司基於 Cas9 展開,專利大戰如火如荼。前幾天,河北科技大學的韓春雨教授開發的 ssDNA-guided genome editing(DNA 引導的基因編輯)讓生物界又一次沸騰,他開創了另外一條思路走基因編輯之路,新的技術優缺點都很明顯,但是可以知道的是改造 Argonaute 的主動權會向中國傾斜一點點。這一領域競爭非常的激烈。
總體來說,遺傳學感覺不再叫遺傳學了,還是叫分子生物學好一些,因為不僅僅是簡單的遺傳過程了,人為改造的成分可以越來越多,將會更多。人們理解基因組現在越來越深入、而且是從 ENCODE 就可以看出是多個層面的理解,所以叫做 Multi-layer genome in high resolution。
大家還得繼續加油~
(本人比較懶,reference 不想再在最後列了,大家感興趣可以私信我~文中用的圖片來自網路,侵刪)
查看知乎原文(12 條討論)推薦閱讀:
※乳腺癌潛伏期十年,幾種癥狀竟是癌前信號,趕快自檢下
※六十年前的掛鐘
※我聽「中樂」五十年
※人生四十年
※沈家豪是個陷阱,二十年過去,你還沒看清么?