簡史系列|RNA-RNA /DNA/Protein研究簡史
作為我們星球上最古老的生物大分子,早在DNA產生之初,RNA可能就扮演現在儲存遺傳信息的功能,RNA自身還能摺疊成複雜的高級結構,並能與蛋白結合參與精確而複雜的生理調節。
RNA在生物信息傳遞過程中發揮至關重要的作用,在中心法則中RNA是聯繫物種遺傳信息與蛋白的紐帶。與此同時在RNA生物體內的種類也紛繁複雜,在人類基因組中序列除5-10%的mRNA以外,絕大多數的RNA是無法編碼蛋白的ncRNA,它們包括snRNA,siRNA,piRNA,miRNA,rRNA,tRNA,circRNA,lncRNA, snoRNA,antiRNA,telomerase RNA等。其中部分siRNA,miRNA, piRNA,lncRNA, circRNA在調控基因表達及染色質結構中發揮重要作用。
siRNA通常是一段長21nt的雙鏈RNA,在植物中通過與靶標的RNA特異性結合降解RNA導致基因沉默;miRNA則是一段長約20-24nt的單鏈RNA,它在進化上高度保守,通過翻譯機制抑制基因的表達。piRNA(piwi-interacting RNA)是一類長約24-32nt的ncRNA,主要存在於生殖系統,初步推測其可能在通過結合Piwi蛋白在沉默基因轉錄過程,維持生殖細胞和幹細胞功能,調節翻譯和mRNA穩定性中發揮功能。lncRNA是一類長度超過200nt的ncRNA,在染色質重塑,轉錄調控,轉錄後調控及蛋白代謝水平調節細胞的基因表達,從而調控生物個體的發育過程,疾病發生和環境應答等生命活動;circRNA是一類不具有5`cap和3`ployA,以共價鍵形成環形結構的ncRNA分子,部分circRNA含有miRNA應答元件,可充當競爭性內源RNA(competing endogenousRNA,ceRNA),在胞漿中以類似海綿一樣吸附miRNA,進而解除miRNA對其靶基因的抑制作用,從而調節基因的表達。一部分含內含子的環狀RNA(EIcirRNA)一般無法出核,存在細胞核內通過順式作用調控基因的轉錄。
RNA通過自身的序列結構或結合到特定的蛋白中參與靶標DNA或RNA的調節或改變染色質結構,從而實現其生物學功能,那對識別特定RNA的所結合的蛋白、RNA、DNA就成為了一個重要的科學問題。
隨著二代測序的發展,對全基因組RNA不同轉錄本的識別已經變得越來越容易,根據不同的實驗目的結合二代測序技術來研究RNA結合事件的技術被不斷開發出來。在下文我們將分成RNA-ProteinRNA-RNARNA-DNA三部分來介紹該領域的最新進展。
一、RNA-Protein研究
1. RNA Pull Down Assay(1)
為了鑒定特定的RNA分子是否與某一種特定的蛋白結合,研究人員根據DNA-Protein實驗中DNA Pull down的實驗方法進行改進,使其在RNA上實現。
技術步驟如下:
(1)設計末端攜帶T7 RNA Promoter的引物擴增DNA片段;
(2)利用T7 RNA polymerase 進行轉錄,轉錄過程添加攜帶生物素的dNTP,使轉錄本攜帶生物素;
(3)裂解細胞核,回收核或胞漿內容物;
(4)將轉錄獲得的RNA與內容物進行孵育;
(5)用磁珠捕獲RNA-蛋白複合物;
(6)用western blot或蛋白質譜鑒定特定的蛋白。
該方法主要用於鑒定某一種RNA結合的特定的RNA binding蛋白是否具有結合或在不同分化周期及細胞周期蛋白的結合情況。
圖1.RNA Pull Down 示意圖
2. REMSA(RNA Electrophoretic Mobility Shift Assay, REMSA)
電泳遷移率檢測是一種用來研究蛋白與其結合的DNA或RNA互作的技術,其原理是蛋白結合了核酸後其分子質量變大,相對於free probe而言,核酸-蛋白複合物在聚丙烯醯胺凝膠上遷移變慢,通過檢測遷移率可以鑒定核酸是否與蛋白結合。
實驗步驟如下:
(1)利用T4 PNK 和32P標記DNA或RNA,並純化;
(2)EMSA凝膠配製;
(3)抽提核裂解液或特定蛋白;
(4)核裂解液與核酸進行孵育,同時設置對照實驗(探針冷競爭反應,突變探針的冷競爭反應,Super-shift反應);
(5)電泳檢測。
3. RIP(RNA Binding Protein Immunoprecipitation,RNA結合蛋白免疫沉澱)
該技術用來研究特定蛋白與全基因組RNA結合情況的技術。該技術主要借鑒了ChIP-seq的蛋白抗原抗體特異性結合的原理,利用特定的抗體將RNA-蛋白複合物進行富集,並用磁珠進行捕獲,回收特定的RNA進行逆轉錄並測序。
其技術步驟如下:
(1)細胞核裂解;
(2)抗體孵育,免疫沉澱;
(3)回收RNA;
(4)cDNA合成,添加測序接頭,純化;
(5)二代測序;
(6)生物信息學數據分析;
(7)功能驗證。
圖2.RIP流程圖
4. CLIP(ultraviolet cross-linking immunprecipitation,紫外交聯免疫沉澱)
為了識別蛋白與RNA分子結合特定的位點,Jernej Ule發明CLIP技術。該技術主要技術原理是利用紫外交聯的方法將RNA於蛋白特定在結合位點交聯在一起,利用抗體富集蛋白結合的RNA,並用RNase消化掉未被蛋白包裹的區域,保留RNA-蛋白結合的核心區域。最後回收RNA進行建庫測序。
其主要步驟有:
(1)用紫外照射細胞,使蛋白和RNA分子進行交聯反應;
(2)裂解細胞,用目的蛋白抗體進行免疫共沉澱;
(3)利用核酸酶RNase對RNA進行切割,保留核心區域;
(4)alkaline 磷酸酶去除RNA末端的磷酸基團,防止下一步自連;
(5)用RNA連接酶在3`端連接上RNA接頭;
(6)用T4PNK 磷酸激酶對RNA 5`端進行磷酸化,添加32p;
(7)SDS-PAGE分選蛋白-RNA複合物;
(8)解交聯並添加接頭,進行cDNA合成;
(9)PCR擴增,並測序;
(10)生物信息學分析。
圖3.CLIP流程圖
5. Ago HITS-CLIP (high-throughput sequencing of RNAs isolated by crosslinking immunoprecipitation)
前面已經提到miRNA可以與mRNA結合調控基因的表達,有研究指出miRNA僅需要6-8nt與mRNA精確配對即可發揮作用。但這對利用鹼基組成重頭預測靶標 mRNA是一個巨大的挑戰。miRNA與Argonaute蛋白複合物構成RISC核心元件,並引導Argonaute錨定到特定的mRNA上,Argonaute蛋白具有內切核酸酶活性,在二價金屬離子的輔助下可以切割mRNA分子,在動物細胞的miRNA沉默途徑中,Argonaute蛋白也可以不依賴內切酶活性來達到基因沉默的作用,它通過抑制靶標mRNA翻譯的方法,以及誘導mRNA發生去腺苷酸化後降解的方式來抑制基因表達。洛克斐勒大學霍華德休斯研究所的Robert B. Darnell研究組在高通量CLIP共價交聯Argonaute-RNA複合物,通過分析RNA的組成,來確定miRNA-RNA全局互作圖譜,作者在這篇文章中重點分析小鼠神經細胞中miR-124全局的互作圖譜,並得到20中最常見的miRNAs的互作圖譜。該方法可以用於鑒定組織特異性的miRNA-mRNA調控網路。
圖4.Ago HITS-CLIP示意圖
其步驟如下:
(1)紫外交聯細胞;
(2)裂解細胞,提取核裂解物;
(3)用Ago抗體進行孵育;
(4)用MNase消化RNA;
(5)用Alkaline phosphalase磷酸酶去除RNA3`末端的磷酸基團;
(6)用T4 PNK磷酸激酶將5`OH轉換成磷酸基團;
(7)用SDS-聚丙烯醯胺凝膠切膠;
(8)回收RNA,並在5`端添加RNA接頭;
(9)RT-PCR生成cDNA分子;
(10)測序及生物信息學分析;
(11)功能分析及鑒定。
6.PAR CLIP (Photoactivatable-Ribonucleoside-Enhanced Crosslinking and Immunoprecipitation)
RNA翻譯是非常重要的科學問題,RNA結合蛋白(RBPs)和小RNA-核糖核蛋白複合物(miRNPs對真核生物基因表達起到了很重要的作用,這些蛋白跟DNA結合蛋白一樣,可以與相關的序列結合來指導它們的表達。這些RBPs和miRNPs共同來調控細胞內許多過程,包括mRNA的成熟、運輸、修飾和翻譯。CLIP雖然可以用來鑒mRNA與核糖蛋白的結合,但是UV雖然可以使得RNA與蛋白直接交聯,但交聯效率較低,且未被交聯的分子更容易被逆轉錄,導致了最終的結果又很強的雜訊,很難分辨出那些是直接交聯的RNA。
洛克菲勒大學的Thomas Tuschl課題組在CLIP的基礎進行了改進,早期的CLIP選用254nm的紫外線照射,他們用更低能量的356nm紫外來照射細胞。而取而代之的是在細胞培養體系中添加了具有光活性的核糖核苷類似物,例如4-硫尿核苷,在活體細胞中將其插入到新生RNA轉錄本中。在低能量的紫外照射過程中,光活性的核糖核標記的RNA被誘導與RBP相互作用。並在RT過程中U會被轉換成C,使得在最終的文庫中可以特定地識別到高精度單鹼基水平的蛋白和RNA結合。
圖5.PAR-CLIP流程圖
7.eCLIP(enhanced CrossLinking and ImmunoPrecipitation followed by high-throughput sequencing)
在對CLIP-seq文庫進行分析發現,其PCR冗餘較高,一個文庫需要測序上百million的數據才能獲取到足夠的有效數據,加州大學Gene W. Yeo對原有的方法進行了改進,他們在添加3`端的接頭上加了可以用來識別不同拷貝的index,同時改進RT的步驟順序,在蛋白解交聯之前進行RT實驗,使得逆轉錄在蛋白結合位點終止,從而可以精確識別到蛋白的結合位點,獲取了單鏈DNA後,它在DNA3`端再添加DNA的接頭,從而可以進行PCR擴增,用於二代高通量測序。該技術使得循環數大大減低,有效數據量顯著增高。
圖6.eCLIP流程圖
二、RNA-RNA互作研究
1. CLASH(crosslinking,ligation, and sequencing of hybrids)
RNA-RNA互作在眾多的生物學進程中被證實,幾乎所有的RNA都必須有正確的摺疊才能發揮功能,而不同的RNA分子之間的結合,構成了RNA代謝的諸多途徑,包括 mRNA前體的剪切,核糖體合成,以及通過miRNA調控mRNA的穩定性。
如核仁小分子RNA(snoRNA)是一類廣泛分布於真核生物細胞核仁的ncRNA,具有特別保守的結構元件,並以此劃分為3大類:box C/D snoRNA、box H/ACA snoRNA和MRP RNA。其中boxC/D和boxH/ACA是已知snoRNA的主要類型,以鹼基配對的方式分別指導著核糖體RNA的甲基化和假尿嘧啶化修飾。研究表明,snoRNA在rRNA的生物合成中發揮作用之外,還能夠指導snRNA、tRNA和mRNA的轉錄後修飾。此外,還有相當數量的snoRNA功能不明,被稱為孤兒snoRNA(orphan snoRNA)。snoRNA 與rRNA的結合被普遍報道,大多數的box C/D snoRNA基因通過甲基化轉移酶Nop1對rRNA進行甲基化,但是與之相反,U3 snoRNA可以配對到rRNA前體的多個位點,這些互作被認為可以協助rRNA前體的正確摺疊,且對rRNA前體的加工是必須的。但是這些互作的證據都是間接的,為了獲得更直接的證據,David Tollervey課題組發明了一種新的方法CLASH。
他們在CLIP的基礎上直接將兩段不同的RNA連接成Chimera,從而在文庫中被識別出來。但是在他們的文章中也報道連接成嵌合片段的reads僅占整個文庫的不到1%。同時rRNA佔整體的RNA佔據了80%以上,因此很難獲得lncRNA-mRNA的互作情況。
圖7.CLASH示意圖
2. Mapping RNA interactome in vivo (MARIO)
鑒於CLASH有效數據少,迫切需要有新的技術來實現嵌合片段的富集,加州大學的Sheng Zhong研究組,借鑒TCC的方法,在蛋白上進行生物素化,使整個反應在磁珠上進行,在RNA於RNA進行連接步驟中他們用添加了一帶有生物素的link,使得最終的嵌合片段可以被富集,從而大大提高了數據的利用率。
主要實驗步驟分為:
(1)紫外線共價交聯RNA-蛋白;
(2)蛋白的生物素化;
(3)與鏈親和素結合,將RNA-Protein固定到磁珠上;
(4)連接帶有生物素的link;
(5)在dilute環境下進行RNA連接;
(6)消化蛋白,用RNase酶部分消化RNA;
(7)用鏈親和素富集帶有生物素的RNA;
(8)生成cDNA;
(9)二代測序及生物學分析。
圖8.MARIO流程圖
三、RNA-DNA互作研究
在X染色體失活過程中,長非編碼RNA XIST會隨機地結合到一條X染色體中,有研究證實Xist的結合與PRC2和H3K27me3成線性相關,暗示其與PRC2共同瀰漫到基因組中,使其結構變得異常緊密(10),有研究證實CTCF能結合到XIST的啟動子上抑制基因的表達,而另一個非編碼RNA JPX是劑量敏感的激活基因,它能特異性地結合CTCF,能類似於海綿一樣從XIST的啟動子上吸附CTCF,從而激活Xist表達(11)。有越來越多的證據表明lncRNA對染色質的構象的形成發揮關鍵的作用。因此如何鑒定RNA與DNA的直接互作已經成為了迫切的需求。
1.R3C(12)
kcnq1pt1,是一個長達91kb的非編碼RNA,它被認為是一個能在父本的染色體影響其反義基因kcnq1的印跡表達。Kcnq1ot1 RNA是一個雙向抑制子,能順式調控超過1Mb的Kcnq1 印跡位點的基因。但對於它的扮演的角色並不是很清楚。吉林大學的He Zhang設計了一個全新的實驗R3C, 他們先將RNA 反轉錄成DNA,然後在cDNA第二鏈的生成中,摻入生物素,使其可以被鏈親和素進行富集。
實驗步驟如下:
(1)甲醛交聯DNA-RNA-Protein複合物;
(2)cDNA生成第一鏈;
(3)第二鏈生成中,摻入生物素;
(4)限制性內切酶進行酶切;
(5)DNA連接酶連接反應;
(6)蛋白解交聯;
(7)設計特定的引物進行擴增,測序。
圖9.R3C示意圖
3. GRID-seq(in situ global RNA interactions with DNA by deep sequencing)
R3C只能用來研究特定RNA與DNA互作情況,並不能獲得全局的RNA-DNA的互作情況,付向東實驗室在今年發表的一項新技術(GRID-seq)解決了這一問題
其實驗步驟主要分為兩部分:
第一部分在體內反應:
(1)用甲醛、DSG雙重交聯細胞核;
(2)用Alu限制性內切酶進行酶切;
(3)在RNA原位連接一段雙鏈的DNA-RNA link,link中攜帶生物素;
(4)RNA反轉錄;
(5)去除遊離的linker;
第二部分在體外反應:
(6)cDNA與DNA進行連接;
(7)解交聯,用鏈親和素磁珠捕獲攜帶生物素的DNA;
(8)從磁珠中洗脫DNA,合成cDNA另一條鏈;
(9)因linker中攜帶Mme1酶切位點,因此可以剪切DNA片段,保留近65鹼基的DNA片段;
(10)切膠回收DNA,添加測序接頭PCR擴增用於二代測序。
圖10.GRID-seq流程圖
四、DNA-RNA-Protein互作研究
1.ChIRP(Chromatin Isolation by RNA Purification)
RNA調控染色質的機制可能不僅僅是通過裸露的RNA分子,可能由各種轉錄因子及RNA結合蛋白的參與,在一次實驗中同時鑒定出RNA-DNA-蛋白複合體的組成成分,顯然能極大地幫助我們理解其調控的機制。Howard Y. Chang 實驗室開發的一門技術ChIRP,很好地解決了這一難題。
實驗步驟如下:
(1)對RNA-DNA-Protein複合物進行交聯;
(2)超聲打斷DNA分子;
(3)設計特定lncRNA的檢測探針,探針中攜帶便於捕獲的生物素;
(4)探針與複合物進行孵育;
(5)用磁珠捕獲複合物;
(6)用RNaseH和RNaseA對RNA進行消化,分別回收基因組DNA和RNA結合蛋白;
(7)測序及質譜鑒定DNA和蛋白的組成。
圖11.ChIRP流程圖
因緣際會,整理RNA互作研究的知識脈絡,對該領域的研究進展有了一次比較全面的認識和介紹,該領域是一個非常前沿的領域,由於技術的難度,很多工作可謂是十年磨一劍,如阮一駿老師的RiCH-PET技術,很多年前就得知已經開發了,囿於個人認識和能力所限,謬誤在所難免,讀者權當是科普便好。如果有興趣深入研究,小編也在文章後列了一系列參考文獻,可參照閱讀,謬誤之處,敬請斧正,在此致謝。
(1)de Silanes I L, Zhan M, Lal A, et al. Identification of a target RNA motif for RNA-binding protein HuR[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(9): 2987-2992.
(2)Parsley T B, Towner J S, Blyn L B, et al. Poly (rC) binding protein 2 forms a ternary complex with the 5′-terminal sequences of poliovirus RNA and the viral 3CD proteinase[J]. Rna, 1997, 3(10): 1124-1134.
(3)Zhao J, Ohsumi T K, Kung J T, et al. Genome-wide identification of polycomb-associated RNAs by RIP-seq[J]. Molecular cell, 2010, 40(6): 939-953.
(4)Ule J, Jensen K B, Ruggiu M, et al. CLIP identifies Nova-regulated RNA networks in the brain[J]. Science, 2003, 302(5648): 1212-1215.
(5)Chi S W, Zang J B, Mele A, et al. Argonaute HITS-CLIP decodes microRNA–mRNA interaction maps[J]. Nature, 2009, 460(7254): 479-486.
(6)Hafner M, Landthaler M, Burger L, et al. Transcriptome-wide identification of RNA-binding protein and microRNA target sites by PAR-CLIP[J]. Cell, 2010, 141(1): 129-141.
(7)Van Nostrand E L, Pratt G A, Shishkin A A, et al. Robust transcriptome-wide discovery of RNA-binding protein binding sites with enhanced CLIP (eCLIP)[J]. Nature methods, 2016, 13(6): 508-514.
(8)Kudla G, Granneman S, Hahn D, et al. Cross-linking, ligation, and sequencing of hybrids reveals RNA–RNA interactions in yeast[J]. Proceedings of the National Academy of Sciences, 2011, 108(24): 10010-10015.
(9)Nguyen T C, Cao X, Yu P, et al. Mapping RNA-RNA interactome and RNA structure in vivo by MARIO[J]. Nature communications, 2016, 7.
(10)Simon M D, Pinter S F, Fang R, et al. High-resolution Xist binding maps reveal two-step spreading during X-chromosome inactivation[J]. Nature, 2013, 504(7480): 465-469.
(11)Sun S, Del Rosario B C, Szanto A, et al. Jpx RNA activates Xist by evicting CTCF[J]. Cell, 2013, 153(7): 1537-1551.
(12)Zhang H, Zeitz M J, Wang H, et al. Long noncoding RNA-mediated intrachromosomal interactions promote imprinting at the Kcnq1 locus[J]. J Cell Biol, 2014, 204(1): 61-75.
(13)Li X, Zhou B, Chen L, et al. GRID-seq reveals the global RNA-chromatin interactome[J]. Nature biotechnology, 2017, 35: 940.
(14)Chu C, Qu K, Zhong F L, et al. Genomic maps of long noncoding RNA occupancy reveal principles of RNA-chromatin interactions[J]. Molecular cell, 2011, 44(4): 667-678.
文章來源: 三維基因組Magic(微信公眾號)
原文:簡史系列|RNA-RNA /DNA/Protein研究簡史
http://www.hzrna.com/4409.html
推薦閱讀:
※札記·合成生物學 專欄開篇
※只有病毒 DNA 或 RNA 的情況下是否能複製完整的病毒出來?
※生物工程深造?
※生物工程技術的發展對社會經濟發展有哪些影響?
※生物醫學工程如何影響並促進醫學的發展與變革?