基因表達調控的順式作用因子 (CREs) 了解一下

基因表達調控

基因調控是現代分子生物學研究的中心課題之一。因為要了解動植物生長發育規律、形態結構特徵及生物學功能,就必須搞清楚基因表達在時間和空間上的調控機制,掌握了它,就等於掌握了一把揭示生物學奧秘的鑰匙。

基因表達是一個多階段進程(multi-level process)。DNA(脫氧核糖核酸)在轉錄為RNA(核糖核酸)後,RNA需要經過一系列轉錄後調控(post-transcriptional regulation)而被翻譯為功能蛋白。先前來自多家實驗室的研究結果清晰地顯示,RNA轉錄水平至多能夠解釋細胞中功能蛋白丰度的50%,而轉錄後基因調控提供了更多精細調節的選擇。為滿足個體發育及機體對外界刺激有效反應的需求,基因表達一系列進程都需要處於精密的調控中,任何錯誤偏離都有可能導致疾病的發生。雖然具有相同甚至更加重要的作用,相比已經較為廣泛深入研究的轉錄調控,轉錄後基因調控研究領域還是一個相對未被開發的處女地,近十幾年才逐漸受到生物醫學界的重視,並逐漸成為研究基因調控的一個主流方向。

轉錄後基因調控包括多種生物學進程,如RNA剪接,polyA加尾(RNA多聚腺苷酸加尾),RNA降解及mRNA翻譯等等。儘管這些不同進程的具體作用分子機制各有不同,但總體而言,它們的調控都是由位於RNA上的順式調控元件(cis-regulatory elements)和以RNA結合蛋白為代表的反式因子(trans-regulatory elements)相互作用完成,所以全局研究轉錄後基因調控網路首先需要全面解析順式調控元件或反式因子。

順式作用元件與反式作用因子

通常,真核細胞基因由編碼蛋白質的編碼區和具有調控作用的非編碼區組成。其中,編碼區由外顯子和內含子間隔排列,而非編碼區,又稱「側翼序列」,特指第一個外顯子和最末一個外顯子的外側區域,包含有啟動子、終止子、上游啟動子元件、增強子、沉默子、反式作用因子等元件。

順式作用元件(cis-acting element),或稱順式元件子,是存在於基因旁側序列中能影響基因表達的序列。順式作用元件包括啟動子、增強子、沉默子 等,它們的作用是參與基因表達的調控。順式作用元件?身不編碼蛋白質,其作用是提供一個結合位點,反式作用因子通過結合在該位點上來改變結合處的特性,進而調控受此順式作用元件影響的基因。調控方式包括對基因轉錄可變剪切的調控、轉錄起始位點的調控以及轉錄效率的調控。

反式作用因子(trans-acting factor)則是指通過直接結合或間接作用於DNA、RNA等核酸分子,對基因表達發揮不同調節作用(激活或抑制)的各類蛋白質,其?身對基因表達沒有調控作用,只是阻斷來自上、下游的調控效應。反式作用因子主要指能結合在基因序列上的特異性蛋白質──轉錄因子,然而隨著表觀遺傳學的發展,研究發現除了蛋白,某些DNA,RNA片斷也具有類似的調控功能,因此現在把它們算作反式作用因子。(不僅僅是轉錄因子)

實驗難度

ChIP、RIP、RNA pull-down、EMSA、Luciferase是基因表達調控研究中,最為核心、最為關鍵的實驗技術。

對於已知或候選反式因子(表觀和轉錄因子)和順式因子的研究手段較成熟,比如經典的EMSA,報告基因,ChIP等。給定反式因子,如何解析可能的結合和互作的未知順式因子,尤其是在native 狀態,unbiased 的組學水平上,曾經也是巨大挑戰。但是這個難題在世紀之初取得了突破性進展:當時博士來自哈佛**Tom Maniatis **( 美國科學院院士,2012年與 Donald D. Brown共同獲得拉斯克基礎醫學特殊貢獻獎,《分子克隆》的主編,第一個構建基因組DNA文庫,第一個構建cDNA文庫,目前在哥倫比亞大學)實驗室(陳志堅、付向東、吳瑛、吳強等老師都來自這個實驗室)的任兵老師(清華新秀頡偉教授的博後合作導師)正在MITRichard Young院士(當時應該還不是院士)實驗室做博士後,是第一個完成全組學水平轉錄因子CHIP分析的人(Ren et al., 2000),之後有一大批的華人學者比如阮一駿、趙可吉等等都成為相關方向的翹楚。任兵老師很快去了UCSD,成為領域的靈魂人物(也是冷泉港課程的負責人),The Young實驗室更是在這個技術之後迅速成為年輕一代表觀和轉錄研究者的夢想之地。

在一個雙倍體細胞里,我們大多數人研究和感興趣的順式序列通常都只有兩條,而與它們結合的反式因子(轉錄因子)通常不會超過4-8個分子。轉錄因子常是以同源或者異源二聚體作用,對於給定的順式序列,結合、沒有結合或者是單倍體方式結合,那能夠拉下來的反式因子的數量一般應該在2-4個分子,多可達8個,少可至2,甚至1(想想imprinting)。 而在哺乳動物細胞中,反式因子常常是成千上萬甚至是千萬個分子。也就是說,要在這浩瀚的一團漆黑的汪洋里從成千上萬甚至千千萬萬個一模一樣的微小生物里抓住僅有1-8條口含微小標籤的微小生物,這將需要如何高效精準,恐怕孫悟空的火眼金睛也難以企及…

用CRISPR-dCas9來研究基因調控

2017年8月24日,Cell雜誌上發表以西南醫學中心徐劍教授和復旦大學周峰研究員為共同通訊作者的文章 「In Situ capture of chromatin interactions by biotinylated dCAS9」,首次利用了「biotinylated dCAS9」的方法建立了高解析度,位點特異原位DNA-蛋白質以及其他元件的互作網路。

順式調控元件(TRE)和反式調控元件(CRE)一直是人們感興趣的對象,通常利用染色質免疫沉澱(ChIP)和染色質捕獲技術來研究。不過,德克薩斯大學西南醫學中心的研究人員最近開發出一種新方法,結合CRISPR的靶定能力以及生物素-鏈霉親和素的互作優勢來鑒定TRE和CRE。

這種名為CAPTURE的方法利用生物素標記的dCas9來分離與天然的染色質背景相互作用的調控元件(CRE和TRE)。CAPTURE包括三個關鍵的組分:

  • 1) 帶有生物素接受位點的dCas9;

  • 2) 生物素連接酶BirA,它將生物素添加到接受位點;

  • 3) 將生物素化的dCas9引到目的位點的gRNA。靶定之後,通過甲醛交聯來固定蛋白與DNA相互作用。

  • 已知順式調控元件,尋找相互作用的未知反式作用因子,是一個難題。用生物素標記的dCas9,能夠找到位點特異性的DNA-蛋白相互作用,著實令人興奮!不過,CAPTURE作為一項新技術,仍存在一些不足,比如需要的細胞樣本量較大,每次實驗需0.25~1 ×109個細胞。希望研究者能進一步完善CAPTURE技術,解決實際操作瓶頸,給各位基因轉錄調控研究者帶來一項研究利器。

    原文:Liu, et al.In SituCapture of Chromatin Interactions by Biotinylated dCas9. Cell 170, 1028–1043 (2017).

    蛋白質相互作用高通量篩選新系統

    細胞內部各種蛋白相互作用如一個社交網路。製作相關圖譜將有助於識別不同蛋白質功能,同時,還能幫助人們拼湊不同分子通路和細胞進程。例如,一個新發現的蛋白質如果與其他新陳代謝相關蛋白質相互作用,研究人員就可推斷,該蛋白質可能是治療代謝紊亂的靶點之一。

    長期以來,人們一直依賴酵母雙雜試驗(standard high-throughput yeast two-hybrid assays)測定蛋白質相互作用。酵母雙雜需要使用一種已知蛋白(被稱作誘餌蛋白),來釣取其他相關蛋白(被稱作獵物蛋白)。為了找到所有相互關係,如果想了解1000個蛋白質在細胞內的互作模式,就需要進行1000個單獨實驗,讓每個誘餌蛋白與細胞內所有蛋白互動一遍。

    將編碼蛋白質的基因分別連在兩個質粒上再導入細胞。如果兩種蛋白在細胞內發生互作,質粒上的Cre基因就會被激活,在它的牽引下兩個獨立質粒上的兩種基因就會連在一起。如此一來,通過基因測序便可迅速找到它們。研究小組構建了大量酵母細胞庫,每個都含有通過隨機組合在質粒中插入的不同蛋白質編碼基因。通過選擇培養基篩選發生重組的細胞(細胞內含有相互作用蛋白),再利用高通量DNA測序來識別究竟是哪兩種蛋白質。如此一來,將不再局限於每次只能檢測1種誘餌蛋白。

    研究人員利用CrY2H-seq一個月內對擬南芥1800多種轉錄因子蛋白重複做了10次相互作用檢測(大約一周時間,即可完成1800多個蛋白質相互作用解析)。每次實驗排列組合總數高達400萬個。他們共計發現了8000多個蛋白質相互作用,對擬南芥轉錄因子相互作用有了新的認識,這組圖譜有助於回答長期以來有關某些轉錄因子是否具有功能的疑問。研究人員發現了一些相對未知的轉錄因子能與一些已知的轉錄因子發生相互作用,能調節植物對生長素的反應。

    將來,該方法可被用來測試更大規模的蛋白質組,例如人類細胞(含有2萬種不同蛋白),這種更便捷,更快的方法也可用於不同條件下細胞整個蛋白質相互作用變化研究。

    CRISPR單嚮導RNA(SgRNA)文庫篩選增強子

    之前,科學團隊多集中於利用CRISPR敲除編碼蛋白的基因突變進行疾病治療研究。Agami團隊另闢蹊徑,首次利用CRISPR / Cas9系統研究非編碼區關鍵元件對腫瘤形成的影響。

    Agami研究團隊構建CRISPR單嚮導RNA(SgRNA)文庫,用於篩選與腫瘤相關的增強子,並將篩選範圍聚焦在兩種轉錄因子——p53和雌激素受體ERα(編碼p53和ERα蛋白的基因常在癌變細胞中發生突變)。

    以含有p53和一種誘導致癌基因Hras的人體細胞為研究材料,當科研人員使用CRISPR敲除對p53功能行使不可或缺的增強子時,Hras基因異常表達,最終導致細胞無限制增長。藉助該研究原理,團隊利用SgRNA文庫篩選了685個基因組位點,包含約90%已知的與p53轉錄因子有關的增強元件。

    通過文庫篩選,研究團隊共鑒定出與p53功能相關聯的3個增強子,其中有2個增強元件位於細胞周期蛋白依賴性激酶抑製劑1A (P21 A)上游,p53需要與這兩個增強子結合才能完全激活細胞衰老過程。

    同理,研究團隊以人乳腺癌細胞為材料,構建另一個不同的SgRNA文庫用於篩選與轉錄因子ERα有關聯的增強子。結果共篩查到3個增強元件與ERα有關。

    為了進一步研究與ERα有關的3個增強元件,Agami團隊計劃選取對抗雌激素治療表現抗性的乳腺癌患者的腫瘤樣本為材料,對這些位點進行測序。他們想知道這些腫瘤樣本中相關增強元件是否存在突變,從而解析為什麼治療出現抗性。

    邁阿密大學米勒醫學院研究人類表觀基因組、癌症分子機制的Ramin Shiekhattar 評述該研究時表示,基於CRISPR進行研究很必要的,因為其實現了內源性評估調控元件的可能。

    什麼因子決定基因的時間和空間表達

    一、真核基因組的複雜性

    1. 真核基因組比原核基因組大得多;

    2. 真核基因的轉錄產物,一個結構基因轉錄生成一條 mRNA,即 mRNA 是單順反子;

    3. 真核基因組僅 10% 的序列參與編碼,90% 的序列,含有大量的重複序列,可能參與調控;

    4. 原核生物基因為蛋白質編碼的序列絕大多數是連續的,而真核生物基因為蛋白質編碼的基因絕大多數是不連續的,即有外顯子和內含子,轉錄後需經剪接去除內含子,才能翻譯獲得完整的蛋白質;

    5. 真核生物 DNA 在細胞核內與多種蛋白結合構成染色質,這種複雜結構直接影響基因表達;

    6. 真核生物的遺傳信息不僅存在於核 DNA 上,也存在線粒體 DNA 上,核內與線粒體基因的表達互相獨立又需要協調。

    二、染色質結構與真核基因表達密切相關

    以染色質形式組裝在細胞核內的 DNA 所攜帶的遺傳信息表達直接收到染色質結構的制約。

    1. 轉錄活化的染色質對核酸酶極為敏感

    2. 轉錄活化染色質的組蛋白髮生改變

    轉錄活躍區域的染色質中的組蛋白的特點:

    (1)富含賴氨酸的 H1 組蛋白含量降低;

    (2)H2A-H2B 組蛋白而具體的不穩定性增加,使它們容易從核小體核心中被置換出來;

    (3)核心組蛋白 H3、H4 可發生乙醯化、磷酸化以及泛素化等修飾。

    3. CpG 島甲基化水平降低

    CpG 島的高甲基化促進染色質形成緻密結構,從而不利於基因表達。

    三、基因組中的順式作用元件是轉錄起始的關鍵調節部位

    順式作用元件位於編碼基因兩側,指可影響自身基因表達活性的 DNA 序列。

    1. 啟動子

    指 RNA 聚合酶結合併啟動轉錄的 DNA 序列。

    但真核同啟動子間不像原核那樣有明顯共同一致的序列,而且單靠 RNA 聚合酶難以結合 DNA 而啟動轉錄,而是需要多種蛋白質因子的相互協調作用,不同蛋白質因子又能與不同 DNA 序列相互作用,不同基因轉錄起始及其調控所需的蛋白因子也不完全相同,因而不同啟動子序列也很不相同,要比原核更複雜、序列也更長。

    2. 增強子

    一種能夠提高轉錄效率的順式調控元件。

    3. 沉默子

    沉默子能夠同反式因子結合從而阻斷增強子及反式激活因子的作用,並最終抑制該基因的轉錄活性,還有些 DNA 序列既可以作為正性,也可以作為負性調節元件發揮順式調節作用,這取決於 DNA 結合因子的性質。

    四、轉錄因子是轉錄調控的關鍵分子

    真核基因的轉錄調節蛋白稱為轉錄因子,也成為反式作用因子。RNA 聚合酶是一種反式作用於轉錄的蛋白因子。在真核細胞中 RNA 聚合酶通常不能單獨發揮轉錄作用,而需要與其他轉錄因子共同協作。

    1. 通用轉錄因子

    為 RNA 聚合酶介導基因轉錄時所必需的一類輔助蛋白質,幫助聚合酶與啟動子結合併起始轉錄,對所有基因都是必需的。

    2. 特異轉錄因子

    為個別基因轉錄所必需,分為轉錄激活因子和轉錄抑制因子。轉錄激活因子多是增強子結合蛋白;轉錄抑制因子多是沉默子結合蛋白,也可有以不依賴 DNA 的方式起作用,而是通過蛋白質-蛋白質相互作用和轉錄激活作用中和轉錄激活因子。

    組織特異性的轉錄因子在細胞分化和組織發育過程中具有重要作用,真正決定著細胞基因的時間、空間特異性表達。

    與啟動子上游元件,如 GC 盒、CAAT 盒等順式作用元件,結合的蛋白質稱為上游因子。與增強子等遠端調控序列結合的轉錄因子稱為可誘導因子。廣義上也可稱為轉錄因子。

    3. 轉錄因子作用的結構特點

    (1)至少包括兩個結構域

    DNA 結合域包括鋅指模體結構、鹼性螺旋-環-螺旋結構、鹼性亮氨酸拉鏈模體結構。

    轉錄激活域分為酸性激活結構域、谷氨醯胺富含結構域、脯氨酸富含結構域。

    (2)包含一個介導蛋白

    最常見的是二聚化結構域。

    4. 二聚化是常見的蛋白質-蛋白相互作用方式

    五、轉錄起始複合物的動態構成是轉錄調控的主要方式

    轉錄激活的調節最終是由 RNA 聚合酶活性體現的,其中關鍵環節是轉錄起始複合物的形成。

    1. 啟動子與 RNA 聚合酶活性

    真核生物 RNA 聚合酶單獨與啟動子親和力極低甚至沒有,必須與基本轉錄因子結合才能與啟動子結合。

    啟動子的核苷酸序列會影響其與 RNA 聚合酶的親和力,後者直接影響轉錄起始的頻率。

    2. 調節蛋白與 RNA 聚合酶活性

    TF Ⅱ D 是唯一有位點特異的 DNA 結合能力的因子。

    六、轉錄後調控主要影響真核 mRNA 的結構與功能

    1. mRNA 的穩定性影響真核生物基因表達

    5"-端的帽子結構可以增加 mRNA 的穩定性、3"-末端的 poly(A) 尾結構防止 mRNA 降解。

    2. 一些非編碼小分子 RNA 可引起轉錄後基因沉默

    如核酶、snRNA、snoRNA、miRNA、siRNA。

    3. mRNA 前體的選擇性剪接可以調節真核生物基因表達

    七、小結

    真核基因組比原核大得多,結構更複雜,含有許多重複序列,真核生物基因為蛋白質編碼的基因絕大多數是不連續的。

    真核基因表達調控的環節更多,轉錄前可以有基因的擴增或重排,並涉及染色質結構的改變、基因激活過程。轉錄後調控的方式也很多,但仍以轉錄起始調控為主。

    正性調控是真核基因調控的主導方面,RNA 聚合酶的轉錄活性依賴於基本轉錄因子,在轉錄前先形成轉錄複合體,其轉錄效率受許多蛋白因子的影響,協調表達更為複雜。


    推薦閱讀:

    貧富調控納入五年規劃是應有之義
    血糖波動和精細調控
    貨幣調控非兒戲
    國五條無新意 調控仍待加碼
    豬業政策矛盾重重 平抑肉價新政是調控還是空調?

    TAG:基因 | 表達 | 作用 | 了解 | 調控 |