多順反子表達元件——一次滿足你N個願望

寫在正文之前

前一段時間有讀者留言說,希望多寫一點有關分子克隆的文章。但考慮了一下,覺得常規的克隆比如獲得開放讀碼框(ORF)並表達這種實在過於簡單,現有的教程也不少,似乎沒有再寫一篇的必要了。但不回應一下讀者的需求又似乎不好,想來想去,還是寫一篇與克隆相關但目前還沒有爛大街的文章。這一篇文章集中討論多順反子,後面可能會考慮寫有關Gibsonnassembly的教程。正如以往一般,想了解什麼,就在討論區留言。能力範圍內,本司機都會寫文。

一、引言

利用質粒載體表達外源基因已經不是什麼高深的學問了,但如果我們想同時表達多個基因呢?可能有人會說,那就把多個質粒混合起來轉染。只是這樣的策略,隨著混合質粒的種類增多,隨機性就越大,並不能保證每個細胞都獲得了等量的每種質粒。而如果使用多個啟動子,將各個「啟動子-ORF」拼接起來呢?沒錯,這是個經典的解決方案。但是,這樣的策略可能存在兩個問題:一是啟動子的個頭不小(如常用的CMV啟動子超過500 bp,EF1α啟動子超過1.1nkb),多個啟動子會導致載體顯著增大,可能會給後續的實驗帶來麻煩;二是強啟動子太多,容易給宿主細胞帶來代謝負擔,換用弱啟動子,又覺得表達丰度不夠。而如果我們想實現外源基因的串聯表達——也就是說,前一個基因表達,勢必引起後一個基因表達——那麼多啟動子的策略並不可行。

多順反子元件近乎完美地解決了上述問題。「順反子」(Cistron)可以算是「基因」的舊稱,起源於比較古老的遺傳學實驗,這裡不展開敘述。單順反子,意思就是這段DNA中,含有編碼單一蛋白的基因。而多順反子(Polycistron或Multicistron),顧名思義,就是這段DNA中含有編碼多個蛋白的基因。多順反子常常存在於原核生物中,一個轉錄本,可以翻譯出多個蛋白。而真核生物,則多利用單順反子策略。

在分子克隆中,我們可以利用原核生物的這一特點應用於真核生物之中,即使用多順反子元件載體,將多個ORF串聯起來,同時表達多個基因。其中,IRES元件和2A多肽元件是最常用也是最容易使用的。

二、IRES——Internal Ribosome Entry Site(內部核糖體進入位點)

mRNA的翻譯,依賴於核糖體的結合,並識別起始密碼子,沿著5』→3』端進行。但是,起始密碼子序列(比如AUG)在一個轉錄本中是廣泛存在的,那核糖體又是如何認得最最開始的那個AUG序列呢?其實道理很簡單,在真核生物中,絕大多數轉錄本的翻譯,同時還依賴於5』端的一個特殊結構,簡稱為「帽子」(cap)。只有識別到cap,核糖體才會結合到mRNA,掃描起始密碼子,從而繼續後續的翻譯進程。(具體的生化過程,請自行翻書。)

nn然而,真核生物還有一小部分基因的翻譯,是可以不依賴於cap的。其中研究最為深入的,便是IRES依賴通路。IRES是一個相當古老的基因元件,最早在脊髓灰質炎病毒(Poliovirus)中發現,在部分真核生物的基因(如某些生長因子,甚至某些原癌基因)中也存在。IRES為核糖體在轉錄本的內部提供了一個新的「落腳點」。即使不存在cap, 核糖體也能與之結合,並掃描起始密碼子。

如今,IRES成為多個基因串聯表達的實用工具。它最大的優點是,後一個基因的ORF並不需要和前一個基因的ORF同框,因為核糖體會重新掃描後一個基因的起始密碼子,而不依賴於前面的ORF結構。這樣一來,克隆工作就簡單得多了。

但是,IRES也有很明顯的缺陷。一是這個元件的塊頭也不小(500-600nbp),二是後一個基因的表達強度,往往低於前一個基因。

三、2A多肽元件(2A peptide)

和IRES元件一樣,2A多肽元件也最早在病毒中發現(小RNA病毒,Picornavirus),且直到目前為止,僅在病毒中發現。而儘管真核生物基因組中並不存在2A,但2A介導的多順反子表達卻廣泛存在。(註:目前為止,尚未發現原核生物中存在2A介導的多順反子表達途徑。)

2A元件是一類編碼約僅有20個氨基酸多肽的序列(如下圖所示),它能阻止翻譯過程中氨基酸形成共價鍵,並維持翻譯繼續進行。這樣一來,翻譯產物就被「切了一刀」,變成兩段(比較正式的叫法是「順式水解反應」,或者說「自切割」)。2A元件的共有序列是D(V/I)ExNPGP。其中,x是任意氨基酸,而「下刀」切割的位點,就在最後兩個氨基酸G和P之間。

(註:除了上圖明示的序列外,在2A元件的5』端加上編碼GSG三肽的序列,可以顯著提高切割效率)

2A多肽元件用於多基因串聯表達,具有IRES無可比擬的優勢。第一,2A非常短,克隆甚至直接合成非常方便。第二,在理想情況下,2A介導的自切割效率幾乎是100%。這也是目前為止唯一能夠保證串聯基因等量表達的策略。

但是,2A多肽元件也是有缺點的。首先,前一個蛋白的C端會多了一小段外源多肽,後一個蛋白的N端也會多一個脯氨酸(Proline)。雖然在絕大多數情況下,這不會影響蛋白質的功能。但有時候運氣不好起來,什麼事情都有可能發生,做實驗的人都懂。其次,後一個ORF要和前一個ORF同框(貌似這不算是什麼缺點),否則就姨媽(霧——移碼了)。最後,不同的2A多肽,在不同物種甚至細胞種類之間的切割效率是不一樣的(有的能接近100%,有的可能只有50%),在正式實驗之前,最好查查相關文獻。

此外值得注意的是,當要串聯表達3個以上蛋白時(即使用2個以上2A多肽元件),請注意使用不同種類的2A來間隔ORF。否則重複出現相同的序列,在臉不好看的情況下,可能會導致一些奇怪的重組現象。

四、多順反子元件的應用

只要充分發揮想像力,串聯表達多個基因可以有多種多樣的應用。

比如說,製作iPS細胞需要同時表達多個轉錄因子,而將這些轉錄因子通過多順反子整合到一兩個質粒上,無疑方便了轉染,以及提高獲得幹細胞克隆的幾率。

又比如,為了在活細胞中監測某些蛋白的表達情況,我們可以為其加上標籤(如熒光蛋白標籤)。但直接用融合標籤的方法,可能會干擾靶蛋白的功能。而使用多順反子元件,將靶蛋白和熒光蛋白隔開,就可以通過檢測熒光強度獲知靶蛋白的表達情況。

而儘管位於IRES後面的ORF表達效率不高,但這一缺陷卻可以被反過來用於強表達細胞克隆的篩選。比如說,構建一個「p53-IRES-puromycin抗性」的載體轉染細胞。當使用puromycin篩選時,細胞只有在載體插入、重組的拷貝數足夠多,p53的表達足夠高時,才能在抗生素的作用下存活下來。


推薦閱讀:

有哪些當時不被認可但後來被認為是極其重要的生命科學發現?
我(男性)的兒子是否必將遺傳我父親的那一條帶Y染色體的基因,並且他不可能跟我母親的基因有任何聯繫?
為什麼線粒體DNA只能通過母親傳給孩子?
引物設計,so easy

TAG:分子生物学 | 克隆 | 基因 |