如何高表達某種基因?

高表達某種基因的難度在哪?解決方法是什麼?


問得太泛了,要區分應用場景,

  1. 比如目的是科研,還是工業生產用?

  2. 表達體系用的是原核、畢赤、還是昆蟲細胞、還是哺乳動物細胞?

  3. 蛋白本身特性是:膜蛋白?高度可溶?分泌?高度修飾?還是帶細胞毒性?

原理上 @Xi Yang 提了挺多,但也都只是原理,真要說明白、講細節,得回答完上面那一系列問題。


蟹妖。其實我不熟悉實驗。

大致上,無非就是:

把基因放在強啟動子後面;

解除抑制性的調控因子;

增加上游原料的濃度;

解除下游產物的反饋抑制。


說明1: 評論里有說我直接把文章粘過來了。這確實是答主之前的一篇文章,原文在此微生物內進行蛋白質表達前需要考慮的8件事 | BioEngX 說實話,我認為一篇文章根本解釋不清楚這個問題,寫一本書可能合適。所以在文後又附上了一篇文章,解釋為了獲得高表達的基因,如何選擇表達系統。

說明2:評論里說你的文章水平一般啊。額,這就沒辦法了,知識有限,理解不深,請見諒了。

以下為原答案。

題目雖然短短几個字,但回答起來卻不那麼容易。只從其中的一個小角度,給出一點思考---微生物內進行蛋白質的表達,應該考慮哪些事情。

在微生物內進行蛋白質表達是生物科技中的核心技術。然而,每種蛋白質都具有其獨特的結構性質,比如二硫鍵(disulfide bonds)數量,是否存在疏水區域 (hydrophobic regions),是否存在跨膜區域 (transmembrane domains),是否具有糖基化 (glycosylations) 等翻譯後修飾過程等, 所有的這些性質都可能決定著蛋白質表達過程的難易。在與目的蛋白質來源相似的宿主內表達蛋白質要相對容易些。然而,大多時候,我們需要在與蛋白質來源不同的宿主內進行蛋白質的表達,比如在原核細胞內表達真核生物的蛋白質,這通常是具有挑戰性的。在這裡,與大家分享幾個有助於跨系統實現蛋白質表達的工具。

1、密碼子優化

為了理解密碼子優化(codon optimization)的重要性,我們需要首先知道什麼是密碼子優化。簡單來講,就是在我們構建的載體內引入宿主系統tRNA更願意讀取的密碼子,這樣能夠更容易將其翻譯成氨基酸,這會提高翻譯速度,提高蛋白質表達的效率。沒錯,我這裡用了「更願意」這樣一個主觀性很強的詞。實際中確實是這樣的,生物系統是具有密碼子偏好性的,不論真核生物還是原核生物,每種生物都會表現出某種程度的密碼子利用的差異和偏愛。這是因為不同生物系統對於特定的密碼子具有不同數量的可利用的tRNAs,並且每一個系統內對於每一個密碼子,都有特定數量的tRNAs。所以,如果tRNAs與密碼子數量的比例不正確,就會阻礙蛋白質的表達。因此,在進行蛋白質表達前,需要根據表達系統,對目的基因進行密碼子優化,使用宿主系統內存在的tRNAs更偏好的密碼子。

2、純化標籤

當我們在微生物內進行蛋白質的表達時,最後通常都是要對蛋白質進行純化的。當然,如果你只是為了應用全細胞提取物或者裂解提取物,可以不用考慮蛋白質的純化問題。為了實現蛋白質的純化,我們必須為蛋白質加上純化標籤。目前很多純化標籤已經被系統研究並應用於實踐了,常用的純化標籤包括His tag, Strep-II tag, GST, Flat-Tag等。

3、分子伴侶與摺疊酶

表達一個困難的基因就像砸碎一個硬堅果,有時候你需要藉助外力。為了獲得一個有用的蛋白,很重要的一點就是保證蛋白質正確摺疊。細胞質(cytoplasm)的環境是還原性(reducing)的,這不利於二硫鍵的正確形成,因此會影響蛋白質的摺疊。為了輔助蛋白質正確的摺疊,防止形成不可溶的包涵體,我們需要表達分子伴侶(chaperones)和摺疊酶(foldases)的輔助載體。一些常見的分子伴侶和摺疊酶包括DsbA/C, Skp, FkpA, GroEL/ES, DnaK/J/GrpE等。我們可以根據蛋白質的表達位置,選擇細胞質(cytoplasmic)內分子伴侶或者細胞間質(periplasmic)分子伴侶。另外一些標籤也能夠輔助蛋白質的摺疊,比如麥芽糖結合蛋白(maltose binding protein, MBP)。MBP是一個42.5 KDa的蛋白質,能夠與目的蛋白質融合表達,不僅能夠增加蛋白質的可溶性,還能夠輔助蛋白質摺疊。MBP的另一個優勢是能夠與交聯澱粉柱(amylose column)結合實現目標蛋白的純化。

4、蛋白質表達位置
在實驗之前,我們需要考慮蛋白質在哪裡表達,是細胞質內(cytoplasm),細胞間質(periplasm)還是細胞外(extracellular)分泌表達如果一個蛋白質內包含有二硫鍵,我們最好在細胞間質的氧化環境內令其表達。氧化環境能夠幫助蛋白質形成正確的二硫鍵從而獲得正確的結構。如果想要蛋白質在細胞內特定的位置表達或分泌到細胞外,需在蛋白質的N端添加信號肽(signal sequence)。在信號肽的幫助下,蛋白質能夠轉移到特定的位置。例如,來自果膠桿菌(Pectobacterium carotovorum)內的PelB信號肽能夠引導蛋白質進入到革蘭氏陰性菌(gram-negative)的細胞間質中。再比如,來自變鉛青鏈黴菌(Streptomyces lividans)內的信號肽能夠將使蛋白質分泌表達到培養基之中。

5、蛋白質表達通路

蛋白質分泌表達具有很多的優勢。一方面分泌表達蛋白質能夠減少對宿主菌的毒性和代謝負擔,使菌適應性增加;另一方面周質空間和胞外培養基中宿主菌蛋白含量很低,有利於目的蛋白的純化。不同的表達途徑對蛋白質的摺疊效率有很大的影響。革蘭氏陰性菌共分為5種天然分泌系統,即I型,II型,III型,IV型和V型。 E.coli 主要通過I型和II型系統分泌表達蛋白質。Ⅰ型分泌系統通過α-溶血素途徑直接介導胞外分泌,組成元件簡單,外源重組蛋白與HlyAC-端結合後,再與HlyB/HlyD形成複合物,由ATP水解提供能量,通過TolC通路實現胞外分泌。通過該系統分泌出胞外的蛋白C端仍然帶有一段信號序列,需要在體外進行剪切;此外該系統中的一些共表達部件對目的蛋白的轉運有競爭作用,重組蛋白表達量很低。Ⅱ型分泌系統先介導細胞周質分泌,再經過MTB(main terminal branch)機制實現胞外分泌。分泌蛋白利用以下三種途徑透過細胞質膜: Sec (secretion)通路、信號識別顆粒(signal recognition particle, SRP)通路或雙精氨酸轉移(twin arginine translocation, TAT)通路。三種通路有所不同,Sec通路將蛋白質轉移到周質空間後蛋白質進行摺疊,TAT通路卻是將摺疊後的蛋白質轉移到細胞周質,而SRP途徑允許蛋白質同時進行摺疊與轉移的過程[1]。由於Ecoli跨越內膜的轉運裝置不完善,蛋白輸出能力不夠,蛋白酶降解等原因導致分泌效率低,胞外分泌量往往達不到實驗或工業生產的要求,目前大腸桿菌的分泌主要是指重組蛋白通過Ⅰ或Ⅱ型系統透過胞質膜分泌至周質腔[2]。

6、表達菌株

不同的大腸桿菌菌株在培養條件和外源基因表達能力上存在著很大差別,因此不同宿主菌的選擇對表達產物的積累以及下游分離純化有至關重要的作用。利用蛋白酶表達缺陷的突變菌株可以提高重組蛋白的分泌表達量,一些缺陷性菌株(如合成外膜元件的基因突變體)既能夠產生可溶性的、具有正確空間結構和二硫鍵的活性蛋白,又能夠避免細胞壁在外源蛋白跨膜轉運中的阻礙作用,有利於重組蛋白分泌到培養基中。最成功的例子就是L2型細菌(缺乏細胞壁和胞周質)已用於青黴素醯基轉移酶、鏈激酶、微小抗體的分泌表達中。但因為這些菌株有生長受損性,不能耐受高密度發酵的過程,L2型細菌不適合工業化生產。總之有很多種類的菌株可以用來實現蛋白質的表達。有關大腸桿菌的菌株及表達載體,大家可以從這個網站了解到,http://Ecoliwiki.net。

7、培養基,溫度,誘導條件等因素
培養基成分、培養方式、培養條件及培養過程中抑制性代謝產物的積累等都會影響重組蛋白在工程菌中的表達產量和分泌的量。其中培養基營養成分、pH和溫度等參數是影響工程菌生長和表達外源蛋白的重要因素,能夠影響蛋白酶的活性、分泌和表達水平。向培養基中添加甘氨酸可以在不導致菌體自溶的情況下促進蛋白從周質空間向胞外的分泌,且不引起明顯的細菌裂解。在培養基中添加糖膠和TritonX-100能阻止周間腔中包涵體的形成,並提高胞外表達的效率。改變培養基的滲透壓、短時間的熱衝擊誘導及降低誘導時的溫度,會明顯提高重組蛋白在大腸桿菌的可溶性表達。另外,對於需要IPTG誘導的菌株,誘導時刻,溫度及培養時間必須經過優化。

8、細胞培養時間

合適的細胞培養時間是決定著細胞完整度及蛋白質表達水平的一個重要因素。細胞培養時間過長會導致細胞裂解,目的蛋白丟失,有毒蛋白酶釋放。而細胞培養時間太短的直接後果就是細胞濃度不夠,目標蛋白產率太低。因此重組菌株的培養時間必須經過優化。

Reference:

【1】Valent QA, Scotti PA and et al. The Escherichia coli SRP and SecB targeting pathways converge at the translocon. EMBO J. 1998 May 1;17(9):2504-12.

【2】鄭海洲,劉曉志,宋欣.重組蛋白在大腸桿菌分泌表達的研究進展.天津藥學雜誌,2009,21(4):0040-42.

下面的文字,專門解釋表達蛋白應該選擇什麼系統。

當你決定克隆或者表達某個蛋白質時,你需要考慮使用哪些表達系統。

目前有以下一些可以適用於大規模生產蛋白的表達系統:

大腸桿菌表達系統

用大腸桿菌進行蛋白表達是最簡單、最快、最便宜的方法。現在有很多商業和非商業的表達載體可以應用,這些載體通常包含有N-和C-末端的純化標籤。另外,很多菌種已經被優化可用於特定蛋白的表達。

酵母表達系統

酵母菌是一類真核微生物, 相比於大腸桿菌,酵母菌有一些較為突出優點。其優點之一就是,酵母菌培養能夠達到一個很高的濃度,這使得酵母菌更適用於同位素標記蛋白的表達生產。最常用的兩種酵母菌株是釀酒酵母(Saccharomyces cerevisiae)和畢赤酵母( Pichia pastoris)。

昆蟲細胞表達系統

昆蟲細胞是比酵母更高級的真核生命表達系統,能夠更好地進行蛋白翻譯後的加工修飾。因此,當你想要表達某種哺乳動物的蛋白時,使用昆蟲細胞作為表達系統,能夠使你有更大的機會去獲得可溶性蛋白。使用昆蟲細胞表達蛋白的不足之處在於成本較高,而且還需要很長的時間才能得到你的蛋白(通常兩周)。

哺乳動物表達系統

很多實驗室將HEK(人胚腎)細胞系和CHO(中國倉鼠卵巢)細胞系,用於表達製備更加複雜的、需要適當翻譯後修飾的蛋白。這兩個細胞系既可以用於瞬時表達也可以用於穩定系表達。穩定的細胞系表達需要消耗一定的時間,但也具有更高的生產率以及更少的變異。另外,這些細胞對分泌蛋白具有高表達能力(商業蛋白高達10或100毫克每升,甚至往往幾克每升),但胞內蛋白的表達水平通常都比較低。

如何判斷哪種表達系統更利於自己的研究呢?你需要問自己這幾個問題:

1. 想要表達什麼類型的蛋白?

當你想要表達的是一個原核蛋白時,很明顯應該選擇大腸桿菌。這個方法迅速價廉,同時大腸桿菌具有針對原核蛋白的所有摺疊和翻譯後修飾功能。如果是真核蛋白的話,表達方法的選擇就取決於更多的因素了(見下文)。

2. 用大腸桿菌表達時能得到可溶性蛋白嗎?

鑒於前面提到的種種原因,真核蛋白的表達通常也將大腸桿菌作為首選表達方法。然而,許多真核蛋白在大腸桿菌內表達時不能進行適當的摺疊,從而會形成不可溶的聚集體(也稱包涵體)。當然有時候,將包涵體溶解,或是通過低溫表達蛋白來提高溶解度是有可能實現的。另外,恰當的使用分子伴侶如谷胱甘肽-S-轉移酶(glutathione-S-transferase ,GST),麥芽糖結合蛋白(MBP)等也可以提高目的蛋白的溶解性。然而與其嘗試10種不同的大腸桿菌,不如換用真核表達系統。

3. 表達的蛋白需要翻譯後修飾嗎?

許多蛋白為了獲得相應的活性或是正確的結構,需要在翻譯後進行修飾。最簡單的一種修飾是發生在所有的生物體中的去除N-末端的蛋氨酸殘基。更複雜的修飾,如N/O–糖基化,N/O–磷酸化則只發生在部分真核細胞中。

4. 表達的蛋白用到哪些密碼子?

我們知道,在生命體中61個密碼子的使用頻率是不一樣的。有些密碼子非常重要,是由於它們出現在高水平表達基因中,而一些低頻密碼子則出現在低表達水平的基因中。對於不同的生命體,低頻密碼子也不盡相同,這取決於生命體本身。不同系統使用密碼子情況可以在condon usage database中獲知(http://www.kazusa.or.jp/codon/)。往往,密碼子的使用頻率反應了同源tRNA的數量水平。因此,當你的目的蛋白的密碼子用法與宿主的密碼子用法不同時,有可能在表達蛋白時會出現問題。下面這些問題經常發生:

  • 翻譯中止。這會導致一系列片段蛋白的產生。
  • 開放閱讀框錯位(Frame shifting)。
  • 氨基酸的錯配。例如,使用AGA密碼子編碼精氨酸時,可能會導致賴氨酸與精氨酸之間的替換。AGA密碼子在真核生物中非常常見,但在大腸桿菌中卻很少見。賴氨酸替換精氨酸後,會導致蛋白質相對分子量降低28Da,這是因為賴氨酸的側鏈比精氨酸的側鏈少了兩個N原子,相對分子量的差別可以通過質譜檢測到。
  • 抑制蛋白合成或細胞生長。這導致的結果是,觀察到的蛋白質表達水平很低甚至根本沒有表達。特別是低頻密碼子出現在mRNA的5』端或連續出現的情況下(mRNA5』端是翻譯開始的位置,這裡出現稀有密碼子,翻譯無法開始),可以觀察到蛋白質表達表達水平是非常低的,同時也會觀察到片段化的蛋白產物。

要想提高大腸桿菌中含有低頻密碼子蛋白的表達水平,有以下兩個方法:

? 定點突變。在具有相同的殘基情況下,用高頻密碼子去替換低頻密碼子。如,大腸桿菌中的精氨酸低頻密碼子AGA, AGG可以用高頻密碼子CGC替換。
? 與編碼稀有tRNA的基因共表達。下面的表格提供了幾個可以用於編碼多個稀有tRNA的大腸桿菌菌株

利用這些菌株進行基因表達時,你經常會得到完整蛋白和被截斷的片段蛋白的混合物。利用C-末端純化標記(比如His tag),可以採用親和層析的方法純化到完整蛋白。當用上面兩種方法來提高蛋白質的表達水平都失敗的情況下,就需要考慮改用其他表達系統如酵母菌和昆蟲細胞等。如果目的蛋白包含了很多大腸桿菌的低頻密碼子,最好直接採用真核表達系統。最後我們通過一張表系統的了解不同表達系統的特點。

References

Protein Expression. A practical approach (Higgins. S.J. Hames, B.D., eds), Oxford University Press, 1999.
Kane, J.F. (1995) Effects of rare codon clusters on high-level expression of heterologous proteins inEscherichia coli. Current Opinions Biotechnol. 6, 494-500.

Zhang, S., Zubay, G. Goldman, E. (1991) Low-usage codons in Escherichia coli, yeast, fruit fly and primates. Gene 105 , 61-72.
Calderone T L, Stevens R D, Oas T G. High-level Misincorporation of Lysine for Arginine at AGA Codons in a Fusion Protein Expressed inEscherichia coli[J]. Journal of molecular biology, 1996, 262(4): 407-412.

Novy, R., Drott, D., Yaeger, K. Mierenhof, R. (2001) Overcoming the codon bias of E. coli for enhanced protein expression. inNovations 12 , 1-3.

上文的原文鏈接在這裡 表達蛋白,你用什麼系統? | BioEngX


除樓上所說加入強啟動子外,使用帶有目的基因的慢病毒轉染細胞導入基因的多個拷貝也是提高基因表達的一種途徑,甚至應用更為普遍。


推薦閱讀:

長頸鹿的脖子會打結嗎?
有沒有生活在空中的生物?
为什么动物们吃生肉、腐肉不会闹肚子而人类一吃就完蛋?
同性戀是否是基因表達哦?
世界上只有人吃辣椒嗎?

TAG:基因 | 基因工程 | 生物學 |