詳解CRISPR/Cas系統與其應用

CRISPR技術雖然是現階段生物界非常新而且非常熱門的一門技術, 在各大門戶網站上有很多文章已經對於此項技術進行了詳細的介紹. 但是本篇文章本著簡潔, 通俗易懂的理念, 將細緻的介紹CRISPR的相關概念並且闡述作者自身對於CRISPR這門技術的理解. 適合剛剛接觸CRISPR系統的人進行學習探討.

在本文中, 我將介紹什麼是CRISPR 系統, 其結構特點和作用機制. 同時也會概括性的介紹CRISPR 在現階段的應用, 和gene drive(基因驅動) 技術.

(1) CRISPR/Cas: 強大的基因組編輯工具

精準, 簡便的對於基因或者基因組的信息進行編輯對於生物學家了解生物體內的代謝過程, 生物體內基因的功能研究和現代基因治療都有著至關重要的作用. 之前的基因組編輯技術, 例如鋅指蛋白 (Zinc Finger, ZFNs)和轉錄激活因子樣效應物

(Transcription activator-like effector, TALENs) 對於基因組編輯的發展做出了不可磨滅的貢獻. 在這兩種技術當中, 基因編輯的工具在基因組上的定位依靠蛋白質與DNA之間的相互反應, 而對於基因組的剪切過程依靠Fokl蛋白. 圖一中, 彩色的圓形或橢圓形代表了合成的錨定蛋白 (Fig.1). 但是錨定過程依靠DNA 與蛋白質相互作用的一個顯著的缺點就是當要錨定新的基因位置時,需要對於錨定蛋白進行重新設計和合成, 這大大的加大了基因編輯的工作量和難度, 使這些技術較難適應高通量的基因組編輯工程.

Figure 1: Zinc Finger, ZFNs and Transcription activator-like effector, TALENs) technologies.

CRISPR/Cas系統作為一個革新性的強大基因組編輯工具的出現改變了這一境況, 可以說是顛覆了基因組編輯這個領域. CRISPR的全名是 (clustered regularly interspaced short palindromic repeats), 中文意思是成簇的, 規律間隔的,短迴文重複序列. Cas 所指的是

(CRISPR-associated). 與上述的工具之間的不同之處是, CRISPR/Cas系統對於基因組上基因的定位利用RNA 與DNA 之間的相互作用, 對於新基因位置的錨定只需要一小段新的RNA序列, 這個特點大大的減少了新和成蛋白的工作量, 且特異性是很高的. 具體的機制在下文會有介紹. CRISPR/Cas系統之所以成為基因組編輯界的新寵是因為這個工具具有很多其他工具不具備的優點, 例如, 合成簡便, 使用方便, 低費用,特異性高等.

(2) CRISPR/Cas系統的結構

CRISPR/Cas系統是細菌體內的獲得性免疫系統, 是用來對抗侵略細菌的外源DNA, 質粒和噬菌體的. 與普通的原核生物的general的免疫系統不一樣, CRISPR/Cas系統是獲得性免疫系統, 這就意味著這個免疫系統是具備「記憶性」的. 他可以記住入侵過的外源DNA 和噬菌體, 並在他們再次入侵的時候切斷他們基因組, 被切斷的基因組將變為線性,無法進行複製和表達,並被細菌體內的酶降解掉. 這個免疫系統雖說簡單, 但是卻非常實用且強大.

CRISPR 系統是一個什麼樣的結構呢. 簡而言之, CRISPR/Cas系統由兩大部分組成: 第一個部分是編碼Cas相關蛋白質的基因(在Fig.2中的白色方塊箭頭), 這些Cas蛋白在獲得外源基因片段和剪切外源基因上都起著重要的作用. 第二大部分被稱為CRISPR array, 這個部分中包含了repeat序列和spacer序列, 這兩種不同的序列是間隔開來的, 本著兩個repeat序列夾一個spacer序列, 正如Fig.2所示, 黑色菱形代表repeat序列, 不同顏色的方形則代表了不同的spacer序列. Repeat序列在同一細菌中的鹼基組成和長度是相對保守的, 基本不變. 在不同的細菌之間會有些許差異. Spacer序列則是用來錨定目的外源基因的, 所以spacer的序列鹼基組成差異較大, 因為他們來自於不同的外源基因. Spacer 基因當中包含著被錨定基因組中的特異性高的保守序列, 確保在之後轉錄出的RNA 可以與被錨定基因組精確配對. CRISPR array之前通常會有一個富含A-T的leader sequence, 這個序列中包含啟動子, 是用來啟動repeat 和spacer序列轉錄的. CRISPR array 不包含閱讀框(ORF, open reading frame).

Figure 2. General CRISPR/Cas system locus.

(3) CRISPR/Cas 系統的作用機制

CRISPR/Cas的作用機制可以分為兩個主要的部分: Adaptation和Interference. 第一個大部分Adaptation根據我的理解可以又分為兩個小部分, 分別是Spacer序列的獲取和CRISPR RNA

(CrRNA)的合成加工. 下面對於作用機制的解釋基於Fig.3.

1. Adaptation: Spacer的獲得

當噬菌體或者外源基因侵入到細菌體內後, 其基因組中的protospacer會被CRISPR/Cas系統中的cas相關基因進行識別而剪切. Cas蛋白對於spacer的識別獲取基於其序列下游的PAM (Protospacer adjacent motif) 序列, PAM 序列在spacer獲取和CRISPR系統的體外設計中都起著至關重要的作用. 不同的CRISPR/Cas系統的PAM識別序列也是不同的. 當Cas相關的蛋白選擇spacer後, 會把其基因剪切下來, 並插入到leader序列和相鄰的repeat的中間, 形成新的spacer. 這樣, 下次同樣的外源基因入侵時, 就可以對其基因組進行剪切了. Spacer的前面是需要有repeat的, 這和後面形成城成熟的CRISPR RNA 很重要. 為了不影響讀者對於機制一個大概的理解, 新插入的spacer前是如何形成新的repeat序列的, 作者將在Appendix1中作介紹.

Figure 3. Adaptation process, including spacers acquisition and crRNA biogenesis.

2. Adaptation: CRISPR RNA (CrRNA) 的形成

之前提到過, leader sequence中具有啟動子, 可以啟動後面CRISPR array的轉錄, 這個轉錄是連續的. 因此轉錄出的RNA 產物是一條長鏈, 其中包含了CRISPR array中所有的spacers和repeats, 這條長鏈RNA 被稱為precursor transcript (pre-crRNA). 如Fig.4所示, 長鏈pre-crRNA會隨之被細菌體內的管家基因表達的酶或者Cas相關的蛋白(取決於CRISPR系統的差異)所加工剪切, 使之稱為成熟的, 含單一spacer的crRNA. 轉錄出來的spacer RNA 序列是和目的錨定基因互補的, crRNA 可以引導Cas相關的蛋白去剪切目的基因組中的基因.

Figure 4. crRNA biogenesis

3. Stage II: interference

在成熟的單一spacer的crRNA形成之後, 其會與Cas相關蛋白和其他的RNA 組分組成一個複合物, crRNA 可以與外源基因中的基因互補配對, 並引導Cas蛋白或蛋白複合物對外源基因片段進行剪切. 正如fig.5和fig.6所示. crRNA和Cas相關蛋白質組成的複合物是根據不同種類 CRISPR系統而不一樣的. 在最常用的type II系統中, crRNA會與noncoding trans-activating CRISPR RNA (tracrRNA)互補配對再與Cas9蛋白形成複合物進行DNA 剪切. 這個在後面會介紹.

Figure 5. Stage II interference.

Figure 6. schematic of interference stage.

(4) 不同的CRISPR 系統

CRISPR/Cas系統大體可以被分為兩類, Class 1 (包含了type I, III, and IV), 和Class 2(包含了type II 和type V和type VI). 在Class1 中, 對於外源基因組的剪切需要一個大的Cas蛋白複合物(由不止一種Cas蛋白組成)和引導RNA. 在Class2中, 對於外源基因的剪切只需要一個單一的剪切蛋白, 例如 TypeII中的Cas9蛋白和TypeV中的cpf1蛋白. Fig.7中清晰的表明了在何種階段, 有何種Cas相關的蛋白參與.

在人工合成Cas系統時, 最常用的是Class2 CRISPR 系統, 因為對於DNA 的剪切只需要單一的Cas9 蛋白或者cpf1 蛋白, 非常簡單便捷.

Figure 7. functional classifications of Cas proteins.

Figure 8. Genomic architectures of the known and newly identified Class 2 CRISPR-Cas systems.

Fig.8 示意了type II 中的三個subtype和Type V中CRISPR 系統的基因結構. 各中Cas蛋白的作用可以對照Fig.7去看. 其中的tracrRNA在上一節中有所介紹. 在對DNA 進行剪切的時候tracrRNA 會和CrRNA配對, 形成guided RNA引導Cas9去剪切DNA. 其中詳細的結構示意圖在Appendix2中顯示.

(5) Type II CRISPR 系統體外的合成策略和應用原理

第三章節中介紹的CRISPR作用機制是細菌體內的作用機制, 是應用CRISPR技術的基礎. CRISPR 之所以被稱為是一個強大的基因組編輯工作是因為他操作簡單, 合成也非常的便捷. 上面提到了TypeII CRISPR 系統是最常用的系統. 那麼在這一節中我就以type系統為例介紹CRISPR的應用.

首先我們先看Fig.9, 這是一個非常清晰的示意圖. 在實踐應用中, 我們會先選擇需要進行錨定剪切的基因, 基因的選擇要基於PAM 序列, 之前介紹過. 那麼type II 的PAM 序列就是NGG. 也就是說, 在目的剪切的基因上, 與剪切的基因片段後必須要有一段PAM序列, 這對後面Cas9的識別和剪切是必要的. 再選擇好欲剪切的基因片段後, crRNA則是被選擇的這一片段. 隨後tracrRNA是必須的, 因為其要和crRNA形成特殊結構後才可以引導Cas9蛋白去剪切. 由Appendix2可以看出, tracrRNA與crRNA配對的部分是repeat基因, 所以在實際應用中, 一個tracrRNA就可以和不同的crRNA (包含目的基因的protospacer和repeat序列)相配對了. 而sgRNA (single-guided RNA) 是體外人工合成的, 可以引導Cas9區剪切目的基因.

Ps: 在實際操作用, 可以不需要linker loop. (如Appendix 2 所示), 因為如果使用linker loop, 對於有每一個spacer都要轉錄一次tracrRNA. 如果一個系統中有多個spacers, 則按照Fig.8 的基因結構合成即可.

Figure 9: Schematic of artificial type II CRISPR systems

那麼當把基因剪斷了之後, 該怎麼辦呢? Cas9蛋白可以引發DNA 的雙鍵斷裂, Cas9中包含了HNH , RuvC-like 和PAM序列交流活性區. HNH 和RuvC會各切DNA 的一條鏈, 造成雙鍵斷裂. 正如Fig.10所示. 如果對HNH和RuvC活性區域進行突變使之無法行駛剪切的功能的話就會產生Dead Cas9 (dCas9). dCas9 只可以提議性的附著到特定的基因位置上 (依據sgRNA 上的序列), 而不可以行駛剪切功能. dCas9在CRISPR的各類應用中起著很重要的作用.還有一種方法就是只對HNH或RuvC的其中一個位點進行沉默突變, 形成和Cas9 nickase, 這樣就可以用兩個不同的nickase對基因組進行錨定和單鏈剪切, 造成粘性末端.

Figure 10. Schematic of main domains of Cas9 protein.

如Fig.10 所示, 單一的CRISPR系統可以造成平末端的DSB (double

stranded break), 兩個Cas9 nickase 系統可以造成粘性末端的斷裂. 當DNA 的雙鏈被剪切了之後, 有兩種修復方式: 第一種就是NHEJ, 不同源的末端修復. 這是生物體內自發的SOS修復, 緊急連接斷裂的DNA 雙鏈, 但這種連接方法是隨機的, 油價可能造成鹼基的插入, 刪除, 造成閱讀框的移碼. 而另一種是HDR, 同源定向修復, 提供一個兩端序列和斷裂序列相同的donor DNA小片段, 這個DNA小片段可以與斷裂的基因進行同源重組, 由此形成目的性的插入基因, 刪除基因等功能 (紅色標出的片段是目的插入片段). 由此可以完成基因組中基因的定向改變, 插入和刪除.

Fig.10中的第三個圖則是運用了dCas9 (dead Cas9). 並在Cas9蛋白上附著上FokI 酶, 這樣兩個dead cas9 就可以實現基因的定位而不可能剪切, 而FokI 酶行駛剪切效用. 這樣的雙錨定功能會大大較低CRISPR 系統的脫靶效應 (off-target).

Figure 11. Cas9 in genomic editing.

(6) CRISPR系統的不同應用

CRISPR系統最先的用途就是造成DNA 的雙鍵斷裂, 在使用NHEJ 或者HDR的方式進行定性,目的基因的編輯. 但很快, CRISPR系統就應用到了眾多領域. 例如激活或抑制轉錄反應. 下面以Fig.12 為例做介紹. 圖A呈現了正常的Cas9蛋白和dCas9蛋白. 圖B的第一幅圖將 w subunit與dCas9 蛋白融合, 這樣Cas9蛋白可以定位到特定的位置, w subunit可以召集轉錄因子, 由此激發轉錄過程, 第二幅圖, dcas9可以結合到RNA聚合酶的下游, 阻擋聚合酶繼續轉錄從而抑制轉錄. 圖C中則同通過融合VP64去激活哺乳動物細胞的基因轉錄和通過融合KRAB去抑制轉錄. 而圖D則更為先進, 相比於圖C中只融合一個VP64激活因子來說, 這裡的方法是融合一個多肽(scFV peptide), 其中包含了VP64, 而多肽之間是可以結合的, 這樣就大大的提升了激活因子VP64的召集率, 一個dCas9蛋白最多可以召集24個VP64, 大大提升轉錄效率. CRISPR系統在轉錄的激活與抑制上還有很多應用, 這裡不詳細介紹, 有興趣的讀者可以去自行閱讀下方的參考文獻學習.

Figure 12. Engineered CRISPR interference systems and different applications.

除了轉錄的激活和抑制之外, 還可以把熒光蛋白融合到dcas9上, 這樣可以通過guide RNA 的引導去定性結合特殊的基因位點, 從而便於觀察. 這對於觀察一個目的基因的表達強度和表達歷程是非常有用的. (Fig.13)

Figure 13. Overview of CRISPR imaging. Sequence-specific enrichment of fluorescence signals by sgRNA-directed dCas9-EGFP allows the imaging of genomic elements in living cells.

(7) Gene drive (基因驅動)技術

一個非常典型的例子就是基於CRISPR 技術上的Gene drive技術. 這個技術可以理論上完全改變一個生態圈中的野生型(Wild type)物種. 哈佛大學醫學院的Wyss機構率先提出的通過基因驅動技術可以扭轉生態中具有攜帶瘧原蟲相關基因的野生型蚊子, 換句話說就是使用CRISPR 技術讓所有可以讓蚊子攜帶瘧原蟲的相關基因消失 , 理論上在幾年時間中就可以根除瘧疾. 具體的理論設想如下:

1. 首先對蚊子野生型蚊子的染色體基因(與攜帶瘧原蟲相關)進行編輯

藍色的蚊子是攜帶gene drive的CRISPR系統的, 灰色的蚊子是野生型. 其中, 藍色的基因代表與攜帶瘧原蟲相關的基因的位置(藍色代表已經編輯過, 無法攜帶瘧原蟲), 在野生型文字中的基因位置是一樣的, 因為他們是等位基因. 野生型內的基因是可以使蚊子攜帶瘧原蟲的. 紅色的基因代表sgRNA, 黃色的基因代表Cas9蛋白.

當攜帶gene drive的蚊子和野生型蚊子相交配後, 兩個同源染色體配對. 但是, 藍色蚊子的一條染色體可以表達出sgRNA和Cas9, 紅色sgRNA可以引導Cas9區剪切野生型中與攜帶瘧原蟲相關的基因有關的基因, 從而這條野生型的染色體DNA發生雙鍵斷裂.

再發生雙鍵斷裂之後, 斷裂的染色體DNA勢必會以另一條同源染色體以模板進行同源重組的修復, 最終野性型的染色體DNA的斷裂位置會編程和藍色蚊子的染色體DNA 同位置的基因一樣, 攜帶此染色體的蚊子無法攜帶瘧原蟲. 通過這樣的基因驅動, 數代雜交過後, 所有蚊子理論上都不攜帶瘧原蟲基因了.

基因驅動的技術不止可以應用於蚊子, 而且可以應用於很多物種. 但是這種技術雖然可以快速根除瘧疾, 但是可能會對生態圈造成不可逆轉的改變. 因此在倫理上存在著諸多問題, 是否能夠付諸於實踐. 還需要繼續討論

(8) 總結

CRISPR/Cas技術的確是一個非常強大且使用簡便的基因編輯工具, 在醫療和科研技術上有著不可低估的潛力. 但是同樣CRISPR技術的發展面臨著技術和倫理的限制, 就技術層面上來說, 很多實驗表明CRISPR 系統體外的脫靶效率還是較高的, 如果想把CRISPR技術應用到醫療領域, 那麼如何降低脫靶效率是一個迫切需要解決的問題. 就倫理層面, CRISPR技術的簡便和強大是否會造成不恰當的使用? 這些都需要謹慎考慮.

本篇文章詳細的介紹了CRISPR 技術的原理和應用, 但還是比較縮減和片面的. 有很多東西由於篇幅限制沒有提到, 那麼作者也會在今後的文章中進行更全面的介紹, 並介紹CRISPR 技術最新的應用, 敬請關注.

附錄:

Appendix 1:

Cas的相關基因再選擇protospacer後會攜帶這雙聯的DNA附著到CRISPR array上. Cas蛋白複合體會切斷CRISPR array第一個repeat序列兩條鏈的3末端, 並插入protospacer到斷裂的第一個repeat中間. 這樣就實現了repeat的複製和protospacer的插入. 同時也滿足了下一個spacer插入的條件.

Appendix 2:

本圖是SaCas9 和SpCas9的guide RNA 的示意圖. 紅色的序列代表tracrRNA, 灰色的代表repeat序列, 藍色的代表spacer序列.

參考文獻:

Chen, Baohui, et al. "Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system." Cell 156.1 (2014): 373.

Deveau, H., Garneau, J.E. and Moineau, S., 2010. CRISPR/Cas system and its role in

phage-bacteria interactions. Annual review of microbiology, 64, pp.475-493.

La Russa, M.F. and Qi, L.S., 2015. The new state of the art: Cas9 for gene activation and repression. Molecular and cellular biology, 35(22), pp.3800-3809.

Makarova, K.S., Wolf, Y.I., Alkhnbashi, O.S., Costa, F., Shah, S.A., Saunders, S.J.,

Barrangou, R., Brouns, S.J., Charpentier, E., Haft, D.H. and Horvath, P., 2015. An updated evolutionary classification of CRISPR–Cas systems. Nature Reviews. Microbiology, 13(11), p.722.

Ran, F.A., Cong, L., Yan, W.X., Scott, D.A., Gootenberg, J.S., Kriz, A.J., Zetsche, B., Shalem, O., Wu, X., Makarova, K.S. and Koonin, E.V., 2015. In vivo genome editing using Staphylococcus aureus Cas9. Nature, 520(7546), pp.186-191.

Shmakov, S., Abudayyeh, O.O., Makarova, K.S., Wolf, Y.I., Gootenberg, J.S., Semenova,

E., Minakhin, L., Joung, J., Konermann, S., Severinov, K. and Zhang, F., 2015. Discovery and functional characterization of diverse class 2 CRISPR-Cas systems. Molecular cell, 60(3), pp.385-397.

Wang, H., La Russa, M. and Qi, L.S., 2016. CRISPR/Cas9 in genome editing and beyond. Annual review of biochemistry, 85, pp.227-264.

Wright, A.V., Nu?ez, J.K. and Doudna, J.A., 2016. Biology and applications of CRISPR systems: harnessing nature』s toolbox for genome engineering. Cell, 164(1), pp.29-44.


推薦閱讀:

關於C2c2的老故事
CRISPR系統脫靶檢測方法介紹
斯坦福大學關於人體會對最常用的兩種 Cas9 蛋白有免疫反應的新研究將對基因編輯領域造成何種影響?
crispr基因編輯會引入數百種unintended基因突變的發現會對基因編輯技術的發展有什麼影響?

TAG:合成生物学 | CRISPR | 分子生物学 |