基因編輯技術CRISPR的發展簡史:從發現到爆炸

?圖片來自McGovern Institute for Brain Research at MIT

編者按

北京時間12月19日,《自然》公布了年度10大人物,Broad研究所David Liu開發出了一款全新的「鹼基編輯器」而當選,2013年張鋒同樣因為CRISPR基因編輯技術的開發而入選。由此可見CRISPR基因編輯技術備受外界關注。事實上,對於一項重大的科學發現來說,其歷程往往漫長且荊棘叢生,但一旦時機成熟,它將會快速發展並得到廣泛應用,CRISPR基因編輯技術也不例外。30多年前,科學家在細菌中發現規律間隔成簇短迴文重複序列,之後發現這種重複序列可讓細菌對病毒有免疫抗性。但這一現象之所以能迅速引燃每個分子生物學家的實驗室,主要是因為該序列衍生的RNA可引導蛋白質結合特定DNA片段,從而引起目標DNA上的雙鏈斷裂,該技術簡單並且極為高效。

《知識分子》將陸續介紹基因編輯技術的前沿進展。本系列文章由上海科技大學生命科學與技術學院劉冀瓏教授主持策劃。

撰文 | 劉 奕 王俏琦 張波 章元兵 張子恆 周爽(上海科技大學生命科學與技術學院)

責編 | 葉水送

知識分子為更好的智趣生活 IDThe-Intellectual

● ● ●

?DAVID LIU當選《自然》2017年十大人物之一,圖片來自Nature

三十年前,實驗生物學家在分析寄居於人類腸道的細菌的一個基因時,偶然發現一組重複迴文密碼。之後這類密碼在其他細菌基因組陸續被發現。通過計算生物學家的縝密計算,判定該類密碼是細菌抵制外敵入侵的關鍵手段。這個判定結果隨後被實驗生物學家在酸奶工廠得到證實。數年後,這類密碼被利用,引發基因編輯領域的爆炸……這類密碼的名字叫做CRISPR。

作為當今生命科學領域最火熱的基因編輯技術,CRISPR因其高效、便捷、適用範圍廣,為科研工作者帶來了福音,同時其廣泛應用也促進了基礎科研、農業、基礎醫學及臨床治療的發展。下面讓我們穿越到三十年前,細數CRISPR系統的發現發展過程。

1987年,Nakata研究組在分析大腸桿菌(Escherichia coli)中基因iap及臨近序列(flanking regions)時,偶然地發現在位於iap的3』端存在含有29個鹼基的高度同源序列重複性出現,且這些重複序列被含32個鹼基的序列間隔開,當時科學家並不清楚這種序列的生物學意義。隨後的幾年(1989年-1999年),陸續有相關研究指出類似的重複序列存在於多種細菌及古生菌中。2000年,Mojica和同事通過比對發現這種重複元件存在於20多種細菌及古生菌中,並將這種核酸序列命名為短規律性間隔重複序列(Short Regularly Spaced Repeats, SRSRs),因其高度保守性,猜測其一定具有重要的生物學功能。

CRISPR一詞正式登上歷史舞台還是2002年的事。Jansen實驗室通過生物信息學分析,發現這種新型DNA序列家族只存在於細菌及古生菌中,而在真核生物及病毒中沒有被發現,並將這種序列稱為規律間隔成簇短迴文重複序列(clustered regularly interspaced short palindromic repeats, CRISPR)。他們將臨近CRISPR locus的基因命名為cas(CRISPR-associated),並發現了4個cas基因(cas1, cas2, cas3, cas4)。2005年,Mojica,Bolotin和Pourcel三個研究組指出CRISPR中的間隔序列來自於外來噬菌體或質粒,其中Mojica實驗室驚喜地發現病毒無法感染攜帶有與病毒同源間隔序列的細胞,而易侵入那些沒有間隔序列的細胞,由此他們提出CRISPR可能參與細菌的免疫功能的假說。

CRISPR能在細菌的免疫功能中起作用在2007首次得到實驗證實。Horvath研究組發現嗜熱鏈球菌被病毒入侵後整合了來自噬菌體基因組新的間隔區序列,同樣的病毒再次入侵時細菌就有了抗性,使其免遭攻擊。同時人為地去除或添加特定的間隔區序列,會影響細菌的抗性表型。因此,他們認為CRISPR及cas基因一起為嗜熱鏈球菌提供了對噬菌體的抗性作用,同時抗性的特異性取決於CRISPR中的間隔區序列,細菌的這種免疫性是可以遺傳的。至此,雖然科學家並不清楚CRISPR/Cas抵抗病毒的具體機制,但他們開始逐漸揭開其神秘的面紗。

2008年,Oost實驗室揭示了宿主細胞中CRISPR的間隔序列如何在cas蛋白的協助下介導發揮抗病毒作用。他們發現在CRISPR轉錄後,cas蛋白會形成一個稱為Cascade的複合物,裂解每個重複單元中的CRISPR RNA前體(pre-crRNA),但裂解產物都保留了間隔序列。在解旋酶cas3的作用下,成熟的CRISPR RNA(crRNA)發揮小嚮導RNA(small guide RNA)的角色,促使Cascade干預病毒的增殖。2009年,Mojica團隊指出前間隔序列臨近的PAM序列為原核生物中CRISPR/Cas發揮免疫識別提供了靶標。

2011年,Charpentier研究組通過對人類病原體化膿性鏈球菌的差異化RNA測序,揭示了反式編碼crRNA(tracrRNA)參與pre-crRNA的加工成熟過程。他們指出,tracrRNA通過24個核苷酸與pre-crRNA中的重複序列互補配對,在保守的內源性RNA酶III和CRISPR相關的Csn1蛋白的參與下指導pre-cr RNA的成熟過程,這些組分對保護化膿性鏈球菌免受噬菌體DNA的入侵必不可少,研究揭示了crRNA成熟的新途徑。

以上我們一直在介紹CRISPR/Cas的發現及細菌、古細菌如何利用該系統來沉默外來核酸以抵禦病毒及質粒的入侵。CRISPR/Cas作為基因編輯系統被應用最早開始於2012年兩位女神的強強聯合,她們分別是來自加州大學伯克利分校的結構生物學家詹妮弗·杜德納(Jennifer Doudna)和瑞典于默奧大學的埃馬紐埃爾·卡彭蒂耶(Emmanuelle Charpentier)。她們通過體外實驗證明:成熟的crRNA通過鹼基互補配對與tracrRNA形成特殊的雙鏈RNA結構,指導cas9蛋白在目標DNA上引起雙鏈斷裂。在與crRNA指導序列互補的位點,cas9蛋白的HNH核酸酶結構域切割crRNA的互補鏈,而cas9蛋白RuvC樣結構域切割非互補鏈。當雙tracrRNA:crRNA被嵌合到一條RNA時,同樣可以指導cas9切割雙鏈DNA。她們的研究證明,在雙鏈RNA指導下切割雙鏈DNA斷裂的內切酶家族並揭示了CRISPR/Cas系統在RNA指導下進行基因編輯的巨大潛力。

?CRISPR/Cas系統發現歷程中的主要貢獻者

之後就一發不可收拾,緊接著是2013年初的兩篇Science和一篇Cell文章,它們分別由來自於哈佛大學醫學院的George Church、麻省理工學院博德研究所的張鋒以及加州大學舊金山分校系統及合成生物學中心的Lei S. Qi(目前就職於斯坦福大學)實驗室,這三篇文章都將CRISPR/Cas系統成功應用到哺乳動物細胞中。其中Church研究組設計了II型CRISPR/Cas系統,在人類細胞中設計特定的gRNA。對於內源性AAVS1基因座,他們成功獲得了293T細胞中10%至25%,K562細胞中13%至8%以及誘導多能幹細胞中2%至4%的靶向率。他們同時表明這個過程依賴於CRISPR組件,是特定的序列;在同時引入多個gRNA時,可以實現對目標基因座的多重編輯。張鋒實驗室證實了cas9可以在小RNA的指導下在人類及小鼠細胞中對內源基因座實現精確切割,同時他們將cas9改造為缺口酶促進同源修復。Qi與同事則將II型CRISPR/Cas系統中的cas9蛋白改造成失去核酸內切酶活性的dCas9,將其與gRNA共表達,產生一種DNA識別複合物使其特異性地干擾轉錄延伸,RNA聚合酶或轉錄因子與DNA的結合達到抑制目標基因表達的目的。他們將其稱為CRISPRi,實現了對大腸桿菌中基因的有效抑制,且沒有明顯的脫靶效應。而且可以實現同時抑制多個基因,他們表明CRISPRi也適用於哺乳動物細胞。很快人們利用CRISPR/Cas系統實現了對斑馬魚、真菌及細菌的基因編輯。2013年5月,Jaenisch研究組利用CRISPR/Cas介導的基因工程技術製造了在多個基因上含有多重突變的小鼠,極大地促進了體內多基因的功能學研究。隨後,人們實現了對果蠅、線蟲、大鼠、豬、羊、以及水稻、小麥、高粱等多種生物的基因編輯。

?基因編輯技術的基本原理,圖片來自origene.com

距開始利用CRISPR/Cas進行基因編輯不到一年時間裡,人們就實現了用該系統來校正遺傳疾病。2013年12月,李勁松研究組和Hans Clevers研究組利用CRISPR/Cas9系統分別校正了小鼠白內障及人幹細胞中一種與囊腫性纖維化相關聯的基因缺陷。同時,研究者通過向人類細胞轉染慢病毒包裝的sgRNA庫,實現了對基因組範圍的功能性篩選。2015年4月,黃軍就和團隊首次修飾人類胚胎DNA,為治療一種在中國南方兒童中常見的遺傳病——地中海貧血症提供了可能。

隨著對CRISPR系統研究的不斷深入,也暴露了一定的缺陷和局限性,如嚴重的脫靶效應。2015年9月,張鋒研究組報道了一種不同於Cas9的新型2類CRISPR效應因子Cpf1。他們的研究證明,Cpf1是一種不依賴tracrRNA,由單個RNA介導的核酸內切酶。Cas9是在同一個位置同時剪切DNA分子的雙鏈,形成的是平末端;而Cpf1剪切後形成是兩個不同長度的鏈,被稱之為黏性末端。同時Cpf1能夠識別富含胸腺嘧啶(T)的PAM序列,可以擴展CRISPR的編輯範圍。

已知的許多遺傳疾病由點突變引起,然而目前糾正點突變的方法存在效率低或引起隨機缺失或插入等缺陷。2016年4月,David R. Liu研究組報道了一種鹼基編輯的新方法。他們將胞嘧啶脫氨酶與CRISPR/Cas9進行融合,在gRNA的指導下,不引起DNA雙鏈斷裂,直接實現胞嘧啶(C)到尿嘧啶(U)的轉變,而DNA複製進一步使得U被T代替,從而實現C→T (or G→A)的轉換。這種鹼基編輯器可有效糾正多種與人類疾病相關的點突變。他們還發展了第二、第三代鹼基編輯技術,進一步提高鹼基編輯效率。在此基礎上,上海科技大學陳佳研究組與合作者共同開發了一種增強型鹼基編輯器。他們發現,將含有尿嘧啶DNA糖基化酶抑製劑(UGI)的質粒與sgRNA/BE3共同轉染293FT細胞,經深度測序分析,與單獨轉染sgRNA/BE3相比,共轉染的方法減低了錯配頻率並提高了C-到T-的替換效率。他們還發現UGI的表達水平與C-到T-的鹼基替換效率成正相關。為了提高實驗的方便性,研究者還將多個重複UGI與BE共表達在同一載體,與靶向不同基因座的多個sgRNA共同轉染293FT細胞,結果表明這種增強型鹼基編輯器大大提高了編輯效率。

2016年6月,張鋒研究組發現一種來自纖毛菌(Leptotrichia shahii)的效應因子C2c2(現被稱為cas13a),具有RNA介導的RNA酶功能。體外生化分析顯示C2c2可在單個crRNA指導下剪切靶向單鏈RNA。細菌內,C2c2可被用來敲低特異性的mRNA,RNA酶活性依賴於HEPN結構域,C2c2是第一個被發現的靶向RNA的CRISPR效應因子。

2016年10月,第一個由CRISPR/Cas9編輯進行的臨床治療實驗由Lu團隊完成,研究者分離患有轉移性非小細胞肺癌病人血液中的免疫細胞,特異性的敲除PD-1基因,對細胞擴增培養後輸回患者體內以期抵抗癌症。

2017年10月,David R. Liu團隊將編碼tRNA腺嘌呤脫氨酶(TadA)的基因引入大腸桿菌內,經歷了漫長的7代篩選後,開發出了一款全新的「鹼基編輯器」,將進化後的TadA與CRISPR/Cas9系統融合,在不引起DNA鏈斷裂的情況下實現了A?T到G?C的轉換,且在人體細胞中,編輯效率超過了50%。這樣就實現了C?G 到 T?A和A?T 到G?C的高效編輯,為多種遺傳疾病的治療提供了有效工具。

註:本文作者署名排列不分先後,按作者姓的拼音排序。

製版編輯: 許逸|

本頁刊發內容未經書面許可禁止轉載及使用

公眾號、報刊等轉載請聯繫授權

copyright@zhishifenzi.com

知識分子為更好的智趣生活 IDThe-Intellectual


推薦閱讀:

年度科學傳播奧斯卡,男女主角都有誰?
怎樣才能既早起又在白天不打瞌睡?(題主因為想擠時間來努力做事和學習,所以才問的這個問題)?
samadhi(三摩地)是一種什麼感受?
漢傳佛教禁食肉是否合理?
自然選擇可以保持某種性狀在種群中的比例嗎?

TAG:基因编辑 | 生物学 | 基因 |