Playing God? 什麼是合成生物學
改造物種? 重建侏羅紀公園? 遙遠的夢可能被合成生物學所取實現, 作為一個較新的學科, 合成生物學在生物, 醫學, 工業, 能源, 檢測等各個領域大放異彩, 同時也在安全和倫理中尋找平衡.
一: 合成生物學概述:
Figure1. Story: Drew Endy, Isadora Deese (Nature 雜誌上關於合成生物學的一組漫畫, 名叫Adventures in synthetic biology, 有興趣的朋友可以看看)
合成生物學是一門在生物學科中較新的領域, 從概念的提出到目前的發展也不過十幾年之久,其目的是把工程學的理念和思想引入到生物學當中來. 合成生物學是一門交叉型學科, 融合了生物學, 化學, 計算機科學, 工程學, 物理學等多個學科, 其目的是將這些學科的概念和知識整合起來, 達到更高效, 更加經濟, 更加精確的按照人類的意志創造出對於有益的產品或者有特殊功能的生物體. 對於傳統的生物學來說, 其遵循up to bottom的思想, 就是從上到下的思想, 舉例來說, 就是給研究者們一個細胞或者物質, 這些研究者們根據已有的經驗和方法對其進行剖析研究. 而對於合成生物學來說, 是一種 Bottom to up 從下到上的思想, 從創造或者改造最基本的細胞組件開始, 再對其進行組裝或者組合, 最終目的是使其成為一種對人類有使用價值的一個生物整體. 而這個」價值」是可以隨著人類的意志和需求改變的, 定向的創造出我們確切需要的產品. 隨著合成生物學概念的出現到現在的飛速發展, 很多領域都可以利用到合成生物學, 例如工業, 醫學, 能源, 環境, 建築等等. 下文將詳細的對於合成生物學的概念和前景進行介紹.
二: 合成生物學的定義, Bottom-up的原則和工程學的理念借鑒
- Synthetic biology refers to both:
- The design and fabrication of biological components and systems that do not alreadyexist in the natural world
- The re-design and fabrication of existing biological systems.
合成生物學定義可以分為兩個概念:(1) 對自然界中不存在的生物原件或者生物系統的設計和組裝.
(2) 對於現有生物系統的重新設計或者建造.合成生物學這個學科的目的就是融合多學科領域的知識和工程學的思想創造或者改造出新的人工製造的生物種類, 生物系統, 代謝通路, 生物功能等.
那麼在創造新型和改造現有的生物組件和系統的時候就要遵循合成生物學自身bottom up的思想. 三個核心的辭彙: part (部件), device (裝置) and system (系統)(Fig.2). 下面我將應用電腦中的hierarchy來類比合成生物學中part, device 和system的概念(Fig.3). 首先對於電腦來說, 一些簡單的二極體電阻等是組成電腦部件的最低級單位, 在生物學中 DNA 和一些蛋白質就是組成part的單位. 對於part來說, 電腦中的part就是一些電子原件, 而生物學的part就是最基本的一些細胞活動的組件, 可以是一個簡單的DNA 序列, 一類蛋白質, 基因中的啟動子終止子等等. 這些part在往上就會組成device, 在電腦中就是一些電路板, 在生物學中可能就是某種功能, 或者某種細胞代謝通路, 而這些device的功能都是由最基本的parts支撐的. 最終由devices就可以組成一個systems(系統), 這個系統可以行使人類所特別設定的功能, 在電腦科學裡面來說就是一個電腦, 在生物學中來說就是一個細胞或更高等的單位. 當一個系統被組成後, 這個系統就可以行使功能.
「Synthetic biology aims to design and engineer biologically based parts, novel devices and systems as well as redesigning existing, natural biological systems.」
---RAEng Inquiry Report 2009
Figure.2 Schematic of the hierarchies of synthetic biology
Figure.3 A possible hierarchy for synthetic biology is inspired by computer engineering
在parts, devices和systems的創建過程當中要基於工程學的思想, 同樣, 三個來自於合成生物學的奠基人之一Drew Endy 在2005年的paper: <Foundations for engineering biology>的核心辭彙: Standardization(標準化), decoupling(去耦合), andabstraction(精簡化) 精闢的總結了合成生物學如何把工程學的理念和知識引用進來, 從而促進合成生物學的快速發展. 基因工程的發展是經歷了很長時間的, 在起初的基因工程研究中, 存在著一些缺點, 例如研究進程慢, 研究出的成果重複率差或兼容性差, 以及研究的生物系統過於複雜等. 而Drew提出的這三個概念就是用來解決以上的問題, 以標準化和簡單化, 達到研究效率提升的目的, 從而推動全球合成生物學的進展以及合作.
首先, 標準化(在一些文章中也用Modularization來闡述相似的概念)是工程學中非常重要的一個概念, 在合成生物學之中也一樣, 在創造或者改造相應的生物學部件時, 一定要進行對於部件的標準化設置, 這樣一個人創造出來的部件通過標準化設置就可以被所有研究者重複使用, 最基本的part的標準化可以大大提升上面device和system的兼容性和標準性, 這是非常重要的一部. 舉個例子來說, 在合成生物學中最盛大的全球賽事iGEM比賽當中, 所有參賽隊伍被要求提交標準化之後的parts, 簡而言之, 就是在parts的兩邊加上統一的prefix 和suffix, 其中包含了統一的酶切位點, 這樣一個part就可以被反覆使用, 大大提升了研究的效率. 圖四則顯示了提交標準化的part, 當一個part被創造或者重新設計出來後, 就可以提交在這個網站上, 其他人就可以使用了. 這些提交上去的原件又叫Biobrick, 很形象的把這些原件比作磚, 那個統一規格的磚, 就可以砌成任何形狀的建築了.
Figure 4. Registry of Standard Biological parts
所謂的decoupling(去耦合) 就是把一個複雜的事物進行拆分, 從而得到其中簡單的片段進行逐一分析, 大大的增加了處理複雜問題的效率. 最後一點就是abstraction(精簡化), 與上一點的目的是一樣的, 都是為了將複雜的生物系統進行簡單化, 而abstraction則強調了解決複雜問題應該使用 hierarchies (分級制度), 在這個理念中, 從事研究工作的人應該只關注在一個等級的研究, 而原則上忽略其他等級的研究,而且只進行有限的穿越等級的交流. 這種觀念可以讓研究者在的研究集中在一個層級, 從而使問題簡單化並提升效率. 這三個概念已經獲得了合成生物學界的廣泛認可.
三: 合成生物學的工具與應用前景
合成生物學中的合成一詞, 狹義的是指在組件和創造一些新型生物功能的和新型生物系統時要用到合成的方法,按照研究者的意志來合成出合適的基因片段或者組件. 同時, 在創建系統的同時也需要結合一些生物體內原本存在的組件.合成生物學研究領域有一些比較常用的且關注度較高的一些工具和技術.下面將非常簡單的概括一下部分工具和應用, 具體詳細的每一項技術的介紹請關注作者賬戶或者微信公眾號 「合成生物學進展」.
(1) DNA的二代測序 (Next generation sequencing, NGS)和三代測序 (Third generation sequencing, TGS)的技術
在合成生物學中, 基因的操作是最為基礎和關鍵的一部分. 所以基因的合成和基因的測序技術對於合成生物學來說是至關重要的.二代和三代測序技術相比於一代的Sanger測序技術來說, 更加的快捷, 便宜和準確. 圖五顯示從2006年到2015年, 對人類基因組測序的費用已經從一千萬美元下降到了幾十美元, 而測序的基因組數量在急速上升. 這主要歸功於二代測序技術的出現和發展. 圖六顯示了主流的二代和三代測序技術的種類, 二代測序的主要供應商包括(454 Roche, IIIumina and Ion torrent), 三代測序現在的主要研究機構包括pacific Biosciences and Oxford Nanopore, 每一種技術都有其優缺點, 根據不同的需要(測序量, 測序長度和測序時間等)可以選擇不同的技術或者相同技術的不同平台, 就二代測序來說, IIumina佔據了絕大部分的測序市場. 而三代測序較於二代測序技術又有所提升, 主要因為二代測序需要對測序的DNA進行擴增, 但是三代測序可以直接測序單鏈DNA 模板, 大大減少測序步驟和測序時間, 但是出錯率相對較高, 仍在測試和研究階段, 至今並沒有實現普及. 作者會在下一期詳細的介紹二代和三代測序的原理.
Figure5. Cost per Human Genome vs Total Number of Genomes Sequenced
Figure 6: Main supplier and technologies of NGS and TGS
(2) DNA 組裝方法 (DNA Assembly)
傳統的基因工程操作就是用限制性內切酶通過基因上的酶切位點把DNA片段切開, 並用連接酶把目的基因片段插進被切開的基因片段. 但是傳統的這種方法耗時耗力, 一次只能操作一個基因片段, 效率低且容易產生frame shift和scar的問題. 在現階段的合成生物學操作中, 多種更為簡潔方便高效的DNA assembly的方法被創造出來, 其中最為常用的有 Gibson, Golden Gate, Gateway和Long-overlap-based assembly等. 這些方法或在連接時設計出特定的overhang,或者使用Type IIS限制性內切酶(Golden Gate), 或使用Site-specific recombination, 這些方法可以實現在同一時間按照特定的順序組裝多個插入的目的基因片段, 且不留下Scar. 這些DNA assembly的新方法大大提升了基因操作的效率. 使得更高難度和更大規模的實驗得以進行.圖7就是golden gate的示意圖.
Figure7: Golden Gate DNA assembly methods
Figure 8. Abstracted mechanisms of DNA assemebly methods
(3) 細胞內的邏輯門
合成生物學中一個核心的目標就是可以創造一個像電子電路一樣的細胞電路, 這個細胞內的電路可以根據輸入(input)的信號做出相應的回應和輸出(output). 在合成生物學發展的過程當中, 一些最初的簡單的邏輯電路, 例如振蕩器(Oscillator) 和toggle switch到現在較為複雜的細胞邏輯電路都被研究者製造出來了. 細胞中的邏輯門的構建是合成生物學中一個非常重要的領域,整合,設計和調整細胞內的邏輯門對於讓細胞實現其目的功能是極為關鍵的. 與計算機中的電路相似, 細胞內的邏輯門也包括了 AND, NOR, OR, NAND等logic gate (Fig.9). 以圖10中的AND gate為例簡單介紹一些細胞logic gate, P1和P2是兩個可以根據環境改變做出調整的啟動子, 只有當 I1和I2兩個小分子input信號同時存在時才能激發P1和P2下游的hrpR 和hrpS的轉錄, 而電路中的Phrp啟動子只有在hrpR 和hrpS兩個蛋白同時存在時才能被激活, 從而促使信號蛋白GFP的表達. 細胞內的邏輯門是合成生物學的中非常核心且基礎的工具, 很多合成生物學的應用中都需要細胞內邏輯門的參與, 所以搞清楚 logic gate是非常重要的.
Figure 8. Rocombinase-based logic gate can implement set of two-input-one-output Boolean logic gates.
Figure9. A modular and orthogonal genetic AND gate design (hrp protein)
(4) 基因組編輯和修改 (genome editing)
分子生物學中一個重要的目標就是實現基因組的定向編輯, 研究者們也不斷地在發展和探索新的基因組編輯修改工具. 一些工具的出現讓基因組的定向編輯成為可能, 例如鋅指蛋白(zinc-finger nucleases, ZFNs)和轉錄激活效應因子(transcription activator-like effector nucleases, TALENs). 但是因為這些工具功能的實現要依靠蛋白質與DNA 的相互作用反應, 而想要target新的目標需要設計新的蛋白, 使得這些技術無法實現高通量的基因組修改功能. 隨著CRISPR (clustered regularly interspaced short palindromic repeats)與Cas9 protein (CRISPR-associated protein 9)的出現, 合成生物學的工具箱中又加入了一個非常強大且簡單的基因組編輯工具. CRISPR-Cas系統是細菌自身的adaptive免疫系統, Cas蛋白受RNA所引導引導, 特定的小片段RNA 遵循鹼基配對原則可以和DNA互補配對, 結合DNA 序列上的PAM(protosparcer-adjacent motif)進行對雙鏈DNA的切割, 讓DNA形成雙鍵斷裂(DSB: Double strand break). 在DNA雙鍵斷裂之後可以通過NHEJ(Nonhomologous end joining)和Homology-directed repair (HDR)兩種方式進行基因的編輯(刪除, 插入特定序列,基因上點突變等). 在進行不同基因位置的剪切上, 只需要根據特定的Cas蛋白的PAM序列特徵設計Guide RNA即可, 非常簡單有效, 是一個目前研究的熱點.
Figure10. Schematic of ZFN, TALEN and Cas9
除了造成DNA的雙鍵斷裂之外, Cas蛋白可以經過特殊設計使切割雙鏈的HNH和RuvC位置失活而創造dead Cas9, 從而使得CRISPR-cas系統可以停留在DNA的任意位置上,實現基因轉錄的激活或抑制, 特定基因的顯色觀察等特定功能. (Figure.11)
Figure11. Schematic of different functions of CRISPR/Cas system
(5) 核糖開關 (Riboregulators and Riboswitches)
如何精準的控制基因的表達是基因工程裡面一個非常重要的主題, 尤其是在控制目的外源基因在宿主中表達的時候, 最好是可誘導的且可以控制表達強度的. 可誘導的啟動子或者強啟動子是一個解決這種問題的方法,可是可誘導的啟動子的選擇較少, 且強啟動子可能會造成細胞自身生長的負擔. 而核糖開關的發現與發展可能可以很好的解決這個問題.
核糖開關是信使RNA的一個部分, 通常存在於不翻譯的5』端, 少數存在於3』端. 他們可以根據外界條件的變化改變自身的結構從而控制下游基因的表達, 這種控制既可以體現在轉錄水平上,也可以體現在翻譯水平上. 一般來說, Riboswitches主要為兩個部分組成, 第一個部分是adpater, 其可以與外界的小分子物質(ligand)結合, 影響到下游表達平台(expression platform)的自身形狀的改變, 從而調控下游基因的表達. 在核糖開關中, 又可以分為cis-regulation和trans-regulation. 以我自己的理解來說, cis-regulation就是adapter和小分子相結合後引發的自身形狀變化, 而trans-regulation就是與反義的RNA 或DNA片段相連後所產生的自身形狀變化.
Figure11. Riboswitches can regulate transcription and translation by "cis" and "trans" ways
Figure12. Zika sensors based on trans riboswitches
舉個例子來說, 圖11中的A圖Shine-Dalgarno(SD)序列是核糖體的結合位點, 在黃色的ligand不存在的時候, SD的自由的,核糖體可以與之結合併行使翻譯, 但是當黃色的ligand存在的時候, 其與Adapter相結合引發了後面的expression platform的改變, 導致SD被配對, 核糖體無法識別, 翻譯無法進行, 下游的基因也就無法表達, 圖B是ligand的結合導致了terminator的形狀改變, 使得翻譯可以繼續進行. 圖A和圖B就是上面所說的cis-regulation, 以結合小分子ligand為主. 而後面的圖C和圖D就是trans-regulation, 通過核糖開關的adapter與反義RNA小片段的結合產生結構改變, 從而控制轉錄或者反義.
美國哈佛大學維斯生物啟發工程研究所合成生物學家James Collins博士在2016年研發出的基因trans-regulation的Tenhold 核糖開關可以快速高效的檢測寨卡病毒, 這個研究有著里程碑式的意義, 是合成生物學走向商業化的重要一步(Fig.12).
(6) 基因組的人工合成
de novo的創造生命, 是人類的夢想. 想要創造生命, 就要從基因的合成開始. 人類從發現基因, 測序基因, 合成基因到現在合成基因組, 離創造生命越來越近. 1979年, 第一個合成基因的誕生, 合成的單位也從最初的Oligos, 到基因, 再從2002年的polio virus cDNA的合成到近期的酵母細胞的染色體合成. 基因合成的難度和長度都呈大幅度的提升(Fig.13).
Figure 13. Synthetic gene/genome size
Figure 14. Internation Synthetic Yeast project
2010年5月20日,Craig Venter小組人工合成了蕈狀支原體(Mycoplasma mycoides)基因組(1078809bp),並在山羊支原體細胞中成功複製、翻譯並傳代。實現了第一個具有人造基因組的活細胞。這就是JCVI-syn1.0. 在syn1.0被創建出來之後, 文特爾的團隊在1.0的基礎上做減法,逐漸剔除一些基因,然後再轉入去除DNA的M. capricolum里反覆測試,看看最多可以去掉多少基因還能保持細菌的活性。最後結論是這個基因組可以削減到531,560個鹼基對 ,473 個基因。這個縮減版基因組的生命體被命名為JCVI-Syn3.0. 但是這個人造的基因組還只是簡單原核生物的基因組.
2014 年4月, 一篇由美國約翰霍普金斯的團隊在science上發表的文章報道了第一個真核生物的染色體合成, synIII, 整個染色體的長度為272,871bp , 其合成是基於316,617bp的啤酒酵母的三號染色. 在此之後, 一個國際的項目: 合成酵母全染色體(Sc2.0)誕生, 這個項目的目的是設計, 組建, 整合12Mb的啤酒酵母的全基因組, 中國的一些高校和組織也參與了這個項目, 例如天津大學, 清華大學和香港大學, 還有華大基因(Fig.14).
在人工合成基因組中, 其工作的基本要點就是刪除不重要的基因片段(Deletion), 調整密碼子和tag基因(Modify)和添加loxP site(Add)這主要是為了之後的替換和設計的. 染色體的合成的原理和技術並不是很複雜, 主要用到DNA assembly的技術和LoxP site的設計(Fig.15), 具體的過程我會在之後的文章中詳細介紹.
Figure 15. Works in Synthetic genome of yeast
四. 結語
在我看來, 合成生物學的發展在融合多種不同領域學科的同時, 也包括了對於分子生物學, 細胞生物學, 微生物學, 蛋白學等這些生物學內的分支學科的整合. 因此, 對於合成生物學的學習, 我認為是比學習單一學科更加複雜和有意思的. 合成生物學的在醫學, 材料, 檢測, 環境, 能源, 建築, 等許多領域都有著非常好的應用前景, 雖然現在真正應用於實踐的應用並不是非常多, 但是在合成生物學領域的科研和創新正在飛速發展, 我相信很多應用通過相應的測試觀察和審批後可以上市進行應用. 當然, 合成生物學是把雙刃劍, 一個有名的例子當屬基於CRISPR 的gene drive技術, 此技術可以讓可以攜帶瘧原蟲的蚊子徹底滅絕, 在威力強大的同時不由得引人擔憂. 對於合成生物學的安全和倫理監管也是一個非常大的課題.
總之, 合成生物學是一個非常有意思的學科. 我也會繼續關注, 學習和分享合成生物學有關的看法和知識.
參考文獻:
[1] Annaluru, N., Muller, H., Mitchell, L.A., Ramalingam, S., Stracquadanio, G., Richardson, S.M., Dymond, J.S., Kuang, Z., Scheifele, L.Z., Cooper, E.M. and Cai, Y., 2014. Total synthesis of a functional designer eukaryotic chromosome. Science, 344(6179), pp.55-58.
[2] Casini, A., Storch, M., Baldwin, G.S. and Ellis, T., 2015. Bricks and blueprints: methods and standards for DNA assembly. Nature Reviews Molecular Cell Biology, 16(9), pp.568-576.
[3] Endy, D., 2005. Foundations for engineering biology. Nature, 438(7067), pp.449-453.
[4] La Russa, M.F. and Qi, L.S., 2015. The new state of the art: Cas9 for gene activation andrepression. Molecular and cellular biology, 35(22), pp.3800-3809.
[5] Mardis, E.R., 2008. Next-generation DNA sequencing methods. Annu. Rev. Genomics Hum. Genet., 9, pp.387-402.
[6] Pardee, K., Green, A.A., Takahashi, M.K., Braff, D., Lambert, G., Lee, J.W., Ferrante, T., Ma, D., Donghia, N., Fan, M. and Daringer, N.M., 2016. Rapid, low-cost detection of Zika virus using programmable biomolecular components. Cell, 165(5), pp.1255-1266.
[7] Rudolph, M.M.,Vockenhuber, M.P. and Suess, B., 2013. Synthetic riboswitches for the conditional control of gene expression in Streptomyces coelicolor. Microbiology, 159(7), pp.1416-1422.
[8] Siuti, P., Yazbek, J. and Lu, T.K., 2013. Synthetic circuits integrating logic and memory in living cells. Nature biotechnology, 31(5), pp.448-452.
[9] Siegl, T., Tokovenko, B., Myronovskyi, M. and Luzhetskyy, A., 2013. Design, construction and characterisation of a synthetic promoter library for fine-tuned gene expression in actinomycetes. Metabolic engineering, 19, pp.98-106.
[10] Wang, H., La Russa, M. and Qi, L.S., 2016. CRISPR/Cas9 in genome editing and beyond. Annual review of biochemistry, 85, pp.227-264.
[11] Wang, B., Kitney, R.I., Joly, N. and Buck, M., 2011. Engineering modular and orthogonal genetic logic gates for robust digital-like synthetic biology. Nature communications, 2, p.508.
推薦閱讀:
※如何捕獲單分子?
※你一條魚,每天換新衣服遛彎,還在深海學人釣魚是怎麼回事!
※如果人是卵生,那麼人類文明會是什麼樣子?
※人患的各種疾病在某些層面上是否可以理解為人類的進化?
※脊椎動物是如何奪過節肢動物在陸地上的統治地位的?為什麼?