【觀點】從傳統到構造——淺談合成生物學的功能與研究範式

(首發於微信公眾號:藍晶實驗室BluephaLab【觀點】從傳統到構造——淺談合成生物學的功能與研究範式,有部分改動 )

作者簡介:郭昊天,2013年復旦大學iGEM隊長,2012年復旦iGEM_D隊員,巴黎交叉科學院博士在讀(巴黎第五大學)

2013年我帶領復旦iGEM本科生團隊,陰差陽錯獲得了研究生組的亞洲區World Championship,當時我不禁想起兩句詩(誤)。無心插柳十之八九,從高中到大學,我接受的都是傳統的生物學訓練,本科論文也是細胞生物學方向,最後怎麼就做合成生物學了呢?合成生物學的發展帶來的不僅僅是一種思維變革,也是對已有的生物學研究必不可少的補充,這也是我對它充滿希冀與熱忱的原因所在。自2011年參加iGEM的這5年,我常常感慨於傳統學科與合成生物學之間巨大的思維差異。今天我想與大家分享一些陽春白雪的形而上,並謹以此文談一談我眼中在生物學發展的大背景中合成生物學的功能與價值,最後再立一些flag,淺談未來的發展方向。

2013 iGEM Jamboree (photo from iGEM website)

1. 如何定義合成生物學?

首先要討論的一個問題是——什麼是合成生物學?每每與年輕的新iGEMer交流的時候,我都難免會被問到這個問題,然而合成生物學的定義本身卻並不那麼清晰,甚至還頗具爭議。絕大多數傳統學科的定義方式都是簡單明快地面向對象的——「XX學是一門研究X的學科」。但是用研究客體難以定義合成生物學。基因工程、代謝工程、基因組學等學科與合成生物學的研究對象有大量重疊。在iGEM比賽中尤為顯著,我們常評價一個項目「不是」合成生物學,有時候卻只需在原有數據的基礎上改變分析和詮釋方法,合成生物學的「味兒」就有了,可見一斑。

合成生物學是以研究「範式」即方法論進行劃分的。早至1974年,對於合成生物學與其他學科的差異,遺傳學家Wac?aw Szybalski就有了初步的描述:「直至現在,我們的工作仍處於分子生物學的描述性階段……真正的挑戰始於我們進入一個生物學領域的「合成」階段。我們將發展全新的控制元件,在基因組中增加新的模塊,甚至建造一整個全新的基因組……建造『新的更優的控制線路』【1】……最終建造其他『合成的』有機體,比如一個『新的更優的老鼠』」。這一描述當下看來依舊具有十足的現代感,初入門徑者足以領會到一絲合成生物學的精神。Waclaw也很好地預言了現如今主要的三個研究方向,一是構建類似於電子線路的生物分子線路(比如邏輯門、模擬線路、生物存儲等等),包括iGEM比賽在內的很多合成生物學研究都圍繞這一模式展開;二是理性設計代謝途徑,比如酵母合成青蒿酸和嗎啡的兩項工作;三是基因(組)的人工合成,比如最小基因組設計,酵母染色體全合成項目Sc2.0,以及最近完成的細菌基因組密碼子兼并後的重編碼。一些前沿方向也開始涉及以合成的生物分子線路重編碼有機體發育過程,最終目標也許就是實現「人創」的生命個體。可見,Waclaw的理解是符合邏輯與現實發展規律的。但Waclaw的這個論述還是有些不盡人意。首先所謂傳統學科如分子生物學也並非那般「不堪」。其次,隨著遺傳學尤其是反向遺傳學的發展,預言中諸如「基因組中插入新的模塊」這樣的工作,在轉基因時代就已被實現,卻並沒有被認為是合成生物學的開端。歸根結底,還是究竟什麼是「合成」,這個概念的闡述不夠清晰,總有些只可意會不可言傳的意味在其中。

J. D. Watson and Wac?aw Szybalski in IBB PAN in Warsaw(Author: Stako)

2. 隔壁學科的研究範式與合成生物學應承擔的功能與價值

既然合成生物學與其他學科的差異是研究範式的差別,我們不妨看一看其他學科的研究範式,討論合成生物學在生物學發展的大背景中應該充當什麼角色,發揮怎樣的功能,則可以順理成章地詮釋合成生物學的研究範式是如何的了。

生物學的目標是理解生命系統的結構、功能以及發展的規律,並在現實世界進行應用,一言以蔽之,生物學最終要回答這樣一個問題——「生命是什麼」。

除合成生物學之外已有的生物學下的分支學科,主體仍是描述性的,這也是學科發展的第一步。進一步,我們試圖分析生命系統內的相互作用與因果關係,比如遺傳分析、蛋白互作分析。生物學的研究主體也再不斷進步,從粗放的定性描述與建立因果鏈,轉變為精細的、定量的描述與系統動態的分析。這些工作為我們理解生命本質提供第一手材料,但距離回答終極話題「生命是什麼」還尚遠。我們仍需透過現象尋找本質,以簡明的基本「定律」統一紛繁複雜的生命現象。理論模型的研究如今大多歸於系統生物學,不過回溯歷史,在更早的時候就已顯現於許多基本學科中。普適定律的提出,無外乎基於三種推理方法——歸納(inductive)、演繹(deductive)與溯源(adductive)。大多數是歸納與溯源結合,由一系列特殊事件歸納出一個普遍規律並直接抽象出模型,或追溯猜想出一個最簡單可能的理論模型。如孟德爾和摩爾根的遺傳定律,圖靈斑、Hodgkin–Huxley的動作電位模型都屬於這一研究方法,較近的經典案例有Uri Alon的調控網路motif研究。另一些極早期的理論模型則是純粹的演繹推理:自人口論(1798)及Logistics方程(1838)以降,理論生態學衍生了極豐富而可靠的數學體系以解釋種群動態;生物化學誕生之初,就有了Michaelis–Menten方程(1903-1913)描述酶促反應動力學,沿用至今一百年不動搖;遺傳學中的Hardy-Weinberg平衡(1908)的提出則是以孟德爾遺傳為假設,對理想群體的演繹結果。今天的系統生物學,就是在系統論、控制論等的加成之下綜合使用三種方法揭示生命設計原理。

三種推理方法只能提出規律,卻不能實現最後一步「證實/證偽普適定律」。對於特定系統的規律證明衍生了兩種方法論,一是如遺傳分析,由表及裡(top-down),將系統視為黑箱,對其擾動觀測,以驗證預測模型;二是如生化分析,自下而上的(bottom-up),將待研究組分純化、重建,直接驗證功能性質。而對普適定律,Top-down方法因為我們對黑箱的無知,難以證明普適性,只可以用來證偽定律。因此我們只好正面硬剛,用bottom-up的方法給出生命設計原理的構造性證明,也就是合成生物學家經常引用的「What I cannot create, I do notnunderstand」,而這正是我認為合成生物學所承擔的功能。合成生物學的開端恰恰就是用最簡單的構造性證明,展示這一研究範式的可行性:相互抑制的兩個分子可以形成雙穩態並實現記憶儲存,好的,我們就構建一個扳鍵開關出來;三分子的抑制環可以實現周期振蕩,那就製作一個振蕩器吧。

相互抑制拓撲結構的模型十分經典,通過調整參數,可以實現雙穩態、振蕩器等動力學特徵變化,這如今被用於描述幹細胞的分化命運控制機制。合成生物學中的動力學模型來自經典分子生物學研究,經過獨立發展之後又被用以解釋生物細胞原有的現象或機制,這是合成生物學成果在基礎研究領域運用的常見模式。(編者)(Figure from Chikara Furusawa and Kunihiko Kaneko, A Dynamical-Systems View of Stem Cell Biology, [J] Science, 338, 215 (2012))

在合成生物學的烏托邦里,如果一個定律普適為真,那麼我們就可以在其指導下任意構建生命體系。在實現這一理想的過程中開發的技術、方法、思想都可視為合成生物學基礎。以這些理論、技術成果推動的新應用(New applications)則是合成生物學轉化實踐的成果。

最初的困境至此也有了解答。對於相同的研究客體,如近年火熱的CRISPR領域,一些專註於CRISPR本身的性質,一些開發CRISPR用以構建更複雜的系統,一些以合成生物學的已有方法推動CRISPR改造,其實分屬於傳統領域與合成生物學的範疇。

3.「古典」合成生物學之殤

合成生物學的最終目標是可以在理性設計指導下構造任意的生物系統實現指定的功能,現階段我們顯然尚不具有這樣的能力,因此必要提出一個具體的解決方案。最先流行的範式是機械與電子工程的,尤其是標準化和模塊化思想,這也是合成生物學早期以及iGEM所提倡的概念。工程學研究怎樣從零部件構建複雜系統,核心思想就是標準化,標準件可以最大化每個元件的通用性和可重複性,所有機械零部件都有明確標準的結構尺寸以及穩定性能;合成生物學也希望能夠製作生物標準元件,並在此基礎上構建生物線路。這種「古典」的還原論觀點有著美好願景:組裝複雜系統只需要了解他的零部件。標準化思想擁有的另一個巨大優勢是一個複雜系統的設計可以簡化為若干功能模塊之間的拼接,可以極大地降低「遺傳機器」的設計成本,並實現設計的自動化。

合成生物學在實際操作中面臨各種瓶頸,主要源自人們面對複雜系統缺乏足夠強大的認知手段和描述方法(編者)

但是古典範式已經遭遇了它的瓶頸,根源在於生物標準件思想本身是早熟的。在機械工程中,所有的元器件有著成熟精確的理論刻畫,比如經典力學和電動力學,而在生物學中,對於基本元件的功能描述並沒有足夠的理論。另一個標準化思想所需的前提假設也往往被忽視——元件的集總性,即所有的物理化學過程發生在元件內部,一個元件的參數、性質、特徵可以抽象於一點。從基因的到網路motif,很多生物學工作用抽象和粗粒化的方法降低系統複雜度,以切中肯綮,然而這並不能支持生物元件的抽象概念本身是合理的。在電子線路中,元件的電磁效應在元件外迅速地衰減,從而可以近似為集總元件;而生物體系像是一鍋燥熱的麵條湯,雖然具有自組織的時空結構,大多數分子間卻可能有非特異的、弱的相互作用,同一分子上的各個組分也並非涇渭分明,("When we try to pick outnanything by itself we find it hitched to everything else in the Universe")。差的集總性,一方面使得我們難以劃定元件的邊界(如啟動子),從而難以設計標準介面與規格;另一方面,無法保證標準件的性能穩定與一致性,即可重複性,在不同使用條件下具有相同的功能。只有元件具有穩定性能時,我們才有可能通過有限測量充分了解元件的性質,否則工程學的解決方案就無法實現。

「生物體系像是一鍋燥熱的麵條湯,雖然具有自組織的時空結構,大多數分子間卻可能有非特異的、弱的相互作用。」

可重複性現如今是合成生物學的一個主要難關,研究者們開發了很多絕緣子元件、發明了一些奇技淫巧,以解除生物元件與遺傳背景和相鄰元件之間的偶聯。可合成生物學元件與機械元件還是有著天壤之別。在遺傳線路的自動化設計與建構的一系列嘗試中,我們可以發現在較複雜的線路中,即使針對系統的特異預測,也常常由於遺傳背景與元件間非特異作用,與實驗結果大相徑庭,而隨著系統的複雜度提高這一現象愈加顯著。不少研究者也因此逐漸從機械論的觀點中轉向尋求新的範式。

4. 一點展望:現在的與未來的合成生物學

現有的一些合成生物學研究中有一些研究與調控系統無關,故而沒有追隨機械工程學的範式。一個著名的例子就是支原體辛西婭及其升級版的構建,其目的只是為了證明:1.細胞是可以化學合成的;2.存在一個最小的細胞基因組。一些研究中則借用了計算機科學的概念,如利用DNA進行信息的數字存儲。化學工程的研究方法在一些代謝網路設計、生物分子設計中也被廣泛借鑒。可見,除了標準化和模塊化的思想,仍有很多新的元素已經被引用進合成生物學。

早熟的生物標準件思想承受了早衰的代價,但同時我們還要認識到,在工程學的格局中,標準件的提出有著非常久遠的歷史,早不是新潮事物。因此合成生物學也要接受新鮮事物,不斷修正革新對於生命體系的理解,以提出更可靠的研究範式;另一方面我們也可嘗試開創全新的、最適於生命系統的研究範式。生命系統中,精確的調控與普遍的熱雜訊矛盾而統一,分子隨機遊走也可能形成自組織結構,邊界不斷生長,細胞不斷分裂,基因組不斷突變演化,這一切,都是合成生物學發展中所要面臨的挑戰,同時也可能是提出新範式的出發點。

關於系統構建與設計,我最後想做一些「民科式的」大膽構思。或許我們可以實現不基於元件進行自動設計,而是給出逐個鹼基的優化方案,並給出相應最優的DNA合成方案。這樣一個自動設計程序,將拋棄元件的抽象概念,而是基於程序與實驗互動式的機器學習的結果:計算機程序給出設計與預測,實驗室自動化平台構建系統並測量,通過不斷試錯修正優化程序的內部結構和參數(也許還可以通過眾包平台使城市科學家參與進來優化程序的學習進程)。而這一程序也許是神經網路的,也許是基於新的演算法。最初的嘗試可以專註於某些特定的生物系統,比如信號轉導通路的從頭設計?至於是否能成功,也不妨拭目以待。

(圖文編輯:Yang Liu Corbicula)


推薦閱讀:

給嬰兒注射一種「美德」基因,讓人天生嚮往美德並身體力行,建立美好社會,是否可行,有無違反人道,為什麼?
為什麼還沒有咬人不癢的蚊子?
《星際迷航》中Spock的嘴唇為何是粉色?
華人學者劉澎濤在《自然》發表幹細胞重要成果 | 前沿
皮皮蝦真這麼強?

TAG:合成生物学 | 生物学 |