現代人工 DNA 合成中,最有效率的方法是什麼?

是用什麼原理呢?


沒人邀,但是答一發(從前的)老本行好了。以及有答案提到的Gibson Assembly,以及Golden Gate什麼的,這些不是DNA合成技術,這些是DNA組裝技術,不宜單純地作為『合成技術』出現在這個答案中

最有效率的方法:

200nt以下的oligo或者雙鏈DNA:固相亞磷醯胺三脂法,具體原理可見wiki Oligonucleotide synthesis。拿到幾個oligo直接退火PCR一下就好了。

kb以上級別,尤其是一次性合成數百個不同的kb級別的DNA片段(我開發的時候管這些獨立的片段叫Building Block):Oligo Microarray (oligo pool -&> 瞎幾把組裝 -&> 好多好多kb級別的DNA片段,當然其實也是從oligo開始,藉助一系列輔助設計和各種組裝技術),或者說寡核苷酸晶元/DNA晶元什麼的。成本可以達到每bp幾分錢,我以前做過幾年這個技術的開發。

## 讀者可以把『Building Block』的概念理解為一個個幾百bp到兩三kbp的『基因』,但是由於我個人對『基因』的概念特別有潔癖所以很少很少為了『理解起來省事』而這麼使用,不過大家去公司定『基因合成』服務,大伙兒其實都是用『基因』這個詞的,不管你合的是不是基因

我習慣把Oligo Microarray的方法叫做第二代合成技術,或者reverse shotgun,因為它非常像把二代DNA測序技術反過來,有非常多相同的特點:用晶元、高通量、便宜、錯誤率較一代低通量技術高、有的方案還涉及通過synthesis-by-sequencing來除錯,二代測序是把長dna打斷成短片接在晶元上擴增測序,而二代合成是把oligo種在晶元上擴增合成然後再用組裝技術裝成完整的長DNA片段(也就是每次數百上千個Building Block)。如果是合成大基因組而非kb級別之類的基因什麼的,可以在設計Building Block的時候放上介面,從而進行後續的Golden Gate或者Gibson組裝。

關於二代合成的原理,可以參考這兩篇文章 https://www.nature.com/nature/journal/v432/n7020/full/nature03151.html,https://www.nature.com/nbt/journal/v28/n12/full/nbt.1716.html

以及Kosuri和Church這個protocol Large-scale de novo DNA synthesis: technologies and applications

或者看看Church文章里的figure感受一下……

二代合成存在一些問題,比如由於是一個龐大容量的Oligo pool,什麼各種二聚體啊、CG含量啊都是問題,以及由Oligo pool拆分出幾百上千個Building Block所用的子Pool、高錯誤率導致的除錯和正確Building Block什麼的篩選,都對Oligo Pool的設計、怎麼保證一個subpool兩次pcr以後不丟oligo、後期測序驗證什麼的不管從dry-lab還是wet-lab還是實驗室的自動化能力上都有很精妙的要求。所有的困難就非常像二代測序誕生的時候:這個post-pool synthesis過程冗長,就像是二代測序開始時建庫特別麻煩;丟oligo導致building block組裝不成功、oligo丰度不均一,就像是二代測序開始時很多區域測不到、受cg含量什麼的影響嚴重;對於高重複、高雜合的序列先天不足;開始時錯誤率較高;突然對編程能力有了要求,etc。

目前能見到的將這個技術商業化的公司有Gen9和TwistBio,分別選擇了不同的技術路線,我自己做開發的時候比較接近Twist Bioscience,而Gen9選擇了除錯酶和synthesis-by-sequencing的策略。我在正確subpool的引物設計和Building Block篩選上刷了一些可以自吹自擂的花樣。更有意思的是這個技術的發明人東岸大神Church同時是兩家公司的股東……

以及我希望看到第三代合成技術,與三代測序類似,應該是長片段、未必需要高通量的合成。以前聽說MIT的某些實驗室在開發,但是貌似還沒有見到。希望能很快見到吧

不過西岸大神Venter和坐下神·Gibson(就是Gibson組裝和Golden Gate的發明神)已經把DNA合成、組裝以及塞進一個通用活細胞使其表達成病毒(啊啊啊啊啊我愛噬菌體!!)這麼一套完整的東西塞進一個黑科技機器了(http://www.nature.com/nbt/journal/v35/n7/full/nbt.3859.html),不考慮正確性的話(實際上合成病毒這種東西多點隨機性是更好玩的)可以說是可以『直接產出長鏈DNA』了。不過依然還是從短oligo開始,只是把合成組裝除錯等等步驟封裝在一起,依然不能說是三代合成技術。但是看見這個機器啊,excited!簡直比東岸大神Church家的MAGE/CAGE機器還要exciting!

總之啊夥計們,別光盯著幾十年前就有的、兩塊錢一bp的技術還覺得是『最有效率的方法』了


謝邀@袁霖 【第一次受邀答題,好!激!動!】

說到最有效率,可以說是把序列發給相應基因合成公司,讓公司幫你做了。但前提是你的實驗室比較有錢(如果序列長的話),記得上學期分子生物學的老師說,公司是按鹼基對的數目收費,做的鹼基對越多,價格也就越高。(好像是按多少到多少bp是一個價格檔次)。

正好看到賽百盛和Gene Oracle公司網站上的一個價目表,僅做參考。感覺還是蠻貴的。(還是學生,不太懂)題主說人工DNA合成,我將其理解為如何獲取目的基因(DNA)。

1.反向轉錄法。以目的基因mRNA為模板,設計上下游的引物,加入原料(dNTP),藉助反轉錄酶,依據鹼基互補配對的原則獲得cDNA,再用DNA聚合酶合成雙鏈DNA。

2.人工合成

依照某一蛋白質的氨基酸序列,或基因序列,設計全長引物,利用OVERLAP方法形成模版DNA,再利用PCR擴增的方法得到雙鏈DNA,然後將PCR產物轉化克隆至克隆載體或者表達載體中。化學合成全基因目前是準確率最高,速度最快的方法,同時可以依據密碼子在不同宿主細胞的偏愛性和不同的實驗需求,設計基因序列,提高表達水平。

@在靈在評論中補充:首先要通過化學合成的方法合成一些寡核苷酸片段,相鄰寡核苷酸片段之前包含互補的鹼基;然後通過overlap PCR,使寡核苷酸通過互補鹼基退火後結合在一起,才能擴增出目的DNA。 這是比較標準的DNA合成方法,一般公司合成大部分DNA序列的原理都是這樣。但結構複雜序列龐大的DNA,就要用其它方法合成了。

但是核苷酸一個一個接上去的方法效率不高,但目前還沒有別的特別好的辦法。總的來說,目前人工合成DNA的方法原理上都一樣,從頭合成寡核苷酸,再通過酶促反應將寡核苷酸序列連接形成完整基因序列(具體來說,可以通過設計使寡核苷酸片段有互補鹼基,利用聚合酶通過overlapPCR連接,也可以通過設計酶切位點,利用限制性內切酶和連接酶進行連接。)。合成複雜DNA的方法不能一概而論,大多需要具體問題具體分析。我舉個例子吧,一般來說酶促合成都是在體外進行的,但在合成基因組的過程中,有大量的片段需要連接,且這些片段本身往往大於20kbp,體外連接就非常困難。當時的研究組通過將這些片段轉入酵母細胞,利用酵母細胞將這些片段組裝,得到了完整的基因組。

這裡講一下 PCR擴增技術。簡單來說是對目的DNA進行大量的擴增。

聚合酶鏈式反應 PCR擴增技術(from 維基百科)

PCR反應模板的製備關於PCR反應模板製備的介紹(from丁香通)

*本人分子生物學學的也是皮毛,如有不對之處,希望大家不吝賜教。


這樓歪的。。。和啪啪啪有啥關係。。。

占坑明天補


多謝@夜神K2指正

本回答審題不清,通篇所講是assembly的技術,並非synthesis相關技術。所以,如果你只關心合成技術的話,可以不必往下看了!

原答案如下:

謝邀 @袁霖

最近真是懶癌發作,幾個受邀問題都是一拖再拖,今天決定就這個比較有意思,也比較技術型的問題簡單說一下自己的看法。

---

其實與這個領域重疊度不大,偶爾用一點相關技術而已。避免啰嗦跑了讀者,先拋出答案:我認為目前最有效的人工合成(**組裝**)DNA的方式是Gibson Assembly。(抖機靈的閃開吧)

前段時間,和師兄一起構建了一批質粒,最長的17kb的樣子,其中有10k是pcr amplify的,有初始模板,只針對個別片段或者位點做了一些突變處理。餘下將近7k是從頭合成的,沒有原始模板。用的就是這種方法。而我認為,我們的這種用法只是這一技術的最初級的使用方法而已。

簡單介紹一下這個方法,然後感興趣的童鞋可以自己去找點乾貨來讀一讀。

Gibson Assembly最初是由Daniel Gibson於2009年在J Craig Venter Institute (JCVI)發明的。其實背後的技術原理是很簡單的,和overlap pcr十分類似,但是效率更高也更準確。

你可能不知道Daniel Gibson是何方神聖,也可能不知道JVCI是個什麼樣的機構。但是,作為一個生物相關專業中人,而且還能提出這樣的問題,想必一定知道Craig Venter。此君就是那位憑一己之力叫板人類基因組計劃的大牛。和人類基因組計劃相關的那段奇聞軼事可以自己去搜索一下,蠻有意思的。

想了解Gibson Assembly牛在何處,要先從Craig Venter第二次引起舉世關注開始(咦?第一次呢?)。2010年5月末,此君在Science上發了一篇文章,題為:

Creation of a Bacterial Cell Controlled by a Chemically Synthesized Genome

此文一出,可以說引起的舉世騷動。當時各大報刊雜誌(不僅僅是那些關注技術的)幾乎都已同樣聳人聽聞的標題報道了這件事:Craig Venter創造了人造生命。Economist在Craig的文章發表當天發表了一篇題為「Artificial life, the stuff of dreams and nightmares, has arrived」的文章,我覺得這個題目很形象的體現了當時的轟動和爭議。而且,比較有意思的是,這篇文章開篇用了這樣一幅圖片:

:)

為了避免跑題,拉回到技術本身。這一技術的主旨就是通過設計一系列存在overlap的長引物,然後通過一系列外切酶、鏈接酶的作用可以最終構建成遠超目前PCR技術能夠擴增長度的DNA。上面提到的Craig的文章,主要就是通過這一技術體外合成了全基因組DNA,然後將這一基因組轉入受體細胞,從而最終得到了由全人工合成DNA操控的人造生命。這篇文章的第一作者就是Daniel Gibson.

談到如何實現這一高大上的目標,下面是技術路線:

The assembly of a synthetic M. mycoides genome in yeast. A synthetic M. mycoides

genome was assembled from 1078 overlapping DNA cassettes in three

steps. In the first step, 1080-bp cassettes (orange arrows),

produced from overlapping synthetic

oligonucleotides, were recombined in sets of 10 to produce 109 ~10-kb

assemblies (blue

arrows). These were then recombined in sets

of 10 to produce 11 ~100-kb assemblies (green arrows). In the final

stage of assembly,

these 11 fragments were recombined into the

complete genome (red circle). With the exception of two constructs that

were enzymatically

pieced together in vitro (27)

(white arrows), assemblies were carried out by in vivo homologous

recombination in yeast. Major variations from the natural

genome are shown as yellow circles. These

include four watermarked regions (WM1 to WM4), a 4-kb region that was

intentionally

deleted (94D), and elements for growth in

yeast and genome transplantation. In addition, there are 20 locations

with nucleotide

polymorphisms (asterisks). Coordinates of the

genome are relative to the first nucleotide of the natural M. mycoides sequence. The designed sequence is 1,077,947 bp. The locations of the Asc I and BssH II restriction sites are shown. Cassettes

1 and 800-810 were unnecessary and removed from the assembly strategy (11). Cassette 2 overlaps cassette 1104, and cassette 799 overlaps cassette 811.

由於懶癌未愈,就不翻中文了,把Science文章里的圖片和圖例說明直接放在這裡了。

想來寫了這些,也足夠激起關心這個點的童鞋自己去查一查讀一讀的熱情了。所以就不寫了:)。。。。。。。

PS, 純粹為了避免愛學習的小童鞋糾正我,我知道Gibson Assembly並不是真正發明於2009年,但是我懶啊,就簡單粗暴的採取了wikipedia的說法。

本文涉及到的文章: DOI:

10.1126/science.1190719


瀉藥。

主要應當是固相合成。從一個固體介質表面開始,一步步往上面連鹼基。應當能做到幾K的長度。

價格什麼的我不知道,隨便找個公司看看它們的產品報價就能知道吧。。


實操中最快的還是就目標DNA進行擴增、剪切和鏈接,設計組裝路線很重要,模板需要完整測序,這樣才不至於合成之後是悲劇。原理就是分子生物學的基本知識,不過現在工具和試劑進步了,最大拼過20kb+的片段,為了快,還使用了自製的超級感受態+NEB的鏈接酶,用了四段DNA片段拼成了一個大質粒。不過不要輕易嘗試,傳授給學生們都表示拼不出來,浪費時間和試劑。


用的固相亞磷醯胺三脂法合成。

通過脫保護,活化,耦合,氧化,蓋帽五步完成一個鹼基,然後重複這五步,直到鹼基一個一個被接上去為止。


一個個鹼基往上加,DNA越長,效率越低


啪啪啪?


謝邀。

人工DNA合成,據我所知有2種。一是PCR,一段引物退火到模板上之後,從引物的3』末端開始延伸,合成原理就是AT,GC配對。合成長度相對較廣,從幾十bp到kb級別,上限是幾十kb。

二是引物合成,從DNA的3『末端開始,向5』端一個鹼基一個鹼基加上去,和PCR的方向是相反的。引物的合成一般是公司來做的,但是序列長度有限制,大多數公司可以合成60nt以下的oligo,質量也還可以,大於60nt的就有難度,質量和純度都會受到影響。

這2種方法,算不上哪個更有效率,看你的需要了。


目前IDT可以合成60-200bp的ultramer(比較穩定),也提供200-2000bp的megamer(很慢,價格比較高)。

注意這篇文章,來自Venter和Gibson。

Digital-to-biological converter for on-demand production of biologics

在Oligo技術成熟的情況下,結合一些自動化方法,以後大規模列印DNA不是夢

根據我個人需求,如果成本低於0.1USD/bp; 速度高於2000bp/day,就可以代替克隆了。(當然正確率也要有保證)


pcr


推薦閱讀:

植物的耐寒性是由什麼決定的?
什麼是「 ATAC-seq 技術」?現在用於哪些生物學研究?
在基因結構中,蛋白質編碼DNA被分成多個外顯子,可能有什麼好處?
我們離合成人還有多遠?
如何看待張鋒的Cell重大突破:基因編輯家族「新神器」——CRISPR/Cpf1?

TAG:脫氧核糖核酸DNA | 分子生物學 | 合成生物學 |