如果只把有用的基因拼接起來，會變成什麼樣？

11-16

本題已收錄進知乎圓桌 ? 基因解碼，歡迎關注討論。

2016年3月26日更。
Venter在最新一期的SCIENCE發表文章：

Design and synthesis of a minimal bacterial genome
給這個跨越八年的課題划上了一個句號：531 kb，473個基因。

==========
這是一個很有趣的問題，要回答這個問題不得不提一個人，他叫Craig Venter。

Craig Venter是全基因組鳥槍法測序的提出者，當年在人類基因組計劃中憑藉自己一家公司和全世界主要國家政府開展測序比賽，最後逼迫各國政府不得不採用他的方法，並和他合作以保證人類基因組序列不會被公司申請到專利。沒有他，人類基因組估計現在還沒測完，基因組學研究可能會推遲10年以上。

好了，2001年人類基因組測序完成。這十幾年來，當年叱吒風雲基因組學領域的科學家兼商人Venter他退休了嗎？沒有，他之後一直在研究題主提的問題！他把研究對象換成了支原體（Mycoplasma genitalium），因為支原體是自然界能獨立生活的基因組最小的生物。他們希望能夠進一步縮小支原體的基因組，從而得到一個能夠在自然界獨立生活的最小基因組（The MinimumGenome ）。

首先他們嘗試逐個敲除支原體基因組的基因間區，和一些非關鍵基因。發現有時候支原體還能活，有時候就死了。這種逐個敲除的方法效率很低。然後Venter等人嘗試了更為激進的方法：重頭合成。他們打算這麼做：每當在野生型支原體里敲除以後導致支原體死亡的基因或者基因間區片段都會被記錄下來，然後把所有重要的基因或者別的什麼必須的片段拼起來，讓這個人工合成的DNA大分子來驅動一個支原體，如果能活，那這就是一個最小基因組。
基因敲除什麼的都是小case，這個方法最難的有兩個地方。1. 支原體基因組少說也有583kb，怎麼合成？2. 更難的是就算你合成了一個583kb的超級長的DNA，你怎麼用它來驅動一個活生生的生物？

Venter還真做到了。

這是2008年2月底Science的研究文章（Research Article），解決了第一個問題。
http://www.ncbi.nlm.nih.gov/pubmed/18218864
題目為Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome（支原體基因組的完全化學合成、組裝與克隆）。聽名字就很霸氣吧。
具體方法並不難，很野蠻哦：PCR產生5~6kb的片段，按照順序利用同源重組的原理兩兩逐級連接起來，其中每一級合成的新片段都會先連接入載體，編號並儲存起來，等到下一級合成的時候再從載體上切下來。為了證明這個基因組是完全從單鹼基合成的，他們每隔一段距離就會加上一段特有的序列作為水印。

兩年之後，2010年7月初，同樣是Science的研究文章，解決了第二個問題。
http://www.ncbi.nlm.nih.gov/pubmed/20488990
題目為Creation of a bacterial cell controlled by a chemically synthesized genome (為化學合成的基因組創造一個原核細胞)。 .
當然現代科學還沒有先進到可以人工合成細胞。他們大概是這樣做的：首先將完整的人工合成的並且帶有抗菌素抗性的支原體基因組轉化入自然的支原體里，得到一個二倍體。然後將二倍體放在含有抗菌素的培養基上培養，讓其分裂。由於自然的支原體不帶抗性，最後能夠生長的支原體就帶有了人工合成的基因組。就這樣，鳩佔鵲巢，人工合成的基因組繼承了自然的細胞。

距離最小基因組還剩最後一步，那就是把篩選得到的生存必須的基因或者必須的未知功能的序列加到我們的列表裡面，每次更新列表就試著合成一個不完整的基因組並讓它去主宰（host）一個細胞。什麼時候這樣一個細胞活下來了，答案就得到了。這個過程我相信已經沒有技術障礙了，只是工作量會很大，因為每次都要重複之前兩步近十年的工作。

總之讓我們拭目以待吧。

具體會變成什麼，真的不清楚。

只是說「垃圾」DNA的部分不能說是真正的垃圾，包括intron ， 3" UTR ， 5"UTR都是有調控作用的。我們的每一個細胞都含有同樣的信息載體，DNA。但是在同一個生物體內，細胞在不同的地方不同的時間，表達的蛋白質都不同，從而達到細胞的分化以及完成不同的使命。那細胞到底是如何完成這樣的調控，做到那些的呢？就是每一個基因的上游都有一大段調控區間，也就是所謂的「垃圾」區段。

細胞有很多的調控蛋白，那些調控蛋白同樣也是受到更上一層蛋白的調控來表達的。算到最初，有可能是外界隱私的干擾來表達最初的調控蛋白，如此一環接一環。

調控蛋白與基因調控區間之間的辨認是非常specific的。（生物過程每一個都是非常specific的么）。基因調控序列中，DNA的大溝部分可以露出序列specific的氫鍵。調控蛋白可以通過其表面上的電荷或者其表面上構成氫鍵的能力與基因調控區間（垃圾區段）的DNA大溝表露的特殊的氫鍵互補，從而特殊的調控蛋白可以辨認出特殊的調控區間。有一些調控蛋白可以直接控制基因表達的開啟或者抑制。然而在真核細胞中，調控的實現是通過：第一層調控蛋白引來第二個，第三個。有一些基因的調控區間可以有上百個不同的蛋白來控制，一環套一環。最終達到不同基因在不同的時候以不同的方式表達的複雜效果。

對於原核細胞來說，這一區段相對較短，包括promoter和operator。promoter是啟動基因表達的調控蛋白結合的DNA區間，operator是抑制基因表達的蛋白可以辨認的DNA區間。對於原核細胞，基因表達的調控就簡單很多，就這兩個期間嘛，不同的組合，不同的表達效果。

但是對於真核細胞來說，這一段調控區間就會很長很長。一個基因可以由好多個調控區間一同控制，而每一個調控區間也是有多到上百個不同調控蛋白來控制。不同的組合，不同的效果。除了不同組合直接達到開啟和抑制基因表達的效果外，有一些調控區間通過引來一些特殊的調控蛋白，那些調控蛋白不是直接控制基因表達的開關，而是控制染色質和染色體之間的互變。成為結構嚴密的染色體，基因就沒有辦法表達，而染色體打開了，變成了鬆散的染色質，那基因序列可以表達了。

因為比起簡單的表達，對於生物體來說，調控是更重要的。這也是為什麼生物DNA中除了表達蛋白的exon的部分以外還有那麼多的「junk」啊。所以去掉那些，沒有調控，最後應該是什麼都的不到吧（猜的）。

「基因」是什麼本身就是一個很頭疼的問題，「有用」是什麼本身又是一個很頭疼的問題

即便我們把所有與轉錄、翻譯相關的元件（從啟動子到終止子，再加上所有反式調控元件什麼的甚至我們懷疑有特定作用但不知道有什麼作用的序列）都算作「有用的基因」，刪去其餘序列還是會有很大問題。至少我們確信，那些「垃圾」序列是有做「必須序列」緩衝的作用的。

以釀酒酵母為例，酵母有6000多個基因，其中只有不足2000個是「必須基因」，即（在現有研究範圍內）無論如何也不能被刪去的基因。而必須基因和非必須基因在整個基因組中是均勻分布的，並不會出現很重要的基因高度富集的情況。這就保證了在基因組在一個區域發生結構變異時，必須基因不會因為「擠在一起」而發生大規模的崩壞，使物種進入滅絕漩渦。

高等生物中「垃圾序列」比例很高的道理也是一樣的，一方面裡面含有各種各樣的不為我們所熟知的調控元件，另一方面，他們的存在也可視為「遺傳穩定性元件」，即便其存在的序列信息可能並不如「有用的基因」那麼重要，但他們的長短、分布對整個基因組的穩定，依然起著重要的作用。

SC #2.0課題（SC是釀酒酵母拉丁名的首字母）旨在通過人工合成釀酒酵母的全基因組，並在非必須基因兩翼加上synLoxP/CRE同源重組位點，來實現釀酒酵母的人工隨機進化。但可以想見的是，在自然選擇中進化的基因組，其在多變的環境下的適應性和魯棒性，必然會好於人工刪改的基因組。

謝邀

先大概講一下基因組的結構吧，簡單點說就是基因區和基因間區。
開始基因區的定義為轉錄成mRNA的那部分，也就是exon，包括UTR和CDS，但現在普遍把intron和上下游區域也算進基因了，一般是上游5K和下游2K，因為這裡有調控區域（啟動子和增強子），也有的把rRNA、tRNA等非編碼RNA算做基因。
基因區搞清楚了，剩下的就是基因間區了，這部分我了解的不多，大概就是一些重複序列，非編碼RNA等，也是對基因的表達有調控作用的，研究的多的有微衛星和microRNA等，可以說這部分幾乎是人類目前知識的盲區。

我想你說的「垃圾基因」可能是指的基因間區吧（如果把UTR、intron和上下游當成垃圾那隻能說太外行了，因為這部分的機制都已經有了初步的定論，一個位點的突變都很可能導致整個基因失活）。至於基因間區中，有很多種類的非編碼RNA也已經在研究中了，比較多的是snRNA、snoRNA和microRNA，這些RNA的功能基本已經有了定論（rRNA和tRNA更不用說了，當然這兩個經常被算做基因）。另外還有很多功能未知的RNA，分子一般都很小，在基因組中拷貝數很多，雖然現在戲稱是垃圾基因，但沒準哪天一篇cell就報道XXRNA分子可能有XX功能。

生命從最簡單的病毒、細菌進化到人類，基因組越來越龐大複雜，肯定不是偶然的，每一種進化出來的特殊結構都應該有其各自的作用。其實越複雜的生命體並不一定是表達的蛋白多，而是調控機制複雜，人的基因組中編碼蛋白的序列只有1%，前前後後都算上也就3%，而細菌中可能90%多都是編碼蛋白的DNA，為啥？就是因為細菌太簡單了，不需要太多的調控，反正能翻譯蛋白就翻譯，複雜點的就來個類似乳糖操縱子這種；而人不一樣，不同組織甚至不同細胞翻譯的蛋白種類都不一樣，表達的量也不一樣，如果和細菌一樣基本不調控了，什麼基因都表達，那你整個人就只有一種細胞，就成一個肉球了。

最後，我個人認為，即使你把所有有功能的DNA都堆到一起，肯定也不會正常，因為生命過程從微觀上看本質上都是化學反應，化學反應是需要適當的空間的，一個反應很可能因為「體位」不好就影響了反應效率甚至根本就反應不下去了，而DNA分子間過於擁擠必然會有影響，要知道，一個分子表達少一點，整個人可能就有某項缺陷甚至根本不能存活。

最後的最後，舉一個實際的例子，唐氏綜合征，也就是21三體，大家應該都聽說過，這種小孩的21號染色體有3條，按照你問題中所有有用的拼一起就能正常的話，那這種小孩就是超人了，因為他不僅所有有用的基因都有，而且還比正常人多了一條染色體，但實際上這種小孩有智力障礙生長障礙等各種畸形，類似的還有13三體和18三體，百度上的圖片都慘不忍睹。

知乎上有大量的垃圾問題垃圾回答垃圾評論，比如本句話，但是都刪掉的話知乎就沉沒了
理論上如果我們完全掌握遺傳學原理，就能像高端碼農一樣用盡量少的基因序列構造盡量複雜的生命體，也就是設計一套位元組數極少卻內涵極豐富的演算法，而不論我們設計的演算法多精簡多有內涵，總會有更好的方案可以開發，所以那些說相信100%有用的言論和要砍掉所有冗餘部分的想法一樣幼稚
不光是基因組，人類中也有大量幾乎不參與社會活動的各種邊緣人，蟻群蜂群也有混日子蹭飯的，元素表中也有幾個貌似沒啥作用的元素，這種無用伴隨有用的情況在各個系統中都普遍存在
蟻群總會保持三成左右的工蟻進行無固定目的探索閑逛，你們該懂這對於蟻群的潛在重大價值
靜態的看，完美主義者必然會想要去除那些冗餘的部分，但是進化是個動態排列組合的過程，是先擲骰子，再從擲出的結果看適應性，你生個孩子不會想到ta最終有多大用，哪怕後來反人類反社會你還是會生的。所有的冗餘數列即便被證實在靜態階段不參與系統運作，也代表了為了進化所作的可能性儲備，而那些有用的基因並不意味著永遠有用，隨著適應性變化，也可能成為冗餘甚至有害基因
越簡單的物種冗餘越少，因為冗餘會明顯增加成本降低效率從而被淘汰，而越複雜的物種越需要冗餘，如果冗餘不足，則roll點會明顯少，進一步開發新適應性的機會就少，容易淘汰。從經濟學角度說，是扔多少個雞蛋到多少別的籃子里最安全的問題。專精伐木一萬年，總有一天被伐木機擠下崗
冗餘所佔比例的大小並不與物種複雜度嚴格成正比，這也是roll點出來的結果，很多兩棲類和幾種原始魚類的冗餘都超多，細胞核超大跟戴了巨型美瞳一般，不要以為人類的23對染色體是最多的
如果我們要設計一種已知可控的程序或物種，當然是冗餘越少越穩定環保性價比高，但要保持可持續發展，就必然要摻入部分資源做風險投資，就好像民主程序中總會出現一些怎麼看都是腦殘的傢伙，但是沒有民主程序社會就無法循環演進了
要使得冗餘變得不必要，必須從根本上提升生物學進化的演算法，從隨機roll點轉變到模擬設計
隨著人工進化研究的推進，通過生物信息學模擬，我們可以預知基因運行的實際效果，不需要以roll點的方式進行低效的生物學進化，就可以在設計生物時適當去除一些冗餘。在擺脫了性繁殖這種不穩定遺傳變異的高耗能低產出進化方式後，顯然生物學會更像IT業，大批的基因碼農（等一下，那時候應該有更多的AI碼農了吧？）從事設計測試基因組的工作，從而誕生基因序列更加精練有內涵的更複雜的物種

我記得之前的問題是有關junk基因的。這個概念由於過時受到了很多人的吐槽。經過知友修改，問題變成了「如果只把有用的基因拼接起來，會變成什麼樣？」這樣的問題就和之前完全不同，變成一個可以討論的問題。

首先定義「有用」的概念。我個人認為，由於「存在即合理」，事實上所有的DNA序列都在一定程度上是有用的。不夠完美的基因結構在漫長的進化過程中會被丟失和突變掉。因為本身細胞核並不是一個完全安全的環境，即使有很多負責維護基因組穩定性和調節細胞內氧還穩態的酶，由於各種外界因素和脅迫，基因斷裂和丟失的情況時有發生。線粒體和葉綠體內共生現象中出現的基因遷移就是一個基因組變化狀態的例子。當今細胞內線粒體和葉綠體本身的基因組大小僅相當於其自由生活祖先的5%，其他95%的都轉移至宿主基因組中。其中原理還並不是很清楚（可能也是我還沒有讀到），不過線粒體和葉綠體中過於活躍的電子傳遞鏈及ROS本身很容易引發基因組不穩定及突變。所以從進化的意義上說，唯有具有價值的基因有被宿主保留的需求。不然早就在各種外界脅迫的影響下丟失了。

然而在個體水平上，基因確實「有用」和「無用」的區別。有一些基因可能在這個生物的一生中也不會有機會被表達。在進行基因功能研究我們經常會遇到這樣的情況，即敲除了某個基因後沒有顯示出表型。其中原因之一可能是該基因只在在特定條件下表達，如受到高溫乾旱紫外等等條件的脅迫。第二個原因可能是基因組中普遍存在的基因冗餘現象，即該基因是多拷貝或者有可以被其他基因功能互補。基因冗餘現象的意義就在於在某重要生命過程中，即使該基因遭遇突變，個體依舊能夠生存下去。核糖體基因就是典型的高拷貝（eg. 人類染色體上有300-400個核糖體rRNA基因的拷貝），因為蛋白質翻譯這個過程的重要性我大概已經不需要詳述。所以在有限時間內去掉一些基因組中的冗餘或條件型表達的基因（非看家基因），確實不會對生物本身的生存造成很大的影響。

其實除開 @徐志超回答中文特爾對人造基因組的嘗試外，實驗室中本身採用的很多菌株和細胞系在非人為的情況下也在一點點的縮小了。實驗室中穩定的培養環境使得其很難再接觸脅迫（除非你本身就是研究脅迫的哈,,???,,）這些株系在長期穩定的培養過程中那些相應乾旱，強光，病原體等等的基因由於束之高閣，沒有在實驗室內的的選擇過程中保留下來。比如Weber等人就發現經過1620代的實驗室培養後線蟲的14個基因突變成了假基因[1]。此外酵母作為一種歷史悠久的模式生物，在實驗室培養過程中也出現了水孔蛋白在內的大量基因功能喪失[2, 3]。然而這些生物的繁殖和營養代謝有關基因都發生了進化和拷貝增加的情況(生長條件好了就把注意力轉向繁殖下一代了(￣▽￣))。

所以從這個意義上說，其實文特爾篩選出來的並不是廣泛意義的「最小基因組」，而是實驗室培養條件下所僅供存活所需的最少基因組合。如果把他們改造後的支原體放到自然環境中，應該也是不能存活的。

所以對於開始這個問題，其實已經成了自問自答。「如果只把有用的基因拼接起來，會變成什麼樣？」如果在這裡把基因用現在的廣義定義（包括非翻譯的基因和調節序列）理解的話，那麼這個生物當然是活的好好的了。當然如果操作不嚴謹，沒有把所謂的所有「有用」基因連上，這個生物可能就只有一個結果: 死翹翹。

reference：

1. Weber, K.P., et al., Whole Genome Sequencing Highlights Genetic
Changes Associated with Laboratory Domestication of C. elegans. PLOS ONE,
2010. 5(11): p. e13922.

2. Bonhivers,
M., et al., Aquaporins in Saccharomyces.
Genetic and functional distinctions between laboratory and wild-type strains.
Journal of Biological Chemistry, 1998. 273(42):
p. 27565-27572.

3. Carreto,
L., et al., Comparative genomics of wild
type yeast strains unveils important genome diversity. BMC Genomics, 2008. 9: p. 524.

酵母發來賀電。

按照上圖（Alexander et. al. 2010 Nat Rev Genet）的趨勢來看，越是高等的生物，編碼區（Exonic）在基因組裡所佔的比重越低。比如，在酵母里Exonic佔72.9%，而在人類里這個比例是2.8%。非編碼區（"Junk" DNA）可能跟高等機體，因應對複雜環境變化，所需要精確調控基因表達有關。

以前看過一個討論寫代碼的帖子，很多代碼很繁雜看起來又沒有用，任何一個接手代碼的新寫手都想把這推翻重寫，他看不明白這多達三四頁的無用代碼是幹嘛的。但重寫代碼重新絕對不是一個好點子，很多軟體公司就是這樣失去了原來寶貴的積累。你不知道的那三頁代碼是為了解決某個硬體版本藍屏BUG的，你看起來亂無頭緒的另一團卻是解決第三代軟體安裝時無限重啟的。這些問題都是幾代代碼工程師從一個個小問題中抽離解決，花了多少個不眠的日日夜夜一字一字敲上去的，所以才有了如此看起來複雜不堪卻實用的代碼。
回到題目，up主的問題和推翻代碼重寫完全就是一個意思。你覺得這一段基因沒用，可能這是在父母患A病時激活免疫的；這另一段冗長無用的基因呢，是為了避免你在海水裡接觸到某種物質起皮疹的，甚至那最不起眼的無用基因，是能提高你在極寒條件下的耐受度。這些情況，不是你不會碰到，別人就不會碰到。
別以為你重新編寫了基因那麼就會更好，那樣只會有更多的BUG，自然已經在幾十億年逐步修正了這些漏洞，你卻要拋棄，果斷只是沒有普遍性的早夭產物罷了。

真核生物多半是沒法存活的，真核生物基因中存在enhancer，通過複雜的三維結構隔著很遠調控基因。刪掉沒用的基因變破壞了三維結構，因此存活的可能性不大。原核還是有可能正常生存的，不過，還是要看具體的實驗結果。

問題是你根本無法定義什麼是「有用」和「無用」啊……

哥，就算咱們不提非編碼RNA、各種詭異的基於染色體構象和3D結構的調控序列，你把最基本的啟動子置於何處？

我認為基因組100%都是有用的，只是現在那些被認為沒用的還沒發現具體功能而已。推薦一篇文章：Landscape of transcription in human cells.

How would you define "有用"
或許哪一天基因組學會告訴你所有的genome都很有用

病毒就是只有編碼區段的。

進化是相當保守的過程。即便是垃圾也沒有完全清除的必要，而且這些片段不一定要表達，可能只是承擔維持結構穩定的作用。轉錄的過程中也涉及到DNA雙鏈打開的過程，基因過於密集也不利於維持穩定。

以上答案純屬臆測，沒有找到文獻支持這樣的想法。。。

關鍵是，百年之內也許人們都搞不清楚，哪些是有用的基因。

不知道你玩過《孢子》這個遊戲沒，我想這個遊戲核心就是「去其糟粕取其精華」的進化吧。
如果真把所有有用的基因拼接起來，我想我們就是這樣吧，差不多，我當時玩的時候拼的奇葩生物多了去了，，23333

偽控制——DNA去中心論

1.根據我們的認識，每個人都與任何他人不同。所以世界上有70億人，就有70億種人。

2.人體共約有40萬億--60萬億個億的細胞，這些細胞被科學家分為200種、400種、800種等不同的類型，但是我認為他們是40萬億--60萬億種。它們彼此之間的分子結構和具體功能差異很大。

3.人體的細胞是如此複雜精密，但是，我推測，它不具備一個真正的總控制中心！

4.DNA根本不是控制中心。

5.進一步說，細胞根本沒有控制中心。

6.DNA的每一部分，負責對應一種環境，發生相應的變化。

5.細胞內的蛋白質亦是如此，細胞膜亦是如此，核糖體亦是如此。

6.遇到A情況如何處理？

遇到B情況如何處理？

遇到C情況又當如何？

7.細胞的每一部分都是自主的，絕不受制受控於其他部位。

8.曾經有科學家就提出DNA是傀儡，起重要作用的是組蛋白，是組蛋白「挾天子以令諸侯」。

9.不管是DNA本身、還是周圍的組蛋白，其思維亦未解脫開「控制論」。

10.我的思想是：由於進化過程中億萬年殘酷的淘汰，如今的細胞早已是各部分「絕對自主」，各有各自成體系的運轉機制，按自己的「邏輯」與周圍的環境發生「專業」的互動，你動我，我動你，細胞內成千上萬的互動成就了細胞的大廈。「協作」失敗的早已全部淘汰。

11.這就有些類似於亞當斯密所說的「看不見的手」，人人為己，而令全球的經濟成為一體。

12.每種物質不過是按自己的「邏輯」採取行動，卻導致整體的變革，生命的多樣化、進化和繁盛。

13.如DNA，它不過是脫氧核苷酸對它周圍環境的一種反應，當千千萬萬相同反應發生時、編構成了精緻的雙螺旋DNA。

14.同理，為何在某部位形成肝臟，在它旁邊卻形成胰臟，根本沒有誰「說了算」，都是物質結構自我演化的結果。

15.所以根本沒有一個CPU，沒有一個控制中心，生命的奇妙恰在這無數分子「各持己見」、「自行其事「，歷經數以兆億計的淘汰，」自然演化「而成。

16.類似」分泌蛋白生產線「這種看似「特別協作」、「特別高效」的東西，實際上只是分散的成百上千的「生命單元」對自己周圍環境變化天然應對的自然之舉。

17.它們之中，誰也沒有意識到「自己是在合作」。

18.它們只是在做它們自己，根本沒有考慮過其他結構，一絲一毫也不會也不可能考慮其他。

19.生命科學認為線粒體是半自主細胞器，實際上，線粒體根本不知道在30個單位遠的地方有細胞核的存在，進而聽從它的某些命令。

20、而且線粒體自身由成百上千的「生命單元」組成，你看到了一個東西叫「線粒體」，就如你在社會生活中看到了一個「公司」。

21.其實細胞的工作，絕對不是以它為單位的，就如人類社會的基本單位不可能是「公司一樣」。

22.構成線粒體的一個個磷脂、蛋白質、多糖等等數以萬計的「生命單元」看似「聯繫十分緊密，實際上彼此根本不知道對方的存在「！

23.它們只是遇到情況A，執行Plan A；遇到情況B,執行Plan B；遇到情況C,執行Plan C。

如此而已！

24.所以，生物實驗怎麼能具有普適性呢？隨機選取的長勢相同的水稻，你哪裡知道它們之間有多大的不同？更不敢想像在細胞層次，這種差異的量級！

25.如果到分子層次，想選兩個相同的細胞簡直是笑話！

26.在全球選個相同指紋都那麼難，大家可以想像一下。

27.國際象棋，才幾個棋子？變化繁複，無窮無盡。那麼一個由無數分子，無數「生命單元」構成的細胞又該如何？

28.當前醫學界很多疾病原因不明，皆在於此。

29.人類基因組工程當時給了人類很大希望，但是後來發現，生命奧秘的大門根本沒有因此敞開，人類最多找到了一扇窗戶而已。

新人第一次回答啊哈哈。
基因領域的進展可謂日新月異，十餘年前人類基因組計劃告訴了我們基因中實際編碼蛋白質的區域只佔全序列的百分之3左右，其餘大量序列被認為是Genome desert，所謂的無意義junk序列。
隨著NGS技術的誕生和不斷進步，researchers對人類基因的其他部分有了更加細緻的研究，其中最出名的是以6篇Nature為核心，其餘20餘篇Genome research和其他期刊上的paper所代表的ENCODE項目（Nature ENCODE : Nature Publishing Group : A landmark in the understanding of the human genome），這是一個是世界範圍的超大型項目，光是世界各地的科研人員通訊交流的費用就超過了50,000刀，其主要目的是對基因組進行大量實驗性的reannotation以解釋在人類基因組計劃中功能意義不明確的基因序列，ENCODE 2012年發表的30篇paper證實了超過80%的Junk序列都是有其調控功能和存在意義的，e.g. Transcription factor的binding sites位置對基因的表達調控有著決定性的影響。具體的有興趣可以通過上面的鏈接看看encode的3篇介紹性的通訊，所以只有編碼區的基因組顯然是無法正常運作的。歡迎各位討論交流。

反對樓上一堆認為肯定不會成功的答案。。。那麼多的片段也許真的就沒用，又不是電腦，垃圾信息多了就會變慢。物競天擇，多幾個沒用的基因又沒什麼危害，犯不著被淘汰吧，也許真就是偶然多出來一些東西，就這麼稀里糊塗傳下來了。
最後我想說，在實驗結果沒出來之前，想當然地認為存在的基因肯定是有某種作用，這種想法不符合科學的精神。

所謂的垃圾片段，只是因為人類暫時的水平問題無法解讀罷了。難以想像在生物進化中錙銖必較的基因，會讓自己本身存在很多的垃圾。