在基因結構中,蛋白質編碼DNA被分成多個外顯子,可能有什麼好處?
可以選擇性地剪接(alternative splicing),帶來不同的功能。
wikipedia Alternative splicing一些外顯子可以單獨連成circular RNA(circRNA) and Competing endogenous RNA(ceRNA)或其他非編碼RNA起到調控作用
A View of Pre-mRNA Splicing from RNase R Resistant RNAs除了上述兩個答案以外,目前來看,具有可變剪切的exon與intron可能還是區分物種的一個標誌。比如,老鼠的肝臟與人的肝臟可能表達譜更像,老鼠的腦和人的腦表達譜更像,但是用剪輯譜卻可以得到,老鼠的肝臟,老鼠的腦是一個物種;人的肝臟和人的腦是另一個物種的。這個結論可能提出一個假說,就是在進化上,可變剪輯也是一個重要的因素。有興趣可以看一下這篇文獻:2012,Science,The Evolutionary Landscape of Alternative Splicing in Vertebrate,Nuno L. Barbosa-Morais et al.
ls很多大神解釋得很專業很詳細,我來泛泛說下我的理解。有這些intron啊什麼的,其實是一種節省儲存信息的方式。打個不恰當的比方,你存百度雲里一個文本A有1萬個字,別人存百度雲的文本B有1萬個字,這兩文本有9000個字是一模一樣的,如果百度雲能夠智能到把9000字儲存一份,不同的1000字各儲存一份,然後再儲存一個link,當你需要A的時候可以順利調出overlap的9000字和special的1000字,需要B的時候也如此,那麼豈不是只用了1萬1千字+link的空間就能儲存原本2萬字空間才能做到的事情?基因組就是這麼做的。DNA序列是一個二維的東西,科普性的理解一般認為,一個基因編碼一個蛋白。但是顯然這樣很浪費,一段5K多的信息就只能做一件事,那我整個基因組得有多大?於是,就有了intron,有了intergenic區間。這樣看起來一個基因平均而言佔了更多的地方(比如10Kb,20Kb),但是通過可變剪切、轉錄調控、基因融合等各種方式,我一個基因能編碼出N個蛋白或者轉錄因子或者其他什麼的,本來只能做一件事,現在能做的事情是以前的10倍、20倍,但是長度只增加了4倍不到,多麼划算啊!雖然同一個基因的不同轉錄本在功能上可能高度相似,但是這並不意味著可以缺了誰。
所以啊,這是一種用最少的成本做最多的事的方式。看起來很複雜,但是對於生物來說,卻是最合適不過了。
@Serena Yu答得很好,很全面了。
我這裡補充一個有意思的數據。
在人類基因組計劃之前,人們普遍認為,人類的基因數目應該很多,但是最後結果測出只有2萬多個基因,大大小於人們的預期。這就是Science在125周年時總結重要的科學問題的時候,寫「為什麼人類有這麼少的基因」(「Why Do Humans Have So Few Genes?」)
目前對於這個問題的一個重要解釋就是,人類的基因數雖然少,但是人類可以可變剪切(Alternative splicing)。因此,同樣的一段基因序列可以編碼出不同的轉錄本(isoform或者transcript),進而編譯不同的蛋白質,產生不同的功能。目前Refseq收錄的轉錄本有56,880(Table Browser),Gencode收錄的轉錄本有79930(GENCODE - Statistics)。從數據就可以看出,確實編譯的蛋白質變得多了。
而題主提出的外顯子就是splicing之後,形成mature RNA中被保留的序列部分,而被切掉的是內含子部分。
當然現在發現,人類的基因組調控,遠比可變剪切這一項要複雜的多,還包含轉錄調控、轉錄後調控、翻譯後修飾、非編碼RNA等等。我感覺多個外顯子這種形式,促成了蛋白質不同功能域的排列組合。這種排列組合和有性生殖的道理一樣,都能夠提高了進化的效率。因為單純靠突變進行進化,不如有性繁殖交換基因,排列組合,多樣性更豐富。
推薦閱讀:
※我們離合成人還有多遠?
※如何看待張鋒的Cell重大突破:基因編輯家族「新神器」——CRISPR/Cpf1?
※決定智商的基因全部來自X染色體嗎?
※進化論或者現代學術界怎麼證明多細胞生物是從單細胞生物演化來的?
※沒有線粒體的最早先的那些真核生物靠什麼生存?