僅憑基因序列信息能否確定物種起源?分子生物學能否獨立確定物種起源?

若僅提供所有物種的足夠多的序列信息(基因組的以及細胞質中的),能否判斷多個物種間的進化關係,從而確定多個物種間的共同祖先?

現在分子生物學研究物種進化的方法又大致有哪些?


唔這裡有幾個我很喜歡討論的點,勾起來我坐下來仔細作答的衝動。

首先針對問題里的幾個「確定」:演化生物學在很多問題上都是歷史學研究,由於演化事件已經過去,而時空穿梭回到過去從目前的物理學來看是不可能的。既然沒有辦法坐時空機回到過去,所以大部分演化事件是永遠無法確定的。我們只能如同探案一般,根據已有的證據,利用邏輯推理,來逐步逼近那個真相。但隨著有效證據的增多和研究手段的進步,我們可以離那個真相越來越近。

我們將所有的「確定」都改成「推測」以後,再來看一下這個問題。

僅憑基因序列信息能否推測物種起源?分子生物學能否獨立推測物種起源?

分子層面主要採用基因序列和蛋白質序列,它們跟形態學證據一樣,都是我們能夠採用的證據的一種。我們最希望的,不是厚此薄彼,而是能夠綜合儘可能多的證據,來逼近事實真相。所以一般不會傾向於「僅憑」或者「獨立」採用某一種。況且正如上面很多人提到的那樣,很多古生物化石我們其實是很難得到分子信息的,只能採用形態學證據。非要採用一種的話,因為歷史事件的永不確定性,我們就要討論可信性問題。分子證據和形態學證據相比,的確有一些可信性上的優勢,但也有一些自身的問題。具體比較討論可以參見這篇答案:

知乎用戶:基因測序技術出現後是不是老的生物分類有很多都被推翻了?

值得注意的是,由於分子證據使用起來很不直觀,我們在很多文章中,都會看到一些明顯是材料鑒定錯誤或者樣品污染導致的錯誤系統樹,這其中不乏一些高檔次論文,而這些錯誤又不是那麼容易被發現。這也提醒我們在使用分子材料時,一定要仔細檢查原材料。

若僅提供所有物種的足夠多的序列信息(基因組的以及細胞質中的),能否判斷多個物種間的進化關係,從而確定多個物種間的共同祖先?

這裡有個很有意思的問題,採用的序列越多,我們就越能得到更真實的系統發生樹么?這也是很多系統學初學者容易起的一個念頭。我的系統樹支持率不夠高,出現了很多沒有解決的枝,一定是我用的基因太少了。我要拿全葉綠體基因組幾十個基因來構樹,甚至全基因組所有的基因來構樹,就一定能夠得到支持率漂亮得不行的系統樹。

很多時候增加序列信息是可以提高系統樹的解決率和支持率,但我們不能盲目樂觀。當代基因組系統學時代,我們窮盡了所有葉綠體基因組或者用了幾百個單拷貝核基因,所有的問題就都解決了么?並沒有,很多演化史上關鍵類群的位置,比如陸生植物最低等的幾個類群——苔類、蘚類、角苔類的演化關係,仍然得不到解決。這是為什麼呢?

首先,對於演化史早期的一些類群來說,它們經歷了多次大規模的滅絕事件。很多孑遺類群,如木賊,銀杏和買麻藤類,其親戚都滅絕得差不多了。導致我們從現生生物中很難找到合適的能夠它們比較,並將它們跟其它現生生物聯繫在一起的中間線索。它們在基因層面上跟其它所有現生種都距離遙遠,使得即便是使用大規模的分子證據,仍然難以將它們定位到系統樹上。

其次,不同的基因具有不同的演化過程。多倍化、自然雜交、基因水平轉移、祖先多態性篩選不全,都會使得基因構建的系統樹與真實的物種樹出現偏差。關於基因樹和物種樹出現偏差原因的討論,可以讀這篇經典文章:

Maddison WP. 1997. Gene trees in species trees. Systematic Biology, 46: 523-536.

所以有些時候,增加序列信息,非但不能更好的解決物種關係,反而會因為不同基因演化歷史的不同,導致更糟糕的結果。所以當我們利用數十數百種序列進行分析時,一定要做一致性檢驗,看到底有多少序列支持構建出的系統樹。

最後,系統發生學這一手段是否足夠可信呢?

我們需要在這裡可以深入到系統發生學的方法學內部去看一看。系統發生學是統計和處理變化的學問,其最樸素的思想就是,親緣關係越近的物種,其序列差異就越小。具體運用到的是兩套統計學思想——頻率學派和貝葉斯學派。關於系統發生學的內涵和這兩套思想在系統發生學中所運用到的具體數學和統計學原理,可以看這個live,這裡也沒功夫展開了:

給生命以時間:譜系學思想和方法

(我惡意滿滿地給了很多演算習題來做,大家慎點ORZ)

因為演化事件的不確定性,不同的方法會給出其推測出的每一物種分化事件的可信度。那麼這些可信度又有多可信呢?頻率概率給出的可信度,其實是將輸入的數據組,隨機打亂後重新排列成新的小數據組,看有多少小數據組跟整體數據組得到的是一致的結論。比如99%的支持率,即是在這一百次隨機抽樣中,有99次都能得到跟原數據組一致的結論。我們可以看到,頻率學派所給出的可信度,其實表徵的是我們原有數據的內部一致性,並沒有直接告訴我們演化事件的可信度。

而貝葉斯頻率,是可以直接告訴我們演化事件的可信度的。但它的問題在於使用了先驗概率。賦予先驗概率以合適的生物學意義,就變成了一個很大的爭議點,因為很多表徵參數,在我們計算之前,都是不知道的,需要我們人為去賦予。而這一主觀的過程,就顯得非常有爭議性。

所以有人開玩笑說:頻率學派,以無懈可擊的邏輯,回答錯誤的問題;而貝葉斯學派回答了正確的問題,卻使用了沒有人能完全相信的假設。

所以從方法學上來看,我們仍然還沒有完美的工具可以使用,進步的空間依然巨大。但只要一直在進步,雖然永遠不能達到,但我們仍然能夠離真相越來越近。

這樣就足夠了。


簡單的說,這是一個構建系統發育樹的過程,既需要組學(見過比較多的是rRNA或者線粒體)的數據,也需要化石的數據,用特定的演算法,來推斷出可能的演化關係。

如果想大概了解一下,建議你看看The Timescale of Life

這是個很有意思的工作(也是個文獻庫),可以告訴你任意兩個種的分歧時間;如果你想知道具體怎麼做的,可以隨便看一篇引文。


。對現生物種的演化,這種方法確實準確。

但討論絕大部分滅絕類群之間的演化關係,滅絕和現生類群之間的演化關係時候,分子演化很難起到有力的作用。

遺傳分子保存期限太短,這是個比較嚴峻的問題。

討論演化問題,雖然現代生物學更注重現生類群。但也不是說滅絕類群就是被淘汰的,毫無意義的類群。這裡可以舉幾個例子。比如牙形動物,古蟲動物,蜥腳類恐龍,這些類群在現在都是完全絕滅的門類。但是他們在當時的演化過程,生態環境中又非常重要。然而,他們生存的年限又遠超了dna可以保存的年限(其實 大部分都遠超了較大生物碳鏈保存年限了 ),化石更多的只是個「形」,而「神」以經飄散多年。但討論很多關鍵類群演化時候,又都要用到他們。試問:怎麼辦?

目前的答案是採用形態學的方法。

原因是沒有其他辦法 ≡ ( ˙-˙ )/

下面是我的粗淺觀點,歡迎討論。

實際上我認為在討論生物演化上,分子永遠不能成為主流。歸根到底是因為遺傳分子的保存年限太短,大部分都不能超過一百萬年。而在地球十億年量級的生命演化歷史中,我們要認清楚,實際上大部分曾經繁盛的類群,都是完全絕滅掉了。沒有現生後代,遺傳分子又完全喪失了,所以沒辦法採用基因測序的研究。打個比方的話,基於現代分子生物學的分子演化理論是生命演化樹上枝稍上新開的花朵,精巧而美麗。但生命之樹上,樹榦是不開花的,只能研究樹榦的走向來研究生命的發展。

在人類能發明時光機回到一億年前抽恐龍血之前,分子演化的方法應該只適用於討論現生類群的演化關係,和近百萬年來滅絕類群的演化關係。


謝邀。

皆可。然而你應該邀請研究生物信息學的答主。我這種三腳貓只能半吊子地講一下。

基於基因序列和基於蛋白質結構推斷進化和物種起源的原理是一樣的,序列信息啊結構啊,像其他答主所說都是可以拿來演算法計算然後畫樹叉(不一定是二叉,也有多叉;不一定標示了祖先源頭的位置,也可以畫無起源的)。

然後其實中心法則相關的所有的東西都有生物信息,也都是可以拿來研究進化的。比如(我忘記了)好像是mRNA?

但是這種方法也有缺陷,因為它有兩個假設,一是假設多樣性開始出現的事件就是物種開始形成的時間,二是假設每發生一次基因序列或者蛋白質序列或蛋白質結構改變,彼此所間隔的時間是一樣的。

還有一個缺陷在於光知道相似性的信息,我們無法知道每次突變發生的平均間隔時間,這個是需要通過化石證據和形態學證據來校準的。

這裡面有一個概念叫"分子鐘"。選擇合適的"分子鐘"很重要。保守的基因序列在近緣種當中幾乎沒有改變,就可以拿來算遠緣物種分化的時間。受選擇壓力影響較大變化快的基因序列,則可以更精細地反映近緣種的進化歷史。

生物信息確定物種起源,有形態學所不具備的優勢。比如形態學形態比較的"像"在很多近緣種里是說不清楚的,在遠緣種,比如動物分類裡面phylum出現的順序,太不像了還是說不清楚。此時生物信息基於分子差異的賦值比對,就可以更決定性地判定物種起源時的關係(phylum的分子進化,這個是science年度十大科學發現,感興趣可以去查一下)。

因為如上的原因,學術界有人類的多起源假說和單起源假說。但是由於分子進化的證據說服力太強,這些假說已經修訂成了assimilation model。

答案結尾例行賣安利,去看《人種自傳23章》呀,呀呀呀。


我不專精於進化生物學,沒做過遠緣物種的系統發育樹構建,只做過同種、近似種的細菌的事情。遠緣物種、高等生物要複雜得多。

僅有基因序列是不夠的,必須要知道各個基因的背景知識,比如哪些基因比較穩定,平均多長時間變一次鹼基等等。如果不依據這些知識來對建樹過程進行設計,那麼只會做出一鍋粥。

通過基因、基因組信息建立系統發育樹,不是一個十分簡單的過程,特別是當你需要一個和實際演化時間相關聯的、比較準確的樹。對於題主說的這種情景,物種間親緣關係非常遠,選擇的marker基因序列可能差距過大,建立序列比對會有些困難。不過儘管如此,基因序列依然是比傳統的形態學更穩定的分類標準。

除了基因序列建樹,基因組之間的變化關係也可以用來做,比如染色體條數、序列的插入、缺失、易位倒位關係。不過這個在遠緣種上可能完全是一鍋粥,根本看不出來。


簡單說的話,這裡面有兩個致命的問題。第一個是進化樹推斷本身的基礎,是建立在parsimony原則之上的。也就是說,我們假定分叉儘可能少的進化樹為實際的進化樹,但是這只是個假設,而事實是怎樣的並沒有可能知道。第二個問題是消失的物種太多了,在一些情況下根本找不到兩個物種間的「過渡物種」,這樣就會導致無法良好地構建模型。如果你單純是作為分類的憑據並沒有問題,但是要定量地分析遠緣物種的共同祖先這是不可能做到的。


不可以。

基因或蛋白序列比對是進化生物學的重要手段。例如:

1.對於所有生物(病毒除外),都有細胞色素C,則可用不同物種的細胞色素C基因序列(蛋白序列)相互比較,大體總結出物種之間的關係。

2.對於真核生物,就不必要用細胞色素C(的基因或蛋白序列)了,而是可以用組蛋白,這樣你能得到一個更接近的結果。

3.對於脊索動物,組蛋白也不必使用了,而是用血紅蛋白……

生物分類從界-門-綱-目-科-屬-種的比較,級別不同,參比的基因或蛋白應該不同,而找到這種有比較意義的基因或蛋白,恰恰是最難的。

如果你掌握了所有生物的全部基因信息。這個難關將被攻破,你有機會通過基因比對獲得最接近的進化順序。

然而,「接近正確」和「正確」仍是兩回事,你要想獲得絕對正確的進化順序,現存生物的信息還遠遠不夠,你還要得到所有滅絕生物的遺傳信息。因為他們是進化的重要參與者,由於滅絕動物的遺傳信息是缺失的,研究人員只能從化石中推斷其形態,給出近似的分類關係。

就像是玩鬥地主的時候,你手裡3456沒有7,連不上啊……


這就是個不懂how to root a phylogenetic tree的問題。


去生物信息那個板塊看看吧,應該是生物信息相關的


物種內,檢測不同個體的遺傳標記或者序列信息可以很容易判斷個體之間的親緣關係。

物種間,要選擇同源基因的序列信息,也能判斷物種之間的遺傳距離或者某個同源基因的遺傳距離。

要確定物種起源,應該很難吧。多久之前算起源,祖先樣本如何獲得。還有,同源和旁源從分子角度怎麼鑒定,分子鐘嗎,突變或者回復突變怎麼識別,突變概率怎麼辦,模型用哪個等等等。

從最簡單地開始,只考慮一個同源基因A,構建基因A的分子進化樹。試著用MEGA軟體做一次就可以了解大概。大概是,先獲得多個物種的A基因DNA序列進行多序列比對,或者A基因的蛋白質序列,進行蛋白質序列比對。參考某一個比對打分模型(鹼基替換模型,Blosum之類的)得到比對結果,然後用極大似然法,最小距離法等等各種演算法建樹,再計算一下此進化樹可靠性,比如bootstrap自舉法好像中文叫這個名字。基本上可以明確該基因的進化關係,但是不能確定哪個是祖先,只能說明遺傳距離遠近。獲得物種間的遺傳距離和進化樹,則需要更多的同源基因序列信息。這裡只是說個大概過程,丟了好多細節,至於具體計算方法,文獻好多好複雜,不介意不求甚解的話,還是從MEGA軟體入手,看一下說明文檔,常用的模型和演算法名字都列在上面了。

至於研究物種進化的方法,如果只從分子信息進行計算推導的話,這麼多年,還是哪些吧。主要還是前提假設模型演算法是否合理。然後非常能容忍誤差,計算出來兩個物種在幾百萬年前分化,然後計算誤差是幾百萬年。

非常推薦新手從MEGA入手。進化中的概念多又雜,各種假設從不同角度出發都很有道理。建個進化樹本身不難,可以如何判斷其合理性非常非常難。


理論上不靠譜,實操中不靠譜,判斷人類有限的時間段,相對可行。

生物的表現主要由DNA+RNA+蛋白質的形式體現。遺傳的核心是由DNA裡面的基因系列控制。

但是RNA存在著很大的作用。

有一個常見的故事,蝴蝶效應,也就是南美的一隻蝴蝶,扇了一下翅膀,然後在某個範圍內下了大暴雨。

這個是系統科學裡混沌的經典故事。也就是一個不起眼的變化,經過多次迭代後,會出現混沌。

此外,物種具有多樣性。比如 mRNA對生物有著重大的影響。這個是我國南大的一位學者提出的觀點。微觀上,蜜蜂后來的形態,跟他吃的東西的mRNA相關。

實際操作中就更顯然了,原來的生物都成了石頭,你哪裡來的基因系列?

但是某個時間段內,比如查曹操的後代之類倒是可行、

具體的物種,由於基因系列的變數過多,壓根就不可行。


謝邀

請參考關於線粒體「夏娃」等相關故事,個人感覺不能

因為DNA會講解,沒有足夠的古DNA很難確定物種起源

個人淺薄觀點


推薦閱讀:

如何選購顯微鏡?
與其他哺乳動物相比,為什麼人類的分娩過程這麼費勁且痛苦?
如何從進化上解釋人們對於漂亮的追求?
幹細胞注射抗衰老有沒有依據,怎麼保證幹細胞在人體自動分化需要的細胞?
為什麼黑貓的數量這麼少?

TAG:進化 | 生物學 | DNA測序 | 生物信息學 | 分子生物學 |