進化樹(phylogenetic trees)裡面每一個分支的長度代表什麼?
就是比如這個靈長目的phylogenetic trees,它的每一個末端橫向長度都不一樣,有的長,有的短,這個長度代表了什麼?如果說橫向是代表演化時間,我看描述分化的時間用的都是若干MYA(millions years ago),那麼就是以當前的時間為衡量的原點,然後距今若干年前分化。這樣的話現有物種不是應該在同一個平齊的位置嗎?(如下圖這種表示,現有物種是平起的,較短的一些是滅絕的物種)
如果是不同的物種,你可以認為那代表了兩個物種的差異度,也可以認為代表了兩個物種的分化時間(相對性的)。
具體說來,看到你貼的第一張圖最下面有一個小橫線,旁邊寫著0.02了嗎?那個跟地圖的標尺是一樣的,代表著這麼長的距離,其差異度有2%。而計算兩個物種的差異度,只需要首先找到兩個物種在進化樹上的位置,然後去找他們最近的節點(分支點,注意,一定是最近的,比如你圖上第一和第二個物種的分支點就是那個小綠點,而不能找到B上面去),分別計算兩個物種所在的位置到節點的橫向距離,加起來,用標尺一換算,就大概知道兩個物種的差異度了——當然,一般也沒人真用進化樹來估算差異度,這只是給你看看的而已。從差異度可以計算出分化時間,這個是沒有問題的,但是並不是像你想的那樣,在橫軸上的位置越靠右,就代表越現代。用進化樹計算的分化時間是一個相對的概念,用第二張圖,你依然可以計算出每個物種跟其他物種的分化時間,比如A跟B在200萬年前分化,A跟C在400萬年前分化,A跟D在500萬年前分化,而B,C,D之間只有幾十萬年的分化時間,那麼A很明顯是這一支的古老物種了。就比如你第二張圖上紅色線標出的那個物種,他的確是比從Homo Sapiens到Gorilla Gorilla更加古老的物種,但是不是因為他在水平軸上的距離更靠左,而是因為他落在了這一支的最外圍,他跟這一支上所有物種的共同節點都更靠左邊。就好像下面的連個Pongo,其實相對這一支來說更加古老,但是在X軸上的位置其實是在右邊。——————在X軸上靠左還是靠右完全說明不了問題,你隨便用Mega調整一下就可以得到一個完全水平上對齊的進化樹了。
—————————————關於評論中看節點還是看水平距離的分割線——————————比如我畫的這棵進化樹,從A到F的水平距離都是一樣的,是不是說明這7個基因就沒有進化上時間的區別了呢?顯然不是。我想,這個應該能夠解釋,到底是看節點還是看水平距離了吧!實際上,這就是我上面說的,隨便用Mega調整一下就可以得到一個完全水平上對齊的進化樹,但是節點位置是用mega調整不起來的。所以很顯然看親緣關係要看節點,而不是看水平距離(如果我沒理解錯你說的水平距離的話)。Mega在進化上是一款 很好用的軟體,當然R包也很方便,看你喜好吧。———————————————————————————————————————————有點想匿,專業知識其實學得不好,但是想了想還是算了,被噴也是進步嗎。
首先,枝長代表什麼取決於用什麼方法建的樹。建樹大法好,主要有三種:距離,最大似然,貝葉斯。
距離法的話僅考慮相似度,即枝長只表示序列的差異,但怎麼定義序列的距離有不同的方法。這種方法簡單,但能力有限,一般與其它配合使用。
不過但你這棵看起來應該不是距離法,另外兩種方法都是基於模型的。基於模型是什麼意思呢?就是我先假設這些物種的進化(實際上就是鹼基替代率)的速率,然後假設這些物種的演化時間,這時序列的差異度是什麼呢?是速率乘以時間,也就是累積進化量(evolutionary change)。有了不同的假設,我就可以算出在這種假設下,觀測到我這樣一組數據的概率。那麼理論上,如果我嘗試所有可能的假設,從中找出最有可能產生這組數據的組合,我就知道了哪個假設更有可能是正確的。(這就是最大似然,貝葉斯在怎麼選假設上有些區別)
所以此時的枝長是什麼呢?可以說是相似度,但它正比於累積進化量,其實是速率和時間的乘積!即第一棵里比例尺中的0.02,它代表的是鹼基替代率和時間的綜合考量,長短的不同部分由於替代率不同,部分由於時間的不同。
當然這兩個量在某些情況下可以分離,比如如果我假設所有速率在不同物種的不同位點都一致(分子鐘),那麼速率都一樣,長度的不同就僅與時間有關,此時枝長體現的就僅是時間,也就是第2棵樹那種情況。
其次,枝長取決於以什麼形式表現這棵樹。phylogram是指上文所述枝長正比於累積進化量的樹,而cladograms僅代表共同祖先的關係,但枝長並不正比於累積進化量,沒有什麼意義。不過你提到的2棵應該都屬於phylogram,區別在於有沒有假設分子鐘,也就是說它們的枝長含義並不一樣。進化樹有步長和沒有步長兩種,一般用ML演算法計算出來的樹是帶步長的,而用MP或者BI算出來的樹是等距離的,也就是沒有步長。而題主所說的枝長其實就可以理解為步長。步長代表了相鄰的兩條序列之間的差異大小。
當設定了外類群後(樹的根),若所選的外類群的進化時間可以確定,比如是化石物種,則越靠近外類群的說明進化速率越低,可以理解為較為古老,步長越大,差異越大。這也是進化樹能體現出來的的信息之一。而對於沒有步長的樹,就不能看出序列差異程度,也沒有進化速率的信息。因此,對於大多數的研究,都會選擇ML樹,因為其中能看出的信息更多一些。
(根據自己的理解所寫,未加以查證。若有錯誤之處,還望指出!)求問題主,用r包畫進化樹怎出來scalebar呢,我用的ggplot2畫的進化樹,沒弄出來標尺
題主的兩個進化樹是不一樣的呀。
進化樹的枝排布,枝長都是可以自己調節的。我只是猜測,圖例下面沒有注釋只是看到了就這麼理解。
第一棵樹,物種沒有都排到一豎行上,下方沒有比例尺,說明這個樹只是物種之間的親緣關係比較,物種之間連接短說明親緣近。第二棵樹的末端是在同一豎行上,說明所有物種都是現在存在的實際測序的,那麼這個fossil calibration就主要看分節點,分節點代表歧化時間,末端枝長沒有意義。
關於進化枝,你可以自己設定他的分布方式。關鍵信息在於這兩篇論文裡面 關於枝長設置和進化樹節點的信息
推薦閱讀:
※經過足夠長的時間大海里是否可進化出高等文明?
※從進化的角度說,青春期為什麼要「變聲」?
※原來在蚊子叮的包上掐十字,並不只是為了好玩!
※【地球演義】鮫騰記1:骨
※【地球演義】六足傳奇6:脫胎換骨