微生物群落結構分析常見方法

微生物群落結構分析是從整體的角度分析各組樣品的微生物群落之間是否有顯著差異,從而分析實驗所關注的因素是否會導致環境微生物群落結構的顯著變化。α 多樣性、β 多樣性以及依據樣品間不相似性進行排序分析和聚類分析是微生物群落結構分析的主要方法。

α 多樣性是樣本內物種多樣性(Within-sample diversity),反映每個樣本的物種的豐富度和均勻度。α 多樣性的高低由 α 多樣性指數表徵,在 16S rRNA 測序數據分析中常用的有香農 - 威納多樣性指數(Shannon-wiener diversity index),辛普森多樣性指數(Simpson diversity index),Chao1 豐富度估計量(Chao1 richness estimator)等。QIIME、Mothur、PAST等軟體都可以進行多種 α 多樣性指數的計算。

β 多 樣 性 是 指 樣 本 間 多 樣 性(Between-sample diversity),其高低反映每個組內各個樣本的群落物種組成差異的大小。人類微生物組計劃通過計算同一組內各個樣品間的距離來表徵各個組的 β 多樣性,通過比較數值大小來比較各個組的 β 多樣性。更形象化的做法是利用距離表徵出的樣品間的關係,通過主成分分析(Principal component analysis,PCA)、主 坐 標 分 析(Principal coordinates analysis,PCoA)等作圖方法將所有樣品在二維坐標系中表現出來,從而從側面反映各個組的 β 多樣性及各樣品之間的相互關係。

PAC和PCoA圖之間的區別

微生物群落樣品間距離即群落之間的不相似性,兩個群落越不相似,它們之間的距離越大。傳統生態學上應用較多的布雷 - 柯蒂斯距離(Bray-Curtisdissimilarity)在微生物 16S rRNA 測序分析中也廣泛應用。然而布雷柯蒂斯距離將不同的OTU 視為完全沒有聯繫的單位,導致 16S rRNA 測序數據中存在著的豐富的序列信息沒有得到有效的應用,UniFrac 距離解決了這個問題。UniFrac距離利用測序序列信息建立的物種系統發育樹,考慮了物種的相似度:如果一個群落中的某物種變成另一個群落中進化關係相近的物種,則視為較小的變化,所反映出的兩個群落的距離較小;如果一個群落中某物種變成另一個群落中進化關係較遠的物種,則視為較大的變化,兩個群落距離較大。非加權UniFrac(unweighted UniFrac)只考慮了物種有無的變化,加權 UniFrac(weighted UniFrac)同時考慮了物種有無和物種丰度的變化。UniFrac 距離可以在UniFrac 網站進行在線計算,也可以通過QIIME分析流進行計算,二者也都可以直接依據UniFrac距離給出 PCA 或 PCoA 圖。

聚類分析是另一種直觀表示樣品間相互關係的方法。該方法利用樣品間距離的數據,建立樣品的系統發生樹,以反映各個樣品的聚類情況。QIIME分析流中採用不加權配對組算術方法(Unweightedpair group method with arithmetic mean,UPGMA)法進行聚類,並且折刀分析法(Jackknifing analysis)驗證該系統發生樹的穩健性。一般來說,系統發生樹所反映的樣品間聚類或距離的信息少於 PCA 或PCoA 圖,因此聚類分析在腸道微生物16S rRNA測序的生物信息學分析中並不常用。

歡迎關注我的微信公眾號呀!

weixin.qq.com/r/bTh2br7 (二維碼自動識別)


推薦閱讀:

持續連載Mathematica教程與腦洞
能級大樓的電子居民
人和香蕉50%基因相同,雨天跑和走哪個淋雨少,這都是科學
circGFRA1在三陰性乳腺癌中起ceRNA的作用
自然科學的基礎物理

TAG:微生物學 | 科研 | 自然科學 |