生物信息百Jia軟體(三):Muscle

編者按

多序列比對主要用來構建系統發育樹或者分子樹,在建樹之前都需要進行多序列比對,muscle是多序列比對中一款老牌工具,比clustalw使用起來簡單一些,直接敲命令就可以。

一、功能分類:

多序列比對

二、軟體官網:

drive5.com/muscle/

三、軟體介紹:

MUSCLE(Multiple Protein Sequence Alignment)。它是一款非常簡單好用的軟體,muscle也是肌肉的意思,也寓意此款軟體功能強勁有力。

muscle是在2004年公布的一款蛋白質水平多序列比對的開源軟體,在速度和精度上都優於ClustalW。比對速度快。因此在進行多序列比對的時候,大多數情況下可以優先使用Muscle。例如Mega等軟體裡面也集成了muscle的多序列比對。

Muscle同樣可以用於DNA的多序列的比對。使用起來十分方便,大多數情況下用戶只需要指定輸入輸出文件即可。它是適合於多序列比對,多個序列之間具有同源關係,並且具有同一方向,muscle需要對序列進行拉伸,例如適合同一個或多個看家基因、16s等放在一起比對。我們同樣也可以將多樣品的SNP結果連接起來進行多序列比對,做系統發育分析。所以對於我們使用muscle主要需要做的就是將輸入文件格式化為滿足muscle輸入即可,主要就是fasta格式。

四、下載安裝:

wget http://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gztar -zxvf muscle3.8.31_i86linux64.tar.gzmv muscle3.8.31_i86linux64 muscle

五、軟體使用:

選項參數:

-in 輸入文件,必須為fasta 格式的序列文件

-out 輸出文件,默認輸出為mfa格式

-diags 適用於輸入序列同源性比較高的序列

-maxiters 最大迭代次數,默認為16

-maxhours 最長迭代時間,默認無限制

-clw 輸出CLUSTALW 格式的結果

-clwstrict 同-clw,輸出文件的頭部包含 「CLUSTAL W (1.81)」 字樣

-html 輸出HTML 格式結果

-msf 輸出msf 格式結果

-log[a] 日誌文件,-loga 表示添加,-log 則直接覆蓋已有日誌文件

-quiet 不要向標準錯誤流列印進度信息

-stable 按著輸入文件中

-group 按著序列的相似度

-version 版本信息

六、使用案例:

現有一個包含多序列的fasta格式文件multi.fasta

muscle -in multi.fasta -out ex1.mfamuscle -in multi.fasta -out ex1.clw -clw

七、注意事項:

1、Muscle是多序列比對軟體,它與Blast和Mummer是完全不同的,這些工具適合全基因組比對;

2、序列的方向要一致;


推薦閱讀:

120-理查德.道金斯/尼爾.德格拉斯.泰森:對談答疑錄
什麼是科學?
八個宇宙秘密(最好的算命風水)
清華大學副校長:所有受精卵35億年前來自於同一細胞同一物質,處於複雜的量子糾纏的體系!
神秘的空間站,帶你一起回顧近60年的人類太空之旅

TAG:生物信息學 | 自然科學 | 生物學 |