生物信息百Jia軟體(三):Muscle
05-13
編者按
多序列比對主要用來構建系統發育樹或者分子樹,在建樹之前都需要進行多序列比對,muscle是多序列比對中一款老牌工具,比clustalw使用起來簡單一些,直接敲命令就可以。
一、功能分類:
多序列比對
二、軟體官網:
http://www.drive5.com/muscle/
三、軟體介紹:
MUSCLE(Multiple Protein Sequence Alignment)。它是一款非常簡單好用的軟體,muscle也是肌肉的意思,也寓意此款軟體功能強勁有力。
muscle是在2004年公布的一款蛋白質水平多序列比對的開源軟體,在速度和精度上都優於ClustalW。比對速度快。因此在進行多序列比對的時候,大多數情況下可以優先使用Muscle。例如Mega等軟體裡面也集成了muscle的多序列比對。Muscle同樣可以用於DNA的多序列的比對。使用起來十分方便,大多數情況下用戶只需要指定輸入輸出文件即可。它是適合於多序列比對,多個序列之間具有同源關係,並且具有同一方向,muscle需要對序列進行拉伸,例如適合同一個或多個看家基因、16s等放在一起比對。我們同樣也可以將多樣品的SNP結果連接起來進行多序列比對,做系統發育分析。所以對於我們使用muscle主要需要做的就是將輸入文件格式化為滿足muscle輸入即可,主要就是fasta格式。四、下載安裝:
wget http://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gztar -zxvf muscle3.8.31_i86linux64.tar.gzmv muscle3.8.31_i86linux64 muscle
五、軟體使用:
選項參數:-in 輸入文件,必須為fasta 格式的序列文件
-out 輸出文件,默認輸出為mfa格式
-diags 適用於輸入序列同源性比較高的序列-maxiters 最大迭代次數,默認為16-maxhours 最長迭代時間,默認無限制-clw 輸出CLUSTALW 格式的結果
-clwstrict 同-clw,輸出文件的頭部包含 「CLUSTAL W (1.81)」 字樣-html 輸出HTML 格式結果-msf 輸出msf 格式結果-log[a] 日誌文件,-loga 表示添加,-log 則直接覆蓋已有日誌文件-quiet 不要向標準錯誤流列印進度信息-stable 按著輸入文件中-group 按著序列的相似度-version 版本信息六、使用案例:
現有一個包含多序列的fasta格式文件multi.fasta
muscle -in multi.fasta -out ex1.mfamuscle -in multi.fasta -out ex1.clw -clw
七、注意事項:
1、Muscle是多序列比對軟體,它與Blast和Mummer是完全不同的,這些工具適合全基因組比對;2、序列的方向要一致;推薦閱讀:
※120-理查德.道金斯/尼爾.德格拉斯.泰森:對談答疑錄
※什麼是科學?
※八個宇宙秘密(最好的算命風水)
※清華大學副校長:所有受精卵35億年前來自於同一細胞同一物質,處於複雜的量子糾纏的體系!
※神秘的空間站,帶你一起回顧近60年的人類太空之旅