打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
使用muscle进行多序列比对

muscle是最为广泛使用的多序列比对工具之一,其速度和准确度比clustal都要更加优秀,在几秒钟的时间就可以完成上百条序列的比对,而且用法简单。官网如下

https://www.drive5.com/muscle/

在下载页面,提供了多个操作系统的可执行文件。


linux下安装的代码如下

wget https://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gztar xzvf muscle3.8.31_i86linux64.tar.gzmv muscle3.8.31_i86linux64 musclechmod +x muscle

由于解压后的文件名很长,这里对文件进行了重命名,然后添加了可执行权限。为了方便调用,可以将该文件添加到PATH环境变量中。muscle的基本用法如下

muscle -in seqs.fa -out seqs.afa

输入序列为FASTA格式,如果输入序列中出现了gap, 会先去除这些gap, 然后在进行多序列比对。默认输出的比对结果也为fasta格式,也支持phylip, msf, clustalw等其他格式。

除了多序列比对外,muscle还可以构建进化树,支持以下两种建树方式

  1. NJ

  2. UPGMA

NJ法构建的进化树可信度更高,而UPGMA建树的速度更快。基本用法如下

muscle -maketree -in seqs.afa -out seqs.phy -cluster neighborjoining

-cluster参数指定建树的方法,默认为upgma。输出的tree文件格式为Newick格式。

muscle的默认参数设置最大化的保证了比对的准确度,对于大的序列,如果比对速度不是很理想时,可以适当的调整参数。

对于核酸和氨基酸序列,官方分别推荐了速度最快的参数设置。

核酸

muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags

氨基酸

muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags -sv -distance1 kbit20_3

使用muscle时,其默认参数设置就能够满足绝大部分的使用场景,只有对于较大的输入序列,才需要调整参数。

EBI提供了muscle的在线服务,网址如下

https://www.ebi.ac.uk/Tools/msa/muscle/

用法和clustal的用法是类似的,这里就不赘述了。对于500条以下而且数据量小于1Mb的序列,可以直接使用该在线服务。

·end·

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
你还在用ClustalW做多序列比对?OUT了
b06b82784d264a2fa23ec80afa901f64 (640×450)
16s分析之Qiime中一些常用的命令学习笔记
扩增子分析还聚OTU就真OUT了,试试unoise3
扩增子分析解读4去嵌合体,非细菌序列,生成代表性序列和OTU表
扩增子数据分析之聚类:UCLUST « Biostack.org
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服