打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
你还在用ClustalW做多序列比对?OUT了

生物信息学跟计算机一样,更新换代都是比较快的,还不能说当年我们用的经典软件,可能在现代来说已经过时了,因而与时俱进对于生物信息人员来说是很重要的。

当我们尝试使用EBI上的在线工具ClustalW2进行比对时,我们发现他已经光荣的退役了。



网站推荐做蛋白序列的多序列比对建议使用Clustal Omega

(https://www.ebi.ac.uk/Tools/msa/clustalo/)


做核酸序列多序列比对采用MUSCLE

(https://www.ebi.ac.uk/Tools/msa/muscle/)




本文主要讲述ClustaW2的替代工具之一MUSCLE用法。

在线版本如上,非常简单,小编在此不做介绍。下面主要说一下Linux版本用法,方便对于大批量序列的快速比对。

下面是MUSCLE的主要参数:

可以看到两个主要的参数-in 和-out,分别是输入和输出。

基础命令:

muscle -in seq.fa -out seq.aligned.fa

muscle -in seq.fa -phyiout seq.aligned.phy(常用的构建ML进化树所采用的MUSCLE命令)


MUSCLE的所有输出格式见下面,只需要仿照上面的命令改成相应的输出参数即可。


-clwout filename CLUSTALW format. By default, will write MUSCLE as the program name in the file header. If the -clwstrict option is specified, then the program name will be written as 'CLUSTAL W (1.81)'. This is useful if the output will be parsed by scripts that check the program name.

-fastaout filename FASTA format (default).

-htmlout filename HTML (web page) output. The alignment is colored using a color scheme from Eric Sonnhammer's Belvu editor.

-physout filename PHYLIP sequential format.

-phyiout filename PHYLIP interleaved format.

-msfout filename MSF format, as used in the GCG package, is requested by using the –msf option. As with CLUSTALW format, this is easier for people to read than FASTA. As of MUSCLE 3.52, the MSF format has been tweaked to be more compatible with GCG. The following differences remain.

(a) MUSCLE truncates labels at the first white space or after 63 characters, which ever comes first. The GCG package apparently truncates after 10 characters. If this is a problem for you, please let me know and I'll add an option to truncate after 10 in a future version.

(b) MUSCLE allows duplicate sequence labels, while GCG forbids duplicates. If you use the –stable option of muscle, then the order of the input sequences is preserved and sequences can be unambiguously identified even if the labels differ.

一个物种一个家

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
如何获取蛋白序列并进行序列比对?
lncRNA芯片的探针到底该如何注释到基因组信息呢
几个多序列比对软件:Muscle,ClustalW和T
序列比对在biopython中的处理
MegaX进化树构建与分析方法介绍
比Blast更快的序列比对工具-Blat
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服