打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
微生物基因组下载神器推荐:ncbi-genome-download
今天向大家推介一个实用的工具,用来从NCBI的ftp直接下载指定物种范围的微生物基因组。
https://github.com/kblin/ncbi-genome-download/blob/master/README.md

比如说,你想下载全部NCBI的refseq的全体细菌基因组(默认是refseq参考序列数据库),默认的格式为genbank:
ncbi-genome-download bacteria
只要genbank数据库的全体真菌基因组(有关genbank和refseq数据库,请看生信人往期推送):
ncbi-genome-download --section genbank fungi
全体病毒的fasta序列:
ncbi-genome-download --format fasta viral
完成且为染色体水平的全体细菌基因组组装
ncbi-genome-download --assembly-level complete,chromosome bacteria
大多数情况下,我们也许只是要属于某一个属或种的基因组。那么我们需要指定明确的分类。
ncbi-genome-download--genus'Streptomyces coelicolor,Escherichia coli' bacteria
如果你有很多的taxonomy ID,那么可以把它们塞到一个文件里:
ncbi-genome-download --taxid my_taxids.txt --assembly-level chromosome vertebrate_mammalian
让我们用新冠病毒做个非常简单的测试。我们在NCBI的Taxonomy数据库(https://www.ncbi.nlm.nih.gov/Taxonomy/)输入一个名字2019-nCoV,会得到如下界面

图1
只有一条结果,点进去:

图2
该页面最下方还显示了详细的物种分类层级

图3
新冠病毒属于冠状病毒科下面的贝塔冠状病毒的沙贝病毒亚属(Sarbecovirus)。我们要着重注意的信息是新冠病毒的物种ID为2697049 (图2)。接下来,执行以下命令:
ncbi-genome-download --section genbank --taxid 2697049 viral
注意,最后的viral必不可少,因为它告诉程序是在所有病毒里找寻(有个别分属真核生物和原核生物的物种有相同的属名)。

图4
打开基因组文件夹,就可以看到里面的genbank格式的文件已经准备就绪了。更多参数,大家可以通过—help查阅

图5
在该软件的主页,有详细的安装和使用说明。

图6 
ncbi-genome-download的作者是来自丹麦技术大学(Technical University of Denmark)的生物信息学家Kai Blin。有趣的是,Blin还谦虚地表示,ncbi-genome-download借鉴了英国爱丁堡大学学者的程序:http://www.opiniomics.org/building-a-kraken-database-with-new-ftp-structure-and-no-gi-numbers/:Idea shamelessly stolen from Mick Watson's Kraken downloader scripts that can also be found in Mick's GitHub repo. However, Mick's scripts are specific to actually building a Kraken database (as advertised)。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
一步一步教你使用NCBI数据库资源
NCBI各数据库简介
NCBI参考序列(RefSeq)常见问题回答 | Public Library of Bioinformatics
NCBI(美国国家生物技术信息中心)的资源架构(下篇)
共享病原体基因组序列数据——做好疾病大流行的防范、准备和应对工作
一步一步教你使用NCBI(挺不错的,推荐)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服