您的当前位置:首页正文

微生物基因组下载神器推荐:ncbi-genome-downloa

来源:花图问答

今天向大家推介一个实用的工具,用来从NCBI的ftp直接下载指定物种范围的微生物基因组。

比如说,你想下载全部NCBI的refseq的全体细菌基因组(默认是refseq参考序列数据库),默认的格式为genbank:

ncbi-genome-download bacteria

ncbi-genome-download --section genbank fungi

全体病毒的fasta序列:

ncbi-genome-download --format fasta viral

完成且为染色体水平的全体细菌基因组组装

ncbi-genome-download --assembly-level complete,chromosome bacteria

大多数情况下,我们也许只是要属于某一个属或种的基因组。那么我们需要指定明确的分类。

ncbi-genome-download--genus"Streptomyces coelicolor,Escherichia coli" bacteria

如果你有很多的taxonomy ID,那么可以把它们塞到一个文件里:

ncbi-genome-download --taxid my_taxids.txt --assembly-level chromosome vertebrate_mammalian

图1

只有一条结果,点进去:

图2

该页面最下方还显示了详细的物种分类层级

图3

新冠病毒属于冠状病毒科下面的贝塔冠状病毒的沙贝病毒亚属(Sarbecovirus)。我们要着重注意的信息是新冠病毒的物种ID为2697049 (图2)。接下来,执行以下命令:

ncbi-genome-download --section genbank --taxid 2697049 viral

注意,最后的viral必不可少,因为它告诉程序是在所有病毒里找寻(有个别分属真核生物和原核生物的物种有相同的属名)。

图4

打开基因组文件夹,就可以看到里面的genbank格式的文件已经准备就绪了。更多参数,大家可以通过—help查阅

图5

在该软件的主页,有详细的安装和使用说明。

图6 

本文作者原创,原载于生信人公众号