BOLD数据库(Barcode of Life Data Systems)主要关注DNA条形码数据,而DNA条形码通常使用线粒体COI基因作为标记,因此,BOLD数据库中的主要数据是与COI基因相关的DNA条形码序列。 但是也包含其他基因序列,包括16S,ITS基因序列等。
更新原因:客户需求使用该数据库进行扩增子物种注释,但是我们没有进行过该数据库下载和分析,弥补空缺。
数据库更新频率:每周都会更新。
官网截图
下载整理了BOLD database,可用于扩增子分析
1. 到官网下载数据库压缩包:
BOLD database网址如下:
https://www.boldsystems.org/index.php/databases
2. 对数据库文件解压缩,并使用拆分脚本将其拆分为序列和注释文件:
perl /TJPROJ1/META_ASS/script_Advanced_analysis/BOLD-database/bold-20230901/new.pl BOLD_Public.01-Sep-2023.fasta BOLD_Public.01-Sep-2023.final.fasta BOLD_Public.01-Sep-2023.final.taxonmy.txt
数据库路径:
/TJPROJ1/META_ASS/script_Advanced_analysis/BOLD-database/bold-20230901
测试路径
/TJPROJ7/META_ASS/16s/chenjiawei/X101SC23042813-Z01/X101SC23042813-Z01-J008/cfx-20230908