目录

BOLD database简介

BOLD数据库(Barcode of Life Data Systems)主要关注DNA条形码数据,而DNA条形码通常使用线粒体COI基因作为标记,因此,BOLD数据库中的主要数据是与COI基因相关的DNA条形码序列。 但是也包含其他基因序列,包括16S,ITS基因序列等。

更新原因:客户需求使用该数据库进行扩增子物种注释,但是我们没有进行过该数据库下载和分析,弥补空缺。

数据库更新频率:每周都会更新。

官网截图

功能

下载整理了BOLD database,可用于扩增子分析

更新方法

1. 到官网下载数据库压缩包:

BOLD database网址如下:

https://www.boldsystems.org/index.php/databases

2. 对数据库文件解压缩,并使用拆分脚本将其拆分为序列和注释文件:

perl /TJPROJ1/META_ASS/script_Advanced_analysis/BOLD-database/bold-20230901/new.pl BOLD_Public.01-Sep-2023.fasta BOLD_Public.01-Sep-2023.final.fasta BOLD_Public.01-Sep-2023.final.taxonmy.txt

数据库路径:

/TJPROJ1/META_ASS/script_Advanced_analysis/BOLD-database/bold-20230901

测试路径

/TJPROJ7/META_ASS/16s/chenjiawei/X101SC23042813-Z01/X101SC23042813-Z01-J008/cfx-20230908