VIBRANT 是一种用于自动恢复和注释细菌和古细菌病毒、确定基因组完整性以及从宏基因组组装中表征病毒群落功能的工具。VIBRANT 使用蛋白质注释特征和基因组特征的神经网络来最大限度地识别高度多样化的部分或完整病毒基因组以及切除整合的原病毒。
VIBRANT 使用三个数据库来识别病毒和表征病毒组代谢潜力:
KEGG(3月发布):https://www.genome.jp/kegg/ (FTP:ftp://ftp.genome.jp/pub/db/kofam/archives/2019-03-20/) Pfam(v32):https://pfam.xfam.org (FTP:ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam32.0/) VOG(94 版):http://vogdb.org/ (FTP: http: //fileshare.csb.univie.ac.at/vog/vog94/)
VIBRANT 专为在宏基因组上高效运行而构建,但也可以针对单个或小组基因组运行。每个Scaffold都单独考虑,因此无论scaffold作为宏基因组的一部分运行还是单独运行,结果都不会有所不同。
可以使用COBRA软件预测的scaftigs.fa序列,也可以使用bins序列,或宏基因组的Scaffold.fa序列文件,建议接入COBRA分析
默认标准分析
source /TJPROJ1/META_ASS/soft/anaconda3/bin/activate /TJPROJ1/META_ASS/soft/VIBRANT/ VIBRANT_run.py -i scaftigs.fa
如果输入文件为氨基酸格式
source /TJPROJ1/META_ASS/soft/anaconda3/bin/activate /TJPROJ1/META_ASS/soft/VIBRANT/ VIBRANT_run.py -i scaftigs.faa -f prot
常见可选参数 -t:增加 VIBRANT 并行运行的数量(类似于线程)
-f:识别核苷酸或蛋白质输入。此标志仅在输入蛋白质时才需要(-f prot),但可以与任何核苷酸输入一起添加(-f nucl)。默认值 = nucl
-folder:指定存放 VIBRANT 输出文件夹和临时文件的目录。如果指定的目录不存在,则会创建该目录。默认值 = 您当前的工作目录。
不常见的可选参数 -l:增加最小scaffold长度要求。最小值为 1000 个碱基对 ( -l 1000)。默认值 = 1000。例如,如果-l 5000调用 ,VIBRANT 将仅考虑大于或等于 5000bp 的scaffold。
-o:增加每个scaffold要求的最小开放阅读框 (ORF 或蛋白质) 数量。最小值为 4 ORF ( -o 4)。默认值 = 4。例如,如果-o 8调用 ,VIBRANT 将仅考虑编码至少 8 种蛋白质的scaffold。
-virome:应谨慎使用此标志。如果输入数据集是病毒组而不是混合宏基因组,这将编辑 VIBRANT 的敏感度。也就是说,如果您预计绝大多数输入scaffold都是病毒,则可-virome用于删除明显的非病毒scaffold。这对运行时没有影响。默认 = 关闭。
-no_plot:此标志可用于跳过生成 VIBRANT 结果的图形表示。如果您根本不需要输出图,或者由于某种原因 VIBRANT 的此功能导致程序中断,您可能希望使用此标志。这对运行时影响不大。默认 = 关闭。
VIBRANT 输出大量文件和文件夹。请参阅output_explanations.pdf父文件夹内有关 VIBRANT 生成的每个文件/文件夹的信息。每个文件和文件夹将具有与输入文件的名称相对应的前缀或后缀。
注意:一些scaffold将是从宿主scaffold中提取的原病毒。这些病毒序列将被赋予新名称。具体而言,名称后将附加术语“ _fragment_# ”,以表明它是更大scaffold的片段,与片段相关的数字在大多数情况下是任意的。
有用的输出:
已识别病毒基因组的 FASTA 文件:VIBRANT_phages_<input_file>/<input_file>.phages_combined.fna
已鉴定的病毒基因组列表:VIBRANT_phages_<input_file>/<input_file>.phages_combined.txt
已识别病毒基因组的 GenBank 文件(如果有-f nucl):VIBRANT_phages_<input_file>/<input_file>.phages_combined.gbk
注意:从scaffold上切除的整合病毒将在基因组和蛋白质名称后附加“fragment_#”。
#######路径与参考########
官方网站:https://github.com/AnantharamanLab/VIBRANT
分析路径: /TJPROJ1/META_ASS/PreSaleEvaluation/COBRA_AMGs_host/VIBRANT
引用:Kieft, K., Zhou, Z. & Anantharaman, K. VIBRANT: automated recovery, annotation and curation of microbial viruses, and evaluation of viral community function from genomic sequences. Microbiome 8, 90 (2020).