MetaWRAP(https://github.com/bxlab/metaWRAP “MetaWRAP”)旨在成为一个易于使用的宏基因组数据分析软件包,从头到尾完成宏基因组分析的核心任务:序列质量控制、组装、可视化、分类分析、提取基因组草图(又称分箱binning)和功能注释。此外,metaWRAP将bin提取和分析提升到了一个新的层次(参见下面的模块概述)。虽然没有简单的最佳方法来处理宏基因组数据,但在深入研究分析参数之前,metaWRAP是一种快速而简单的方法。MetaWRAP可应用于多种环境,包括肠道、水和土壤微生物组。
样本Cleandata序列准备: fastq文件需要以gz结尾,或解压后的数据,配置在Dataclean.total.list文件内作为–in的输入参数,形如:
CL /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CL/CL_350.fq1.gz,/TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CL/CL_350.fq2.gz CS /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CS/CS_350.fq1.gz,/TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CS/CS_350.fq2.gz
可以提供contig文件,作为–in2的输入文件,形如:
CL /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/02.Assembly/CL/CL.scaftigs.fa CS /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/02.Assembly/CS/CS.scaftigs.fa
group.list 样本信息内容,用于从–in 和–in2的传入文件中选择样本进行分析 只需要一列样本名称即可
使用Bash的操作形式:
#默认分析模式 独立分析 /TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ #设置具体分析点 #/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ -s 1,2,3,4,5,6,7,8,9,10 #独立分析需要组装 #/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ --need-assemble #独立分析不需要组装,提供组装序列 #/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ -in2 total.scaftigs.list #混合分析 (混合必定重新组装) #/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list -o ./ #有一种情况,混合所有contig序列,使用cat命令将所有样本的contig 合并到一起后,将该contig命名为merge,并配置contig文件,作为--in2的输入文件,形如: merge contigfile.fna /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list -o ./ -in2 total.scaftigs.list #这样就可以作为免组装的混合组装进行分析了
完整脚本及测试路径:
/TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/ /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/example
软件github链接:
https://github.com/bxlab/metaWRAP
方法对应文献: MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis