目录

MetaWRAP简介

MetaWRAP(https://github.com/bxlab/metaWRAP “MetaWRAP”)旨在成为一个易于使用的宏基因组数据分析软件包,从头到尾完成宏基因组分析的核心任务:序列质量控制、组装、可视化、分类分析、提取基因组草图(又称分箱binning)和功能注释。此外,metaWRAP将bin提取和分析提升到了一个新的层次(参见下面的模块概述)。虽然没有简单的最佳方法来处理宏基因组数据,但在深入研究分析参数之前,metaWRAP是一种快速而简单的方法。MetaWRAP可应用于多种环境,包括肠道、水和土壤微生物组。

数据准备

样本Cleandata序列准备: fastq文件需要以gz结尾,或解压后的数据,配置在Dataclean.total.list文件内作为–in的输入参数,形如:

CL      /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CL/CL_350.fq1.gz,/TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CL/CL_350.fq2.gz
CS      /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CS/CS_350.fq1.gz,/TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/01.DataClean/SystemClean/CS/CS_350.fq2.gz

可以提供contig文件,作为–in2的输入文件,形如:

CL      /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/02.Assembly/CL/CL.scaftigs.fa
CS      /TJPROJ7/MICROCOOP/Coop_project/X101SC19092528-Z02-hagongda.202006/X101SC19092528-Z02-J023.N12.meta.ngs/02.Assembly/CS/CS.scaftigs.fa

group.list 样本信息内容,用于从–in 和–in2的传入文件中选择样本进行分析 只需要一列样本名称即可

流程

使用Bash的操作形式:

#默认分析模式 独立分析
/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./
#设置具体分析点
#/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ -s 1,2,3,4,5,6,7,8,9,10
#独立分析需要组装
#/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ --need-assemble
#独立分析不需要组装,提供组装序列
#/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list --independent-analysis -o ./ -in2 total.scaftigs.list
#混合分析 (混合必定重新组装)
#/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list -o ./

#有一种情况,混合所有contig序列,使用cat命令将所有样本的contig 合并到一起后,将该contig命名为merge,并配置contig文件,作为--in2的输入文件,形如:
merge      contigfile.fna
/TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/pipeline.py -in Dataclean.total.list -g group.list -o ./ -in2 total.scaftigs.list
#这样就可以作为免组装的混合组装进行分析了

完整脚本及测试路径:

/TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/bin/
/TJPROJ1/META_ASS/script_Advanced_analysis/metaWRAP/example

软件github链接:

https://github.com/bxlab/metaWRAP


方法对应文献: MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis