目录

简介

meta分析流程中,由于CARD数据库分析流程与其他数据库(CAZy,KEGG,eggNOG)差异较大,主要体现在丰度表格式不同,所以流程没有CARD数据库的PCA,PCoA和NMDS分析。 现依照KEGG流程补充此部分分析,主要思路体现在对输入文件内容的更改,使其适配脚本逻辑。

功能

具体包括三个分析点:PCA,PCoA,NMDS

数据准备

1. PCA分析的输入文件:

CARD PCA分析脚本所用数据为stat.ARO.relative.xls,需要对其进行处理,第一列列名删掉,将最后一行的NonARO替换为Others。

2. PCoA分析的输入文件:

CARD PCoA分析脚本所用数据也是stat.ARO.relative.xls,需要对其进行处理,将第一列复制添加到最后一列,将最后一列列名删掉,将最后一行的NonARO替换为Others。

文件内容修改后,还需要将文件名称名称从stat.ARO.relative.xls 改为ARO.relative.stat.xls,因为脚本逻辑以“.”分割,将-2(倒数第二个元素)作为层级(KEGG中的level1,2,3),所以脚本中最后的内容ARO.relative作为前缀(KEGG为Unigenes.relative)

此外脚本识别的是文件夹,需要新建Relative文件夹,将改名后的文件放入其中。

3. NMDS分析的输入文件:

CARD NMDS分析脚本所用数据为stat.ARO.absolute.xls,需要对其进行处理,将第一列复制添加到最后一列,将最后一列列名改为Description,将最后一行的NonARO替换为Others。

对丰度表的数据处理可以写脚本,也可以vim进行处理。

数据分析

1. PCA分析脚本:

perl /PUBLIC/software/MICRO/share/MetaGenome_pipeline/MetaGenome_pipeline_V5.1/lib/05.Function/lib/KEGG/../../../00.Commbin/PCA/PCA.R.pl 绝对路径/stat.ARO.relative.xls 绝对路径/all.mf 绝对路径/PCA 2>pca.log

2. PCoA分析脚本:

perl /PUBLIC/software/MICRO/share/MetaGenome_pipeline/MetaGenome_pipeline_V5.1/lib/05.Function/lib/KEGG/../../../00.Commbin/PCoA/pcoa_plot.pl 绝对路径/Relative/ 绝对路径/all.mf 绝对路径/PCoA ARO.relative

注:ARO.relative为设置输出文件前缀名称

3. NMDS分析脚本:

perl /PUBLIC/software/MICRO/share/MetaGenome_pipeline/MetaGenome_pipeline_V5.1/lib/05.Function/lib/KEGG/../../../00.Commbin/NMDS/NMDS.R.pl 绝对路径/stat.ARO.absolute.xls 绝对路径/all.mf 绝对路径/NMDS -T 2>log

注:all.mf为样本/分组信息,以制表符分割