目录

一、流程简介

生物地球化学循环(biogeochemical cycle)是地球系统科学中的核心研究领域之一,涉及到碳、氮、磷、硫、重金属等元素在地球圈层中的循环过程的描述、示踪和预测。微生物在生物地球化学循环中扮演着关键的驱动作用,因为它们具有多样的类型、广泛的分布和丰富的物质代谢方式。通过将微生物群落组成与碳、氮、硫、磷等生态过程联系起来,以更好地理解微生物群落的结构和功能,来促进对微生物生物过程和原位相互作用的理解。

根据文献发布的碳(甲烷)、氮、磷、硫数据库,重新串写了生物地球化学循环分析流程,以满足老师的多元化需求。

二、流程测试

  测试路径:/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3

三、流程执行

step1: 解析并校验分析点信息, 生成project.yaml

/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/cyc_CNPS.py \
  --Unigenes_fa Unigenes.readsNum.screening.fa \
  --Unigenes_len Unigenes.protein.cdhit.fa.len.xls \
  --Unigenes_even Unigenes.readsNum.even.xls  \
  --group_list all.mf.xls \
  --venn       venn.list \
  --vs_two     vs_two.list \
  --vs_multi   vs_multi.list \
  --vs_thr     vs_thr.list \
  --workdir    /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3 \
  --projectid  X101SC23062191-Z01-F005 \
  --contract   合同名称 \
  --BI sunhongtao \
  --TS sunhongtao

参数简介:

--Unigenes_fa   meta标准交付结果\n
--Unigenes_len  meta标准交付结果
--Unigenes_even meta标准交付结果
--group_list    不带表头的分组信息,支持多列

--venn          分析点控制参数: 韦恩图(<5), 花瓣图(>=5), upset图(不限制), 不限制样本和分组, 自动识别样本或分组,自动识别属于哪个分组
--vs_two        分析点控制参数: t-test                          对比组数量=2,  每个对比组样本数量需>=3, 自动识别属于哪个分组
--vs_multi      分析点控制参数: adonis anoism amova mrpp lefse  对比组数量>=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组
--vs_thr        分析点控制参数: anova K-W                       对比组数量>=3, 每个对比组样本数量需>=3, 自动识别属于哪个分组

--workdir       工作目录

--projectid     分期号          用于生成项目信息及结果文件目录
--contract      合同名称        用于生成项目信息
--BI            生信            用于生成项目信息
--TS            技术            用于生成项目信息

step2: 根据project.yaml中的信息, 在config下生成workflow.smk, 用于流程控制

/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_workflow.py \
  --project project.yaml  --workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3

step3: 打印启动脚本workflow.sh 和 run.sh

/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_start.py \
  --project project.yaml  --rules config/workflow.smk

step4: 执行以下命令启动分析

sh run.sh