====== 一、流程简介 ======
生物地球化学循环(biogeochemical cycle)是地球系统科学中的核心研究领域之一,涉及到碳、氮、磷、硫、重金属等元素在地球圈层中的循环过程的描述、示踪和预测。微生物在生物地球化学循环中扮演着关键的驱动作用,因为它们具有多样的类型、广泛的分布和丰富的物质代谢方式。通过将微生物群落组成与碳、氮、硫、磷等生态过程联系起来,以更好地理解微生物群落的结构和功能,来促进对微生物生物过程和原位相互作用的理解。
根据文献发布的碳(甲烷)、氮、磷、硫数据库,重新串写了生物地球化学循环分析流程,以满足老师的多元化需求。
====== 二、流程测试 ======
测试路径:/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3
====== 三、流程执行 ======
step1: 解析并校验分析点信息, 生成project.yaml
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/cyc_CNPS.py \
--Unigenes_fa Unigenes.readsNum.screening.fa \
--Unigenes_len Unigenes.protein.cdhit.fa.len.xls \
--Unigenes_even Unigenes.readsNum.even.xls \
--group_list all.mf.xls \
--venn venn.list \
--vs_two vs_two.list \
--vs_multi vs_multi.list \
--vs_thr vs_thr.list \
--workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3 \
--projectid X101SC23062191-Z01-F005 \
--contract 合同名称 \
--BI sunhongtao \
--TS sunhongtao
参数简介:
--Unigenes_fa meta标准交付结果\n
--Unigenes_len meta标准交付结果
--Unigenes_even meta标准交付结果
--group_list 不带表头的分组信息,支持多列
--venn 分析点控制参数: 韦恩图(<5), 花瓣图(>=5), upset图(不限制), 不限制样本和分组, 自动识别样本或分组,自动识别属于哪个分组
--vs_two 分析点控制参数: t-test 对比组数量=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组
--vs_multi 分析点控制参数: adonis anoism amova mrpp lefse 对比组数量>=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组
--vs_thr 分析点控制参数: anova K-W 对比组数量>=3, 每个对比组样本数量需>=3, 自动识别属于哪个分组
--workdir 工作目录
--projectid 分期号 用于生成项目信息及结果文件目录
--contract 合同名称 用于生成项目信息
--BI 生信 用于生成项目信息
--TS 技术 用于生成项目信息
step2: 根据project.yaml中的信息, 在config下生成workflow.smk, 用于流程控制
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_workflow.py \
--project project.yaml --workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3
step3: 打印启动脚本workflow.sh 和 run.sh
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_start.py \
--project project.yaml --rules config/workflow.smk
step4: 执行以下命令启动分析
sh run.sh