====== 一、流程简介 ====== 生物地球化学循环(biogeochemical cycle)是地球系统科学中的核心研究领域之一,涉及到碳、氮、磷、硫、重金属等元素在地球圈层中的循环过程的描述、示踪和预测。微生物在生物地球化学循环中扮演着关键的驱动作用,因为它们具有多样的类型、广泛的分布和丰富的物质代谢方式。通过将微生物群落组成与碳、氮、硫、磷等生态过程联系起来,以更好地理解微生物群落的结构和功能,来促进对微生物生物过程和原位相互作用的理解。 根据文献发布的碳(甲烷)、氮、磷、硫数据库,重新串写了生物地球化学循环分析流程,以满足老师的多元化需求。 ====== 二、流程测试 ======   测试路径:/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3 ====== 三、流程执行 ====== step1: 解析并校验分析点信息, 生成project.yaml /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/cyc_CNPS.py \ --Unigenes_fa Unigenes.readsNum.screening.fa \ --Unigenes_len Unigenes.protein.cdhit.fa.len.xls \ --Unigenes_even Unigenes.readsNum.even.xls \ --group_list all.mf.xls \ --venn venn.list \ --vs_two vs_two.list \ --vs_multi vs_multi.list \ --vs_thr vs_thr.list \ --workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3 \ --projectid X101SC23062191-Z01-F005 \ --contract 合同名称 \ --BI sunhongtao \ --TS sunhongtao 参数简介: --Unigenes_fa meta标准交付结果\n --Unigenes_len meta标准交付结果 --Unigenes_even meta标准交付结果 --group_list 不带表头的分组信息,支持多列 --venn 分析点控制参数: 韦恩图(<5), 花瓣图(>=5), upset图(不限制), 不限制样本和分组, 自动识别样本或分组,自动识别属于哪个分组 --vs_two 分析点控制参数: t-test 对比组数量=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组 --vs_multi 分析点控制参数: adonis anoism amova mrpp lefse 对比组数量>=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组 --vs_thr 分析点控制参数: anova K-W 对比组数量>=3, 每个对比组样本数量需>=3, 自动识别属于哪个分组 --workdir 工作目录 --projectid 分期号 用于生成项目信息及结果文件目录 --contract 合同名称 用于生成项目信息 --BI 生信 用于生成项目信息 --TS 技术 用于生成项目信息 step2: 根据project.yaml中的信息, 在config下生成workflow.smk, 用于流程控制 /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_workflow.py \ --project project.yaml --workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3 step3: 打印启动脚本workflow.sh 和 run.sh /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_start.py \ --project project.yaml --rules config/workflow.smk step4: 执行以下命令启动分析 sh run.sh