生物地球化学循环(biogeochemical cycle)是地球系统科学中的核心研究领域之一,涉及到碳、氮、磷、硫、重金属等元素在地球圈层中的循环过程的描述、示踪和预测。微生物在生物地球化学循环中扮演着关键的驱动作用,因为它们具有多样的类型、广泛的分布和丰富的物质代谢方式。通过将微生物群落组成与碳、氮、硫、磷等生态过程联系起来,以更好地理解微生物群落的结构和功能,来促进对微生物生物过程和原位相互作用的理解。
根据文献发布的碳(甲烷)、氮、磷、硫数据库,重新串写了生物地球化学循环分析流程,以满足老师的多元化需求。
测试路径:/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3
step1: 解析并校验分析点信息, 生成project.yaml
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/cyc_CNPS.py \ --Unigenes_fa Unigenes.readsNum.screening.fa \ --Unigenes_len Unigenes.protein.cdhit.fa.len.xls \ --Unigenes_even Unigenes.readsNum.even.xls \ --group_list all.mf.xls \ --venn venn.list \ --vs vs.list \ --workdir ./ \ --projectid X101SC23062191-Z01-F005 \ --contract 合同名称 \ --BI sunhongtao \ --TS sunhongtao 参数简介: --Unigenes_fa meta标准交付结果 --Unigenes_len meta标准交付结果 --Unigenes_even meta标准交付结果 --group_list 不带表头的分组信息,支持多列 --venn 分析点控制参数: 韦恩图(<5), 花瓣图(>=5), upset图(不限制), 不限制样本和分组, 自动识别样本或分组,自动识别属于哪个分组 --vs 参数按照对比组数量自动拆分,以下参数无需传入。直接粘贴信息搜集表lefse和metastat部分,无需关注对比组重复和最后的空制表符 #--vs_two 分析点控制参数: t-test 对比组数量=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组 #--vs_multi 分析点控制参数: adonis anoism amova mrpp lefse 对比组数量>=2, 每个对比组样本数量需>=3, 自动识别属于哪个分组 #--vs_thr 分析点控制参数: anova K-W 对比组数量>=3, 每个对比组样本数量需>=3, 自动识别属于哪个分组 --workdir 工作目录 --projectid 分期号 用于生成项目信息及结果文件目录 --contract 合同名称 用于生成项目信息 --BI 生信 用于生成项目信息 --TS 技术 用于生成项目信息
step2: 根据project.yaml中的信息, 在config下生成workflow.smk, 用于流程控制
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_workflow.py \ --project project.yaml --workdir /TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/test3
step3: 打印启动脚本workflow.sh 和 run.sh
/TJPROJ5/META_ASS/meta/sunhongtao/script/workflow_CNPS_cyc/bin/get_start.py \ --project project.yaml --rules config/workflow.smk
step4: 执行以下命令启动分析
sh run.sh