======单菌框架图新流程运行方法====== 框架图新流程手动分析目前只测试了细菌项目,流程还有不完善的地方。 现整理了相关流程步骤如下: ======准备工作====== **1. 切换liuqingqing账号:** ###刘庆庆账号已无法使用,需要使用个人账号进行测试### 该流程是根据分期号自动抓取数据路径,所以需要liuqingqing账号权限才可以进行抓取 ======运行步骤====== #######以下是新流程(数据库更新)####### **1. 如果是重分析,可以根据分期号,自动生成分析的json文件:** /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v3/denovo_main_pipline.py config -s X101SC24032793-Z01-F001 **2. 假设是新下机路径或合并重分析或提供结果文件分析,此时不可根据分期号自动生成分析的json文件,需要手动生成json:** 需要配置以下脚本生成json: /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v3/denovo_main_pipline.py config \ -s X101SC24032793-Z01-F005 \ -r raw.list \ -w /TJPROJ7/META_ASS/16s/chenjiawei/X101SC24032793-Z01/X101SC24032793-Z01-F005/kjt-20240409 \ -c Y \ -i true \ -p 天津医科李静老师单菌分析技术服务(委托)合同 \ -t H101SC24032793 参数说明: /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v3/denovo_main_pipline.py config -h Usage: denovo_main_pipline.py config [OPTIONS] Options: -s, --stageid TEXT 分期号 [required] -r, --rawlist TEXT 下机路径信息[诺禾ID\t样本名\t路径\tinsertSize\t基因组大小\t文库] -w, --workdir TEXT 工作路径 -c, --cleandata [Y|N] 是否交付clean -i, --chinese [true|false] 是否为国内项目 -p, --pjname TEXT 合同名 -t, --contractid TEXT 合同编号 -h, --help Show this message and exit. rawlist格式示例: FKDN230602972-1A HSCGJ01 /TJPROJ4/XJ/department_data-nova/5001/240403_A00783_1544_BH7YMYDSXC-new 350 1000 FDSW230602972-2r **3. 根据生成的json文件,打印分析脚本:** /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v3/denovo_main_pipline.py bac -c analysis.json 注:细菌:bac 真菌:fun 此步执行后会生成sjm投递的work.sh **4. sjm投递任务:** nohup sh work.sh & #######以下是旧流程####### **1. 如果是重分析,可以根据分期号,自动生成分析的json文件:** /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v2/denovo_main_pipline.py config -s X101SC24032793-Z01-F001 **2. 假设是新下机路径或合并重分析或提供结果文件分析,此时不可根据分期号自动生成分析的json文件,需要手动生成json:** 需要配置以下脚本生成json: /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v2/denovo_main_pipline.py config \ -s X101SC24032793-Z01-F005 \ -r raw.list \ -w /TJPROJ7/META_ASS/16s/chenjiawei/X101SC24032793-Z01/X101SC24032793-Z01-F005/kjt-20240409 \ -c Y \ -i true \ -p 天津医科李静老师单菌分析技术服务(委托)合同 \ -t H101SC24032793 参数说明: /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v2/denovo_main_pipline.py config -h Usage: denovo_main_pipline.py config [OPTIONS] Options: -s, --stageid TEXT 分期号 [required] -r, --rawlist TEXT 下机路径信息[诺禾ID\t样本名\t路径\tinsertSize\t基因组大小\t文库] -w, --workdir TEXT 工作路径 -c, --cleandata [Y|N] 是否交付clean -i, --chinese [true|false] 是否为国内项目 -p, --pjname TEXT 合同名 -t, --contractid TEXT 合同编号 -h, --help Show this message and exit. rawlist格式示例: FKDN230602972-1A HSCGJ01 /TJPROJ4/XJ/department_data-nova/5001/240403_A00783_1544_BH7YMYDSXC-new 350 1000 FDSW230602972-2r **3. 根据生成的json文件,打印分析脚本:** /TJPROJ7/GB_MICRO/PUBLIC/source/Denovo_v2/denovo_main_pipline.py bac -c analysis.json 注:细菌:bac 真菌:fun 此步执行后会生成sjm投递的work.sh **4. sjm投递任务:** nohup sh work.sh & 注: 最后三步有顺序问题,前端还未修改,all_statFunc_*,result_report_*,get_Delivery_*,整个流程跑完后需要重新按顺序跑一遍这三步。 ======指定spade软件进行后续分析方法====== 与旧框架图逻辑一致,细菌框架图还是使用三种软件进行组装soap denovo,spade,adyss;然后使用CISA整合,客户会反馈组装结果碎,需要更换软件进行组装的需求,一般情况下更换spade即可。 执行以下脚本即可完成流程修改用于仅使用spade组装结果进行后续分析: #移动到job文件目录 cd */script #备份原job文件 mv *.job *job.ori #生成修改后的job,并完成脚本替换 perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/new-kjt/spade.pl *job.ori *.job sjm script/*.job 流程测试路径: /TJPROJ7/META_ASS/16s/chenjiawei/X101SC24032793-Z01/X101SC24032793-Z01-F001/kjt-20240329 ======需要排污进行后续分析方法====== 排污方法与旧流程逻辑一致,如果遇到GC-depth图中有多个中心的情况,可以使用脚本进行排污,具体操作顺序是: ①将框架图流程第二步组装跑完。 ②到02.Assembly/01.run_assembly/*/04.gapclose下完成不同中心的序列提取。 ③将提取中心的序列到microNT中进行比对注释,获取各个中心序列的物种信息,再决定保留哪个中心的序列进行后续分析。 ④重新跑第二步组装的后续步骤,接入到整个流程中。 ======运行步骤====== **1. 前面刷出重分析脚本,得到sjm文件,在第二步组装的最后一步脚本最后加入exit 1:** sed -i '$a\exit 1' script/02.Assemble/*getFinal*sh **2. sjm投递重分析,由于加入了exit 1,流程跑到第二步结束后会failed停止:** **3. 可以观察各样本的GC-depth图,完成不同中心的序列提取,microNT比对,保留序列步骤** 注:该部分均需要手动操作,需要看图决定脚本参数 提取序列脚本如下: /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/dup/dup.sh 和microNT比对脚本如下: /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/dup/blast.sh 备份原始的02.Assembly/01.run_assembly/*/04.gapclose/all.scafSeq.500 为02.Assembly/01.run_assembly/*/04.gapclose/all.scafSeq.500.ori 将保留的序列替换为02.Assembly/01.run_assembly/*/04.gapclose/all.scafSeq.500 **4. 生成新的sjm job脚本,用于投递第二步的最后一步05.remove_pulution** perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/new-kjt/dup.pl *.job *.dup.job **5. sjm投递第二步的最后一步05.remove_pulution** source /home/liuqingqing/bash_profile_for_meta sjm *.dup.job 注:由于最后一步的结尾仍是exit 1,流程结束后,可以查看去污效果,若不理想可反复执行4-5步骤,直到得到理想去污结果 **6. 接入到后续标准流程** 若得到理想的去污结果,需要将首次的sjm job的stat文件中的failed 替换为done,然后sjm投递*job.status