用户工具

站点工具


数据质控

两种情况质控

  1. 有下机路径,文件命名包含诺禾编号,如FKDO240072420-1A_16SV34,接下来以情况1替代
  2. 客户直接提供数据,文件命名自定义,如SC120s.1,接下来以情况2替代

根据两种情况的质控方法分别如下:

情况1

(1)首先需要配置list,包含七列分别为:文库号、标签、下机路径、诺禾编号、扩增区间、项目批次、测序通道,七列缺一不可

其中第一列、第四列、第五列、第七列都能在路径或文件信息中找到,剩余三列可自定义,第二列要求不同的标签、都三列和第六列填写相同内容 填写完list后使用:

(2)生成toml文件

''/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ13/GB_MICRO/USER/yangyuhong/script/qc_toml/tab2list.py list''

(3)在目录下mkdir log

''/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ7/GB_MICRO/PUBLIC/source/amplicon/module/splitQualityControl -PJ qc.toml -OD ./ -SD ./log''

(4)将rawdata软链接到autoDemultiplex文件夹的最底层目录下


(5)进入log目录

''for i in $(ls qc*); do qsub -V -cwd -l vf=10G,p=2 -q meta_ass.q $i; done''

一键投递所有qc任务,结果在结果文件夹(项目批次id+扩增区间)下查看

情况2

(1)首先需要配置list,包含两列分别为:诺禾编号、扩增区间,两列缺一不可


(2)生成toml文件

''/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ7/META_ASS/16s/chenlei/jiaoben/qc/bin/tab2list.py list''

(3)在目录下mkdir log

''/TJPROJ7/GB_MICRO/PUBLIC/software/amplicon/python3/bin/python /TJPROJ7/META_ASS/16s/chenlei/jiaoben/qc/bin/splitQualityControl  -PJ qc.toml -OD ./ -SD ./log''

(4)将rawdata软链接到autoDemultiplex文件夹扩增区间的最底层目录下


(5)进入log下执行toudi.sh,结果在结果文件夹(扩增区间)下查看

数据质控.txt · 最后更改: 2024/05/08 05:57 由 chenlei