目录

wgbs-rna联合分析说明文档

原wiki链接:

http://192.168.47.160:8080/wiki/GB/doku.php?id=products_tr:pipelines:wgbs-rna联合分析&do=edit

1.准备文件

在执行目录新建rna_seq文件夹,软链rna项目的03.Result文件夹,如下图所示

在执行目录下新建methydir文件夹,软链甲基化项目的03.Result文件夹和05.CX_report文件夹,如下图所示

在执行目录下准备prepare.sh脚本

perl /TJPROJ2/GB/PUBLIC/source/GB_TR/epi/WGBS/gb_epi_wgbs/mRNA_WGBS_combine_analysis/WGBS_RNA/new_associate_prepare.pl \
  -methydir `pwd`/methydir \
  -refdir `pwd`/rna_seq \
  -Genomedir /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Annotation/WGBS/Genome_Reg/all \
  -outdir `pwd`/Prepare \
  -fai /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Sequence/WholeGenomeFasta/genome.fa.fai \
  -group AF_1:AF_2:AF_3,PF_1:PF_2:PF_3,EF_1:EF_2:EF_3 \
  -groupname AF,PF,EF \
  -compare 1:2,1:3,2:3 \
  -report_features CGI,CGI_shore,promoter,utr5,exon,intron,utr3,repeat,genebody,upstream_2k,downstream_2k \
  -Biorepeat yes \
  -genenamefile  /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Annotation/Genes/genenamefile.txt \
  -push_pom yes \
  -batchid batchid

-methydir        甲基化结果准备路径
-refdir          rna结果准备路径
-Genomedir       Genome_Reg bed文件的路径
-outdir          准备分析所需文件的路径
-fai             基因组fai文件
-group           样本分组方式,组内用:分割,组间用,分割
-groupname       组名,与group位置对应
-compare         比较组分组方式,比较组内用:分割,比较组间用,分割,数字为groupname的顺序
-report_feature  需要做的features
-Biorepeat       是否有生物学重复
-genenamefile    genenamefile文件
-push_pom        yes or no
-pom_database    formal or test,默认formal
-batchid         分期号

执行prepare.sh脚本后,进入Prepare文件夹,执行sjm_prepare.sh脚本

2.分析部分

在执行目录下准备run.sh脚本

perl  /TJPROJ2/GB/PUBLIC/source/GB_TR/epi/WGBS/gb_epi_wgbs/mRNA_WGBS_combine_analysis/WGBS_RNA/new_Association_Pipeline.pl \
  --project X101SCXXXXXXXX-ZXX-XXXX_sus_scrofa,XXX合同,X101SCXXXXXXXX-ZXX-XXXX \
  --preparedir `pwd`/Prepare \
  --species ssc \
  --group AF_1:AF_2:AF_3,PF_1:PF_2:PF_3,EF_1:EF_2:EF_3 \
  --groupname AF,PF,EF \
  --compare 1:2,1:3,2:3 \
  --features CGI,CGI_shore,promoter,utr5,exon,intron,utr3,repeat,genebody,upstream_2k,downstream_2k\
  --autogenome /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1 \
  --product_source gn \
  --push_pom yes

--project           分期号_物种拉丁名,分期名,分期号
--preparedir        准备分析所需文件的路径
--species           kegg id
--group             样本分组方式,组内用:分割,组间用,分割
--groupname         组名,与group位置对应
--compare           比较组分组方式,比较组内用:分割,比较组间用,分割,数字为groupname的顺序
--features          需要做的features
--autogenome        自动化准备参考基因组路径,如手动提供文件,可使用--fa,--gtf,--chrlist,--goann参数
--product_source    gn或hw
--push_pom          yes or no
--pom_database      formal or test,默认formal

执行prepare.sh脚本后,执行sjm_Associate_analysis.sh脚本

检查结果后执行release.sh脚本整理释放文件