====== wgbs-rna联合分析说明文档 ====== 原wiki链接: http://192.168.47.160:8080/wiki/GB/doku.php?id=products_tr:pipelines:wgbs-rna联合分析&do=edit =====1.准备文件===== 在执行目录新建rna_seq文件夹,软链rna项目的03.Result文件夹,如下图所示 {{ :products_tr:pipelines:lianhe1.png }} 在执行目录下新建methydir文件夹,软链甲基化项目的03.Result文件夹和05.CX_report文件夹,如下图所示 {{ :products_tr:pipelines:lianhe2.png }} 在执行目录下准备prepare.sh脚本 perl /TJPROJ2/GB/PUBLIC/source/GB_TR/epi/WGBS/gb_epi_wgbs/mRNA_WGBS_combine_analysis/WGBS_RNA/new_associate_prepare.pl \ -methydir `pwd`/methydir \ -refdir `pwd`/rna_seq \ -Genomedir /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Annotation/WGBS/Genome_Reg/all \ -outdir `pwd`/Prepare \ -fai /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Sequence/WholeGenomeFasta/genome.fa.fai \ -group AF_1:AF_2:AF_3,PF_1:PF_2:PF_3,EF_1:EF_2:EF_3 \ -groupname AF,PF,EF \ -compare 1:2,1:3,2:3 \ -report_features CGI,CGI_shore,promoter,utr5,exon,intron,utr3,repeat,genebody,upstream_2k,downstream_2k \ -Biorepeat yes \ -genenamefile /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1/Annotation/Genes/genenamefile.txt \ -push_pom yes \ -batchid batchid -methydir 甲基化结果准备路径 -refdir rna结果准备路径 -Genomedir Genome_Reg bed文件的路径 -outdir 准备分析所需文件的路径 -fai 基因组fai文件 -group 样本分组方式,组内用:分割,组间用,分割 -groupname 组名,与group位置对应 -compare 比较组分组方式,比较组内用:分割,比较组间用,分割,数字为groupname的顺序 -report_feature 需要做的features -Biorepeat 是否有生物学重复 -genenamefile genenamefile文件 -push_pom yes or no -pom_database formal or test,默认formal -batchid 分期号 执行prepare.sh脚本后,进入Prepare文件夹,执行sjm_prepare.sh脚本 =====2.分析部分===== 在执行目录下准备run.sh脚本 perl /TJPROJ2/GB/PUBLIC/source/GB_TR/epi/WGBS/gb_epi_wgbs/mRNA_WGBS_combine_analysis/WGBS_RNA/new_Association_Pipeline.pl \ --project X101SCXXXXXXXX-ZXX-XXXX_sus_scrofa,XXX合同,X101SCXXXXXXXX-ZXX-XXXX \ --preparedir `pwd`/Prepare \ --species ssc \ --group AF_1:AF_2:AF_3,PF_1:PF_2:PF_3,EF_1:EF_2:EF_3 \ --groupname AF,PF,EF \ --compare 1:2,1:3,2:3 \ --features CGI,CGI_shore,promoter,utr5,exon,intron,utr3,repeat,genebody,upstream_2k,downstream_2k\ --autogenome /TJPROJ13/GB_TR/PJ_AI/AI_genome/animal/ncbi_sus_scrofa_gcf_000003025_6_sscrofa11_1 \ --product_source gn \ --push_pom yes --project 分期号_物种拉丁名,分期名,分期号 --preparedir 准备分析所需文件的路径 --species kegg id --group 样本分组方式,组内用:分割,组间用,分割 --groupname 组名,与group位置对应 --compare 比较组分组方式,比较组内用:分割,比较组间用,分割,数字为groupname的顺序 --features 需要做的features --autogenome 自动化准备参考基因组路径,如手动提供文件,可使用--fa,--gtf,--chrlist,--goann参数 --product_source gn或hw --push_pom yes or no --pom_database formal or test,默认formal 执行prepare.sh脚本后,执行sjm_Associate_analysis.sh脚本 检查结果后执行release.sh脚本整理释放文件