======reads在基因上的覆盖度测试====== =====软件===== 天津软件路径:\\ /PUBLIC/software/HUMAN/bin/genePredToBed; /PUBLIC/software/HUMAN/bin/gtfToGenePred 南京软件路径: /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed ====bed文件生成方法==== ##GenePred /PUBLIC/software/HUMAN/bin/gtfToGenePred -ignoreGroupsWithoutExons -allErrors /NJPROJ1/RNA/database/genome/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94.gtf Homo_sapiens_Ensemble_94_flat.txt ##bed /PUBLIC/software/HUMAN/bin/genePredToBed Homo_sapiens_Ensemble_94_flat.txt hg19.bed ====geneBody_coverage.py==== 利用RseQC里面的一个脚本进行分析\\ geneBody_coverage.py -r hg19.bed -i E20_3.bam -o /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed/out ====结果展示==== {{zhangxin:genebody.png?400|}} ====官网==== http://rseqc.sourceforge.net/#genebody-coverage-py ====文件说明==== 如何bam文件大于等于三个,会绘制热图,如果小于三个只绘制饱和曲线图\\ 样品的排序通过饱和度的偏态分布,具有最好(最差)的覆盖度的样品将会在热图的顶端(底部)\\ 覆盖度的偏态是通过皮尔斯偏态系数进行计算\\ Only input sorted and indexed BAM file(s).\\ Genes/transcripts with mRNA length < 100 will be skipped (Number specified to “-l” cannot be < 100).\\ 长度小于100的gene和转录本将会跳过计算,但是可以设置参数 -l 来保证小于100的gene和转录本进行计算\\ 根据bed文件将每个转录本按照长度分成100份(分位数),然后根据bam文件,检测每一份上的覆盖度的信号,进行标准化,最后进行可视化\\