======reads在基因上的覆盖度测试====== =====软件===== 天津软件路径：\\ /PUBLIC/software/HUMAN/bin/genePredToBed； /PUBLIC/software/HUMAN/bin/gtfToGenePred 南京软件路径： /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed ====bed文件生成方法====


##GenePred
/PUBLIC/software/HUMAN/bin/gtfToGenePred -ignoreGroupsWithoutExons -allErrors /NJPROJ1/RNA/database/genome/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94.gtf Homo_sapiens_Ensemble_94_flat.txt
##bed
/PUBLIC/software/HUMAN/bin/genePredToBed Homo_sapiens_Ensemble_94_flat.txt hg19.bed

====geneBody_coverage.py==== 利用RseQC里面的一个脚本进行分析\\


geneBody_coverage.py -r hg19.bed -i E20_3.bam -o /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed/out

====结果展示==== {{zhangxin:genebody.png?400|}} ====官网==== http://rseqc.sourceforge.net/#genebody-coverage-py ====文件说明==== 如何bam文件大于等于三个，会绘制热图，如果小于三个只绘制饱和曲线图\\ 样品的排序通过饱和度的偏态分布，具有最好（最差）的覆盖度的样品将会在热图的顶端（底部）\\ 覆盖度的偏态是通过皮尔斯偏态系数进行计算\\ Only input sorted and indexed BAM file(s).\\ Genes/transcripts with mRNA length < 100 will be skipped (Number specified to “-l” cannot be < 100).\\ 长度小于100的gene和转录本将会跳过计算，但是可以设置参数 -l 来保证小于100的gene和转录本进行计算\\ 根据bed文件将每个转录本按照长度分成100份（分位数），然后根据bam文件，检测每一份上的覆盖度的信号，进行标准化，最后进行可视化\\