======reads在基因上的覆盖度测试======
=====软件=====
天津软件路径:\\
/PUBLIC/software/HUMAN/bin/genePredToBed;
/PUBLIC/software/HUMAN/bin/gtfToGenePred
南京软件路径: /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed
====bed文件生成方法====
##GenePred
/PUBLIC/software/HUMAN/bin/gtfToGenePred -ignoreGroupsWithoutExons -allErrors /NJPROJ1/RNA/database/genome/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94.gtf Homo_sapiens_Ensemble_94_flat.txt
##bed
/PUBLIC/software/HUMAN/bin/genePredToBed Homo_sapiens_Ensemble_94_flat.txt hg19.bed
====geneBody_coverage.py====
利用RseQC里面的一个脚本进行分析\\
geneBody_coverage.py -r hg19.bed -i E20_3.bam -o /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed/out
====结果展示====
{{zhangxin:genebody.png?400|}}
====官网====
http://rseqc.sourceforge.net/#genebody-coverage-py
====文件说明====
如何bam文件大于等于三个,会绘制热图,如果小于三个只绘制饱和曲线图\\
样品的排序通过饱和度的偏态分布,具有最好(最差)的覆盖度的样品将会在热图的顶端(底部)\\
覆盖度的偏态是通过皮尔斯偏态系数进行计算\\
Only input sorted and indexed BAM file(s).\\
Genes/transcripts with mRNA length < 100 will be skipped (Number specified to “-l” cannot be < 100).\\
长度小于100的gene和转录本将会跳过计算,但是可以设置参数 -l 来保证小于100的gene和转录本进行计算\\
根据bed文件将每个转录本按照长度分成100份(分位数),然后根据bam文件,检测每一份上的覆盖度的信号,进行标准化,最后进行可视化\\