天津软件路径:
/PUBLIC/software/HUMAN/bin/genePredToBed;
/PUBLIC/software/HUMAN/bin/gtfToGenePred
南京软件路径: /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed
##GenePred /PUBLIC/software/HUMAN/bin/gtfToGenePred -ignoreGroupsWithoutExons -allErrors /NJPROJ1/RNA/database/genome/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94.gtf Homo_sapiens_Ensemble_94_flat.txt ##bed /PUBLIC/software/HUMAN/bin/genePredToBed Homo_sapiens_Ensemble_94_flat.txt hg19.bed
利用RseQC里面的一个脚本进行分析
geneBody_coverage.py -r hg19.bed -i E20_3.bam -o /NJPROJ2/RNA/personal_dir/jiangkai/software/genePredToBed/out
如何bam文件大于等于三个,会绘制热图,如果小于三个只绘制饱和曲线图
样品的排序通过饱和度的偏态分布,具有最好(最差)的覆盖度的样品将会在热图的顶端(底部)
覆盖度的偏态是通过皮尔斯偏态系数进行计算
Only input sorted and indexed BAM file(s).
Genes/transcripts with mRNA length < 100 will be skipped (Number specified to “-l” cannot be < 100).
长度小于100的gene和转录本将会跳过计算,但是可以设置参数 -l 来保证小于100的gene和转录本进行计算
根据bed文件将每个转录本按照长度分成100份(分位数),然后根据bam文件,检测每一份上的覆盖度的信号,进行标准化,最后进行可视化