1、 模块介绍
/PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py 模块目的在于对指定基因制作landscape图,观察样本突变情况,同时基于转录组表达量对选定的高频基因进行验证,检查高频突变基因是否参与表达,发挥作用。
左侧为landscape图,展示基因突变,右侧为对应的基因和样本的FPKM值 两张图中样本排序相同,但是FPKM图中只有检测了FPKM的样本,未检测的样本会被忽略 两张图中基因是对应的,未检测到的基因会被标记为灰色 Landscape_Fpkm.png
2、 使用方法 准备输入文件: maf文件,建议使用00.parper中的Somatic_mutation.maf genelist,关注的需要验证的基因列表,可使用SMG的基因 FPKM.xls,转录组检测的FPKM文件,建议使用2.Quantification/Quantification/Count/FPKM.xls 准备工作: 这部分工作产生原因是:转录组使用的Ensembl数据库,所以需要将ENS的基因名改为Refgene的基因名。已经有专门的程序可以做这件事情,但是由于基因名称管理混乱,所以没有加到模块中,方便这部分数据的升级。
export PATH=/PUBLIC/software/Cancer/lishaobo/tools:$PATH Ens2Ref -i FPKM.xls # 如果是b38流程,需要 -r b38 参数
命令会在当前目录下产生E2R_FPKM.xls,为修改后的FPKM文件。
如果是b38版本这部分工作还可以使用如下代码代替,这部分考虑更加周全,后续可以升级b37:
python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/change.ensg2name.py FPKM.xls E2R_FPKM.xls
感谢志明贡献的代码
开始分析:
#source /PUBLIC/software/Cancer/lishaobo/exp/exppy2.sh 最初版本 #/TJPROJ6/RNA_SH/software/conda/conda/envs/python_2.7/bin/python 也可以使用这个 python Landscape_Fpkm.py -h python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py \ -m Somatic_mutation.maf \ -f E2R_FPKM.xls \ -g genelist \ -o ./Landscape_Fpkm
结果文件: 文件名 文件介绍 Landscape_Fpkm.pdf 主图1
Only_Landscape.pdf 附图2
Only_Fpkm.pdf 附图3
Landscape_Fpkm.R 主图脚本
Only_Fpkm.R 附图3脚本
sample.fpkm fpkm 数据
sample.mut mutation 数据
tempsample.fpkm 附图3 fpkm数据
测试路径: /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/test/Landscape_Fpkm