======Landscape_FPKM使用文档====== 1、 模块介绍 /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py   模块目的在于对指定基因制作landscape图,观察样本突变情况,同时基于转录组表达量对选定的高频基因进行验证,检查高频突变基因是否参与表达,发挥作用。 左侧为landscape图,展示基因突变,右侧为对应的基因和样本的FPKM值 两张图中样本排序相同,但是FPKM图中只有检测了FPKM的样本,未检测的样本会被忽略 两张图中基因是对应的,未检测到的基因会被标记为灰色 Landscape_Fpkm.png 2、 使用方法 准备输入文件: maf文件,建议使用00.parper中的Somatic_mutation.maf genelist,关注的需要验证的基因列表,可使用SMG的基因 FPKM.xls,转录组检测的FPKM文件,建议使用2.Quantification/Quantification/Count/FPKM.xls 准备工作:   这部分工作产生原因是:转录组使用的Ensembl数据库,所以需要将ENS的基因名改为Refgene的基因名。已经有专门的程序可以做这件事情,但是由于基因名称管理混乱,所以没有加到模块中,方便这部分数据的升级。 export PATH=/PUBLIC/software/Cancer/lishaobo/tools:$PATH Ens2Ref -i FPKM.xls # 如果是b38流程,需要 -r b38 参数 命令会在当前目录下产生E2R_FPKM.xls,为修改后的FPKM文件。 如果是b38版本这部分工作还可以使用如下代码代替,这部分考虑更加周全,后续可以升级b37: python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/change.ensg2name.py FPKM.xls E2R_FPKM.xls 感谢志明贡献的代码 开始分析: #source /PUBLIC/software/Cancer/lishaobo/exp/exppy2.sh 最初版本 #/TJPROJ6/RNA_SH/software/conda/conda/envs/python_2.7/bin/python 也可以使用这个 python Landscape_Fpkm.py -h python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py \ -m Somatic_mutation.maf \ -f E2R_FPKM.xls \ -g genelist \ -o ./Landscape_Fpkm 结果文件: 文件名 文件介绍 Landscape_Fpkm.pdf 主图1 Only_Landscape.pdf 附图2 Only_Fpkm.pdf 附图3 Landscape_Fpkm.R 主图脚本 Only_Fpkm.R 附图3脚本 sample.fpkm fpkm 数据 sample.mut mutation 数据 tempsample.fpkm 附图3 fpkm数据 测试路径: /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/test/Landscape_Fpkm