Landscape_FPKM使用文档

1、 模块介绍

/PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py   模块目的在于对指定基因制作landscape图,观察样本突变情况,同时基于转录组表达量对选定的高频基因进行验证,检查高频突变基因是否参与表达,发挥作用。

左侧为landscape图,展示基因突变,右侧为对应的基因和样本的FPKM值 两张图中样本排序相同,但是FPKM图中只有检测了FPKM的样本,未检测的样本会被忽略 两张图中基因是对应的,未检测到的基因会被标记为灰色 Landscape_Fpkm.png

2、 使用方法 准备输入文件: maf文件,建议使用00.parper中的Somatic_mutation.maf genelist,关注的需要验证的基因列表,可使用SMG的基因 FPKM.xls,转录组检测的FPKM文件,建议使用2.Quantification/Quantification/Count/FPKM.xls 准备工作:   这部分工作产生原因是:转录组使用的Ensembl数据库,所以需要将ENS的基因名改为Refgene的基因名。已经有专门的程序可以做这件事情,但是由于基因名称管理混乱,所以没有加到模块中,方便这部分数据的升级。

export PATH=/PUBLIC/software/Cancer/lishaobo/tools:$PATH
Ens2Ref -i FPKM.xls  # 如果是b38流程,需要 -r b38 参数

命令会在当前目录下产生E2R_FPKM.xls,为修改后的FPKM文件。

如果是b38版本这部分工作还可以使用如下代码代替,这部分考虑更加周全,后续可以升级b37:

 python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/change.ensg2name.py FPKM.xls E2R_FPKM.xls

感谢志明贡献的代码

开始分析:

#source /PUBLIC/software/Cancer/lishaobo/exp/exppy2.sh            最初版本
#/TJPROJ6/RNA_SH/software/conda/conda/envs/python_2.7/bin/python  也可以使用这个
python Landscape_Fpkm.py -h

python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Landscape_Fpkm.py \
  -m Somatic_mutation.maf \
  -f E2R_FPKM.xls  \
  -g genelist \
  -o ./Landscape_Fpkm

结果文件: 文件名 文件介绍 Landscape_Fpkm.pdf 主图1

Only_Landscape.pdf 附图2

Only_Fpkm.pdf 附图3

Landscape_Fpkm.R 主图脚本

Only_Fpkm.R 附图3脚本

sample.fpkm fpkm 数据

sample.mut mutation 数据

tempsample.fpkm 附图3 fpkm数据

测试路径: /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/test/Landscape_Fpkm