======Gistic的高频CNV表达量有相关性 使用文档====== from 张志明 https://note.youdao.com/ynoteshare/index.html?id=7c82b5a551bf3a88517933a838d64f06&type=note&_time=1671096674192 1、 模块介绍 /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Box_CNV_FPKM.py /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/CNV_FPKM.py   对Gistic的高频CNV进行验证,其是否与表达量有相关性 2、 使用方法 Gistic文件,建议使用Gistic中的Amplification_CNVs.genes.xls ,文件必须保留题头 和Deletion_CNVs.genes.xls D1R2, DNA样本名及其对应的RNA样本名 列表 FPKM.xls,转录组检测的FPKM文件,建议使用2.Quantification/Quantification/Count/FPKM.xls 对其中一个文件预处理 /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Ens2Ref -i FPKM.xls 这部分工作产生原因是:转录组使用的Ensembl数据库,所以需要将ENS的基因名改为Refgene的基因名。已经有专门的程序可以做这件事情,但是由于基因名称管理混乱,所以没有加到模块中,方便这部分数据的升级。 如果是b38版本这部分工作还可以使用如下代码代替,这部分考虑更加周全,后续可以升级b37: python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/change.ensg2name.py FPKM.xls E2R_FPKM.xls 开始分析: #source /PUBLIC/software/Cancer/lishaobo/exp/exppy2.sh 最初版本 #/TJPROJ6/RNA_SH/software/conda/conda/envs/python_2.7/bin/python 也可以使用这个 python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/CNV_FPKM.py \ -m Somatic_mutation.maf \ -f E2R_FPKM.xls \ -g genelist \ -o ./Landscape_Fpkm python /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/Box_CNV_FPKM.py \ -A Amplification_CNVs.genes.xls \ -D Deletion_CNVs.genes.xls \ -s D1R2 \ -f E2R_FPKM.xls \ -o ./Box_CNV_FPKM      测试路径: /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/test/CNV_FPKM /PUBLIC/software/Cancer/lishaobo/softtest/Advanalysis/DNA_RNA/test/BoxCNV_FPKM