用户工具

站点工具


甲基化结果文件6.compare_dm_analysis中文件来源解读

甲基化结果文件6.compare_DM_Analysis中文件来源解读

6.1.DMR_results

*.DMR.all.result.xls DMR所有结果
*.DMR.result.xls DMR所有结果中前10000条结果(所有结果少于10000时,与*.DMR.all.result.xls是相同)
*.result.annotation.xls 对*.DMR.result.xls文件进行注释,结果中只包含了有注释的,没有注释的DMR不在表格中
*.result.hyper.annotation.xls 对*.result.annotation.xls分类,第8列diff.Methy大于0
*.result.hypo.annotation.xls 对*.result.annotation.xls分类,第8列diff.Methy小于0

各文件readme如下:
1、*.DMR.result.xls

  为DMR分析结果文件,各列信息如下:
     1、染色体ID
     2、DMR起始位点
     3、DMR终止位点
     4、DMR长度
     5、DMR区域位点数目
     6、case组平均甲基化水平
     7、control组平均甲基化水平
     8、差异甲基化水平
     9、统计显著值,反应DMR整体差异,其绝对值越大差异越显著
     10、序列环境类型
  PS:.DMR.all.result.xls 为DSS软件鉴定的所有DMR,如果每种序列环境(CG,CHG,CHH)DMR数目大于10000,
     则选择该context中显著值较高的10000个区域进行后续分析

2、*.DMR.result.annotation.xls

  为DMR分析注释结果,各列信息如下:
     1、染色体ID
     2、DMR起始位点
     3、DMR终止位点
     4、DMR长度
     5、DMR区域位点数目
     6、case组平均甲基化水平
     7、control组平均甲基化水平
     8、差异甲基化水平
     9、统计显著值,反应DMR整体差异,其绝对值越大差异越显著
     10、序列环境类型
     11、区域ID(可能是基因ID,repeatID,CGI位置信息)
     12、区域类型
     13、若为基因ID相关区域,并且有基因名称和相关描述
     14、基因相关描述

3、*.DMR.result.(hyper/hypo).annotation.xls

    为DMR中hyper/hypo区域注释结果,各列信息如*.DMR.result.annotation.xls文件一致
    

6.3.DMR_plot

4.annot_region_distribution

为DMR锚定区域的Hyper/Hypo数量分布
*.(CG/CHG/CHH).DMRs_generegion.distribution.pdf : 为各个类型的DMR锚定区域分布,pdf格式
*.(CG/CHG/CHH).DMRs_generegion.distribution.png : 为各个类型的DMR锚定区域分布,png格式
*.(CG/CHG/CHH).region.txt :为各个类型的DMR锚定区域分布,
         各列信息为(1、gene_region:基因功能区域;2、number:DMR数目;3、DMR_type:DMR类型Hyper/Hypo),此为作图数据
         

*.(CG/CHG/CHH).region.txt 是根据*.DMR.result.annotation.xls(有注释的结果全部来源于这里,在统计个数的时候。同一个DMR注释到不同gene的相同功能区算做一次计数,即1,2,3,10,12会有重复,在去除重复的情况下计数) 和 *.DMR.result.xls(主要是other_region的数量,加了那些没有注释的结果)的结果。

甲基化结果文件6.compare_dm_analysis中文件来源解读.txt · 最后更改: 2022/10/11 02:27 由 zhangxin