diffband输出文件解读

以上图为例:

chr                染色体
Start              peak的起始位置
End                peak的终止位置
Conc               矫正后的readcount在所有样本中均值(做了log2处理)
Conc_hr1           处理组中矫正后的readcount的均值(做了log2处理)
Conc_WT            对照组中矫正后的readcount的均值(做了log2处理)
log2FoldChange     处理组比上对照组的log2FoldChange值(Conc_hr1 - Conc_WT)
pvalue             pvalue
FDR                多重矫正后的p值
hr1_1_Ip           样本的矫正后的readcount
hr1_2_Ip           样本的矫正后的readcount
hr1_3_Ip           样本的矫正后的readcount
WT_1_Ip            样本的矫正后的readcount
WT_2_Ip            样本的矫正后的readcount
WT_3_Ip            样本的矫正后的readcount

peak的处理:组内的样前取peak的并集,然后组间取peak的并集,作为最后分析的peak集合。由于不同的peak数据集会存在overlap,所以首先合并peak区域,当导入的peak数据集越多,理论上合并后的peak平均宽度就会越宽,overlap的peak越多,合并后的peak机会越宽。正是由于merge机制的存在,最终定量结果中的peak无论是个数还是宽度都和输入的不太一致。
peak的定量:diffbind对合并后的peak区域定量,得到每个样本readcount结果。(例如以第一行的peak为例,10.7=log2((384.26+2647.01+1992.2)/3))
差异分析:调用DESeq2或者edgeR进行差异分析。