以上图为例:
chr 染色体 Start peak的起始位置 End peak的终止位置 Conc 矫正后的readcount在所有样本中均值(做了log2处理) Conc_hr1 处理组中矫正后的readcount的均值(做了log2处理) Conc_WT 对照组中矫正后的readcount的均值(做了log2处理) log2FoldChange 处理组比上对照组的log2FoldChange值(Conc_hr1 - Conc_WT) pvalue pvalue FDR 多重矫正后的p值 hr1_1_Ip 样本的矫正后的readcount hr1_2_Ip 样本的矫正后的readcount hr1_3_Ip 样本的矫正后的readcount WT_1_Ip 样本的矫正后的readcount WT_2_Ip 样本的矫正后的readcount WT_3_Ip 样本的矫正后的readcount
peak的处理:组内的样前取peak的并集,然后组间取peak的并集,作为最后分析的peak集合。由于不同的peak数据集会存在overlap,所以首先合并peak区域,当导入的peak数据集越多,理论上合并后的peak平均宽度就会越宽,overlap的peak越多,合并后的peak机会越宽。正是由于merge机制的存在,最终定量结果中的peak无论是个数还是宽度都和输入的不太一致。
peak的定量:diffbind对合并后的peak区域定量,得到每个样本readcount结果。(例如以第一行的peak为例,10.7=log2((384.26+2647.01+1992.2)/3))
差异分析:调用DESeq2或者edgeR进行差异分析。