目录

GSEA结果解读

1、GSEA简介

常规的GO(Gene Ontology)和pathway(KEGG)分析,属于超几何富集算法,使用的基因数据源是我们根据实验组vs对照组所获得的差异基因,其中差异基因则需要根据设置的阈值进行判断,比如p值、FDR值、Fold Change等,因此这就会涉及到人为的阈值选择,具有一定的主观性,毕竟没有一个公认的、固定的阈值标准告诉我们,这样的基因就是差异的基因,所以这种富集结果可能有一定的局限性。

基因集富集分析GSEA采用的算法则不同,使用的基因数据源是我们实验组和对照组检测到的所有基因(无论是否被人为阈值判断为差异基因),将所有基因与预定义的GSEA基因集(类似pathway、GO这样的基因与功能对应关系)进行比较、富集,从而判断基因对表型(功能)的贡献。因此,从基因集的富集角度出发,GSEA不局限于是否为差异基因,理论上更容易发现一些对生物通路/功能有细微变化(基因倍数变化小)的影响。

总的来说,二种富集分析都是可以使用的方法,而GSEA涵盖的变化基因更多,哪怕有些基因在我们看来不是”差异基因”,因此,GSEA相对来说要更为全面一些。

2、GSEA结果解读

富集分析结果分为网页报告的html版和tsv版的文本,都是表达一样的意思。表头含义如下所示:
GS:基因集的名字,详细信息等(官方版基因集可跳转到网页,查看更多基因集的信息);
SIZE:该基因集中包含在表达矩阵中的基因数目(经过条件筛选的值);
ES:基因集的富集分数,该基因集在表达数据中的基因排名列表的顶部或底部被过度代表的程度;
NES:归一化的ES值。通过标准化富集分数,GSEA解决了基因集大小以及基因集与表达矩阵之间相关性的差异问题。因此,可以使用归一化的富集分数(NES)来比较