差异分析中DESeq2软件的pvalue和padj会出现NA的情况,最后我们的结果中都是将padj赋值为1

DESeq2中还额外进行了independent filtering进行进一步过滤提高统计检出率。没有通过过滤标准的基因校正后的padj赋值为NA (这也是之前总被问起的DESeq2结果中NA的来源)。
DESeq2说明文档deseq2.pdf,在其中搜索independent filtering关键词即可,在第40页有相关的说明以及参考文献连接(https://www.pnas.org/doi/full/10.1073/pnas.0914005107)。

如下图

为啥P-value会出现NA呢?

可能因为在差异分析之前被筛掉了,这样搞更能提高差异分析的效能,DEseq2不会物理移走gene,但是会出现NA,可能出现NA的情况有:

(1) gene在所有样本中都是0

(2) gene中有一个样本出现离群—cook检验

(3) gene有着极低的表达—对应着high dispersion,只要你提高p值阈值,应该不会出现这种情况。也有可能被independent filting给干掉。但只有padj会受到影响