DESeq2
DESeq2的差异表达分析步骤
具体步骤参见下面流程图中的蓝色部分:
简单地说,DESeq2将对原始reads进行建模,使用标准化因子(scale factor)来解释库深度的差异。然后,DESeq2估计基因的离散度,并缩小这些估计值以生成更准确的离散度估计,从而对reads count进行建模。最后,DESeq2拟合负二项分布的模型,并使用Wald检验或似然比检验进行假设检验。
为什么说DESeq2复杂呢?因为上一篇文章讲了七个步骤,也仅仅只是完成了这个流程图中Estimate size facors这一步。
在使用DESeq2进行基因表达差异分析之前,最重要的是明确我们的研究目的,了解数据中的变异来源。一旦我们了解了数据的主要变异来源,就可以在分析之前提前移除它们,或者通过将这些变量包含在统计模型的公式中对它们进行分析。