查看原文
其他

limma和edgeR对RNA-seq表达矩阵差异分析的区别

生信技能树 生信技能树 2022-06-06


前面我们在生信技能树系统性介绍了大量RNA-seq相关背景知识,以及表达矩阵分析的一般流程

其中差异分析我们使用了limma/voom,edgeR,DESeq2这3个流程,很多朋友比较感兴趣到底应该是选择哪一个,而且它们的区别是?

具体的统计学原理我们推荐大家看:

这里我们直接看效果,正好最近重新复习TCGAbiolinks看到了这个图。

学徒作业,完成两个火山图,一个logFC的散点图,一个UpSet图

步骤分解:

  • 从UCSC的XENA数据库里面下载TCGA-BRCA 的counts值矩阵

  • 从UCSC的XENA数据库里面下载TCGA-BRCA 的亚型信息

  • 使用 limma or edgeR 对下载的counts值矩阵根据亚型信息进行差异分析

  • 差异分析结果做火山图

  • 差异分析结果做logFC的散点图

  • 差异分析结果做UpSet图

DEA analyses of TCGA-BRCA data comparing luminal subtypes with normal samples. A-B) Volcano plots are shown where only those genes with logFC higher than 6 or lower than-6 are labelled and only the significant up-or down-regulated genes are shown as dots.

We carried out DEA using the limma (A) or edgeR pipelines (B) of TCGAbiolinks. C) The correlation plot between the logFC estimated by the two pipelines for the top 500 DE genes is shown. The genes discussed in the main text are highlighted in bold. D) The intersect between all the DE genes estimated by the two pipelines is shown using UpSet. https://doi.org/10.1371/journal.pcbi.1006701.g003

TCGAbiolinks值得大家仔细学习

现在的CNS文章,或多或少使用一些TCGA教程,你把这个R包学习10遍,写成200篇自己的笔记,未来一年的学习计划。

这个包涵盖了TCGA的方方面面:https://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html

这里面的每一个case都值得你花几个小时去学习!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存