RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
zh_CN
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
提供了RNA测序的微分表达分析方法的详细协议:伽利马、EdgeR、DESeq2。
RNA测序(RNA-seq)是转录学中最广泛使用的技术之一,因为它可以揭示基因改变与复杂的生物过程之间的关系,在肿瘤的诊断、预后和治疗方面具有重要价值。RNA-seq 数据的微分分析对于识别异常转录至关重要,而 limma、EdgeR 和 DESeq2 是微分分析的有效工具。然而,RNA-seq差异分析需要一定的R语言技能和选择适当方法的能力,这是医学教育课程所缺乏的。
在此,我们提供详细的协议,以确定胆管癌 (CHOL) 和正常组织之间通过伽马, DESeq2 和 EdgeR 的差异表达基因 (DEG), 结果在火山地块和维恩图中显示。伽马、DESeq2 和 EdgeR 这三种方案相似,但在分析过程中有不同的步骤。例如,线性模型用于伽马体的统计,而负二元分布用于边缘R和DESeq2。此外,正常化的RNA-seq计数数据对于 EdgeR 和 limma 是必要的,但对于 DESeq2 来说不是必要的。
在这里,我们为三种微分分析方法提供了详细的协议:伽利马、EdgeR 和 DESeq2。这三种方法的结果是部分重叠的。这三种方法都有各自的优势,方法的选择只取决于数据。
RNA测序(RNA-seq)是转录学中应用最广泛的技术之一,具有许多优点(例如,高数据可重复性),并极大地增进了我们对复杂生物过程1、2的功能和动力学的理解。在不同的生物背景下识别异常记录(也称为微分表达基因 )是RNA-seq分析的关键步骤。RNA-seq 使深入了解发病机制相关的分子机制和生物功能成为可能。因此,差异分析被认为是有价值的诊断,预后和治疗肿瘤3,4,5。目前,更多的开源R/生物导体包已经开发为RNA-seq差分表达分析,特别是利马,DESeq2和EdgeR 1,6,7。然而,差异分析需要一定的R语言技能和选择适当方法的能力,这是医学教育课程所缺乏的。
在本协议中,根据从癌症基因组图集 (TCGA) 中提取的胆管癌 (CHOL) RNA-seq 计数数据,R 程序11分别执行了三种最已知的方法(limma8、EdgeR9和 DESeq210),以确定 CHOL 和正常组织之间的 DEG。伽马、EdgeR 和 DESeq2 的三种方案相似,但在分析过程中有不同的步骤。例如,EdgeR 和 limma8、9需要规范化的 RNA-seq 计数数据,而 DESeq2 则使用自己的库差异来更正数据,而不是校正10。此外,edgeR 特别适用于 RNA-seq 数据,而 limma 则用于微阵列和 RNA-seq。Limma 采用线性模型来评估 DEG12,而 edgeR 中的统计数据基于负二元分布,包括经验贝叶估计、精确测试、通用线性模型和准可能性测试9。
总之,我们分别使用 limma、DESeq2 和 EdgeR 提供 RNA-seq 差分表达分析的详细协议。通过引用本文,用户可以轻松地执行 RNA-seq 差分分析,并为其数据选择适当的差分分析方法。
注:打开 R 工作室程序并加载 R 文件"DEGs.R",该文件可以从补充文件/脚本中获取。
1. 数据的下载和预处理
2. 通过"利马"进行差异表达分析
3. 通过"边缘"进行差异表达分析
4. 通过"DESeq2"进行差异表达分析
5. 维恩图
有各种方法可视化差异表达分析的结果,其中火山图和维恩图特别使用。利马用|logFC|≥2和adj识别了 CHOL 和正常组织之间的 3323 个 DEG。P.Val<0.05作为阈值,其中1880个在CHOL组织中被降低调节,1443个被调高(图1a)。同时,EdgeR 确定了 1578 个下监管 DEG 和 3121 个向上监管的 DEG(图 1b):DESeq2 确定了 1616 个下行监管的 DEG 和 2938 个向上监管的 DEG(图 1c)。比较这三种方法的结果,1431个上调的DEG和1531个下调节的DEG是重叠的(图2)。

图1。在 CHOL 和正常组织之间识别不同表达的基因 (DEG)。 (a-c)由伽马、边缘和DESeq2获得的所有基因的火山图,分别根据折叠变化(日志2)绘制 , 红点表示受调节的DEG(调整后 的p 值<0.05和日志|FC|> 2) 和绿点表示向下调节的 DEG(调整后 的 p 值< 0.05 和日志|FC|< 2)。 请单击此处查看此图的较大版本。

图2。Venn 图显示从 limma、边缘和 DESeq2 中得出的结果之间重叠。请单击此处查看此图的较大版本。
补充文件。请点击这里下载此文件。
该手稿以前没有出版过,也没有考虑在其他地方出版。所有作者都为撰写这份重要知识内容的手稿作出了贡献,并阅读并批准了最终手稿。我们宣布没有利益冲突。
提供了RNA测序的微分表达分析方法的详细协议:伽利马、EdgeR、DESeq2。
这项工作得到了中国国家自然科学基金(81860276号赠款)和国家重点研发计划重点专项资金项目(2018YFC1003200号赠款)的支持。
| R | 版本 3.6.2 | 免费软件 | |
| Rstudio | 免费软件 |