RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
German
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Ein detailliertes Protokoll der methoden der differentiellen Expressionsanalyse für die RNA-Sequenzierung wurde bereitgestellt: limma, EdgeR, DESeq2.
Die RNA-Sequenzierung (RNA-seq) ist eine der am weitesten verbreiteten Technologien in der Transkriptomik, da sie den Zusammenhang zwischen der genetischen Veränderung und komplexen biologischen Prozessen aufdecken kann und einen großen Wert in der Diagnostik, Prognose und Therapeutik von Tumoren hat. Die Differentialanalyse von RNA-seq-Daten ist entscheidend, um aberrante Transkriptionen zu identifizieren, und limma, EdgeR und DESeq2 sind effiziente Werkzeuge für die Differentialanalyse. Die RNA-seq-Differentialanalyse erfordert jedoch bestimmte Fähigkeiten mit der Sprache R und die Fähigkeit, eine geeignete Methode zu wählen, die im Lehrplan der medizinischen Ausbildung fehlt.
Hierin stellen wir das detaillierte Protokoll zur Identifizierung differentiell exprimierter Gene (DEGs) zwischen Cholangiokarzinom (CHOL) und normalem Gewebe durch Limma, DESeq2 bzw. EdgeR zur Verfügung, und die Ergebnisse werden in Vulkandiagrammen und Venn-Diagrammen gezeigt. Die drei Protokolle limma, DESeq2 und EdgeR sind ähnlich, haben aber unterschiedliche Schritte zwischen den Prozessen der Analyse. Beispielsweise wird ein lineares Modell für die Statistik in Limma verwendet, während die negative Binomialverteilung in edgeR und DESeq2 verwendet wird. Darüber hinaus sind die normalisierten RNA-Seq-Zähldaten für EdgeR und Limma notwendig, aber nicht für DESeq2.
Hier stellen wir ein detailliertes Protokoll für drei Differentialanalysemethoden zur Verfügung: limma, EdgeR und DESeq2. Die Ergebnisse der drei Methoden überschneiden sich teilweise. Alle drei Methoden haben ihre eigenen Vorteile, und die Wahl der Methode hängt nur von den Daten ab.
Die RNA-Sequenzierung (RNA-seq) ist eine der am weitesten verbreiteten Technologien in der Transkriptomik mit vielen Vorteilen (z. B. hohe Datenreproduzierbarkeit) und hat unser Verständnis der Funktionen und Dynamik komplexer biologischer Prozesse dramatisch verbessert1,2. Die Identifizierung von Aberrat-Transkripten unter verschiedenen biologischen Kontexten, die auch als differentiell exprimierte Gene (DEGs) bezeichnet werden, ist ein wichtiger Schritt in der RNA-seq-Analyse. RNA-seq ermöglicht ein tiefes Verständnis der pathogenesebezogenen molekularen Mechanismen und biologischen Funktionen. Daher wurde die Differentialanalyse als wertvoll für die Diagnostik, Prognose und Therapie von Tumoren3,4,5angesehen. Derzeit wurden weitere Open-Source-R/Bioconductor-Pakete für die RNA-seq-Differentialexpressionsanalyse entwickelt, insbesondere limma, DESeq2 und EdgeR1,6,7. Die Differentialanalyse erfordert jedoch bestimmte Fähigkeiten mit der Sprache R und die Fähigkeit, die geeignete Methode zu wählen, die im Lehrplan der medizinischen Ausbildung fehlt.
In diesem Protokoll wurden basierend auf den Cholangiokarzinom (CHOL) RNA-seq-Zähldaten, die aus dem Cancer Genome Atlas (TCGA) extrahiert wurden, drei der bekanntesten Methoden (Limma8, EdgeR9 und DESeq210) vom R-Programm11 durchgeführt, um die DEGs zwischen CHOL und normalem Gewebe zu identifizieren. Die drei Protokolle limma, EdgeR und DESeq2 sind ähnlich, haben aber unterschiedliche Schritte zwischen den Prozessen der Analyse. Zum Beispiel sind die normalisierten RNA-seq-Zähldaten für EdgeR und Limma8,9notwendig, während DESeq2 seine eigenen Bibliotheksdiskrepanzen verwendet, um Daten anstelle von Normalisierung10zu korrigieren. Darüber hinaus eignet sich edgeR speziell für RNA-seq-Daten, während das limma für Microarrays und RNA-seq verwendet wird. Ein lineares Modell wird von limma zur Bewertung der DEGs12übernommen, während die Statistiken in edgeR auf den negativen Binomialverteilungen basieren, einschließlich empirischer Bayes-Schätzung, exakter Tests, verallgemeinerter linearer Modelle und Quasi-Wahrscheinlichkeitstests9.
Zusammenfassend stellen wir die detaillierten Protokolle der RNA-seq-Differentialexpressionsanalyse unter Verwendung von limma, DESeq2 bzw. EdgeR zur Verfügung. Durch bezugnahmend auf diesen Artikel können Benutzer die RNA-seq-Differentialanalyse einfach durchführen und die geeigneten Differentialanalysemethoden für ihre Daten auswählen.
HINWEIS: Öffnen Sie das R-studio-Programm und laden Sie die R-Datei "DEGs.R", die Datei kann aus Ergänzenden Dateien/Skripten erworben werden.
1. Herunterladen und Vorverarbeitung von Daten
2. Differentielle Expressionsanalyse durch "Limma"
3. Differentialausdrucksanalyse durch "edgeR"
4. Differentialexpressionsanalyse durch "DESeq2"
5. Venn-Diagramm
Es gibt verschiedene Ansätze, um das Ergebnis der Differentialexpressionsanalyse zu visualisieren, unter denen insbesondere das Vulkandiagramm und das Venn-Diagramm verwendet werden. limma identifizierte 3323 DEGs zwischen dem CHOL und normalem Gewebe mit den |logFC|≥2 und adj. P.Val <0,05 als Schwellenwerte, darunter 1880 in CHOL-Geweben herunterreguliert und 1443 hochreguliert wurden (Abbildung 1a). In der Zwischenzeit identifizierte edgeR die 1578 herunterregulierten DEGs und 3121 hochregulierten DEGs (Abbildung 1b); DESeq2 identifizierte die 1616 herunterregulierten DEGs und 2938 hochregulierten DEGs (Abbildung 1c). Vergleicht man die Ergebnisse dieser drei Methoden, so überschnitten sich 1431 hochregulierte DEGs und 1531 herunterregulierte DEGs (Abbildung 2).

Abbildung 1. Identifizierung differentiell exprimierter Gene (DEGs) zwischen CHOL und normalem Gewebe. (a-c) Die Vulkandiagramme aller gene, die von limma, edgeR bzw. DESeq2 erworben wurden, adj p-Wert (-log10) wird gegen die Faltenänderung (log2) aufgezeichnet, rote Punkte repräsentieren die hochregulierten DEGs (angepasster p-Wert<0,05 und log | FC|> 2) und die grünen Punkte repräsentieren die nach unten regulierten DEGs (adjustierter p-Wert< 0,05 und log | FC|< 2). Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 2. Venn-Diagramme zeigen Überschneidungen zwischen den Ergebnissen, die aus limma, edgeR und DESeq2 abgeleitet wurden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Ergänzende Dateien. Bitte klicken Sie hier, um diese Datei herunterzuladen.
Das Manuskript wurde noch nicht veröffentlicht und wird nicht für eine Veröffentlichung an anderer Stelle in Betracht gezogen. Alle Autoren haben zur Erstellung dieses Manuskripts für wichtige intellektuelle Inhalte beigetragen und das endgültige Manuskript gelesen und genehmigt. Wir erklären, dass kein Interessenkonflikt besteht.
Ein detailliertes Protokoll der methoden der differentiellen Expressionsanalyse für die RNA-Sequenzierung wurde bereitgestellt: limma, EdgeR, DESeq2.
Diese Arbeit wurde von der National Natural Science Foundation of China (Grant No. 81860276) und Key Special Fund Projects des National Key R&D Program (Grant No. 2018YFC1003200) unterstützt.
| R | Version 3.6.2 | kostenlose Software | |
| Rstudio | kostenlose Software |