RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
it_IT
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
È stato fornito un protocollo dettagliato di metodi di analisi dell'espressione differenziale per il sequenziamento dell'RNA: limma, EdgeR, DESeq2.
Il sequenziamento dell'RNA (RNA-seq) è una delle tecnologie più utilizzate nella trascrittomica in quanto può rivelare la relazione tra l'alterazione genetica e processi biologici complessi e ha un grande valore nella diagnostica, nella prognostica e nella terapia dei tumori. L'analisi differenziale dei dati RNA-seq è fondamentale per identificare trascrizioni aberranti e limma, EdgeR e DESeq2 sono strumenti efficienti per l'analisi differenziale. Tuttavia, l'analisi differenziale RNA-seq richiede determinate abilità con il linguaggio R e la capacità di scegliere un metodo appropriato, che manca nel curriculum di educazione medica.
Qui forniamo il protocollo dettagliato per identificare i geni differenzialmente espressi (DEG) tra il colangiocarcinoma (CHOL) e i tessuti normali attraverso limma, DESeq2 e EdgeR, rispettivamente, e i risultati sono mostrati in grafici vulcanici e diagrammi di Venn. I tre protocolli di limma, DESeq2 e EdgeR sono simili ma hanno passaggi diversi tra i processi di analisi. Ad esempio, un modello lineare viene utilizzato per le statistiche in limma, mentre la distribuzione binomiale negativa viene utilizzata in edgeR e DESeq2. Inoltre, i dati normalizzati del conteggio RNA-seq sono necessari per EdgeR e limma, ma non sono necessari per DESeq2.
Qui forniamo un protocollo dettagliato per tre metodi di analisi differenziale: limma, EdgeR e DESeq2. I risultati dei tre metodi sono in parte sovrapposti. Tutti e tre i metodi hanno i loro vantaggi e la scelta del metodo dipende solo dai dati.
Il sequenziamento dell'RNA (RNA-seq) è una delle tecnologie più utilizzate nella trascrittomica con molti vantaggi (ad esempio, un'elevata riproducibilità dei dati) e ha notevolmente aumentato la nostra comprensione delle funzioni e delle dinamiche di processi biologici complessi1,2. L'identificazione di trascritti ablati in diversi contesti biologici, noti anche come geni differenzialmente espressi (DEG), è un passo chiave nell'analisi RNA-seq. RNA-seq consente di ottenere una profonda comprensione dei meccanismi molecolari e delle funzioni biologiche correlate alla patogenesi. Pertanto, l'analisi differenziale è stata considerata preziosa per la diagnostica, la prognostica e la terapia dei tumori3,4,5. Attualmente, sono stati sviluppati più pacchetti R/Bioconductor open source per l'analisi dell'espressione differenziale RNA-seq, in particolare limma, DESeq2 e EdgeR1,6,7. Tuttavia, l'analisi differenziale richiede alcune abilità con il linguaggio R e la capacità di scegliere il metodo appropriato, che manca nel curriculum di educazione medica.
In questo protocollo, basato sui dati di conteggio RNA-seq del colangiocarcinoma (CHOL) estratti da The Cancer Genome Atlas (TCGA), tre dei metodi più noti (limma8,EdgeR9 e DESeq210)sono stati effettuati, rispettivamente, dal programma R11 per identificare i DEG tra CHOL e tessuti normali. I tre protocolli di limma, EdgeR e DESeq2 sono simili ma hanno passaggi diversi tra i processi di analisi. Ad esempio, i dati normalizzati del conteggio RNA-seq sono necessari per EdgeR e limma8,9, mentre DESeq2 utilizza le proprie discrepanze di libreria per correggere i dati invece della normalizzazione10. Inoltre, edgeR è specificamente adatto per i dati RNA-seq, mentre il limma viene utilizzato per microarray e RNA-seq. Un modello lineare è adottato da limma per valutare i DEG12, mentre le statistiche in edgeR si basano sulle distribuzioni binomiali negative, tra cui stima empirica di Bayes, test esatti, modelli lineari generalizzati e test di quasi-verosimiglianza9.
In sintesi, forniamo i protocolli dettagliati dell'analisi dell'espressione differenziale RNA-seq utilizzando rispettivamente limma, DESeq2 e EdgeR. Facendo riferimento a questo articolo, gli utenti possono facilmente eseguire l'analisi differenziale RNA-seq e scegliere i metodi di analisi differenziale appropriati per i loro dati.
NOTA: Aprire il programma R-studio e caricare il file R "DEGs.R", il file può essere acquisito da file / script supplementari.
1. Download e pre-elaborazione dei dati
2. Analisi dell'espressione differenziale attraverso "limma"
3. Analisi dell'espressione differenziale tramite "edgeR"
4. Analisi dell'espressione differenziale tramite "DESeq2"
5. Diagramma di Venn
Esistono vari approcci per visualizzare il risultato dell'analisi dell'espressione differenziale, tra cui il diagramma del vulcano e il diagramma di Venn sono particolarmente utilizzati. limma ha identificato 3323 DEG tra il CHOL e i tessuti normali con il |logFC|≥2 e adj. P.Val <0,05 come soglie, tra cui 1880 erano down-regolati nei tessuti CHOL e 1443 erano up-regolati (Figura 1a). Nel frattempo, edgeR ha identificato i 1578 DEG down-regulated e i 3121 DEG up-regulated (Figura 1b); DESeq2 ha identificato i 1616 DEG down-regulated e i 2938 DEG up-regulated (Figura 1c). Confrontando i risultati di questi tre metodi, 1431 DEG up-regulated e 1531 DEG down-regulated sono stati sovrapposti (Figura 2).

Figura 1. Identificazione di geni differenzialmente espressi (DEG) tra CHOL e tessuti normali. (a-c) I grafici del vulcano di tutti i geni acquisiti da limma, edgeR e DESeq2, rispettivamente, il valore adj p (-log10) è tracciato contro il cambiamento di piega (log2), i punti rossi rappresentano i DEG up-regolati (valore p aggiustato<0,05 e log | FC|> 2) e i punti verdi rappresentano i DEG down-regulated (valore p rettificato< 0,05 e log | FC|< 2). Fare clic qui per visualizzare una versione più grande di questa figura.

Figura 2. I diagrammi di Venn mostrano sovrapposizioni tra i risultati derivati da limma, edgeR e DESeq2. Fare clic qui per visualizzare una versione più grande di questa figura.
File supplementari. Fare clic qui per scaricare questo file.
Il manoscritto non è stato pubblicato prima e non è stato preso in considerazione per la pubblicazione altrove. Tutti gli autori hanno contribuito alla creazione di questo manoscritto per importanti contenuti intellettuali e hanno letto e approvato il manoscritto finale. Dichiariamo che non vi è alcun conflitto di interessi.
È stato fornito un protocollo dettagliato di metodi di analisi dell'espressione differenziale per il sequenziamento dell'RNA: limma, EdgeR, DESeq2.
Questo lavoro è stato sostenuto dalla National Natural Science Foundation of China (Grant No. 81860276) e dai Key Special Fund Projects del National Key R&D Program (Grant No. 2018YFC1003200).
| R | versione 3.6.2 | software gratuito | |
| Rstudio | software gratuito |