RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
pt_BR
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Foi fornecido um protocolo detalhado de métodos de análise de expressão diferencial para sequenciamento de RNA: limma, EdgeR, DESeq2.
O sequenciamento de RNA (RNA-seq) é uma das tecnologias mais utilizadas em transcriptômica, pois pode revelar a relação entre a alteração genética e os processos biológicos complexos e tem grande valor em diagnósticos, prognósticos e terapêuticas de tumores. A análise diferencial dos dados do RNA-seq é crucial para identificar transcrições aberrantes, e limma, EdgeR e DESeq2 são ferramentas eficientes para análise diferencial. No entanto, a análise diferencial do RNA-seq requer certas habilidades com linguagem R e a capacidade de escolher um método adequado, que está faltando no currículo da educação médica.
Aqui, fornecemos o protocolo detalhado para identificar genes expressos diferencialmente (DEGs) entre o cholangiocarcinoma (CHOL) e os tecidos normais através de limma, DESeq2 e EdgeR, respectivamente, e os resultados são mostrados em parcelas vulcânicas e diagramas de Venn. Os três protocolos de limma, DESeq2 e EdgeR são semelhantes, mas têm etapas diferentes entre os processos da análise. Por exemplo, um modelo linear é usado para estatísticas em limma, enquanto a distribuição binomial negativa é usada em edgeR e DESeq2. Além disso, os dados de contagem de RNA-seq normalizados são necessários para EdgeR e limma, mas não é necessário para o DESeq2.
Aqui, fornecemos um protocolo detalhado para três métodos de análise diferencial: limma, EdgeR e DESeq2. Os resultados dos três métodos são parcialmente sobrepostos. Todos os três métodos têm suas próprias vantagens, e a escolha do método depende apenas dos dados.
O RNA-sequenciamento (RNA-seq) é uma das tecnologias mais utilizadas em transcriptômicas com muitas vantagens (por exemplo, reprodutibilidade de dados elevados), e aumentou drasticamente nossa compreensão das funções e dinâmicas dos processos biológicos complexos1,2. A identificação de transcrições aberratas em diferentes contextos biológicos, também conhecidos como genes expressos diferencialmente (DEGs), é um passo fundamental na análise do RNA-seq. O RNA-seq torna possível obter uma compreensão profunda dos mecanismos moleculares relacionados à patogênese e funções biológicas. Portanto, a análise diferencial tem sido considerada valiosa para diagnósticos, prognósticos e terapêuticas de tumores3,4,5. Atualmente, mais pacotes de R/Bioconductor de código aberto foram desenvolvidos para análise de expressão diferencial RNA-seq, particularmente limma, DESeq2 e EdgeR1,6,7. No entanto, a análise diferencial requer certas habilidades com linguagem R e a capacidade de escolher o método adequado, que está faltando no currículo da educação médica.
Neste protocolo, com base nos dados da contagem de RNA-seq de cholangiocarcinoma (CHOL) extraídos do Atlas do Genoma do Câncer (TCGA), três dos métodos mais conhecidos (limma8, EdgeR9 e DESeq210) foram realizados, respectivamente, pelo programa R11 para identificar os DEGs entre CHOL e tecidos normais. Os três protocolos de limma, EdgeR e DESeq2 são semelhantes, mas têm etapas diferentes entre os processos de análise. Por exemplo, os dados de contagem de RNA-seq normalizados são necessários para EdgeR e limma8,9, enquanto o DESeq2 usa suas próprias discrepâncias de biblioteca para corrigir dados em vez de normalização10. Além disso, edgeR é especificamente adequado para dados RNA-seq, enquanto o limma é usado para microarrays e RNA-seq. Um modelo linear é adotado pela limma para avaliar os DEGs12,enquanto as estatísticas em edgeR são baseadas nas distribuições binomiais negativas, incluindo estimativa empírica de Bayes, testes exatos, modelos lineares generalizados e testes de quase-probabilidade9.
Em resumo, fornecemos os protocolos detalhados da análise de expressão diferencial RNA-seq utilizando limma, DESeq2 e EdgeR, respectivamente. Ao se referir a este artigo, os usuários podem facilmente realizar a análise diferencial do RNA-seq e escolher os métodos de análise diferencial adequados para seus dados.
NOTA: Abra o programa R-studio e carregue o arquivo R "DEGs.R", o arquivo pode ser adquirido a partir de arquivos suplementares/Scripts.
1. Download e pré-processamento de dados
2. Análise de expressão diferencial através de "limma"
3. Análise diferencial da expressão através do "edgeR"
4. Análise de expressão diferencial através do "DESeq2"
5. Diagrama de Venn
Existem várias abordagens para visualizar o resultado da análise de expressão diferencial, entre as quais o enredo do vulcão e o diagrama de Venn são particularmente utilizados. limma identificou 3323 DEGs entre o CHOL e tecidos normais com o |logFC|≥2 e adj. P.Val <0,05 como limiares, entre os quais 1880 foram regulados em tecidos CHOL e 1443 foram regulados(Figura 1a). Enquanto isso, o edgeR identificou os 1578 DEGs para baixo regulados e 3121 DEGs up-regulated(Figura 1b); O DESeq2 identificou os 1616 DEGs não regulamentados e 2938 DEGs up-regulated(Figura 1c). Comparando os resultados desses três métodos, foram sobrepostos 1431 DEGs up-regulated e 1531 DEGs com regulação a preços baixos(Figura 2).

Figura 1. Identificação de genes expressos diferencialmente (DEGs) entre CHOL e tecidos normais. (a-c) As parcelas vulcânicas de todos os genes adquiridos por limma, edgeR e DESeq2, respectivamente, adj p value (-log10) é plotado contra a mudança de dobra (log2), os pontos vermelhos representam os DEGs atualizados (valor p ajustado<0,05 e log | FC|> 2) e os pontos verdes representam os DEGs não regulados (valor p ajustado< 0,05 e | de registro FC|< 2). Clique aqui para ver uma versão maior desta figura.

Figura 2. Os diagramas de Venn mostram sobreposição entre os resultados derivados do limma, edgeR e DESeq2. Clique aqui para ver uma versão maior desta figura.
Arquivos Complementares. Clique aqui para baixar este Arquivo.
O manuscrito não foi publicado antes e não está sendo considerado para publicação em outros lugares. Todos os autores contribuíram para a criação deste manuscrito para conteúdo intelectual importante e leram e aprovaram o manuscrito final. Declaramos que não há conflito de interesses.
Foi fornecido um protocolo detalhado de métodos de análise de expressão diferencial para sequenciamento de RNA: limma, EdgeR, DESeq2.
Este trabalho foi apoiado pela National Natural Science Foundation of China (Grant No. 81860276) e key Special Fund Projects of National Key P&D Program (Grant No. 2018YFC1003200).
| R | versão 3.6.2 | software livre | |
| Rstudio | software livre |