Method Article

Análise Transcriptômica Baseada em Dados de RNA-seq em massa

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O protocolo atual estabelece um pipeline completo para analisar o processo de RNA-seq em massa, desde dados brutos até análise de enriquecimento funcional.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Fígado gordududo não alcoólico (NAFL) geralmente é considerado uma condição benigna; no entanto, uma vez que progride para esteatohepatite não alcoólica (NASH), os pacientes enfrentam um risco significativamente aumentado de desenvolver doença hepática em estágio terminal. Muitos estudos estão tentando elucidar o mecanismo molecular subjacente à transição da NAFL para a NASH. Tecnologias de sequenciamento de alto débito (como o RNA-seq em massa) proporcionaram aos pesquisadores um entendimento mais profundo ao examinar o transcriptoma, revelar a expressão de moléculas, ativação de vias de sinalização e outros fatores associados à progressão da doença. Há uma grande quantidade de dados de código aberto disponíveis para pesquisadores analisarem a fim de identificar potenciais alvos para o tratamento de doenças. No entanto, pesquisas relacionadas são limitadas pela falta de um processo eficiente e confiável para a análise a montante do transcriptoma. Aqui, é oferecido um pipeline altamente reprodutível e fácil de usar de análise upstream e subsequente análise diferencial de genes relacionados, para alcançar processamento padronizado e análise profunda de dados privados ou públicos. O pipeline é dividido em quatro etapas: (1) controle de qualidade dos dados; (2) mapeamento gênico; (3) análise diferencial de genes; e (4) análise funcional. Esse processo visa descobrir os mecanismos moleculares da transformação de doenças e auxiliar pesquisadores na triagem de potenciais alvos medicamentosos e abordagens terapêuticas por meio da análise de dados de RNA-seq em massa.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A doença hepática gordurosa não alcoólica (NAFLD) é a doença hepática crônica mais prevalente no mundo, afetando mais de um quarto da população. Sua incidência aumentou dramaticamente nas últimasdécadas 1, 2, 3. A crescente carga de doenças, especialmente sua forma mais avançada, a esteatohepatite não alcoólica (NASH), representa um grande desafio global à saúde e um pesado ônuseconômico 4. O primeiro estágio da NAFLD é o fígado gorduroso não alcoólico (NAFL), que é acompanhado de inflamação e fibrose que podem evoluir....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Para fins de demonstração, o conjunto de dados público PRJNA1023502 gerado por Lan Bai et al. foi usado para ilustrar cada etapa tanto das análises upstream quantodownstream 20. Como este conjunto de dados se origina do banco de dados de acesso aberto NCBI SRA, não são necessárias permissões adicionais ou aprovações éticas. Veja a Tabela de Materiais para verificar todas as versões necessárias de software e R-package. O conjunto de dados público PRJNA1023502 compreende 6 amostras não-NASH, 6 NAFL e 6 amostras de RNA-seq hepática NASH. Neste protocolo, o conjunto de dados foi usado para demonstr....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O fluxo de trabalho de análise upstream para RNA-seq em massa é ilustrado na Figura 1A. Esse fluxo de trabalho executa sequencialmente os seguintes passos-chave em uma plataforma Linux: primeiro, um rigoroso controle de qualidade dos dados brutos de sequenciamento é realizado usando fastp para remover leituras e sequências de adaptadores de baixa qualidade; subsequentemente, o HISAT2 alinha leituras de alta qualidade ao genoma de referência, com Samtools con.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A análise de dados de RNA-seq em massa é caracterizada como uma tarefa interdisciplinar que integra genômica, bioinformática, estatística e ciência da computação. Um fluxo de trabalho analítico completo abrange múltiplas etapas upstream e downstream, incluindo pré-processamento de dados brutos, controle de qualidade, alinhamento de sequências, quantificação em nível de gene, normalização de dados, análise de expressão diferencial e interpretação biológica. Entre esses passos, converter c.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Os autores declaram que não têm conflitos de interesse.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Os autores gostariam de agradecer aos mantenedores dos bancos de dados públicos utilizados neste estudo.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
biomaRtBiocondutor2.64.0Anotação genética do Ensembl
clusterProfilerBiocondutor4.16.0Análise de enriquecimento funcional
DESeq2Biocondutor1.48.1Análise diferencial de expressão
FactoMineRAgroParisTech2.11.0ACP e análise multivariada
fastpOpenGene1.0.1Controle de qualidade e filtragem dos dados do FASTQ
Contagens de DestaquesDivisão de Bioinformática, Instituto Walter e Eliza Hall de Pesquisa Médica2.0.0  Conte o número de leituras mapeadas para cada gene para quantificação da expressão gênica
ggplot2Postular3.5.2Visualização de dados
ggrepelKamil Slowikowski0.9.6Rótulos de texto não sobrepostos
ggridgesClaus O. Wilke0.5.6Criar plots de crista
HISAT2Universidade Johns Hopkins2.2.1Alinhe as leituras filtradas de alta qualidade ao genoma de referência
REquipe Principal R  4.5.0Um ambiente para computação, análise e visualização de dados
RColorBrewerErich Neuwirth1.1.3Paletas de cores para plotar
samtoolsFluxo de trabalho em Genômica em Grande Escala1.22.0Converter e processar arquivos SAM para recuperação e acesso eficientes
Kit de Ferramentas da SRACentro Nacional de Informação em Biotecnologia3.2.1Obtenha e pré-processe dados brutos de sequenciamento a partir do banco de dados NCBI SRA

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles