Method Article

Análisis transcriptómico basado en datos de ARN-seq a granel

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El protocolo actual establece una cadena completa para analizar el proceso de RNA-seq a granel desde los datos brutos hasta el análisis de enriquecimiento funcional.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El hígado graso no alcohólico (NAFL) suele considerarse una condición benigna; sin embargo, una vez que progresa a esteatohepatitis no alcohólica (NASH), los pacientes enfrentan un riesgo significativamente mayor de desarrollar enfermedad hepática en fase terminal. Muchos estudios intentan esclarecer el mecanismo molecular que subyace a la transición de NAFL a NASH. Las tecnologías de secuenciación de alto rendimiento (como el ARN-seq a granel) han proporcionado a los investigadores una comprensión más profunda al examinar el transcriptoma, revelar la expresión de moléculas, la activación de vías de señalización y otros factores asociados a la progresión de la enfermedad. Existe una gran cantidad de datos de código abierto disponibles para que los investigadores los analicen con el fin de identificar posibles objetivos para el tratamiento de enfermedades. Sin embargo, la investigación relacionada está limitada por la falta de un proceso eficiente y fiable para el análisis aguas arriba del transcriptoma. Aquí, se proporciona una línea de análisis upstream altamente reproducible y fácil de usar y posterior análisis diferencial de genes relacionados para lograr un procesamiento estandarizado y un análisis profundo de datos privados o públicos. La cadena se divide en cuatro pasos: (1) control de calidad de los datos; (2) mapeo génico; (3) análisis diferencial de genes; y (4) análisis funcional. Este proceso tiene como objetivo descubrir los mecanismos moleculares de transformación de enfermedades y ayudar a los investigadores a detectar posibles objetivos y enfoques terapéuticos mediante el análisis de datos de ARN-seq a granel.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La enfermedad hepática grasa no alcohólica (NAFLD) es la enfermedad hepática crónica más prevalente a nivel mundial, afectando a más de una cuarta parte de la población. Su incidencia ha aumentado drásticamente en las últimasdécadas 1,2,3. La creciente carga de enfermedades, especialmente su forma más avanzada, la esteatohepatitis no alcohólica (NASH), supone un gran desafío para la salud global y una gran cargaeconómica 4. La primera etapa de la NAFLD es el hígado graso no alcohólico (NAFL), que va acompañado de infla....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Para fines demostrativos, se utilizó el conjunto de datos público PRJNA1023502 generado por Lan Bai et al. para ilustrar cada paso tanto de análisis upstream comodownstream 20. Como este conjunto de datos se origina en la base de datos de acceso abierto NCBI SRA, no se requieren permisos adicionales ni aprobaciones éticas. Consulte la Tabla de Materiales para verificar todas las versiones requeridas de software y R-package. El conjunto de datos disponible públicamente PRJNA1023502 comprende 6 muestras de RNA-seq de hígado que no son NASH, 6 NAFL y 6 muestras de RNA de hígado NASH. En este proto....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El flujo de trabajo de análisis upstream para la secuencia masiva de ARN se ilustra en la Figura 1A. Este flujo de trabajo ejecuta secuencialmente los siguientes pasos clave en una plataforma Linux: primero, se realiza un riguroso control de calidad de los datos de secuenciación en bruto usando fastp para eliminar lecturas y secuencias adaptadoras de baja calidad; posteriormente, HISAT2 alinea las lecturas de alta calidad con el genoma de referencia, con Sam.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El análisis masivo de datos de RNA-seq se caracteriza como una tarea interdisciplinar que integra genómica, bioinformática, estadística e informática. Un flujo de trabajo analítico completo abarca múltiples pasos aguas arriba y posterior, incluyendo preprocesamiento de datos en bruto, control de calidad, alineación de secuencias, cuantificación a nivel génico, normalización de datos, análisis de expresión diferencial e interpretación biológica. Entre estos pasos, convertir con precisión .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Los autores declaran que no tienen ningún conflicto de interés.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Los autores desean agradecer a los mantenedores de las bases de datos públicas utilizadas en este estudio.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
biomaRtBioconductor2.64.0Anotación génica de Ensembl
clusterProfilerBioconductor4.16.0Análisis de enriquecimiento funcional
DESeq2Bioconductor1.48.1Análisis de expresión diferencial
FactoMineRAgroParisTech2.11.0ACP y análisis multivariante
fastpOpenGene1.0.1Control de calidad y filtrado de datos FASTQ
RecuentosCaracterísticasDivisión de Bioinformática, Instituto Walter y Eliza Hall de Investigación Médica2.0.0  Cuenta el número de lecturas asignadas a cada gen para la cuantificación de la expresión génica
ggplot2Postul3.5.2Visualización de datos
ggrepelKamil Slowikowski0.9.6Etiquetas de texto que no se solapan
ggridgesClaus O. Wilke0.5.6Crear gráficos de crestas
HISAT2Universidad Johns Hopkins2.2.1Alinea las lecturas filtradas de alta calidad con el genoma de referencia
REquipo Principal R  4.5.0Un entorno para la computación, análisis y visualización de datos
RColorBrewerErich Neuwirth1.1.3Paletas de colores para trazar gráficos
samtoolsCorriente de trabajo de Genómica a Gran Escala1.22.0Convertir y procesar archivos SAM para una recuperación y acceso eficientes
Kit de herramientas SRACentro Nacional de Información Biotecnológica3.2.1Obtener y preprocesar los datos de secuenciación en bruto de la base de datos NCBI SRA

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles