Method Article

Analyse transcriptomique basée sur des données de RNA-seq en vrac

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le protocole actuel établit un pipeline complet pour analyser le processus de séquence ARN en vrac depuis les données brutes jusqu’à l’analyse d’enrichissement fonctionnel.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le foie gras non alcoolique (NAFL) est généralement considéré comme une affection bénigne ; cependant, une fois qu’elle évolue vers une stéatohépatite non alcoolique (NASH), les patients présentent un risque significativement accru de développer une maladie hépatique terminale. De nombreuses études tentent d’élucider le mécanisme moléculaire sous-jacent à la transition de NAFL à NASH. Les technologies de séquençage à haut débit (telles que l’ARN-seq en vrac) ont permis aux chercheurs d’approfondir leur compréhension en examinant le transcriptome, en révélant l’expression des molécules, l’activation des voies de signalisation et d’autres facteurs liés à la progression de la maladie. Il existe une mine de données open source à disposition pour les chercheurs afin d’identifier des cibles potentielles pour le traitement des maladies. Cependant, la recherche associée est limitée par l’absence d’un processus efficace et fiable pour l’analyse en amont du transcriptome. Ici, une chaîne d’analyse en amont hautement reproductible et conviviale ainsi qu’une analyse génétique différentielle associée sont fournies pour permettre un traitement standardisé et un analyse approfondie des données privées ou publiques. Le pipeline est divisé en quatre étapes : (1) contrôle qualité des données ; (2) cartographie génétique ; (3) analyse différentielle des gènes ; et (4) analyse fonctionnelle. Ce processus vise à découvrir les mécanismes moléculaires de la transformation des maladies et à aider les chercheurs à dépister les cibles potentielles des médicaments et les approches thérapeutiques grâce à l’analyse des données Bulk RNA-seq.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La stéatose hépatique non alcoolique (NAFLD) est la maladie chronique du foie la plus répandue au monde, touchant plus d’un quart de la population. Son incidence a augmenté de façon spectaculaire ces dernièresdécennies 1, 2, 3. La charge croissante des maladies, en particulier sa forme plus avancée, la stéatohépatite non alcoolique (NASH), représente un défi sanitaire mondial majeur et un lourd fardeau économique4. Le premier stade de la NAFLD est le foie gras non alcoolique (NAFL), accompagné d’inflammation et de fibr....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

À des fins de démonstration, le jeu de données public PRJNA1023502 généré par Lan Bai et al. a été utilisé pour illustrer chaque étape des analyses amont et aval20. Comme ce jeu de données provient de la base de données en libre accès NCBI SRA, aucune autorisation supplémentaire ni approbation éthique n’est requise. Consultez le tableau des matériaux pour vérifier toutes les versions requises des logiciels et des paquets R. L’ensemble de données disponible publiquement PRJNA1023502 comprend 6 échantillons non NASH, 6 NAFL et 6 échantillons d’ARN-seq hépatique NASH. Dans ce protocole, l’ensemble....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le flux de travail d’analyse en amont pour le seq d’ARN en vrac est illustré à la Figure 1A. Ce flux de travail exécute séquentiellement les étapes clés suivantes sur une plateforme Linux : premièrement, un contrôle de qualité rigoureux des données brutes de séquençage est effectué à l’aide de fastp pour supprimer les lectures de faible qualité et les séquences d’adaptateurs ; par la suite, HISAT2 aligne les lectures de haute qualité au génome de référence, .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L’analyse massive de données ARN-seq est caractérisée comme une tâche interdisciplinaire qui intègre la génomique, la bioinformatique, les statistiques et l’informatique. Un flux de travail analytique complet comprend plusieurs étapes en amont et en aval, incluant le prétraitement des données brutes, le contrôle qualité, l’alignement des séquences, la quantification au niveau des gènes, la normalisation des données, l’analyse d’expression différentielle et l’interprétation biologique. Pa.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Les auteurs déclarent qu’ils n’ont aucun conflit d’intérêts.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Les auteurs tiennent à remercier les responsables des bases de données publiques utilisées dans cette étude.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
biomaRtBioconducteur2.64.0Annotation génétique d’Ensembl
clusterProfilerBioconducteur4.16.0Analyse de l’enrichissement fonctionnel
DESeq2Bioconducteur1.48.1Analyse différentielle de l’expression
FactoMineRAgroParisTech2.11.0ACP et analyse multivariée
fastpOpenGene1.0.1Contrôle qualité et filtrage des données FASTQ
Nombre de fonctionnalitésDivision de bioinformatique, Institut Walter et Eliza Hall de recherche médicale2.0.0  ; Compter le nombre de lectures mappées à chaque gène pour la quantification de l’expression génique
ggplot2Postul3.5.2Visualisation des données
ggrepelKamil Slowikowski0.9.6Étiquettes textuelles non chevauchantes
ggridgesClaus O. Wilke0.5.6Créer des graphiques de crête
HISAT2Université Johns Hopkins2.2.1Aligner les lectures filtrées de haute qualité au génome de référence
RÉquipe principale R & nbsp ;4.5.0Un environnement pour le calcul, l’analyse et la visualisation des données
RColorBrewerErich Neuwirth1.1.3Palettes de couleurs pour le tracé
samtoolsFlux de travail sur la génomique à grande échelle1.22.0Convertir et traiter les fichiers SAM pour une récupération et un accès efficaces
Boîte à outils SRACentre national d’information biotechnologique3.2.1Obtenir et prétraiter les données brutes de séquençage à partir de la base de données NCBI SRA

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles