Method Article

Transkriptomische Analyse basierend auf Bulk-RNA-seq-Daten

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Das vorliegende Protokoll etabliert eine vollständige Pipeline zur Analyse des Bulk-RNA-Seq-Prozesses von Rohdaten bis zur funktionellen Anreicherungsanalyse.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nichtalkoholische Fettleber (NAFL) gilt üblicherweise als gutartige Erkrankung; sobald es jedoch zu nicht-alkoholischer Steatohepatitis (NASH) überschreitet, besteht ein deutlich erhöhtes Risiko, eine Endstadium-Lebererkrankung zu entwickeln. Viele Studien versuchen, den molekularen Mechanismus hinter dem Übergang von NAFL zu NASH zu klären. Hochdurchsatz-Sequenzierungstechnologien (wie Bulk RNA-seq) haben Forschern ein tieferes Verständnis verschafft, indem sie das Transkriptom untersucht und die Expression von Molekülen, die Aktivierung von Signalwegen und andere Faktoren im Zusammenhang mit dem Krankheitsverlauf aufzeigten. Es gibt eine Fülle von Open-Source-Daten, die Forscher analysieren können, um potenzielle Ziele für die Behandlung von Krankheiten zu identifizieren. Die verwandte Forschung ist jedoch durch das Fehlen eines effizienten und zuverlässigen Verfahrens zur Upstream-Analyse des Transkriptoms eingeschränkt. Hier wird eine hochgradig reproduzierbare und benutzerfreundliche Upstream-Analyse sowie eine daraus resultierende Differentialgenanalyse-Pipeline bereitgestellt, um eine standardisierte Verarbeitung und tiefgehende Parsing privater oder öffentlicher Daten zu erreichen. Die Pipeline ist in vier Schritte unterteilt: (1) Qualitätskontrolle der Daten; (2) Genkartierung; (3) Differentialgenanalyse; und (4) Funktionalanalysis. Dieser Prozess zielt darauf ab, die molekularen Mechanismen der Krankheitstransformation aufzudecken und Forschern durch die Analyse von Bulk RNA-seq-Daten potenzielle Arzneimittelziele und therapeutische Ansätze zu unterstützen.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die nicht-alkoholische Fettlebererkrankung (NAFLD) ist weltweit die am häufigsten verbreitete chronische Lebererkrankung und betrifft mehr als ein Viertel der Bevölkerung. Seine Häufigkeit ist in den letzten Jahrzehnten dramatisch gestiegen, 1,2,3. Die wachsende Krankheitsbelastung, insbesondere ihre fortgeschrittenere Form, die nichtalkoholische Steatohepatitis (NASH), stellt eine große globale Gesundheitsherausforderung und eine schwere wirtschaftliche Belastungdar. Die erste Stufe von NAFLD ist die nicht-alkoholisch....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Zu Demonstrationszwecken wurde der öffentlich verfügbare Datensatz PRJNA1023502 von Lan Bai et al. erstellt, um jeden Schritt sowohl der Upstream- als auch Downstream-Analysen20 zu illustrieren. Da dieser Datensatz aus der Open-Access-Datenbank der NCBI SRA stammt, sind keine zusätzlichen Genehmigungen oder ethischen Genehmigungen erforderlich. Siehe die Materialtabelle, um alle erforderlichen Software- und R-Package-Versionen zu überprüfen. Der öffentlich verfügbare Datensatz umfasst PRJNA1023502 6 Nicht-NASH-, 6 NAFL- und 6 NASH-Leber-RNA-seq-Proben. In diesem Protokoll wurde der Datensatz ve....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Der Upstream-Analyse-Workflow für Bulk RNA-Seq ist in Abbildung 1A dargestellt. Dieser Workflow führt sequentiell folgende Schlüsselschritte auf einer Linux-Plattform aus: Erstens wird eine strenge Qualitätskontrolle der Rohsequenzierungsdaten mittels FASTP durchgeführt, um minderwertige Lese- und Adaptersequenzen zu entfernen; anschließend richtet HISAT2 hochwertige Lesungen auf das Referenzgenom aus, wobei Samtools die Ausrichtungsdateien konvertiert und s.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Massenanalyse von RNA-seq-Daten wird als interdisziplinäre Aufgabe charakterisiert, die Genomik, Bioinformatik, Statistik und Informatik integriert. Ein vollständiger analytischer Workflow umfasst mehrere Upstream- und Downstream-Schritte, darunter Rohdatenvorverarbeitung, Qualitätskontrolle, Sequenzausrichtung, Gen-Quantifizierung, Datennormalisierung, Analyse differenzieller Expression und biologische Interpretation. Unter diesen Schritten ist die genaue Umwandlung der Rohsequenzie.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Autoren erklären, dass sie keine Interessenkonflikte haben.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Autoren möchten den Betreuern der öffentlich verfügbaren Datenbanken danken, die in dieser Studie verwendet wurden.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
biomaRtBioleiter2.64.0Genannotation aus Ensembl
clusterProfilerBioleiter4.16.0Funktionale Anreicherungsanalyse
DESeq2Bioleiter1.48.1Differentialexpressionsanalyse
FactoMineRAgroParisTech2.11.0PCA und multivariate Analyse
FastpOpenGene1.0.1Qualitätskontrolle und Filterung von FASTQ-Daten
FeatureCountsBioinformatik-Abteilung, Walter and Eliza Hall Institute of Medical Research2.0.0  Zähle die Anzahl der Reads, die jedem Gen zur Genexpressionsquantifizierung zugeordnet wurden.
ggplot2Posit3.5.2Datenvisualisierung
ggrepelKamil Slowikowski0.9.6Nicht überlappende Textbeschriftungen
ggridgesClaus O. Wilke0.5.6Erstelle Gratlinien-Diagramme
HISAT2Johns Hopkins Universität2.2.1Richten Sie die gefilterten, hochwertigen Lesungen auf das Referenzgenom aus
RR Core Team 4.5.0Eine Umgebung für Datenberechnung, -analyse und -visualisierung
RColorBrewerErich Neuwirth1.1.3Farbpaletten zum Plotten
SamtoolsArbeitsbereich der großflächigen Genomik1.22.0Konvertieren und verarbeiten Sie SAM-Dateien für effiziente Abrufe und Zugriff
SRA-ToolkitNationales Zentrum für Biotechnologie-Information3.2.1Rohsequenzierungsdaten aus der NCBI SRA-Datenbank abrufen und vorverarbeiten

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles