Method Article

Analiza transkryptomiczna oparta na zbiorowych danych RNA-seq

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Niniejszy protokół ustanawia kompletny pipeline do analizy procesu masowego RNA-seq od surowych danych do analizy wzbogacenia funkcjonalnego.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Bezalkoholowa stłuszczona wątroba (NAFL) jest zwykle uważana za łagodne schorzenie; jednak gdy choroba przechodzi w niealkoholowe steato-wątroby (NASH), pacjenci są znacznie bardziej narażeni na rozwój końcowej choroby wątroby. Wiele badań próbuje wyjaśnić molekularny mechanizm leżący u podstaw przejścia z NAFL do NASH. Technologie sekwencjonowania o wysokiej przepustowości (takie jak RNA-seq w masie) pozwoliły badaczom uzyskać głębsze zrozumienie poprzez badanie transkryptomu, ujawnianie ekspresji cząsteczek, aktywacji szlaków sygnalizacyjnych oraz innych czynników związanych z postępem choroby. Dostępnych jest mnóstwo otwartych źródeł danych, które badacze mogą analizować w celu identyfikacji potencjalnych celów leczenia chorób. Jednak powiązane badania są ograniczone przez brak efektywnego i wiarygodnego procesu analizy transkryptomu w górnym zakresie. Tutaj dostępna jest wysoce powtarzalna i przyjazna dla użytkownika analiza upstream oraz powiązany potok analizy różnicowej genów, umożliwiający ustandaryzowane przetwarzanie i głęboką analizę danych prywatnych lub publicznych. Potok podzielony jest na cztery etapy: (1) kontrola jakości danych; (2) mapowanie genów; (3) różnicowa analiza genów; oraz (4) analizę funkcjonalną. Proces ten ma na celu odkrycie molekularnych mechanizmów transformacji choroby oraz wsparcie naukowców w przesiewaniu potencjalnych celów leków i podejść terapeutycznych poprzez analizę danych RNA-seq w całości.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Niealkoholowa stłuszczeniowa choroba wątroby (NAFLD) jest najpowszechniejszą chorobą przewlekłej wątroby na świecie, dotykającą ponad jedną czwartą populacji. Jego częstość gwałtownie wzrosła w ostatnich dekadach 1,2,3. Rosnące obciążenie chorobą, zwłaszcza jej bardziej zaawansowaną formą, niealkoholowym steato-zapaleniem wątroby (NASH), stanowi poważne globalne wyzwanie zdrowotne i duże obciążenie ekonomiczne4. Pierwszym stadium NAFLD jest niealkoholowa stłuszczona wątroba (NAFL), któremu towarzyszą stany zapalne i włóknienie, które mogą przechodzić d....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Do celów demonstracyjnych publicznie dostępny zbiór danych PRJNA1023502 opracowany przez Lan Bai i in. został wykorzystany do zilustrowania każdego etapu zarówno analiz w górnym, jak i dalszym ciągu20. Ponieważ ten zbiór danych pochodzi z otwartej bazy danych NCBI, nie są wymagane dodatkowe uprawnienia ani etyczne zgody. Zobacz Tabelę Materiałów , aby zweryfikować wszystkie wymagane wersje oprogramowania i pakietów R. Publicznie dostępny zbiór danych PRJNA1023502 zawiera 6 próbek nie-NASH, 6 NAFL oraz 6 NASH RNA-seq wątroby. W tym protokole zbiór danych został wykorzystany do demonstracji wszystkich etapów masowego workflow RNA....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Przepływ analizy upstream dla masowego RNA-seq został zilustrowany na Rysunku 1A. Ten workflow wykonuje kolejno następujące kluczowe kroki na platformie Linux: po pierwsze, rygorystyczna kontrola jakości surowych danych sekwencjonowania jest wykonywana za pomocą fastp, aby usunąć niskiej jakości odczyty i sekwencje adapterów; następnie HISAT2 dopasowuje wysokiej jakości odczyty do genomu referencyjnego, a Samtools konwertuje i sortuje pliki wyrównania; wreszcie FeatureCounts przeprowadza kwa.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Analiza danych RNA-seq w całości charakteryzuje się interdyscyplinarnym zadaniem integrującym genomikę, bioinformatykę, statystykę i informatykę. Pełny przepływ pracy analityczny obejmuje wiele etapów w górę i w dolnym kierunku, w tym wstępne przetwarzanie surowych danych, kontrolę jakości, wyrównywanie sekwencji, kwantyfikację na poziomie genów, normalizację danych, analizę różnicowej ekspresji oraz interpretację biologiczną. Wśród tych etapów szczególnie istotne jest dokładne przekształcenie surowych odczytów sekwencjo.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy deklarują, że nie mają żadnych konfliktów interesów.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy chcieliby podziękować opiekunom publicznie dostępnych baz danych wykorzystanych w tym badaniu.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
biomaRtBioconductor2.64.0Adnotacja genów z Ensembl
clusterProfilerBioconductor4.16.0Analiza wzbogacania funkcjonalnego
DESeq2Bioconductor1.48.1Analiza różniczkowa ekspresji
FactoMineRAgroParisTech2.11.0Analiza PCA i wielowymiarowa
fastpOpenGene1.0.1Kontrola jakości i filtrowanie danych FASTQ
Liczba cechDział Bioinformatyki, Instytut Badań Medycznych im. Waltera i Elizy Hallów2.0.0  Policz liczbę odczytów przypisanych do każdego genu w celu ilościowania ekspresji genów
ggplot2Pozycja3.5.2Wizualizacja danych
GgrepelKamil Slowikowski0.9.6Etykiety tekstowe nienakładające się
GgridgesClaus O. Wilke0.5.6Tworz działki grzbietowe
HISAT2Uniwersytet Johnsa Hopkinsa2.2.1Dopasuj filtrowane wysokiej jakości odczyty do genomu referencyjnego
RR Core Team 4.5.0Środowisko do obliczania, analizy i wizualizacji danych
RColorBrewerErich Neuwirth1.1.3Palety kolorów do wyznaczania wykresów
samtoolsStrumień pracy w genomice na dużą skalę1.22.0Konwertowanie i przetwarzanie plików SAM dla efektywnego odzyskiwania i dostępu
Zestaw narzędziNarodowe Centrum Informacji Biotechnologicznej3.2.1Pobierz i wstępnie przetwarzaj surowe dane sekwencjonowania z bazy danych NCBI

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles