Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Optimierung zur Sequenzierung und Analyse degradierter FFPE-RNA-Proben

Published: June 8, 2020 doi: 10.3791/61060
* These authors contributed equally

Summary

Diese Methode beschreibt die Schritte zur Verbesserung der Qualität und Quantität der Sequenzdaten, die aus formal in-fixierten Paraffin-eingebetteten (FFPE) RNA-Proben gewonnen werden können. Wir beschreiben die Methodik zur genaueren Bewertung der Qualität von FFPE-RNA-Proben, bereiten Sequenzierungsbibliotheken vor und analysieren die Daten aus FFPE-RNA-Proben.

Abstract

Die Genexpressionsanalyse durch RNA-Sequenzierung (RNA-Seq) ermöglicht einzigartige Einblicke in klinische Proben, die potenziell zu einem mechanistischen Verständnis der Grundlagen verschiedener Krankheiten sowie Resistenz- und/oder Anfälligkeitsmechanismen führen können. FFPE-Gewebe, die die häufigste Methode zur Erhaltung der Gewebemorphologie in klinischen Proben darstellen, sind jedoch nicht die besten Quellen für die Genexpressionsprofilanalyse. Die aus solchen Proben gewonnene RNA wird oft abgebaut, fragmentiert und chemisch modifiziert, was zu suboptimalen Sequenzierungsbibliotheken führt. Diese wiederum erzeugen Sequenzdaten schlechter Qualität, die für die Genexpressionsanalyse und Mutationsermittlung möglicherweise nicht zuverlässig sind. Um das Beste aus FFPE-Proben zu machen und die bestmöglichen Daten aus minderwertigen Proben zu erhalten, ist es wichtig, bestimmte Vorsichtsmaßnahmen zu treffen, während der Planung des experimentellen Entwurfs, der Vorbereitung von Sequenzierungsbibliotheken und bei der Datenanalyse. Dazu gehören die Verwendung geeigneter Metriken für die präzise Stichprobenqualitätskontrolle (QC), die Ermittlung der besten Methoden für verschiedene Schritte während der Generierung der Sequenzierungsbibliothek und die sorgfältige Bibliothek QC. Darüber hinaus ist die Anwendung korrekter Software-Tools und Parameter für die Sequenzdatenanalyse von entscheidender Bedeutung, um Artefakte in RNA-seq-Daten zu identifizieren, Kontaminationen und Lesewerte niedriger Qualität herauszufiltern, die Homogenität der Genabdeckung zu bewerten und die Reproduzierbarkeit von Genexpressionsprofilen zwischen biologischen Replikationen zu messen. Diese Schritte können eine hohe Genauigkeit und Reproduzierbarkeit für die Profilierung sehr heterogener RNA-Proben gewährleisten. Hier beschreiben wir die verschiedenen Schritte für Die Probe QC, Bibliotheksvorbereitung und QC, Sequenzierung und Datenanalyse, die dazu beitragen können, die Menge an nützlichen Daten aus minderwertiger RNA zu erhöhen, wie die aus FFPE-RNA-Geweben.

Introduction

Die Verwendung von Sequenzierungsansätzen der nächsten Generation hat es uns ermöglicht, eine Fülle von Informationen aus verschiedenen Arten von Stichproben zu erhalten. Alte und schlecht erhaltene Beispiele sind jedoch für die häufig verwendeten Methoden zur Generierung von Sequenzdaten nach wie vor nicht praktikabel und erfordern häufig Änderungen an etablierten Protokollen. FFPE-Gewebe stellen einen solchen Probentyp dar, der für klinische Proben1,2,3weit verbreitet ist. Während die FFPE-Konservierung die Gewebemorphologie aufrechterhält, weisen die Nukleinsäuren in FFPE-Geweben in der Regel eine breite Palette von Schäden und Abbau auf, was es schwierig macht, die genomischen Informationen abzurufen, die zu wichtigen Erkenntnissen über molekulare Mechanismen führen können, die verschiedenen Störungen zugrunde liegen.

Genexpressionsdaten, die durch RNA-Sequenzierung generiert werden, sind oft entscheidend für die Untersuchung von Krankheits- und Resistenzmechanismen und ergänzen die DNA-Mutationsanalyse. Die RNA ist jedoch anfälliger für Degradation, was es schwieriger macht, genaue Genexpressionsdaten aus FFPE-Geweben zu generieren. Da die große Verfügbarkeit und Erschwinglichkeit der Sequenzierung relativ jung ist, wurden ältere Proben oft nicht unter Bedingungen gelagert, die zur Erhaltung der RNA-Integrität erforderlich sind. Einige der Probleme für FFPE-Proben sind der Abbau der RNA durch einbetten in Paraffin, die chemische Modifikation von RNA, die zu Fragmentierung oder Refraktorik zu enzymatischen Prozessen führt, die für die Sequenzierung erforderlich sind, und der Verlust der Poly-A-Schwänze, wodurch die Anwendbarkeit von Oligo-dT als Primer für die Reverse-Transkriptase4begrenzt wird. Eine weitere Herausforderung ist die Handhabung/Lagerung von FFPE-Proben unter suboptimalen Bedingungen, was zu einem weiteren Abbau von labilen Molekülen wie RNA in den Geweben führen kann5. Dies ist besonders relevant für ältere Proben, die zu einer Zeit gesammelt wurden, als eine Genexpressionsanalyse durch RNA-Sequenzierung für die Proben nicht erwartet wurde. All dies führt zu einer verminderten Qualität und Quantität der extrahierten RNA, die für die Generierung nützlicher Sequenzdaten zur Verfügung steht. Die geringe Erfolgswahrscheinlichkeit in Verbindung mit den hohen Kosten der Sequenzierung hat viele Forscher davon abgebracht, Genexpressionsdaten aus potenziell nützlichen FFPE-Proben zu generieren und zu analysieren. Einige Studien in den letzten Jahren haben die Nutzbarkeit von FFPE-Geweben für die Genexpressionsanalyse2,6,7,8,9, wenn auch für weniger und/oder neuere Proben gezeigt.

Als Machbarkeitsstudie verwendeten wir RNA, die aus FFPE-Tumorgewebeproben aus drei Residual Tissue Repositories aus Surveillance, Epidemiology, and End Results (SEER) Krebsregisterfürarbeitung für RNA-Sequenzierung und Genexpressionsanalyse extrahiert wurde10. Die FFPE-Gewebe aus hochgradigen ovarischen serösen Adenokarzinomen wurden von 7 bis 32 Jahren unter unterschiedlichen Bedingungen vor der RNA-Extraktion gelagert. Da diese Blöcke in den meisten Fällen jahrelang an verschiedenen Stellen gelagert worden waren, ohne dass in Zukunft eine sensible genetische Analyse erwartet wurde, wurde nicht viel darauf geachtet, die Nukleinsäuren zu erhalten. So zeigten die meisten Proben eine qualitativ minderwertige RNA, wobei ein großer Teil der Proben mit Bakterien kontaminiert war. Nichtsdestotrotz konnten wir genquantifiziert, die Homogenität und Kontinuität der Genabdeckung messen und die Pearson-Korrelationsanalyse zwischen biologischen Replikationen durchführen, um die Reproduzierbarkeit zu messen. Basierend auf einer Reihe von Schlüssel-Signatur-Gen-Panel, verglichen wir die Proben in unserer Studie mit The Cancer Genome Atlas (TCGA) Daten und bestätigte, dass etwa 60% der Proben hatten vergleichbare Genexpressionsprofile11. Basierend auf der Korrelation zwischen verschiedenen QC-Ergebnissen und Beispielmetadaten identifizierten wir wichtige QC-Metriken, die einen guten Vorhersagewert für die Identifizierung von Stichproben haben, die eher verwendbare Sequenzdaten generieren11.

Hier beschreiben wir die Methodik für die FFPE-RNA-Qualitätsbewertung, die Generierung von Sequenzierungsbibliotheken ausgehend von extrahierten RNA-Proben und die bioinformatische Analyse der Sequenzierungsdaten.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. RNA-Quantitäts- und Qualitätsbewertung

  1. Wählen Sie die FFPE-Proben nach vordefinierten Kriterien aus und extrahieren Sie RNA nach einer geeigneten Methode (z.B. FFPE-Kernsäureextraktionskit, Tabelle der Materialien).
    HINWEIS: Es gibt verschiedene Methoden für die FFPE-RNA-Extraktion, einschließlich der neueren Mikrodissektionsmethoden, die mit sehr wenig Gewebe arbeiten und gute RNA12,,13,,14extrahieren können.
  2. Es sollte äußerst darauf geachtet werden, die Integrität der RNA in allen Stadien zu erhalten. Dazu gehört die Arbeit mit RNase-freiem entionisiertem Wasser, die Verwendung von RNase-freiem Kunststoff und die Reinigung aller Instrumente, die mit den FFPE-Blöcken mit RNase-Dekontaminationsreagenzien in Berührung kommen.
  3. RNA sollte immer sorgfältig behandelt und im Eis aufbewahrt werden, sofern nicht anders angegeben, um den Abbau während der Handhabung zu minimieren.
  4. Wenn genügend Material zur Verfügung steht, extrahieren Sie RNA aus mehr als einer Region im FFPE-Block, um biologische Replikationen aus so vielen Proben wie möglich zu erzeugen. Teilen Sie für einige der Proben mit ausreichender RNA-Ausbeute die extrahierte RNA in zwei teile, um sie als technische Replikationen zu verarbeiten.
  5. Wenn möglich, sammeln Sie eine kleine Menge der Probe separat nach der Extraktion für QC (d. h. ein QC aliquot), um wiederholte Handhabung und Frost-Tau-Zyklen der Probe zu vermeiden, die wahrscheinlich zum Abbau der RNA führen.
  6. Überprüfen Sie die Qualität der RNA (vorzugsweise aus dem QC aliquot), indem Sie sie auf einem RNA-QC-System (z.B. Agilent Bioanalyzer-System mit einem RNA Nano Chip, Table of Materials)gemäß den Anweisungen des Herstellers ausführen.
  7. Analysieren Sie die Verteilung von RNA-Fragmenten in den Proben (z.B. mit der Software Bioanalyzer 2100 Expert), indem Sie die DV200- und DV100-Werte als Prozentsatz der Fragmente mit einer Größe von mehr als 200 nt (DV200) oder 100 nt (DV100) berechnen.
  8. Identifizieren Sie unter DV200 und DV100die Metrik mit einer größeren Streuung von Werten für den angegebenen Stichprobensatz, und wählen Sie diese für die Gruppierung der Stichproben nach ihrem Intaktgrad aus.
    HINWEIS: Bei Probensätzen mit intakteren RNA-Molekülen (d. h. hohen DV200-Werten, alle oder die meisten mit DV200 > 40%) ist DV200 wahrscheinlich eine nützliche QC-Metrik. Bei Sample-Sets mit mehr degradierten Transkripten (d. h. niedrigen DV200-Werten, alle oder die meisten mit DV200 < 40%) ist JEDOCH DV100 eher nützlich.
  9. Identifizieren Sie anhand der QC-Metriken die Samples mit DV100 < 40%. Da dieser Grad der Verschlechterung mit hoher Wahrscheinlichkeit keine nützlichen Sequenzierungsdaten11erzeugt, ist es ratsam, die Verarbeitung solcher Proben zu vermeiden. Wenn Ersatz für solche Proben verfügbar ist, sollte ihre Qualität überprüft werden, um idealerweise nur Proben mit DV100 > 50% einzubeziehen.

2. Vorbereitung der Sequenzierungsbibliothek

  1. Ermitteln Sie anhand der Qualität der in Abschnitt 1 bewerteten Stichproben eine geeignete Methode zum Generieren der Sequenzierungsbibliotheken.
    1. Für Probensätze mit sehr geringem Abbau und hohen DV200-Werten verwenden Sie die mRNA-Sequenzierung (d. h. Erfassung polyadenylierter Transkripte), gezielte RNA-Sequenzierung (d. h. Verwendung von Capture-Sonden für bestimmte Gene von Interesse), RNA-Exome-Sequenzierung (d. h. Verwendung von Capture-Sonden zur Anreicherung für das kodierungstranskriptom) oder gesamter RNA-Sequenzierung (d. h. Verwendung von Zufallsprimern zur umgekehrten Transkription zur Sequenzierung der gesamten RNA-Population nach Entfernung der Rippen). Es ist jedoch wichtig zu beachten, dass der Fixierungsprozess Zuneigung in der extrahierten RNA einführen kann. Somit funktionieren die Erfassungsansätze möglicherweise nicht in allen Fällen, selbst bei hohen DV200-Werten.
    2. Wenn der Stichprobensatz Proben mit hohem Abbau enthält (DV200 < 30%), verwenden Sie eine Methode zur Vorbereitung der RNA-Bibliothek insgesamt und nicht eine Methode, die von der Erfassung bestimmter Regionen der Transkripte abhängt, da diese spezifischen Regionen in degradierten Proben möglicherweise fehlen. Die Verwendung von Zufallsprimern zur CDNA-Generierung führt zu einer höheren Darstellung nutzbarer RNA in der endgültigen Bibliothek und ist daher besser für FFPE-RNA-Proben geeignet.
    3. Verwenden Sie für ribosomale RNA-Erschöpfung für Probensätze mit hohem Abbau RNaseH-basierte Methoden. Dies sind Methoden, bei denen rRNA-spezifische DNA-Sonden an rRNA binden, doppelsträngige Moleküle von RNaseH verdaut werden und übrig gebliebene Sonden von DNase gereinigt werden (z.B. NEBNext rRNA Erschöpfungskit, Tabelle der Materialien). Diese Methoden funktionieren bei degradierten Proben besser als bei einigen anderen Methoden8.
  2. Verwenden Sie für die Generierung von Sequenzierungsbibliotheken (wenn möglich) höhere Eingangsmengen für Proben, die eine stärker degradierte RNA haben (DV100 < 60%). Während Proben mit relativ guter RNA-Qualität (DV100 > 60%) kann auch bei niedrigeren Eingangsmengen gute Sequenzdaten liefern (die niedrigste für dieses Protokoll mit FFPE-RNA getestet wurde, war 20 ng), für mehr degradierte RNA (DV100 < 60%), ist es besser, mit höheren Eingangsmengen zu beginnen (z. B. >100 ng).
    HINWEIS: Wenn genügend (z. B. >500 ng) Beispiel zur Verfügung steht, ist es ratsam, mindestens die Hälfte des Samples zu speichern, um die Bibliotheksvorbereitung bei Bedarf zu wiederholen. Bei Proben mit geringer Eingabe (z. B. <100 ng) ist es in der Regel besser, den gesamten Betrag zu verwenden und eine Bibliothek mit ausreichender Vielfalt zu generieren.
  3. Nach der Auswahl eines geeigneten Bibliotheksvorbereitungskits zur Generierung von RNA-Seq-Bibliotheken insgesamt aus Proben mit hohem Abbau (z. B. NEBNext Ultra II RNA Library Prep Kit für Illumina, siehe Tabelle der Materialien),folgen Sie den Anweisungen des Herstellers, um die Bibliotheken zu generieren.
    HINWEIS: Bei der Bibliotheksvorbereitung ist es wichtig, den RNA-Fragmentierungsschritt für degradierte Proben zu überspringen und die Verwendung von zufälligen Primern für die cDNA-Synthese des ersten Strangs sicherzustellen.
  4. Zur Verbesserung der Effizienz und Geschwindigkeit, insbesondere für die Proben mit niedrigem Eingang, verwenden Sie geeignete Magnetträger mit starken festen Magneten für perlenbasierte Reinigungs- und Größenauswahlschritte (siehe Materialtabelle).
  5. Passen Sie für die PCR-Anreicherung der adaptergebundenen DNA die Anzahl der Amplifikationszyklen basierend auf der Menge der Eingangs-DNA an, um eine maximale Darstellung zu gewährleisten und unnötige Duplizierungen der Bibliotheksmoleküle zu vermeiden. Für FFPE-RNA-Proben mit niedrigem Eingang (<100 ng) empfehlen wir 16–18 Amplifikationszyklen, während die hohen Eingangsproben (1.000 ng) in der Regel genügend Bibliotheksmengen in 12–14 Amplifikationsrunden generieren.
  6. Bewerten Sie nach der PCR-Verstärkung und -Bereinigung gemäß den Anweisungen des Herstellers die Bibliotheksqualität, indem Sie die Bibliothekskonzentration und Molekülverteilung auf einer geeigneten Plattform analysieren (z. B. Agilent Bioanalyzer DNA Chip, siehe Tabelle der Materialien). Wiederholen Sie bei Samples mit Primer-Peaks (ca. 80 bp) oder Adapter-Dimer-Peaks (ca. 128 bp) die Bereinigung, um diese Spitzen zu entfernen.
  7. Berechnen Sie die durchschnittliche Bibliotheksgröße für jede Bibliothek (z. B. mit der Software Bioanalyzer 2100 Expert).

3. Sequenzierungsbibliothek QC

  1. Sobald festgestellt wurde, dass die Bibliotheken frei von überschüssigen Primer und Adapter-Dimern sind und eine ausreichende Konzentration für die nachfolgende Sequenzierung haben, wird durch qPCR weiter quantitiert.
    HINWEIS: Aufgrund der Empfindlichkeit der Clustergenerierung gegenüber der Bibliothekskonzentration ist eine genaue Quantifizierung von entscheidender Bedeutung, um zu verhindern, dass kostspielige Sequenzierungsläufe unterLeistung oder Überlastung geraten. Quantitative Echtzeit-PCR-Methoden (qPCR) sind nützlich, um die Clusterdichte auf Illumina-Plattformen zu verbessern, ohne dass es zu einer Überclusterbildung führt. Die qPCR-Methode ist präziser und empfindlicher als die Methoden, die auf der qualitativen und/oder quantitativen Analyse aller Bibliotheksmoleküle (z. B. Agilent Bioanalyzer) basieren, da sie die Vorlagen misst, die beide Adaptersequenzen an beiden Enden haben, die Cluster auf der Flowcell bilden. Die Bibliotheksgröße muss jedoch im Voraus bekannt sein, da eine Größenkorrektur auf alle Stichproben angewendet werden muss, damit die Ergebnisse mit einer Standardkurve verglichen werden können.
    VORSICHT: Labormäntel und Handschuhe müssen immer bei der Durchführung von qPCR getragen werden, und das Verfahren muss in einem Biosicherheitsschrank gemäß den Anweisungen des Herstellers durchgeführt werden.
    1. Richten Sie eine 96-Well-Platte mit drei Replikationen für jede Probe zur Fehlervermeidung ein, indem Sie ein geeignetes Kit verwenden (z. B. KAPA SYBR FAST qPCR Master Mix für Illumina-Bibliotheken, einen Teil des Library Quantification Kits, siehe Tabelle der Materialien), zusammen mit den Standards, einer positiven Steuerung (z. B. PhiX-Steuerung, siehe Tabelle der Materialien)und einem No Template Control (NTC). Der NTC ist qPCR-Mix ohne DNA-Bibliothek. Die positive Kontrolle kann jede Bibliothek mit bekannter Konzentration und Fragmentgröße sein.
      1. Bereiten Sie mindestens sechs Verdünnungen der Standards gemäß dem Herstellerprotokoll vor.
    2. Nach Dem Hinzufügen aller Komponenten (z.B. qPCR-Master-Mix, Bibliotheken, Standards), decken Sie die Platte mit Dichtungsfolie ab und verwenden Sie einen Rakel, um sicherzustellen, dass die Folie einen gleichmäßigen und sicheren Kontakt mit der Platte herstellt.
    3. Wirbel und drehen Sie die Platte bei 1.500 U/min für mindestens 1 min. Überprüfen Sie die Platte visuell, um sicherzustellen, dass es keine Luftblasen an der Unterseite der Brunnen.
    4. Richten Sie die Platte auf dem Thermocycler (z. B. CFX96 Touch System, siehe Materialtabelle) unter Verwendung der vom Hersteller empfohlenen Einstellungen ein.
    5. Speichern Sie den Ausführungsordner, in dem auf ihn für die Datenanalyse zugegriffen werden kann.
    6. Überprüfen Sie bei der Datenanalyse, ob sich die Steigung im Bereich -3,1 bis -3,6, der Wirkungsgrad von 90 % bis 110 % und derR2 (Korrelationskoeffizient für die Standardkurve) nicht weniger als 0,98 befindet.
  2. Pooling: Sobald die qPCR-Konzentration der Sequenzierungs-Ready-Bibliotheken erhalten ist, werden die Äquimolarenbeträge der einzelnen Bibliotheken in Pool-Äquimolar-Mengen, abhängig von der Anzahl der Sequenzierungslesevorgänge, die pro Probe erforderlich sind, und der Sequenzierungsausgabe des Instruments abgerufen.
  3. QC der Pools: Quantitieren Sie die Bibliothekspools erneut durch qPCR nach dem gleichen Protokoll wie in Schritt 3.1 beschrieben.

4. Sequenzierung

  1. Ziehen Sie die Sequenzierungsreagenz-Kits je nach Ausführungsparametern und tauen Sie sie im Benutzerhandbuch auf. Auf der Illumina-Website finden Sie die neuesten Versionen aller Benutzerhandbücher für die Sequenzierung auf Illumina-Instrumenten.
  2. Stellen Sie sicher, dass die Reagenzien vollständig aufgetaut sind, und legen Sie die Reagenzienschale auf 4 °C. Der Lauf sollte spätestens 2 h nach dem Auftauen der Reagenzien gestartet werden. Wenn dies nicht der Fall ist, kann sich dies auf die Qualität der Laufergebnisse auswirken.
  3. Invertieren Sie die Patrone 5x, um Reagenzien zu mischen und tippen Sie vorsichtig auf die Bank, um Luftblasen zu reduzieren.
  4. Stellen Sie das unverpackte Flow-Zell-Paket bei Raumtemperatur für 30 min beiseite.
  5. Entpacken Sie das Flow-Zell-Paket und reinigen Sie die Glasoberfläche der Durchflusszelle mit einem fusselfreien Alkoholwisch. Trocknen Sie das Glas mit einem low-lint Laborgewebe.
  6. Öffnen Sie die Illumina -Anwendung "Experiment Manager". Wählen Sie "Sample Sheet erstellen", dann wählen Sie den Sequencer und klicken Sie auf"Weiter".
  7. Erstellen und hochladen Sie das Beispielblatt basierend auf den Illumina-Sequenzerkriterien (z. B. Illumina Experiment Manager, Softwareguide).
  8. Scannen Sie an den Eingabeaufforderungen den Reagenzien-Kit-Barcode und geben Sie den Run Set Up Parameters ein (z. B. für einen einzelnen indizierten PE 75-Zykluslauf, geben Sie 76-8-76ein).
  9. Denaturieren und verdünnen Sie den Bibliothekspool basierend auf der Sequencer-Benutzerhandbuch-Empfehlung (z. B. NextSeq 500 Systemguide von Illumina, siehe Tabelle der Materialien).
  10. Denaturieren und verdünnen Sie die Kontrollbibliothek PhiX (siehe Materialtabelle) auf die entsprechende Konzentration (z. B. 1,8 pM für NextSeq).
  11. Mischen Sie Die Beispielbibliothek und die PhiX-Steuerung, um ein Verhältnis von 1% PhiX-Steuervolumen zu erzielen.
  12. Belasten Sie denaturierte und verdünnte Probe in die Reagenzpatrone im dafür vorgesehenen Reservoir.
  13. Laden Sie die Flowcell, die Pufferkassette und die Reagenzkassette.
  14. Führen Sie eine automatisierte Überprüfung durch, um sicherzustellen, dass die Ausführungsparameter die Systemprüfung bestehen.
  15. Wenn die automatisierte Prüfung abgeschlossen ist, wählen Sie Start aus, um mit der Sequenzierung zu beginnen.

5. Datenanalyse und Qualitätsbewertung

ANMERKUNG: Ein typischer RNA-Seq-Datenanalyse-Workflow (Abbildung 1) umfasst Vorverarbeitung und QC, Ausrichtung auf Genom und Post-Alignment QC, Gen- und Transkriptquantifizierung, Probenkorrelationsanalyse, Differentialanalyse zwischen verschiedenen Probengruppen, Behandlungsbedingungen sowie Gensatzanreicherung und Pfadanalyse.

Die RNA-Seq-Daten können Qualitätsprobleme haben, die die Genauigkeit des Genprofilings beeinflussen und zu falschen Schlussfolgerungen führen können. Daher sind anfängliche QC-Prüfungen auf Sequenzierungsqualität, Kontamination, Sequenzierungsabdeckungsverzerrung und andere Quellen von Artefakten sehr wichtig. Das Anwenden einer RNA-Seq QC-Pipeline ähnlich dem hier beschriebenen Workflow wird empfohlen, um Artefakte zu erkennen und Filterung oder Korrektur vor der nachgelagerten Analyse anzuwenden.

  1. Vorverarbeitung
    HINWEIS: Dazu gehören Demultiplexing, Bewertung der Sequenzlesequalität, GC-Inhalt, Vorhandensein von Sequenzierungsadaptern, überrepräsentierte k-mersund PCR duplizierte Lesevorgänge. Diese Informationen helfen, Sequenzierungsfehler, PCR-Artefakte oder Kontaminationen zu erkennen.
    1. Demultiplex Illumina-Sequenzierung wird mit dem Illumina-Softwaretool bcl2fastq2 ausgeführt, um unformatierte FASTQ-Dateien für jedes im Beispielblatt definierte Beispiel zu generieren. Erlauben Sie einer Nichtübereinstimmung in den Beispielindex-Barcodes, sequenziierende Sequenzierungsfehler zu tolerieren, wenn es keine Barcodekollision gibt.
    2. Führen Sie das Softwaretool FASTQC15 aus, um eine Qualitätsprüfung für unformatierte FASTQ-Dateien durchzuführen, um schlechte Qualität oder Anomalien bei der Sequenzierung von Lesevorgängen zu erkennen.
    3. Für Adapter und minderwertige Basen Trimmen, trimmen Sie die Sequenzierungsadapter und minderwertige Basen mit Cutadapt16 oder Trimmomatic17 Software-Tools. Speichern Sie die getrimmten Lesevorgänge in den Paar-Ende-Fastq-Dateien.
    4. Kontaminationsbildschirm
      1. Führen Sie FASTQ_screen18 aus, um eine mögliche Kreuzkontamination mit anderen Arten zu erkennen.
      2. Führen Sie miniKraken von Kraken219 aus, um die Taxonomien kontaminierender Arten zu identifizieren.
  2. Ausrichtung auf Referenzgenom und Post-Alignment QC
    1. Die getrimmten Lesevorgänge können mit STAR aligner20an einer Referenzgenomsequenz (GRCh Build hg19 oder hg38) ausgerichtet werden. Wenden Sie die Gencode-Annotation-GTF-Datei an, um die gespleißte Transkriptausrichtung zu steuern. Es wird empfohlen, STAR 2-Pass zu betreiben, um die Empfindlichkeit gegenüber neuartigen Spleißknoten zu erhöhen. Im zweiten Durchgang werden alle Lesevorgänge mit annotierten Genen und Transkripten und neuartigen Kreuzungen aus dem ersten Durchgang neu zugeordnet.
    2. Führen Sie EIN QC nach der Ausrichtung aus.
      1. Führen Sie die21MarkDuplicates von Picard aus, um die Bibliothekskomplexität zu bewerten, indem Sie die Menge an eindeutigen oder nicht duplizierten Lesevorgängen in den Beispielen ermitteln.
      2. Führen Sie das CollectRnaSeqMetrics-Programm von Picard aus, um Mapping-Prozentsätze für Codierung, Intronic, Intergene, UTR-Regionen und Genkörperabdeckung zu sammeln.
      3. Führen Sie RSeQC22 aus, um die innere Entfernung des Lesepaars, die Leseverteilung zwischen CDS-Exons, 5'UTR, 3'UTR, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, LESEN von GC-Inhalten, Knotensättigung und Bibliotheksstranginformationen zu ermitteln.
      4. Führen Sie multi-QC23 aus, um einen aggregierten Bericht im HTML-Format zu generieren.
  3. Genquantifizierungs- und Korrekturanalyse
    1. Führen Sie RSEM24 aus, um Rohzählung sowie normalisierte Lesezählung auf Gene und Transkripte zu erhalten. Die Lesezählmessung wie RPKM (Liest pro Kilobase von Exonmodell pro Million Lesevorgänge), FPKM (Fragmente pro Kilobase des Exonmodells pro Million zugeordneter Lesevorgänge) und TPM (Transkripte pro Million) sind die am häufigsten gemeldeten RNA-Seq-Genexpressionswerte. Gene, die unterhalb eines Rauschenschwellenwerts ausgedrückt werden (z. B. TPM < 1 oder Rohanzahl <5), können gefiltert werden.
    2. Führen Sie die Transkriptquantifizierung durch, um die Rohanzahl der zugeordneten Lesevorgänge mit Programmen wie HTSeq-Count oder FeatureCounts zu aggregieren.
    3. Führen Sie Principal Components Analysis (PCA) mithilfe eines R-Skripts aus, um Batcheffekte zu ermitteln und eine Qualitätszuordnung des angegebenenDatasets 25zu bewerten. Die Stichprobenkorrelationsanalyse kann mit der Pearson-Korrelation zwischen verschiedenen Metriken durchgeführt werden.
  4. Differentialgenexpressionsanalyse
    1. Führen Sie eine Gendifferenzanalyse zwischen den Probenbedingungen mit dem Programm edgeR26,27 und/oder limma-Voom28 durch und verwenden Sie Normalisierungsmethoden wie TPM, TMM, DESeqoder UpperQuartile.
    2. Es wird empfohlen, mindestens zwei Softwaretools für die Differenzanalyse auszuführen, um zwei DEGs-Listen zum Vergleich aufzurufen und die endgültigen DEGs zu erhalten, um die Erkennungsempfindlichkeit und -genauigkeit zu verbessern.
  5. Genset-Anreicherung und Signalweganalyse
    1. Führen Sie Gene Set Enrichment Analysis (GSEA)29,30 basierend auf der Rangfolge von Transkripten nach einer Messung der Differential-Expressed-Gene (DEGs) Liste durch, um festzustellen, ob die DEGs statistisch signifikante, konkordante Unterschiede zwischen biologischen Bedingungen aufweisen.
    2. Führen Sie Funktionsanalysen mit Ressourcen wie Gene Ontology31, DAVID32,33oder anderen verfügbaren Softwaretools durch.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Die oben beschriebene Methode wurde auf 67 FFPE-Proben angewendet, die 7–32 Jahre lang unter verschiedenen Bedingungen gelagert worden waren (die mediane Probenlagerzeit betrug 17,5 Jahre). Die hier vorgestellten Datenundanalyseergebnisse wurden zuvor in Zhao et al.11beschrieben und veröffentlicht. Bei der Überprüfung der Probenqualität, wie sie zuvor beschrieben wurde (d. h. Beispielspuren in Abbildung 2), erwies sich DV100 als nützlicher als DV200, da es empfindlicher ist, den Anteil kleinerer Fragmentgrößen für stark abgebaute RNA-Proben genau zu messen.

Im gegebenen Probensatz lagen weniger als 10 % der Proben (7 von 67) über dem von Illumina34empfohlenen DV200-Schnitt von 30 %. Etwa 26% der Proben (19 von 67) hatten einen DV100 > 60% (d. h. höhere Wahrscheinlichkeit, gute Sequenzdaten zu generieren), 40% (27 von 67) lagen im Bereich von 40%–60% für DV100 (d. h. akzeptabel, aber mit geringerer Wahrscheinlichkeit, gute Sequenzdaten zu generieren), und etwa 10% (7 von 67) hatten eine DV100 von <40% (d. h. sehr geringe Wahrscheinlichkeit, gute Sequenzsequenzen zu erzeugen). Für 14 von 67 Samples konnte die Software die DV-Werte nicht ermitteln. Tabelle 1 zeigt eine Zusammenfassung der QC-Metriken für die Stichproben in verschiedenen DV100-Kategorien. Eine detaillierte QC-Analyse und Datenkorrelation für alle 67 Proben finden Sie unter Zhao et al.11.

Angesichts des hohen Abbaugrads im Sample-Set wurde eine Methode zur Vorbereitung der "Gesamt-RNA"-Bibliothek gewählt und Sequenzierungsbibliotheken mit dem NEBNext Ultra II RNA Library Prep Kit für Illumina (Table of Materials) erstellt. Um die Darstellung der Sequenzierungsbibliotheken trotz des hohen Grades an Probendegradation zu verbessern, wurde die maximal mögliche RNA-Menge (1.000 ng, wenn verfügbar) als Input für die Bibliotheksvorbereitung verwendet. Zusätzlich erforderte der hohe Abbau der FFPE-RNA-Proben die rRNA-Erschöpfungsmethode, da die degradierten Transkripte wahrscheinlich nicht die Poly-A-Schwänze für die mRNA-Erfassung hatten. Nach der Erschöpfung der ribosomalen RNA durch Hybridisierung zu bestimmten Sonden und DerVerdauung der hybridisierten Transkripte mit RNaseH wurden die restlichen Transkripte mit zufälligen Primern in cDNA umgewandelt. Die Größenauswahl wurde auch für Bibliotheken vermieden, die aus niedrigeren Eingabebeispielen erstellt wurden. Beispielspuren der endgültigen Bibliotheken sind in Abbildung 3dargestellt.

Stark degradierte FFPE-Proben stellen eine große Herausforderung für die Genexpressionsprofilierung in Tumorproben dar. Daher ist die Anwendung korrekter Bioinformatik-Analysemethoden und Softwaretools von entscheidender Bedeutung, um Artefakte oder Anomalien in Datensätzen zu erkennen, um eine hohe Genauigkeit und Reproduzierbarkeit der Genquantifizierung zu gewährleisten. Die in dieser Studie verwendeten Software-Tools sind in der Zusatztabelleaufgeführt. Im angegebenen Beispielsatz haben wir Sequenzierung und Bibliotheksqualitätsbewertung durchgeführt, wobei einige Beispielmetriken in Abbildung 4dargestellt sind. Eine Übersicht über die Qualität der Raw-Fastq-Dateisequenzierung und den Inhalt des Beispieladapters finden Sie in Abbildung 4A bzw. Abbildung 4B. Fastqc-Bildschirm kann helfen, Verunreinigungen, wie bakterielle und MausKontamination, in den Proben zu erkennen, wie in Abbildung 4Cgezeigt. Im gegebenen Probensatz wiesen 41 von 67 Proben eine bakterielle Kontamination von 5 % bis 48 % auf, und sechs Proben wiesen eine Mauskontamination von 4 % bis 11 % auf (Abbildung 4C). Die STAR-Ausrichtungsergebnisse (Abbildung 4D) zeigten den Anteil der Lesevorgänge, die dem Referenzgenom zugeordnet wurden, den Prozentsatz der Lesevorgänge, der dem Referenzgenom eindeutig zugeordnet ist, und den Anteil der Lesevorgänge, die nicht zugeordnet oder mehreren Loci zugeordnet wurden. Picard CollectRNAStatistics wurde verwendet, um die prozentuale mRNA, intronic und intergene Basen in den Ausrichtungsdateien zu bestimmen (Abbildung 4E). Um die Homogenität der Leseabdeckung auf Gen en und Transcripts zu beurteilen, haben wir das Picard-Software-Tool verwendet, um eine Genkörperabdeckungsdiagramm zu generieren, die den Prozentsatz der Lesevorgänge misst, die jede Nukleotidposition aller Gene abdecken, die in Behälter von 5" UTR bis 3" UTR skaliert werden. Abbildung 4F zeigt, dass einige degradierte Bibliotheken 3' Voreingenommenheit hatten, wo mehr Lesevorgänge näher an 3' Ende als am 5' Ende abgebildet werden.

FFPE-Proben weisen in der Regel eine große Variabilität in Genexpressionsprofilen auf, die durch variablen Abbau während der Probenspeicherung, RNA-Extraktion oder Probenverarbeitung entstehen können. Es ist wichtig, geeignete statistische Methoden zu verwenden, um die zugrunde liegenden Muster aufzudecken und die Variation und Korrelation zwischen den Stichproben zu messen. Wir haben die Principal Component Analysis (PCA) für sechs Paare biologischer Replikationen aus einer Teilmenge der 67 FFPE-Proben angewendet. Ein PCA-Diagramm zeigte, dass 26 % der Gesamtvariation von der ersten Hauptkomponente und 19 % von der zweiten und dritten Komponente zusammen erfasst wurden(Abbildung 5). Unter den sechs Replikationspaaren wiesen zwei Replikationspaare höhere Variationen auf (Korrelationen unter 0,22) als die letzten vier Proben (Korrelationswerte zwischen 0,7–0,8), wenn genexpression-Werte zwischen den Replikationspaaren verglichen wurden. Da die Replikationen durch Extraktion von RNA aus zwei verschiedenen Gewebelocken erzeugt wurden, die aus den gleichen FFPE-Blöcken geschnitten wurden, war das Gewebealter hier kein Faktor für die höhere Varianz, und es wurde wahrscheinlich durch die unterschiedliche Menge an bakterieller Kontamination verursacht (1%–55%) sowie verschiedene mRNA-Inhalte (2-3-fache Differenz) zwischen den Replikationen. Die Zufälligkeit des mRNA-Abbaus nach der Extraktion könnte auch zur höheren Varianz zwischen Proben ähnlichen Ursprungs beitragen.

Figure 1
Abbildung 1: RNaseq-Analyseworkflow. Das Flussdiagramm beschreibt die Analyseschritte für die Vorverarbeitung, Qualitätsbewertung, Kartierung zu Referenz, Genquantifizierung und Differentialanalyse zwischen verschiedenen Stichprobengruppen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 2
Abbildung 2: Beispiel Bioanalyzer-Spuren von sechs verschiedenen FFPE-RNA-Proben. Die horizontale Achse bezeichnet das Molekulargewicht (bp) und Fluoreszenzeinheiten (FU) und die vertikale Achse zeigt die Konzentration unterschiedlich großer Fragmente. Die RNA-Integritätsnummern (RIN), DV200 (d. h. Prozent der Fragmente >200 bp) und DV100 (d. h. Prozent der Fragmente >100 bp) werden auf jedem Profil angegeben. Ein 25 bp Peak in jedem Profil gibt den Molekulargewichtsmarker an. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 3
Abbildung 3: Beispiel Bioanalyzer-Spuren von endgültigen Bibliotheken, die aus vier verschiedenen Beispielen erstellt wurden. Die horizontale Achse bezeichnet das Molekulargewicht (bp) und Fluoreszenzeinheiten (FU) auf der vertikalen Achse geben die Konzentration unterschiedlich großer Fragmente an. Die unteren (35 bp oder 50 bp) und oberen (10.380 bp) Markerspitzen sind grün bzw. violett markiert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 4
Abbildung 4: Beispiel für den Multi-QC-Bericht für die Vorverarbeitung von QC-Ergebnissen. (A) Liniendiagramm mit den Prozentsätzen der Q30-Basen aller Sequenzierungslesevorgänge in jeder Stichprobe. (B) Sequenzierung von Adapterinhalten in rohen Fastq-Dateien. (C) Kontaminationsbildschirm zur Genauen aufeinander abgestimmten Arten. (D) Genom-Mapping-Statistiken. (E) Leseverteilung basierend auf Gencode-Genanmerkungen. (F) Genkörper/Transkriptabdeckung Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 5
Abbildung 5: Beispiel-PCA-Analyse zum Anzeigen der Übereinstimmung der Stichprobengruppe. PCA-Analyse für biologische Replikationen. PCA-Plot mit In zwei Dimensionen gezeichneten Samples mit ihren Projektionen auf die ersten beiden Hauptkomponenten. Biologische Repliken werden in der gleichen Farbe dargestellt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Anzahl der Proben Median-Eingang für lib prep (ng) Median RIN Median DV200 Median DV100 Median-Lib-Größe (bp) Median-Lib-Ausbeute (ng) Median-Lib-Molarität (nM) Median-Lagerzeit (Jahre) Median % Kontamination Median-Genanzahl
DV100 <40% 7 237.6 2.5 6 34 445 24.5 7 22 27.4 14,759
DV100 40-60% 27 1000 2.5 12 51 408 19.8 5.9 18 9.9 10,202
DV100 >60% 19 1000 2.3 26 73 355 84.9 24 13 3.2 9,993

Tabelle 1: Zusammenfassung der QC-Metriken für Stichprobenmengen. Die Tabelle zeigt die QC-Metriken der Stichproben, gruppiert nach ihren DV100-Werten. Die Anzahl der Stichproben in jeder Gruppe wird aufgelistet, und die Medianwerte für jede Metrik werden angezeigt.

Ergänzende Tabelle: Analysesoftwaretools, Parameter und Softwarereferenz. Die Tabelle listet die Analysesoftware-Tools und Parameter auf, die in jedem Schritt der RNA-seq-Analyse verwendet werden. Die Software-Tool-Referenzen sind in der Tabelle aufgeführt. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Die hier beschriebene Methode beschreibt die wichtigsten Schritte, die erforderlich sind, um gute Sequenzdaten aus FFPE-RNA-Proben zu erhalten. Die wichtigsten Punkte, die bei dieser Methode zu berücksichtigen sind: (1) Stellen Sie sicher, dass die RNA nach der Extraktion so gut wie möglich erhalten bleibt, indem Sie die Probenhandhabung und die Gefrier- und Auftauzyklen minimieren. Separate QC-Aliquots sind sehr hilfreich. (2) Verwenden Sie eine QC-Metrik, die für den angegebenen Stichprobensatz am besten geeignet ist. RIN-Werte und DV200 sind für herabgestufte Stichproben häufig nicht nützlich, und DV100 kann die Metrik der Wahl sein, um die Qualität in einem bestimmten Beispielsatz zu bewerten. (3) Bei mehr degradierten Proben ist es am besten, einen hohen Probeneingang zu verwenden. Höhere Inputbeträge führen zu einer besseren Diversität und geringerer Duplizierung in der endgültigen Bibliothek, was zu einer verbesserten Datenqualität führt. Da nicht alle RNA in FFPE-RNA-Proben aufgrund hoher Abbau- und Refraktakität in enzymatische Prozesse verwendbar sind, sind diese Effekte in FFPE-RNA im Vergleich zu frischgefrorener RNA ausgeprägter. (4) Verwenden Sie zufällige Primierung für den umgekehrten Transkriptionsschritt im Gegensatz zur Verwendung von Oligo-dT oder bestimmten Sequenzen als Primer. Sofern der Satz spezifischer Sonden nicht in der Lage ist, so viel Sequenz wie möglich für alle Transkripte von Interesse abzudecken, sind zufällige Primer eine sichere Wette, um die Umwandlung einer maximalen Anzahl von Transkripten (oder Fragmenten davon) in cDNA sicherzustellen. Daher sind die gesamten Methoden der RNA-Bibliothek für degradierte Proben nützlicher als mRNA-Methoden, die auf dem Vorhandensein von Poly-A-Schwänzen basieren. (5) Eine genaue Quantifizierung von Bibliotheken durch quantitative Echtzeit-PCR (qPCR) ist wichtig, um Eine Unterleistung oder Überlastung der Sequenzer zu vermeiden. (6) Bewertung einer potenziellen Kontamination der RNA als Teil der Standard-Postsequenzierungs-RNA-Seq-QC-Protokolle. Bakterielle Kontamination und genomische DNA-Kontamination sind bei FFPE-Proben aufgrund von Lagerbedingungen und Probenvorbereitungsverfahren üblich. Proben, die mit fremden Arten kontaminiert sind, können je nach Ausmaß der Kontamination eine Sequenzierungsabdeckung verschwenden. Darüber hinaus kann eine interne Kontamination durch eine unvollständige rRNA-Erschöpfung entstehen, was zu einem hohen Prozentsatz der Lesezuordnungen zu rRNAs führt. Ineffiziente genomische DNA-Entfernung während der DNase-Verdauung könnte zu falsch positiver Expressionsdetektion von Transkripten oder einer fehlerhaften de novo-Assemblierung von Transkripten führen. Adapterkontamination, die während der Bibliotheksvorbereitung eingeführt wird, ist auch ein häufiges Problem für stark degradierte RNAs mit sehr kurzen RNA-Fragmenten. Kontamination kann die Genauigkeit der Gen- und Transkriptprofilierung beeinträchtigen und zu einer falschen Entdeckung führen. Daher ist es wichtig, die Kontaminationsquellen genau zu identifizieren und die Kontamination möglichst während der Proben- oder Bibliotheksvorbereitungsschritte zu entfernen oder die kontaminierenden Lesevorgänge während des Datenverarbeitungsschritts zu filtern. (7) Die Vorverarbeitung und die Qualitätskontrolle nach der Ausrichtung sind wichtig, um Proben mit schlechter Qualität und niedrigem mRNA-Gehalt zu erkennen. Diese Proben sollten aus der weiteren Analyse entfernt werden. Genexpressionsdaten aus Proben, die niedrige Genzahlen erzeugen, sollten mit Vorsicht verwendet werden. (8) Es ist eine gute Praxis, biologische Replikate einzubeziehen, um die Varianz und Korrelation von Proben zu messen, um die Reproduzierbarkeit der Daten zu gewährleisten.

FFPE-Proben stellen eine sehr wertvolle Ressource für eine große Anzahl von Krankheiten dar. Die Fähigkeit, zuverlässige Sequenzinformationen aus solchen Proben zu erhalten, würde viele Studien unterstützen, die darauf abzielen, die molekularen Mechanismen hinter verschiedenen Störungen, Resistenzen und Anfälligkeiten zu verstehen. Obwohl die Einschränkungen, die durch die häufig suboptimale Qualität der aus solchen Proben extrahierten RNA auferlegt werden, solche Bemühungen behindern, tragen die hier beschriebenen Schritte dazu bei, diese Einschränkungen bis zu einem gewissen Grad zu mildern und es uns zu ermöglichen, das Beste aus FFPE-RNA zu machen, um zuverlässige Informationen zur Genexpression zu erhalten.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Diese Arbeit wurde vom National Cancer Institute (NCI), National Institutes of Health (NIH) finanziert. Leidos Biomedical Research, Inc. ist der operative und technische Support-Auftragnehmer für das Frederick National Laboratory for Cancer Research, das vollständig von NIH finanziert wird. Mehrere Autoren (YZ, MM, KT, YL, JS, BT) sind mit Leidos Biomedical Research, Inc. verbunden, aber alle Autoren werden vollständig vom National Cancer Institute finanziert, einschließlich der Gehälter der Autoren und Forschungsmaterialien. Leidos Biomedical Research, Inc. stellte weder Gehalt für die Autoren (YZ, MM, KT, YL, JS, BT) noch Material für die Studie zur Verfügung, noch hatte es eine Rolle bei der Erstellung, Datenerhebung, Analyse, Entscheidung zur Veröffentlichung oder Vorbereitung des Manuskripts.

Acknowledgments

Wir danken Dr. Danielle Carrick (Abteilung für Krebsbekämpfung und Bevölkerungswissenschaften, National Cancer Institute) für die weitere Hilfe, insbesondere für die Einleitung dieser Studie, die Bereitstellung der Proben und für hilfreiche Vorschläge bei der Datenanalyse. Wir danken allen Mitgliedern der CCR-Sequenzierungsanlage am Frederick National Laboratory for Cancer Research für ihre Hilfe bei der Probenvorbereitung und -sequenzierung, insbesondere Brenda Ho für die Unterstützung in der Probe QC, Oksana German für die Bibliothek QC, Tatyana Smirnova für die Durchführung der Sequenzer. Wir danken auch Tsai-wei Shen und Ashley Walton von der Sequencing Facility Bioinformatics Group für ihre Unterstützung bei der Datenanalyse und der Implementierung von RNA-seq-Pipelines. Wir danken auch CCBR und NCBR für die Unterstützung bei der RNaseq-Analysepipeline und der Entwicklung von Best Practices.

Materials

Name Company Catalog Number Comments
2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

DOWNLOAD MATERIALS LIST

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019).
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019).
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Broad Institute. , Available from: http://broadinstitute.github.io/picard/ (2019).
  22. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  23. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  25. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  26. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  27. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  28. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  29. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  30. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  31. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  33. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  34. Evaluating RNA Quality from FFPE Samples. Illumina. , Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016).

Tags

Genetik Ausgabe 160 RNA-Sequenzierung formalinfixiertes Paraffin eingebettet FFPE Next Generation Sequenzierung NGS RNA-Seq-Analyse
Optimierung zur Sequenzierung und Analyse degradierter FFPE-RNA-Proben
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Levin, Y., Talsania, K., Tran, B.,More

Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter