Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Optimalisatie voor sequencing en analyse van gedegradeerde FFPE-RNA Samples

Published: June 8, 2020 doi: 10.3791/61060
* These authors contributed equally

Summary

Deze methode beschrijft de stappen om de kwaliteit en kwantiteit van sequentiegegevens te verbeteren die kunnen worden verkregen uit formeel vaste paraffine-embedded (FFPE) RNA-monsters. We beschrijven de methodologie om de kwaliteit van FFPE-RNA-monsters nauwkeuriger te beoordelen, sequencingbibliotheken voor te bereiden en de gegevens van FFPE-RNA-monsters te analyseren.

Abstract

Genexpressieanalyse door RNA-sequencing (RNA-seq) maakt unieke inzichten mogelijk in klinische monsters die mogelijk kunnen leiden tot mechanistisch begrip van de basis van verschillende ziekten, resistentie en/of gevoeligheidsmechanismen. FFPE-weefsels, die de meest voorkomende methode vormen voor het behoud van weefselmorfologie in klinische specimens, zijn echter niet de beste bronnen voor genexpressieprofileringsanalyse. Het RNA verkregen uit dergelijke monsters wordt vaak afgebroken, gefragmenteerd en chemisch gewijzigd, wat leidt tot suboptimale sequencing bibliotheken. Deze genereren op hun beurt gegevens van slechte kwaliteit sequentie die mogelijk niet betrouwbaar zijn voor genexpressieanalyse en mutatiedetectie. Om optimaal gebruik te maken van FFPE-monsters en de best mogelijke gegevens te verkrijgen uit monsters van lage kwaliteit, is het belangrijk om bepaalde voorzorgsmaatregelen te nemen tijdens het plannen van experimenteel ontwerp, het voorbereiden van sequencing bibliotheken en tijdens data-analyse. Dit omvat het gebruik van geschikte statistieken voor nauwkeurige steekproefkwaliteitscontrole (QC), het identificeren van de beste methoden voor verschillende stappen tijdens het genereren van sequencing-bibliotheek en zorgvuldige bibliotheek QC. Daarnaast is het toepassen van de juiste softwaretools en parameters voor sequentiegegevensanalyse van cruciaal belang om artefacten in RNA-seq-gegevens te identificeren, besmetting en lage kwaliteit te lezen, uniformiteit van gendekking te beoordelen en de reproduceerbaarheid van genexpressieprofielen onder biologische replicaties te meten. Deze stappen kunnen zorgen voor een hoge nauwkeurigheid en reproduceerbaarheid voor profilering van zeer heterogene RNA-monsters. Hier beschrijven we de verschillende stappen voor voorbeeld QC, bibliotheekvoorbereiding en QC, sequencing en gegevensanalyse die kunnen helpen om de hoeveelheid nuttige gegevens verkregen uit RNA van lage kwaliteit te verhogen, zoals die verkregen uit FFPE-RNA-weefsels.

Introduction

Het gebruik van de volgende generatie sequencing benaderingen heeft ons in staat gesteld om een schat aan informatie uit verschillende soorten monsters te verzamelen. Oude en slecht bewaarde monsters blijven echter onwerkbaar voor de veelgebruikte methoden voor het genereren van sequentiegegevens en vereisen vaak wijzigingen in gevestigde protocollen. FFPE-weefsels vertegenwoordigen een dergelijk monstertype dat op grote schaal is gebruikt voor klinische specimens1,2,3. Terwijl FFPE behoud onderhoudt weefselmorfologie, de nucleïnezuren in FFPE weefsels vertonen meestal een breed scala van schade en afbraak, waardoor het moeilijk is om de genomische informatie die kan leiden tot belangrijke inzichten over moleculaire mechanismen die ten grondslag liggen aan verschillende aandoeningen op te halen.

Genexpressiegegevens gegenereerd door RNA-sequencing zijn vaak instrumenteel bij het bestuderen van ziekte- en resistentiemechanismen en vormen een aanvulling op de dna-mutatieanalyse. RNA is echter gevoeliger voor afbraak, waardoor het moeilijker wordt om nauwkeurige genexpressiegegevens uit FFPE-weefsels te genereren. Bovendien, omdat de brede beschikbaarheid en betaalbaarheid van sequencing relatief recent is, werden oudere exemplaren vaak niet opgeslagen in omstandigheden die nodig zijn om de RNA-integriteit te behouden. Enkele van de problemen voor FFPE monsters omvatten afbraak van RNA als gevolg van inbedding in paraffine, chemische modificatie van RNA leidt tot fragmentatie of refractoriness tot enzymatische processen die nodig zijn voor sequencing, en verlies van de poly-A staarten, het beperken van de toepasbaarheid van oligo-dT als een inleiding voor reverse transcripte4. Een andere uitdaging is de behandeling/opslag van FFPE-monsters onder suboptimale omstandigheden, wat kan leiden tot verdere afbraak van labiele moleculen zoals RNA in de weefsels5. Dit is vooral relevant voor oudere monsters die kunnen zijn verzameld op een moment dat genexpressie analyse door RNA sequencing niet werd verwacht voor de monsters. Al deze leiden tot verminderde kwaliteit en kwantiteit van het geëxtraheerde RNA beschikbaar voor het genereren van nuttige sequentiegegevens. De lage kans op succes, gecombineerd met de hoge kosten van sequencing, heeft veel onderzoekers ervan weerhouden om genexpressiegegevens te genereren en te analyseren uit potentieel nuttige FFPE-monsters. Sommige studies in de afgelopen jaren hebben aangetoond dat de bruikbaarheid van FFPE weefsels voor genexpressie analyse2,6,7,8,9, zij het voor minder en / of meer recente monsters.

Als haalbaarheidsstudie gebruikten we RNA uit FFPE-tumorweefselmonsters uit drie Residual Tissue Repositories van Surveillance, Epidemiologie en End Results (SEER) kankerregisters voor RNA-sequencing en genexpressieanalyse10. De FFPE-weefsels van hoogwaardige eierstokkanker werden van 7-32 jaar onder wisselende omstandigheden opgeslagen voor RNA-extractie. Omdat in de meeste gevallen deze blokken jarenlang op verschillende locaties waren opgeslagen zonder de verwachting van een gevoelige genetische analyse in de toekomst, was er niet veel zorg genomen om de nucleïnezuren te behouden. Zo, de meeste van de monsters tentoongesteld slechte kwaliteit RNA, met een groot deel van de monsters besmet met bacteriën. Niettemin waren we in staat om genkwantificering uit te voeren, de uniformiteit en continuïteit van gendekking te meten en de Pearson correlatieanalyse uit te voeren tussen biologische replica's om reproduceerbaarheid te meten. Op basis van een set van de belangrijkste handtekening genpaneel, vergeleken we de monsters in onze studie met The Cancer Genome Atlas (TCGA) gegevens en bevestigd dat ongeveer 60% van de monsters had vergelijkbare genexpressie profielen11. Op basis van de correlatie tussen verschillende QC-resultaten en voorbeeldmetadata, hebben we belangrijke QC-statistieken geïdentificeerd die een goede voorspellende waarde hebben voor het identificeren van monsters die eerder bruikbare sequentiegegevens genereren11.

Hier beschrijven we de methodologie die wordt gebruikt voor ffpe-RNA kwaliteitsbeoordeling, het genereren van sequencing bibliotheken vanaf geëxtraheerde RNA monsters, en bio-informatica analyse van de sequencing gegevens.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. RNA-kwantiteit en kwaliteitsbeoordeling

  1. Selecteer de FFPE-monsters op basis van vooraf gedefinieerde criteria en extraheer RNA met behulp van een geschikte methode (bijvoorbeeld FFPE-nuclei zuur extractiekit, tabel van materialen).
    OPMERKING: Er zijn verschillende methoden beschikbaar voor FFPE-RNA extractie, waaronder de nieuwere microdissection methoden die kunnen werken met zeer weinig weefsel en extract goede kwaliteit RNA12,13,14.
  2. Er moet alles aan worden gedaan om de integriteit van RNA in alle stadia te behouden. Dit omvat het werken met RNase vrij gedeioniseerd water, het gebruik van RNase gratis plasticware, en het reinigen van alle instrumenten die in contact komen met de FFPE blokken met RNase ontsmetting reagentia.
  3. RNA moet altijd zorgvuldig worden behandeld en in ijs worden bewaard, tenzij anders bepaald om afbraak tijdens het hanteren te minimaliseren.
  4. Als er voldoende materiaal beschikbaar is, extract RNA uit meer dan een regio in het FFPE-blok om biologische replica's te genereren uit zoveel mogelijk monsters. Voor sommige van de monsters met een ruime RNA-opbrengst, verdeel het geëxtraheerde RNA in twee om te verwerken als technische replica's.
  5. Verzamel indien mogelijk een kleine hoeveelheid monster afzonderlijk na extractie voor QC (d.w.z. een QC-aliquot) om herhaalde behandelings- en vriesdooicycli van het monster te voorkomen die waarschijnlijk tot afbraak van het RNA zullen leiden.
  6. Controleer de kwaliteit van het RNA (bij voorkeur van de QC aliquot) door het uit te voeren op een RNA QC-systeem (bijvoorbeeld Agilent Bioanalyzer systeem met behulp van een RNA Nano-chip, Tabel van materialen) volgens de instructies van de fabrikant.
  7. Analyseer de verdeling van RNA-fragmenten in de samples (bijvoorbeeld met behulp van de Bioanalyzer 2100 Expert-software) door de DV200- en DV100-waarden te berekenen als het percentage fragmenten groter dan 200 nt (DV200) of 100 nt (DV100)in grootte.
  8. Onder DV200 en DV100,identificeer de statistiek die een grotere spreiding van waarden voor de gegeven steekproefset heeft, en kies dat voor het groeperen van de steekproeven op hun graad van intactheid.
    OPMERKING: Voor voorbeeldsets met meer intacte RNA-moleculen (d.w.z. hoge DV200-waarden, alles of meer met DV200 > 40%), is DV200 waarschijnlijk een nuttige QC-statistiek. Echter, voor voorbeeld sets met meer gedegradeerde transcripties (dat wil zeggen, lage DV200 waarden, alle of de meeste met DV200 < 40%), DV100 is meer kans om nuttig te zijn.
  9. Op basis van de QC-statistieken, identificeer de monsters die DV100 < 40% hebben. Omdat deze mate van afbraak zeer waarschijnlijk geen nuttige sequencing gegevens11genereert, is het raadzaam om te voorkomen dat dergelijke monsters worden verwerkt. Als vervangingen voor dergelijke monsters beschikbaar zijn, moet de kwaliteit ervan worden gecontroleerd om idealiter alleen monsters met DV100 > 50% op te nemen.

2. Volgorde van voorbereiding van de bibliotheek

  1. Op basis van de kwaliteit van de monsters zoals beoordeeld in sectie 1, een geschikte methode voor het genereren van de sequencing bibliotheken.
    1. Voor voorbeeldsets met een zeer lage afbraak en hoge DV200-waarden gebruikt u mRNA-sequencing (d.w.z. het vastleggen van polyadenylated transcripties), gerichte RNA-sequencing (d.w.z. het gebruik van capture probes voor specifieke genen van belang), RNA exome sequencing (d.w.z. het gebruik van capture probes om te verrijken voor de coderingstranscriptie), of totale RNA-sequencing (d.w.z., gebruik van willekeurige primers voor omgekeerde transcriptie om de gehele RNA-populatie te sequencen na het verwijderen van ribosomale RNA uit de monsters). Het is echter belangrijk op te merken dat het fixatieproces bias in het geëxtraheerde RNA kan introduceren. Zo kan de capture benaderingen niet goed werken in alle gevallen, zelfs met hoge DV200 waarden.
    2. Als de voorbeeldset monsters bevat met een hoge afbraak (DV200 < 30%), gebruikt u een totale RNA-bibliotheekvoorbereidingsmethode en niet een methode die afhankelijk is van het vastleggen van specifieke gebieden van de transcripties, omdat deze specifieke regio's mogelijk ontbreken in gedegradeerde monsters. Het gebruik van willekeurige primers voor het genereren van cDNA leidt tot een hogere weergave van bruikbaar RNA in de uiteindelijke bibliotheek, en is daarom meer geschikt voor FFPE-RNA monsters.
    3. Voor ribosomale RNA-uitputting voor monstersets met een hoge afbraak, gebruikt u op RNaseH gebaseerde methoden. Dit zijn methoden waarbij rRNA-specifieke DNA-sondes binden aan rRNA, dubbelstrengs moleculen worden verteerd door RNaseH, en overgebleven sondes worden opgeruimd door DNase (bijvoorbeeld NEBNext rRNA uitputting kit, Tabel van materialen). Deze methoden werken beter voor gedegradeerde monsters dan sommige andere methoden8.
  2. Voor het genereren van sequencingbibliotheken gebruikt u hogere invoerbedragen (indien mogelijk) voor monsters met meer afgebroken RNA (DV100 < 60%). Terwijl monsters met een redelijk goede kwaliteit RNA (DV100 > 60%) kan opleveren goede sequentie gegevens, zelfs bij lagere input bedragen (de laagste getest voor dit protocol met FFPE-RNA was ~ 20 ng), voor meer gedegradeerd RNA (DV100 < 60%), is het beter om te beginnen met hogere input bedragen (bijvoorbeeld, >100 ng).
    OPMERKING: Als er voldoende (bijvoorbeeld >500 ng) monster beschikbaar is, is het raadzaam om ten minste de helft van het monster op te slaan voor het herhalen van de bibliotheek voorbereiding, indien nodig. Voor monsters met een lage invoer (bijvoorbeeld <100 ng) is het meestal beter om de volledige hoeveelheid te gebruiken en een bibliotheek van voldoende diversiteit te genereren.
  3. Na het selecteren van een geschikte bibliotheek voorbereiding kit voor het genereren van totale RNA seq bibliotheken uit monsters met een hoge afbraak (bijvoorbeeld, NEBNext Ultra II RNA Library Prep Kit voor Illumina, zie Tabel van materialen), volg de instructies van de fabrikant om de bibliotheken te genereren.
    OPMERKING: Tijdens de voorbereiding van de bibliotheek is het belangrijk om de RNA-fragmentatiestap voor gedegradeerde monsters over te slaan en het gebruik van willekeurige primers voor de eerste strengcDNA-synthese te garanderen.
  4. Voor het verbeteren van de efficiëntie en snelheid, vooral voor de lage invoer monsters, gebruik maken van de juiste magnetische rekken met sterke vaste magneten voor kraal-gebaseerde zuivering en grootte-selectie stappen (zie Tabel van materialen).
  5. Voor PCR-verrijking van adapterligumed DNA, pas het aantal versterkingscycli aan op basis van de hoeveelheid input-DNA om maximale weergave te garanderen en onnodige duplicatie van de bibliotheekmoleculen te voorkomen. Voor ffpe-RNA-samples met een lage invoer (<100 ng) raden we 16-18 versterkingscycli aan, terwijl de hoge inputsamples (1.000 ng) meestal voldoende bibliotheekhoeveelheden genereren in 12-14 versterkingsronden.
  6. Na PCR-versterking en opschoning volgens de instructies van de fabrikant, beoordeelt u de bibliotheekkwaliteit door de bibliotheekconcentratie en de verdeling van moleculen op een geschikt platform te analyseren (bijvoorbeeld Agilent Bioanalyzer DNA Chip, zie Tabel van materialen). Voor monsters met primer pieken (~ 80 bp) of adapter-dimer pieken (~ 128 bp), herhaal de cleanup om deze pieken te verwijderen.
  7. Bereken de gemiddelde bibliotheekgrootte voor elke bibliotheek (bijvoorbeeld met behulp van de Bioanalyzer 2100 Expert-software).

3. Sequencing bibliotheek QC

  1. Zodra is vastgesteld dat de bibliotheken vrij zijn van overtollige primer en adapter-dimers en voldoende concentratie hebben voor latere sequencing, kwantificeren verder door qPCR.
    OPMERKING: Vanwege de gevoeligheid van clustergeneratie voor bibliotheekconcentratie is nauwkeurige kwantificering van vitaal belang om te voorkomen dat kostbare sequencing-runs ondermaats presteren of overbelasten. Kwantitatieve real-time PCR (qPCR) methoden zijn nuttig voor het verbeteren van de clusterdichtheid op Illumina-platforms zonder dat dit resulteert in overclustering. De qPCR-methode is nauwkeuriger en gevoeliger dan de methoden op basis van kwalitatieve en/of kwantitatieve analyse van alle bibliotheekmoleculen (bijvoorbeeld Agilent Bioanalyzer), omdat het de sjablonen meet die beide adaptersequenties aan beide zijden hebben die clusters vormen op de stroomcel. De grootte van de bibliotheek moet echter van tevoren bekend worden als een groottecorrectie moet worden toegepast op alle monsters, zodat de resultaten kunnen worden vergeleken met een standaardcurve.
    LET OP: Labjassen en handschoenen moeten altijd worden gedragen bij het uitvoeren van qPCR, en de procedure moet worden uitgevoerd in een bioveiligheidskast volgens de instructies van de fabrikant.
    1. Stel een 96-putplaat in met drie replicaties voor elk monster voor foutpreventie met behulp van een geschikte kit (bijvoorbeeld KAPA SYBR FAST qPCR Master Mix for Illumina-bibliotheken, een deel van de Library Quantification-kit, zie Tabel met materialen),samen met de normen, een positieve controle (bijvoorbeeld PhiX-controle, zie Tabel van Materialen),en een no template-controle (NTC). De NTC is qPCR mix zonder DNA bibliotheek. De positieve controle kan elke bibliotheek met bekende concentratie en fragmentgrootte zijn.
      1. Bereid minimaal zes verdunningen van de standaarden volgens het leveranciersprotocol voor.
    2. Na het toevoegen van alle componenten (dat wil zeggen, qPCR master mix, bibliotheken, normen), dek de plaat met afdichting film en gebruik een squeegee om ervoor te zorgen dat de film maakt gelijkmatig en veilig contact met de plaat.
    3. Vortex en spin de plaat bij 1.500 rpm voor ten minste 1 min. Visueel inspecteren van de plaat om ervoor te zorgen dat er geen luchtbellen aan de onderkant van de putten.
    4. Stel de plaat in op de thermische cycler (bijvoorbeeld CFX96 Touch System, zie Tabel van Materialen) met behulp van de aanbevolen instellingen van de fabrikant.
    5. Sla de run-map op waar deze kan worden geopend voor gegevensanalyse.
    6. Controleer tijdens de gegevensanalyse of de helling zich in het bereik van -3,1 tot -3,6 bevindt, de efficiëntie van 90% tot 110% en de R2 (correlatiecoëfficiënt voor de standaardcurve) niet minder dan 0,98.
  2. Pooling: Zodra de qPCR-concentratie van de sequencing ready bibliotheken is verkregen, pool equimolar hoeveelheden van elk van de bibliotheken, afhankelijk van het aantal sequencing leest vereist per monster en de volgorde output van het instrument.
  3. QC van de pools: Kwuleer de bibliotheekgroepen opnieuw door qPCR volgens hetzelfde protocol als beschreven in stap 3.1.

4. Volgorde

  1. Afhankelijk van de run parameters, trek de sequencing reagens kits en ontdooien ze volgens de handleiding. Kijk op de website van Illumina voor de nieuwste versies van alle gebruikersgidsen voor sequencing op Illumina-instrumenten.
  2. Zorg ervoor dat de reagentia volledig ontdooid zijn en leg de reagentiabak op 4 °C. De run moet uiterlijk om 2 uur worden gestart nadat de reagentia zijn ontdooid. Als u dat niet doet, kan dit van invloed zijn op de kwaliteit van de run-resultaten.
  3. Draai de cartridge 5x om om reagentia te mengen en tik voorzichtig op de bank om luchtbellen te verminderen.
  4. Zet het onverpakte stroomcelpakket 30 minuten opzij op kamertemperatuur.
  5. Pak het stroomcelpakket uit en maak het glasoppervlak van de stroomcel schoon met een pluisvrij alcoholdoekje. Droog het glas met een laag pluisisch laboratoriumweefsel.
  6. Open de toepassingIllumina" Experiment Manager ". Kies 'Voorbeeldblad maken',kies vervolgens de Sequencer en klik op 'Volgende'.
  7. Maak en upload het voorbeeldblad op basis van Illumina sequencer criteria (bijvoorbeeld Illumina Experiment Manager, software guide).
  8. Scan bij de prompts de barcode van de reagenskit en voer de run Set Up Parameters in (bijvoorbeeld voor een enkele geïndexeerde PE 75-cyclusrun 76-8-76).
  9. Ontature en verdun de bibliotheekgroep op basis van de aanbeveling voor de sequencer-gebruikersgids (bijvoorbeeld NextSeq 500-systeemgids van Illumina, zie Tabel met materialen).
  10. Denature en verdun de controlebibliotheek PhiX (zie Tabel van Materialen)aan de aangewezen concentratie (b.v., 1.8 pM voor NextSeq).
  11. Mix voorbeeldbibliotheek en PhiX-besturingselement om te resulteren in een PhiX-controlevolumeverhouding van 1%.
  12. Belast gedenatureerd en verdund monster in de reagenscartridge in het aangewezen reservoir.
  13. Laad de stroomcel, buffercartridge en de reagentcartridge.
  14. Voer een geautomatiseerde controle en controle uit om ervoor te zorgen dat de runparameters de systeemcontrole doorstaan.
  15. Wanneer de automatische controle is voltooid, selecteert u Start om de sequencing-run te starten.

5. Gegevensanalyse en kwaliteitsbeoordeling

OPMERKING: Een typische RNA-seq data-analyse workflow (Figuur 1) omvat voorbewerking en QC, uitlijning naar genoom en post alignment QC, gen en transcript kwantificering, monster correlatie analyse, differentiële analyse tussen verschillende monstergroepen, behandeling voorwaarden, en gen set verrijking en route analyse.

De RNA-seq-gegevens kunnen kwaliteitsproblemen hebben die de nauwkeurigheid van genprofilering kunnen beïnvloeden en tot foutieve conclusies kunnen leiden. Daarom zijn de eerste QC-controles op sequencing-kwaliteit, verontreiniging, sequencing dekkingbias en andere bronnen van artefacten erg belangrijk. Het toepassen van een RNA-Seq QC-pijplijn die vergelijkbaar is met de hier beschreven werkstroom, wordt aanbevolen om artefacten te detecteren en filtering of correctie toe te passen voordat de downstream-analyse wordt uitgevoerd.

  1. Preprocessing
    OPMERKING: Dit omvat demultiplexing, beoordeling van de gelezen kwaliteit van de volgorde, kGC-inhoud, aanwezigheid van sequencing-adapters, oververtegenwoordigde k-mers en PCR-gedupliceerde reads. Deze informatie helpt bij het detecteren van sequencing fouten, PCR-artefacten of verontreiniging.
    1. Demultiplex Illumina sequencing wordt uitgevoerd met behulp van de Illumina software tool bcl2fastq2 om ruwe FASTQ-bestanden te genereren voor elk monster gedefinieerd in de voorbeeldblad. Laat een mismatch in de barcodes van de voorbeeldindex sequencing tolereren als er geen botsing met streepjescodes is.
    2. Voer de FASTQC15-softwaretool uit om een kwaliteitscontrole uit te voeren op ruwe FASTQ-bestanden om eventuele slechte kwaliteit of afwijkingen in het opeenvolgen van afwijkingen te detecteren.
    3. Voor adapter- en lage-kwaliteits bases trimmen, trim de sequencing adapters en lage kwaliteit bases met behulp van Cutadapt16 of Trimmomatic17 software tools. Sla de bijgesneden reads op in de fastq-bestanden met twee uiteindes.
    4. Contaminatiescherm
      1. Voer FASTQ_screen18 om mogelijke kruisbesmetting met andere soorten op te sporen.
      2. Run miniKraken van Kraken219 om de taxonomieën van besmette soorten te identificeren.
  2. Uitlijning naar referentiegenoom en postuitlijning QC
    1. De bijgesneden leest kunnen worden uitgelijnd op een referentie genoomsequentie (GRCh Build hg19 of hg38) met behulp van STAR aligner20. Pas het GTF-bestand Gencode-annotatie toe om de gespleten transcriptuitlijning te begeleiden. Het wordt aanbevolen om STAR 2-pass uit te voeren om de gevoeligheid voor nieuwe splice-knooppunten te verhogen. In de tweede pas worden alle reads opnieuw in kaart gebracht met behulp van geannoteerd gen en transcripties en nieuwe knooppunten vanaf de eerste pas.
    2. Voer QC uit na uitlijning uit.
      1. Voer Picard's21MarkDuplicates uit om de complexiteit van de bibliotheek te evalueren door de hoeveelheid unieke of niet-gedupliceerde reads in de samples te bepalen.
      2. Voer Picard's CollectRnaSeqMetrics-programma uit om kaartpercentages te verzamelen op codering, intronic, intergene, UTR-regio's en genlichaamdekking.
      3. Voer RSeQC22 uit om de binnenafstand van het leespaar te bepalen, lees de verdeling over CDS-exonen, 5'UTR, 3'UTR, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, lees GC-inhoud, verbindingsverzadiging en informatie over bibliotheekstreng.
      4. Voer multi-QC23 uit om een geaggregeerd rapport in HTML-indeling te genereren.
  3. Genkwantificering en correctieanalyse
    1. Voer RSEM24 om ruwe telling evenals genormaliseerde gelezen telling op genen en afschriften te krijgen. De leestellingsmeting zoals RPKM (leest per kilobase van exonmodel per miljoen leest), FPKM (fragmenten per kilobase van exonmodel per miljoen toegewezen leest) en TPM (transcripties per miljoen) zijn de vaakst gemelde RNA-seq genexpressiewaarden. Genen die onder een ruisende drempel worden uitgedrukt (zoals TPM < 1 of raw count <5) kunnen worden gefilterd.
    2. Voer transcriptkwantificering uit om ruwe tellingen van toegewezen reads op elke transcriptequenties samen te voegen met behulp van programma's zoals HTSeq-count of featureCounts.
    3. Uitvoeren Van Principal Components Analysis (PCA) met behulp van een R-script om batch-effecten te bepalen en een kwaliteitskaart van de opgegeven gegevensset25te beoordelen. Monstercorrelatieanalyse kan worden uitgevoerd met behulp van de Pearson correlatie tussen verschillende metrische gegevens.
  4. Differentiële genexpressieanalyse
    1. Voer gendifferentieelanalyse uit tussen monsteromstandigheden met behulp van het programma edgeR26,,27 en/of limma-Voom28 en gebruik normalisatiemethoden zoals TPM, TMM, DESeqof UpperQuartile.
    2. Het wordt aanbevolen om ten minste twee differentiële analyse software tools draaien om twee set van DEGs lijsten bellen voor vergelijking en krijgen de uiteindelijke DEGs om detectie gevoeligheid en nauwkeurigheid te verbeteren.
  5. Gen set verrijking en trajectanalyse
    1. Voer Gene Set Enrichment Analysis (GSEA)29,30 op basis van de rangschikking van transcripties volgens een meting van differentiaal uitgedrukte genen (DEGs) lijst om te bepalen of de DEGs statistisch significante, concordante verschillen tussen biologische omstandigheden vertonen.
    2. Voer functieanalyse uit met behulp van bronnen zoals Gene Ontology31, DAVID32,33of andere beschikbare softwaretools.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

De hierboven beschreven methode werd toegepast op 67 FFPE-monsters die gedurende 7-32 jaar onder verschillende omstandigheden waren opgeslagen (de mediane opslagtijd van monsters was 17,5 jaar). De hier gepresenteerde dataset- en analyseresultaten werden eerder beschreven en gepubliceerd in Zhao et al.11. Bij het controleren van de monsterkwaliteit zoals eerder beschreven (d.w.z. voorbeeldsporen in figuur 2)bleek DV100 nuttiger te zijn dan DV200 omdat het gevoeliger is om het aandeel kleinere fragmentgroottes voor sterk gedegradeerde RNA-monsters nauwkeurig te meten.

In de gegeven steekproefset was minder dan 10% van de monsters (7 van de 67) boven de DV200-afgesneden van 30%, zoals aanbevolen door Illumina34. Ongeveer 26% van de monsters (19 van de 67) had een DV100 > 60% (d.w.z. een hogere kans op het genereren van goede sequentiegegevens), 40% (27 van 67) bevonden zich in het bereik van 40%-60% voor DV100 (d.w.z., aanvaardbaar, maar met een lagere kans op het genereren van goede sequentiegegevens), en ongeveer 10% (7 van de 67) had een DV100 van <40% (d.w.z. zeer lage kans op goede sequentiegegevens). Voor 14 van de 67 monsters, de software was niet in staat om de DV-waarden te bepalen. Tabel 1 bevat een overzicht van QC-statistieken voor de voorbeelden in verschillende DV100-categorieën. Voor gedetailleerde QC-analyse en gegevenscorrelatie voor alle 67 monsters, zie Zhao et al.11.

Gezien de hoge mate van degradatie in de sample set, een 'totale RNA' bibliotheek voorbereiding methode werd gekozen, en sequencing bibliotheken werden voorbereid met behulp van de NEBNext Ultra II RNA Library Prep Kit voor Illumina (Tabel van materialen). Om de weergave van de sequencing bibliotheken te verbeteren, ondanks de hoge mate van monsterdegradatie, werd de maximaal mogelijke hoeveelheid RNA (1.000 ng indien beschikbaar) gebruikt als input voor bibliotheekvoorbereiding. Bovendien, de hoge afbraak van de FFPE-RNA monsters noopte de rRNA uitputting methode, omdat de gedegradeerde transcripties waren waarschijnlijk niet de poly-A staarten voor mRNA capture. Na de uitputting van ribosomale RNA door hybridisatie naar specifieke sondes en de vertering van de gehybridiseerde transcripties met behulp van RNaseH, werden de resterende transcripties omgezet in cDNA met behulp van willekeurige primers. De selectie van de grootte werd ook vermeden voor bibliotheken die zijn voorbereid op voorbeelden met lagere invoer. Voorbeeldsporen van definitieve bibliotheken worden weergegeven in figuur 3.

Sterk gedegradeerde FFPE monsters vormen een grote uitdaging voor genexpressie profilering in tumor monsters. Het toepassen van de juiste analysemethoden voor bio-informatica en softwaretools is dus van cruciaal belang om artefacten of afwijkingen in datasets te detecteren om een hoge nauwkeurigheid en reproduceerbaarheid van genkwantificering te garanderen. De softwaretools die in deze studie worden gebruikt, zijn opgenomen in de aanvullende tabel. In de gegeven voorbeeldset hebben we sequencing en bibliotheekkwaliteitsbeoordeling uitgevoerd, met enkele voorbeeldstatistieken in figuur 4. Een overzicht van de kwaliteit van de raw fastq-bestandssequencing en de inhoud van de voorbeeldadapter worden weergegeven in respectievelijk figuur 4A en figuur 4B. Fastqc-scherm kan helpen bij het detecteren van besmetting, zoals bacteriële en muisverontreiniging, in de monsters zoals weergegeven in figuur 4C. In de gegeven sample set, 41 van de 67 monsters had 5%-48% bacteriële besmetting, en zes monsters had 4%-11% muis besmetting (Figuur 4C). STAR uitlijning resultaten (Figuur 4D) toonde het aandeel van de leest in kaart gebracht aan de referentie genoom, percentage van de leest uniek in kaart gebracht aan de referentie genoom, en het aandeel van de leest die niet werden toegewezen of in kaart gebracht om meerdere loci. Picard CollectRNAStatistics werd gebruikt om het percentage mRNA, intronic en intergene bases te bepalen die aanwezig zijn in de uitlijnbestanden(figuur 4E). Om de uniformiteit van de leesdekking op gen en transcripties te beoordelen, gebruikten we de Picard-softwaretool om een genlichaamdekkingsplot te genereren, dat het percentage reads meet dat betrekking heeft op elke nucleotidepositie van alle genen die in bakken zijn opgeschaald van 5′ UTR tot 3′ UTR. Figuur 4F toont aan dat sommige gedegradeerde bibliotheken 3' bias hadden, waar meer reads dichter bij 3' einde in kaart worden gebracht dan aan het einde van 5.I.

FFPE-monsters hebben meestal een grote variabiliteit in genexpressieprofielen die kunnen ontstaan als gevolg van variabele afbraak tijdens monsteropslag, RNA-extractie of monsterverwerking. Het is belangrijk om geschikte statistische methoden te gebruiken om de onderliggende patronen bloot te leggen en de variatie en correlatie tussen monsters te meten. We hebben Principal Component Analysis (PCA) toegepast voor zes paar biologische replica's uit een subset van de 67 FFPE-monsters. Uit een pca-plot bleek dat 26% van de totale variatie werd vastgelegd door de eerste hoofdcomponent en 19% van de tweede en derde componenten samen (figuur 5). Van de zes paren van replica's, twee paren van replicaties had hogere variaties (correlaties onder 0,22) dan de laatste vier monsters (correlatiewaarden tussen 0,7-0,8) bij het vergelijken van genexpressie waarden tussen de repliceren paren. Omdat de replica's werden gegenereerd door het extraheren van RNA uit twee verschillende weefselkrullen gesneden uit dezelfde FFPE blokken, het weefsel leeftijd was geen factor in de hogere variantie hier, en het was waarschijnlijk veroorzaakt door de verschillende hoeveelheid bacteriële besmetting (1%-55%) evenals verschillende mRNA-inhoud (2-3 keer verschil) tussen de replica's. De willekeur van mRNA-afbraak na extractie kan ook bijdragen aan de hogere variantie tussen monsters van vergelijkbare oorsprong.

Figure 1
Figuur 1: RNaseq analyseworkflow. Het stroomdiagram beschrijft de analysestappen voor voorbewerking, kwaliteitsbeoordeling, toewijzing naar referentie, genkwantificering en differentiële analyse tussen verschillende steekproefgroepen. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 2
Figuur 2: Voorbeeld Bioanalyzer sporen van zes verschillende FFPE-RNA monsters. De horizontale as geeft de moleculaire gewicht (bp) en fluorescentie-eenheden (FU) aan en de verticale as toont de concentratie van fragmenten van verschillende grootte. De RNA Integrity Numbers (RIN), DV200 (d.w.z. percentage fragmenten >200 bp) en DV100 (d.w.z. percentage fragmenten >100 bp) worden op elk profiel aangegeven. Een piek van 25 bp in elk profiel geeft de moleculaire gewichtsmarkering aan. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 3
Figuur 3: Voorbeeld Bioanalyzer sporen van de laatste bibliotheken bereid uit vier verschillende monsters. De horizontale as geeft de moleculaire gewicht (bp) en fluorescentie-eenheden (FU) op de verticale as aan de concentratie van verschillende groottefragmenten aan. De onderste (35 bp of 50 bp) en bovenste (10.380 bp) marker pieken zijn gelabeld in respectievelijk groen en paars. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 4
Figuur 4: Voorbeeld multi-QC-rapport voor het voorbewerken van QC-resultaten. (A) Lijndiagram met de percentages van Q30-basissen van alle sequencing leest in elk monster. (B) Sequencing adapter inhoud in raw fastq bestanden. (C) Verontreinigingsscherm om nauw op elkaar afgestemde soorten te controleren. (D) Genoommapping statistieken. (E) Lees de distributie op basis van Gencode genannotatie. (F) Gene lichaam / transcript dekking Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 5
Figuur 5: Voorbeeld van PCA-analyse om de concordantie van de steekproefgroep weer te geven. PCA-analyse voor biologische replica's. PCA plot met monsters uitgezet in twee dimensies met behulp van hun projecties op de eerste twee belangrijkste componenten. Biologische replicaties worden in dezelfde kleur weergegeven. Klik hier om een grotere versie van dit cijfer te bekijken.

Aantal monsters Mediane invoer voor lib prep (ng) Mediaan RIN Mediaan DV200 Mediaan DV100 Mediaan Lib-grootte (bp) Mediane Lib opbrengst (ng) Mediane Lib Molarity (nM) Mediane specimen opslagtijd (jaren) Mediane % besmetting Gemiddelde gentelling
DV100 <40% 7 237.6 2.5 6 34 445 24.5 7 22 27.4 14,759
DV100 40-60% 27 1000 2.5 12 51 408 19.8 5.9 18 9.9 10,202
DV100 >60% 19 1000 2.3 26 73 355 84.9 24 13 3.2 9,993

Tabel 1: Overzicht van de QC-statistieken met de steekproefset. De tabel toont de QC-statistieken van de monsters, gegroepeerd op basis van hun DV100-waarden. Het aantal voorbeelden in elke groep wordt vermeld en mediane waarden voor elke statistiek worden weergegeven.

Aanvullende tabel: Analysesoftwaretools, parameters en softwarereferentie. De tabel bevat de analysesoftwaretools en parameters die worden gebruikt in elke stap van de RNA-seq-analyse. De verwijzingen naar de softwaretool worden in de tabel weergegeven. Klik hier om deze tabel te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

De hier beschreven methode schetst de belangrijkste stappen die nodig zijn om goede sequentiegegevens te verkrijgen van FFPE-RNA-monsters. De belangrijkste punten om met deze methode rekening mee te houden zijn: (1) Zorg ervoor dat het RNA na extractie zo goed mogelijk wordt bewaard door de behandeling van het monster en het bevriezen en ontdooien van cycli te minimaliseren. Aparte QC aliquots zijn zeer nuttig. (2) Gebruik een QC-statistiek die het beste is voor de gegeven sampleset. RIN-waarden en DV200 zijn vaak niet nuttig voor gedegradeerde monsters en DV100 kan de statistiek zijn om de kwaliteit in een bepaalde voorbeeldset te beoordelen. (3) Voor meer gedegradeerde monsters is het het beste om een hoge steekproefinvoer te gebruiken. Hogere inputbedragen leiden tot een betere diversiteit en een lagere duplicatie in de uiteindelijke bibliotheek, wat leidt tot een betere gegevenskwaliteit. Omdat niet alle RNA in FFPE-RNA monsters bruikbaar is als gevolg van hoge afbraak en refractoriness aan enzymatische processen, zijn deze effecten meer uitgesproken in FFPE-RNA in vergelijking met vers bevroren RNA. (4) Gebruik willekeurige priming voor de omgekeerde transcriptiestap in tegenstelling tot het gebruik van oligo-dT of specifieke sequenties als primers. Tenzij de set van specifieke sondes in staat is om zo veel mogelijk volgorde voor alle transcripties van belang te dekken, willekeurige primers zijn een veilige gok om de omzetting van een maximum aantal transcripties (of fragmenten daarvan) in cDNA te waarborgen. Dus, totale RNA bibliotheek prep methoden zijn nuttiger voor gedegradeerde monsters dan mRNA methoden, die afhankelijk zijn van de aanwezigheid van poly-A staarten. (5) Een nauwkeurige kwantificering van bibliotheken door kwantitatieve real-time PCR (qPCR) is belangrijk om ondermaatse prestaties of overbelasting van de sequencers te voorkomen. (6) Mogelijke besmetting van het RNA beoordelen als onderdeel van de standaard RNA-Seq QC-protocollen na de nancquentie. Bacteriële besmetting en genomische DNA-besmetting komen vaak voor bij FFPE-monsters als gevolg van opslagomstandigheden en monsterbereidingsprocedures. Monsters die besmet zijn met vreemde soorten kunnen de dekking van de sequencing verspillen, afhankelijk van de omvang van de verontreiniging. Bovendien kan interne verontreiniging het gevolg zijn van onvolledige rRNA-uitputting, wat leidt tot een hoog percentage reads mapping naar rRNAs. Inefficiënte genomische DNA-verwijdering tijdens DNase spijsvertering kan leiden tot vals-positieve expressie detectie van transcripties of onjuiste de novo assemblage van transcripties. Adapter verontreiniging geïntroduceerd tijdens de voorbereiding van de bibliotheek is ook een veel voorkomend probleem voor sterk gedegradeerde RNAs met zeer korte RNA fragmenten. Besmetting kan de nauwkeurigheid van gen- en transcript profilering beïnvloeden en leiden tot valse ontdekking. Daarom is het belangrijk om de contaminatiebronnen nauwkeurig te identificeren en de verontreiniging, indien mogelijk, tijdens de voorbereidingsstappen van het monster of de bibliotheek te verwijderen of de vervuilende reads tijdens de gegevensverwerkingsstap te filteren. (7) Voorbewerking en kwaliteitscontrole na uitlijning zijn belangrijk om monsters van slechte kwaliteit en een laag mRNA-gehalte op te sporen. Deze monsters moeten uit verdere analyse worden verwijderd. Genexpressie gegevens uit monsters die lage gentellingen genereren, slechte dekking moet worden gebruikt met de nodige voorzichtigheid. (8) Het is een goede gewoonte om biologische replica's op te nemen om de variantie van monsters en correlatie te meten om de reproduceerbaarheid van gegevens te waarborgen.

FFPE monsters vertegenwoordigen een zeer waardevolle bron voor een groot aantal ziekten. De mogelijkheid om betrouwbare sequentie-informatie te verkrijgen uit dergelijke monsters zou helpen veel studies gericht op het begrijpen van de moleculaire mechanismen achter verschillende aandoeningen, weerstand, en gevoeligheid. Hoewel de beperkingen die worden opgelegd door de vaak suboptimale kwaliteit van RNA uit dergelijke monsters dergelijke inspanningen belemmeren, helpen de hier beschreven stappen om deze beperkingen tot op zekere hoogte te beperken en stellen ons in staat om optimaal gebruik te maken van FFPE-RNA om betrouwbare genexpressie-informatie te verkrijgen.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Dit werk werd gefinancierd door het National Cancer Institute (NCI), National Institutes of Health (NIH). Leidos Biomedical Research, Inc. is de operationele en technische ondersteuning aannemer voor de Frederick National Laboratory for Cancer Research, die volledig wordt gefinancierd door NIH. Verschillende auteurs (YZ, MM, KT, YL, JS, BT) zijn aangesloten bij Leidos Biomedical Research, Inc, maar alle auteurs zijn volledig gefinancierd door het National Cancer Institute, inclusief salarissen van auteurs en onderzoeksmateriaal. Leidos Biomedical Research, Inc. gaf geen salaris voor de auteurs (YZ, MM, KT, YL, JS, BT) of materiaal voor de studie, noch had het enige rol in het ontwerp van de studie, het verzamelen van gegevens, analyse, besluit om te publiceren, of voorbereiding van het manuscript.

Acknowledgments

We zijn dr. Danielle Carrick (Division of Cancer Control and Population Sciences, National Cancer Institute) dankbaar voor voortdurende hulp, vooral voor het initiëren van deze studie, ons te voorzien van de monsters, en voor nuttige suggesties tijdens data-analyse. Wij danken alle leden van de CCR Sequencing Facility van het Frederick National Laboratory for Cancer Research voor hun hulp tijdens de voorbereiding van de steekproef en sequencing, vooral Brenda Ho voor hulp in monster QC, Oksana Duits voor bibliotheek QC, Tatyana Smirnova voor het runnen van de sequencers. We willen ook Tsai-wei Shen en Ashley Walton van Sequencing Facility Bioinformatics Group bedanken voor hun hulp bij data-analyse en RNA-seq pipeline implementation. We danken ccbr en NCBR ook voor hulp bij de analysepijplijn van RNaseq en de ontwikkeling van best practices.

Materials

Name Company Catalog Number Comments
2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

DOWNLOAD MATERIALS LIST

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019).
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019).
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Broad Institute. , Available from: http://broadinstitute.github.io/picard/ (2019).
  22. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  23. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  25. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  26. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  27. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  28. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  29. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  30. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  31. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  33. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  34. Evaluating RNA Quality from FFPE Samples. Illumina. , Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016).

Tags

Genetica RNA sequencing formaline-fixed paraffine embedded FFPE next generation sequencing NGS RNA-seq analysis
Optimalisatie voor sequencing en analyse van gedegradeerde FFPE-RNA Samples
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Levin, Y., Talsania, K., Tran, B.,More

Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter