Summary

Optimering til sekventering og analyse af forringede FFPE-RNA-prøver

Published: June 08, 2020
doi:

Summary

Denne metode beskriver de trin til at forbedre kvaliteten og kvantiteten af sekvensdata, der kan fås fra formalin-faste paraffin-indlejrede (FFPE) RNA-prøver. Vi beskriver metoden til mere præcist at vurdere kvaliteten af FFPE-RNA-prøver, udarbejde sekventeringsbiblioteker og analysere data fra FFPE-RNA-prøver.

Abstract

Genekspressionsanalyse ved RNA-sekventering (RNA-seq) giver unik indsigt i kliniske prøver, der potentielt kan føre til mekanistisk forståelse af grundlaget for forskellige sygdomme samt resistens- og/eller modtagelighedsmekanismer. FFPE-væv, som repræsenterer den mest almindelige metode til konservering af vævsmorfologi i kliniske prøver, er imidlertid ikke de bedste kilder til analyse af genekspressionsprofilering. RNA fremstillet af sådanne prøver er ofte nedbrudt, fragmenteret og kemisk modificeret, hvilket fører til suboptimale sekventering biblioteker. Til gengæld genererer disse sekvensdata af dårlig kvalitet, som måske ikke er pålidelige til genekspressionsanalyse og mutationsopdagelse. For at få mest muligt ud af FFPE-prøver og få de bedst mulige data fra prøver af lav kvalitet er det vigtigt at tage visse forholdsregler, mens man planlægger eksperimentelt design, forbereder sekventeringsbiblioteker og under dataanalyse. Dette omfatter brug af relevante målinger til præcis stikprøvekvalitetskontrol (QC), identificere de bedste metoder til forskellige trin under sekvensering bibliotek generation, og omhyggelig bibliotek QC. Desuden er det afgørende at anvende korrekte softwareværktøjer og parametre til sekvensdataanalyse for at identificere artefakter i RNA-seq-data, bortfiltrere forurening og lavkvalitetsaflæsninger, vurdere ensartetheden af gendækningen og måle reproducerbarheden af genekspressionsprofiler blandt biologiske replikater. Disse trin kan sikre høj nøjagtighed og reproducerbarhed til profilering af meget heterogene RNA-prøver. Her beskriver vi de forskellige trin til prøve QC, bibliotek forberedelse og QC, sekventering, og dataanalyse, der kan bidrage til at øge mængden af nyttige data fra lav kvalitet RNA, som den, der opnås fra FFPE-RNA væv.

Introduction

Brug af næste generations sekventeringsmetoder har gjort det muligt for os at indsamle et væld af oplysninger fra forskellige typer prøver. Gamle og dårligt bevarede prøver forbliver dog uigennemførlige for de almindeligt anvendte metoder til generering af sekvensdata og kræver ofte ændringer af veletablerede protokoller. FFPE-væv repræsenterer en sådan prøvetype , som er blevet anvendt i vid udstrækning til kliniske prøver1,2,3. Mens FFPE konservering fastholder væv morfologi, nukleinsyrer i FFPE væv normalt udviser en bred vifte af skader og nedbrydning, hvilket gør det vanskeligt at hente den genomiske oplysninger, der kan føre til vigtige indsigter om molekylære mekanismer, der ligger til grund for forskellige lidelser.

Genekspressionsdata genereret af RNA-sekvensering er ofte medvirkende til at studere sygdoms- og resistensmekanismer og supplerer DNA-mutationsanalyse. Men RNA er mere modtagelig for nedbrydning, hvilket gør det mere udfordrende at generere nøjagtige genekspressionsdata fra FFPE-væv. Da sekvensering er forholdsvis ny, blev ældre prøver desuden ofte ikke opbevaret under forhold, der var nødvendige for at bevare RNA-integriteten. Nogle af problemerne med FFPE-prøver omfatter nedbrydning af RNA på grund af indlejring i paraffin, kemisk modifikation af RNA, der fører til fragmentering eller refractoriness til enzymatiske processer, der kræves til sekventering, og tab af poly-A haler, begrænse anvendeligheden af oligo-dT som primer for omvendt transkription4. En anden udfordring er håndtering/opbevaring af FFPE-prøver under suboptimale forhold, hvilket kan føre til yderligere nedbrydning af labile molekyler som RNA i væv5. Dette er især relevant for ældre prøver, der kan være indsamlet på et tidspunkt, hvor der ikke blev forudset genekspressionsanalyse ved RNA-sekvensering for prøverne. Alle disse fører til nedsat kvalitet og kvantitet af det udtrukne RNA til rådighed til at generere nyttige sekvensdata. Den lave sandsynlighed for succes, kombineret med de høje omkostninger ved sekventering, har afskrækket mange forskere fra at forsøge at generere og analysere genekspressionsdata fra potentielt nyttige FFPE-prøver. Nogle undersøgelser i de senere år har vist, at FFPE-væv er anvendeligt til genekspressionsanalyse2,,6,7,8,9, om end for færre og/eller nyere prøver.

Som en forundersøgelse brugte vi RNA udvundet fra FFPE tumorvævsprøver fra tre residualvævslagre fra overvågning, epidemiologi og slutresultater (SEER) kræftregistre til RNA-sekventering og genekspressionsanalyse10. FFPE-væv fra højkvalitets ovarieserøse adenocarcinomer blev opbevaret fra 7-32 år under forskellige forhold før RNA-ekstraktion. Fordi disse blokke i de fleste tilfælde havde været opbevaret på forskellige steder i årevis uden forventning om nogen følsom genetisk analyse i fremtiden, var der ikke blevet taget megen hensyn til at bevare nukleinsyrerne. Således udviste de fleste prøver RNA af dårlig kvalitet, og en stor del af prøverne var forurenet med bakterier. Ikke desto mindre var vi i stand til at udføre gen kvantificering, måle ensartethed og kontinuitet i gendækning, og udføre Pearson korrelationsanalyse blandt biologiske replikater til at måle reproducerbarhed. Baseret på et sæt af centrale signatur gen panel, sammenlignede vi prøverne i vores undersøgelse med The Cancer Genome Atlas (TCGA) data og bekræftede, at ca 60% af prøverne havde sammenlignelige genekspression profiler11. Baseret på sammenhængen mellem forskellige QC-resultater og prøvemetadata identificerede vi vigtige QC-målinger, der har en god prædiktiv værdi til identifikation af prøver, der er mere tilbøjelige til at generere brugbare sekvensdata11.

Her beskriver vi den metode, der anvendes til FFPE-RNA-kvalitetsvurdering, generering af sekventeringsbiblioteker fra udvundet RNA-prøver og bioinformatikanalyse af sekventeringsdataene.

Protocol

1. RNA-kvantitet og kvalitetsvurdering Udvælg FFPE-prøverne efter foruddefinerede kriterier, og ekstrakt RNA udeksembes ved hjælp af en passende metode (f.eks. FFPE-nukleinsyreekstraktionssæt, tabel over materialer).BEMÆRK: Der findes flere forskellige metoder til FFPE-RNA-ekstraktion, herunder de nyere mikrodissectionmetoder, der kan arbejde med meget lidt væv og udtrække RNA12,13,,14….

Representative Results

Den ovenfor beskrevne metode blev anvendt på 67 FFPE-prøver, der havde været opbevaret under en række forskellige betingelser i 7-32 år (medianprøvelagringstiden var 17,5 år). De datasæt og analyseresultater, der præsenteres her , er tidligere beskrevet og offentliggjort i Zhao et al.11. Ved kontrol af prøvekvaliteten som beskrevet tidligere (dvs. eksempelspor i figur 2) blev DV100 anset for at være mere nyttig end DV200, fordi den er …

Discussion

Den metode, der er beskrevet her, skitserer de vigtigste trin, der kræves for at opnå gode sekvensdata fra FFPE-RNA-prøver. De vigtigste punkter, der skal overvejes med denne metode, er: 1) Sørg for, at RNA’et bevares bedst muligt efter ekstraktionen ved at minimere prøvehåndteringen og fryse- og optøningscyklusserne. Separate QC aliquots er meget hjælpsomme. (2) Brug en QC-metrikværdi, der er bedst for det givne stikprøvesæt. RIN-værdier og DV200 er ofte ikke nyttige for nedbrudte prøver, og DV<s…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Vi er taknemmelige for at Dr. Danielle Carrick (Division of Cancer Control og Befolkning Sciences, National Cancer Institute) for fortsat hjælp, især for at indlede denne undersøgelse, der giver os prøverne, og for nyttige forslag under dataanalyse. Vi oprigtigt takke alle medlemmer af CCR Sekventering Facility på Frederick National Laboratory for Cancer Research for deres hjælp under prøve forberedelse og sekventering, især Brenda Ho for bistand i prøve QC, Oksana tysk for biblioteket QC, Tatyana Smirnova for at køre sequencers. Vi vil også gerne takke Tsai-wei Shen og Ashley Walton på Sequencing Facility Bioinformatics Group for at hjælpe med dataanalyse og implementering af RNA-seq-rørledning. Vi takker også CCBR og NCBR for hjælp med RNaseq analyse pipeline og bedste praksis udvikling.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video