Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Validera hela genomet Nanopore Sekvensering, med Hjälp av Usutu Virus som exempel

Published: March 11, 2020 doi: 10.3791/60906

Summary

Vi har tidigare validerat ett protokoll för amplicon-baserade hela genomet Usutu virus (USUV) sekvensering på en nanopore sekvensering plattform. Här beskriver vi de metoder som används mer i detalj och bestämmer felfrekvensen för nanopore R10-flödescellen.

Abstract

Hela genomsekvensering kan användas för att karakterisera och spåra virusutbrott. Nanopore-baserade hela genomsekvenseringsprotokoll har beskrivits för flera olika virus. Dessa metoder använder en överlappande amplicon-baserade metod som kan användas för att rikta ett visst virus eller grupp av genetiskt relaterade virus. Förutom bekräftelse av virusnärvaron kan sekvensering användas för genomiska epidemiologistudier, för att spåra virus och reda ut ursprung, reservoarer och överföringssätt. För sådana tillämpningar är det viktigt att förstå möjliga effekter av felfrekvensen som är associerad med den plattform som används. Rutinmässig tillämpning i kliniska och folkhälsoinställningar kräver att detta dokumenteras med varje viktig förändring i protokollet. Tidigare validerades ett protokoll för hela genomet Usutu-virussekvensering på nanoporesekvenseringsplattformen (R9.4-flödescell) genom direkt jämförelse med Illumina-sekvensering. Här beskriver vi den metod som används för att bestämma den nödvändiga lästäckningen, med jämförelsen mellan R10-flödescellen och Illumina-sekvenseringen som exempel.

Introduction

Den snabba utvecklingen inom tredje generationens sekvensteknik gör det möjligt för oss att gå vidare mot nära sekvensering i realtid under virusutbrott. Denna tid sett till att genetisk information är tillgänglig kan vara användbar för att bestämma viruspatogenernas ursprung och utveckling. Guld standarder inom nästa generations sekvensering är dock fortfarande andra generationens sequencers. Dessa tekniker är beroende av specifika och tidskrävande tekniker som klonal förstärkning under en emulsion PCR eller klonal bro förstärkning. De tredje generationens sequencers är billigare, handhållna och kommer med förenklade biblioteksberedningsmetoder. Speciellt den lilla storleken på sekvensenheten och det låga inköpspriset gör det till en intressant kandidat för utbyggbar, fältbar sekvensering. Detta kan till exempel ses under ebolavirusutbrottet i Sierra Leone och under de pågående utredningarna av utbrott av arbovirus i Brasilien1,2,3. Den rapporterade höga felfrekvensen4 kan dock begränsa de program för vilka nanoporesekvensering kan användas.

Nanopore sekvensering utvecklas snabbt. Nya produkter finns på marknaden regelbundet. Exempel på detta är till exempel de 1D-kvadratiska satser som möjliggör sekvensering av båda delarna av DNA-molekylen, vilket ökar noggrannheten hos de kallas baserna5 och utvecklingen av R10-flödescellen som mäter förändringen i ström vid två olika fall ipor6 . Dessutom kommer förbättrade bioinformatiska verktyg som förbättringar i bascalling att förbättra noggrannheten hos basecalling7. En av de mest använda basuppringarna (t.ex. Albacore) har uppdaterats minst 12 gånger under en niomånadersperiod5. Nyligen släppte tillverkaren också en ny basecaller kallas flip-flop, som genomförs i standard nanopore programvara8. Tillsammans kommer alla dessa förbättringar att leda till mer exakta sekvenser och kommer att minska felfrekvensen för nanopore sequencer.

Usutu virus (USUV) är en mygga-borne arbovirus av familjen Flaviviridae och det har en positiv-strandsatta RNA genomet på cirka 11.000 nukleotider. USUV drabbar främst stora gråugglor och koltrastar9,10, även om andra fågelarter är också mottagliga för USUV infektion11. Nyligen identifierades USUV också hos gnagare och shrews även om deras potentiella roll i överföringen av viruset är okänd12. Hos människor, asymtomatiska infektioner har beskrivits i blodgivare13,14,15,16 medan USUV infektioner har också rapporterats vara associerade med encefalit eller meningo-encefalit17,18. I Nederländerna upptäcktes USUV först hos vilda fåglar 201610 och i asymtomatiska blodgivare 201814. Sedan den första upptäckten av USUV har utbrott rapporterats under de följande åren och övervakning, inklusive hela genomsekvensering, pågår för närvarande för att övervaka framforskning och spridning av ett trädvirus i en tidigare naiv population.

I likhet med vad som har beskrivits för andra virus, såsom ebolavirus, Zika virus och gula febern virus3,19,20, har vi utvecklat en primer inställd på sekvens full längd USUV21. Denna polymeras kedjereaktion (PCR)-baserad metod möjliggör återvinning av full längd USUV genom från mycket värd-förorenade provtyper som hjärnprover i prover upp till ett Ct-värde på cirka 32. Fördelarna med en amplicon-baserad sekvensering sett är en högre känslighet jämfört med metagenomisk sekvensering och en högre specificitet. Begränsningar av att använda en amplicon-baserad metod är att sekvenserna bör vara liknande för att utforma primers passar alla stammar och att primers är utformade på vår nuvarande kunskap om viruset mångfald.

Med tanke på den ständiga utvecklingen och förbättringarna i tredje generationens sekvensering finns det ett behov av att regelbundet utvärdera felfrekvensen för sequencer. Här beskriver vi en metod för att utvärdera nanopores prestanda direkt mot Belysningsarmatursekvensering med USUV som exempel. Denna metod tillämpas på sekvenser som genereras med den senaste R10 flödescellen och basecalling utförs med den senaste versionen av flip-flop basecaller.

Protocol

OBS: Lista över programvaruverktyg som ska användas: usearch v11.0.667; muskel v3.8.1551; porechop 0.2.4; cutadapt 2,5. minimap2 2.16-r922; Samtools 1.9. trimmomatic 0,39. bbmap 38.33; spader v3.13.1. kma-1.2.8

1. Primer design

  1. Börja med att ladda ner eller hämta en uppsättning relevanta referenshela genomsekvenser från offentliga eller privata datainsamlingar. Till exempel, hämta alla full längd USUV genom (taxid64286) från NCBI databasen22. USUV kodar ett genom på cirka 11.000 nukleotider så bara hämta sekvenser med en sekvens längd på 8.000-12.000 nukleotider. Gör detta med hjälp av följande sökpost:
    - taxid64286[Organism:noexp] OCH 8000[SLEN]:12000[SLEN].
    1. Klicka på Skicka till | Fullständig post | Fil; Använd Format = FASTA och skapa filen.
  2. Om du vill minska uppsättningen referenssekvenser tar du bort dubblettsekvenser eller sekvenser med över 99 % nukleotidsidentitet från datauppsättningen. Gör detta med hjälp av klustret snabbt alternativ från usearch23. På kommandoraden anger du:
    - usearch -cluster_fast All_USUV.fasta -id 0,99 -centroids All_USUV_dedup.fasta
  3. För att generera primers måste sekvenser justeras. Detta görs med hjälp av MUSCLE24. På kommandoraden anger du:
    - muskel-i All_USUV_dedup.fasta -ut All_USUV_dedup_aligned.fasta -log log_muscle.txt
    OBS: Det är viktigt att manuellt inspektera justeringen för att kontrollera avvikelser. Dessa kan korrigeras manuellt om det behövs och ändarna kan trimmas efter längden på de flesta hela genomsekvenser.
  4. Primal används för att göra ett utkast val av grundfärger som kan användas för full längd amplicon sekvensering19. Ladda upp justeringen till den ursprungliga webbplatsen(http://primal.zibraproject.org/)och välj önskad ampliconlängd och överlappa längden mellan de olika ampliconerna. Gå till primal.zibraproject.org, fyll i schemats namn,ladda upp den justerade fasta filen, välj ampliconlängd, överlappa storlek och generera schemat.
  5. Justera den fullständiga uppsättningen tillgängliga slutförda USUV-sekvenser (inte den nedskalade eller deduderade uppsättningen). På kommandoraden anger du:
    - muskel-i All_USUV.fasta -ut All_USUV_aligned.fasta -log log_muscle.txt
    OBS: Mappa de genererade primers mot fullständig justering (använd inte deduplicerad justering), manuellt korrekta fel och inkluderar högst 5 degenerativa primer positioner.

2. Multiplex PCR

  1. Utför multiplex-PCR med hjälp av designade grundfärger och nanopore- och illuminasekvensering. Multiplex PCR för USUV utfördes som tidigare beskrivs19,21.
  2. Utför basecalling med flip-flop version 3.0.6.6+9999d81.

3. Dataanalys för att generera konsensussekvenser från nanoporedata

  1. Flera prover kan multiplexeras på en enda nanopore sekvensering springa. När du har utfört sekvenskörningen demultiplexar nanopore-data. Använd Porechop25 för detta. För att förhindra kontaminering och öka noggrannheten, använd require_two_barcodes flaggan. På kommandoraden anger du:
    - porechop -i Run_USUV.fastq -o Run_USUV_demultiplex --require_two_barcodes
  2. Efter demultiplexing, ta bort primer sekvenser (anges i filen Primers_Usutu.fasta i båda riktningarna) med cutadapt26. Dessutom, ta bort sekvenser med en längd kortare än 75 nukleotider. Grundlagen måste tas bort eftersom de kan införa artificiella fördomar i konsensussekvensen. På kommandoraden anger du:
    - cutadapt -b fil:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75
  3. Demultiplexed sekvens läsningar kan mappas mot en panel av olika referensstammar med minimap227 och en konsensus sekvens kan genereras med samtools28. Följ exemplet nedan som visar proceduren för en referensbaserad justering och konsensussekvensgenerering av ett exempel: BC01. På kommandoraden anger du:
    - minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam
    - samtools sortera BC01.bam > BC01_sorted.bam
    - bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools samtal -mv -Oz -o BC01.vcf.gz
    - bcftools index BC01.vcf.gz
    - katt Random_Refs_USUV.fasta | bcftools konsensus BC01.vcf.gz > BC01_consensus.fasta
  4. För referensbaserade justeringer är det viktigt att en närbesläktad referenssekvens används. Utför därför en BlastN-sökning med den genererade konsensussekvensen för att identifiera den närmaste referensstammen. Därefter upprepar du den referensbaserade justeringen med den närmaste referensstammen som referens (steg 3.3 och 3.4). På kommandoraden anger du:
    - minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam
    - samtools sortera BC01_ref.bam > BC01_sorted_ref.bam
    - bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools samtal -mv -Oz -o BC01_ref.vcf.gz
    - bcftools index BC01_ref.vcf.gz
    - katt Ref_USUV_BC01.fasta | bcftools konsensus BC01_ref.vcf.gz > BC01_ref_consensus.fasta

4. Analys av Illumina-data

  1. Dessa sekvenser demultiplexeras automatiskt efter sekvensering. Läsningar kan kvalitetsstyras med trimmomatic29. För parkopplade belysningsluminasekvenser, använd den vanliga cut-off medianPHRED-poängen på 33 och en minimal läslängd på 75 för att få korrekt, hög kvalitet läser. På kommandoraden anger du:
    - trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75
  2. Ta bort grundfärger (anges i filen Primers_Usutu.fasta i båda riktningarna), eftersom de kan införa konstgjorda fördomar, med cutadapt26. Dessutom, ta bort sekvenser med en längd kortare än 75 nukleotider med hjälp av kommandonnedan. På kommandoraden anger du:
    - cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75
  3. Innan de novo montering, sekvensen läser kan normaliseras för en jämn täckning över genomet. Detta är viktigt eftersom de novo montörer som SPAdes tar hänsyn till lästäckningen när monteringsekvensen läses. Normalisera läser till en läs-täckning av 50 med BBNorm från BBMap-paketet30. På kommandoraden anger du:
    - bbmap/bbnorm.sh target=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq
  4. De normaliserade läsningarna är de novo monterade med SPAdes31. Standardinställningar används för monteringen med alla olika kmers (21, 33, 55, 77, 99 och 127). På kommandoraden anger du:
    - spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq
  5. Karta QC läser mot den erhållna konsensus sekvens med minimap2 och program som Geneious, Bioedit eller Ugene att kurera anpassningen. Det är viktigt att kontrollera början och slutet av contig.
    1. Rikta in QC läser mot erhållna konsensussekvensering med minimap2.
    2. Importera justeringen i Geneious/Bioedit/UGene.
    3. Inspektera, korrigera och kurera speciellt början och slutet av genomet manuellt.

5. Bestämma den nödvändiga lästäckningen för att kompensera för felprofilen vid nanoporesekvensering med hjälp av Luminoxiddata som guldstandard

  1. Välj sekvens läser mappning till en amplicon, i det här fallet amplicon 26. Därefter kartlägger nanopore läsningar mot denna amplicon med minimap2. Använd Samtools för att bara välja läsningar mappning till amplicon 26 och för att konvertera bam-filen till fastq. På kommandoraden anger du:
    - minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam
    - samtools visa -b -F 4 BC01.bam > BC01_mapped.bam
    - samtools bam2fq BC01_mapped.bam | seqtk seq - -> BC01_mapped.fastq
  2. Slumpmässigt välja delmängder av till exempel 200 sekvens läsningar tusen gånger. Om du till exempel ändrar den till 10 blir det slumpmässigt val av tusen gånger en delmängd på 10 sekvensläsningar. Skriptet tillhandahålls som tilläggsfil 1. På kommandoraden anger du:
    - python Random_selection.py
  3. Alla slumpmässigt valda sekvensläsningar är anpassade till amplicon 26. Använd KMA32 för att kartlägga sekvensläsningarna och för att omedelbart generera en konsensussekvens. Använd optimerade inställningar för nanopore sekvensering, indikerad av -bcNano-flaggan. På kommandoraden anger du:
    - kma index -i Amplicon26.fasta
    - för fil i random_sample*; gör
    - sampleID=${file%.fastq}
    - kma -i ${sampleID}.fastq -o ${sampleID} -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano
    - gjort
  4. Inspektera de genererade konsensussekvenserna på kommandoraden med:
    - katt *.fsa > All_genomes.fsa
    - minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam
    - samtools sortera All_genomes.bam > All_genomes_sorted.bam
    - samtools statistik All_genomes_sorted.bam > stats.txt
    1. Felfrekvensen visas i stats.txt under rubriken felfrekvens #mismatches / baser mappas. Visa den på skärmen med följande kommando:
      - grep ^SN stats.txt | cut -f 2-
    2. Mängden indelningar visas under rubriken #Indels per cykel. Visa den på skärmen med följande kommando:
      - grep ^IC stats.txt | cut -f 2-

Representative Results

Nyligen släpptes en ny version av flödescellversionen (R10) och erbjödförbättringar till den basuppringare som användes för att konvertera den elektroniska strömsignalen till DNA-sekvenser (så kallad flip-flop basecaller). Därför har vi omsekvenserade USUV från hjärnvävnad av en USUV-positiv uggla som tidigare var sekvenserade på en R9.4 flödescell och på en Illumina Miseq instrument21. Här beskrev vi den metod som används för att bestämma den nödvändiga lästäckningen för tillförlitlig konsensussamtal genom direkt jämförelse med Illumina-sekvensering.

Med hjälp av den nyare flödescellen i kombination med basecaller flip-flop visar vi att en lästäckning på 40x resulterar i identiska resultat jämfört med Illumina-sekvensering. En lästäckning på 30x resulterar i en felfrekvens på 0,0002% vilket motsvarar ett fel i varje 585.000 nukleotider sekvenserade, medan en lästäckning av 20x resulterar i ett fel i varje 63.529 nukleotider sekvenserade. En läs-täckning av 10x resulterar i ett fel i varje 3.312 nukleotider sekvenserade, vilket innebär att över tre nukleotider per full USUV genom kallas fel. Med en läs-täckning över 30x observerades inga indels. En läs-täckning av 20x resulterade i detektion av en indel position medan en lästäckning av 10x resulterade i indels i 29 positioner. En översikt över felfrekvensen med olika stopp för lästäckningvisas i tabell 1.

Täckning Fel iteration 1 Iteration av felfrekvens 1 Indels: Iteration av fel 2 Iteration av felfrekvens 2 Indels: Fel iteration 3 Iteration av felfrekvens 3 Indels:
10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7
20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0
30x (30x) 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0
40x (40x) 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0
50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0

Tabell 1: Översikt över felfrekvensen för nanoporesekvensering. Varje iteration representerar tusen slumpmässiga prover.

Kompletterande fil 1: Slumpmässigmarkering. Klicka här för att se den här filen (Högerklicka för att ladda ner).

Discussion

Nanopore sekvensering utvecklas ständigt och därför finns det ett behov av metoder för att övervaka felfrekvensen. Här beskriver vi ett arbetsflöde för att övervaka felfrekvensen för nanopore sequencer. Detta kan vara användbart efter lanseringen av en ny flödescell, eller om nya versioner av basecalling släpps. Detta kan dock också vara användbart för användare som vill ställa in och validera sitt eget sekvenseringsprotokoll.

Olika verktyg för programvara och justering kan ge olika resultat33. I detta manuskript syftade vi till att använda fritt tillgängliga mjukvarupaket som ofta används, och som har tydlig dokumentation. I vissa fall kan man prioritera kommersiella verktyg, som i allmänhet har ett mer användarvänligt gränssnitt men måste betalas. I framtiden kan denna metod tillämpas på samma prov om stora ändringar i sekvensteknik eller basanropsprogram införs Företrädesvis bör detta göras efter varje uppdatering av basuppringaren eller flödescellen, men med tanke på hastigheten på den aktuella utvecklingen kan detta också göras först efter större uppdateringar.

Minskningen av felfrekvensen vid sekvensering gör det möjligt att multiplexera ett högre antal prover. Därmed är nanopore sekvensering komma närmare att ersätta konventionella realtid PCRs för diagnostiska analyser, vilket redan är fallet för influensavirus diagnostik. Dessutom ökar minskningen av felfrekvensen användbarheten av denna tekniksekvensering, till exempel för bestämning av mindre varianter och för opartisk metagenomisk sekvensering med hög genomströmning.

Ett viktigt steg i protokollet är att nära, tillförlitliga referenssekvenser måste vara tillgängliga. Grundfärger är baserade på den nuvarande kunskapen om virusmångfald och kan behöva uppdateras då och då. En annan kritisk punkt när du ställer in en amplicon-baserad sekvensering strategi är balanseringen av primer koncentrationen för att få en jämn balans i amplicon djup. Detta möjliggör multiplexering av fler exempel på en sekvenskörning och resulterar i en betydande kostnadsminskning.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Detta arbete har fått finansiering från Europeiska unionens forsknings- och innovationsprogram Horisont 2020 enligt bidragsavtalet nr 643476 (COMPARE).

Materials

Name Company Catalog Number Comments
Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

DOWNLOAD MATERIALS LIST

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. Nanopore Store, R10 flow cells. , https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019).
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. GitHub - nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads. , https://github.com/nanoporetech/flappie (2019).
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. GitHub - rrwick/Porechop: adapter trimmer for Oxford Nanopore reads. , https://github.com/rrwick/porechop (2018).
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. BBMap download | SourceForge.net. , https://sourceforge.net/projects/bbmap/ (2019).
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Tags

Genetik nanopore sekvensering R10 flowcell USUV arbovirus hela genomsekvensering
Validera hela genomet Nanopore Sekvensering, med Hjälp av Usutu Virus som exempel
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Oude Munnink, B. B., Nieuwenhuijse,More

Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter