Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Validering af hele genom nanopore sekventering, ved hjælp af Usutu Virus som et eksempel

Published: March 11, 2020 doi: 10.3791/60906

Summary

Vi har tidligere valideret en protokol for amplicon-baseret hele genom Usutu virus (USUV) sekventering på en nanopore sekventering platform. Her beskriver vi de anvendte metoder mere detaljeret og bestemmer fejlhastigheden for nanopore R10 flowcellen.

Abstract

Hele genomsekvensering kan bruges til at karakterisere og spore virusudbrud. Nanopore-baserede hele genom sekvensering protokoller er blevet beskrevet for flere forskellige vira. Disse tilgange anvender en overlappende ampliconbaseret tilgang, som kan bruges til at målrette mod en bestemt virus eller gruppe af genetisk beslægtede vira. Ud over bekræftelse af virustilstedeværelsen kan sekvensering anvendes til genomiske epidemiologiske undersøgelser til at spore virus og optrævle oprindelser, reservoirer og transmissionsmåder. For sådanne applikationer er det afgørende at forstå mulige virkninger af fejlprocenten i forbindelse med den anvendte platform. Rutinemæssig anvendelse i kliniske og folkesundhedsmæssige indstillinger kræver, at dette er dokumenteret med alle vigtige ændringer i protokollen. Tidligere blev en protokol for hele genomet Usutu virus sekventering på nanopore sekventering platform valideret (R9.4 flowcell) ved direkte sammenligning med Illumina sekventering. Her beskriver vi den metode, der bruges til at bestemme den krævede læsedækning, ved hjælp af sammenligningen mellem R10-flowcellen og Illumina-sekvenseringen som et eksempel.

Introduction

Hurtig udvikling inden for tredje generations sekvensteknologier giver os mulighed for at bevæge os fremad mod tæt på realtidssekvensering under virusudbrud. Denne rettidige tilgængelighed af genetiske oplysninger kan være nyttig til at bestemme oprindelsen og udviklingen af virale patogener. Guld standarder inden for næste generation sekventering dog er stadig den anden generation sequencere. Disse teknikker er afhængige af specifikke og tidskrævende teknikker som klonal forstærkning under en emulsion PCR eller klonal bro forstærkning. Den tredje generation sequencere er billigere, håndholdte og kommer med forenklede bibliotek forberedelse metoder. Især den lille størrelse af sekvensen enhed og den lave købspris gør det til en interessant kandidat til deployerbare, markable sekvensering. Dette kunne for eksempel ses under udbruddet af ebolavirus i Sierra Leone og under de igangværende undersøgelser af udbrud af arbovirus i Brasilien1,2,3. Den rapporterede høje fejlfrekvens4 kan dog begrænse de applikationer, som nanoporesekventering kan anvendes til.

Nanopore sekventering udvikler sig hurtigt. Nye produkter er tilgængelige på markedet på regelmæssig basis. Eksempler herpå er for eksempel de 1D kvadrerede sæt, som gør det muligt at sekventere begge dele af DNA-molekylet, hvilket øger nøjagtigheden af de såkaldte baser5 og udviklingen af R10-flowcellen, som måler ændringen i strøm ved to forskellige forekomster i pore6. Desuden vil forbedrede bio-informatik værktøjer som forbedringer i basecalling forbedre nøjagtigheden af basecalling7. En af de hyppigst anvendte basecallers (f.eks.5 For nylig, producenten også udgivet en ny basecaller kaldet flip-flop, som er implementeret i standard nanopore software8. Tilsammen vil alle disse forbedringer føre til mere præcise sekvenser og vil reducere fejlprocenten for nanopore sequencer.

Usutu virus (USUV) er en myg-bårne arbovirus af familien Flaviviridae og det har en positiv-strandede RNA genom på omkring 11.000 nukleotider. USUV påvirker hovedsageligt store gråugler og solsorte9,10, selv om andre fuglearter også er modtagelige for USUV-infektion11. For nylig, USUV blev også identificeret i gnavere og spidsmus, selv om deres potentielle rolle i overførsel af virus forbliver ukendt12. Hos mennesker er asymptomatiske infektioner blevet beskrevet hos bloddonorerne 13,14,15,16 ,mens usuv-infektioner også er blevet rapporteret at være forbundet med encephalitis eller meningo-encephalitis17,18. I Holland blev USUV først påvist hos vilde fugle i 201610 og hos asymptomatiske bloddonorer i 201814. Siden den første påvisning af USUV, udbrud er blevet rapporteret i de efterfølgende år og overvågning, herunder hele genom sekventering, er i øjeblikket i gang for at overvåge dukke og spredning af en arbovirus i en tidligere naiv befolkning.

Svarende til, hvad der er blevet beskrevet for andre vira, såsom Ebola virus, Zika virus og gul feber virus3,19,,20,vi har udviklet en primer indstillet til sekvens fuld længde USUV21. Denne polymerase kædereaktion (PCR)-baseret tilgang giver mulighed for inddrivelse af fuld længde USUV genomer fra meget vært-forurenet prøvetyper som hjerneprøver i prøver op til en Ct-værdi på omkring 32. Fordelene ved en amplicon-baseret sekventering tilgang er en højere følsomhed i forhold til metagenomic sekventering og en højere specificitet. Begrænsninger ved at bruge en amplicon-baseret tilgang er, at sekvenserne skal være ens for at designe primere montering alle stammer, og at primere er designet på vores nuværende viden om virus mangfoldighed.

I betragtning af den konstante udvikling og forbedringer i tredje generations sekvensering er der behov for regelmæssigt at vurdere sekvenserens fejlprocent. Her beskriver vi en metode til at evaluere nanoporens ydeevne direkte mod Illumina-sekvensering ved hjælp af USUV som eksempel. Denne metode anvendes på sekvenser, der genereres med den nyeste R10-flowcelle, og basecalling udføres med den nyeste version af flip-flop basecaller.

Protocol

BEMÆRK: Liste over software-værktøjer, der skal anvendes: usearch v11.0.667; muskel v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2.16-r922; samtools 1.9; trimmomatisk 0,39; bbmap 38.33; spar v3.13.1; kma-1,2,8

1. Primer design

  1. Start med at downloade eller hente et sæt relevante reference hele genom sekvenser fra offentlige eller private dataindsamlinger. For eksempel hente alle fuld længde USUV genomer (taxid64286) fra NCBI database22. USUV koder et genom på omkring 11.000 nukleotider, så kun hente sekvenser med en sekvens længde på 8.000-12.000 nukleotider. Gør dette ved hjælp af følgende søgepost:
    - taxid64286[Organism:noexp] OG 8000[SLEN]:12000[SLEN].
    1. Klik på Send til | Komplet post | Fil; Brug Format = FASTA, og opret filen.
  2. Hvis du vil reducere sættet af referencesekvenser, skal du fjerne dublerede sekvenser eller sekvenser med over 99 % nukleotididentitet fra datasættet. Gør dette ved hjælp af klyngen hurtig mulighed fra usearch23. Angiv:
    - usearch -cluster_fast All_USUV.fasta -id 0,99 -centroids All_USUV_dedup.fasta
  3. For at generere primerne skal sekvenser justeres. Dette gøres ved hjælp af MUSKEL24. Angiv:
    - muskel -i All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txt
    BEMÆRK: Det er vigtigt manuelt at inspicere justeringen for at kontrollere, om der er uoverensstemmelser. Disse kan korrigeres manuelt, hvis det er nødvendigt, og enderne kan trimmes i henhold til længden af de fleste hele genomsekvenser.
  4. Primal bruges til at lave et udkast valg af primere, som kan bruges til fuld længde amplicon sekventering19. Overfør justeringen til det oprindelige websted (http://primal.zibraproject.org/)og vælg den foretrukne ampliconlængde og overlapper længden mellem de forskellige amplicons. Gå til primal.zibraproject.org, udfyld skemanavnet,overfør den justerede fasta-fil, vælg ampliconlængden, overlapper størrelsen, og opret skemaet.
  5. Juster hele sættet af tilgængelige komplette USUV-sekvenser (ikke det reducerede eller dedublerede sæt). Angiv:
    - muskel -i All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txt
    BEMÆRK: Tilknyt de genererede primere mod den komplette justering (brug ikke den dedublerede justering), ret fejl manuelt og medtag maksimalt 5 degenerative primerpositioner.

2. Multiplex PCR

  1. Udfør multiplex PCR ved hjælp af de designede primere og nanopore og Illumina sekventering. Multiplex-PCR for USUV blev udført som tidligere beskrevet19,21.
  2. Udfør basecalling med flip-flop version 3.0.6.6+9999d81.

3. Dataanalyse til at generere konsensussekvenser fra nanoporedata

  1. Flere prøver kan multiplexed på en enkelt nanopore sekventering køre. Efter at have udført sekvenskørslen, demultiplex nanopore data. Brug Porechop25 til dette. Brug require_two_barcodes flaget for at undgå kontaminering og forbedre nøjagtigheden. Angiv:
    - porechop -i Run_USUV.fastq -o Run_USUV_demultiplex --require_two_barcodes
  2. Efter demultiplexing fjernes primersekvenserne (angivet i filen Primers_Usutu.fasta i begge retninger) ved hjælp af cutadapt26. Derudover fjernes sekvenser med en længde, der er kortere end 75 nukleotider. Primerne skal fjernes, da de kan indføre kunstige skævheder i konsensussekvensen. Angiv:
    - cutadapt -b fil:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75
  3. Demultiplexed sekvens læsninger kan kortlægges mod et panel af forskellige reference stammer ved hjælp af minimap227 og en konsensus sekvens kan genereres ved hjælp af samtools28. Følg nedenstående eksempel, som viser proceduren for en referencebaseret justering og dannelsen af konsensussekvensen af et eksempel: BC01. Angiv:
    - minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam
    - samtools sortere BC01.bam > BC01_sorted.bam
    - bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools call -mv -Oz -o BC01.vcf.gz
    - bcftools indeks BC01.vcf.gz
    - kat Random_Refs_USUV.fasta | bcftools konsensus BC01.vcf.gz > BC01_consensus.fasta
  4. For referencebaserede justeringer er det vigtigt, at der anvendes en nært beslægtet referencesekvens. Udfør derfor en BlastN-søgning med den genererede konsensussekvens for at identificere den nærmeste referencestamme. Derefter gentages den referencebaserede justering med den nærmeste referencestamme som reference (trin 3.3 og 3.4). Angiv:
    - minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam
    - samtools sortere BC01_ref.bam > BC01_sorted_ref.bam
    - bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools call -mv -Oz -o BC01_ref.vcf.gz
    - bcftools indeks BC01_ref.vcf.gz
    - kat Ref_USUV_BC01.fasta | bcftools konsensus BC01_ref.vcf.gz > BC01_ref_consensus.fasta

4. Analyse af Illumina-dataene

  1. Disse sekvenser demultiplexed automatisk efter sekvensering. Læsninger kan kvalitetskontrolleres ved hjælp af trimmomatic29. For parrede Illumina-sekvenser skal du bruge den almindeligt anvendte cut-off median PHRED-score på 33 og en minimal læselængde på 75 for at få nøjagtige læser af høj kvalitet. Angiv:
    - trimmomatisk PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75
  2. Fjern primere (angivet i filen Primers_Usutu.fasta i begge retninger), da de kan indføre kunstige bias, ved hjælp af cutadapt26. Hertil kommer, fjerne sekvenser med en længde kortere end 75 nukleotider ved hjælp af kommandoerne nedenfor. Angiv:
    - cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75
  3. Før de novo-samling kan sekvenslæsningerne normaliseres for en jævn dækning på tværs af genomet. Dette er afgørende, da de novo assemblers som SPAdes tage læse dækning i betragtning, når samle sekvens læser. Normaliser læser til en læse dækning af 50 ved hjælp af BBNorm fra BBMap pakke30. Angiv:
    - bbmap/bbnorm.sh target=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq
  4. De normaliserede aflæsninger er de novo samlet ved hjælp af SPAdes31. Standardindstillinger bruges til assemblyen ved hjælp af alle forskellige kmers (21, 33, 55, 77, 99 og 127). Angiv:
    - spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq
  5. Kort QC læser mod den opnåede konsensus sekvens ved hjælp af minimap2 og programmer som Geneious, Bioedit eller Ugene at kuratere tilpasningen. Det er vigtigt at kontrollere begyndelsen og slutningen af den tilstødende.
    1. Juster QC-aflæsningerne i forhold til den opnåede konsensussekvens ved hjælp af minimap2.
    2. Importér justeringen i Geneious/Bioedit/UGene.
    3. Manuelt inspicere, korrekt og kuratere især begyndelsen og slutningen af genomet.

5. Bestemmelse af den krævede læsedækning for at kompensere for fejlprofilen i nanoporesekventering ved hjælp af Illumina-data som guldstandard

  1. Vælg sekvens læser tilknytning til en amplicon, i dette tilfælde amplicon 26. Efterfølgende kort nanopore læser mod denne amplicon ved hjælp af minimap2. Brug Samtools til kun at vælge læsetilknytningen til amplicon 26 og konvertere bam-filen til fastq. Angiv:
    - minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam
    - samtools view -b -F 4 BC01.bam > BC01_mapped.bam
    - samtools bam2fq BC01_mapped.bam | seqtk seq - -> BC01_mapped.fastq
  2. Tilfældigt vælge undersæt af for eksempel 200 sekvens læser tusind gange. For eksempel vil ændre det til 10 resultere i tilfældig udvælgelse af tusind gange en delmængde af 10 sekvens læser. Scriptet leveres som supplerende fil 1. Angiv:
    - python Random_selection.py
  3. Alle tilfældigt udvalgte sekvenslæsninger justeres til amplicon 26. Brug KMA32 til at kortlægge sekvensen læser og til straks at generere en konsensus sekvens. Brug optimerede indstillinger til nanopore-sekvensering, angivet med -bcNano-flaget. Angiv:
    - kma indeks -i Amplicon26.fasta
    - til fil i random_sample*;
    - sampleID=${file%.fastq}
    - kma -i ${sampleID}.fastq -o ${sampleID} -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano
    - udført
  4. Undersøg de genererede konsensussekvenser på kommandolinjen ved hjælp af:
    - kat *.fsa > All_genomes.fsa
    - minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam
    - samtools sortere All_genomes.bam > All_genomes_sorted.bam
    - samtools statistik All_genomes_sorted.bam > stats.txt
    1. Fejlprocenten vises i stats.txt under overskriften fejlprocent #mismatches / baser tilknyttet. Vis den på skærmen med følgende kommando:
      - grep ^SN stats.txt | cut -f 2-
    2. Mængden af indels vises under overskriften #Indels pr. cyklus. Vis den på skærmen med følgende kommando:
      - grep ^IC stats.txt | cut -f 2-

Representative Results

For nylig blev en ny version af flowcelleversionen (R10) udgivet og tilbudt forbedringer af basecalleren, der bruges til at konvertere det elektroniske strømsignal til DNA-sekvenser (såkaldt flip-flop basecaller). Derfor har vi re-sekvenseret USUV fra hjernevæv af en USUV-positiv ugle, som tidligere blev sekventeret på en R9.4 flow celle og på en Illumina Miseq instrument21. Her beskrev vi den metode, der anvendes til at bestemme den krævede læsedækning for pålidelig konsensus opkald ved direkte sammenligning med Illumina sekventering.

Ved hjælp af den nyere flowcelle i kombination med basecaller flip-flop viser vi, at en læsedækning på 40x resulterer i identiske resultater i forhold til Illumina sekventering. En læsedækning på 30x resulterer i en fejlprocent på 0,0002%, hvilket svarer til en fejl i hver 585.000 nukleotider sekvenseret, mens en læsedækning på 20x resulterer i en fejl i hver 63.529 nukleotider sekvenseret. En læsedækning af 10x resulterer i en fejl i hver 3.312 nukleotider sekvenseret, hvilket betyder, at over tre nukleotider pr fuld USUV genom bliver kaldt forkert. Med en læsedækning over 30x blev der ikke observeret nogen indels. En læsedækning på 20x resulterede i påvisning af en indel position, mens en læsedækning på 10x resulterede i indels i 29 positioner. Tabel 1indeholder en oversigt over fejlprocenten ved hjælp af forskellige skæringer i læsedækning .

Dækning Gentagelse af fejl 1 Gentagelse af fejlrate 1 Indels: Gentagelse af fejl 2 Gentagelse af fejlrate 2 Indels: Gentagelse af fejl 3 Gentagelse af fejlrate 3 Indels:
kr. 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7
kr. 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0
30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0
kr. 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0
kr. 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0

Tabel 1: Oversigt over fejlprocenten for sekvensering af nanopore. Hver iteration repræsenterer tusind tilfældige prøver.

Supplerende fil 1: Tilfældig udvælgelse. Klik her for at se denne fil (Højreklik for at downloade).

Discussion

Nanopore sekventering er i konstant udvikling, og derfor er der behov for metoder til at overvåge fejlprocenten. Her beskriver vi en arbejdsgang til overvågning af fejlprocenten for nanopore sequencer. Dette kan være nyttigt efter udgivelsen af en ny flowcelle, eller hvis nye versioner af basecalling frigives. Dette kan dog også være nyttigt for brugere, der vil konfigurere og validere deres egen sekvensprotokol.

Forskellige software- og justeringsværktøjer kan give forskellige resultater33. I dette manuskript tilstræbede vi at bruge frit tilgængelige softwarepakker, der er almindeligt anvendt, og som har klar dokumentation. I nogle tilfælde kan kommercielle værktøjer foretrækkes, som generelt har en mere brugervenlig grænseflade, men som skal betales. I fremtiden kan denne metode anvendes på den samme prøve i tilfælde af store ændringer i sekvens teknologi eller basecalling software indføres Fortrinsvis dette bør ske efter hver opdatering af basecaller eller flowcell, men i betragtning af hastigheden af den aktuelle udvikling dette kan også gøres først efter større opdateringer.

Reduktionen i fejlprocenten i sekvensering giver mulighed for et højere antal prøver, der skal multiplekseres. Derved er nanopore sekventering komme tættere på at erstatte konventionelle real time PCR til diagnostiske analyser, hvilket allerede er tilfældet for influenza virus diagnostik. Desuden øger reduktionen af fejlprocenten anvendeligheden af denne tekniksekvens, f.eks.

Et kritisk skridt i protokollen er, at tætte, pålidelige referencesekvenser skal være tilgængelige. Primerne er baseret på den nuværende viden om virus mangfoldighed og måske skal opdateres en gang imellem. Et andet kritisk punkt, når du opretter en amplicon-baseret sekventering tilgang er afvejning af primer koncentration for at få en jævn balance i amplicon dybde. Dette gør det muligt at multipleksere flere prøver på en sekvenskørsel og resulterer i en betydelig omkostningsreduktion.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Dette arbejde har modtaget støtte fra EU's forsknings- og innovationsprogram Horisont 2020 under tilskudsaftale nr.

Materials

Name Company Catalog Number Comments
Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

DOWNLOAD MATERIALS LIST

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. Nanopore Store, R10 flow cells. , https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019).
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. GitHub - nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads. , https://github.com/nanoporetech/flappie (2019).
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. GitHub - rrwick/Porechop: adapter trimmer for Oxford Nanopore reads. , https://github.com/rrwick/porechop (2018).
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. BBMap download | SourceForge.net. , https://sourceforge.net/projects/bbmap/ (2019).
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Tags

Genetik nanopore sekventering R10 flowcell USUV arbovira hele genom sekvensering
Validering af hele genom nanopore sekventering, ved hjælp af Usutu Virus som et eksempel
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Oude Munnink, B. B., Nieuwenhuijse,More

Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter