Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Validación de la secuenciación de nanoporos del genoma completo, utilizando el virus Usutu como ejemplo

Published: March 11, 2020 doi: 10.3791/60906

Summary

Anteriormente validamos un protocolo para la secuenciación del virus Usutu (USUV) del genoma completo basado en amplificación en una plataforma de secuenciación de nanoporos. Aquí, describimos los métodos utilizados con más detalle y determinamos la tasa de error de la celda de flujo rincrónico R10.

Abstract

La secuenciación del genoma completo se puede utilizar para caracterizar y rastrear brotes virales. Se han descrito protocolos de secuenciación del genoma completo basados en nanoporos para varios virus diferentes. Estos enfoques utilizan un enfoque basado en amplificación superpuesto que se puede utilizar para atacar un virus o grupo específico de virus genéticamente relacionados. Además de la confirmación de la presencia del virus, la secuenciación puede utilizarse para estudios de epidemiología genómica, para rastrear virus y desentrañar orígenes, reservorios y modos de transmisión. Para este tipo de aplicaciones, es crucial comprender los posibles efectos de la tasa de error asociada con la plataforma utilizada. La aplicación rutinaria en entornos clínicos y de salud pública requiere que esto se documente con cada cambio importante en el protocolo. Anteriormente, se validó un protocolo para la secuenciación del virus Usutu genómico completo en la plataforma de secuenciación de nanoporos (R9.4 flowcell) mediante comparación directa con la secuenciación de Illumina. Aquí, describimos el método utilizado para determinar la cobertura de lectura requerida, utilizando la comparación entre la celda de flujo R10 y la secuenciación de Illumina como ejemplo.

Introduction

La rápida evolución de las tecnologías de secuencia de tercera generación nos permite avanzar hacia la secuenciación casi en tiempo real durante los brotes virales. Esta disponibilidad oportuna de información genética puede ser útil para determinar el origen y la evolución de los patógenos virales. Los estándares de oro en los campos de la secuenciación de próxima generación, sin embargo, siguen siendo los secuenciadores de segunda generación. Estas técnicas se basan en técnicas específicas y que consumen mucho tiempo, como la amplificación clonal durante una PCR de emulsión o una amplificación de puente clonal. Los secuenciadores de tercera generación son más baratos, portátiles y vienen con metodologías simplificadas de preparación de bibliotecas. Especialmente el pequeño tamaño del dispositivo de secuencia y el bajo precio de compra lo convierten en un candidato interesante para la secuenciación desplegable y en un campo. Esto podría, por ejemplo, verse durante el brote del virus del Ebola en Sierra Leona y durante las investigaciones en curso sobre el brote de arbovirus en Brasil1,2,3. Sin embargo, la alta tasa de error4 notificada podría limitar las aplicaciones para las que se puede utilizar la secuenciación de nanoporos.

La secuenciación de nanoporos está evolucionando rápidamente. Los nuevos productos están disponibles en el mercado de forma regular. Ejemplos de esto son, por ejemplo, los kits cuadrados 1D que permiten la secuenciación de ambas hebras de la molécula de ADN, aumentando así la precisión de las bases llamadas5 y el desarrollo de la célula de flujo R10 que mide el cambio en la corriente en dos casos diferentes en el poro6. Además, las herramientas bioinformáticas mejoradas, como las mejoras en las llamadas de base, mejorarán la precisión de la llamada base7. Uno de los que llaman base más utilizados (por ejemplo, Albacore), se ha actualizado al menos 12 veces en un período de 9 meses5. Recientemente, el fabricante también lanzó un novedoso llamador base llamado flip-flop, que se implementa en el software de nanoporos predeterminado8. Juntos, todas estas mejoras conducirán a secuencias más precisas y disminuirán la tasa de error del secuenciador de nanoporos.

El virus Usutu (USUV) es un arbovirus transmitido por mosquitos de la familia Flaviviridae y tiene un genoma de ARN de cadena positiva de alrededor de 11.000 nucleótidos. EL USUV afecta principalmente a los grandes búhos grises y mirlos99,10, aunque otras especies de aves también son susceptibles a la infección por USUV11. Recientemente, USUV también fue identificado en roedores y musarañas, aunque su papel potencial en la transmisión del virus sigue siendo desconocido12. En humanos, se han descrito infecciones asintomáticas en donantes de sangre13,14,15,16 mientras que las infecciones de USUV también se han divulgado para estar asociadas con encefalitis o meningo-encefalitis17,18. En los Países Bajos, USUV se detectó por primera vez en aves silvestres en 201610 y en donantes de sangre asintomática en 201814. Desde la detección inicial de USUV, se han notificado brotes durante los años siguientes y la vigilancia, incluida la secuenciación del genoma completo, está actualmente en curso para controlar la emerger y propagar un arbovirus en una población previamente ingenua.

Similar a lo que se ha descrito para otros virus, tales como el virus del Ebola, el virus del Zika y el virus de la fiebre amarilla3,19,20, hemos desarrollado un conjunto de imprimación para secuenciar toda la longitud USUV21. Este enfoque basado en la reacción en cadena de la polimerasa (PCR) permite la recuperación de genomas USUV de longitud completa a partir de tipos de muestras altamente contaminadas por el huésped, como muestras cerebrales en muestras de hasta un valor Ct de alrededor de 32. Los beneficios de un enfoque de secuenciación basado en amplificación son una mayor sensibilidad en comparación con la secuenciación metagenómica y una mayor especificidad. Las limitaciones del uso de un enfoque basado en el amplificador son que las secuencias deben ser similares con el fin de diseñar imprimaciones que se ajusten a todas las cepas y que las imprimaciones están diseñadas sobre nuestro conocimiento actual sobre la diversidad de virus.

Dados los constantes desarrollos y mejoras en la secuenciación de tercera generación, es necesario evaluar la tasa de error del secuenciador de forma regular. Aquí, describimos un método para evaluar el rendimiento de nanoporos directamente contra la secuenciación de Illumina utilizando USUV como ejemplo. Este método se aplica a las secuencias generadas con la última celda de flujo R10 y la llamada base se realiza con la última versión del llamador base flip-flop.

Protocol

NOTA: Lista de herramientas de software que se utilizarán: usearch v11.0.667; músculo v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimapa2 2.16-r922; samtools 1.9; trimmomatic 0,39; bbmap 38.33; picas v3.13.1; kma-1.2.8

1. Diseño de imprimación

    2. Multiplex PCR

    1. Realice el PCR multiplex utilizando las imprimaciones y nanoporas diseñadas y la secuenciación de Illumina. El PCR multiplex para USUV se realizó como se describió anteriormente19,21.
    2. Realice la llamada base con la versión 3.0.6.6+9999d81.

    3. Análisis de datos para generar secuencias de consenso a partir de datos de nanoporos

    1. Se pueden multiplexar varias muestras en una sola ejecución de secuenciación de nanoporos. Después de realizar la ejecución de la secuencia, demultiplexe los datos de nanoporos. Usa Porechop25 para esto. Para evitar la contaminación y mejorar la precisión, utilice el require_two_barcodes bandera. En la línea de comando, escriba:
      - porechop -i Run_USUV.fastq -o Run_USUV_demultiplex -require_two_barcodes
    2. Después de la desmultiplexación, elimine las secuencias de imprimación (indicadas en el archivo Primers_Usutu.fasta en ambas orientaciones) utilizando cutadapt26. Además, elimine secuencias con una longitud inferior a 75 nucleótidos. Los imprimadores tienen que ser eliminados ya que pueden introducir sesgos artificiales en la secuencia de consenso. En la línea de comando, escriba:
      - cutadapt -b archivo:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75
    3. Las lecturas de secuencia desmultiplexadas se pueden asignar a un panel de deformaciones unitarias distintas mediante minimap227 y se puede generar una secuencia de consenso utilizando samtools28. Siga el ejemplo siguiente que muestra el procedimiento de una alineación basada en referencias y la generación de secuencias de consenso de una muestra: BC01. En la línea de comando, escriba:
      - minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam
      - samtools ordenar BC01.bam > BC01_sorted.bam
      - bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam - bcftools call -mv -Oz -o BC01.vcf.gz
      - bcftools índice BC01.vcf.gz
      - gato Random_Refs_USUV.fasta - consenso bcftools BC01.vcf.gz > BC01_consensus.fasta
    4. Para las alineaciones basadas en referencias es esencial que se utilice una secuencia de referencia estrechamente relacionada. Por lo tanto, realice una búsqueda BlastN con la secuencia de consenso generada para identificar la cepa de referencia más cercana. Después de eso, repita la alineación basada en referencias con la deformación unitaria de referencia más cercana como referencia (paso3.3 y 3.4). En la línea de comando, escriba:
      - minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam
      - samtools sort BC01_ref.bam > BC01_sorted_ref.bam
      - bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam á bcftools call -mv -Oz -o BC01_ref.vcf.gz
      - índice bcftools BC01_ref.vcf.gz
      - Ref_USUV_BC01 de gatos: el consenso bcftools BC01_ref.vcf.gz > BC01_ref_consensus.fasta

    4. Análisis de los datos de Illumina

    1. Estas secuencias se demultiplexan automáticamente después de la secuenciación. Las lecturas se pueden controlar con la calidad mediante trimmomatic29. Para secuencias de Illumina de extremo emparejado, utilice la puntuación PHRED mediana de corte comúnmente utilizada de 33 y una longitud de lectura mínima de 75 para obtener lecturas precisas y de alta calidad. En la línea de comando, escriba:
      - TRIMmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75
    2. Eliminar imprimaciones (indicadas en el archivo Primers_Usutu.fasta en ambas orientaciones), ya que pueden introducir sesgos artificiales, utilizando cutadapt26. Además, elimine secuencias con una longitud inferior a 75 nucleótidos utilizando los comandos siguientes. En la línea de comando, escriba:
      - cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75
    3. Antes del montaje de novo, las lecturas de la secuencia se pueden normalizar para una cobertura uniforme a través del genoma. Esto es esencial ya que los ensambladores de novo como SPAdes tienen en cuenta la cobertura de lectura al ensamblar lecturas de secuencia. Normalizar las lecturas a una cobertura de lectura de 50 utilizando BBNorm desde el paquete BBMap30. En la línea de comando, escriba:
      - bbmap/bbnorm.sh target-50 in-9_1P_trimmed.fastq in2-9_2P_trimmed.fastq out-Sample9_FW_norm.fastq out2-Sample9_RE_norm.fastq
    4. Las lecturas normalizadas se ensamblan de novo utilizando SPAdes31. La configuración predeterminada se utiliza para el ensamblaje utilizando todos los kilómetros diferentes (21, 33, 55, 77, 99 y 127). En la línea de comando, escriba:
      - spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq
    5. Mapear el QC lee en contra de la secuencia de consenso obtenida usando minimap2 y programas como Geneious, Bioedit o Ugene para curar la alineación. Es importante comprobar el principio y el final de la contig.
      1. Alinee las lecturas de control de calidad con la secuencia de consenso obtenida mediante minimap2.
      2. Importe la alineación en Geneious/Bioedit/UGene.
      3. Inspeccione, corrija y comisaria manualmente el principio y el final del genoma.

    5. Determinar la cobertura de lectura requerida para compensar el perfil de error en la secuenciación de nanoporos utilizando datos de Illumina como estándar de oro

    1. Seleccionar secuencia lee la asignación a un amplicon, en este caso amplicon 26. Posteriormente, mapear las lecturas de nanoporos contra este amplicon usando minimap2. Utilice Samtools para seleccionar solo la asignación de lecturas para amplificar 26 y convertir el archivo bam en fastq. En la línea de comando, escriba:
      - minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam
      - vista samtools -b -F 4 BC01.bam > BC01_mapped.bam
      - samtools bam2fq BC01_mapped.bam á seqtk seq - -> BC01_mapped.fastq
    2. Seleccione aleatoriamente subconjuntos de, por ejemplo, 200 secuencias, lecturas mil veces. Por ejemplo, cambiarlo a 10 dará como resultado la selección aleatoria de mil veces un subconjunto de 10 lecturas de secuencia. El script se proporciona como archivo complementario 1. En la línea de comando, escriba:
      - pitón Random_selection.py
    3. Todas las lecturas de secuencia seleccionadas aleatoriamente se alinean para amplificar 26. Utilice KMA32 para asignar las lecturas de secuencia y generar inmediatamente una secuencia de consenso. Utilice ajustes optimizados para la secuenciación de nanoporos, indicados por el indicador -bcNano. En la línea de comando, escriba:
      - kma index -i Amplicon26.fasta
      - para el archivo en random_sample*;
      - sampleID-$-file%.fastq-
      - kma -i $-sampleID-.fastq -o $-sampleID- -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano
      - hecho
    4. Inspeccione las secuencias de consenso generadas en la línea de comandos utilizando:
      - gato *.fsa > All_genomes.fsa
      - minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam
      - samtools sort All_genomes.bam > All_genomes_sorted.bam
      - estadísticas de samtools All_genomes_sorted.bam > stats.txt
      1. La tasa de error se muestra en stats.txt en la tasa de error de encabezado #mismatches / bases asignadas. Visualízquelo en la pantalla con el siguiente comando:
        - grep -SN stats.txt - corte -f 2-
      2. La cantidad de indels se muestra bajo la partida #Indels por ciclo. Visualízquelo en la pantalla con el siguiente comando:
        - grep -IC stats.txt - corte -f 2-

    Representative Results

    Recientemente, se lanzó una nueva versión de la versión de celda de flujo (R10) que ofrecía mejoras en el llamador base utilizado para convertir la señal de corriente electrónica en secuencias de ADN (lo que llamó llamador base flip-flop). Por lo tanto, hemos re-secuenciado USUV del tejido cerebral de un búho USUV-positivo que fue secuenciado previamente en una célula de flujo R9.4 y en un instrumento Illumina Miseq21. Aquí, describimos el método utilizado para determinar la cobertura de lectura necesaria para llamadas de consenso confiables mediante comparación directa con la secuenciación de Illumina.

    Usando la celda de flujo más reciente en combinación con el flip-flop basecaller mostramos que una cobertura de lectura de 40x resulta en resultados idénticos en comparación con la secuenciación de Illumina. Una cobertura de lectura de 30x da como resultado una tasa de error de 0.0002% que corresponde a un error en cada 585.000 nucleótidos secuenciados, mientras que una cobertura de lectura de 20x da como resultado un error en cada 63.529 nucleótidos secuenciados. Una cobertura de lectura de 10 veces da como resultado un error en cada 3.312 nucleótidos secuenciados, lo que significa que más de tres nucleótidos por genoma USUV completo se llaman errores. Con una cobertura de lectura superior a 30x, no se observaron indels. Una cobertura de lectura de 20x resultó en la detección de una posición indel, mientras que una cobertura de lectura de 10x resultó en indels en 29 posiciones. En la Tabla 1se muestra una descripción general de la tasa de error utilizando diferentes cortes de cobertura de lectura.

    Cobertura Iteración de errores 1 Iteración de la tasa de error 1 Indels: Iteración de errores 2 Iteración de la tasa de error 2 Indels: Iteración de errores 3 Iteración de la tasa de error 3 Indels:
    10o 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7
    20o 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0
    30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0
    40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0
    50o 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0

    Tabla 1: Visión general de la tasa de error de la secuenciación de nanoporos. Cada iteración representa mil muestras aleatorias.

    Archivo suplementario 1: Selección aleatoria. Haga clic aquí para ver este archivo (haga clic con el botón derecho para descargar).

    Discussion

    La secuenciación de nanoporos está en constante evolución y, por lo tanto, es necesario realizar métodos para controlar la tasa de error. Aquí, describimos un flujo de trabajo para monitorear la tasa de error del secuenciador de nanoporos. Esto puede ser útil después del lanzamiento de una nueva celda de flujo, o si se liberan nuevas versiones de la llamada base. Sin embargo, esto también puede ser útil para los usuarios que desean configurar y validar su propio protocolo de secuenciación.

    Diferentes herramientas de software y alineación pueden producir diferentes resultados33. En este manuscrito, nuestro objetivo era utilizar paquetes de software de libre disposición que se utilizan comúnmente, y que tienen documentación clara. En algunos casos, se puede dar preferencia a las herramientas comerciales, que generalmente tienen interfaces más fáciles de usar, pero tienen que ser pagadas. En el futuro, este método se puede aplicar a la misma muestra en caso de que se introduzcan grandes modificaciones en la tecnología de secuencia o software de llamada base Preferentemente esto debe hacerse después de cada actualización del llamador base o flowcell, sin embargo, dada la velocidad de los desarrollos actuales, esto también se puede hacer sólo después de las actualizaciones importantes.

    La reducción de la tasa de error en la secuenciación permite multiplexar un mayor número de muestras. De este modo, la secuenciación de nanoporos está cada vez más cerca de sustituir los ITP convencionales en tiempo real por ensayos de diagnóstico, lo que ya es el caso del diagnóstico del virus de la gripe. Además, la reducción de la tasa de error aumenta la usabilidad de esta secuenciación técnica, por ejemplo para la determinación de variantes menores y para la secuenciación metagenómica imparcial de alto rendimiento.

    Un paso crítico en el protocolo es que las secuencias de referencia cercanas y confiables deben estar disponibles. Los imprimadores se basan en el conocimiento actual sobre la diversidad de virus y es posible que deba actualizarse de vez en cuando. Otro punto crítico al configurar un enfoque de secuenciación basado en amplificación es el equilibrio de la concentración de imprimación para obtener un equilibrio uniforme en profundidad de amplificación. Esto permite la multiplexación de más muestras en una ejecución de secuencia y da como resultado una reducción significativa de costos.

    Disclosures

    Los autores no tienen nada que revelar.

    Acknowledgments

    Este trabajo ha recibido financiación del programa de investigación e innovación Horizonte 2020 de la Unión Europea en virtud del acuerdo de subvención No 643476 (COMPARE).

    Materials

    Name Company Catalog Number Comments
    Agencourt AMPure XP beads Beckman Coulter A63881
    dNTPs Qiagen 201900
    FLO-MIN106 R10 flowcell Nanopore R10 flowcell
    KAPA Hyperplus libarary preparation kit Roche 7962436001
    Library Loading Bead Kit Nanopore EXP-LLB001
    Ligation Sequencing Kit 1D Nanopore SQK-LSK109
    Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
    Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
    NEB Blunt/TA Ligase Master Mix NEB M0367S
    NEB Next Quick Ligation Module NEB E6056
    NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
    Protoscript II Reverse Transcriptase NEB M0368X
    Q5 High-Fidelity polymerase NEB M0491
    Qubit dsDNA HS Assay kit Thermo Fisher Q32851
    Random Primers Promega C1181
    RNAsin Ribonuclease Inhibitor Promega N2111

    DOWNLOAD MATERIALS LIST

    References

    1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
    2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
    3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
    4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
    5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
    6. Nanopore Store, R10 flow cells. , https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019).
    7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
    8. GitHub - nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads. , https://github.com/nanoporetech/flappie (2019).
    9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
    10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
    11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
    12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
    13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
    14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
    15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
    16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
    17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
    18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
    19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
    20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
    21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
    22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
    23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
    24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
    25. GitHub - rrwick/Porechop: adapter trimmer for Oxford Nanopore reads. , https://github.com/rrwick/porechop (2018).
    26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
    27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
    28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
    29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
    30. BBMap download | SourceForge.net. , https://sourceforge.net/projects/bbmap/ (2019).
    31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
    32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
    33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

    Tags

    Genética Número 157 nanoporo secuenciación célula de flujo R10 USUV arbovirus secuenciación del genoma completo
    Validación de la secuenciación de nanoporos del genoma completo, utilizando el virus Usutu como ejemplo
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Oude Munnink, B. B., Nieuwenhuijse,More

    Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter