Genetics

Valider le séquençage des nanopores du génome entier, en utilisant le virus Usutu comme exemple

Published: March 11, 2020 doi: 10.3791/60906

Bas B. Oude Munnink¹, David F. Nieuwenhuijse¹, Reina S. Sikkema¹, Marion Koopmans¹

¹ErasmusMC, Department of Viroscience, WHO Collaborating Centre for Arbovirus and Viral Hemorrhagic Fever Reference and Research, Erasmus University Medical Center

Summary

Nous avons précédemment validé un protocole pour le séquençage du virus Usutu (USUV) à base d’amplicon sur une plate-forme de séquençage des nanopores. Ici, nous décrivons les méthodes utilisées plus en détail et déterminons le taux d’erreur de la cellule d’écoulement nanopore R10.

Abstract

Le séquençage du génome entier peut être utilisé pour caractériser et retracer les flambées virales. Des protocoles de séquençage du génome entier à base de nanopore ont été décrits pour plusieurs virus différents. Ces approches utilisent une approche à base d’amplicons qui se chevauche qui peut être utilisée pour cibler un virus ou un groupe spécifique de virus génétiquement apparentés. En plus de la confirmation de la présence du virus, le séquençage peut être utilisé pour des études d’épidémiologie génomique, pour suivre les virus et démêler les origines, les réservoirs et les modes de transmission. Pour de telles applications, il est crucial de comprendre les effets possibles du taux d’erreur associé à la plate-forme utilisée. L’application courante dans les milieux cliniques et de santé publique exige que cela soit documenté à chaque changement important dans le protocole. Auparavant, un protocole pour le séquençage du virus Usutu sur la plate-forme de séquençage des nanopores a été validé (R9.4 flowcell) par comparaison directe avec le séquençage Illumina. Ici, nous décrivons la méthode utilisée pour déterminer la couverture de lecture requise, en utilisant la comparaison entre la cellule de débit R10 et le séquençage Illumina comme exemple.

Introduction

L’évolution rapide des technologies de séquence de troisième génération nous permet d’aller de l’avant vers un séquençage en temps quasi réel lors d’éclosions virales. Cette disponibilité opportune de l’information génétique peut être utile pour déterminer l’origine et l’évolution des agents pathogènes viraux. Les normes d’or dans les domaines du séquençage de la prochaine génération sont cependant encore les séquenceurs de deuxième génération. Ces techniques s’appuient sur des techniques spécifiques et chronophages comme l’amplification clonale lors d’une amplification par col létération du pcR ou d’un pont clonal. Les séquenceurs de troisième génération sont moins chers, portatifs et sont livrés avec des méthodologies simplifiées de préparation de bibliothèque. Surtout la petite taille de l’appareil séquence et le faible prix d’achat en fait un candidat intéressant pour le séquençage déployable et fieldable. Cela pourrait par exemple être vu lors de l’épidémie de virus Ebola en Sierra Leone et au cours des enquêtes en cours sur l’épidémie d’arbovirus au Brésil¹^,²^,³. Cependant, le taux d’erreur élevé^{signalé 4} pourrait limiter les applications pour lesquelles le séquençage des nanopores peut être utilisé.

Le séquençage des nanopores évolue rapidement. De nouveaux produits sont disponibles régulièrement sur le marché. Par exemple, les kits 1D carrés qui permettent le séquençage des deux brins de la molécule d’ADN, augmentant ainsi la précision des bases⁵ appelées et le développement de la cellule d’écoulement R10 qui mesure le changement de courant à deux exemples différents dans le pore⁶. En outre, l’amélioration des outils bio-informatiques comme l’amélioration de l’appel de base améliorera la précision de l’appel de base⁷. L’un des appel de base les plus fréquemment utilisés (p. ex., Albacore), a été mis à jour au moins 12 fois au cours d’une période de 9 mois⁵. Récemment, le fabricant a également publié un nouvel appel de base appelé flip-flop, qui est mis en œuvre dans le logiciel nanopore par défaut⁸. Ensemble, toutes ces améliorations mèneront à des séquences plus précises et diminueront le taux d’erreur du séquenceur de nanopores.

Le virus Usutu (USUV) est un arbovirus transmis par les moustiques de la famille Flaviviridae et il a un génome d’ARN positif-échoué d’environ 11.000 nucléotides. USUV affecte principalement les grands hiboux gris et les merles⁹^,¹⁰, bien que d’autres espèces d’oiseaux soient également sensibles à l’infection USUV¹¹. Récemment, USUV a également été identifié chez les rongeurs et les musaraignes bien que leur rôle potentiel dans la transmission du virus reste inconnu¹². Chez l’homme, des infections asymptomatiques ont été décrites chez les donneurs de sang¹³^,¹⁴^,¹⁵^,¹⁶ tandis que les infections USUV ont également été rapportées pour être associées à l’encéphalite ou à la méningo-encéphalite¹⁷^,¹⁸. Aux Pays-Bas, l’USUV a été détecté pour la première fois chez des oiseaux sauvages en 2016¹⁰ et chez des donneurs de sang asymptomatiques en 2018¹⁴. Depuis la détection initiale de l’USUV, des flambées ont été signalées au cours des années suivantes et la surveillance, y compris le séquençage du génome entier, est actuellement en cours pour surveiller l’émergence et la propagation d’un arbovirus dans une population auparavant naïve.

Semblable à ce qui a été décrit pour d’autres virus, tels que le virus Ebola, le virus Zika et le virus de la fièvre jaune³^,¹⁹^,²⁰, nous avons développé un ensemble d’amorce pour séquencer pleine longueur USUV²¹. Cette approche basée sur la réaction en chaîne de polymérase (PCR) permet de récupérer les génomes USUV de pleine longueur à partir de types d’échantillons fortement contaminés par l’hôte comme des échantillons de cerveau dans des échantillons jusqu’à une valeur Ct d’environ 32. Les avantages d’une approche de séquençage à base d’amplicon sont une sensibilité plus élevée par rapport au séquençage métagénomique et une spécificité plus élevée. Les limites de l’utilisation d’une approche basée sur l’amplicon sont que les séquences doivent être similaires afin de concevoir des amorces s’adaptant à toutes les souches et que les amorces sont conçus sur nos connaissances actuelles sur la diversité du virus.

Compte tenu de l’évolution constante et de l’amélioration du séquençage de troisième génération, il est nécessaire d’évaluer régulièrement le taux d’erreur du séquenceur. Ici, nous décrivons une méthode pour évaluer la performance de la nanopore directement contre le séquençage Illumina en utilisant USUV comme exemple. Cette méthode est appliquée aux séquences générées avec la dernière cellule de débit R10 et l’appel de base est effectué avec la dernière version du tourne-disque.

Protocol

REMARQUE : Liste des outils logiciels à utiliser : usearch v11.0.667; muscle v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2,16-r922; samtools 1.9; trimmomatique 0,39; bbmap 38.33; piques v3.13.1; kma-1.2.8

1. Conception d’apprêt

Commencez par télécharger ou récupérer un ensemble de séquences de génome entiers de référence pertinentes à partir de collections de données publiques ou privées. Par exemple, récupérez tous les génomes USUV pleine longueur (taxid64286) de la base de données^{NCBI 22}. USUV code un génome d’environ 11 000 nucléotides et ne récupère les séquences qu’avec une longueur de séquence de 8 000 à 12 000 nucléotides. Faites-le en utilisant l’entrée de recherche suivante :
- taxid64286[Organism:noexp] ET 8000[SLEN]:12000[SLEN].
1. Cliquez sur Envoyer à Enregistrement complet (en anglais) Fichier; utiliser Format et FASTA et créer le fichier.
Pour réduire les séquences de référence, supprimez les séquences ou séquences en double avec plus de 99 % d’identité nucléotide du jeu de données. Faites cela en utilisant l’option rapide cluster de usearch²³. Sur la ligne de commande entrez :
- usearch -cluster_fast All_USUV.fasta -id 0.99 -centroids All_USUV_dedup.fasta
Pour générer les amorces, les séquences doivent être alignées. Ceci est fait en utilisant MUSCLE²⁴. Sur la ligne de commande entrez :
- muscle -in All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txt
REMARQUE : Il est essentiel d’inspecter manuellement l’alignement pour vérifier les écarts. Ceux-ci peuvent être corrigés manuellement si nécessaire et les extrémités peuvent être coupées en fonction de la longueur de la plupart des séquences du génome entier.
Primal est utilisé pour faire une sélection de projet des amorces qui peuvent être utilisés pour le séquençage amplicon pleine longueur¹⁹. Téléchargez l’alignement sur le site Web primal (http://primal.zibraproject.org/) et sélectionnez la longueur d’amplicon préférée et chevauchez la longueur entre les différents amplicons. Aller à primal.zibraproject.org, remplir le nom Scheme,télécharger le fichier fasta aligné, sélectionner la longueur amplicon, la taille de chevauchement, et de générer le régime.
Alignez l’ensemble complet des séquences complètes USUV disponibles (pas l’ensemble réduit ou déduplicated). Sur la ligne de commande entrez :
- muscle -in All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txt
REMARQUE : Cartographiez les amorces générées par rapport à l’alignement complet (n’utilisez pas l’alignement déduplicé), corrigez manuellement les erreurs et incluez un maximum de 5 positions d’amorce dégénératives.

2. MULTIPLEx PCR

Effectuez le PCR multiplex à l’aide des amorces et du séquençage des nanopores et des Illumina. Le PCR multiplex pour USUV a été exécuté comme décrit précédemment¹⁹^,²¹.
Effectuez l’appel de base avec la version flip-flop 3.0.6.6-9999d81.

3. Analyse de données pour générer des séquences consensuelles à partir de données nanopores

Plusieurs échantillons peuvent être multiplexés sur une seule course de séquençage de nanopore. Après avoir effectué la séquence, demultiplex les données nanopore. Utilisez Porechop²⁵ pour cela. Pour prévenir la contamination et améliorer la précision, utilisez le drapeau require_two_barcodes. Sur la ligne de commande entrez :
- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex --require_two_barcodes
Après lemultiplexage, supprimer les séquences d’amorce (indiquées dans le fichier Primers_Usutu.fasta dans les deux orientations) à l’aide de cutadapt²⁶. En outre, retirer les séquences d’une longueur inférieure à 75 nucléotides. Les amorces doivent être supprimées car elles peuvent introduire des biais artificiels dans la séquence consensuelle. Sur la ligne de commande entrez :
- cutadapt -b file:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75
Les lectures de séquences demultiplexées peuvent être cartographiées contre un panneau de souches de référence distinctes à l’aide de minimap2²⁷ et une séquence consensuelle peut être générée à l’aide de samtools²⁸. Suivez l’exemple ci-dessous qui montre la procédure d’un alignement fondé sur des références et la génération de séquences consensuelles d’un échantillon : BC01. Sur la ligne de commande entrez :
- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq -gt; BC01.bam
- samtools trier BC01.bam -gt; BC01_sorted.bam
- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam - bcftools call -mv -Oz -o BC01.vcf.gz
- indice bcftools BC01.vcf.gz
- chat Random_Refs_USUV.fasta - consensus bcftools BC01.vcf.gz -gt; BC01_consensus.fasta
Pour les alignements basés sur les références, il est essentiel qu’une séquence de référence étroitement liée soit utilisée. Par conséquent, effectuez une recherche BlastN avec la séquence de consensus générée pour identifier la souche de référence la plus proche. Après cela, répétez l’alignement basé sur la référence avec la souche de référence la plus proche comme référence (étape 3.3 et 3.4). Sur la ligne de commande entrez :
- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq -gt; BC01_ref.bam
- samtools trier BC01_ref.bam -gt; BC01_sorted_ref.bam
- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam - bcftools call -mv -Oz -o BC01_ref.vcf.gz
- indice bcftools BC01_ref.vcf.gz
- chat Ref_USUV_BC01.fasta - consensus bcftools BC01_ref.vcf.gz -gt; BC01_ref_consensus.fasta

4. Analyse des données Illumina

Ces séquences sont automatiquement démulplexées après séquençage. Les lectures peuvent être contrôlées de qualité à l’aide de trimmomatic²⁹. Pour les séquences Illumina jumelées, utilisez le score phRED médian préélement couramment utilisé de 33 et une longueur de lecture minimale de 75 pour obtenir des lectures précises et de haute qualité. Sur la ligne de commande entrez :
- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75
Supprimer les amorces (indiquées dans le fichier Primers_Usutu.fasta dans les deux orientations), car ils peuvent introduire des biais artificiels, en utilisant cutadapt²⁶. En outre, supprimer les séquences d’une longueur inférieure à 75 nucléotides à l’aide des commandes ci-dessous. Sur la ligne de commande entrez :
- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75
Avant l’assemblage de novo, la séquence se lit peut être normalisée pour une couverture uniforme à travers le génome. Ceci est essentiel puisque les assembleurs de novo comme SPAdes prennent en compte la couverture de lecture lors de l’assemblage de la séquence. Normaliser les lectures à une couverture de lecture de 50 en utilisant BBNorm à partir du paquet BBMap³⁰. Sur la ligne de commande entrez :
- bbmap/bbnorm.sh target 50 in-9_1P_trimmed.fastq in2-9_2P_trimmed.fastq out-Sample9_FW_norm.fastq out2-Sample9_RE_norm.fastq
Les lectures normalisées sont de novo assemblés à l’aide de SPAdes³¹. Les réglages par défaut sont utilisés pour l’assemblage à l’aide de tous les kmers différents (21, 33, 55, 77, 99 et 127). Sur la ligne de commande entrez :
- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq
Carte du QC se lit contre la séquence de consensus obtenue à l’aide de minimap2 et des programmes comme Geneious, Bioedit ou Ugene pour organiser l’alignement. Il est important de vérifier le début et la fin du contig.
1. Alignez les lectures du QC par rapport au séquençage consensuel obtenu à l’aide de minimap2.
2. Importer l’alignement dans Geneious/Bioedit/UGene.
3. Inspecter manuellement, corriger et curé en particulier le début et la fin du génome.

5. Déterminer la couverture de lecture requise pour compenser le profil d’erreur dans le séquençage des nanopores à l’aide des données Illumina comme norme d’or

Sélectionnez séquence lit la cartographie à un amplicon, dans ce cas amplicon 26. Par la suite, la carte de la nanopore se lit contre cet amplicon à l’aide de minimap2. Utilisez Samtools pour sélectionner uniquement la cartographie des lectures pour amplicon 26 et pour convertir le fichier bam en fastq. Sur la ligne de commande entrez :
- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq -gt; BC01.bam
- samtools view -b -F 4 BC01.bam -gt; BC01_mapped.bam
- samtools bam2fq BC01_mapped.bam - seqtk seq - -gt; BC01_mapped.fastq
Sélectionnez au hasard des sous-ensembles de 200 séquences par exemple lit mille fois. Par exemple, le changer à 10 se traduira par la sélection aléatoire de mille fois un sous-ensemble de 10 lectures séquences. Le script est fourni sous forme de fichier supplémentaire 1. Sur la ligne de commande entrez :
- python Random_selection.py
Toutes les lectures de séquences choisies au hasard sont alignées sur l’amplicon 26. Utilisez KMA³² pour cartographier les lectures de la séquence et pour générer immédiatement une séquence consensuelle. Utilisez des réglages optimisés pour le séquençage des nanopores, indiqué par le drapeau -bcNano. Sur la ligne de commande entrez :
- indice kma -i Amplicon26.fasta
- pour le fichier dans random_sample; ne
- sampleID-$-file%.fastq
- kma -i $.sampleID.fastq -o $-sampleID' -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano
- fait
Inspectez les séquences de consensus générées sur la ligne de commande en utilisant :
- chat '.fsa 'gt; All_genomes.fsa
- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa -gt; All_genomes.bam
- samtools trier All_genomes.bam -gt; All_genomes_sorted.bam
- samtools stats All_genomes_sorted.bam -gt; stats.txt
1. Le taux d’erreur est affiché dans le stats.txt sous le taux d’erreur de tête #mismatches / bases cartographiées. Affichez-le à l’écran avec la commande suivante :
  - grep 'SN stats.txt ' coupe -f 2-
2. La quantité d’indels est affichée sous le cap #Indels par cycle. Affichez-le à l’écran avec la commande suivante :
  - grep stats.txt ''s cut -f 2-

Representative Results

Récemment, une nouvelle version de la version de cellule de flux (R10) a été libérée et a offert des améliorations au tourne-bas utilisé pour convertir le signal courant électronique en séquences d’ADN (ce qu’on appelle le tourne-disque). Par conséquent, nous avons re-séquence USUV à partir du tissu cérébral d’un hibou USUV-positif qui a été précédemment séquencé sur une cellule de débit R9.4 et sur un instrument Illumina Miseq²¹. Ici, nous avons décrit la méthode utilisée pour déterminer la couverture de lecture requise pour un consensus fiable appelant par comparaison directe avec le séquençage Illumina.

En utilisant la nouvelle cellule de débit en combinaison avec le flip-flop de l’appel de base, nous montrons qu’une couverture de lecture de 40x donne des résultats identiques par rapport au séquençage Illumina. Une couverture de lecture de 30x se traduit par un taux d’erreur de 0,0002% qui correspond à une erreur dans 585 000 nucléotides séquencés, tandis qu’une couverture de lecture de 20x entraîne une erreur dans 63 529 nucléotides séquencés. Une couverture de lecture de 10x entraîne une erreur dans 3 312 nucléotides séquencés, ce qui signifie que plus de trois nucléotides par génome USUV complet sont appelés faux. Avec une couverture de lecture au-dessus de 30x, aucun indels n’a été observé. Une couverture de lecture de 20x a permis de détecter une position indel tandis qu’une couverture de lecture de 10x a entraîné des indels dans 29 positions. Un aperçu du taux d’erreur à l’aide de différents seuils de couverture lus est indiqué dans le tableau 1.

Couverture	Erreurs itération 1	Fréquence d’erreur itération 1	Indels:	Erreurs itération 2	Fréquence d’erreur itération 2	Indels:	Erreurs itération 3	Fréquence d’erreur itération 3	Indels:
10 ans et plus	100	0.0274%	4	116	0.0297%	18	110	0.0282%	7
20 ans et plus	4	0.0010%	0	6	0.0015%	1	7	0.0018%	0
30x 30x	2	0.0005%	0	0	0.0000%	0	0	0.0000%	0
40x 40x	0	0.0000%	0	0	0.0000%	0	0	0.0000%	0
50 ans et plus	0	0.0000%	0	0	0.0000%	0	0	0.0000%	0

Tableau 1 : Aperçu du taux d’erreur du séquençage des nanopores. Chaque itération représente mille échantillons aléatoires.

Fichier supplémentaire 1 : Sélection aléatoire. S’il vous plaît cliquez ici pour afficher ce fichier (Cliquez à droite pour télécharger).

Discussion

Le séquençage des nanopores est en constante évolution et il est donc nécessaire de mettre en place des méthodes pour surveiller le taux d’erreur. Ici, nous décrivons un flux de travail pour surveiller le taux d’erreur du séquenceur de nanopore. Cela peut être utile après la libération d’une nouvelle cellule de débit, ou si de nouvelles versions de l’appel de base sont libérés. Cependant, cela peut également être utile pour les utilisateurs qui souhaitent configurer et valider leur propre protocole de séquençage.

Différents logiciels et outils d’alignement peuvent donner des résultats différents³³. Dans ce manuscrit, nous avons cherché à utiliser des progiciels librement disponibles qui sont couramment utilisés, et qui ont une documentation claire. Dans certains cas, la préférence peut être accordée aux outils commerciaux, qui ont généralement des interfaces plus conviviales, mais doivent être payés. À l’avenir, cette méthode peut être appliquée au même échantillon au cas où de grandes modifications dans la technologie de séquence ou de basecalling sont introduites De préférence cela devrait être fait après chaque mise à jour du point de base ou flowcell, mais étant donné la vitesse des développements actuels, cela peut également être fait seulement après des mises à jour majeures.

La réduction du taux d’erreur dans le séquençage permet de multiples échantillons. Par conséquent, le séquençage des nanopores se rapproche du remplacement des RPC en temps réel conventionnels pour les essais diagnostiques, ce qui est déjà le cas pour le diagnostic du virus de la grippe. En outre, la réduction du taux d’erreur augmente la facilité d’utilisation de cette technique de séquençage, par exemple pour la détermination de variantes mineures et pour le séquençage métagénomique impartial à haut débit.

Une étape critique du protocole est que des séquences de référence étroites et fiables doivent être disponibles. Les amorces sont basées sur les connaissances actuelles sur la diversité des virus et pourraient avoir besoin d’être mis à jour de temps en temps. Un autre point critique lors de la mise en place d’une approche de séquençage à base d’amplicon est l’équilibre de la concentration d’apprêt pour obtenir un équilibre égal dans la profondeur amplicon. Cela permet le multiplexe d’un plus grand nombre d’échantillons sur une séquence exécutée et entraîne une réduction significative des coûts.

Disclosures

Les auteurs n’ont rien à divulguer.

Acknowledgments

Ce travail a reçu un financement du programme de recherche et d’innovation Horizon 2020 de l’Union européenne dans le cadre de l’accord de subvention no 643476 (COMPARE).

Materials

Name	Company	Catalog Number	Comments
Agencourt AMPure XP beads	Beckman Coulter	A63881
dNTPs	Qiagen	201900
FLO-MIN106 R10 flowcell	Nanopore	R10 flowcell
KAPA Hyperplus libarary preparation kit	Roche	7962436001
Library Loading Bead Kit	Nanopore	EXP-LLB001
Ligation Sequencing Kit 1D	Nanopore	SQK-LSK109
Native Barcoding Kit 1D 1-12	Nanopore	EXP-NBD103
Native Barcoding Kit 1D 13-24	Nanopore	EXP-NBD104
NEB Blunt/TA Ligase Master Mix	NEB	M0367S
NEB Next Quick Ligation Module	NEB	E6056
NEB Next Ultra II End Repair / dA-Tailing Module	NEB	E7546S
Protoscript II Reverse Transcriptase	NEB	M0368X
Q5 High-Fidelity polymerase	NEB	M0491
Qubit dsDNA HS Assay kit	Thermo Fisher	Q32851
Random Primers	Promega	C1181
RNAsin Ribonuclease Inhibitor	Promega	N2111

DOWNLOAD MATERIALS LIST

References

Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
Nanopore Store, R10 flow cells. , https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019).
Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
GitHub - nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads. , https://github.com/nanoporetech/flappie (2019).
Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
GitHub - rrwick/Porechop: adapter trimmer for Oxford Nanopore reads. , https://github.com/rrwick/porechop (2018).
Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
BBMap download | SourceForge.net. , https://sourceforge.net/projects/bbmap/ (2019).
Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Genetics

Valider le séquençage des nanopores du génome entier, en utilisant le virus Usutu comme exemple

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.