Source: Ewa Bukowska-Faniband1, Tilde Andersson1, Rolf Lood1
1 Département des sciences cliniques Lund, Division of Infection Medicine, Biomedical Center, Lund University, 221 00 Lund, Suède
La planète Terre est un habitat pour des millions d’espèces bactériennes, dont chacune a des caractéristiques spécifiques. L’identification des espèces bactériennes est largement utilisée dans l’écologie microbienne pour déterminer la biodiversité des échantillons environnementaux et la microbiologie médicale pour diagnostiquer les patients infectés. Les bactéries peuvent être classées à l’aide de méthodes de microbiologie conventionnelles, telles que la microscopie, la croissance sur des médias spécifiques, les tests biochimiques et sérologiques, et les tests de sensibilité aux antibiotiques. Au cours des dernières décennies, les méthodes de microbiologie moléculaire ont révolutionné l’identification bactérienne. Une méthode populaire est le séquençage du gène 16S ribosomal RNA (rRNA). Cette méthode est non seulement plus rapide et plus précise que les méthodes conventionnelles, mais permet également d’identifier les souches qui sont difficiles à cultiver en laboratoire. En outre, la différenciation des souches au niveau moléculaire permet la discrimination entre les bactéries phénotypiquement identiques (1-4).
16S rRNA se joint à un complexe de 19 protéines pour former une sous-unité 30S du ribosome bactérien (5). Il est encodé par le gène 16S rRNA, qui est présent et fortement conservé dans toutes les bactéries en raison de sa fonction essentielle dans l’assemblage de ribosome; cependant, il contient également des régions variables qui peuvent servir d’empreintes digitales pour des espèces particulières. Ces caractéristiques ont fait du gène 16S rRNA un fragment génétique idéal à utiliser dans l’identification, la comparaison et la classification phylogénétique des bactéries (6).
Le séquençage du gène rRNA 16S est basé sur la réaction en chaîne de polymérase (PCR) (7-8) suivie du séquençage de l’ADN (9). PCR est une méthode de biologie moléculaire utilisée pour amplifier des fragments spécifiques d’ADN à travers une série de cycles qui comprennent:
i) Dénaturation d’un modèle d’ADN à double brin
ii) Annealing des amorces (oligonucléotides courts) qui sont complémentaires au modèle
iii) Extension des amorces par l’enzyme de polymérase d’ADN, qui synthétise un nouveau brin d’ADN
Un aperçu schématique de la méthode est montré dans la figure 1.
Figure 1 : Aperçu schématique de la réaction de PCR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Il y a plusieurs facteurs qui sont importants pour une réaction réussie de PCR, dont l’un est la qualité du modèle d’ADN. L’isolement de l’ADN chromosomique des bactéries peut être effectué à l’aide de protocoles standard ou de kits commerciaux. Une attention particulière doit être prise pour obtenir de l’ADN exempt de contaminants qui peuvent inhiber la réaction de PCR.
Les régions conservées du gène 16S rRNA permettent la conception de paires d’apprêt universels (un avant et un revers) qui peuvent se lier à la région cible et l’amplifier dans n’importe quelle espèce bactérienne. La région cible peut varier en taille. Alors que certaines paires d’amorces peuvent amplifier la plupart du gène 16S rRNA, d’autres n’amplifient que des parties de celui-ci. Des exemples d’amorces couramment utilisées sont présentés dans le tableau 1 et leurs sites de liaison sont représentés à la figure 2.
Nom d’amorce | Séquence (5′-3′) | Avant/revers | référence |
8F b) | AGAGTTTGATCCTGGCTCAG | en avant | -1 |
27F (en) | AGAGTTTGATCMTGGCTCAG | en avant | -10 |
515F (en) | GTGCCAGCMGCCGCGGTAA | en avant | -11 |
911R | GCCCCCGTCAATTCMTTTGA | revenir sur | -12 |
en 1391R | GACGCGGTGTGTRCA | revenir sur | -11 |
1492R | GGTTACCTTGTTACGACTT GGTTACCTTGTTACGACTT GGTTACCTTGTTACGACTT GGTTA | revenir sur | -11 |
Tableau 1 : Exemples d’oligonucléotides standard utilisés dans l’amplification des gènes 16S rRNA a).
a) Les longueurs prévues du produit PCR générées à l’aide des différentes combinaisons d’amorces peuvent être estimées en calculant la distance entre les sites de liaison pour l’avant et l’amorce inverse (voir la figure 2), par exemple la taille du PCR produit utilisant la paire d’apprêt 8F-1492R est de 1500 bp, et pour la paire d’apprêt 27F-911R 900 bp.
b) également connu sous le nom de fD1
Figure 2 : Figure représentative de la séquence de rRNA 16S et des sites de liaison d’amorce. Les régions conservées sont colorées en gris et les régions variables sont remplies de lignes diagonales. Pour permettre la plus haute résolution, l’amorce 8F et 1492R (nom basé sur l’emplacement sur la séquence d’ARNr) sont utilisées pour amplifier la séquence entière, permettant le séquençage de plusieurs régions variables du gène. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Les conditions de cyclisme pour le PCR (c’est-à-dire la température et le temps requis pour que l’ADN soit dénaturé, annealed avec des amorces et synthétisé) dépendent du type de polymérase qui est utilisé et des propriétés des amorces. Il est recommandé de suivre les directives du fabricant pour une polymérase particulière.
Une fois le programme PCR terminé, les produits sont analysés par électrophoresis de gel d’agarose. Un PCR réussi donne une seule bande de taille prévue. Le produit doit être purifié avant le séquençage pour enlever les amorces résiduelles, les désoxyribonucleotides, la polymérase et le tampon qui étaient présents dans la réaction PCR. Les fragments d’ADN purifiés sont habituellement envoyés pour le séquençage aux services commerciaux de séquençage ; cependant, certaines institutions effectuent le séquençage de l’ADN dans leurs propres installations de base.
La séquence d’ADN est automatiquement générée à partir d’un chromatogramme d’ADN par un ordinateur et doit être soigneusement vérifiée pour la qualité, car l’édition manuelle est parfois nécessaire. Après cette étape, la séquence génétique est comparée aux séquences déposées dans la base de données rRNA 16S. Les régions de similitude sont identifiées, et les séquences les plus similaires sont livrées.
1. Mise en place
2. Protocole
Note: Le protocole démontré s’applique au séquençage du gène 16S rRNA à partir d’une culture pure de bactéries. Elle ne s’applique pas aux études métagénomiques.
Figure 3 : Agarose gel électrophoresis de gDNA isolé de Bacillus subtilis. Lane 1: M – marqueur de masse moléculaire (de haut en bas: 10000 bp, 8000 bp, 6000 bp, 5000 bp, 4000 bp, 3500 bp, 3000 bp, 2500 bp, 2000 bp, 1500 bp, 1000 bp, 1000 bp). Voie 2: gDNA – ADN génomique isolé de Bacillus subtilis. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
composant | Concentration finale | Volume par réaction | Volume par x réactions (mix master) |
tampon de réaction 5x | 1x 1x | 10 l | 10 l x |
10 mM dNTP | 200 m | 1 l | 1 l x |
10 M Amorce 8F | 0,5 M | 2,5 l | 2,5 l x |
10 M Amorce 1492R | 0,5 M | 2,5 l | 2,5 l x |
Polymérase de phusion | 1 unité | 0,5 l | 0,5 l x |
Template ADN | – | 1 l | – |
ddH2O | – | 32,5 l | 32,5 l x |
Volume total | 50 l | 49 l x |
Tableau 2 : composants de réaction PCR. – utiliser l’ADNc dilué 10x, 100x ou 1000x à partir de l’étape 2.3.
pas | température | temps | Cycles |
Dénaturation initiale | 98oC | 30 sec | |
Dénaturation | 98oC | 10 sec | 25-30 |
Recuit | 60oC | 30 sec | |
prolongation | 72oC | 45 sec | |
Prolongation finale | 72oC | 7 min | |
tenir | 4oC | ∞ |
Tableau 3 : Programme PCR pour l’amplification du gène 16S rRNA.
Figure 4 : Électrophoresis de gel d’Agarose des produits de PCR amplifiés utilisant des amorces 8F et 1492R et gDNA comme modèle. L’échantillon d’ADNc de B. subtilis (voir la figure 3) a été dilué 10, 100 et 1000 fois afin de tester les meilleurs résultats. Voie 1: M – marqueur de masse moléculaire (de haut en bas: 10000 bp, 8000 bp, 6000 bp, 5000 bp, 4000 bp, 3500 bp, 3000 bp, 2500 bp, 2000 bp, 1500 bp, 1000 bp, 750 bp, 500 bp, 250 bp). Voie 2: Réaction PCR avec le modèle dilué 10x. Voie 3: Réaction PCR avec le modèle dilué 100x. Voie 4: Réaction PCR avec le modèle dilué 1000x. Voie 5: (C-) – contrôle négatif (réaction sans modèle d’ADN). Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
3. Analyse des données et résultats
Note: Le produit PCR est séquencé à l’aide des amorces avant (ici 8F) et inverses (ici 1492R). Par conséquent, deux ensembles de séquences de données sont générés, l’un pour l’avant et l’autre pour l’amorce inversée. Pour chaque séquence, au moins deux types de fichiers sont générés : i) un fichier texte contenant la séquence d’ADN et ii) un chromatogramme d’ADN, qui montre la qualité de la séquence.
Figure 5 : Exemples de dépannage du séquençage de l’ADN. A) Exemple d’une séquence de chromatogrammes de qualité (des pics uniformément espacés et sans ambiguïté). B) Séquence de mauvaise qualité qui se produit habituellement au début du chromatogramme. La zone grise est considérée comme de mauvaise qualité et automatiquement supprimée par le logiciel de séquençage. Plus de bases peuvent être coupées manuellement. C) Présence de double pics (indiqués par des flèches). Un nucléotide indiqué par la flèche rouge a été lu par le séquenceur comme “T” (pic rouge), mais le pic bleu est plus fort, et il peut également être interprété comme “C”. D) Les pics de chevauchement indiquent une contamination par l’ADN(c.-à-d. plus d’un modèle). E) Perte de résolution et soi-disant « pics larges » (marqués par rectangle) qui empêchent l’appel de base fiable. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 6 : Exemple du résultat de blast nucléotide. La séquence de gène de rRNA 16S de la culture pure de B. subtilis 168 a été employée comme séquence de requête. Le top hit montre 100% d’identité (souligné) à la souche B. subtilis 168, comme prévu. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
La Terre abrite des millions d’espèces bactériennes, chacune ayant des caractéristiques uniques. L’identification de ces espèces est essentielle à l’évaluation des échantillons environnementaux. Les médecins doivent également distinguer différentes espèces bactériennes pour diagnostiquer les patients infectés.
Pour identifier les bactéries, une variété de techniques peuvent être utilisées, y compris l’observation microscopique de la morphologie ou de la croissance sur un média spécifique pour observer la morphologie des colonies. L’analyse génétique, une autre technique pour identifier les bactéries a gagné en popularité ces dernières années, en partie en raison du séquençage du gène de l’ARN ribosomal 16S.
Le ribosome bactérien est un complexe d’ARN protéique composé de deux sous-unités. La sous-unité 30S, la plus petite de ces deux sous-unités, contient 16S rRNA, qui est codé par le gène 16S rRNA contenu dans l’ADN génomique. Les régions spécifiques de 16S rRNA sont fortement conservées, en raison de leur fonction essentielle dans l’assemblage de ribosome. Tandis que d’autres régions, moins critiques pour fonctionner, peuvent varier entre les espèces bactériennes. Les régions variables dans l’ARNr 16S, peuvent servir d’empreintes moléculaires uniques pour les espèces bactériennes, ce qui nous permet de distinguer les souches phénotypiquement identiques.
Après avoir obtenu un échantillon de qualité de gDNA, PCR du gène de codage 16S rRNA peut commencer. PCR est une méthode de biologie moléculaire couramment utilisée, consistant en des cycles de dénaturation du modèle d’ADN à double brin, l’annexion des paires d’apprêt universels, qui amplifient les régions hautement conservées du gène, et l’extension des amorces par la polymérase d’ADN. Alors que certains amorces amplifient la plupart du gène de codage 16S rRNA, d’autres ne font qu’amplifier des fragments de celui-ci. Après PCR, les produits peuvent être analysés par électrophoresis de gel d’agarose. Si l’amplification a été un succès, le gel devrait contenir une seule bande d’une taille prévue, selon la paire d’amorce utilisée, jusqu’à 1500bp, la longueur approximative du gène 16S rRNA.
Après la purification et le séquençage, les séquences obtenues peuvent ensuite être entrées dans la base de données BLAST, où elles peuvent être comparées avec des séquences de référence 16S rRNA. Comme cette base de données retourne les correspondances basées sur la similitude la plus élevée, cela permet de confirmer l’identité des bactéries d’intérêt. Dans cette vidéo, vous observerez le séquençage du gène 16S rRNA, y compris le PCR, l’analyse et l’édition de séquences d’ADN, l’assemblage de séquences et la recherche de bases de données.
Lors de la manipulation des micro-organismes, il est essentiel de suivre de bonnes pratiques microbiologiques, y compris en utilisant la technique aseptique et le port d’équipement de protection individuelle approprié. Après avoir effectué une évaluation appropriée des risques pour le micro-organisme ou l’échantillon environnemental d’intérêt, obtenir une culture d’essai. Dans cet exemple, une culture pure de Bacillus subtilis est utilisée.
Pour commencer, développez votre micro-organisme sur un milieu approprié dans les conditions appropriées. Dans cet exemple, Bacillus subtilis 168 est cultivé dans le bouillon LB pendant la nuit dans un incubateur secouant réglé à 200 tr/min à 37 degrés Celsius. Ensuite, utilisez un kit disponible dans le commerce pour isoler l’ADN génomique ou l’ADN g de 1,5 millilitres de la culture de nuit B. subtilis.
Pour vérifier la qualité de l’ADN isolé, d’abord mélanger cinq microlitres de l’ADN g isolé avec un microlitre de colorant de chargement de gel d’ADN. Ensuite, chargez l’échantillon sur un gel agarose de 0,8 %, contenant un réactif de coloration de l’ADN, comme sYBR sûr ou EtBr. Après cela, chargez une norme de masse moléculaire d’un kilobase sur le gel, et exécutez l’électrophorèse jusqu’à ce que le colorant avant soit à environ 0,5 centimètre du fond du gel. Une fois l’électrophoresis de gel terminée, visualisez le gel sur un transilluminator de lumière bleue. L’ADNc doit apparaître comme une bande épaisse, au-dessus de 10 kilobase sa taille et avoir un minimum de frottis.
Après cela, pour créer des dilutions en série de l’ADNc, étiqueter trois tubes de microcentrifuge comme 10X, 100X, et 1000X. Ensuite, utilisez une pipette pour distribuer 90 microlitres d’eau distillée stérile dans chacun des tubes. Ensuite, ajoutez 10 microlitres de la solution gDNA au tube 10X. Pipette tout le volume de haut en bas pour s’assurer que la solution est mélangée à fond. Ensuite, retirez 10 microlitres de la solution du tube 10X et transférez-le dans le tube 100X. Mélanger la solution telle qu’elle a été décrite précédemment. Enfin, transférer 10 microlitres de la solution dans le tube 100X, sur le tube 1000X.
Pour commencer le protocole PCR, décongeler les réactifs nécessaires sur la glace. Ensuite, préparez le mix PCR master. Étant donné que la polymérase d’ADN est active à température ambiante, la réaction installée doit se produire sur la glace. Aliquot 49 microlitres du mélange maître dans chacun des tubes PCR. Ensuite, ajoutez un microlitre de modèle à chacun des tubes expérimentaux et un microlitre d’eau stérile au tube de commande négatif, pipetting de haut en bas pour mélanger. Après cela, définir la machine PCR en fonction du programme décrit dans le tableau. Placez les tubes dans le thermocycler et commencez le programme.
Une fois le programme terminé, examinez la qualité de votre produit par électrophoresis de gel d’agarose, comme précédemment démontré. Une réaction réussie utilisant le protocole décrit devrait donner une bande simple d’environ 1.5 kilobase. Dans cet exemple, l’échantillon contenant 100X d’ADN dilué a donné le produit de la plus haute qualité. Ensuite, purifier le meilleur produit PCR, dans ce cas, l’ADN 100X g, avec un kit disponible dans le commerce. Maintenant, le produit PCR peut être envoyé pour le séquençage.
Dans cet exemple, le produit PCR est séquencé à l’aide d’amorces avant et inverses. Ainsi, deux ensembles de données, chacun contenant une séquence d’ADN et un chromatogramme d’ADN, sont générés : l’un pour l’amorce avant et l’autre pour l’amorce inverse. Tout d’abord, examiner les chromatogrammes générés par chaque amorce. Un chromatogramme idéal devrait avoir des pics espacés uniformément avec peu ou pas de signaux de fond.
Si les chromatogrammes affichent des pics doubles, plusieurs modèles d’ADN peuvent avoir été présents dans les produits PCR et la séquence doit être jetée. Si les chromatogrammes contenaient des pics de différentes couleurs au même endroit, le logiciel de séquençage probablement mal appelé nucléotides. Cette erreur peut être identifiée manuellement et corrigée dans le fichier texte. La présence de larges pics dans le chromatogramme indique une perte de résolution, ce qui provoque une mauvaise dépouillement des nucléotides dans les régions associées. Cette erreur est difficile à corriger et les décalages dans l’une ou l’autre des étapes suivantes doivent être considérés comme peu fiables. Une mauvaise qualité de lecture du chromatogramme, indiquée par la présence de pics multiples, se produit habituellement aux cinq extrémités principales et aux trois extrémités principales de la séquence. Certains programmes de séquençage suppriment automatiquement ces sections de mauvaise qualité. Si votre séquence n’a pas été tronquée automatiquement, identifiez les fragments de mauvaise qualité et supprimez leurs bases respectives du fichier texte.
Utilisez un programme d’assemblage d’ADN pour assembler les deux séquences d’amorce en une seule séquence continue. N’oubliez pas que les séquences obtenues à l’aide d’amorces avant et arrière devraient se chevaucher partiellement. Dans le programme d’assemblage d’ADN, insérez les deux séquences en format FASTA dans la case appropriée. Ensuite, cliquez sur le bouton Soumettre et attendre que le programme retourne les résultats.
Pour afficher la séquence assemblée, cliquez sur Contigs dans l’onglet résultats. Ensuite, pour afficher les détails de l’alignement, sélectionnez les détails d’assemblage. Naviguez sur le site Web pour l’outil de recherche d’alignement local de base, ou BLAST, et sélectionnez l’outil blast nucléotide pour comparer votre séquence à la base de données. Entrez votre séquence dans la boîte de texte de séquence de requête et sélectionnez la base de données appropriée dans le menu défilement vers le bas. Enfin, cliquez sur le bouton BLAST au bas de la page, et attendez que l’outil retourne les séquences les plus similaires de la base de données.
Dans cet exemple, le hit le plus haut est la souche 168 de B. subtilis, montrant l’identité à 100% avec la séquence dans la base de données BLAST. Si le coup supérieur n’affiche pas l’identité à 100 % de votre espèce ou souche attendue, cliquez sur la séquence qui correspond le plus étroitement à votre requête pour voir les détails de l’alignement. Les nucléotides alignés seront rejoints par de courtes lignes verticales et les nucléotides dépareillés auront des espaces entre eux. En se concentrant sur les régions dépareillées identifiées, révisez la séquence et répétez la recherche BLAST si vous le souhaitez.
L’identification des espèces bactériennes est importante pour les différents chercheurs, ainsi que pour ceux dans les soins de santé. Le séquençage 16S de rRNA a été au commencement employé par des chercheurs pour déterminer des relations phylogénétiques entre les bactéries. Avec le temps, il a été mis en œuvre dans le cadre d’études métagénomiques visant à déterminer la biodiversité des échantillons environnementaux et dans les laboratoires cliniques comme méthode permettant d’identifier les agents pathogènes potentiels. Il permet une identification rapide et précise des bactéries présentes dans les échantillons cliniques, facilitant un diagnostic plus précoce et un traitement plus rapide des patients.
Earth is home to millions of bacterial species, each with unique characteristics. Identifying these species is critical in evaluating environmental samples. Doctors also need to distinguish different bacterial species to diagnose infected patients.
To identify bacteria, a variety of techniques can be employed, including microscopic observation of morphology or growth on a specific media to observe colony morphology. Genetic analysis, another technique for identifying bacteria has grown in popularity in recent years, due in part to 16S ribosomal RNA gene sequencing.
The bacterial ribosome is a protein RNA complex consisting of two subunits. The 30S subunit, the smaller of these two subunits, contains 16S rRNA, which is encoded by the 16S rRNA gene contained within the genomic DNA. Specific regions of 16S rRNA are highly conserved, due to their essential function in ribosome assembly. While other regions, less critical to function, may vary among bacterial species. The variable regions in 16S rRNA, can serve as unique molecular fingerprints for bacterial species, allowing us to distinguish phenotypically identical strains.
After obtaining a quality sample of gDNA, PCR of the 16S rRNA encoding gene can begin. PCR is a commonly used molecular biology method, consisting of cycles of denaturation of the double-stranded DNA template, annealing of universal primer pairs, which amplify highly conserved regions of the gene, and the extension of primers by DNA polymerase. While some primers amplify most of the 16S rRNA encoding gene, others only amplify fragments of it. After PCR, the products can be analyzed via agarose gel electrophoresis. If amplification was successful, the gel should contain a single band of an expected size, depending upon the primer pair used, up to 1500bp, the approximate length of the 16S rRNA gene.
After purification and sequencing, the obtained sequences can then be entered into the BLAST database, where they can be compared with reference 16S rRNA sequences. As this database returns matches based on the highest similarity, this allows confirmation of the identity of the bacteria of interest. In this video, you will observe 16S rRNA gene sequencing, including PCR, DNA sequence analysis and editing, sequence assembly and database searching.
When handling microorganisms, it is essential to follow good microbiological practice, including using aseptic technique and wearing appropriate personal protective equipment. After performing an appropriate risk assessment for the microorganism or environmental sample of interest, obtain a test culture. In this example, a pure culture of Bacillus subtilis is used.
To begin, grow your microorganism on a suitable medium in the appropriate conditions. In this example, Bacillus subtilis 168 is grown in LB broth overnight in a shaking incubator set to 200 rpm at 37 degrees Celsius. Next, use a commercially available kit to isolate genomic DNA or gDNA from 1.5 milliliters of the B. subtilis overnight culture.
To check the quality of the isolated DNA, first mix five microliters of the isolated gDNA with one microliter of DNA gel loading dye. Then, load the sample onto a 0.8% agarose gel, containing DNA staining reagent, such as SYBR safe or EtBr. After this, load a one kilobase molecular mass standard onto the gel, and run the electrophoresis until the front dye is approximately 0.5 centimeters from the bottom of the gel. Once the gel electrophoresis is complete, visualize the gel on a blue light transilluminator. The gDNA should appear as a thick band, above 10 kilobase in size and have minimal smearing.
After this, to create serial dilutions of the gDNA, label three microcentrifuge tubes as 10X, 100X, and 1000X. Then, use a pipette to dispense 90 microliters of sterile distilled water into each of the tubes. Next, add 10 microliters of the gDNA solution to the 10X tube. Pipette the whole volume up and down to ensure the solution is mixed thoroughly. Then, remove 10 microliters of the solution from the 10X tube and transfer this to the 100X tube. Mix the solution as previously described. Finally, transfer 10 microliters of the solution in the 100X tube, to the 1000X tube.
To begin the PCR protocol, thaw the necessary reagents on ice. Then, prepare the PCR master mix. Since the DNA polymerase is active at room temperature, the reaction set up must occur on ice. Aliquot 49 microliters of the master mix into each of the PCR tubes. Then, add one microliter of template to each of the experimental tubes and one microliter of sterile water to the negative control tube, pipetting up and down to mix. After this, set the PCR machine according to the program described in the table. Place the tubes into the thermocycler and start the program.
Once the program is complete, examine the quality of your product via agarose gel electrophoresis, as previously demonstrated. A successful reaction using the described protocol should yield a single band of approximately 1.5 kilobase. In this example, the sample containing 100X diluted gDNA yielded the highest quality product. Next, purify the best PCR product, in this case, the 100X gDNA, with a commercially available kit. Now the PCR product can be sent for sequencing.
In this example, the PCR product is sequenced using forward and reverse primers. Thus, two data sets, each containing a DNA sequence and a DNA chromatogram, are generated: one for the forward primer and the other for the reverse primer. First, examine the chromatograms generated from each primer. An ideal chromatogram should have evenly spaced peaks with little to no background signals.
If the chromatograms display double peaks, multiple DNA templates may have been present in the PCR products and the sequence should be discarded. If the chromatograms contained peaks of different colors in the same location, the sequencing software likely miscalled nucleotides. This error can be manually identified and corrected in the text file. The presence of broad peaks in the chromatogram indicates a loss of resolution, which causes miscounting of the nucleotides in the associated regions. This error is difficult to correct and mismatches in any of the subsequent steps should be treated as unreliable. Poor chromatogram reading quality, indicated by the presence of multiple peaks, usually occurs at the five prime and three prime ends of the sequence. Some sequencing programs remove these low quality sections automatically. If your sequence was not truncated automatically, identify the low quality fragments and remove their respective bases from the text file.
Use a DNA assembly program to assemble the two primer sequences into one continuous sequence. Remember, sequences obtained using forward and reverse primers should partially overlap. In the DNA assembly program, insert the two sequences in FASTA format into the appropriate box. Then, click the submit button and wait for the program to return the results.
To view the assembled sequence, click on Contigs in the results tab. Then, to view the details of the alignment, select assembly details. Navigate to the website for the basic local alignment search tool, or BLAST, and select the nucleotide BLAST tool to compare your sequence to the database. Enter your sequence into the query sequence text box and select the appropriate database in the scroll down menu. Finally, click the BLAST button on the bottom of the page, and wait for the tool to return the most similar sequences from the database.
In this example, the top hit is B. subtilis strain 168, showing 100% identity with the sequence in the BLAST database. If the top hit does not show 100% identity to your expected species or strain, click on the sequence which most closely matches your query to see the details of the alignment. Aligned nucleotides will be joined by short vertical lines and mismatched nucleotides will have gaps between them. Focusing on the identified mismatched regions, revise the sequence and repeat the BLAST search if desired.
Microbiology
126.3K Vues
Microbiology
309.0K Vues
Microbiology
130.2K Vues
Microbiology
164.0K Vues
Microbiology
185.4K Vues
Microbiology
285.9K Vues
Microbiology
92.8K Vues
Microbiology
360.6K Vues
Microbiology
184.4K Vues
Microbiology
85.4K Vues
Microbiology
37.1K Vues
Microbiology
28.1K Vues