Fuente: Ewa Bukowska-Faniband1, Tilde Andersson1, Rolf Lood1
1 Departamento de Ciencias Clínicas Lund, División de Medicina de Infecciones, Centro Biomédico, Universidad de Lund, 221 00 Lund, Suecia
El planeta Tierra es un hábitat para millones de especies bacterianas, cada una de las cuales tiene características específicas. La identificación de especies bacterianas se utiliza ampliamente en la ecología microbiana para determinar la biodiversidad de muestras ambientales y microbiología médica para diagnosticar pacientes infectados. Las bacterias se pueden clasificar utilizando métodos de microbiología convencionales, como la microscopía, el crecimiento en medios específicos, las pruebas bioquímicas y serológicas y los ensayos de sensibilidad a los antibióticos. En las últimas décadas, los métodos de microbiología molecular han revolucionado la identificación bacteriana. Un método popular es la secuenciación del gen del ARN ribosomal 16S (ARN RRNA). Este método no sólo es más rápido y preciso que los métodos convencionales, sino que también permite la identificación de cepas que son difíciles de cultivar en condiciones de laboratorio. Además, la diferenciación de las cepas a nivel molecular permite la discriminación entre bacterias fenotípicamente idénticas (1-4).
El ARNR 16S se une a un complejo de 19 proteínas para formar una subunidad 30S del ribosoma bacteriano (5). Está codificado por el gen 16S rRNA, que está presente y altamente conservado en todas las bacterias debido a su función esencial en el ensamblaje ribosoma; sin embargo, también contiene regiones variables que pueden servir como huellas dactilares para determinadas especies. Estas características han hecho del gen rRNA 16S un fragmento genético ideal para ser utilizado en la identificación, comparación y clasificación filogenética de bacterias (6).
La secuenciación del gen rRNA 16S se basa en la reacción en cadena de la polimerasa (PCR) (7-8) seguida de la secuenciación del ADN (9). La PCR es un método de biología molecular utilizado para amplificar fragmentos específicos de ADN a través de una serie de ciclos que incluyen:
i) Desnaturalización de una plantilla de ADN de doble cadena
ii) Recocido de imprimaciones (oligonucleótidos cortos) que son complementarios a la plantilla
iii) Extensión de imprimaciones por la enzima ADN polimerasa, que sintetiza una nueva cadena de ADN
En la Figura 1se muestra una descripción esquemática del método.
Figura 1: Descripción esquemática de la reacción PCR. Haga clic aquí para ver una versión más grande de esta figura.
Hay varios factores que son importantes para una reacción de PCR exitosa, uno de los cuales es la calidad de la plantilla de ADN. El aislamiento del ADN cromosómico de las bacterias se puede realizar utilizando protocolos estándar o kits comerciales. Se debe tener especial cuidado para obtener ADN que esté libre de contaminantes que puedan inhibir la reacción de PCR.
Las regiones conservadas del gen 16S rRNA permiten el diseño de pares de imprimación universales (uno hacia adelante y otro inverso) que pueden unirse y amplificar la región objetivo en cualquier especie bacteriana. La región de destino puede variar en tamaño. Mientras que algunos pares de imprimación pueden amplificar la mayor parte del gen rRNA 16S, otros amplifican sólo partes de él. En la Tabla 1 se muestran ejemplos de imprimaciones de uso común y sus sitios de enlace se muestran en la Figura 2.
Primer nombre | Secuencia (5′-3′) | Adelante/retroceso | Referencia |
8F b) | AGAGTTTGATCCTGGCTCAG | Adelante | -1 |
27F | AGAGTTTGATCMTGGCTCAG | Adelante | -10 |
515F | GTGCCAGCMGCCGCGGTAA | Adelante | -11 |
911R | GCCCCCGTCAATTCMTTTGA | Marcha atrás | -12 |
1391R | GACGGGCGGTGTARCA | Marcha atrás | -11 |
1492R | GGTTACCTTGTTACGACTT | Marcha atrás | -11 |
Tabla 1: Ejemplos de oligonucleótidos estándar utilizados en la amplificación de genes 16S rRNA a).
a) Las longitudes esperadas del producto PCR generado utilizando las diferentes combinaciones de imprimación se pueden estimar calculando la distancia entre los sitios de unión para la imprimación delantera y la inversa (véase la figura 2), por ejemplo, el tamaño del PCR producto con el par de imprimación 8F-1492R es de 1500 bp, y para el par de imprimación 27F-911R a 900 bp.
b) también conocido como fD1
Figura 2: Figura representativa de la secuencia de rRNA 16S y los sitios de enlace de imprimación. Las regiones conservadas se colorean en gris y las regiones variables se rellenan con líneas diagonales. Para permitir la resolución más alta, la imprimación 8F y 1492R (nombre basado en la ubicación en la secuencia rRNA) se utilizan para amplificar toda la secuencia, permitiendo la secuencia de varias regiones variables del gen. Haga clic aquí para ver una versión más grande de esta figura.
Las condiciones de ciclismo para pcR(es decir, la temperatura y el tiempo necesarios para que el ADN sea desnaturalizado, recocido con imprimadores y sintetizado) dependen del tipo de polimerasa que se utiliza y de las propiedades de las imprimaciones. Se recomienda seguir las pautas del fabricante para una polimerasa en particular.
Una vez completado el programa PCR, los productos son analizados por electroforesis de gel de agarosa. Un PCR exitoso produce una sola banda de tamaño esperado. El producto debe purificarse antes de la secuenciación para eliminar las imprimaciones residuales, los desoxirribonucleótidos, la polimerasa y el tampón que estaban presentes en la reacción de PCR. Los fragmentos de ADN purificados generalmente se envían para la secuenciación a servicios de secuenciación comercial; sin embargo, algunas instituciones realizan la secuenciación del ADN en sus propias instalaciones principales.
La secuencia de ADN se genera automáticamente a partir de un cromatograma de ADN por una computadora y debe ser cuidadosamente revisada para la calidad, ya que a veces se necesita la edición manual. Siguiendo este paso, la secuencia genética se compara con las secuencias depositadas en la base de datos 16S rRNA. Se identifican las regiones de similitud y se entregan las secuencias más similares.
1. Configurar
2. Protocolo
Nota: El protocolo demostrado se aplica a la secuenciación del gen rRNA 16S de un cultivo puro de bacterias. No se aplica a estudios metagenómicos.
Figura 3: Electroforesis de gel de agarosa de ADNaaislado de Bacillus subtilis. Carril 1: M – marcador de masa molecular (de arriba a abajo: 10000 bp, 8000 bp, 6000 bp, 5000 bp, 4000 bp, 3500 bp, 3000 bp, 2500 bp, 2000 bp, 1500 bp, 1000 bp). Carril 2: gDNA – ADN genómico aislado de Bacillus subtilis. Haga clic aquí para ver una versión más grande de esta figura.
Componente | Concentración final | Volumen por reacción | Volumen por x reacciones (mezcla maestra) |
Búfer de reacción 5x | 1x | 10 l | 10 l x x |
DNTP de 10 mM | 200 M | 1 L | 1 l x x |
10 M Primer 8F | 0,5 m | 2,5 l | 2,5 sL x x |
10 M Primer 1492R | 0,5 m | 2,5 l | 2,5 sL x x |
Phusion polimerasa | 1 unidad | 0,5 l | 0,5 sL x x |
ADN de plantilla * | – | 1 L | – |
ddH2O | – | 32,5 l | 32,5 l x x |
Volumen total | 50 l | 49 l x x |
Cuadro 2: Componentes de reacción PCR. * Utilice el ADNado diluido de 10x, 100x o 1000x del paso 2.3.
Paso | Temperatura | hora | Ciclos |
Desnaturalización inicial | 98oC | 30 seg | |
Desnaturalización | 98oC | 10 seg | 25-30 |
Recocido | 60oC | 30 seg | |
Extensión | 72oC | 45 seg | |
Extensión final | 72oC | 7 min | |
Mantener | 4oC | ∞ |
Cuadro 3: Programa PCR para la amplificación del gen rRNA 16S.
Figura 4: Electroforesis de gel de agarosa de productos PCR amplificadas utilizando imprimaciones 8F y 1492R y gDNA como plantilla. La muestra de ADN g de B. subtilis (ver figura 3) se diluyó 10, 100 y 1000 veces con el fin de probar el mejor resultado. Carril 1: M – marcador de masa molecular (de arriba a abajo: 10000 bp, 8000 bp, 6000 bp, 5000 bp, 4000 bp, 3500 bp, 3000 bp, 2500 bp, 2000 bp, 1500 bp, 1000bp, 750 bp, 500 bp, 250 bp). Carril 2: Reacción PCR con plantilla diluida 10x. Carril 3: Reacción PCR con plantilla diluida de 100x. Carril 4: Reacción PCR con plantilla diluida 1000x. Carril 5: (C-) – control negativo (reacción sin la plantilla de ADN). Haga clic aquí para ver una versión más grande de esta figura.
3. Análisis de datos y resultados
Nota: El producto PCR se secuencia utilizando las imprimaciones delanteras (aquí 8F) y inversas (aquí 1492R). Por lo tanto, se generan dos conjuntos de secuencia de datos, uno para el avance y otro para el primer inverso. Para cada secuencia se generan al menos dos tipos de archivo: i) un archivo de texto que contiene la secuencia de ADN y ii) un cromatograma de ADN, que muestra la calidad de la ejecución de secuenciación.
Figura 5: Ejemplos de solución de problemas de secuenciación de ADN. A) Un ejemplo de una secuencia de cromatogramas de calidad (picos uniformemente espaciados e inequívocos). B) Secuencia de mala calidad que generalmente ocurre al principio del cromatograma. El área de la zona gris se considera de baja calidad y se elimina automáticamente por el software de secuenciación. Más bases se pueden recortar manualmente. C) Presencia de picos dobles (indicados por flechas). Un nucleótido que se indica mediante la flecha roja ha sido leído por el secuenciador como “T” (pico rojo), pero el pico azul es más fuerte, y también se puede interpretar como “C”. D) Los picos superpuestos indican contaminación del ADN(es decir, más de una plantilla). E) Pérdida de resolución y los llamados “picos anchos” (marcados por rectángulo) que impiden la llamada base confiable. Haga clic aquí para ver una versión más grande de esta figura.
Figura 6: Ejemplo del resultado de la BLAST de nucleótidos. La secuencia del gen 16S rRNA del cultivo puro de B. subtilis 168 se utilizó como secuencia de consulta. El primer éxito muestra 100% de identidad (subrayado) a la cepa B. subtilis 168, como se esperaba. Haga clic aquí para ver una versión más grande de esta figura.
La Tierra es el hogar de millones de especies bacterianas, cada una con características únicas. La identificación de estas especies es fundamental en la evaluación de muestras ambientales. Los médicos también necesitan distinguir diferentes especies bacterianas para diagnosticar pacientes infectados.
Para identificar bacterias, se pueden emplear una variedad de técnicas, incluyendo la observación microscópica de morfología o crecimiento en un medio específico para observar la morfología de la colonia. El análisis genético, otra técnica para identificar bacterias ha crecido en popularidad en los últimos años, debido en parte a la secuenciación del gen del ARN ribosomal 16S.
El ribosoma bacteriano es un complejo de ARN proteico que consta de dos subunidades. La subunidad 30S, la más pequeña de estas dos subunidades, contiene 16S rRNA, que está codificado por el gen rRNA 16S contenido en el ADN genómico. Las regiones específicas de 16S rRNA están altamente conservadas, debido a su función esencial en el montaje ribosoma. Mientras que otras regiones, menos críticas para funcionar, pueden variar entre las especies bacterianas. Las regiones variables en 16S rRNA, pueden servir como huellas moleculares únicas para las especies bacterianas, lo que nos permite distinguir cepas fenotípicamente idénticas.
Después de obtener una muestra de calidad de gDNA, pcR del gen de codificación 16S rRNA puede comenzar. La PCR es un método de biología molecular comúnmente utilizado, que consiste en ciclos de desnaturalización de la plantilla de ADN de doble cadena, recocido de pares de imprimación universales, que amplifican regiones altamente conservadas del gen, y la extensión de imprimaciones por ADN polimerasa. Mientras que algunos imprimadores amplifican la mayor parte del gen de codificación 16S rRNA, otros sólo amplifican fragmentos de él. Después de pcR, los productos se pueden analizar a través de electroforesis de gel de agarosa. Si la amplificación fue exitosa, el gel debe contener una sola banda de un tamaño esperado, dependiendo del par de imprimación utilizado, hasta 1500bp, la longitud aproximada del gen rRNA 16S.
Después de la purificación y la secuenciación, las secuencias obtenidas se pueden introducir en la base de datos BLAST, donde se pueden comparar con las secuencias rRNA de referencia 16S. Como esta base de datos devuelve coincidencias basadas en la mayor similitud, esto permite la confirmación de la identidad de las bacterias de interés. En este vídeo, observará la secuenciación del gen rRNA 16S, incluyendo PCR, análisis y edición de secuencia de ADN, montaje de secuencia según la base de datos.
Al manipular microorganismos, es esencial seguir buenas prácticas microbiológicas, incluyendo el uso de una técnica aséptica y el uso de equipos de protección personal adecuados. Después de realizar una evaluación de riesgos adecuada para el microorganismo o la muestra de interés ambiental, obtenga un cultivo de prueba. En este ejemplo, se utiliza una cultura pura de Bacillus subtilis.
Para empezar, haz crecer tu microorganismo en un medio adecuado en las condiciones adecuadas. En este ejemplo, Bacillus subtilis 168 se cultiva en caldo LB durante la noche en una incubadora de agitación establecida a 200 rpm a 37 grados centígrados. A continuación, utilice un kit disponible comercialmente para aislar el ADN genómico o el ADN electrónico de 1,5 mililitros del cultivo nocturno de B. subtilis.
Para comprobar la calidad del ADN aislado, primero mezcle cinco microlitros del ADN gDNA aislado con un microlitro de color ante la carga de gel de ADN. A continuación, cargue la muestra en un gel de agarosa del 0,8%, que contenga un reactivo de tinción de ADN, como SYBR seguro o EtBr. Después de esto, cargue un estándar de masa molecular de una kilobase en el gel, y ejecute la electroforesis hasta que el tinte frontal esté aproximadamente a 0,5 centímetros de la parte inferior del gel. Una vez que la electroforesis de gel esté completa, visualice el gel en un transiluminador de luz azul. El ADNes debe aparecer como una banda gruesa, por encima de 10 kilobase de tamaño y tener un mínimo de manchas.
Después de esto, para crear diluciones en serie del ADN, etiquete tres tubos de microcentrífuga como 10X, 100X y 1000X. A continuación, utilice una pipeta para dispensar 90 microlitros de agua destilada estéril en cada uno de los tubos. A continuación, agregue 10 microlitros de la solución de ADN-a g al tubo 10X. Pipetear todo el volumen hacia arriba y hacia abajo para asegurarse de que la solución se mezcla a fondo. A continuación, retire 10 microlitros de la solución del tubo 10X y transfiera esto al tubo 100X. Mezcle la solución como se describió anteriormente. Finalmente, transfiera 10 microlitros de la solución en el tubo 100X, al tubo 1000X.
Para comenzar el protocolo PCR, descongelar los reactivos necesarios en el hielo. A continuación, prepare la mezcla maestra de PCR. Dado que la polimerasa de ADN está activa a temperatura ambiente, la reacción establecida debe producirse en el hielo. Aliquot 49 microlitros de la mezcla maestra en cada uno de los tubos PCR. Luego, agregue un microlitro de plantilla a cada uno de los tubos experimentales y un microlitro de agua estéril al tubo de control negativo, pipeteando hacia arriba y hacia abajo para mezclar. Después de esto, configure la máquina PCR de acuerdo con el programa descrito en la tabla. Coloque los tubos en el termociclador e inicie el programa.
Una vez completado el programa, examine la calidad de su producto a través de la electroforesis de gel de agarosa, como se ha demostrado anteriormente. Una reacción exitosa utilizando el protocolo descrito debe producir una sola banda de aproximadamente 1,5 kilobase. En este ejemplo, la muestra que contiene 100X de ADN adobloca diluido produjo un producto de la más alta calidad. A continuación, purificar el mejor producto PCR, en este caso, el 100X gDNA, con un kit disponible comercialmente. Ahora el producto PCR se puede enviar para la secuenciación.
En este ejemplo, el producto PCR se secuencia mediante imprimaciones directas e inversas. Así, se generan dos conjuntos de datos, cada uno con una secuencia de ADN y un cromatograma de ADN: uno para la imprimación delantera y el otro para la imprimación inversa. En primer lugar, examine los cromatogramas generados a partir de cada imprimación. Un cromatograma ideal debe tener picos espaciados uniformemente con pocas o ninguna señal de fondo.
Si los cromatogramas muestran picos dobles, es posible que haya varias plantillas de ADN presentes en los productos PCR y la secuencia debe descartarse. Si los cromatogramas contenían picos de diferentes colores en la misma ubicación, es probable que el software de secuenciación haya llamado mal los nucleótidos. Este error se puede identificar y corregir manualmente en el archivo de texto. La presencia de picos amplios en el cromatograma indica una pérdida de resolución, lo que provoca recuentos erróneos de los nucleótidos en las regiones asociadas. Este error es difícil de corregir y las discrepancias en cualquiera de los pasos subsiguientes deben tratarse como poco fiables. La mala calidad de lectura del cromatograma, indicada por la presencia de múltiples picos, generalmente ocurre en los cinco extremos primos y tres extremos principales de la secuencia. Algunos programas de secuenciación eliminan estas secciones de baja calidad automáticamente. Si la secuencia no se truncó automáticamente, identifique los fragmentos de baja calidad y elimine sus respectivas bases del archivo de texto.
Utilice un programa de ensamblaje de ADN para ensamblar las dos secuencias de imprimación en una secuencia continua. Recuerde, las secuencias obtenidas utilizando imprimaciones hacia adelante e inversas deben superponerse parcialmente. En el programa de ensamblaje de ADN, inserte las dos secuencias en formato FASTA en el cuadro correspondiente. A continuación, haga clic en el botón Enviar y espere a que el programa devuelva los resultados.
Para ver la secuencia ensamblada, haga clic en Contigs en la pestaña de resultados. A continuación, para ver los detalles de la alineación, seleccione detalles de ensamblaje. Navegue hasta el sitio web para obtener la herramienta básica de búsqueda de alineación local, o BLAST, y seleccione la herramienta blast de nucleótidos para comparar la secuencia con la base de datos. Escriba la secuencia en el cuadro de texto de la secuencia de consulta y seleccione la base de datos adecuada en el menú desplegable. Por último, haga clic en el botón BLAST en la parte inferior de la página y espere a que la herramienta devuelva las secuencias más similares de la base de datos.
En este ejemplo, el hit más alto es B. subtilis strain 168, mostrando 100% de identidad con la secuencia en la base de datos BLAST. Si el hit superior no muestra 100% de identidad a su especie o cepa esperada, haga clic en la secuencia que coincida más estrechamente con su consulta para ver los detalles de la alineación. Los nucleótidos alineados se unirán por líneas verticales cortas y los nucleótidos no coincidentes tendrán huecos entre ellos. Centrándose en las regiones no coincidentes identificadas, revise la secuencia y repita la búsqueda BLAST si lo desea.
La identificación de especies bacterianas es importante para diferentes investigadores, así como para aquellos en la atención médica. La secuenciación de arNM 16S fue utilizada inicialmente por los investigadores para determinar las relaciones filogenéticas entre las bacterias. Con el tiempo, se ha implementado en estudios metagenómicos para determinar la biodiversidad de muestras ambientales y en laboratorios clínicos como un método para identificar patógenos potenciales. Permite una identificación rápida y precisa de las bacterias presentes en las muestras clínicas, facilitando un diagnóstico más temprano y un tratamiento más rápido de los pacientes.
Earth is home to millions of bacterial species, each with unique characteristics. Identifying these species is critical in evaluating environmental samples. Doctors also need to distinguish different bacterial species to diagnose infected patients.
To identify bacteria, a variety of techniques can be employed, including microscopic observation of morphology or growth on a specific media to observe colony morphology. Genetic analysis, another technique for identifying bacteria has grown in popularity in recent years, due in part to 16S ribosomal RNA gene sequencing.
The bacterial ribosome is a protein RNA complex consisting of two subunits. The 30S subunit, the smaller of these two subunits, contains 16S rRNA, which is encoded by the 16S rRNA gene contained within the genomic DNA. Specific regions of 16S rRNA are highly conserved, due to their essential function in ribosome assembly. While other regions, less critical to function, may vary among bacterial species. The variable regions in 16S rRNA, can serve as unique molecular fingerprints for bacterial species, allowing us to distinguish phenotypically identical strains.
After obtaining a quality sample of gDNA, PCR of the 16S rRNA encoding gene can begin. PCR is a commonly used molecular biology method, consisting of cycles of denaturation of the double-stranded DNA template, annealing of universal primer pairs, which amplify highly conserved regions of the gene, and the extension of primers by DNA polymerase. While some primers amplify most of the 16S rRNA encoding gene, others only amplify fragments of it. After PCR, the products can be analyzed via agarose gel electrophoresis. If amplification was successful, the gel should contain a single band of an expected size, depending upon the primer pair used, up to 1500bp, the approximate length of the 16S rRNA gene.
After purification and sequencing, the obtained sequences can then be entered into the BLAST database, where they can be compared with reference 16S rRNA sequences. As this database returns matches based on the highest similarity, this allows confirmation of the identity of the bacteria of interest. In this video, you will observe 16S rRNA gene sequencing, including PCR, DNA sequence analysis and editing, sequence assembly and database searching.
When handling microorganisms, it is essential to follow good microbiological practice, including using aseptic technique and wearing appropriate personal protective equipment. After performing an appropriate risk assessment for the microorganism or environmental sample of interest, obtain a test culture. In this example, a pure culture of Bacillus subtilis is used.
To begin, grow your microorganism on a suitable medium in the appropriate conditions. In this example, Bacillus subtilis 168 is grown in LB broth overnight in a shaking incubator set to 200 rpm at 37 degrees Celsius. Next, use a commercially available kit to isolate genomic DNA or gDNA from 1.5 milliliters of the B. subtilis overnight culture.
To check the quality of the isolated DNA, first mix five microliters of the isolated gDNA with one microliter of DNA gel loading dye. Then, load the sample onto a 0.8% agarose gel, containing DNA staining reagent, such as SYBR safe or EtBr. After this, load a one kilobase molecular mass standard onto the gel, and run the electrophoresis until the front dye is approximately 0.5 centimeters from the bottom of the gel. Once the gel electrophoresis is complete, visualize the gel on a blue light transilluminator. The gDNA should appear as a thick band, above 10 kilobase in size and have minimal smearing.
After this, to create serial dilutions of the gDNA, label three microcentrifuge tubes as 10X, 100X, and 1000X. Then, use a pipette to dispense 90 microliters of sterile distilled water into each of the tubes. Next, add 10 microliters of the gDNA solution to the 10X tube. Pipette the whole volume up and down to ensure the solution is mixed thoroughly. Then, remove 10 microliters of the solution from the 10X tube and transfer this to the 100X tube. Mix the solution as previously described. Finally, transfer 10 microliters of the solution in the 100X tube, to the 1000X tube.
To begin the PCR protocol, thaw the necessary reagents on ice. Then, prepare the PCR master mix. Since the DNA polymerase is active at room temperature, the reaction set up must occur on ice. Aliquot 49 microliters of the master mix into each of the PCR tubes. Then, add one microliter of template to each of the experimental tubes and one microliter of sterile water to the negative control tube, pipetting up and down to mix. After this, set the PCR machine according to the program described in the table. Place the tubes into the thermocycler and start the program.
Once the program is complete, examine the quality of your product via agarose gel electrophoresis, as previously demonstrated. A successful reaction using the described protocol should yield a single band of approximately 1.5 kilobase. In this example, the sample containing 100X diluted gDNA yielded the highest quality product. Next, purify the best PCR product, in this case, the 100X gDNA, with a commercially available kit. Now the PCR product can be sent for sequencing.
In this example, the PCR product is sequenced using forward and reverse primers. Thus, two data sets, each containing a DNA sequence and a DNA chromatogram, are generated: one for the forward primer and the other for the reverse primer. First, examine the chromatograms generated from each primer. An ideal chromatogram should have evenly spaced peaks with little to no background signals.
If the chromatograms display double peaks, multiple DNA templates may have been present in the PCR products and the sequence should be discarded. If the chromatograms contained peaks of different colors in the same location, the sequencing software likely miscalled nucleotides. This error can be manually identified and corrected in the text file. The presence of broad peaks in the chromatogram indicates a loss of resolution, which causes miscounting of the nucleotides in the associated regions. This error is difficult to correct and mismatches in any of the subsequent steps should be treated as unreliable. Poor chromatogram reading quality, indicated by the presence of multiple peaks, usually occurs at the five prime and three prime ends of the sequence. Some sequencing programs remove these low quality sections automatically. If your sequence was not truncated automatically, identify the low quality fragments and remove their respective bases from the text file.
Use a DNA assembly program to assemble the two primer sequences into one continuous sequence. Remember, sequences obtained using forward and reverse primers should partially overlap. In the DNA assembly program, insert the two sequences in FASTA format into the appropriate box. Then, click the submit button and wait for the program to return the results.
To view the assembled sequence, click on Contigs in the results tab. Then, to view the details of the alignment, select assembly details. Navigate to the website for the basic local alignment search tool, or BLAST, and select the nucleotide BLAST tool to compare your sequence to the database. Enter your sequence into the query sequence text box and select the appropriate database in the scroll down menu. Finally, click the BLAST button on the bottom of the page, and wait for the tool to return the most similar sequences from the database.
In this example, the top hit is B. subtilis strain 168, showing 100% identity with the sequence in the BLAST database. If the top hit does not show 100% identity to your expected species or strain, click on the sequence which most closely matches your query to see the details of the alignment. Aligned nucleotides will be joined by short vertical lines and mismatched nucleotides will have gaps between them. Focusing on the identified mismatched regions, revise the sequence and repeat the BLAST search if desired.
Related Videos
Microbiology
127.9K Vistas
Microbiology
313.4K Vistas
Microbiology
131.6K Vistas
Microbiology
165.5K Vistas
Microbiology
187.6K Vistas
Microbiology
292.2K Vistas
Microbiology
93.3K Vistas
Microbiology
362.2K Vistas
Microbiology
185.5K Vistas
Microbiology
86.1K Vistas
Microbiology
38.0K Vistas
Microbiology
28.9K Vistas