Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

La base de datos ITS2

Published: March 12, 2012 doi: 10.3791/3806

Summary

La base de datos ITS2 es un banco de trabajo para la secuencia de inferencia filogenética y al mismo tiempo teniendo en cuenta la estructura secundaria del espaciador transcrito interno 2. Esto incluye la recopilación de datos con la anotación precisa, predicción de estructura, la alineación de secuencias múltiples de estructura y cálculo árbol de rápido. En pocas palabras, esta mesa de trabajo simplifica primeros análisis filogenéticos para unos pocos clics.

Abstract

El espaciador transcrito interno 2 (ITS2) se ha utilizado como un marcador filogenético durante más de dos décadas. Como ITS2 la investigación se centró principalmente en la secuencia ITS2 muy variable, que limita al este marcador de bajo nivel sólo filogenética. Sin embargo, la combinación de la secuencia ITS2 y su estructura altamente conservadas secundaria mejora la resolución filogenética 1 y permite la inferencia filogenética en filas múltiples, incluyendo taxonómicos delimitación especies 2-8.

La base de datos ITS2 9 presenta un conjunto de datos exhaustiva de los espaciadores internos transcritos 2 secuencias de NCBI GenBank con precisión reannotated 11 10. Después de una anotación Perfil de modelos ocultos de Markov (HMM), la estructura secundaria de cada secuencia se prevé. En primer lugar, se comprueba si un mínimo de energía en base doble 12 (directa veces) da como resultado una conformación correcta, de cuatro hélices. Si este no es el caso, la estructura espronosticado por el modelo de homología 13. En el modelado de homología, una estructura ya conocida secundaria se transfiere a otra secuencia ITS2, cuya estructura secundaria no fue capaz de doblar correctamente en un pliegue directa.

La Base de Datos ITS2 no sólo es una base de datos para almacenamiento y recuperación de la secuencia ITS2-estructuras. También proporciona varias herramientas para procesar sus propias secuencias ITS2, incluyendo la predicción de la anotación, estructural, la detección y el motivo de BLAST 14 de búsqueda de la combinación de secuencia-estructura de la información. Por otra parte, se integra versiones recortadas de 4SALE 15,16 y 17 ProfDistS para el cálculo de alineación de secuencias múltiples, estructura y Neighbor Joining 18 la reconstrucción del árbol. Juntos forman una tubería de análisis coherente de un conjunto inicial de secuencias de una filogenia basada en la secuencia y estructura secundaria.

En pocas palabras, esta mesa de trabajo simplifica los análisis filogenéticos de los primeros sólounos pocos clics de ratón, mientras que, además, proporcionar las herramientas y los datos globales para el análisis a gran escala.

Protocol

1. Anotación correcta de la secuencia ITS2

  1. Acceder a la mesa de trabajo de base de datos ITS2 filogenia aquí: http://its2.bioapps.biozentrum.uni-wuerzburg.de
  2. Comience su análisis haciendo clic en el "Anotar" icono en la sección "Herramientas". A continuación, escriba o pegue la secuencia en el editor de secuencias en la parte superior de la página web. El editor de secuencia comprueba automáticamente si sus secuencias ITS2 son válidos.
  3. Elija un modelo HMM adecuada para sus secuencias (por ejemplo, Viridiplantae para las plantas).
  4. Iniciar el proceso haciendo clic en "Anotar".
  5. Al pasar por la "hibridizar" icono puede ver una imagen de la 5.8S y 28S rRNA híbrida como una confirmación de la exactitud de la anotación del HMM.
  6. Haga clic en el signo más verde resultante de la secuencia ITS2 para seleccionar el modo de predicción de estructura secundaria: Para predecir la estructura sin templat conocidacorreo, haga clic en "Predecir la estructura." Si desea utilizar su propia plantilla para el modelado de homología, haga clic en "La estructura del modelo."

2. Predicción de estructura secundaria

  1. Predecir
    1. La secuencia ITS2 anotada automáticamente pegar en el editor de secuencias.
    2. Para iniciar la predicción de estructura secundaria con la configuración predeterminada, haga clic en el "predecir las estructuras de" botón.
    3. Guarde la secuencia ITS2 resultado incluyendo la estructura modelada secundaria en el pool de datos haciendo clic en el signo más verde y luego "Añadir a la piscina." Como alternativa, puede añadirlo a su banco de datos a través de arrastrar y soltar (Figura 1).
    4. Si la secuencia no podía doblar directamente, los mejores resultados de la homología de modelos se muestran. Guardar la más adecuada secuencia-estructura a través de arrastrar y soltar para el pool de datos. Como alternativa, guarde la secuencia-estructura en el banco de datos con un clic derecho y luego un clic en "Añadir a la piscina."
  2. Modelado personalizado
    1. Introduzca o pegue una o varias plantillas (con la estructura conocida) en el editor de secuencia superior.
    2. Introduzca o pegue una o varias secuencias diana (sin estructura) en el editor de secuencia inferior.
    3. Haga clic en "Predecir mejor plantilla (s)" para iniciar el modelado de homología con la configuración predeterminada.
    4. Las mejores plantillas de destino combinaciones se muestran en la lista resultante.
    5. Guarde el modelado secuencia-estructura (s) de su elección, ya sea a través de arrastrar y soltar para el pool de datos o mediante un clic derecho y un clic en "Añadir a la piscina."

3. Motivo Buscar

  1. Escriba o pegue la secuencia de la consulta (s) en el editor de secuencias en la parte superior de la página web.
  2. Elija el modelo HMM correcta (por ejemplo Viridiplantae para las plantas). 3,3. Haga clic en "búsqueda de motivos" para iniciar el proceso.
  3. ITS2 secuencias con motivos señalados son ilustradasTed en la parte inferior de la página web.
  4. Haga clic en el icono junto a la cabecera de la secuencia para mostrar los motivos señalados en la estructura secundaria.

4. Buscar y Navegar

  1. Buscar
    1. Tipo de un nombre de taxón o de un identificador de GenBank (GI) en el campo de búsqueda en la parte superior de la página web.
    2. Una búsqueda por el nombre de taxón es apoyado por una aparición en vivo cuadro de búsqueda.
    3. Usted puede realizar una búsqueda múltiple por comas para separar sus consultas.
    4. Haga clic en el botón "Buscar" para ejecutar la búsqueda.
    5. Sus resultados aparecen en una lista en una nueva pestaña.
    6. Haga clic en un nombre de columna para ordenar los resultados según la columna en particular. También puede agregar o quitar columnas de su elección con el menú de la columna. El menú de la columna se puede entrar con un clic en el icono de la flecha que aparece dentro de un nombre de columna.
    7. Haga clic en "Mostrar detalles" para ver los detalles de una secuencia-estructura. </ Li>
    8. Guarde la secuencia-estructura (s) de su elección, ya sea a través de arrastrar y soltar para el pool de datos o por un clic derecho y un clic en "Añadir a la piscina."
    9. Para guardar los resultados en un archivo externo, haga clic en "Guardar selección" o "Guardar todo".
  2. Navegar
    1. Examinar la base de datos ITS2 navegando a través de la estructura de árbol a la izquierda de la página web.
    2. Haga clic en el signo más para ver los taxones en un nivel inferior.
    3. Haga clic en el nombre del taxón para abrir una nueva pestaña que contiene cada secuencia-estructura del taxón.
    4. Haga clic en "Mostrar detalles" para ver los detalles de un par de secuencias-estructura.
    5. Guarde la secuencia-estructura (s) de su elección, ya sea a través de arrastrar y soltar para el pool de datos o por un clic derecho y un clic en "Añadir a la piscina."
    6. Para guardar los resultados en un archivo externo, haga clic en "Guardar selección" o "Guardar todo".

5. ITS2 Blast

  1. Escriba o pegue las secuencias de la consulta uno o varios en el editor de secuencias. Sus secuencias de pasos pueden ser simples secuencias de nucleótidos o pares de la estructura de la secuencia. También puede escribir varias estructuras secundarias por debajo de una secuencia. Al marcar la casilla "Serializar secuencias XXFASTA" estas estructuras se utilizan posteriormente como consultas individuales.
  2. Para iniciar BLAST con la configuración predeterminada, haga clic en "explosiva". Dependiendo de la naturaleza de la consulta, ya sea un BLASTN común o el BLAST secuencia ITS2-estructura se lleva a cabo.
  3. Una ficha de sub-se abre para cada secuencia de la consulta dentro de las pestañas que aparecen "Los resultados de BLAST", así como una visión general de las búsquedas realizadas.
  4. Haga clic en "Mostrar Alineaciones" para ver las alineaciones de BLAST calculados.
  5. Save the BLAST hits de su elección ya sea a través de arrastrar y soltar para el pool de datos o por un clic derecho y un clic en "Añadir a la piscina."
  6. Para guardar los resultados en un archivo externo, haga clic en "Guardar selección"O" Guardar todo ".

6. Secuencias múltiples estructura de alineación

  1. Echa un vistazo a tu reserva de los datos haciendo clic en "Administrar base de datos" y luego el símbolo de la lupa al lado del número de secuencias en su piscina. Alternativamente, puede hacer clic en el signo de pool de datos en la parte inferior izquierda de la página web.
  2. Haga clic en un par de secuencias-estructura en el banco de datos para ver sus detalles.
  3. Para crear una secuencia de múltiples estructura de alineación de todos los pares de la estructura de la secuencia en la piscina, haga clic en "Analizar conjunto de datos" y luego "la secuencia y estructura."
  4. Ahora se le pedirá que seleccione el modo gráfico de su alineación. Si la alineación contiene sólo unas pocas secuencias, rechazar el modo fino, haga clic en "No" De lo contrario elegir el modo gráfico delgada haciendo clic en "Sí".
  5. En algunos momentos, la alineación se muestra en una nueva pestaña (Figura 2). Por otra parte, se guarda automáticamente en el pool de datos.
  6. Para guardar ella alineación en un archivo externo, haga clic en "Guardar la alineación".

7. Árbol filogenético

  1. Para el cálculo de un vecino de secuencia basado en estructura de árbol de unión de la alineación múltiple, haga clic en "Analizar conjunto de datos" y luego "Neighbor Joining".
  2. El árbol resultante se ilustra en una nueva pestaña (Figura 3).
  3. Escalar el árbol libremente con la barra de desplazamiento "árbol de Zoom."
  4. Reroot su árbol haciendo clic en un nodo o una hoja del árbol y luego "Reroot en este nodo."
  5. Si desea eliminar un taxón de su banco de datos, haga clic en la hoja y elegir la opción "Eliminar este nodo de la piscina." Ahora usted puede recalcular su alineación y árbol con el taxón de muestreo reducido.
  6. Haga clic en "árbol de Guardar" para guardar el árbol filogenético como un resultado final de su análisis a un archivo externo NEWICK.

8. Software adicional

  1. Haga clic en "Acerca de este sitio web" - "Herramientas" para encontrar más informar ación sobre la 4SALE independiente herramientas y ProfDistS.
  2. Además de la alineación y la función Vecino Participar proporcionado por la interfaz de base de datos web ITS2, ahora se puede acceder a varias funciones nuevas, la delimitación especies, por ejemplo sobre la base de cambios de bases compensatorias (CBC).

9. Los resultados representativos

El flujo de trabajo como se describe anteriormente ha aplicado con éxito en varios estudios de acceso abierto 3,4. Ejemplos pueden ser vistos a través de los siguientes enlaces:

En estos estudios a gran escala, hemos sido capaces de resolver la filogenia de Chlorophyta, así como Hypnales (Bryophyta) walta resolución i. En ambos casos, un taxón de muestreo exhaustivo se obtuvo de la base de datos ITS2 9, alinea automáticamente con 4SALE 15,16 y por último procesado por ProfDistS 17 en un árbol filogenético. En todos estos pasos, la secuencia y estructura de la información se utilizaron de forma simultánea. Manos a la Obra de apoyo para la columna vertebral filogenético se logró utilizando Vecino perfil de junta (PNJ) 19, que está disponible en la versión independiente de ProfDistS.

Para un conjunto más pequeño de los pares de la estructura de la secuencia, las figuras 1 a 3 describen los principales pasos de este flujo de trabajo automatizado 5 directamente en el banco de trabajo de base de datos nueva ITS2: taxón de muestreo, la alineación de secuencias múltiples de estructura y, finalmente, el cálculo de árboles filogenéticos.

Figura 1
Figura 1. Taxón de muestreo por arrastrar y soltar. En las secuencias de tiempo o secuencia de estruc- pares electrónicos se pueden añadir a los datos existentes, por ejemplo a través de arrastrar y soltar. Aquí una secuencia-estructura se añade la función de arrastrar y soltar después de la predicción de estructura secundaria. El azul elipse indica el lugar donde se coloca la secuencia-estructura en el banco de datos. Haga clic aquí para ver la versión en tamaño completo de esta imagen.

Figura 2
Figura 2. Múltiples secuencia-estructura de la alineación en el modo gráfico completo. Para las secuencias en la piscina de datos, el modo gráfico completo fue elegido. Las bases son de color, de pares de bases se pueden resaltar con círculos rojos haciendo clic en una base o soporte de un par de bases. Haga clic aquí para ver la versión en tamaño completo de esta imagen.

3.jpg "alt =" Figura 3 "/>
Figura 3. Secuencia de la estructura Vecino Participar árbol. El árbol libremente escalable calculado de un total de siete taxones múltiples secuencia-estructura de la alineación se pueden guardar en el formato Newick.

Discussion

La base de datos ITS2 es un banco de trabajo completo y totalmente funcional para los internos transcritos de separación de 2 secuencia-estructura-base filogenética. El sitio web puede funcionar muy rápido y de manera intuitiva. Mientras que otros bancos de trabajo basados ​​en la web filogenia como ARB 20 o 21 Mobyle sólo son capaces de trabajar en la secuencia y / o información de la estructura de consenso, la base de datos ITS2 9 considera secuencias y estructuras secundarias individuales para cada taxón al mismo tiempo. Sin embargo, debido a las limitaciones en la capacidad computacional del servidor web, se recomienda utilizar las herramientas independientes para el alineamiento múltiple y Neighbor Joining 18 de cálculo, 4SALE 15,16 y ProfDistS 17, respectivamente, para grandes conjuntos de datos. Al lado de la base de flujo de trabajo ITS2 filogenia de la secuencia de la estructura 5, estas herramientas cuentan con varias funciones adicionales, como el cálculo de repeticiones de arranque, perfil de junta de vecinos (PNJ) 19 o especiedelimitación s sobre la base de cambios de bases compensatorias (CBC) 8. Se puede acceder a través de la "Acerca de este sitio web" - "Herramientas" para su descarga e información detallada. Para utilizar 4SALE y ProfDistS, que es necesario llevar siempre los archivos en el formato correcto. Un taxón de muestreo para ser procesado por 4SALE debe tener el final. FASTA o. Txt, mientras que la alineación de secuencias-estructura como un insumo para ProfDistS debe terminar con. Xfasta.

Actualmente estamos implementando métodos alternativos para la reconstrucción del árbol filogenético de la base de datos ITS2, así como en las herramientas relacionadas. Por lo tanto, los métodos, como la secuencia de la estructura basada en parsimonia máxima 22 y / o de máxima verosimilitud 23 se podrá acceder en el futuro.

Disclosures

No hay conflictos de interés declarado.

Acknowledgments

Le damos una cordial agradecimiento al grupo de ITS2, Biocenter, Universidad de Würzburg, para la retroalimentación rica y valiosa. También agradecemos a la Deutsche Forschungsgemeinschaft (DFG; Mu-2831/1-1 subsidio) para su financiación.

Materials

Name Company Catalog Number Comments
Internet access Preferably high-speed
ITS2 Database9 University of Warzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 University of Warzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 University of Warzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

DOWNLOAD MATERIALS LIST

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Tags

Genética Número 61 la alineación espaciador transcrito interno 2 la sistemática molecular la estructura secundaria ARN ribosomal árbol filogenético modelado por homología filogenia
La base de datos ITS2
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Merget, B., Koetschan, C., Hackl,More

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter