March 12th, 2012
La base de datos ITS2 es un banco de trabajo para la secuencia de inferencia filogenética y al mismo tiempo teniendo en cuenta la estructura secundaria del espaciador transcrito interno 2. Esto incluye la recopilación de datos con la anotación precisa, predicción de estructura, la alineación de secuencias múltiples de estructura y cálculo árbol de rápido. En pocas palabras, esta mesa de trabajo simplifica primeros análisis filogenéticos para unos pocos clics.
El espaciador interno transcrito dos genes ribosómicos o I TS dos es uno de los marcadores más importantes en sistemática molecular. La investigación de los últimos 20 años se ha centrado principalmente en la explotación de las dos secuencias I T para la reconstrucción filogenética. Sin embargo, la estructura secundaria de I TS dos se está utilizando cada vez más en el campo de la inferencia filogenética debido a varias razones.
El análisis de la estructura secundaria amplía la aplicabilidad taxonómica de este marcador, mientras que la secuencia I TS dos, que evoluciona rápidamente y, por lo tanto, es muy variable, es principalmente adecuada para el análisis filogenético a nivel de especie o inferior. La adición de información estructural permite el análisis en un rango taxonómico más alto simultáneamente debido a las dos estructuras secundarias fuertemente conservadas que consisten en sus cuatro características características. Por lo tanto, los resultados del análisis de estructuras secundarias pueden mejorar la resolución filogenética obtenida de la secuencia primaria.
Bienvenidos, queridos colegas, mi nombre es Matthias Wolf. Llevo unos ocho años trabajando en la segunda prueba. Estoy trabajando aquí en el Departamento de Bioinformática del biocentro de la Universidad de Würzburg en Alemania.
Hoy nos gustaría presentarles una pequeña película sobre cómo usar la base de datos I ts two. Hola, soy y Chu. La razón de esa película es que la base de datos I Ts two no es de hecho solo una base de datos para almacenamiento, sino que también proporcionamos muchas herramientas que le permiten mejorar su análisis filogenético.
En este vídeo, queremos mostrarte cómo trabajar con estas herramientas y cómo conectarlas todas entre sí. Correcto. La delineación de la secuencia de dos I Ts puede ser crucial para la predicción de la estructura. Por lo tanto, se ha implementado una interfaz basada en web para la anotación basada en el modelo de markoff oculto.
Para lograr una anotación correcta de sus dos secuencias de I Ts, puede pegarlas en el editor de secuencias en la parte superior del sitio web. Esto se demuestra cargando las secuencias de ejemplo de los planes. El propio editor de secuencias comprueba si las dos secuencias I TS son válidas o no, y emite mensajes de error.
Por ejemplo, cuando se utilizan caracteres que no son PAC Después de elegir el HMM correcto, se puede iniciar el proceso haciendo clic en anotar cada 5.8 s y se eliminan los 28 SRNA que podrían ser identificados por el programa, dejando las dos secuencias correctamente anotadas, que se encontraban en el medio. Como resultado, se muestran dos secuencias delimitadas de I TS, así como el híbrido predicho de 5,8 s y 28 S-R-R-N-A. Como confirmación de la exactitud de las anotaciones HMM después de la anotación de dos secuencias recién retenidas, las estructuras secundarias pueden determinarse por dos medios.
La primera predicción se puede lograr mediante el modelado de homología con el conjunto completo de secuencias y estructuras de la base de datos que sirven como plantillas. Para predecir la estructura de su anotado, sus dos secuencias, haga clic en predecir estructura. Si sus dos secuencias de la derecha pueden plegarse directamente en la estructura secundaria típica de dos, el resultado se representa de inmediato.
Ahora puede elegir entre varias opciones para procesar aún más su estructura de secuencia, incluida la adición a su grupo de datos. Si su derecho aquí, dos secuencias no se pueden plegar directamente, se realiza una búsqueda masiva en la base de datos. La página resultante muestra los mejores impactos de explosión, incluido el modelado de homología para cada plástico como plantilla.
Con un clic en el signo más se muestran los detalles, puede seleccionar los pares de estructura de secuencia de su elección y agregarlos al grupo de datos, ya sea por pista y suelta o usando el menú contextual con el clic derecho. Un segundo enfoque consiste en introducir manualmente una o varias secuencias, incluidas sus estructuras secundarias como plantillas, para transferir las estructuras secundarias más adecuadas a las secuencias de consulta. Esto se demuestra cargando el archivo de ejemplo para varias plantillas.
Al hacer clic en Predecir las mejores plantillas, realiza el modelado de homología con la configuración predeterminada. El programa de modelado de homología calculará todo contra todas las estructuras y mostrará las mejores combinaciones de plantillas de consulta. En la tabla resultante, puede ver qué plantillas podrían usar correctamente su estructura secundaria para modelar una o varias secuencias de consulta.
Una vez más, los detalles de los resultados se pueden abrir con un clic en el signo más, ya que el enfoque completo del modelado de homología es independiente del I TS dos. Se puede utilizar para predecir la estructura secundaria de cualquier ARN dada una molécula homóloga con una estructura conocida. Además, los pares de estructura de secuencia resultantes se pueden agregar al grupo de datos por arrastrar y tr o a través del menú contextual, que se abre con el clic derecho.
Además de la estructura general, se han descrito motivos conservados como la secuencia A-U-G-G-U que precede al vértice de la tercera hélice y una pirámide perinal en desajuste en la segunda hélice para el I TS dos. Este desajuste UU está rodeado por dos motivos, uno a la izquierda de la hélice dos y otro a la derecha entre la hélice dos y tres con un nucleótido triple A adicional. Habiendo transformado estos motivos de secuencia en hms, ahora proporcionamos la identificación de estos motivos en secuencias de interés.
Para buscar estos motivos, introduzca su secuencia de consulta en el campo de búsqueda y elija el modelo correcto. De nuevo, esto se demuestra cargando el archivo de ejemplo para los planes. Para iniciar los cálculos, haga clic en búsqueda de motivos.
Encontrado: Dos motivos se anotan y se resaltan en las secuencias de consulta. Una posibilidad de recuperar dos pares de estructuras de secuencia de la base de datos I Ts dos es la función de búsqueda. Permite al usuario buscar estructuras de secuencia, ya sea por nombre de taxón o por identificador de banco de genes.
Para buscar una estructura de secuencia por identificador de GenBank, escriba el GI en el campo de búsqueda y haga clic en buscar. Aparecerá una lista de visitas en una nueva pestaña. Puede ver los detalles de una estructura de secuencia haciendo clic en mostrar detalles.
Además, puede mostrar las direcciones de secuencia S de todos los hits dentro de la pestaña haciendo clic en mostrar estructura de secuencia por arrastrar y soltar, o a través del menú contextual con un clic derecho, las estructuras de secuencia de elección se pueden agregar al grupo de datos. Además de la búsqueda de pares de estructuras de secuencia por gi, puede escribir un nombre de taxón en el campo de búsqueda, que está respaldado por un cuadro de búsqueda en vivo que aparece. Después de que aparezca la nueva pestaña con una lista de todos los hits, puede acceder a las mismas funciones que antes.
Por ejemplo, agregar selección al grupo de datos mediante arrastrar y soltar. La segunda posibilidad de recuperar pares de estructuras de secuencia de la base de datos es la función de exploración. Aquí, los textos son variados.
Según la base de datos de taxonomía del NCBI, se puede acceder a los datos a través de la estructura en forma de árbol. A la izquierda del sitio web. Con el clic en el signo más, puede mostrar el texto un nivel debajo.
Con un clic en el nombre de un taxón, se abre una nueva pestaña que contiene cada estructura de secuencia, par del taxón. Además de la búsqueda de secuencias y estructuras con identificadores de bancos CEM o información sobre especies, la base de datos I Ts two también proporciona una búsqueda basada en voladuras. Sin embargo, los procedimientos de voladura destacados a menudo no pueden identificar una relación lejana.
Es decir, dos secuencias debido a la alta divergencia de secuencias. Para superar este obstáculo, hemos implementado una búsqueda de voladura basada en secuencias y estructuras que incluye información sobre la estructura altamente conservada para la búsqueda de homología. Esto se hace traduciendo la estructura de la secuencia en una secuencia de pseudoproteínas de 12 letras.
Por lo tanto, el muestreo de especies que comienza con cualquier secuencia de interés y cobertura. Los amplios rangos taxonómicos se han vuelto tan simples como una búsqueda masiva. Para realizar una búsqueda masiva, puede escribir las secuencias de consulta en el editor de secuencias.
Si la secuencia de consulta es una secuencia de nucleótidos simple sin estructura, se utiliza un algoritmo blast n común para las secuencias, incluidas sus estructuras secundarias. La interfaz web utiliza el algoritmo I Ts two blast. Inicie el proceso haciendo clic en blast.
Después de unos momentos, tus golpes explosivos se enumeran en un nuevo toque. Aquí verá un toque para cada secuencia de consulta. Con el clic en mostrar alineaciones, puede desplazarse por las alineaciones de yeso. Como antes, puede seleccionar los pares de estructuras de secuencia de su elección y ponerlos en el grupo de datos.
Durante su trabajo en la base de datos ITS dos, su grupo de datos puede haberse llenado con varias estructuras de secuencia. Puede acceder a su grupo de datos en cualquier momento y mostrar su contenido. El siguiente paso de su análisis es la alineación de la estructura de secuencia múltiple.
Haga clic en analizar conjunto de datos y, a continuación, en secuencia y estructura para realizar la alineación de la estructura de secuencia. Ahora, se le pide que seleccione el modo gráfico de su alineación. Para un conjunto grande de secuencias, se recomienda seleccionar la versión delgada.
Dado que nuestro grupo de datos solo contiene unas pocas estructuras de secuencia, elegimos el modo gráfico completo. Una vez completado el cálculo, la alineación se agrega al grupo de datos. Al resaltar un lado de un par de bases, se resalta automáticamente su contraparte.
Finalmente, la alineación puede ser segura con un clic en alineación segura. Una vez que esté satisfecho con la calidad de la alineación de la estructura de su secuencia, puede calcular un árbol de unión de vecinos filogenéticos haciendo clic en analizar conjunto de datos y, a continuación, en vecino. La unión al árbol resultante aparece en una nueva pestaña.
Puede escalar su árbol libremente usando la barra de desplazamiento, redirigir su árbol haciendo clic en un nodo u hoja arbitrario del árbol y luego redirigir en este nodo. Si desea eliminar un taxón de su grupo de datos, haga clic en la hoja y elija. Quite este nodo del grupo.
Ahora puede recalcular su alineación y árbol con un muestreo de taxones reducido con un clic en árbol seguro. Puede guardar su árbol filogenético en formato NU. Haga clic en sobre este sitio web y luego en herramientas para encontrar información adicional sobre las herramientas independientes a la venta y profesionales.
Además de la alineación en la función de unión de vecinos, como también proporciona la interfaz web de la base de datos I Ts two, ahora puede acceder a varias funciones nuevas, por ejemplo, la limitación de especies Del basada en cambios compensatorios. En los últimos minutos, hemos querido mostrarte algunos trucos para mejorar tu análisis filogenético. Le mostramos cómo recopilar sus datos de la base de datos I Ts dos, alinearlos con cuatro celdas y finalmente calcular sus árboles con Pro S.In todos estos pasos, no solo consideramos la secuencia, sino también la secuencia y la estructura. Seguro.
Esperamos que hayas disfrutado de nuestra pequeña película y de la construcción de árboles pesados. Buenas noches.
La base de datos ITS2 sirve como una herramienta integral para el análisis filogenético, integrando datos de secuencia e información de estructura secundaria del espaciador transcrito interno 2 (ITS2). Facilita la anotación precisa, la predicción de estructura y la alineación, simplificando el proceso de análisis filogenético.