$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
StickWRLD se ha utilizado anteriormente para detectar dependencias de interposición (IPDS) entre los residuos en ambos ADN y la proteína 3 15-17 alineaciones. Estos residuos co-evolución, mientras que a menudo distal uno de otro en la secuencia de alineación, son a menudo proximal uno al otro en la proteína plegada. StickWRLD permite un rápido descubrimiento de residuos específicos de co-ocurrencia en dichos sitios, por ejemplo., Una alanina en la posición "x" está fuertemente correlacionada con una treonina en la posición "y". Estas correlaciones pueden ser indicativos de relaciones estructurales demostrables, y por lo general son los sitios que, por necesidad, co-evolucionan. StickWRLD es capaz de detectar estas relaciones, incluso cuando más "tradicional" enfoques utilizando HMMs para describir motivos fallan. Por ejemplo, el análisis de la alineación del dominio PFAM tapa ADK usando StickWRLD revela una fuerte correlación positiva entre las cisteínas (C) en las posiciones 4 y 8 y un coordinadapar de C en las posiciones 35 y 38. Al mismo tiempo, StickWRLD mostró una fuerte relación positiva similar entre histidina (H) y serina (S) a las 4 y 8, con unas fuertes relaciones negativas entre estos y el cuarteto C a 4, 8, 35 y 38, y una fuerte relación positiva con ácido aspártico (D) y treonina (T) en las posiciones 35 y 38 respectivamente. Existen IPDs adicionales entre la H, S, D, T motivo y una T y G en la posición 10 y 29 **** en B subtilis **** destacando el carácter condicional de estas IPDs - el motivo tetracisteína no lo hace "cuidado" acerca de las identidades de estas dos posiciones, mientras que el H hidrófila, S, D, T tríada requiere residuos específicos en estas posiciones casi absolutamente. Estos dos motivos residuos dependientes de la posición completamente diferentes pueden cumplir el mismo papel que la tapa ADK. Como puede verse en la Figura 6, un gran grupo de IPDs, incluyendo una asociación de 3-nodo entre G (glicina) en la posición 132, Y (tirosina) en la posición 135, y un P (Proline) en la posición 141, es visible en primer plano (Figura 6A). En la Figura 6B, la vista ha sido sesgada para posicionar al usuario un poco por encima del cilindro, revelando una IPD entre un H (histidina) en la posición 136 y una M (metionina) en la posición 29, 107 residuos distante. Un motivo derivado de HMM PFAM del mismo dominio (Figura 2), por su parte, no sólo no detecta estos como específicamente variantes co-ocurrentes motivo, pero también define los grupos globales en un esquema biológicamente no soportado 16.

Figura 1. "Subway Mapa" representación de la B. subtilis adenosina quinasa estructura de dominio (ADK) Tapa. Las flechas indican IPDs identificados en la alineación de PFAM dominio Tapa ADK por StickWRLD. StickWRLD es capaz de identificar correctamente IPDs dentro de un clúster of residuos que se encuentran en las proximidades de la proteína plegada. De particular interés son la T y G par en las posiciones 9 y 29, que sólo forman una IPD cuando la tétrada de residuos en 4, 7, 24, y 27 no es C, C, C, C). Número de residuos que se muestra representa B. subtilis posiciones de alineación posición y no PFAM. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2. Skylign 18 Hidden Markov Model (HMM) Logo Secuencia del dominio tapa ADK. Mientras HMMs son herramientas poderosas para determinar las probabilidades en cada posición, así como la contribución de cada sitio al modelo general, la independencia posicional de HMMs los hace inadecuado para la detección de IPDs. Este modelo no sugiere ninguna de lasdependencias visto en las representaciones StickWRLD (Figura 6). Haga clic aquí para ver una versión más grande de esta figura.

Figura 3. El cargador de datos StickWRLD. Los usuarios pueden elegir a partir de datos de demostración existentes o cargar sus propios datos en forma de secuencia de ADN o de proteínas alineaciones.

Figura 4. La ventana Control StickWRLD. El panel de control permite al usuario cambiar varias propiedades de la vista, así como regular los umbrales que controlan la visualización de líneas de borde que indican las relaciones entre los residuos (IPDS). Un círculo en rojo son los valores predeterminados que normalmente necesitan t o ajustarse para optimizar la visión de cualquier conjunto de datos. El valor residual establece el umbral de (esperado observados) para los que se dibujan líneas conector / asociación. Los controles para la columna y Bolas etiquetas controlan si la posición de la columna y los valores de residuos (por ejemplo, "A" para arginina) se muestran. Las palancas de control de la línea de borde de columna dentro y fuera de la pantalla de líneas de borde de conexión columnas - para los conjuntos de datos densos Esto es mejor apagados. Los controles de espesor de la columna si la columna en sí o no se muestra -. Ajuste a un valor muy pequeño (por ejemplo, 0,1) se traza una línea a través de las esferas de la columna, por lo que es fácil distinguir las columnas entre sí por favor haga clic aquí para ver una versión más grande de esta figura.
ghres.jpg "width =" 600 "/>
Figura 5. Vista inicial de la ventana StickWRLD OpenGL con la adenilato quinasa dominio tapa conjunto de datos proteína cargada. La perspectiva inicial se ve "abajo" a través del cilindro compuesto por las posiciones de alineación de secuencias. El usuario puede girar el cilindro utilizando izquierda-clic del ratón y arrastre, y hacer zoom in / out usando el botón derecho del ratón, haga clic y arrastre. La vista inicial es bastante denso porque la pantalla por defecto muestra incluso pequeñas tasas de co-evolución. Para muchas proteínas, en esta configuración, módulos distintos pueden ser detectados, pero incluso en densamente co-evolución de las proteínas de la pantalla se puede simplificarse con rapidez y de forma interactiva para encontrar los IPDs más importantes utilizando la interfaz StickWRLD. Haga clic aquí para ver una versión más grande de esta figura.
ghres.jpg "width =" 700 "/>
Figura 6. Vista de cerca de una visualización StickWRLD de la proteína de dominio tapa adenilato quinasa. Aquí hemos cambiado el valor por defecto residual a 0,2. Esto aumenta el umbral para la visualización de los bordes inter-residuos, mostrando un menor número de bordes. Los bordes que quedan indican IPDs fuertemente asociados. Además de la vista se ha girado y ampliada para permitir una mejor visualización de los bordes. (A) Un gran grupo de IPDs es visible en el primer plano, incluyendo una asociación de 3-nodo entre G (glicina) en la posición 132, Y (tirosina) en la posición 135, y un P (prolina) en la posición 141. (B) La vista ha sido sesgada para posicionar al usuario un poco por encima del cilindro, revelando una IPD entre un H (histidina) en la posición 136 y una M (metionina) en la posición 29, 107 residuos lejano. Por favor, haga clic aquí para ver una versión más grande de esta figura.

Figura 7. Ventana Control StickWRLD inferior derecha vista de información. CTRL + clic izquierdo sobre un objeto (por ejemplo, la esfera o borde) en la ventana OpenGL muestra la información para el objeto en la parte inferior derecha de la ventana de Control StickWLRD. Aquí vemos la información para un borde IPD entre una metionina en la posición 29 y una histidina en la posición 136.