$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
StickWRLD foi usado anteriormente para detectar dependências de interposição (DIP) entre os resíduos em ambos os 3 DNA e proteínas 15-17 alinhamentos. Estes resíduos de co-evolução, enquanto muitas vezes distai de uma outra no alinhamento de sequências, são muitas vezes proximal para uma outra na proteína dobrada. StickWRLD permite a rápida descoberta de co-ocorrência específica do resíduo em tais locais, por exemplo., Uma alanina na posição "X" é fortemente correlacionada com uma treonina na posição de "y". Estas correlações podem ser indicativos de relações estruturais demonstráveis, e tipicamente são os locais que, por necessidade, co-evoluem. StickWRLD é capaz de detectar esses relacionamentos, mesmo quando mais "tradicional" abordagens usando HMMs para descrever motivos falhar. Por exemplo, a análise do alinhamento PFAM do domínio ADK tampa usando StickWRLD revela uma forte correlação positiva entre cisteínas (C) nas posições 4 e 8 e uma coordenadapar de C nas posições 35 e 38. Ao mesmo tempo, StickWRLD mostrou uma forte relação positiva semelhante entre histidina (H) e serina (S), a 4 e 8, com fortes relações negativas entre estes eo quarteto C a 4, 8, 35, e 38, e uma forte correlação positiva com o ácido aspártico (D) e treonina (T) nas posições 35 e 38, respectivamente. Existem IPDs adicionais entre o H, S, D, T motivo e uma T e G na posição **** 10 e 29 em subtilis b **** destacando o carácter condicional destas IPDs - o motivo tetraciste�a não "cuidado" sobre as identidades nessas duas posições, enquanto o H hidrofílico, S, D, T tríade exige que os resíduos específicos nestas posições quase absolutamente. Estes dois motivos resíduos dependente da posição completamente diferente pode cumprir o mesmo papel a tampa ADK. Como pode ser visto na Figura 6, um grande aglomerado de DIP, incluindo uma associação de 3-nó entre G (glicina) na posição 132, Y (tirosina) na posição 135, e um P (ProLiNE) na posição 141, é visível no primeiro plano (Figura 6A). Na Figura 6B, o ponto de vista tem sido desviada para posicionar o utilizador ligeiramente acima do cilindro, revelando uma IPD entre um H (histidina) na posição 136 e um M (metionina) na posição 29, 107 resíduos distante. Um motivo PFAM HMM-derivado do mesmo domínio (Figura 2), por sua vez, não só não detecta estes como especificamente variantes motivo co-occuring, mas também define os grupos globais em um esquema biologicamente sem suporte 16.

Figura 1. "Subway Map" representação do B. subtilis adenosina quinase estrutura de domínio (ADK) Lid. As setas indicam IPDs identificados no alinhamento PFAM de ADK domínio Lid por StickWRLD. StickWRLD é capaz de identificar corretamente IPDs dentro de um cluster oresíduos de f que estão em estreita proximidade na proteína dobrada. De particular interesse são os pares T e G nas posições 9 e 29, que formam apenas uma DIP, quando o tétrade de resíduos em 4, 7, 24, e 27 não seja C, C, C, C). Números dos resíduos apresentada representa B. subtilis posições de alinhamento de posição e não Pfam. Por favor clique aqui para ver uma versão maior desta figura.

Figura 2. Skylign 18 Hidden Markov Model (HMM) Logo Seqüência para o domínio ADK tampa. Enquanto HMMs são ferramentas poderosas para determinar as probabilidades em cada posição, bem como a contribuição de cada site para o modelo global, a independência posicional de HMMs torna- inadequados para detectar IPDs. Este modelo não sugerir qualquer um dosdependências visto nas representações StickWRLD (Figura 6). Por favor clique aqui para ver uma versão maior desta figura.

Figura 3. O StickWRLD Data Loader. Os usuários podem escolher a partir de dados de demonstração existentes ou carregar os seus próprios dados na forma de DNA ou sequência de proteína alinhamentos.

Figura 4. A janela Controle de StickWRLD. O painel de controle permite ao usuário alterar várias propriedades de vista, bem como regular os limiares que controlam a exibição de linhas de bordo, indicando relações entre resíduos (DIP). Circulado em vermelho são os padrões que normalmente precisam de t o ser ajustado para uma melhor visualização de qualquer conjunto de dados. O valor residual define o limiar de (observado o esperado) para os quais linhas conector / associação são desenhados. Os controles para Rótulos de coluna e Bola de controlar ou não a posição da coluna e os valores de resíduos (por exemplo, "A" para a arginina) são exibidos. A coluna de borda alterna controle de linha e fora da exibição de linhas de borda conectando colunas - para conjuntos de dados densos isso é melhor desligado. Os controles de coluna de espessura ou não a própria coluna é exibida -. Definir este para um valor muito pequeno (por exemplo, 0.1) irá desenhar uma linha através das esferas na coluna, tornando-se fácil distinguir as colunas de um outro favor clique aqui para ver uma versão maior desta figura.
"width =" 600 ghres.jpg "/>
Figura 5. visão inicial da janela StickWRLD OpenGL com o domínio tampa conjunto de dados proteína adenilatoquinase carregado. A perspectiva inicial olha "para baixo" através do cilindro composto pelas posições de alinhamento de sequências. O usuário pode girar o cilindro usando esquerdo do mouse clique e arraste, e zoom in / out usando botão direito do mouse clique e arraste-. A visão inicial é bastante densa, porque a exibição padrão mostra mesmo pequenas taxas de co-evolução. Para muitas proteínas, nesta configuração, módulos distintos podem ser detectados, mas mesmo em densamente co-evoluindo proteínas a tela pode ser rapidamente e de forma interativa simplificados para encontrar as DIP mais importantes usando a interface StickWRLD. Por favor clique aqui para ver uma versão maior este valor.
"width =" 700 ghres.jpg "/>
Figura 6. Opinião do close up de uma visualização StickWRLD da proteína domínio tampa adenilatoquinase. Aqui nós mudamos o padrão residual para 0,2. Isto aumenta o limiar para a exibição de arestas de inter-resíduos, mostrando menos arestas. As arestas que permanecem indicam IPDs fortemente associados. Além disso, o ponto de vista tem sido rodado e ampliado para permitir uma melhor visualização das bordas. (A) Um grande conjunto de DIP é visível no primeiro plano, incluindo uma associação de 3-nó entre G (glicina) na posição 132, Y (tirosina) na posição 135, e um P (prolina) na posição 141. (B) A vista foi desviada para posicionar o usuário ligeiramente acima do cilindro, revelando uma IPD entre um H (histidina) na posição 136 e um M (metionina) na posição 29, 107 resíduos distante. Por favor clique aqui para ver uma versão maior desta figura.

Figura 7. Janela do Controle StickWRLD inferior direito vista da informação. CTRL + clique esquerdo em um objeto (por exemplo, esfera ou ponta) na janela de OpenGL exibe as informações para o objeto no canto inferior direito da janela do Controle StickWLRD. Aqui vemos a informação para uma vantagem IPD entre uma metionina na posição 29 e uma histidina na posição 136.