July 16th, 2017
É apresentado um protocolo para a investigação on-line sobre a relação proteína-estrutura-dinâmica usando Bio3D-web.
O objetivo geral do Bio3D-web é permitir a análise interativa da sequência, estrutura e diversidade de confirmação de famílias de proteínas. Bio3D-web é um novo aplicativo da web que pode nos ajudar a entender as relações entre sequência, estrutura e dinâmica dentro de grandes famílias de proteínas. A principal vantagem do Bio3D-web é que ele fornece análise on-line interativa e reprodutível de sequência, estrutura e dinâmica, não exigindo nenhum conhecimento prévio de programação por parte do usuário.
Para inserir uma estrutura para análise, obtenha o ID PDB da adenilato quinase pesquisando no banco de dados de proteínas. Insira o ID PDB de quatro caracteres para adenilato quinase ou cole uma sequência de proteínas na caixa de texto da estrutura de entrada ou do painel de sequência. Clique no botão azul de seleção de acerto seguinte no primeiro painel ou simplesmente role para baixo até a seleção de acerto do painel B para uma análise mais aprofundada.
Certifique-se de que o controle deslizante limitar o número total de estruturas incluídas esteja definido como seu valor máximo para incluir todas as estruturas acima do corte. Reduza o limite de inclusão do BitScore para incluir ocorrências mais distantes ou aumente-o para excluir. Certifique-se de que as ocorrências selecionadas representem estruturas relevantes inspecionando detalhes da tabela, como nome do PDB, espécies e ligantes ligados.
Clique na guia alinhar para executar o alinhamento de sequência das estruturas selecionadas na guia de pesquisa. Há um surgimento potencial de erros de alinhamento, especialmente ao analisar proteínas mais distantes, como quando a similaridade da sequência está abaixo de 30%Sempre verifique e corrija o alinhamento da sequência na guia de alinhamento. Revise o resumo do alinhamento no painel Um resumo do alinhamento.
Certifique-se de que as regiões de interesse estejam alinhadas e não mascaradas por lacunas em uma ou mais estruturas. Clique no botão azul Próxima análise para executar a análise de agrupamento baseada em sequência das estruturas coletadas. Em seguida, clique no botão azul de próxima conservação para calcular a conservação de resíduos em colunas.
Selecione os conjuntos de estruturas alinhadas para gerar uma plotagem da conservação de resíduos em cada posição de alinhamento. Execute a sobreposição da estrutura inserindo a guia de ajuste. Certifique-se de que as estruturas das proteínas estejam sobrepostas às regiões correspondentes e relevantes por inspeção visual.
Clique e arraste o mouse sobre a estrutura para girar e role para ampliar. Ajuste a coloração das estruturas clicando nas opções de cores. Em seguida, clique no botão azul Próxima análise para executar o agrupamento baseado em estrutura das estruturas PDB coletadas.
Alterne o mapa de calor RMSD no menu suspenso de opções de plotagem. Clique no botão azul aninhar RMSF para visualizar a variabilidade da estrutura de cada resíduo com os principais elementos da estrutura secundária mostrados nas regiões marginais do eixo X. Execute a análise de componentes principais entrando na guia PCA.
Para visualizar os componentes principais, alterne a caixa de seleção mostrar trajetória do PC para visualizar os movimentos descritos pelos componentes principais com a ferramenta de visualização no navegador. Certifique-se de que o componente principal um seja escolhido no primeiro menu suspenso. Para visualizar os movimentos descritos por outros componentes principais, escolha o PC desejado no menu suspenso escolher componente principal.
Projete as estruturas individuais em dois PCs selecionados clicando no botão azul próximo gráfico. Certifique-se de que PC no eixo X esteja definido como um e PC no eixo Y como dois. Para projetar as estruturas em outros componentes principais, ajuste a numeração do PC de acordo.
Clique em qualquer ponto individual na plotagem para rotular as estruturas. Como alternativa, realce uma ou mais estruturas na tabela Anotação de plotagem do conformador PCA abaixo da plotagem. Calcule as contribuições de resíduos para os componentes principais individuais clicando no botão azul próximas contribuições de resíduos.
Plote as contribuições para componentes principais adicionais incluindo o número do PC na caixa de texto escolher componente principal. Clique na guia eNMA para iniciar o cálculo do modo normal. Ajuste o número de estruturas diminuindo ou aumentando o corte para inclusão ou exclusão de estrutura.
Clique no NMA do conjunto de lances de escada verde para iniciar o cálculo da análise de modo normal. Role para baixo até o segundo painel da guia eNMA, chamado visualização de modos normais, para visualização dos modos normais. Clique no botão azul próximas flutuações para calcular as flutuações no sentido do resíduo das estruturas selecionadas para a análise do modo normal do conjunto.
Alterne o cluster por RMSD para colorir os perfis de flutuação por clustering baseado em RMSD. Alterne a caixa de seleção Linhas de propagação para plotar os perfis de flutuação agrupados separados uns dos outros. Em seguida, clique no botão azul próximo PCA versus NMA para calcular a semelhança entre os modos normais individuais e os componentes principais.
Clique no botão azul Avançar na parte inferior para gerar um relatório de resultados de análise, entrada definida pelo usuário e opções de parâmetro. O relatório pode ser baixado nos formatos PDF, Word e HTML compartilháveis. O relatório também inclui um link para revisitar a sessão de análise posteriormente, que também pode ser compartilhado com os colaboradores.
Aqui estão as estruturas PDB disponíveis da adenilato quinase sobrepostas ao núcleo invariante identificado. As estruturas são coloridas de acordo com o clustering baseado em RMSD fornecido na guia de ajuste. A visualização dos componentes principais está disponível na guia PCA para caracterizar as principais variações conformacionais no conjunto de dados.
Aqui, a trajetória correspondente ao primeiro componente principal é mostrada na representação do tubo mostrando o movimento de fechamento em larga escala da proteína. As estruturas são projetadas em seus dois primeiros componentes principais em um gráfico conformador mostrando uma representação dimensional baixa da variabilidade conformacional. Cada ponto ou estrutura é colorido de acordo com os critérios especificados pelo usuário, neste caso, resultados de clustering baseados em PCA.
A análise de modo normal na guia eNMA sugere dinâmica local e global aprimorada para estruturas no estado aberto em comparação com o estado fechado. O Bio3D-web pode ser usado para explorar conjuntos de sequências e estruturas e ajudar a entender as tendências gerais na família de proteínas de interesse em minutos. Bio3D-web ha me ajudou a informar a análise estrutural da superfamília cinesina.
O Bio3D-web fornece um fluxo de trabalho completo para investigação totalmente personalizada de relações dinâmicas de sequência-estrutura. Este fluxo de trabalho fornece funcionalidade para mapeamento de relacionamento de interconformidade com PCA e comparação quantitativa de dinâmicas locais e globais em grandes conjuntos de estruturas heterogêneas usando NMA de conjunto. Prevê-se que a maioria dos pesquisadores use o Bio3D-web para entender as tendências gerais em sua família de proteínas de interesse, o que pode informar análises especializadas adicionais.
O Bio3D-web é, portanto, projetado como uma ferramenta de geração de hipóteses com relatórios resumidos compartilháveis que incluem todos os parâmetros definidos pelo usuário. Os resultados do Bio3D-web também podem ser baixados e são totalmente compatíveis com o pacote Bio3D-R para uma análise mais aprofundada. Muitas estruturas estão agora disponíveis para uma determinada família de proteínas, muitas vezes determinadas sob diferentes condições.
A comparação desse grande número de estruturas pode nos dizer sobre mecanismos estruturais críticos para sua função, como ligação de ligantes, catálise e regulação alostérica. O Bio3D-web é amplamente acessível e fácil de usar, sem nenhuma instalação de software dedicada ou aprendizado de uma nova linguagem de programação. O Bio3D-web é compatível com todos os principais navegadores.
O código-fonte completo e as instruções de configuração para configuração local estão disponíveis gratuitamente.
Este artigo apresenta um protocolo para usar o Bio3D-web, uma aplicação web projetada para a análise interativa de sequência, estrutura e dinâmica de proteínas. Ele permite que pesquisadores explorem relações dentro de grandes famílias de proteínas sem necessidade de conhecimento de programação.