Biology

O Banco de Dados ITS2

Published: March 12, 2012 doi: 10.3791/3806

Benjamin Merget^1,2, Christian Koetschan¹, Thomas Hackl¹, Frank Förster¹, Thomas Dandekar¹, Tobias Müller¹, Jörg Schultz¹, Matthias Wolf¹

¹Department of Bioinformatics, Biocenter, University of Würzburg, ²Institute of Pharmacy and Food Chemistry, University of Würzburg

Summary

O Banco de Dados ITS2 é uma seqüência de bancada para inferência filogenética e, simultaneamente, considerando a estrutura secundária do espaçador interno transcrito 2. Isto inclui a coleta de dados com anotações precisas, a previsão de estrutura, alinhamento de sequências-estrutura múltipla e cálculo árvore rápido. Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a alguns cliques.

Abstract

O espaçador interno transcrito 2 (ITS2) tem sido utilizado como um marcador filogenética para mais de duas décadas. Como ITS2 pesquisa voltada principalmente para a seqüência ITS2 muito variável, confinado este marcador de baixo nível filogenética apenas. No entanto, a combinação da sequência ITS2 ea sua estrutura altamente conservada secundário melhora a resolução filogenética ¹ e permite inferência filogenética em fileiras múltiplas taxonómicos, incluindo espécies de delimitação ^2-8.

O Banco de Dados ITS2 ⁹ apresenta um conjunto de dados exaustivo de espaçadores internos transcritos 2 seqüências do NCBI GenBank ¹¹ precisão reannotated ^10. Após uma anotação por Modelos Hidden Markov perfil (HMMs), a estrutura secundária de cada sequência é previsto. Primeiro, ele é testado se um mínimo de energia com base vezes ¹² (vezes direta) resulta em uma correta conformação hélice, quatro. Se este não for o caso, a estrutura épredita por modelagem homologia ^13. Em modelagem de homologia, uma estrutura já conhecida secundário é transferido para outra sequência de ITS2, cuja estrutura secundária não foi capaz de dobrar correctamente numa dobra directa.

O Banco de Dados ITS2 não é apenas um banco de dados para armazenamento e recuperação de ITS2 seqüência-estruturas. Ele também fornece várias ferramentas para processar as suas próprias sequências de ITS2, incluindo previsão, anotação estrutural, detecção e motivo de pesquisa BLAST ¹⁴ no combinadas informações de seqüência-estrutura. Além disso, integra as versões cortadas dos 4SALE ^15,16 e ProfDistS ¹⁷ para cálculo alinhamento múltiplo de seqüência-estrutura e vizinho Unindo ¹⁸ reconstrução da árvore. Juntos, eles formam um gasoduto análise coerente de um conjunto inicial de seqüências de uma filogenia baseada na seqüência e estrutura secundária.

Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a apenasalguns cliques do mouse, enquanto que, adicionalmente, fornecendo ferramentas e dados para abrangentes análises em larga escala.

Protocol

1. Anotação correta de ITS2 Sequence

Acesse a bancada filogenia ITS2 banco de dados aqui: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Comece sua análise clicando no botão "Anotar" ícone na seção "Ferramentas". Em seguida, digite ou cole a sua seqüência no editor de seqüência no topo do site. O editor de seqüência verifica automaticamente, se as suas sequências de ITS2 são válidos.
Escolha um modelo HMM adequado às suas sequências (por exemplo Viridiplantae para as plantas).
Inicie o processo clicando em "Anotar".
Passando o mouse sobre o ícone "Combine", você pode ver uma imagem do 5.8S e 28S rRNA híbrido como uma confirmação de precisão a anotação do HMM.
Clique no sinal de adição verde da seqüência resultante ITS2 para selecionar o seu modo de predição de estrutura secundária: Para prever a estrutura sem templat conhecidoe, clique em "Prever estrutura." Se você quiser usar o seu próprio modelo para a modelagem de homologia, clique em "estrutura do modelo."

2. Previsão de Estrutura Secundária

Predizer
1. A seqüência ITS2 anotada é automaticamente colado no editor de seqüência.
2. Para iniciar a previsão de estrutura secundária com as configurações padrão, clique em "Prever estruturas" botão.
3. Salvar a seqüência ITS2 resultante, incluindo a estrutura modelada secundário no conjunto de dados, clicando no sinal de mais verde e, em seguida, "Adicionar à piscina." Alternativamente, você pode adicioná-lo à sua reserva de dados através de drag and drop (Figura 1).
4. Se a seqüência não poderia dobrar diretamente, os melhores resultados da modelagem de homologia são mostradas. Salve o mais adequado seqüência-estrutura através de arrastar e soltar para o conjunto de dados. Como alternativa, salve a seqüência-estrutura para o conjunto de dados com um clique direito e depois um clique em "Adicionar ao pool."
Modelagem Personalizada
1. Escreva ou cole modelos de um ou múltiplos (com estrutura conhecida) para o editor seqüência superior.
2. Escreva ou cole uma ou várias sequências alvo (sem estrutura) para o editor seqüência inferior.
3. Clique em "Prever o melhor modelo (s)" para iniciar a modelagem de homologia com as configurações padrão.
4. As melhores modelo alvo combinações são mostrados na lista resultante.
5. Salve o modelado seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."

3. Pesquisa Motif

Digite ou cole a seqüência de consulta (s) no editor de seqüência no topo do site.
Escolha o modelo HMM correta (por exemplo Viridiplantae para as plantas). 3,3. Clique em "busca do motivo" para iniciar o processo.
ITS2 sequências com motivos, destacam-se illustrated na parte inferior do site.
Clique no ícone ao lado do cabeçalho sequência, para apresentar os motivos destacados na estrutura secundária.

4. Pesquise e navegue

Pesquisar
1. Digite um nome de táxon ou um identificador GenBank (GI) no campo de pesquisa no topo do site.
2. Uma busca pelo nome taxon é apoiado por uma caixa de aparecer ao vivo de pesquisa.
3. Você pode realizar uma busca múltipla por vírgula separando as suas dúvidas.
4. Clique no botão "Procurar" para executar a pesquisa.
5. Os resultados aparecerão listados em uma nova aba.
6. Clique no nome de uma coluna para classificar os resultados de acordo com a coluna particular. Você também pode adicionar ou remover colunas de sua escolha com o menu da coluna. O menu da coluna pode ser inserido com um clique no ícone da seta que aparece dentro de um nome de coluna.
7. Clique em "Mostrar detalhes" para ver os detalhes de uma sequência-estrutura. </ Li>
8. Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."
9. Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo".
Procurar
1. Navegar na Base de Dados ITS2 navegando pela estrutura de árvore à esquerda do site.
2. Clique em uma mais-sinal para ver a taxa um nível inferior.
3. Clique no nome de um taxon para abrir uma nova guia contendo cada seqüência-estrutura do taxon.
4. Clique em "Mostrar detalhes" para ver os detalhes de um par de seqüência-estrutura.
5. Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."
6. Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo".

5. Explosão ITS2

Digite ou cole uma ou várias seqüências de consulta para o editor seqüência. Suas seqüências podem ser tanto simples sequências de nucleótidos ou seqüência-estrutura pares. Você também pode digitar várias estruturas secundárias abaixo uma seqüência. Ao marcar a caixa "Serialize seqüências XXFASTA" estas estruturas são usadas posteriormente como consultas individuais.
Para iniciar o BLAST com as configurações padrão, clique em "Blast". Dependendo da natureza da sua consulta, quer BLASTN um comum ou no ITS2 BLAST sequência-estrutura é executada.
A sub-aba é aberta para cada seqüência de consulta dentro dos que aparecem na guia "Resultados explosão", bem como uma visão geral das pesquisas realizadas.
Clique em "Alinhamentos Mostrar" para ver os alinhamentos BLAST calculados.
Salve os hits BLAST de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e um clique em "Adicionar ao pool."
Para salvar os resultados para um arquivo externo, clique em "Salvar seleção"Ou" Salvar tudo ".

6. Alinhamento de seqüências-estrutura múltipla

Dê uma olhada no seu conjunto de dados, clicando em "Gerenciar conjunto de dados" e, em seguida, o símbolo da lupa ao lado do número de seqüências em sua piscina. Alternativamente, você pode clicar no sinal de pool de dados na parte inferior esquerda do site.
Clique em um par de seqüência-estrutura em seu conjunto de dados para exibir seus detalhes.
Para criar um alinhamento de sequências-estrutura múltipla de todos os pares seqüência-estrutura em sua piscina, clique em "conjunto de dados Analisar" e depois "Seqüência e Estrutura".
Agora é-lhe pedido para seleccionar o modo gráfico do seu alinhamento. Se o seu alinhamento contém apenas algumas seqüências, recusar o modo fino, clicando em "Não" Caso contrário, escolha o modo fino gráfico clicando em "Sim".
Em alguns momentos, o seu alinhamento é mostrado em uma nova aba (Figura 2). Além disso, ele é salvo automaticamente para o conjunto de dados.
Para salvar o seualinhamento para um arquivo externo, clique em "Salvar alinhamento."

7. Árvore filogenética

Para calcular uma seqüência de Neighbor-estrutura baseada em Unir em árvore do seu alinhamento múltiplo, clique em "Dataset Analisar" e depois "Neighbor Unir".
A árvore resultante é ilustrado em uma nova aba (Figura 3).
Escale a sua árvore livremente com a barra de rolagem "árvore Zoom".
Reroot sua árvore clicando em um nó ou folha da árvore e, em seguida, "Reroot neste nó."
Se você quiser remover um taxon de seu conjunto de dados, clique na folha e escolha "Remover este nó de piscina." Agora você pode recalcular o seu alinhamento e árvore com a amostragem taxon reduzida.
Clique em "árvore Save" para salvar sua árvore filogenética como um resultado final de sua análise para um arquivo Newick externo.

8. Software adicional

Clique em "Sobre este site" - "Ferramentas" para encontrar adicional informarção sobre o 4SALE ferramentas stand-alone e ProfDistS.
Ao lado do alinhamento e função Vizinho Juntando fornecido pela interface ITS2 banco de dados web, agora você pode acessar várias funções novas, a delimitação das espécies por exemplo, com base nas alterações de base de compensação (CBCS).

9. Os resultados representativos

O fluxo de trabalho, como descrito acima foi utilizada com sucesso em vários inquéritos de acesso aberto ^3,4. Exemplos podem ser vistos através dos seguintes links:

Nestes estudos de grande escala, nós fomos capazes de resolver a filogenia de Chlorophyta, bem como Hypnales (Bryophyta) wom alta resolução. Em ambos os casos, uma amostragem taxon exaustiva foi recolhida a partir do banco de dados ITS2 ^9, automaticamente alinhado com 4SALE ^15,16 e finalmente processada por ProfDistS ¹⁷ em uma árvore filogenética. Em todos estes passos, a sequência e estrutura de informação foram utilizados simultaneamente. Suporte Bootstrap para a espinha dorsal filogenética foi conseguida utilizando Vizinho perfil de união (PNJ) ^19, que está disponível na versão autónoma do ProfDistS.

Para um conjunto menor de seqüência-estrutura pares, figuras 1 a 3 descrevem os principais passos deste fluxo de trabalho automatizado ⁵ diretamente na bancada banco de dados novo ITS2: amostragem taxonômica, o alinhamento da seqüência de estrutura de múltiplas e, eventualmente, o cálculo árvore filogenética.

A Figura 1
Figura 1. Amostragem Taxon por arrastar e soltar. Em qualquer seqüência de tempo ou seqüência estru- pares de e podem ser adicionados ao conjunto de dados, por exemplo através de arrastar e gota. Aqui uma sequência-estrutura é adicionado usando a função arrastar e soltar depois de predição de estrutura secundária. A elipse azul marca a área onde a seqüência de estrutura é jogada na piscina de dados. Clique aqui para ver a versão completa do tamanho desta imagem.

A Figura 2
Figura 2. Alinhamento da seqüência-estrutura múltipla no modo gráfico completo. Para as sequências de poucos no conjunto de dados, o modo completo gráfico foi escolhido. Bases são coloridos; pares de bases podem ser destacados com círculos vermelhos clicando em uma base ou suporte de um par de base. Clique aqui para ver a versão completa do tamanho desta imagem.

"Alt =" 3.jpg Figura 3 "/>
Figura 3. Vizinho Sequence-estrutura Juntando árvore. A árvore livremente escalável calculado de sete táxons alinhamento da seqüência de estrutura de múltiplas podem ser salvos no formato Newick.

Discussion

O Banco de Dados ITS2 é uma bancada completa e totalmente funcional para espaçadores internos transcritos 2 seqüência-estrutura-base filogenética. O site pode ser operado muito rápida e intuitiva. Enquanto outras bancadas baseados na web como filogenia ARB ²⁰ ou ²¹ Mobyle só são capazes de trabalhar em seqüência e / ou informação sobre a estrutura de consenso, o banco de dados ITS2 ⁹ considera seqüências e estruturas secundárias individuais para cada taxon simultaneamente. No entanto, devido a limitações na capacidade computacional do servidor web, é altamente recomendável usar as ferramentas stand-alone para alinhamento múltiplo e Neighbor Unindo ¹⁸ cálculo, 4SALE ^15,16 e ProfDistS ^17, respectivamente, para grandes conjuntos de dados. Além do básico de fluxo de trabalho filogenia ITS2 sequência ^estrutura-5, essas ferramentas apresentam várias funções adicionais, como calcular bootstrap repetições, vizinho Perfil Unir (PNJ) ¹⁹ ou espéciedelimitação s com base nas alterações de base de compensação (CBCS) ^8. Eles podem ser acessados através do "Sobre este site" - seção "Ferramentas" para download e informações mais detalhadas. Para usar 4SALE e ProfDistS, é necessário sempre trazer os arquivos para o formato correto. Um táxon de amostragem para serem processados pelo 4SALE deve ter o final. Fasta ou. Txt, enquanto que o alinhamento da seqüência-estrutura como uma entrada para ProfDistS deve terminar com. Xfasta.

Estamos presentemente a implementação métodos alternativos para reconstrução filogenética árvore no banco de dados ITS2, bem como nas ferramentas relacionadas. Assim, métodos como seqüência-estrutura baseada em Máxima Parcimônia ²² e / ou máxima verossimilhança ^{23 estarão} acessíveis no futuro.

Disclosures

Não há conflitos de interesse declarados.

Acknowledgments

Nós cordialmente agradecer ao grupo ITS2, centro biológico, da Universidade de Würzburg, para o feedback rico e valioso. Agradecemos também o Deutsche Forschungsgemeinschaft (DFG; concessão Mu-2831/1-1) para financiamento.

Materials

Name	Company	Catalog Number	Comments
Internet access			Preferably high-speed
ITS2 Database⁹	University of Warzburg		Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE^15,16	University of Warzburg		Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS¹⁷	University of Warzburg		Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/