Summary
O Banco de Dados ITS2 é uma seqüência de bancada para inferência filogenética e, simultaneamente, considerando a estrutura secundária do espaçador interno transcrito 2. Isto inclui a coleta de dados com anotações precisas, a previsão de estrutura, alinhamento de sequências-estrutura múltipla e cálculo árvore rápido. Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a alguns cliques.
Abstract
O espaçador interno transcrito 2 (ITS2) tem sido utilizado como um marcador filogenética para mais de duas décadas. Como ITS2 pesquisa voltada principalmente para a seqüência ITS2 muito variável, confinado este marcador de baixo nível filogenética apenas. No entanto, a combinação da sequência ITS2 ea sua estrutura altamente conservada secundário melhora a resolução filogenética 1 e permite inferência filogenética em fileiras múltiplas taxonómicos, incluindo espécies de delimitação 2-8.
O Banco de Dados ITS2 9 apresenta um conjunto de dados exaustivo de espaçadores internos transcritos 2 seqüências do NCBI GenBank 11 precisão reannotated 10. Após uma anotação por Modelos Hidden Markov perfil (HMMs), a estrutura secundária de cada sequência é previsto. Primeiro, ele é testado se um mínimo de energia com base vezes 12 (vezes direta) resulta em uma correta conformação hélice, quatro. Se este não for o caso, a estrutura épredita por modelagem homologia 13. Em modelagem de homologia, uma estrutura já conhecida secundário é transferido para outra sequência de ITS2, cuja estrutura secundária não foi capaz de dobrar correctamente numa dobra directa.
O Banco de Dados ITS2 não é apenas um banco de dados para armazenamento e recuperação de ITS2 seqüência-estruturas. Ele também fornece várias ferramentas para processar as suas próprias sequências de ITS2, incluindo previsão, anotação estrutural, detecção e motivo de pesquisa BLAST 14 no combinadas informações de seqüência-estrutura. Além disso, integra as versões cortadas dos 4SALE 15,16 e ProfDistS 17 para cálculo alinhamento múltiplo de seqüência-estrutura e vizinho Unindo 18 reconstrução da árvore. Juntos, eles formam um gasoduto análise coerente de um conjunto inicial de seqüências de uma filogenia baseada na seqüência e estrutura secundária.
Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a apenasalguns cliques do mouse, enquanto que, adicionalmente, fornecendo ferramentas e dados para abrangentes análises em larga escala.
Protocol
1. Anotação correta de ITS2 Sequence
- Acesse a bancada filogenia ITS2 banco de dados aqui: http://its2.bioapps.biozentrum.uni-wuerzburg.de
- Comece sua análise clicando no botão "Anotar" ícone na seção "Ferramentas". Em seguida, digite ou cole a sua seqüência no editor de seqüência no topo do site. O editor de seqüência verifica automaticamente, se as suas sequências de ITS2 são válidos.
- Escolha um modelo HMM adequado às suas sequências (por exemplo Viridiplantae para as plantas).
- Inicie o processo clicando em "Anotar".
- Passando o mouse sobre o ícone "Combine", você pode ver uma imagem do 5.8S e 28S rRNA híbrido como uma confirmação de precisão a anotação do HMM.
- Clique no sinal de adição verde da seqüência resultante ITS2 para selecionar o seu modo de predição de estrutura secundária: Para prever a estrutura sem templat conhecidoe, clique em "Prever estrutura." Se você quiser usar o seu próprio modelo para a modelagem de homologia, clique em "estrutura do modelo."
2. Previsão de Estrutura Secundária
- Predizer
- A seqüência ITS2 anotada é automaticamente colado no editor de seqüência.
- Para iniciar a previsão de estrutura secundária com as configurações padrão, clique em "Prever estruturas" botão.
- Salvar a seqüência ITS2 resultante, incluindo a estrutura modelada secundário no conjunto de dados, clicando no sinal de mais verde e, em seguida, "Adicionar à piscina." Alternativamente, você pode adicioná-lo à sua reserva de dados através de drag and drop (Figura 1).
- Se a seqüência não poderia dobrar diretamente, os melhores resultados da modelagem de homologia são mostradas. Salve o mais adequado seqüência-estrutura através de arrastar e soltar para o conjunto de dados. Como alternativa, salve a seqüência-estrutura para o conjunto de dados com um clique direito e depois um clique em "Adicionar ao pool."
- Modelagem Personalizada
- Escreva ou cole modelos de um ou múltiplos (com estrutura conhecida) para o editor seqüência superior.
- Escreva ou cole uma ou várias sequências alvo (sem estrutura) para o editor seqüência inferior.
- Clique em "Prever o melhor modelo (s)" para iniciar a modelagem de homologia com as configurações padrão.
- As melhores modelo alvo combinações são mostrados na lista resultante.
- Salve o modelado seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."
3. Pesquisa Motif
- Digite ou cole a seqüência de consulta (s) no editor de seqüência no topo do site.
- Escolha o modelo HMM correta (por exemplo Viridiplantae para as plantas). 3,3. Clique em "busca do motivo" para iniciar o processo.
- ITS2 sequências com motivos, destacam-se illustrated na parte inferior do site.
- Clique no ícone ao lado do cabeçalho sequência, para apresentar os motivos destacados na estrutura secundária.
4. Pesquise e navegue
- Pesquisar
- Digite um nome de táxon ou um identificador GenBank (GI) no campo de pesquisa no topo do site.
- Uma busca pelo nome taxon é apoiado por uma caixa de aparecer ao vivo de pesquisa.
- Você pode realizar uma busca múltipla por vírgula separando as suas dúvidas.
- Clique no botão "Procurar" para executar a pesquisa.
- Os resultados aparecerão listados em uma nova aba.
- Clique no nome de uma coluna para classificar os resultados de acordo com a coluna particular. Você também pode adicionar ou remover colunas de sua escolha com o menu da coluna. O menu da coluna pode ser inserido com um clique no ícone da seta que aparece dentro de um nome de coluna.
- Clique em "Mostrar detalhes" para ver os detalhes de uma sequência-estrutura. </ Li>
- Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."
- Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo".
- Procurar
- Navegar na Base de Dados ITS2 navegando pela estrutura de árvore à esquerda do site.
- Clique em uma mais-sinal para ver a taxa um nível inferior.
- Clique no nome de um taxon para abrir uma nova guia contendo cada seqüência-estrutura do taxon.
- Clique em "Mostrar detalhes" para ver os detalhes de um par de seqüência-estrutura.
- Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool."
- Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo".
5. Explosão ITS2
- Digite ou cole uma ou várias seqüências de consulta para o editor seqüência. Suas seqüências podem ser tanto simples sequências de nucleótidos ou seqüência-estrutura pares. Você também pode digitar várias estruturas secundárias abaixo uma seqüência. Ao marcar a caixa "Serialize seqüências XXFASTA" estas estruturas são usadas posteriormente como consultas individuais.
- Para iniciar o BLAST com as configurações padrão, clique em "Blast". Dependendo da natureza da sua consulta, quer BLASTN um comum ou no ITS2 BLAST sequência-estrutura é executada.
- A sub-aba é aberta para cada seqüência de consulta dentro dos que aparecem na guia "Resultados explosão", bem como uma visão geral das pesquisas realizadas.
- Clique em "Alinhamentos Mostrar" para ver os alinhamentos BLAST calculados.
- Salve os hits BLAST de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e um clique em "Adicionar ao pool."
- Para salvar os resultados para um arquivo externo, clique em "Salvar seleção"Ou" Salvar tudo ".
6. Alinhamento de seqüências-estrutura múltipla
- Dê uma olhada no seu conjunto de dados, clicando em "Gerenciar conjunto de dados" e, em seguida, o símbolo da lupa ao lado do número de seqüências em sua piscina. Alternativamente, você pode clicar no sinal de pool de dados na parte inferior esquerda do site.
- Clique em um par de seqüência-estrutura em seu conjunto de dados para exibir seus detalhes.
- Para criar um alinhamento de sequências-estrutura múltipla de todos os pares seqüência-estrutura em sua piscina, clique em "conjunto de dados Analisar" e depois "Seqüência e Estrutura".
- Agora é-lhe pedido para seleccionar o modo gráfico do seu alinhamento. Se o seu alinhamento contém apenas algumas seqüências, recusar o modo fino, clicando em "Não" Caso contrário, escolha o modo fino gráfico clicando em "Sim".
- Em alguns momentos, o seu alinhamento é mostrado em uma nova aba (Figura 2). Além disso, ele é salvo automaticamente para o conjunto de dados.
- Para salvar o seualinhamento para um arquivo externo, clique em "Salvar alinhamento."
7. Árvore filogenética
- Para calcular uma seqüência de Neighbor-estrutura baseada em Unir em árvore do seu alinhamento múltiplo, clique em "Dataset Analisar" e depois "Neighbor Unir".
- A árvore resultante é ilustrado em uma nova aba (Figura 3).
- Escale a sua árvore livremente com a barra de rolagem "árvore Zoom".
- Reroot sua árvore clicando em um nó ou folha da árvore e, em seguida, "Reroot neste nó."
- Se você quiser remover um taxon de seu conjunto de dados, clique na folha e escolha "Remover este nó de piscina." Agora você pode recalcular o seu alinhamento e árvore com a amostragem taxon reduzida.
- Clique em "árvore Save" para salvar sua árvore filogenética como um resultado final de sua análise para um arquivo Newick externo.
8. Software adicional
- Clique em "Sobre este site" - "Ferramentas" para encontrar adicional informarção sobre o 4SALE ferramentas stand-alone e ProfDistS.
- Ao lado do alinhamento e função Vizinho Juntando fornecido pela interface ITS2 banco de dados web, agora você pode acessar várias funções novas, a delimitação das espécies por exemplo, com base nas alterações de base de compensação (CBCS).
9. Os resultados representativos
O fluxo de trabalho, como descrito acima foi utilizada com sucesso em vários inquéritos de acesso aberto 3,4. Exemplos podem ser vistos através dos seguintes links:
- http://www.plosone.org/article/info%% 3Adoi 2F10.1371% 2Fjournal.pone.0016931
- http://www.biomedcentral.com/1756-0500/3/320
Nestes estudos de grande escala, nós fomos capazes de resolver a filogenia de Chlorophyta, bem como Hypnales (Bryophyta) wom alta resolução. Em ambos os casos, uma amostragem taxon exaustiva foi recolhida a partir do banco de dados ITS2 9, automaticamente alinhado com 4SALE 15,16 e finalmente processada por ProfDistS 17 em uma árvore filogenética. Em todos estes passos, a sequência e estrutura de informação foram utilizados simultaneamente. Suporte Bootstrap para a espinha dorsal filogenética foi conseguida utilizando Vizinho perfil de união (PNJ) 19, que está disponível na versão autónoma do ProfDistS.
Para um conjunto menor de seqüência-estrutura pares, figuras 1 a 3 descrevem os principais passos deste fluxo de trabalho automatizado 5 diretamente na bancada banco de dados novo ITS2: amostragem taxonômica, o alinhamento da seqüência de estrutura de múltiplas e, eventualmente, o cálculo árvore filogenética.
Figura 1. Amostragem Taxon por arrastar e soltar. Em qualquer seqüência de tempo ou seqüência estru- pares de e podem ser adicionados ao conjunto de dados, por exemplo através de arrastar e gota. Aqui uma sequência-estrutura é adicionado usando a função arrastar e soltar depois de predição de estrutura secundária. A elipse azul marca a área onde a seqüência de estrutura é jogada na piscina de dados. Clique aqui para ver a versão completa do tamanho desta imagem.
Figura 2. Alinhamento da seqüência-estrutura múltipla no modo gráfico completo. Para as sequências de poucos no conjunto de dados, o modo completo gráfico foi escolhido. Bases são coloridos; pares de bases podem ser destacados com círculos vermelhos clicando em uma base ou suporte de um par de base. Clique aqui para ver a versão completa do tamanho desta imagem.
"Alt =" 3.jpg Figura 3 "/>
Figura 3. Vizinho Sequence-estrutura Juntando árvore. A árvore livremente escalável calculado de sete táxons alinhamento da seqüência de estrutura de múltiplas podem ser salvos no formato Newick.
Discussion
O Banco de Dados ITS2 é uma bancada completa e totalmente funcional para espaçadores internos transcritos 2 seqüência-estrutura-base filogenética. O site pode ser operado muito rápida e intuitiva. Enquanto outras bancadas baseados na web como filogenia ARB 20 ou 21 Mobyle só são capazes de trabalhar em seqüência e / ou informação sobre a estrutura de consenso, o banco de dados ITS2 9 considera seqüências e estruturas secundárias individuais para cada taxon simultaneamente. No entanto, devido a limitações na capacidade computacional do servidor web, é altamente recomendável usar as ferramentas stand-alone para alinhamento múltiplo e Neighbor Unindo 18 cálculo, 4SALE 15,16 e ProfDistS 17, respectivamente, para grandes conjuntos de dados. Além do básico de fluxo de trabalho filogenia ITS2 sequência estrutura-5, essas ferramentas apresentam várias funções adicionais, como calcular bootstrap repetições, vizinho Perfil Unir (PNJ) 19 ou espéciedelimitação s com base nas alterações de base de compensação (CBCS) 8. Eles podem ser acessados através do "Sobre este site" - seção "Ferramentas" para download e informações mais detalhadas. Para usar 4SALE e ProfDistS, é necessário sempre trazer os arquivos para o formato correto. Um táxon de amostragem para serem processados pelo 4SALE deve ter o final. Fasta ou. Txt, enquanto que o alinhamento da seqüência-estrutura como uma entrada para ProfDistS deve terminar com. Xfasta.
Estamos presentemente a implementação métodos alternativos para reconstrução filogenética árvore no banco de dados ITS2, bem como nas ferramentas relacionadas. Assim, métodos como seqüência-estrutura baseada em Máxima Parcimônia 22 e / ou máxima verossimilhança 23 estarão acessíveis no futuro.
Disclosures
Não há conflitos de interesse declarados.
Acknowledgments
Nós cordialmente agradecer ao grupo ITS2, centro biológico, da Universidade de Würzburg, para o feedback rico e valioso. Agradecemos também o Deutsche Forschungsgemeinschaft (DFG; concessão Mu-2831/1-1) para financiamento.
Materials
Name | Company | Catalog Number | Comments |
Internet access | Preferably high-speed | ||
ITS2 Database9 | University of Warzburg | Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de | |
Software: 4SALE15,16 | University of Warzburg | Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ | |
Software: ProfDistS17 | University of Warzburg | Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |
References
- Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
- Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
- Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
- Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
- Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
- Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
- Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
- Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
- Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
- Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
- Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
- Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
- Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
- Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
- Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
- Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
- Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
- Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
- Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
- Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
- Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
- Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
- Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).