Summary

База данных ITS2

Published: March 12, 2012
doi:

Summary

База данных ITS2 является рабочее место для филогенетических выводов одновременно учитывая последовательность и вторичная структура внутреннего транскрипции Spacer 2. Это включает в себя сбор данных с точной аннотацией, предсказания структуры, несколько последовательность структуры выравнивание и быстрый расчет дерева. В двух словах, это рабочее место упрощает первых анализов филогенетического в несколько кликов.

Abstract

Внутренний транскрипции Spacer 2 (ITS2) был использован в качестве маркера филогенетического течение более чем двух десятилетий. Как ITS2 исследования в основном сосредоточены на очень изменчива ITS2 последовательности, ограничивается этот маркер с низким уровнем филогенетики только. Тем не менее, сочетание ITS2 последовательность и ее хорошо сохранились и вторичная структура улучшает филогенетического резолюции 1 и позволяет филогенетического вывод на несколько рангов таксономической, в том числе видов делимитации 2-8.

База данных ITS2 9 представлены исчерпывающие данных внутренней транскрипции Spacer 2 последовательностей из GenBank NCBI 11 точное reannotated 10. После аннотации профиля скрытых Марковских моделей (ПММ), вторичная структура каждой последовательности прогнозируется. Во-первых, проверяется ли минимум энергии основаны раз 12 (прямой раза) приводит к правильным, четыре конформации спирали. Если это не так, то структурапредсказано гомологий моделирования 13. В гомологий моделирования, уже известно вторичная структура переносится на другую последовательность ITS2, чья вторичная структура не в состоянии правильно сложить в прямом раза.

База данных ITS2 это не только база данных для хранения и поиска последовательности ITS2-структур. Она также предоставляет несколько инструментов для обработки собственных ITS2 последовательностей, в том числе аннотации, структурные предсказания, мотив обнаружения и BLAST 14 поиск на сочетании последовательности информационной структуры. Кроме того, он интегрируется отделкой версии 4SALE 15,16 и 17 ProfDistS несколько последовательность структуры расчета выравнивания и сосед Объединение 18 деревьев реконструкции. Вместе они образуют согласованный трубопровода анализ от первоначального набора последовательностей филогении на основе последовательности и вторичной структуры.

В двух словах, это рабочее место упрощает первых анализов филогенетического толькоНесколько щелчков мыши, а кроме того, предоставление инструментов и данных комплексных крупномасштабных исследований.

Protocol

1. Правильные аннотации ITS2 последовательностей Доступ ITS2 верстак филогении базы данных здесь: http://its2.bioapps.biozentrum.uni-wuerzburg.de Начните свой анализ, нажав кнопку "комментировать" значок в разделе "Сервис". Затем введите или вставьте последовательность в последовательность редактором в верхней части веб-сайта. Последовательность редактор автоматически проверяет, является ли ваша ITS2 последовательностей являются действительными. Выберите HMM модели, пригодной для последовательности (например, Viridiplantae для растений). Начать процесс, нажав кнопку "комментировать". При наведении на "скрещиваться" изображение можно просматривать изображения 5.8S и 28S рРНК гибридных как подтверждение точности HMM аннотации. Нажмите на зеленый плюс полученного ITS2 последовательности, чтобы выбрать способ вторичной структуры: Чтобы предсказать структуру, не известно templatе, нажмите на кнопку "Прогнозирование структуры". Если вы хотите использовать свой собственный шаблон для гомологий моделирования, нажмите "Модель структуры". 2. Предсказание вторичной структуры Предсказывать Аннотированный последовательность ITS2 автоматически вставляется в последовательность редактора. Чтобы начать Предсказание вторичной структуры с настройками по умолчанию, нажмите кнопку "Прогнозирование структуры" кнопку. Сохраните полученный ITS2 последовательность в том числе моделируемой вторичной структуры в бассейн данные, нажав на зеленый знак плюс, а затем "Добавить в бассейн". Кроме того, вы можете добавить его в свой пул данных с помощью перетаскивания (рис. 1). Если последовательность не может сложить прямо, наилучшие результаты гомологического моделирования. Сохранить наиболее подходящей последовательности структуры с помощью перетаскивания для пула данных. Кроме того, сохранение последовательности в структуре данных бассейн с правой кнопкой мыши, а затем нажмите на "Добавить в бассейн". Пользовательские моделирования Введите или вставьте один или несколько шаблонов (с известной структурой) в верхней редактор последовательности. Введите или вставьте один или несколько целевых последовательностей (без структуры) в нижней последовательность редактора. Нажмите на кнопку "Предсказать лучший шаблон (ы)", чтобы начать гомологий моделирования с настройками по умолчанию. Лучший шаблон мишени комбинации показаны в результирующем списке. Сохранить последовательность моделируемой структуры (ы) по вашему выбору либо с помощью перетаскивания в пул данных или щелкните правой кнопкой мыши и нажмите на кнопку "Добавить в бассейн". 3. Мотив поиска Введите или вставьте запрос последовательность (ы) в последовательности редактором в верхней части веб-сайта. Выбор правильной модели СММ (например, Viridiplantae для растений). 3.3. Нажмите на кнопку "Мотив поиска", чтобы начать процесс. ITS2 последовательностей выделены мотивы иллюстрацииТед в нижней части сайта. Нажмите на иконку рядом с заголовком последовательность отображения мотивы выделены вторичные структуры. 4. Поиск и просмотр Поиск Тип или название таксона или GenBank идентификатор (GI) в поле поиска в верхней части веб-сайта. Поиск по названию таксона поддерживает появление живого поиска. Вы можете выполнять поиск по нескольким запятой разделяющие ваши запросы. Нажмите на кнопку "Поиск", чтобы выполнить поиск. Ваши результаты появляются перечисленные в новой вкладке. Нажмите на имя столбца, чтобы отсортировать результаты по определенному столбцу. Вы также можете добавить или удалить столбцы по вашему выбору с колонкой меню. Колонка меню могут быть введены с мыши на значок стрелки, появляющиеся в имени столбца. Нажмите на кнопку "Показать детали" для просмотра информации о последовательности структуры. </ LI> Сохранить последовательность структуры (ы) по вашему выбору либо с помощью перетаскивания в пул данных или щелкните правой кнопкой мыши и нажмите на кнопку "Добавить в бассейн". Для сохранения результатов во внешний файл, нажмите на кнопку "Сохранить выбор" или "Сохранить все". Просматривать Обзор ITS2 базы данных по навигации по древовидной структуре в левой части сайта. Нажмите на знак плюс, чтобы посмотреть таксонов на один уровень ниже. Нажмите на название таксона, чтобы открыть новую вкладку, содержащую каждой последовательности структуры таксона. Нажмите на кнопку "Показать детали" для просмотра информации о последовательности структуры пары. Сохранить последовательность структуры (ы) по вашему выбору либо с помощью перетаскивания в пул данных или щелкните правой кнопкой мыши и нажмите на кнопку "Добавить в бассейн". Для сохранения результатов во внешний файл, нажмите на кнопку "Сохранить выбор" или "Сохранить все". 5. ITS2 Blast Введите или вставьте один или несколько запросов последовательности в последовательности редактора. Ваша последовательность может быть либо простым нуклеотидной последовательности или последовательности структуры пар. Вы также можете ввести несколько дополнительных структур под одну последовательность. Установив флажок "Сериализация XXFASTA последовательности" эти структуры используются в дальнейшем в качестве отдельных запросов. Для начала BLAST с настройками по умолчанию, нажмите на "Blast". В зависимости от характера запроса, либо общий BLASTN или ITS2 последовательностей BLAST-структуры выполняется. Суб-вкладки открывается для каждого запроса в последовательности появляется вкладка "Результаты BLAST", а также обзор выполненных запросов. Нажмите на кнопку "Показать Выравнивание", чтобы просмотреть расчетных выравнивания BLAST. Сохранить BLAST хитов на ваш выбор либо с помощью перетаскивания в бассейн данные или щелкните правой кнопкой мыши и нажмите на кнопку "Добавить в бассейн". Для сохранения результатов во внешний файл, нажмите на кнопку "Сохранить выбор"Или" Сохранить все ". 6. Несколько последовательности структуры Выравнивание Взгляните на ваш пул данных, нажав кнопку "Управление данных", а затем символ увеличительного стекла рядом с числом последовательностей в вашем бассейне. Кроме того, вы можете нажать на знак пула данных в левом нижнем углу веб-сайта. Нажмите на последовательность структуры пары в пул данных, чтобы просмотреть сведения. Для создания нескольких последовательность структуры выравнивание всех последовательность структуры пар в бассейне, нажмите на кнопку "Анализ данных" и затем "Последовательность и структура". Теперь вам будет предложено выбрать графический режим вашего выравнивания. Если выравнивание содержит только несколько последовательностей, отказаться от тонких режим, нажав кнопку "нет" В противном случае выбрать тонкий графический режим, нажав кнопку "Да". Через несколько мгновений, ваш выравнивание показано в новой вкладке (рис. 2). Кроме того, он автоматически сохраняется в пул данных. Чтобы сохранитьВыравнивание во внешний файл, нажмите на кнопку "Сохранить выравнивание". 7. Филогенетическое древо Чтобы вычислить последовательность структуры на основе сосед Присоединение дерево вашего множественного выравнивания, нажмите на кнопку "Анализ данных" и "Соседка присоединение". В результате дерево показано в новой вкладке (рис. 3). Масштаб ваше дерево свободно с полосой прокрутки "Zoom дерево». Reroot вашего дерева, нажав на узел или лист дерева, а затем "Reroot на этом узле." Если вы хотите удалить из вашего таксон пула данных, нажмите на листе и выберите "Удалить этот узел из бассейна". Теперь вы можете пересчитать выравнивание и дерево с уменьшенной выборки таксонов. Нажмите на кнопку "Сохранить дерево", чтобы сохранить филогенетическое дерево как конечный результат вашего анализа на внешний файл Newick. 8. Дополнительное программное обеспечение Нажмите на кнопку "О сайте" – "Инструменты", чтобы найти дополнительные сообщитьЦ И А Ц о автономные инструменты 4SALE и ProfDistS. Помимо выравнивания и сосед Объединение функций предоставляемых ITS2 веб-интерфейс базы данных, вы можете получить доступ несколько новых функций, например, разграничение видов на основе компенсаторные изменения базы (CBCS). 9. Представитель Результаты Рабочий процесс, как описано выше, успешно применяется в ряде открытых исследований доступа 3,4. Примеры можно посмотреть по следующим ссылкам: http://www.plosone.org/article/info% 3Adoi% 2F10.1371% 2Fjournal.pone.0016931 http://www.biomedcentral.com/1756-0500/3/320 В эти крупные исследования масштабе, мы смогли решить филогении Chlorophyta а также Hypnales (мхи) Wго высокого разрешения. В обоих случаях, исчерпывающий выборки таксонов была собрана из базы данных ITS2 9, автоматически выравниваются с 4SALE 15,16 и, наконец, обрабатываются ProfDistS 17 в филогенетическом древе. Во всех этих шагов, последовательность и структура информации были использованы одновременно. Bootstrap поддержку основу филогенетических была достигнута с помощью профиля сосед Вступление (PNJ) 19, который доступен в автономном версия ProfDistS. Для меньшего набора последовательностей структуры пар, цифры от 1 до 3 описать основные этапы этого автоматизированные рабочие процессы 5 непосредственно на новое рабочее место ITS2 базы данных: Таксон выборки, несколько последовательность выравнивание структуры и в конечном итоге расчет филогенетического дерева. Рисунок 1. Таксон выборки в перетаскивания. В любой момент последовательности или последовательности структурно электронных пар могут быть добавлены в пул данных, например с помощью перетаскивания. Вот последовательность структуры добавляется с помощью перетаскивания после вторичной структуры. Синий эллипс отмечает место, где последовательность структуры падает в бассейн данные. Щелкните здесь для просмотра полноразмерной версии этого образа. Рисунок 2. Несколько последовательность структуры выравнивания в полном графическом режиме. За несколько последовательностей в пул данных, полный графический режим был выбран. Основы окрашены; пар оснований могут быть выделены с красными кругами, нажав на одну базу или кронштейне пар оснований. Щелкните здесь для просмотра полноразмерной версии этого образа. 3.jpg "ALT =" 3 "/> Рисунок 3. Последовательность структуры сосед Присоединение дерева. Свободно масштабируемая дерево рассчитывается из семи таксонов несколько последовательность выравнивание структуры могут быть сохранены в формате Newick.

Discussion

База данных ITS2 является полным и полностью функциональный верстак для внутреннего транскрипции Spacer 2 последовательность структуры на основе филогенетики. Сайт может работать очень быстро и интуитивно. В то время как другие веб-филогении верстаки, как ARB 20 или 21 Mobyle только в состоянии работать на последовательность и / или информации консенсус структура, база данных ITS2 9 рассматривается последовательность и индивидуальных вторичных структур для каждого таксона одновременно. Однако, из-за ограничений в области вычислительной мощностью сервера, то настоятельно рекомендуется использовать автономные инструменты для выравнивания и несколько соседей Объединение 18 расчетов, 4SALE 15,16 и ProfDistS 17, соответственно, для больших наборов данных. Наряду с основной последовательности ITS2 структуры филогении рабочий 5, эти инструменты имеют ряд дополнительных функций, например, расчет загрузки повторяет, профиль соседа Вступление (PNJ) 19 или породыс делимитации на основе компенсаторные изменения базы (CBCS) 8. Они могут быть доступны через "О сайте" – "Сервис" раздел для загрузки и подробную информацию. Для использования 4SALE и ProfDistS, необходимо всегда приносит файлы в нужный формат. Таксон выборки для обработки 4SALE должны иметь окончание. FASTA или. TXT, в то время как последовательность структуры выравнивание в качестве вклада ProfDistS должна заканчиваться. Xfasta.

Мы в настоящее время проводят альтернативные методы филогенетического дерева реконструкции ITS2 базы данных, а также в связанных с ними инструментов. Таким образом, методы, такие как последовательность структуры на основе максимальной экономии 22 и / или максимального правдоподобия 23 будет доступна в будущем.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Мы сердечно благодарим группу ITS2, Биоцентр Университета Вюрцбурга, для богатых и ценные замечания. Мы также благодарим Deutsche Forschungsgemeinschaft (DFG, грант Mu-2831/1-1) для финансирования.

Materials

Name of the reagent Company Comments
Internet access   Preferably high-speed
ITS2 Database9 Department of Bioinformatics, University of Würzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 Department of Bioinformatics, University of Würzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 Department of Bioinformatics, University of Würzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE – A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. o. l. f. g. a. n. g. ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Play Video

Cite This Article
Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

View Video