Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Die ITS2 Database

Published: March 12, 2012 doi: 10.3791/3806

Summary

Die ITS2 Datenbank ist eine Werkbank für phylogenetische Schluß gleichzeitiger Berücksichtigung Sequenz und der Sekundärstruktur der internen transkribierten Spacer 2. Dazu gehören die Datenerfassung mit genauen Anmerkungen, die Vorhersage, multiples Sequenz-Alignment-Struktur und schnelle Berechnung Baum. Auf den Punkt gebracht, erleichtert es das erste Werkbank phylogenetische Analysen auf ein paar Klicks.

Abstract

Die internen transkribierten Spacer 2 (ITS 2) wurde als phylogenetischer Marker wurden für mehr als zwei Jahrzehnten eingesetzt. Als ITS2 Forschung vor allem auf die sehr variable ITS2 Sequenz konzentriert, es auf diese Markierung, um Low-Level-Phylogenetik nur beschränkt. Jedoch verbessert die Kombination der ITS2-Sequenz und die hoch konservierten Sekundärstruktur die phylogenetische Auflösung 1 und erlaubt phylogenetischen Folgerung bei mehreren Reihen taxonomische, einschließlich Spezies Abgrenzung 2-8.

Die ITS2 Datenbank 9 bilden eine vollständige Datensatz der internen transkribierten Spacer 2 Sequenzen aus NCBI GenBank 11 akkurat reannotated 10. Nach einer Anmerkung durch Profile Hidden Markov Models (HMM), wird die sekundäre Struktur von jeder Sequenz vorhergesagt. Zuerst wird bestimmt, ob eine Mindestenergie bezogen Falz 12 (direkt fach) zu einer korrekten, Vier-Helix-Konformation getestet. Ist dies nicht der Fall ist, ist die Strukturvorhergesagt durch Homologiemodellierung 13. In Homologiemodellierung, ein bereits bekannter Sekundärstruktur zu einem anderen ITS2 Sequenz übertragen wird, war deren sekundäre Struktur nicht in der Lage, korrekt zu falten in einem direkten fache.

Die ITS2 Database ist nicht nur eine Datenbank zum Speichern und Abrufen der ITS2-Sequenz-Strukturen. Es bietet auch verschiedene Tools, um Ihre eigene ITS2 Sequenzen, einschließlich Anmerkungen, strukturelle Voraussage, Motiv-Erkennung und 14 BLAST Suche auf der kombinierten Sequenz-Struktur-Informationen zu verarbeiten. Darüber hinaus integriert es getrimmten Versionen von 4SALE 15,16 und 17 für ProfDistS multiples Sequenz-Alignment-Struktur Berechnung und Neighbor Joining 18 Baum Rekonstruktion. Zusammen bilden sie eine kohärente Analyse-Pipeline von einer anfänglichen Menge von Sequenzen zu einer Phylogenie auf Sequenz und der Sekundärstruktur basiert.

Auf den Punkt gebracht, erleichtert es das erste Werkbank phylogenetische Analysen auf nurein paar Mausklicks, während zusätzlich die Bereitstellung von Tools und Daten für umfassende groß angelegte Analysen.

Protocol

1. Korrekte Annotation von ITS2 Sequence

  1. Besuchen Sie das ITS2 Database Workbench Phylogenie hier: http://its2.bioapps.biozentrum.uni-wuerzburg.de
  2. Beginnen Sie Ihre Analyse über die Schaltfläche "Kommentieren"-Symbol in der Sektion "Tools". Dann geben oder fügen Sie Ihre Sequenz in die Sequenz-Editor am oberen Rand der Website. Der Sequenz-Editor prüft automatisch, ob Ihr ITS2 Sequenzen gültig sind.
  3. Wählen Sie ein HMM-Modell eignet sich für Ihre Sequenzen (zB Viridiplantae für Pflanzen).
  4. Starten Sie den Vorgang durch Klicken auf "Kommentieren".
  5. Durch Überfahren des "hybridisieren"-Symbol können Sie ein Bild des 5.8S und 28S-rRNA-Hybrid als eine Bestätigung der HMM-Annotation die Genauigkeit anzuzeigen.
  6. Klicken Sie auf das grüne Pluszeichen des resultierenden ITS2 Sequenz auf dem Weg der Sekundärstruktur Vorhersage wählen: Um die Struktur ohne eine bekannte templat vorhersagene, klicken Sie auf "Predict Struktur." Wenn Sie eine eigene Vorlage für die Homologiemodellierung verwenden möchten, klicken Sie auf "Modell-Struktur."

2. Sekundärstruktur Vorhersage

  1. Vorhersagen
    1. Die kommentierte ITS2 Sequenz wird automatisch in die Sequenz-Editor eingefügt.
    2. Um die Sekundärstruktur Vorhersage mit den Standardeinstellungen zu starten, klicken Sie auf die "Predict Strukturen"-Taste.
    3. Speichern Sie die resultierende Sequenz ITS2 einschließlich der modellierten sekundären Struktur in den Datenpool, indem Sie auf das grüne Plus-Zeichen und dann auf "Hinzufügen zu bündeln." Alternativ können Sie es auf Ihre Daten Pool hinzufügen per Drag and Drop (Abbildung 1).
    4. Wenn die Sequenz konnte nicht direkt aussteigen, werden die besten Ergebnisse der Homologie-Modellierung gezeigt. Speichern Sie die am besten geeignete Sequenz-Struktur per Drag & Drop auf den Datenpool. Alternativ speichern Sie die Sequenz-Struktur in den Daten-Pool mit einem Rechtsklick und dann ein Klick auf "In den Pool."
  2. Benutzerdefinierte Modeling
    1. Geben oder fügen Sie eine oder mehrere Vorlagen (mit bekannter Struktur) in die obere Sequenz-Editor.
    2. Geben oder fügen Sie ein oder mehrere Zielsequenzen (ohne Struktur) in die untere Sequenz-Editor.
    3. Klicken Sie auf "Predict beste Vorlage (n)", um die Homologiemodellierung mit den Standardeinstellungen zu starten.
    4. Die besten Template-Target-Kombinationen sind in der resultierenden Liste angezeigt.
    5. Speichern Sie die modellierten Sequenz-Struktur (en) Ihrer Wahl entweder per Drag & Drop auf den Datenpool oder durch einen Rechtsklick und einem Klick auf "In den Pool."

3. Motif-Suche

  1. Geben oder fügen Sie Ihre Anfrage Sequenz (en) in die Sequenz-Editor am oberen Rand der Website.
  2. Wählen Sie die richtige HMM-Modell (zB Viridiplantae für Pflanzen). 3.3. Klicken Sie auf "Motivsuche", um den Vorgang zu starten.
  3. ITS2 Sequenzen mit hervorgehobenen Motive sind AbbildungenTed am unteren Rand der Webseite.
  4. Klicken Sie auf das Symbol neben der Sequenz-Header, um die Motive in der Sekundärstruktur hervorgehoben angezeigt wird.

4. Suchen und Stöbern

  1. Suche
    1. Geben Sie entweder ein Name oder ein Taxon GenBank Identifier (GI) in das Suchfeld am oberen Rand der Website.
    2. Eine Suche nach Taxon Name wird von einem erscheinende Live-Suchfeld unterstützt.
    3. Sie können eine mehrere Suchbegriffe durch Kommata getrennt Ihre Fragen.
    4. Klicken Sie auf die Schaltfläche "Suchen", um die Suche auszuführen.
    5. Ihre Ergebnisse erscheinen in einem neuen Tab angezeigt.
    6. Klicken Sie auf einen Spaltennamen, um die Ergebnisse entsprechend der jeweiligen Spalte zu sortieren. Sie können auch Spalten hinzufügen oder entfernen Ihrer Wahl mit der Spalte Menü. Die Spalte-Menü kann mit einem Klick auf das Pfeil-Icon erscheint innerhalb einer Spalte Name eingegeben werden.
    7. Klicken Sie auf "Details anzeigen", um die Details einer Sequenz-Struktur zu sehen. </ Li>
    8. Speichern Sie die Sequenz-Struktur (en) Ihrer Wahl entweder per Drag & Drop auf den Datenpool oder durch einen Rechtsklick und einem Klick auf "In den Pool."
    9. Um Ihre Ergebnisse in eine externe Datei zu speichern, dann auf "Speichern Auswahl" oder klicken Sie auf "Save all".
  2. Blättern
    1. Durchsuchen Sie die Datenbank ITS2 durch das Navigieren durch die Baumstruktur auf der linken Seite der Website.
    2. Klicken Sie auf ein Pluszeichen, um die Taxa eine Ebene tiefer zu sehen.
    3. Klicken Sie auf ein Taxon-Namen, um eine neue Registerkarte mit jeder Sequenz-Struktur des Taxons zu öffnen.
    4. Klicken Sie auf "Details anzeigen", um die Details einer Sequenz-Struktur-Paar zu sehen.
    5. Speichern Sie die Sequenz-Struktur (en) Ihrer Wahl entweder per Drag & Drop auf den Datenpool oder durch einen Rechtsklick und einem Klick auf "In den Pool."
    6. Um Ihre Ergebnisse in eine externe Datei zu speichern, dann auf "Speichern Auswahl" oder klicken Sie auf "Save all".

5. ITS2 Explosion

  1. Geben oder fügen Sie ein oder mehrere Abfrage-Sequenzen in die Sequenz-Editor. Ihre Sequenzen können entweder einfache Nukleotid-Sequenzen oder Sequenz-Struktur-Paaren sein. Sie können auch mehrere sekundäre Strukturen unterhalb einer Sequenz. Indem Sie das Kontrollkästchen "Serialize XXFASTA Sequenzen" diese Strukturen anschließend als einzelne Abfragen verwendet werden.
  2. Um BLAST mit den Standardeinstellungen zu starten, klicken Sie auf "Blast." Je nach Art der Abfrage, entweder eine gemeinsame BLASTN oder die ITS2-Sequenz-Struktur BLAST durchgeführt wird.
  3. Ein Sub-Register wird für jede Abfrage-Sequenz innerhalb der erscheinenden Registerkarte geöffnet "BLAST-Ergebnisse", sowie einen Überblick über die ausgeführten Recherchen.
  4. Klicken Sie auf "Show Alignments", um die berechneten BLAST Ausrichtungen anzuzeigen.
  5. Speichern Sie die BLAST-Hits Ihrer Wahl entweder per Drag & Drop auf den Datenpool oder durch einen Rechtsklick und einem Klick auf "In den Pool."
  6. Um Ihre Ergebnisse in eine externe Datei zu speichern, auf "Speichern Auswahl klicken"Oder" Alle speichern. "

6. Multiple Sequenz-Struktur-Alignment

  1. Werfen Sie einen Blick auf Ihre Datenpool durch Klick auf "Verwalten Datensatz" und dann das Lupensymbol rechts neben der Anzahl der Sequenzen in Ihrem Pool. Alternativ können Sie auch auf dem Daten-Pool Zeichen am unteren Rand der Website links klicken.
  2. Klicken Sie auf eine Sequenz-Struktur-Paar in den Daten-Pool, um dessen Details anzuzeigen.
  3. Um eine mehrfache Sequenz-Struktur-Ausrichtung aller Sequenz-Struktur-Paare in Ihrem Pool zu erstellen, auf "Analyze Datensatz" klicken und dann "Sequenz und Struktur."
  4. Nun werden Sie gefragt, um die Grafik-Modus Ihres Ausrichtung wählen. Wenn Ihre Ausrichtung enthält nur wenige Sequenzen, sinken die schlanke Modus, indem Sie auf "Nein!" Andernfalls wählen Sie die schlanken grafischen Modus, indem Sie auf "Ja."
  5. In wenigen Augenblicken ist Ihre Ausrichtung in einem neuen Tab (Abbildung 2) gezeigt. Darüber hinaus wird es automatisch auf den Datenpool gespeichert.
  6. Um Ihre sparenAusrichtung auf eine externe Datei, klicken Sie auf "Speichern Ausrichtung."

7. Stammbaum

  1. Um eine Sequenz-Struktur-basierte Nachbar Joining Baum des multiplen Alignment zu berechnen, auf "Analyze Dataset" klicken und dann "Neighbor Joining".
  2. Der resultierende Baum wird in einem neuen Tab (Abbildung 3) dargestellt.
  3. Skalieren Sie Ihr Baum frei mit der Scroll-Leiste "Zoom Baum."
  4. Reroot Ihren Baum mit einem Klick auf einen Knoten oder Blatt des Baumes und dann "Reroot an diesem Knoten."
  5. Wenn Sie ein Taxon aus Ihren Daten-Pool entfernen möchten, klicken Sie auf das Blatt, und wählen Sie "Entfernen Sie diesen Knoten aus Pool." Jetzt können Sie Ihre neu berechnen Alignment und Baum mit dem reduzierten Taxon Probenahme.
  6. Klicken Sie auf "Speichern Baum", um Ihren Stammbaum als endgültiges Ergebnis Ihrer Analyse an ein externes NEWICK Datei zu speichern.

8. Zusätzliche Software

  1. Klicken Sie auf "Über diese Website" - "Extras" finden Sie weitere informierenation über den Stand-Alone-Tools 4SALE und ProfDistS.
  2. Neben der Ausrichtung und Neighbor Joining-Funktion durch die ITS2 Database Web-Interface zur Verfügung gestellt haben, können Sie nun Zugriff auf einige neue Funktionen, z. B. Arten Abgrenzung auf kompensatorische Basenänderungen (CBC) basieren.

9. Repräsentative Ergebnisse

Der Workflow, wie oben beschrieben wurde erfolgreich in mehreren Open-Access-Befragungen 3,4 angewandt worden. Beispiele können über die folgenden Links eingesehen werden:

In diesen groß angelegte Studien, konnten wir die Phylogenie der Chlorophyta sowie Hypnales (Bryophyta) w lösenit Hochauflösung. In beiden Fällen wurde eine erschöpfende Taxon Probenahme aus der Datenbank ITS2 9, automatisch mit 4SALE 15,16 ausgerichtet gesammelt und schließlich durch ProfDistS 17 in einen phylogenetischen Baum verarbeitet. In all diesen Schritten wurden Sequenz und Struktur Informationen gleichzeitig verwendet. Bootstrap Unterstützung für die phylogenetische Rückgrat wurde durch die Verwendung Profil Nachbar Fügen (NPC) 19, die in der Standalone-Version von ProfDistS ist.

Für eine kleinere Gruppe von Sequenz-Struktur-Paare, beschreiben Abbildungen 1 bis 3 die wichtigsten Schritte dieser automatisierten Workflow-5 direkt auf der neuen ITS2 Database Workbench: Taxon Probenahme, die multiples Sequenz-Alignment-Struktur und schließlich die Berechnung phylogenetischer Baum.

1
Abbildung 1. Taxon Probenahme per Drag and Drop. Zu jeder Zeit können Sequenzen oder Sequenz-structur e-Paare können auf den Datenpool aufgenommen werden, zum Beispiel per Drag and Drop. Hier wird eine Sequenz-Struktur hinzugefügt wird per Drag & Drop nach Sekundärstruktur Vorhersage. Die blaue Ellipse markiert den Bereich, wo die Sequenz-Struktur in den Daten-Pool fallen gelassen wird. Klicken Sie hier, um die Full-Size-Version dieses Bildes zu sehen.

2
Abbildung 2. Multiple Sequenz-Struktur-Ausrichtung in voller Grafik-Modus. Für die wenigen Sequenzen im Datenpool wurde die volle Grafik-Modus gewählt. Basen sind farbig; Basenpaare kann mit roten Kreisen, indem Sie auf ein Basis-oder Halter von einem Basenpaar hervorgehoben werden. Klicken Sie hier, um die Full-Size-Version dieses Bildes zu sehen.

3.jpg "alt =" Bild 3 "/>
Abbildung 3. Sequenz-Struktur-Nachbar-Joining-Baum. Das frei skalierbare Baum von einem sieben Taxa multiples Sequenz-Alignment berechnet Struktur kann in der NEWICK Format gespeichert werden.

Discussion

Die ITS2 Database ist ein komplettes und voll funktionsfähiges Werkbank für den internen transkribierten Spacer 2-Sequenz-Struktur-basierte Phylogenetik. Die Website ist sehr schnell und intuitiv zu bedienen. Während andere Web-basierte Phylogenese Werkbänken wie ARB 20 oder Mobyle 21 nur in der Lage, auf Reihenfolge und / oder Informationen Konsensus-Struktur zu arbeiten, hält die ITS2 Datenbank 9 Sequenzen und einzelnen Sekundärstrukturen für jedes Taxon gleichzeitig. Jedoch aufgrund von Einschränkungen in der Rechenkapazität des Web-Servers, ist es sehr empfehlenswert, um die Stand-alone-Werkzeuge für multiple Alignment und Neighbor Joining 18 Berechnung, 4SALE 15,16 ProfDistS und 17, jeweils für große Datenmengen nutzen. Neben der grundlegenden ITS2 Sequenz-Struktur Phylogenie Workflow-5, zeichnen sich diese Werkzeuge an zusätzlichen Funktionen, wie die Berechnung Bootstrap-Wiederholungen, Profil Nachbar Fügen (NPC) 19 oder species Begrenzung auf kompensatorische Basenänderungen (CBC) 8 basiert. Abschnitt "Tools" zum Download und ausführliche Informationen - Sie können durch das "Über diese Website" zugegriffen werden. Um 4SALE und ProfDistS verwenden, ist es notwendig zu bringen immer Dateien in das richtige Format. Ein Taxon von der Probenahme bis 4SALE verarbeitet werden müssen haben die Endung. FASTA oder. Txt, während die Sequenz-Struktur-Ausrichtung als Input für ProfDistS müssen. Xfasta beenden.

Wir sind derzeit die Umsetzung alternativer Methoden zur Rekonstruktion phylogenetischer Baum in der ITS2 Datenbank sowie in den zugehörigen Werkzeugen. So werden Methoden wie Sequenz-Struktur-basierte Maximum Parsimony 22 und / oder Maximum Likelihood 23 zugänglich sein, in der Zukunft.

Disclosures

Keine Interessenskonflikte erklärt.

Acknowledgments

Wir bedanken uns herzlich die ITS2 Gruppe, Biozentrum, Universität Würzburg, für die Reichen und wertvolles Feedback. Wir danken der Deutschen Forschungsgemeinschaft (DFG; Zuschuss Mu-2831/1-1) für die Finanzierung.

Materials

Name Company Catalog Number Comments
Internet access Preferably high-speed
ITS2 Database9 University of Warzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 University of Warzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 University of Warzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

DOWNLOAD MATERIALS LIST

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Tags

Genetik Ausgabe 61 Ausrichtung internen transkribierten Spacer 2 Molekulare Systematik Sekundärstruktur ribosomalen RNA Stammbaum Homologiemodellierung Phylogenie
Die ITS2 Database
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Merget, B., Koetschan, C., Hackl,More

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter