Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

De ITS2 Database

Published: March 12, 2012 doi: 10.3791/3806

Summary

De ITS2 Database is een werkbank voor fylogenetische gevolgtrekking tegelijkertijd overweegt volgorde en de secundaire structuur van het inwendige overgeschreven afstands 2. Dit omvat het verzamelen van gegevens met de juiste annotatie, structuur voorspelling, multiple sequence alignment-structuur en snelle boom berekening. In een notendop is dit werkbank vereenvoudigt de eerste fylogenetische analyses om een ​​paar klikken.

Abstract

De inwendige overgeschreven afstands 2 (ITS2) werd gebruikt als een fylogenetische marker voor meer dan twee jaar. Als ITS2 onderzoek voornamelijk gericht op de zeer variabel ITS2 volgorde, dan beperkt deze markering aan low-level phylogenetics alleen. De combinatie van de ITS2 sequentie en de sterk geconserveerd secundaire structuur verbetert de resolutie fylogenetische 1 en kan op verschillende fylogenetische conclusie taxonomisch rijen, waaronder soorten begrenzing 2-8.

De ITS2 Database 9 vormt een complete dataset van inwendige overgeschreven afstands twee sequenties uit NCBI GenBank 11 nauwkeurig reannotated 10. Naar aanleiding van een aantekening van het profiel van Hidden Markov Models (HMMs), wordt de secundaire structuur van elke sequentie voorspeld. Eerst wordt getest of een minimaal energieverbruik gebaseerd vouw 12 (direct voudig) resulteert in een juiste, vier helixconformatie. Indien dit niet het geval de constructievoorspeld door homologie modellen 13. In homologie modellering, een reeds bekende secundaire structuur wordt overgedragen aan een andere ITS2 reeks, waarvan de secundaire structuur was niet in staat om correct te vouwen in een directe vouw.

De ITS2 Database is niet alleen een database voor de opslag en het terugvinden van ITS2 sequentie-structuren. Het biedt ook een aantal tools om het verwerken van uw eigen ITS2 sequenties, inclusief annotatie, structurele voorspelling, motief detectie en BLAST 14 zoekresultaten op de gecombineerde sequentie-structuur informatie. Bovendien integreert het gesneden versies van 4SALE 15,16 en ProfDistS 17 voor meervoudige sequentie-structuur alignment berekening en Neighbor Deelnemen aan 18 boom wederopbouw. Samen vormen ze een coherente analyse pijpleiding van een eerste reeks van sequenties van een fylogenie op basis van volgorde en secundaire structuur.

In een notendop is dit werkbank vereenvoudigt de eerste fylogenetische analyses alleeneen paar muisklikken, terwijl bovendien het verstrekken van hulpmiddelen en gegevens voor uitgebreide grootschalige analyses.

Protocol

1. Correcte Annotatie van ITS2 Sequence

  1. Toegang tot de ITS2 Database fylogenie werkbank hier: http://its2.bioapps.biozentrum.uni-wuerzburg.de
  2. Begin uw analyse door te klikken op de "Annotate" icoon in de rubriek 'Extra'. Vervolgens typt u of uw volgorde te plakken in de sequence editor aan de bovenkant van de website. De sequence editor controleert automatisch, of uw ITS2 sequenties geldig zijn.
  3. Kies een HMM model geschikt is voor uw sequenties (bijv. Viridiplantae voor planten).
  4. Start het proces door te klikken op "annoteren."
  5. Door de muisaanwijzer op de "hybridiseren" icoon kunt u een afbeelding van de 5,8 s en 28S rRNA hybride als een bevestiging van de nauwkeurigheid van de HMM annotatie's.
  6. Klik op de groene plus-teken van de daaruit voortvloeiende ITS2 volgorde aan uw manier van secundaire structuur voorspelling te selecteren: Om de structuur te voorspellen zonder een bekende template, klik op "Voorspel structuur." Als u wilt uw eigen template te gebruiken voor de Homologie Modeling, klikt u op "Model structuur."

2. Secundaire structuur Voorspelling

  1. Voorspellen
    1. De geannoteerde ITS2 sequentie wordt automatisch geplakt in de sequence editor.
    2. Om de secundaire structuur voorspelling met de standaard instellingen te starten, klikt u op "Voorspel structuren" knop.
    3. Sla het ITS2 volgorde inclusief de gemodelleerde secundaire structuur in de data pool door te klikken op het groene plus-teken en vervolgens op "Voeg toe aan zwembad." Als alternatief kunt u deze toevoegen aan uw datapool via slepen en neerzetten (figuur 1).
    4. Indien de sequentie niet rechtstreeks vouwen worden de beste resultaten van de homologie modellering weergegeven. Sla de meest geschikte sequentie-structuur via slepen en neerzetten om de gegevens zwembad. Als alternatief, behalve de sequentie-structuur in de data zwembad met een klik met de rechtermuisknop en dan een klik op "Voeg toe aan zwembad."
  2. Aangepast Modeling
    1. Typ of plak een of meerdere sjablonen (met een bekende structuur) in de bovenste sequence editor.
    2. Typ of plak een of meerdere doelsequenties (zonder structuur) in de onderste sequence editor.
    3. Klik op "Voorspel de beste template (s)" om de Homologie Modeling met de standaard instellingen te starten.
    4. De beste template-target combinaties in de lijst zelf.
    5. Ofwel Sla de gemodelleerde sequentie-structuur (s) van uw keuze via slepen en neerzetten om de gegevens zwembad of door een klik met de rechtermuisknop en klik op "Voeg toe aan zwembad."

3. Motief Zoeken

  1. Typ of uw vraag sequentie (s) plakken in de sequence editor aan de bovenkant van de website.
  2. Kies de juiste HMM model (bv. Viridiplantae voor planten). 3.3. Klik op "Motif zoeken" om het proces te starten.
  3. ITS2 sequenties met opvallende motieven zijn illustratiested onderaan de website.
  4. Klik op het icoontje naast de volgorde header om de motieven gemarkeerd in de secundaire structuur weer te geven.

4. Zoek en Bladeren

  1. Zoeken
    1. Type ofwel een taxon naam of een GenBank Identifier (GI) in het zoekveld aan de bovenkant van de website.
    2. Een zoektocht door taxon naam wordt ondersteund door een verschijnen live-zoekvak.
    3. U kunt een meerdere zoekopdracht door komma's scheiden van uw vragen.
    4. Klik op de knop 'Zoeken' om de zoekopdracht uit te voeren.
    5. Uw resultaten verschijnen in een nieuw tabblad.
    6. Klik op de naam van een kolom om de resultaten te sorteren op de betreffende kolom. U kunt ook of kolommen van uw keuze te verwijderen met de kolom-menu. De kolom menu kan bereikt worden met een klik op de verschijning pijl in naam van een kolom.
    7. Klik op "Toon details" om de details van een sequentie-structuur weer te geven. </ Li>
    8. Ofwel Sla de sequentie-structuur (s) van uw keuze via slepen en neerzetten om de gegevens zwembad of door een klik met de rechtermuisknop en klik op "Voeg toe aan zwembad."
    9. Om uw resultaten op te slaan naar een extern bestand, klik op "Bewaar selectie" of "Save All".
  2. Bladeren
    1. Blader door de ITS2 database door te navigeren via de boomstructuur aan de linkerkant van de website.
    2. Klik op een plus-teken voor de taxa een niveau lager weer te geven.
    3. Klik op een taxon naam aan een nieuw tabblad met elke sequentie-structuur van het taxon te openen.
    4. Klik op "Toon details" om de details van een sequentie-structuur paar te bekijken.
    5. Ofwel Sla de sequentie-structuur (s) van uw keuze via slepen en neerzetten om de gegevens zwembad of door een klik met de rechtermuisknop en klik op "Voeg toe aan zwembad."
    6. Om uw resultaten op te slaan naar een extern bestand, klik op "Bewaar selectie" of "Save All".

5. ITS2 Blast

  1. Typ of plak een of meerdere query-sequenties in de sequence editor. Uw sequenties kunnen ofwel gewoon nucleotidesequenties of sequentie-structuur paren. U kunt ook een aantal secundaire structuren onder een reeks. Door het vakje "Serialize XXFASTA sequenties" deze structuren worden vervolgens als individuele vragen gebruikt.
  2. Om BLAST met de standaard instellingen te starten, klikt u op "Blast." Afhankelijk van de aard van uw zoekopdracht, hetzij een gemeenschappelijke BLASTN of ITS2 sequentie-structuur BLAST uitgevoerd.
  3. Een sub-tab wordt geopend voor elke query sequentie binnen de verschijning tabblad "BLAST resultaten," evenals een overzicht van de uitgevoerde zoekopdrachten.
  4. Klik op "Show Afstemming" om de berekende BLAST uitlijningen te bekijken.
  5. Ofwel Sla de BLAST-hits van uw keuze via slepen en neerzetten om de gegevens zwembad of door een klik met de rechtermuisknop en klik op "Voeg toe aan zwembad."
  6. Om uw resultaten op te slaan naar een extern bestand, klik op "Opslaan selectie"Of" Save All ".

6. Meervoudige sequentie-uitlijning structuur

  1. Neem een ​​kijkje op uw gegevens zwembad door te klikken op "Manage dataset" en dan op het vergrootglas-symbool rechts naast het aantal sequenties in uw zwembad. U kunt ook klikken op de datapool teken in de linkerbenedenhoek van de website.
  2. Klik op een sequentie-structuur paar in uw gegevens zwembad om de details te bekijken.
  3. Om een ​​meervoudige sequentie-structuur uitlijning van alle sequentie-structuur paren in de pool aan te maken, klik op "Analyseer dataset" en dan "Sequence & Structuur."
  4. Nu wordt u gevraagd om de grafische modus van je karakter te selecteren. Als je karakter bevat slechts een paar sequenties, weigeren de slanke modus door te klikken op "Nee." Anders kiest u de slanke grafische modus door te klikken op "Ja".
  5. In enkele ogenblikken wordt je karakter getoond in een nieuw tabblad (figuur 2). Bovendien is het automatisch opgeslagen in de datapool.
  6. Om je op te slaanaanpassing aan een extern bestand, klikt u op "Save uitlijning."

7. Fylogenetische boom

  1. Om een ​​sequentie-structuur op basis van Neighbor Deelnemen aan boom van uw meerdere afstemming te berekenen, klik op "Analyseer Dataset" en dan "Neighbor Deelnemen."
  2. De resulterende is afgebeeld in een nieuwe tab (figuur 3).
  3. Vrij Schaal uw boom met de schuifbalk "Zoom boom."
  4. Reroot uw boom door te klikken op een knoop of blad van de boom en vervolgens op "Reroot op dit knooppunt."
  5. Als u een taxon uit uw data pool te verwijderen, klikt u op het blad en kies "Verwijder deze knoop uit het zwembad." Nu kun je herberekenen je karakter en de boom met de verminderde taxon bemonstering.
  6. Klik op "Opslaan boom" om uw stamboom op te slaan als een eindresultaat van de analyse naar een extern Newick bestand.

8. Aanvullende software

  1. Klik op "Over deze website" - "Tools" te vinden extra op de hoogteatie over de stand-alone tools 4SALE en ProfDistS.
  2. Naast de afstemming en de naaste Deelnemen aan de functie die door de ITS2 Database web-interface, kunt u nu toegang tot een aantal nieuwe functies, zoals soorten die afbakening op basis van compenserende basis veranderingen (CBCS).

9. Representatieve resultaten

De workflow zoals hierboven beschreven met succes is toegepast in verschillende open toegang enquêtes 3,4. Voorbeelden kunt u bekijken via de volgende links:

In deze grootschalige onderzoeken, konden we de fylogenie van de Chlorophyta en Hypnales (Bryophyta) w op te lossenet hoge resolutie. In beide gevallen werd een uitgebreide taxon steekproef verzameld uit de ITS2 Database 9, automatisch afgestemd op 4SALE 15,16 en ten slotte verwerkt door ProfDistS 17 in een fylogenetische boom. In al deze stappen zijn sequentie en de structuur informatie gelijktijdig gebruikt. Bootstrap ondersteuning voor de fylogenetische backbone werd bereikt met Profile Neighbor Deelnemen aan (PNJ) 19, dat beschikbaar is in de stand-alone versie van ProfDistS.

Voor een kleiner aantal van sequentie-structuur paren, figuren 1 tot 3 beschrijven de belangrijkste stappen van deze geautomatiseerde workflow 5 rechtstreeks op de nieuwe ITS2 Database werkbank: taxon bemonstering, de meervoudige sequentie-structuur uitlijning en uiteindelijk de fylogenetische boom berekening.

Figuur 1
Figuur 1. Taxon bemonstering per slepen en neerzetten. Op elk moment sequenties of sequentie-structureel e paren kunnen worden toegevoegd aan de datapool, bijvoorbeeld via slepen en neerzetten. Hier een sequentie-structuur wordt toegevoegd met behulp van drag and drop na secundaire structuur voorspelling. De blauwe ellips markeert het gebied waar de sequentie-structuur is gedaald in de datapool. Klik hier om de grotere versie van deze foto te bekijken.

Figuur 2
Figuur 2. Meervoudige sequentie-structuur van de aanpassing op volledige grafische modus. Voor enkele sequenties in de data pool werd het volledige grafische weergave gekozen. Bases zijn gekleurd; baseparen kunnen worden gemarkeerd met rode cirkels door te klikken op een basis of houder van een basepaar. Klik hier om de grotere versie van deze foto te bekijken.

3.jpg "alt =" Afbeelding 3 "/>
Figuur 3. Sequentie-structuur Neighbor Deelnemen boom. De vrij schaalbare boom berekend van een zeven taxa meervoudige sequentie-structuur uitlijning kan worden opgeslagen in de Newick formaat.

Discussion

De ITS2 Database is een complete en volledig functionele werkbank voor de inwendige overgeschreven afstands 2 sequentie-structure-based phylogenetics. De website kan heel snel en intuïtief te bedienen. Terwijl andere web-based fylogenie werkbanken, zoals ARB 20 of Mobyle 21 zijn alleen in staat om te werken aan sequentie en / of consensus structuur van informatie, het ITS2 Database 9 beschouwt sequenties en individuele secundaire structuren voor elk taxon tegelijk. Echter, als gevolg van beperkingen in de rekencapaciteit van de webserver, is het sterk aanbevolen om de stand-alone tools te gebruiken voor meerdere uitlijning en Neighbor Deelnemen aan 18 berekening, 4SALE 15,16 en ProfDistS 17, respectievelijk voor grote datasets. Naast de basis ITS2 sequentie-structuur fylogenie workflow 5, deze tools zijn voorzien van een aantal extra functies, zoals het berekenen van bootstrap repliceert, Profiel Neighbor Deelnemen aan (PNJ) 19 of species afbakening op basis van compenserende basis veranderingen (CBCS) 8. Ze zijn toegankelijk via de "Over deze website" - "Tools" voor download en gedetailleerde informatie. Om 4SALE en ProfDistS gebruiken, is het noodzakelijk brengen altijd bestanden naar het juiste formaat. Een taxon dat monsters worden verwerkt door 4SALE moet het einde. FASTA of. Txt, terwijl de sequentie-structuur alignment als input voor ProfDistS moet eindigen met. Xfasta.

We zijn momenteel de uitvoering van alternatieve methoden voor fylogenetische boom wederopbouw in de ITS2 database en in de gerelateerde tools. Zo zal methoden, zoals sequentie-structuur op basis van Maximum Parsimony 22 en / of Maximum Likelihood 23 toegankelijk zijn in de toekomst.

Disclosures

Geen belangenconflicten verklaard.

Acknowledgments

Wij van harte bedanken de ITS2 groep, Biocenter, Universiteit van Würzburg, voor rijke en waardevolle feedback. We danken ook de Deutsche Forschungsgemeinschaft (DFG, subsidie ​​Mu-2831/1-1) voor de financiering.

Materials

Name Company Catalog Number Comments
Internet access Preferably high-speed
ITS2 Database9 University of Warzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 University of Warzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 University of Warzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

DOWNLOAD MATERIALS LIST

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Tags

Genetica uitlijning inwendige overgeschreven afstands 2 moleculaire systematiek secundaire structuur ribosomaal RNA fylogenetische boom homologie modellering fylogenie
De ITS2 Database
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Merget, B., Koetschan, C., Hackl,More

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter