Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Den ITS2 Database

Published: March 12, 2012 doi: 10.3791/3806

Summary

Den ITS2 Database er et arbejdsbord for fylogenetisk følgeslutning samtidig betragtning sekvens og sekundære struktur af det indre transkriberede spacer 2. Dette omfatter indsamling af data med nøjagtig annotation, struktur forudsigelse, multipel sekvens-struktur tilpasning og hurtig træ beregning. I en nøddeskal, forenkler denne arbejdsbord første fylogenetiske analyser til nogle få klik.

Abstract

Indre transkriberet spacer 2 (ITS2) er blevet anvendt som en phylogenetisk markør for mere end to årtier. Som ITS2 forskning primært fokuseret på den meget variable ITS2 sekvens, er det begrænset denne markør til lav-niveau fylogeni kun. Imidlertid kombinationen af ITS2 sekvensen og dens stærkt bevaret sekundære struktur forbedrer fylogenetiske opløsning 1 og tillader fylogenetisk inferens på flere taksonomiske rækker, herunder arter afgrænsning 2-8.

Den ITS2 database 9 viser en udtømmende datasæt af interne transskriberede spacer-2-sekvenser fra NCBI GenBank 11 nøjagtigt reannotated 10. Efter en anmærkning af profil skjulte Markov modeller (HMM'er), er den sekundære struktur af hver sekvens forudsagt. Først er det afprøves, om et minimalt energi baseret gange 12 (direkte fold) resulterer i en korrekt, fire helix kropsbygning. Hvis dette ikke er tilfældet, er strukturenforudsagt af homologimodellering 13. I homologimodellering, er en allerede kendt sekundær struktur overført til en anden ITS2 sekvens, hvis sekundære struktur er ikke i stand til at folde korrekt i en direkte fold.

Den ITS2 Database er ikke kun en database til lagring og genfinding af ITS2 sekvens-strukturer. Det giver også flere værktøjer til at behandle dine egne ITS2 sekvenser, herunder annotation, strukturelle forudsigelse, motiv afsløring og BLAST 14 søg på den kombinerede sekvens-struktur oplysninger. Desuden integrerer klippede versioner af 4SALE 15,16 og ProfDistS 17 for multipel sekvens-struktur tilpasning beregning og nabo Samling 18 træ genopbygning. Danner tilsammen en sammenhængende analyse rørledning fra et første sæt af sekvenser til en fylogeni baseret på sekvensen og sekundær struktur.

I en nøddeskal, forenkler denne arbejdsbord første fylogenetiske analyser kunet par museklik, mens yderligere giver værktøjer og data til omfattende store analyser.

Protocol

1. Korrekt Annotation af ITS2 sekvens

  1. Gå til ITS2 Database fylogeni arbejdsbord her: http://its2.bioapps.biozentrum.uni-wuerzburg.de
  2. Begynd din analyse ved at klikke på "Kommentér" ikonet i afsnittet "Tools." Så skriv eller indsæt sekvens i sekvens redaktør i toppen af ​​hjemmesiden. Rækkefølgen editor automatisk kontrollerer, om dine ITS2 sekvenser er gyldige.
  3. Vælg en HMM model passer til dine sekvenser (f.eks Viridiplantae for planter).
  4. Start processen ved at klikke på "Kommentér".
  5. Ved svævende over "hybridisere" ikonet kan du se et billede af 5.8S og 28S rRNA hybrid som en bekræftelse af HMM annotation nøjagtighed.
  6. Klik på det grønne plus-tegnet af den resulterende ITS2 sekvens for at vælge din måde af sekundær struktur forudsigelse: at forudsige struktur uden en kendt template, skal du klikke på "forudsige struktur." Hvis du vil bruge din egen skabelon for homologimodellering, klik på "Model struktur."

2. Sekundær struktur Prediction

  1. Forudsige
    1. Den kommenterede ITS2 sekvensen automatisk indsættes i den sekvens editor.
    2. For at starte den sekundære struktur forudsigelse med standardindstillingerne, skal du klikke på "forudsige strukturer" knappen.
    3. Gem den resulterende ITS2 sekvens herunder modellerede sekundære struktur i data puljen ved at klikke på det grønne plus-tegnet og derefter på "Føj til pool." Alternativt kan du føje den til dine data pool via træk og slip (fig. 1).
    4. Hvis sekvensen ikke kan folde direkte, er de bedste resultater homologimodellering vist. Gem den bedst egnede sekvens-struktur via træk og slip til data pool. Alternativt, gemme sekvens-struktur i data poolen med et højreklik og derefter et klik på "Tilføj til pool."
  2. Brugerdefineret Modeling
    1. Indtast, eller indsæt et eller flere skabeloner (med kendt struktur) i den øverste sekvens editor.
    2. Indtast, eller indsæt et eller flere målsekvenser (uden struktur) i den nedre sekvens editor.
    3. Klik på "Forudsig bedste template (s)" for at starte homologimodellering med standardindstillinger.
    4. De bedste template-target kombinationer er vist i den resulterende liste.
    5. Gem modellerede sekvens-struktur (r) efter eget valg enten via træk og slip til data pool eller ved at højreklikke og et klik på "Tilføj til pool."

3. Motiv Søg

  1. Indtast eller indsæt din forespørgsel sekvens (er) i sekvensen redaktør i toppen af ​​hjemmesiden.
  2. Vælg den rigtige HMM model (f.eks Viridiplantae for planter). 3,3. Klik på "Motiv søgning" for at starte processen.
  3. ITS2 sekvenser med fremhævet motiver er illuTED i bunden af ​​hjemmesiden.
  4. Klik på ikonet ved siden af ​​sekvens header for at vise motiverne fremhævet i den sekundære struktur.

4. Søg og Browse

  1. Søg
    1. Skriv enten et taxon navn eller en GenBank Identifier (GI) i søgefeltet øverst på hjemmesiden.
    2. En søgning efter taxon navn er understøttet af en optræder live-søgefeltet.
    3. Du kan udføre en multipel søgning ved komma-adskille dine forespørgsler.
    4. Klik på knappen "Søg" for at udføre søgningen.
    5. Dine resultater vises opført i et nyt faneblad.
    6. Klik på et kolonnenavn for at sortere dine resultater i henhold til den særlige kolonne. Du kan også tilføje eller fjerne kolonner efter eget valg med søjlen menuen. Kolonnen Menuen kan indtastes med et klik på den viste pil ikon i en kolonne navn.
    7. Klik på "Vis detaljer" for at se detaljerne i en sekvens-struktur. </ Li>
    8. Gem sekvens-struktur (r) efter eget valg enten via træk og slip til data pool eller ved at højreklikke og et klik på "Tilføj til pool."
    9. Hvis du vil gemme dine resultater til en ekstern fil, skal du klikke på "Gem valg" eller "Gem alle."
  2. Gennemse
    1. Gennemse ITS2 Database ved at navigere gennem træ-lignende struktur i venstre side af hjemmesiden.
    2. Klik på plus-tegnet for at se den taxa en lavere niveau.
    3. Klik på et taxon navn for at åbne en ny fane, der indeholder hver sekvens-struktur taxon.
    4. Klik på "Vis detaljer" for at se detaljerne i en sekvens-struktur par.
    5. Gem sekvens-struktur (r) efter eget valg enten via træk og slip til data pool eller ved at højreklikke og et klik på "Tilføj til pool."
    6. Hvis du vil gemme dine resultater til en ekstern fil, skal du klikke på "Gem valg" eller "Gem alle."

5. ITS2 Blast

  1. Indtast eller indsæt et eller flere forespørgsler sekvenser i den rækkefølge editor. Deres sekvenser kan enten være glatte nukleotidsekvenser eller sekvens-struktur par. Du kan også skrive flere sekundære strukturer under en sekvens. Ved at markere feltet "føljeton XXFASTA sekvenser" disse strukturer anvendes efterfølgende som individuelle forespørgsler.
  2. For at starte BLAST med standardindstillingerne, skal du klikke på "Blast". Afhængigt af arten af ​​din forespørgsel, enten en fælles BLASTN eller ITS2 sekvens-struktur BLAST udføres.
  3. En sub-fane åbnes for hver forespørgsel sekvens inden for de optræder fanebladet "BLAST Results", samt en oversigt over de udførte søgninger.
  4. Klik på "Vis Alignments" for at se de beregnede BLAST alignments.
  5. Gem BLAST hits efter eget valg enten via træk og slip til data pool eller ved at højreklikke og et klik på "Tilføj til pool."
  6. Hvis du vil gemme dine resultater til en ekstern fil, skal du klikke på "Gem valg"Eller" Gem alle. "

6. Multipel sekvens-struktur Alignment

  1. Tag et kig på dine data pool ved at klikke på "Administrer datasæt" og derefter på forstørrelsesglasset symbolet lige ved siden af ​​antallet af sekvenser i din pool. Alternativt kan du klikke på data poolen skilt nederst til venstre på hjemmesiden.
  2. Klik på en sekvens-struktur par i dine data pool for at se dens detaljer.
  3. Sådan oprettes et multiple sekvens-struktur tilpasningen af ​​alle sekvens-struktur par i din pool, skal du klikke på "Analyser datasæt" og derefter "Sequence & Structure".
  4. Nu bliver du bedt om at vælge den grafiske tilstand af din tilpasning. Hvis du er på linie indeholder kun nogle få sekvenser, afviser slanke modus ved at klikke på "Nej" Ellers skal du vælge den slanke grafiske tilstand ved at klikke på "Ja."
  5. I nogle få øjeblikke, er din linie vist i et nyt faneblad (Figur 2). Desuden er det automatisk til data pool.
  6. For at gemmetilpasning til en ekstern fil, skal du klikke på "Gem tilpasning."

7. Fylogenetisk træ

  1. Hvis du vil beregne en sekvens-struktur baseret Neighbor Samling træ af din multipel tilpasning, skal du klikke på "Analyser Dataset" og derefter "nabo Vær med."
  2. Den resulterende træet er illustreret i en ny fane (fig. 3).
  3. Skaler dit træ frit med rullepanelet "Zoom træ."
  4. Reroot dit træ ved at klikke på en node eller en af ​​træets blade og derefter "Reroot dette emne."
  5. Hvis du ønsker at fjerne en taxon fra dine data pool, klik på bladet og vælg "Fjern denne knude fra pulje." Nu kan du genberegne tilpasning og træ med den reducerede taxon prøveudtagning.
  6. Klik på "Gem træ" for at gemme dit fylogenetiske træ som et endeligt resultat af din analyse til en ekstern Newick fil.

8. Ekstra software

  1. Klik på "Om denne hjemmeside" - "Tools" for at finde yderligere informeretion om stand-alone-værktøjer 4SALE og ProfDistS.
  2. Udover justeringen og nabo Samling funktion, som den ITS2 Database web-interface, kan du nu få adgang til flere nye funktioner, f.eks arter afgrænsningsproblemer baseret på kompenserende baseændringerne (CBCs).

9. Repræsentative resultater

Arbejdsgangen, som beskrevet ovenfor, har med succes været anvendt i adskillige open access undersøgelser 3,4. Eksempler kan ses via nedenstående links:

I disse store undersøgelser, var vi i stand til at løse fylogeni af Chlorophyta samt Hypnales (Bryophyta) wi'te høj opløsning. I begge tilfælde blev en udtømmende taxon prøveudtagning indsamlet fra ITS2 database 9, automatisk tilpasses 4SALE 15,16 og endelig behandlet af ProfDistS 17 i et fylogenetisk træ. I alle disse trin, blev sekvens og struktur oplysninger, der bruges samtidig. Bootstrap støtte til fylogenetiske rygraden blev opnået ved hjælp Profil Neighbor sammenføjning (PNJ) 19, der er tilgængelig i den enkeltstående version af ProfDistS.

For et mindre sæt af sekvens-struktur par, beskriver figur 1 til 3. Det vigtige trin i denne automatiserede arbejdsproces 5 direkte på den nye ITS2 Database arbejdsbord: taxon prøveudtagning, multipel sekvens-struktur opretning og til sidst det fylogenetiske træ beregningen.

Figur 1
Figur 1. Taxon sampling pr træk og slip. Ved enhver tid sekvenser eller sekvens-struktu e par kan tilføjes til data pool, for eksempel via træk og slip. Her en sekvens-struktur er tilføjet ved hjælp af træk og slip efter sekundær struktur forudsigelse. Den blå ellipse markerer det område, hvor den sekvens-struktur er faldet i data puljen. Klik her for at se fuld størrelse version af dette billede.

Figur 2
Figur 2. Multipel sekvens-struktur tilpasning i fuld grafisk tilstand. For de få sekvenser i dataene pulje blev fuldt grafisk tilstand valgt. Baser er farvet; basepar kan blive fremhævet med røde cirkler ved at klikke på en base eller beslag af en base par. Klik her for at se fuld størrelse version af dette billede.

3.jpg "alt =" Figur 3 "/>
Figur 3. Sekvens-struktur nabo Sammenføjning træ. Den frit skalerbare træ beregnet for en syv taxa multipel sekvens-struktur tilpasning kan gemmes i Newick format.

Discussion

Den ITS2 Database er et komplet og fuldt funktionelt arbejdsbord til interne transskriberede spacer 2 sekvens-struktur-baserede fylogeni. Hjemmesiden kan betjenes meget hurtigt og intuitivt. Mens andre web-baserede fylogeni arbejdsbænke som ARB 20 eller Mobyle 21 er kun i stand til at arbejde på sekvens og / eller konsensus struktur oplysninger, ITS2 Database 9 mener sekvenser og individuelle sekundære strukturer for hver taxon samtidigt. Men på grund af begrænsninger i den beregningsmæssige kapacitet webserveren, anbefales det at bruge de enkeltstående værktøjer til multipel tilpasning og nabo Samling 18 beregning, 4SALE 15,16 og ProfDistS 17, henholdsvis for store datasæt. Udover den grundlæggende ITS2 sekvens-struktur, fylogeni workflow 5, har disse værktøjer en række yderligere funktioner, såsom beregning af bootstrap replikater, Profile Neighbor sammenføjning (PNJ) 19 eller species afgrænsning baseret på kompenserende baseændringerne (CBCs) 8. De kan tilgås via "Om denne hjemmeside" - "Tools" for download og detaljerede oplysninger. For at bruge 4SALE og ProfDistS, at det er nødvendigt altid at bringe filer til det korrekte format. Et taxon prøvetagning skal behandles af 4SALE skal have slutning. FASTA eller. Txt, må hvorimod sekvensen-struktur, tilpasning som et input til ProfDistS slutter med. Xfasta.

Vi er i øjeblikket at gennemføre alternative metoder til fylogenetisk træ genopbygning i ITS2 databasen samt i de tilhørende værktøjer. Således vil metoder som sekvens-struktur-baserede Max parsimoni 22 og / eller maximum likelihood 23 være tilgængelige i fremtiden.

Disclosures

Ingen interessekonflikter erklæret.

Acknowledgments

Vi hjerteligt takke ITS2 gruppen, Biocenter, University of Würzburg, for rige og værdifuld feedback. Vi takker også Deutsche Forschungsgemeinschaft (DFG, tilskud Mu-2831/1-1) til finansiering.

Materials

Name Company Catalog Number Comments
Internet access Preferably high-speed
ITS2 Database9 University of Warzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 University of Warzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 University of Warzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

DOWNLOAD MATERIALS LIST

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Tags

Genetik tilpasning intern afskrives spacer 2 molekylære systematik sekundær struktur ribosomalt RNA fylogenetiske træ homologimodellering fylogeni
Den ITS2 Database
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Merget, B., Koetschan, C., Hackl,More

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter