Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Den ITS2 databas

Published: March 12, 2012 doi: 10.3791/3806

Summary

Den ITS2 Database är en arbetsbänk för fylogenetisk inferens samtidig hänsyn sekvens och sekundär struktur av den interna transkriberade spacer 2. Detta inkluderar datainsamling med korrekt annotation, struktur prediktion, multipel sekvens-struktur inriktning och snabb träd beräkning. I ett nötskal, förenklas detta arbetsbänk första fylogenetiska analyser till några klick.

Abstract

Den interna transkriberade spacer 2 (ITS2) har använts som ett fylogenetiskt markör för mer än två decennier. Som ITS2 forskningen främst inriktad på mycket varierande ITS2 sekvens inskränkt denna markör till låg nivå fylogeni bara. Men förbättrar kombinationen av ITS2 sekvensen och dess högkonserverad sekundära struktur fylogenetiska upplösningen 1 och låter fylogenetiska slutledning på flera taxonomiska leden, inklusive art avgränsning 2-8.

Den ITS2 Database 9 visar en uttömmande uppsättning data av interna transkriberade spacer 2 sekvenser från NCBI GenBank 11 exakt reannotated 10. Efter en annotering av profilerade Hidden Markov Models (HMM), är den sekundära strukturen av varje sekvens förutsägas. För det första testas om en lägsta energi bygger gånger 12 (direkt gånger) resulterar i en korrekt fyra helix konformation. Om så inte är fallet, är strukturenförutsägs av homologimodellering 13. I homologimodellering är en redan känd sekundär struktur överföras till en annan ITS2 sekvens var som sekundär struktur inte kan vika korrekt i en direkt gånger.

Den ITS2 Database är inte bara en databas för lagring och hämtning av ITS2 sekvens-strukturer. Det ger också flera verktyg för att bearbeta dina egna ITS2 sekvenser, inklusive anteckningar, strukturell förutsägelse, motiv upptäckt och BLAST 14 sök på den kombinerade sekvensen-struktur information. Dessutom integrerar klippta versioner av 4SALE 15,16 och ProfDistS 17 för flera sekvens-struktur inriktning beräkning och granne gå med 18 träd återuppbyggnad. Tillsammans bildar de en sammanhängande analys rörledning från en första uppsättning sekvenser till en fylogeni baserat på sekvens och sekundär struktur.

I ett nötskal, förenklas detta arbetsbänk första fylogenetiska analyser endastnågra mus-klick, samtidigt som dessutom tillhandahålla verktyg och data för omfattande storskaliga analyser.

Protocol

1. Korrekt Notering av ITS2 Sequence

  1. Gå till ITS2 arbetsbänken Database fylogeni här: http://its2.bioapps.biozentrum.uni-wuerzburg.de
  2. Börja din analys genom att klicka på "Kommentera"-ikonen i avsnittet "Verktyg". Sedan skriv eller klistra in din sekvens i sekvensen redaktör på toppen av webbplatsen. Sekvensen redaktör kontrollerar automatiskt om dina ITS2 sekvenser är giltiga.
  3. Välj ett HMM modell som passar för dina sekvenser (t.ex. Viridiplantae för växter).
  4. Starta processen genom att klicka på "Kommentera".
  5. Genom att hålla över "hybridisera" ikonen kan du visa en bild av 5.8S och 28S rRNA hybrid som en bekräftelse av HMM noteringen noggrannhet.
  6. Klicka på den gröna plustecknet i den resulterande ITS2 sekvensen för att välja ditt sätt att sekundär struktur förutsägelse: För att förutsäga strukturen utan en känd template, klicka på "förutsäga struktur." Om du vill använda din egen mall för homologimodellering, klicka på "Modell struktur."

2. Sekundärstrukturprediktion

  1. Förutse
    1. Den kommenterade ITS2 sekvensen automatiskt klistras in i sekvensen redigeraren.
    2. För att starta den sekundära strukturen förutsägelsen med standardinställningar, klicka på "Beräkna strukturer"-knappen.
    3. Spara den resulterande ITS2 sekvensen inklusive modellerade sekundära strukturen i data poolen genom att klicka på den gröna plustecknet och sedan "Lägg till pool." Alternativt kan du lägga till dina uppgifter pool genom att dra och släppa (figur 1).
    4. Om sekvensen inte kunde vikas direkt, erhålles de bästa resultaten från homologimodellering visas. Spara den mest lämplig sekvens-struktur genom att dra och släppa för att data poolen. Alternativt, spara sekvensen-strukturen i data poolen med ett högerklick och sedan ett klick på "Lägg till pool."
  2. Anpassad Modeling
    1. Skriv eller klistra in en eller flera mallar (med känd struktur) i den övre sekvensen redaktören.
    2. Skriv eller klistra in en eller flera målsekvensema (utan struktur) i den nedre sekvensen redaktören.
    3. Klicka på "Beräkna bästa mall (s)" för att starta homologimodellering med standardinställningar.
    4. De bästa mall-mål-kombinationer visas i den resulterande listan.
    5. Spara modellerade sekvensen-struktur (er) du vill antingen via dra och släpp till data poolen eller genom att högerklicka och klicka på "Lägg till pool."

3. Motiv efter

  1. Skriv eller klistra in din fråga sekvens (er) i sekvensen redaktör på toppen av webbplatsen.
  2. Välj rätt HMM modellen (t.ex. Viridiplantae för växter). 3,3. Klicka på "Motif sök" för att starta processen.
  3. ITS2 sekvenser med markerade motiv är illustraTed längst ner på webbplatsen.
  4. Klicka på ikonen bredvid den sekvens huvudet för att visa motiv lyfts fram i den sekundära strukturen.

4. Sök och bläddra

  1. Sök
    1. Skriv antingen en taxon namn eller en GenBank Identifier (GI) i sökfältet längst upp på webbsidan.
    2. En sökning genom taxon namn stöds av ett uppträder live-sökrutan.
    3. Du kan utföra en multipel sökning genom att komma-separera dina frågor.
    4. Klicka på "Sök" knappen för att utföra sökningen.
    5. Dina resultat verkar förtecknas i en ny flik.
    6. Klicka på ett kolumnnamn för att sortera resultaten enligt den särskilda kolumnen. Du kan också lägga till eller ta bort kolumner i ditt val med kolumnen menyn. Kolumnen menyn kan anges med ett klick på visas pilikonen inom en kolumn namn.
    7. Klicka på "Visa detaljer" för att visa information om en sekvens-struktur. </ Li>
    8. Spara sekvens-struktur (er) du vill antingen via dra och släpp till data poolen eller genom att högerklicka och klicka på "Lägg till pool."
    9. För att spara dina resultat till en extern fil, klicka på "Spara markering" eller "Spara alla."
  2. Bläddra
    1. Bläddra i ITS2 Database genom att navigera genom trädet struktur till vänster på webbplatsen.
    2. Klicka på ett plus-tecken för att visa taxa en nivå lägre.
    3. Klicka på en taxon namn för att öppna en ny flik som innehåller varje sekvens-struktur taxon.
    4. Klicka på "Visa detaljer" för att visa information om en sekvens-struktur par.
    5. Spara sekvens-struktur (er) du vill antingen via dra och släpp till data poolen eller genom att högerklicka och klicka på "Lägg till pool."
    6. För att spara dina resultat till en extern fil, klicka på "Spara markering" eller "Spara alla."

5. ITS2 Blast

  1. Skriv eller klistra in en eller flera query sekvenser i sekvensen redigeraren. Dina sekvenser kan antingen vara enkla nukleotidsekvenser eller sekvens-struktur par. Du kan också skriva flera sekundära strukturer under en sekvens. Genom att kryssa i rutan "Serialisera XXFASTA sekvenser" dessa strukturer används sedan som enskilda frågor.
  2. För att starta BLAST med standardinställningarna, klicka på "Blast". Beroende på vilken typ av din fråga, antingen en vanlig BLASTN eller ITS2 sekvensen-strukturen BLAST utförs.
  3. En sub-flik öppnas för varje fråga sekvens inom de visas fliken "BLAST resultat", samt en översikt över de avrättade sökningar.
  4. Klicka på "Visa Väglinjer" för att se de beräknade BLAST inriktningar.
  5. Spara BLAST hits som du väljer antingen via dra och släpp till data poolen eller genom att högerklicka och klicka på "Lägg till pool."
  6. För att spara dina resultat till en extern fil, klicka på "Spara markering"Eller" Spara alla. "

6. Flera Sekvens-struktur Alignment

  1. Ta en titt på dina data pool genom att klicka på "Hantera datamängd" och sedan på förstoringsglaset symbolen bredvid antalet sekvenser i din pool. Alternativt kan du klicka på data poolen skylten längst ner till vänster på webbplatsen.
  2. Klicka på en sekvens-struktur par i dina uppgifter pool för att visa dess detaljer.
  3. För att skapa en multipel sekvens-struktur anpassningen av alla sekvens-struktur par i din pool, klicka på "Analysera dataset" och sedan "Sekvens & Structure".
  4. Nu är du ombedd att välja den grafiska läge för din inställning. Om anpassning innehåller endast ett fåtal sekvenser, minska den tunna genom att klicka "Nej" Annars väljer den tunna grafikläge genom att klicka på "Ja".
  5. På några ögonblick är din inställning visas i en ny flik (Figur 2). Dessutom sparas det automatiskt till data poolen.
  6. Om du vill sparaanpassning till en extern fil, klicka på "Spara inriktning."

7. Fylogenetiskt träd

  1. För att beräkna en sekvens-struktur baserad granne Sammanfogning träd på din flera anpassning, klicka på "Analysera Dataset" och sedan "granne gå med."
  2. Den resulterande träd visas i en ny flik (figur 3).
  3. Skala ditt träd fritt med rullningslisten "Zoom träd."
  4. Reroot ditt träd genom att klicka på en nod eller blad av trädet och sedan "Reroot på denna nod."
  5. Om du vill ta bort ett taxon från dina data pool, klicka på bladet och välj "Ta bort den här noden från poolen." Nu kan du räkna om din inriktning och träd med den reducerade taxon provtagning.
  6. Klicka på "Spara tree" för att spara fylogenetiska träd som ett slutresultat av din analys till en extern Newick fil.

8. Ytterligare programvara

  1. Klicka på "Om webbplatsen" - "Verktyg" för att hitta ytterligare informationation om stand-alone verktyg 4SALE och ProfDistS.
  2. Förutom inriktningen och granne gå med funktion som ges av ITS2 Database webbgränssnittet kan du nu flera nya funktioner, t.ex. arter avgränsning bygger på kompenserande bas förändringar (CBCs).

9. Representativa resultat

Arbetsflödet som beskrivs ovan har med framgång använts i flera open access undersökningar 3,4. Exempel kan ses via följande länkar:

I dessa storskaliga studier kunde vi lösa fylogeni Chlorophyta samt Hypnales (Bryophyta) wed hög upplösning. I båda fallen var en uttömmande taxon provtagning samlas från ITS2 databas 9, automatiskt i linje med 4SALE 15,16 och slutligen behandlas av ProfDistS 17 till ett fylogenetiskt träd. I alla dessa steg, var sekvens och strukturera information används samtidigt. Bootstrap stöd för fylogenetiska ryggraden uppnåddes med hjälp Profil granne Delta (PNJ) 19, som finns i den fristående versionen av ProfDistS.

För en mindre uppsättning av sekvens-struktur par, figurer 1 till 3 beskriver de viktigaste stegen i denna automatiserat arbetsflöde 5 direkt på den nya ITS2 Database arbetsbänk: taxon provtagning, med flera sekvens-struktur inriktning och så småningom fylogenetiska trädet beräkningen.

Figur 1
Figur 1. Taxon provtagning per dra och släppa. När som helst sekvenser eller sekvens-Struktur e par kan läggas till uppgifterna poolen, till exempel genom att dra och släppa. Här en sekvens-struktur tillsätts genom att dra och släppa efter sekundär struktur förutsägelse. Den blå ellipsen markerar det område där sekvensen-strukturen ned i data poolen. Klicka här för att se fullstor version av denna bild.

Figur 2
Figur 2. Flera sekvens-struktur anpassning i full grafikläge. För de få sekvenserna i data poolen var full grafikläge valt. Baser är färgade, baspar kan markeras med röda cirklar genom att klicka på en bas eller konsol av en bas par. Klicka här för att se fullstor version av denna bild.

3.jpg "alt =" Bild 3 "/>
Figur 3. Sekvens-struktur granne Gå med träd. Den fritt skalbara träd beräknas av sju taxa flera sekvens-struktur inriktning kan sparas i Newick format.

Discussion

Den ITS2 Database är en komplett och fullt fungerande arbetsbänk för interna transkriberade spacer 2 sekvensen-struktur-baserade fylogeni. Webbplatsen kan användas mycket snabbt och intuitivt. Medan andra webbaserade fylogeni arbetsbänkar som ARB 20 eller Mobyle 21 har endast möjlighet att arbeta på sekvens och / eller konsensusstrukturen uppgifter anser ITS2 databasen 9 sekvenser och individuella sekundära strukturer för varje taxon samtidigt. På grund av begränsningar i beräkningskapacitet på webbservern, är det starkt rekommenderat att använda fristående verktyg för flera anpassning och granne Sammanfogning 18 beräkning, 4SALE 15,16 och ProfDistS 17, respektive för stora datamängder. Förutom den grundläggande ITS2 sekvensen-struktur fylogeni arbetsflöde 5, dessa verktyg har flera nya funktioner, såsom beräkning av bootstrap replikat, Profile granne Joining (PNJ) 19 eller species avgränsning bygger på kompenserande bas förändringar (CBCs) 8. De kan nås via "Om webbplatsen" - "Verktyg" för nedladdning och detaljerad information. Om du vill använda 4SALE och ProfDistS att det är nödvändigt alltid ta filer till rätt format. Ett taxon provtagning ska behandlas av 4SALE måste ha ändelsen. FASTA eller. Txt, måste medan sekvensen-strukturen inriktning som ingång för ProfDistS sluta med. Xfasta.

Vi genomför för närvarande alternativa metoder för att fylogenetiskt träd återuppbyggnaden i ITS2 databasen samt i de relaterade verktyg. Således kommer metoder som följd-struktur-baserade Högsta sparsamhet 22 och / eller Maximum Likelihood 23 vara tillgängliga i framtiden.

Disclosures

Inga intressekonflikter deklareras.

Acknowledgments

Vi tackar hjärtligt för ITS2 gruppen, Biocenter, universitetet i Würzburg, för rik och värdefull feedback. Vi tackar också Deutsche Forschungsgemeinschaft (DFG, bidrag Mu-2831/1-1) för finansiering.

Materials

Name Company Catalog Number Comments
Internet access Preferably high-speed
ITS2 Database9 University of Warzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 University of Warzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 University of Warzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

DOWNLOAD MATERIALS LIST

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE - A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. olfgang ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Tags

Genetik 61 Nummer justering inre transkriberade spacer 2 molekylär systematik sekundär struktur ribosomalt RNA fylogenetiska träd homologimodellering fylogeni
Den ITS2 databas
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Merget, B., Koetschan, C., Hackl,More

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter