Biology

Den ITS2 Database

Published: March 12, 2012 doi: 10.3791/3806

Benjamin Merget^1,2, Christian Koetschan¹, Thomas Hackl¹, Frank Förster¹, Thomas Dandekar¹, Tobias Müller¹, Jörg Schultz¹, Matthias Wolf¹

¹Department of Bioinformatics, Biocenter, University of Würzburg, ²Institute of Pharmacy and Food Chemistry, University of Würzburg

Summary

Den ITS2 Database er en arbeidsbenk for fylogenetisk slutning samtidig vurderer sekvens og sekundær struktur av den interne transkribert spacer to. Dette inkluderer datainnsamling med nøyaktig merknader, struktur prediksjon, multiple sekvens-struktur justering og rask tre beregning. I et nøtteskall, forenkler denne arbeidsbenken første fylogenetiske analyser til noen få klikk.

Abstract

Den interne transkribert spacer 2 (ITS2) har blitt brukt som en fylogenetisk markør for mer enn to tiår. Som ITS2 forskning i hovedsak fokusert på den veldig variabel ITS2 sekvens, begrenset det denne markøren til lavnivå fylogeni bare. Imidlertid forbedrer kombinasjonen av ITS2 sekvensen og den svært konservert sekundær struktur fylogenetisk oppløsning ¹ og lar fylogenetisk slutning på flere taksonomiske gradene, herunder avgrensning av arter ^2-8.

Den ITS2 Database ⁹ presenterer en uttømmende datasett av interne transkriberte spacer 2 sekvenser fra NCBI GenBank ¹¹ nøyaktig reannotated ^10. Etter en merknad av profil Hidden Markov Models (HMM), er den sekundære strukturen i hver sekvens spådd. Først blir det testet hvorvidt et minimum energi basert fold ¹² (direkte fold) resultater i en riktig, fire helix eksteriør. Hvis dette ikke er tilfelle, er strukturenspådd av homologi modellering ^13. I homologi modellering, er en allerede kjent sekundær struktur overført til en annen ITS2 sekvens, var som sekundær struktur ikke i stand til å kaste riktig i en direkte fold.

Den ITS2 Database er ikke bare en database for lagring og gjenfinning av ITS2 sekvens-strukturer. Det gir også flere verktøy for å behandle dine egne ITS2 sekvenser, inkludert merknader, strukturelle prediksjon, motiv deteksjon og BLAST ¹⁴ søk på kombinert sekvens-struktur informasjon. Dessuten integrerer den klippede versjoner av 4SALE ^15,16 og ProfDistS ¹⁷ for flere sekvens-struktur justering beregning og Neighbor Delta ¹⁸ tre gjenoppbygging. Sammen danner de en sammenhengende analyse rørledning fra et første sett av sekvenser til en fylogeni basert på sekvens og sekundær struktur.

I et nøtteskall, forenkler denne arbeidsbenken første fylogenetiske analyser for å barenoen museklikk, mens i tillegg tilby verktøy og data for omfattende storskala analyser.

Protocol

1. Riktig annotering av ITS2 Sequence

Åpne ITS2 Database fylogeni arbeidsbenk her: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Begynn analyse ved å klikke på "Annotate"-ikonet i avsnittet "Tools". Deretter skriver eller limer du sekvens i sekvensen redaktør øverst på nettsiden. Sekvensen redaktør sjekker automatisk, hvorvidt dine ITS2 sekvenser er gyldige.
Velg en HMM modell som passer for dine sekvenser (f.eks Viridiplantae for planter).
Begynn prosessen ved å klikke på "Annotate."
Ved svever over "hybridize"-ikonet kan du vise et bilde av 5.8S og 28S rRNA hybrid som en bekreftelse av HMM merknadens nøyaktighet.
Klikk på den grønne plusstegnet på resultatfilen ITS2 sekvensen for å velge din måte sekundær struktur prediksjon: å forutsi strukturen uten en kjent template, klikk på "Tippe struktur." Hvis du vil bruke din egen mal for homologi modellering, klikk på "modell struktur."

2. Sekundær struktur Prediction

Forutsi
1. The Annotated ITS2 sekvensen blir automatisk limt inn i sekvensen redaktør.
2. Slik starter den sekundære strukturen prediksjon med standardinnstillingene, klikker du på "Tippe strukturer"-knappen.
3. Lagre den resulterende ITS2 sekvensen inkludert modellert sekundær struktur i data bassenget ved å klikke på det grønne plusstegnet og deretter "Legg til bassenget." Alternativt kan du legge det til din data bassenget via dra-og slipp (Figur 1).
4. Hvis sekvensen ikke kunne kaste direkte, er de beste resultatene av homologi modellering vist. Lagre den mest passende sekvens-struktur ved å dra og slippe til data bassenget. Alternativt lagre sekvens-struktur i data bassenget med et høyreklikk og deretter et klikk på "Legg til bassenget."
Custom Modeling
1. Skriv eller lim inn en eller flere maler (med kjent struktur) i den øvre sekvensen redaktør.
2. Skriv eller lim inn ett eller flere mål sekvenser (uten struktur) inn i den nedre sekvensen redaktør.
3. Klikk på "Tippe beste mal (s)" å starte homologi modellering med standardinnstillinger.
4. De beste mal-målet kombinasjoner er vist i den resulterende listen.
5. Lagre modellert sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget."

3. Motif Søk

Skriv eller lim inn spørringen sekvens (e) inn i sekvensen redaktør øverst på nettsiden.
Velg riktig HMM-modellen (f.eks Viridiplantae for planter). 3.3. Klikk på "Motif søk" for å starte prosessen.
ITS2 sekvenser med uthevede motivene er illustrasjonented nederst på nettsiden.
Klikk på ikonet ved siden av sekvensen overskriften for å vise motivene fremhevet i den sekundære strukturen.

4. Søk og Bla

Søk
1. Skriv enten en taxon navn eller en GenBank Identifier (GI) i søkefeltet øverst på nettsiden.
2. Et søk etter taxon navn er støttet av en vises live-søkeboks.
3. Du kan utføre en multippel søk etter komma skille dine spørsmål.
4. Klikk på "Søk" knappen for å utføre søket.
5. Dine resultater vises oppført i en ny fane.
6. Klikk på en kolonne for å sortere resultatene i henhold til den aktuelle kolonnen. Du kan også legge til eller fjerne kolonner med ditt valg med kolonnen menyen. Kolonnen menyen kan legges inn med et klikk på den vises pilikonet innenfor en kolonne navn.
7. Klikk på "Vis detaljer" for å vise detaljene for en sekvens-struktur. </ Li>
8. Lagre sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget."
9. Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg" eller "Lagre alle."
Bla
1. Bla gjennom ITS2 Database ved å navigere gjennom trestruktur til venstre på nettsiden.
2. Klikk på et pluss-tegn for å vise taxa ett nivå lavere.
3. Klikk på en taxon navn for å åpne en ny fane som inneholder hver sekvens-struktur taxon.
4. Klikk på "Vis detaljer" for å vise detaljene for en sekvens-struktur par.
5. Lagre sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget."
6. Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg" eller "Lagre alle."

5. ITS2 Blast

Skriv eller lim en eller flere spørringer sekvenser inn i sekvensen redaktør. Dine sekvenser kan enten være rene nukleotidsekvenser eller sekvens-struktur par. Du kan også skrive flere sekundære strukturer under en sekvens. Ved å krysse av i boksen "serialiserer XXFASTA sekvenser" disse strukturene blir brukt senere som individuelle spørringer.
Slik starter BLAST med standardinnstillingene, klikker du på "Blast". Avhengig av art i søket, enten en vanlig BLASTN eller ITS2 sekvens-struktur BLAST er utført.
En sub-fane åpnes for hver spørring sekvens innenfor de dukker kategorien "blast Resultater," samt en oversikt over utførte søk.
Klikk på "Vis Alignments" for å vise de beregnede BLAST justeringer.
Lagre BLAST treff av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget."
Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg"Eller" Lagre alle. "

6. Flere Sequence-struktur Alignment

Ta en titt på din data pool ved å klikke på "Manage datasett" og deretter forstørrelsesglasset symbolet rett ved siden av antall sekvenser i bassenget. Alternativt kan du klikke på data bassenget skiltet nederst til venstre på nettsiden.
Klikk på en sekvens-struktur par i din data bassenget for å vise detaljer.
For å opprette en multippel sekvens-struktur justering av alle sekvens-struktur pairer i bassenget, klikk på "Analyser datasett" og deretter "Sekvens & Structure".
Nå blir du bedt om å velge den grafiske modus for justering din. Hvis justeringen inneholder bare noen få sekvenser, avslår slanke modus ved å klikke "Nei" Ellers velger den slanke grafisk modus ved å klikke "Ja."
I noen få øyeblikk, er justeringen vist i en ny fane (Figur 2). Dessuten lagres den automatisk til data bassenget.
Hvis du vil lagrejustering til en ekstern fil, klikk på "Lagre justering."

7. Fylogenetisk tre

For å beregne en sekvens-struktur basert Naboen Delta tre av multippel alignment, klikk på "Analyser datasett" og deretter "Neighbor Delta."
Den resulterende treet er illustrert i en ny fane (figur 3).
Skalere treet fritt med rullefeltet "Zoom treet."
Reroot treet ved å klikke på en node eller blad av treet og deretter "Reroot på denne noden."
Hvis du vil fjerne en taxon fra data pool, klikk på blad og velg "Fjern denne noden from pool". Nå kan du rekalkulere din innretting og tre med redusert taxon prøvetaking.
Klikk på "Lagre treet" for å lagre fylogenetisk tre som et endelig resultat av analysen din til en ekstern Newick fil.

8. Ekstra programvare

Klikk på "Om denne nettsiden" - "Verktøy" for å finne ytterligere informereasjon om frittstående verktøy 4SALE og ProfDistS.
Ved siden av innretting og Neighbor Bli funksjon fra ITS2 Database web-grensesnittet, kan du nå få tilgang til flere nye funksjoner, for eksempel avgrensning av arter basert på kompenserende grunnleggende endringer (cbcs).

9. Representative Resultater

Arbeidsflyten som beskrevet ovenfor har med hell blitt brukt i flere open access undersøkelser ^3,4. Eksempler kan ses gjennom følgende linker:

I disse store studiene, kunne vi løse fylogeni av Chlorophyta samt Hypnales (Bryophyta) wed høy oppløsning. I begge tilfellene ble en uttømmende taxon prøvetaking hentet fra ITS2 Database ^9, automatisk justert med 4SALE ^15,16 og til slutt behandles av ProfDistS ¹⁷ inn i et fylogenetisk tre. I alle disse trinnene, ble sekvens og struktur informasjon som brukes samtidig. Bootstrap støtte for fylogenetisk ryggraden ble oppnådd ved hjelp Profile Neighbor Delta (PNJ) ^19, som er tilgjengelig i den frittstående versjonen av ProfDistS.

For et mindre sett av sekvens-struktur par, tallene 1 til 3 beskriver de viktigste trinnene i denne automatisert arbeidsflyt ⁵ direkte på den nye ITS2 Database arbeidsbenk: taxon prøvetaking, med flere sekvens-struktur justering og til slutt fylogenetisk tre beregningen.

Figur 1
Figur 1. Taxon sampling per dra og slipp. Til enhver tid sekvenser eller sekvens-Struktur e parene kan legges til data bassenget, for eksempel ved å dra og slipp. Her er en sekvens-struktur er lagt hjelp av dra og slipp etter sekundær struktur prediksjon. Den blå ellipsen markerer området der sekvens-strukturen er utelatt i data bassenget. Klikk her for å vise i full størrelse versjon av dette bildet.

Figur 2
Figur 2. Multippel sekvens-struktur justering i full grafisk modus. For de få sekvensene i data bassenget, ble full grafikk modus valgt. Baser er farget; basepar kan bli markert med røde sirkler ved å klikke på en base eller brakett av en base par. Klikk her for å vise i full størrelse versjon av dette bildet.

3.jpg "alt =" Figur 3 "/>
Figur 3. Sequence-struktur Naboen Bli treet. Den fritt skalerbare tre beregnet av en syv taxa flere sekvens-struktur justering kan lagres i Newick format.

Discussion

Den ITS2 Database er en komplett og fullt funksjonell arbeidsbenk for interne transkriberte spacer 2 sekvens-struktur-baserte fylogeni. Nettstedet kan betjenes svært raskt og intuitivt. Mens andre web-baserte fylogeni arbeidsbenker som ARB ²⁰ eller Mobyle ²¹ er bare i stand til å arbeide på sekvens og / eller konsensus strukturere informasjon, vurderer ITS2 Database ⁹ sekvenser og individuelle sekundære strukturer for hver taxon samtidig. Men på grunn av begrensninger i regnekapasitet av web server, er det sterkt anbefalt å bruke de frittstående verktøy for flersekvenssammenstilling og nabo Delta ¹⁸ beregningen, ^15,16 4SALE og ProfDistS ^17, henholdsvis for store datasett. Ved siden av grunnleggende ITS2 sekvens-struktur fylogeni arbeidsflyt ^5, disse verktøyene har flere tilleggsfunksjoner, som beregning bootstrap gjentak, Profile Neighbor Delta (PNJ) ¹⁹ eller species avgrensing basert på kompenserende grunnleggende endringer (cbcs) ^8. De kan nås via "Om denne nettsiden" - "Verktøy"-delen for nedlasting og detaljert informasjon. Slik bruker 4SALE og ProfDistS, å det er nødvendig alltid bringe filer til riktig format. En art prøvetaking skal behandles av 4SALE må ha slutt. Fasta eller. Txt, må mens sekvens-struktur justering som en inngang for ProfDistS ender med. Xfasta.

Vi er for tiden å implementere alternative metoder for fylogenetisk tre gjenoppbygging i ITS2 databasen så vel som i de relaterte verktøy. Dermed vil metoder som sekvens-struktur-baserte Maksimal parsimony ²² og / eller Maksimum Likelihood ²³ være tilgjengelig i fremtiden.

Disclosures

Ingen interessekonflikter erklært.

Acknowledgments

Vi hjertelig takker ITS2 gruppen, Biocenter, Universitetet i Würzburg, for rike og verdifulle tilbakemeldinger. Vi takker også Deutsche Forschungsgemeinschaft (DFG, tilskudd Mu-2831/1-1) for finansiering.

Materials

Name	Company	Catalog Number	Comments
Internet access			Preferably high-speed
ITS2 Database⁹	University of Warzburg		Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE^15,16	University of Warzburg		Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS¹⁷	University of Warzburg		Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/