Biology

Il ITS2 Database

Published: March 12, 2012 doi: 10.3791/3806

Benjamin Merget^1,2, Christian Koetschan¹, Thomas Hackl¹, Frank Förster¹, Thomas Dandekar¹, Tobias Müller¹, Jörg Schultz¹, Matthias Wolf¹

¹Department of Bioinformatics, Biocenter, University of Würzburg, ²Institute of Pharmacy and Food Chemistry, University of Würzburg

Summary

Il database ITS2 è un banco di lavoro per la sequenza di inferenza filogenetica simultaneamente e considerando la struttura secondaria del spaziatore interno trascritto 2. Ciò include la raccolta di dati con annotazioni accurate, predizione della struttura, di sequenze multiple-struttura di allineamento e di calcolo albero veloce. In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi pochi click.

Abstract

Lo spaziatore interno trascritto 2 (ITS2) è stato utilizzato come marcatore filogenetica per più di due decenni. Come ITS2 ricerca principalmente focalizzata sulla sequenza ITS2 molto variabile, ha limitato questo indicatore a basso livello solo filogenesi. Tuttavia, la combinazione della sequenza ITS2 e la sua struttura altamente conservata secondaria migliora la risoluzione filogenetica ¹ e permette inferenza filogenetica a ranghi tassonomici multipli, comprese le specie delimitazione ^2-8.

Il ITS2 Database ⁹ presenta un set di dati esaustiva di interni trascritti distanziali 2 sequenze da NCBI GenBank ¹¹ precisione reannotated ^10. A seguito di un'annotazione profilo Models Hidden Markov (HMM), la struttura secondaria di ciascuna sequenza è previsto. In primo luogo, viene testato se un minimo di energia basata volte ¹² (diretta volte) i risultati in una corretta, conformazione elica quattro. Se questo non è il caso, la struttura èprevisto dalla modellazione omologia ^13. Nella modellazione omologia, una struttura già noto secondaria viene trasferita ad un'altra sequenza ITS2, la cui struttura secondaria non era in grado di piegare correttamente in una piega diretta.

Il database ITS2 non è solo un database per l'archiviazione e il recupero di ITS2 sequenza-strutture. Inoltre fornisce diversi strumenti per elaborare le proprie ITS2 sequenze, tra cui l'annotazione, la previsione strutturale, individuazione dei motivi e BLAST ¹⁴ ricerca sul combinato sequenza-struttura informativa. Inoltre, integra le versioni tagliate di 4SALE ProfDistS ^15,16 e ¹⁷ per sequenze multiple-struttura calcolo di allineamento e Neighbor Joining ¹⁸ ricostruzione albero. Insieme formano un pipeline coerente analisi da una prima serie di sequenze di una filogenia basata sulla sequenza e struttura secondaria.

In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi solopochi clic del mouse, mentre fornisce inoltre strumenti e dati completi per analisi su vasta scala.

Protocol

1. Annotazione corretta di Sequence ITS2

Accedi al banco di lavoro ITS2 filogenesi Database qui: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Iniziate la vostra analisi facendo clic sull'icona "annotazione" nella sezione "Strumenti". Quindi, digitare o incollare la sequenza nell'editor di sequenza nella parte superiore del sito. L'editor di sequenza controlla automaticamente, se i vostri sequenze ITS2 sono validi.
Scegli un modello HMM adatto per le sequenze (ad esempio Viridiplantae per le piante).
Avviare il processo facendo clic su "Annota".
Posizionando il mouse sopra l'icona "ibridazione" è possibile visualizzare un'immagine del 5.8S e 28S rRNA ibrida come una conferma di precisione l'annotazione di HMM.
Fare clic sul segno più verde della risultante ITS2 sequenza per selezionare il modo di predizione della struttura secondaria: Per prevedere la struttura senza templat notae, cliccare su "Indovina struttura". Se si desidera utilizzare un modello personalizzato per l'omologia Modeling, fare clic su "struttura modello".

2. Structure Prediction secondaria

Predire
1. La sequenza ITS2 annotato viene automaticamente incollato nell'editor sequenza.
2. Per avviare la previsione della struttura secondaria con le impostazioni predefinite, fare clic sul pulsante "Predict strutture".
3. Salvare la sequenza ITS2 risultante compresa la struttura modellata secondaria nel pool di dati facendo clic sul segno più di colore verde e poi "Aggiungi alla piscina." In alternativa, è possibile aggiungerlo alla tua riserva di dati tramite drag and drop (Figura 1).
4. Se la sequenza non poteva piegare direttamente, i migliori risultati della modellazione omologia sono mostrati. Salvare il più adatto sequenza-struttura di via drag and drop per il pool di dati. In alternativa, salvare la sequenza-struttura in piscina dati con un click destro e poi un clic su "Aggiungi al pool."
Modeling personalizzato
1. Digita o incolla uno o più modelli (con struttura nota) nell'editor sequenza superiori.
2. Digita o incolla sequenze bersaglio uno o più (senza struttura) nell'editor sequenza inferiore.
3. Clicca su "Predict migliori template (s)" per avviare la Modeling omologia con le impostazioni predefinite.
4. I migliori template bersaglio combinazioni sono mostrati nella lista risultante.
5. Salvare la sequenza di modellato-struttura (s) di vostra scelta sia via drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool."

3. Motif Search

Digitare o incollare la sequenza query (s) nell'editor sequenza nella parte superiore del sito.
Scegli il modello corretto HMM (ad esempio Viridiplantae per le piante). 3,3. Clicca su "search Motif" per avviare il processo.
ITS2 sequenze con motivi evidenziate sono le illustrazioniTed sul fondo del sito.
Fare clic sull'icona accanto alla sequenza di intestazione per visualizzare i motivi evidenziati nella struttura secondaria.

4. Cerca e Consulta

Cerca
1. Digitare il nome di un taxon o di un identificatore GenBank (GI) nel campo di ricerca nella parte superiore del sito.
2. Una ricerca per nome taxon è supportato da uno che appare live-search box.
3. È possibile eseguire una ricerca multipla da una virgola di separazione vostre domande.
4. Fare clic sul pulsante "Cerca" per eseguire la ricerca.
5. I risultati appaiono elencati in una nuova scheda.
6. Fare clic su un nome della colonna per ordinare i risultati in base alla particolare colonna. È inoltre possibile aggiungere o rimuovere colonne di vostra scelta con il menu della colonna. Il menu della colonna è possibile inserire con un clic sulla freccia che appare all'interno di un nome di colonna.
7. Clicca su "Visualizza dettagli" per visualizzare i dettagli di una sequenza-struttura. </ Li>
8. Salvare la sequenza-struttura (s) di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool."
9. Per salvare i risultati in un file esterno, fare clic su "Salva selezione" o "Salva tutto".
Sfogliare
1. Sfoglia il database ITS2 navigando attraverso la struttura ad albero a sinistra del sito.
2. Fare clic sul segno più per visualizzare i taxa di un livello inferiore.
3. Clicca sul nome taxon per aprire una nuova scheda contenente ogni sequenza-struttura del taxon.
4. Clicca su "Visualizza dettagli" per visualizzare i dettagli di una sequenza-struttura di coppia.
5. Salvare la sequenza-struttura (s) di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool."
6. Per salvare i risultati in un file esterno, fare clic su "Salva selezione" o "Salva tutto".

5. ITS2 Blast

Digitare o incollare le sequenze di uno o più di query nell'editor di sequenza. Le sequenze possono essere sia semplici sequenze nucleotidiche o sequenza-struttura coppie. È inoltre possibile digitare diverse strutture secondarie di seguito una sequenza. Selezionando la casella "Serialize sequenze XXFASTA" queste strutture sono utilizzate in seguito come singole query.
Per iniziare BLAST con le impostazioni predefinite, fare clic su "Blast". A seconda della natura della query, o un BLASTN comune o la sequenza di ITS2 struttura BLAST viene eseguita.
Un sub-scheda è aperto per ogni sequenza query all'interno del appaiono scheda "Risultati BLAST", nonché una panoramica delle ricerche eseguite.
Clicca su "Allineamenti Mostra" per visualizzare gli allineamenti BLAST calcolati.
Salva i colpi BLAST di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool."
Per salvare i risultati in un file esterno, fare clic su "Salva selezione"O" Salva tutto ".

6. Sequenze multiple-struttura di allineamento

Date un'occhiata al vostro pool di dati facendo clic su "Gestione dataset" e poi il simbolo della lente d'ingrandimento accanto al numero di sequenze in piscina. In alternativa, è possibile fare clic sul segno pool di dati in basso a sinistra del sito.
Fare clic su una sequenza di struttura coppia in pool di dati per visualizzarne i dettagli.
Per creare un multiplo di sequenza-struttura di allineamento di tutte le coppie sequenza-struttura nella piscina, fare clic su "Analizza dataset" e poi "Sequenza e struttura".
Ora vi viene chiesto di selezionare la modalità grafica del proprio allineamento. Se il vostro allineamento contiene solo alcune sequenze, rifiutare il modo sottile facendo clic su "No" In caso contrario, scegliere la modalità grafica snella facendo clic su "Sì".
In pochi istanti, l'allineamento viene visualizzato in una nuova scheda (Figura 2). Inoltre, viene automaticamente salvato nella pool di dati.
Per salvare ill'allineamento in un file esterno, fare clic su "Salva l'allineamento".

7. Albero filogenetico

Per calcolare una sequenza-struttura approssimati basati Partecipare ad albero del vostro allineamento multiplo, clicca su "Analizza Dataset" e poi "prossimo Joining".
La struttura risultante è illustrata in una nuova scheda (Figura 3).
Scalare il vostro albero liberamente con la barra di scorrimento "albero Zoom".
Reroot il vostro albero facendo clic su un nodo o foglia dell'albero e poi "Reroot a questo nodo."
Se si desidera rimuovere un taxon dal pool di dati, fare clic sulla foglia e scegliere "Rimuovi questo nodo dalla piscina". Ora è possibile ricalcolare l'allineamento e l'albero con il campionamento taxon ridotta.
Clicca su "albero Save" per salvare l'albero filogenetico come risultato finale della sua analisi in un file esterno NEWICK.

8. Software aggiuntivo

Clicca su "Informazioni su questo sito" - "Strumenti" per trovare ulteriori informarezione per la stand-alone 4SALE strumenti e ProfDistS.
Oltre l'allineamento e la funzione prossimo Partecipare fornita dall'interfaccia web ITS2 Database, è ora possibile accedere a diverse nuove funzioni, la delimitazione delle specie ad esempio, sulla base delle variazioni compensative di base (CBC).

9. Risultati rappresentativi

Il flusso di lavoro come descritto sopra è stata applicata con successo in una serie di indagini ad accesso aperto ^3,4. Gli esempi possono essere visti attraverso i seguenti link:

In questi studi su larga scala, siamo stati in grado di risolvere la filogenesi di Chlorophyta così come Hypnales (Bryophyta) wesimo alta risoluzione. In entrambi i casi, un campionamento taxon esaustivo è stato raccolto dal Database ITS2 ^9, automaticamente allineato con 4SALE ^15,16 e infine trattati da ProfDistS ¹⁷ in un albero filogenetico. In tutti questi passaggi, la sequenza e le informazioni della struttura sono stati utilizzati contemporaneamente. Bootstrap sostegno per la spina dorsale filogenetica è stata ottenuta utilizzando prossimo Profilo di giunzione (PNJ) ^19, che è disponibile in versione stand-alone di ProfDistS.

Per un insieme ridotto di sequenza-struttura coppie, figure da 1 a 3 descritte le fasi principali di questo flusso di lavoro automatizzato ⁵ direttamente sul nuovo ITS2 workbench Database: campionamento taxon, il multiplo di sequenza-struttura di allineamento e, infine, il calcolo albero filogenetico.

Figura 1. Taxon di campionamento per il drag and drop. In tutte le sequenze temporali o sequenza di strut- coppie di e può essere aggiunto al pool di dati, ad esempio tramite drag and drop. Qui una sequenza-struttura viene aggiunto utilizzando il drag and drop dopo la predizione di struttura secondaria. L'azzurro segna ellisse l'area in cui è caduto la sequenza-struttura nel pool di dati. Clicca qui per vedere la versione full-size di questa immagine.

Figura 2. Multipla sequenza-struttura di allineamento in modalità completamente grafica. Per le sequenze pochi nel pool di dati, la modalità di un elemento grafico è stato scelto. Le basi sono colorati; coppie di basi può essere evidenziato con cerchi rossi cliccando su una base o staffa di una coppia di basi. Clicca qui per vedere la versione full-size di questa immagine.

3.jpg "alt =" Figura 3 "/>
Figura 3. Sequenza-struttura di Neighbor Joining albero. L'albero liberamente scalabile calcolato di un taxa sette sequenze multiple-struttura di allineamento possono essere salvati nel formato NEWICK.

Discussion

Il Database ITS2 è un banco di lavoro completo e pienamente funzionale per interni trascritti spacer 2 sequenza-struttura-base di filogenesi. Il sito web può essere utilizzato molto veloce e intuitivo. Mentre gli altri web-based banchi filogenesi come ARB Mobyle ²⁰ o ²¹ sono solo in grado di lavorare su sequenza e / o struttura informativa consenso, il ITS2 Database ⁹ considera le singole sequenze e strutture secondarie per ogni taxon simultaneamente. Tuttavia, a causa delle limitazioni nella capacità di calcolo del server web, si raccomanda di utilizzare gli strumenti stand-alone per l'allineamento multiplo e Neighbor Joining ¹⁸ calcolo, 4SALE ProfDistS ^15,16 e ^17, rispettivamente, per grandi dataset. Accanto alla base ITS2 sequenza-struttura del flusso di lavoro filogenesi ^5, questi strumenti dispongono di numerose funzioni aggiuntive, come il calcolo bootstrap replica, Neighbor Joining Profile (PNJ) ¹⁹ o speciedelimitazione s sulla base delle variazioni compensative di base (CBC) ^8. È possibile accedere attraverso la "Informazioni su questo sito" - sezione "Tools" per il download e informazioni dettagliate. Per utilizzare 4SALE e ProfDistS, è necessario portare sempre con file nel formato corretto. Un taxon campionamento per essere trattati da 4SALE deve avere il finale. Fasta o. Txt, mentre la sequenza-struttura di allineamento come input per ProfDistS deve terminare con. Xfasta.

Si stanno applicando metodi alternativi per la ricostruzione albero filogenetico nel database ITS2 nonché nei relativi strumenti. Così, metodi come la sequenza-struttura-based massima parsimonia ²² e / o Maximum Likelihood ²³ sarà accessibile in futuro.

Disclosures

Non ci sono conflitti di interesse dichiarati.

Acknowledgments

Siamo lieti di ringraziare il gruppo ITS2, Biocenter, Università di Würzburg, per il feedback ricca e preziosa. Ringraziamo anche la Deutsche Forschungsgemeinschaft (DFG; sovvenzione Mu-2831/1-1) per il finanziamento.

Materials

Name	Company	Catalog Number	Comments
Internet access			Preferably high-speed
ITS2 Database⁹	University of Warzburg		Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE^15,16	University of Warzburg		Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS¹⁷	University of Warzburg		Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/