Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Utilizzando SCOPE per identificare potenziali Motivi regolamentari in geni Coregulated

Published: May 31, 2011 doi: 10.3791/2703

Summary

Un metodo straight-forward e robusto per identificare potenziali motivi di regolamentazione geni co-regolati è presentato. SCOPE non richiede alcun parametro utente e motivi ritorni che rappresentano ottimi candidati per i segnali regolamentari. L'identificazione di tali segnali regolatori aiuta a comprendere la biologia di base.

Abstract

SCOPE è un mirino motivo ensemble che utilizza tre algoritmi di componenti in parallelo per identificare i potenziali motivi di regolamentazione da parte sovra-rappresentazione e la posizione preferenza motivo 1. Ogni componente algoritmo è ottimizzato per trovare un diverso tipo di motivo. Prendendo il meglio di questi tre approcci, ambito di applicazione si comporta meglio di qualsiasi algoritmo unico, anche in presenza di dati rumorosi 1. In questo articolo, utilizziamo una versione web di SCOPE 2 per esaminare i geni che sono coinvolti nella conservazione dei telomeri. SCOPE è stata incorporata in almeno due altro motivo trovare programmi 3,4 ed è stato utilizzato in altri studi 5-8.

I tre algoritmi che compongono SCOPE BEAM sono 9, che trova non degeneri motivi (ACCGGT), PRISM 10, che trova degenerare motivi (ASCGWT), e DISTANZIALE 11, che trova motivi più bipartito (ACCnnnnnnnnGGT). Questi tre algoritmi sono stati ottimizzati per trovare la loro corrispondente tipo di motivo. Insieme, essi permettono SCOPE per svolgere molto bene.

Una volta che un set di geni è stata analizzata e motivi candidato individuato, CAMPO DI APPLICAZIONE possono cercare altri geni che contengono il motivo che, se aggiunto al set originale, migliorerà il punteggio motivo. Questo può avvenire attraverso sovra-rappresentazione o la posizione preferenza motivo. Lavorare con i set di geni parziali che sono biologicamente verificato siti di legame fattore di trascrizione, ambito di applicazione è stata in grado di identificare la maggior parte del resto dei geni regolati anche dal fattore di trascrizione dato.

Uscita dal campo di applicazione mostra motivi candidato, il loro significato, e altre informazioni, sia come una tabella e una mappa come motivo grafico. Domande e tutorial video sono disponibili sul sito web SCOPE che comprende anche un "Cerca di esempio" pulsante che permette all'utente di effettuare un giro di prova.

Ambito di applicazione è un'interfaccia utente molto amichevole che consente agli utenti inesperti di accedere piena potenza dell'algoritmo senza dover diventare un esperto in bioinformatica di trovare motivo. Come input, ambito di applicazione può richiedere un elenco di geni o le sequenze FASTA. Questi possono essere inseriti in campi di testo del browser, o leggere da un file. L'uscita dal campo di applicazione contiene un elenco di tutti i motivi identificati con i loro punteggi, il numero di occorrenze, frazione di geni contenenti il ​​motivo, e l'algoritmo utilizzato per identificare il motivo. Per ogni motivo, i dettagli risultato comprende una rappresentazione consenso del motivo, un logo sequenza, una matrice di peso posizione, e un elenco di istanze per ogni occorrenza motivo (con posizioni esatte e "filone" indicato). I risultati sono restituiti in una finestra del browser e anche opzionalmente via email. Precedenti lavori descrivere gli algoritmi in dettaglio 1,2,9-11 SCOPE.

Protocol

Discussion

SCOPE offre al ricercatore un potente strumento da utilizzare per l'identificazione di potenziali motivi regolamentari in set di geni regolati coordinatamente. L'utente non è tenuto a indovinare le dimensioni del motivo o il numero di occorrenze del motivo ben altro motivo trovare siti richiedono. Questi parametri sono sostanzialmente inconoscibile fino a quando il motivo è identificato. L'interfaccia è molto semplice, sia per l'inserimento di sequenze di geni o di nomi e per vedere l'uscita.

Uscita SCOPE fornisce informazioni dettagliate su tutti i motivi che sono identificate, utilizzando tre diversi modi di rappresentazione motivo. Ogni istanza del motivo in tutti i geni è presente con la posizione e le informazioni "filone". Risultati grafici sotto forma di mappe motivo a fornire una rappresentazione visiva che è facile da capire e fornisce un modo intuitivo per vedere i modelli nei motivi che sono presenti.

SCOPE è molto robusto per la presenza di rumore nei dati. In genere, questa assume la forma di geni in più essere presente nel set di partenza che non potrebbe in realtà essere co-regolati con il resto dei geni. Questo accade spesso quando si inizia con i geni che sono co-espressi in esperimenti di microarray. A volte l'esperimento è rumoroso, o ci possono essere numerosi fattori di trascrizione attivati ​​nelle condizioni sperimentali utilizzati per l'esperimento microarray. Questi diversi fattori di trascrizione dovrà probabilmente diversi siti bersaglio sul DNA. Anche in presenza di geni estranei di 4 volte (rumore: rapporto segnale è 4:1), SCOPE è conserva ancora il 50% della sua accuratezza nel predire siti 1.

Sebbene ambito contiene oltre 2 milioni di sinonimi per i nomi dei geni, non riesce a volte a identificare alcuni nomi di geni. Stiamo aggiornando costantemente le nostre liste sinonimo, ma a volte trovare sinonimi che si riferiscono a diversi dello stesso gene. In questi casi, non includono i sinonimi causa dell'ambiguità. se hai un nome del gene che non si trova da portata, si consiglia di consultare il sito specifico del genoma per trovare un nome alternativo da utilizzare in gene SCOPE. Esempi di nomi gene appropriate per ogni specie sono forniti da SCOPE.

Ambito contiene attualmente 72 specie con nuove specie che viene aggiunto per tutto il tempo. Il sito web contiene video di aiutare così come FAQ. Il codice sorgente è liberamente disponibile per gli utenti accademica scrivendo a RHG.

Disclosures

Nessun conflitto di interessi dichiarati.

Acknowledgments

Questa ricerca è stata sostenuta da una sovvenzione per RHG dalla National Science Foundation, DBI-0445967.

References

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. van MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Tags

Genetica Numero 51 regolazione genica la biologia computazionale algoritmo la sequenza motivo promotore
Utilizzando SCOPE per identificare potenziali Motivi regolamentari in geni Coregulated
Play Video
PDF DOI

Cite this Article

Martyanov, V., Gross, R. H. UsingMore

Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter