Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Mit SCOPE potenzieller regulatorischer Motive in Coregulated Gene zu identifizieren

Published: May 31, 2011 doi: 10.3791/2703

Summary

Eine geradlinige und robuste Methode, um potenzielle regulatorische Motive in Zusammenarbeit regulierten Gene zu identifizieren wird vorgestellt. SCOPE erfordert keine User-Parameter und liefert Motive, die ausgezeichnete Kandidaten stellen für regulatorische Signale. Die Identifikation solcher Regulationssignale hilft, die zugrunde liegenden Biologie zu verstehen.

Abstract

SCOPE ist ein Ensemble Motiv finder, dass Drei-Komponenten-Algorithmen verwendet, die parallel zu potenzieller regulatorischer Motive von Überrepräsentation und Motiv Position bevorzugt 1 zu identifizieren. Jede Komponente Algorithmus ist optimiert, um eine andere Art von Motiv zu finden. Indem man die besten dieser drei Ansätze, führt SCOPE besser als jede einzigen Algorithmus, auch in Gegenwart von verrauschten Daten 1. In diesem Artikel nutzen wir eine Web-Version von SCOPE 2, um Gene, die in Telomererhaltung mitwirken. SCOPE hat sich in mindestens zwei anderen Motiv Auffinden von Programmen 3,4 aufgenommen und hat in anderen Studien 5-8 verwendet worden.

Die drei Algorithmen, die SCOPE enthalten, sind BEAM 9, die nicht entartet Motive (ACCGGT) findet, PRISM 10, die entartete Motive (ASCGWT) findet, und Abstandshalter 11, die länger bipartite Motive (ACCnnnnnnnnGGT) findet. Diese drei Algorithmen wurden optimiert, um die entsprechenden Art von Motiv zu finden. Zusammen ermöglichen sie SCOPE extrem gute Leistung.

Sobald ein Gen gesetzt analysiert wurde und Kandidaten Motive identifiziert haben, können SCOPE für andere Gene, die das Motiv, das, wenn sie auf den ursprünglichen Satz hinzugefügt, das Motiv Score zu verbessern enthalten aussehen. Dies kann durch übermäßige Präsenz oder Motiv Positionsgebote auftreten. Arbeiten mit partiellen Gen-Sets, die biologisch Transkriptionsfaktorbindungsstellen überprüft haben, war SCOPE in der Lage, die meisten der Rest der Gene auch durch die gegebene Transkriptionsfaktor reguliert werden.

Die Ausgabe von SCOPE stellt Kandidaten Motive, ihre Bedeutung, und andere Informationen sowohl als Tisch als auch als grafische Motiv Karte. FAQs und Video-Tutorials sind bei der SCOPE-Website, die auch ein "Sample Search"-Taste, die dem Benutzer einen Probelauf durchführen können zur Verfügung.

Scope hat eine sehr benutzerfreundliche Oberfläche, die unerfahrene Anwender ermöglicht, den Algorithmus die volle Leistung, ohne dass ein Experte in der Bioinformatik von Motiv zu finden geworden zugreifen. Als Eingang kann SCOPE, eine Liste von Genen, oder FASTA-Sequenzen. Diese können im Browser Textfelder eingegeben werden, oder aus einer Datei gelesen. Die Ausgabe von SCOPE enthält eine Liste aller identifizierten Motive mit ihren Noten, Anzahl der Vorkommen, Anteil von Genen, die das Motiv, und der Algorithmus verwendet, um das Motiv zu erkennen. Für jedes Motiv, sind Ergebnis eines Konsenses Darstellung des Motivs, eine Sequenz-Logo, eine Position, Gewicht Matrix, und eine Liste der Instanzen für jedes Motiv Auftreten (mit genauen Positionen und "Strang" bezeichnet). Die Ergebnisse werden in einem Browser-Fenster und wahlweise auch per E-Mail zurück. Vorherige Arbeiten beschreiben die SCOPE-Algorithmen im Detail 1,2,9-11.

Protocol

Discussion

SCOPE stellt der Forscher mit einem leistungsfähigen Werkzeug für die Identifizierung von möglichen regulatorischen Motive in Mengen von koordinativ regulierten Gene zu verwenden. Der Anwender ist nicht erforderlich, um die Größe des Motivs oder die Anzahl der Vorkommen des Motivs wie viele andere Motive finden Sites erfordern erraten. Diese Parameter sind grundsätzlich unerkennbar, bis das Motiv erkannt wird. Das Interface ist sehr einfach sowohl für die Eingabe-Sequenzen oder Gen-Namen und für die Anzeige der Ausgabe.

SCOPE-Ausgang liefert detaillierte Informationen über alle Motive, die identifiziert werden, mit drei verschiedenen Arten von Motiv-Darstellung. Jede Instanz des Motivs in alle Gene mit Position und "Strang" aufgeführten Informationen. Grafische Ergebnisdarstellung in Form von Motiv-Karten bieten eine optische Anzeige, die einfach zu verstehen ist, und bietet eine intuitive Art und Weise, um Muster in den Motiven, die vorhanden sind zu sehen.

SCOPE ist sehr robust, um die Anwesenheit von Rauschen in den Daten. Typischerweise geschieht dies in Form von zusätzlichen Gene in der Startaufstellung, die nicht vielleicht tatsächlich mit dem Rest der Gene co-reguliert werden. Dies geschieht häufig, wenn beginnend mit Genen, die in Microarray-Experimenten co-exprimiert. Manchmal ist das Experiment ist laut, oder es können verschiedene Transkriptionsfaktoren in den experimentellen Bedingungen für die Microarray-Experiment verwendeten aktiviert werden. Diese verschiedenen Transkriptionsfaktoren wird wahrscheinlich je nach Zielort auf der DNA. Selbst in Gegenwart von 4-fach-fremde Gene (Lärm: Signal-Verhältnis ist 4:1), ist SCOPE noch hält 50% der Genauigkeit in der Vorhersage Seiten 1.

Obwohl SCOPE enthält über 2 Millionen Synonyme für Gen-Namen, es geht manchmal nicht, um einige Gene Namen zu identifizieren. Wir aktualisieren ständig unsere Synonym-Listen, aber manchmal feststellen, dass verschiedene Synonyme für das gleiche Gen verweisen. In diesen Fällen haben wir nicht die Synonyme wegen der Mehrdeutigkeit. Wenn Sie ein Gen Namen, die nicht von SCOPE gefunden haben, ist es empfehlenswert, dass Sie das Genom spezifischen Ort beziehen sich auf eine alternative Gen Namen in SCOPE Verwendung finden. Beispiele für entsprechende Gen-Namen für jede Art von SCOPE zur Verfügung gestellt.

SCOPE umfasst derzeit 72 Arten mit neuen Arten die ganze Zeit aufgenommen. Die Website enthält Video sowie FAQs helfen. Der Quellcode ist frei verfügbar für akademische Nutzer, indem er an RHG.

Disclosures

Keine Interessenskonflikte erklärt.

Acknowledgments

Diese Arbeit wurde durch ein Stipendium der National Science Foundation, DBI-0445967 RHG unterstützt.

References

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. van MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Tags

Genetik Genregulation Bioinformatik Algorithmus Promotorsequenz Motiv
Mit SCOPE potenzieller regulatorischer Motive in Coregulated Gene zu identifizieren
Play Video
PDF DOI

Cite this Article

Martyanov, V., Gross, R. H. UsingMore

Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter