Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Usando alcance para identificar posibles motivos de reglamentación en los genes coregulated

Published: May 31, 2011 doi: 10.3791/2703

Summary

Un método sencillo y robusto para identificar los posibles motivos de reglamentación en la co-genes regulados se presenta. Ámbito de aplicación no requiere ningún parámetro de usuario y vuelve motivos que representan excelentes candidatos para las señales de regulación. La identificación de tales señales reguladoras ayuda a entender la biología subyacente.

Abstract

SCOPE es un buscador de motivos conjunto que utiliza tres algoritmos de componentes en paralelo para identificar los posibles motivos de reglamentación por la sobre-representación y la preferencia motivo de la posición 1. Cada algoritmo componente se ha optimizado para encontrar otro tipo de motivo. Al tomar lo mejor de estos tres enfoques, alcance un mejor rendimiento que cualquier algoritmo único, incluso en la presencia de datos ruidosos 1. En este artículo, utilizamos una versión web de SCOPE 2 a examinar los genes que están involucrados en el mantenimiento de los telómeros. ALCANCE se ha incorporado en al menos dos motivos para encontrar otros programas de 3,4 y se ha utilizado en otros estudios 5-8.

Los tres algoritmos que conforman alcance son HAZ 9, que se encuentra no degenerados motivos (ACCGGT), PRISM 10, que se encuentra degenerada motivos (ASCGWT) y el espaciador 11, que se encuentra más motivos bipartito (ACCnnnnnnnnGGT). Estos tres algoritmos se han optimizado para encontrar su correspondiente tipo de motivo. En conjunto, permiten llevar a cabo ALCANCE muy bien.

Una vez que un conjunto de genes se ha analizado e identificado los motivos candidato, ámbito de aplicación puede buscar otros genes que contienen el motivo de que, cuando se añade a la serie original, será motivo de mejorar la puntuación. Esto puede ocurrir por sobre-representación o la preferencia de posición motivo. Trabajar con conjuntos de genes parciales que se han verificado biológicamente factor de transcripción sitios de unión, ámbito de aplicación es capaz de identificar la mayor parte del resto de los genes también está regulada por el factor de transcripción dada.

La producción de ALCANCE muestra motivos candidato, su significado, y otra información tanto en forma de tabla y como un mapa motivo gráfico. Preguntas frecuentes y tutoriales en vídeo están disponibles en el sitio web de alcance que también incluye un "ejemplo de búsqueda" botón que permite al usuario realizar una prueba.

Ámbito de aplicación tiene una interfaz de usuario muy amigable que permite a los usuarios novatos a acceder a la energía total del algoritmo sin tener que convertirse en un experto en el tema de bioinformática de la búsqueda. Como entrada, SCOPE puede tomar una lista de genes o secuencias FASTA. Estos se pueden introducir en los campos de texto del navegador, o leer de un archivo. La salida del ámbito contiene una lista de todos los motivos identificados con sus resultados, el número de ocurrencias, fracción de los genes que contiene el motivo, y el algoritmo utilizado para identificar el motivo. Para cada tema, detalles de los resultados incluyen una representación de consenso del motivo, una secuencia logo, una matriz de la posición de peso, y una lista de casos por cada ocurrencia motivo (con posiciones exactas y "cadena", indicó). Los resultados se devuelven en una ventana del navegador y, opcionalmente, también por correo electrónico. Trabajos anteriores describen los algoritmos de SCOPE en detalle 1,2,9-11.

Protocol

Discussion

ALCANCE proporciona al investigador una herramienta poderosa para usar para la identificación de los posibles motivos de reglamentación en conjuntos de genes regulados coordinadamente. El usuario no está obligado a adivinar el tamaño del motivo o el número de ocurrencias del motivo como motivo la búsqueda de muchos otros sitios requieren. Estos parámetros son básicamente desconocido hasta que el motivo se identifica. La interfaz es muy sencilla, tanto para entrar en las secuencias de genes o los nombres y para ver la salida.

ALCANCE salida proporciona información detallada sobre todos los motivos que se identifican, utilizando tres diferentes formas de representación motivo. Cada instancia del motivo en todos los genes está en la lista con información de posición y "cadena". Los resultados gráficos en forma de mapas motivo de ofrecer una pantalla de visualización que es fácil de entender y proporciona una manera intuitiva de ver patrones en los motivos que están presentes.

SCOPE es muy robusto a la presencia de ruido en los datos. Normalmente, esto toma la forma de genes extra que está presente en el conjunto de partida que en realidad no puede ser co-regulado con el resto de los genes. Esto sucede a menudo cuando se comienza con los genes que son co-expresados ​​en los experimentos de microarrays. A veces, el experimento es ruidoso, o puede haber varios factores de transcripción activados en las condiciones experimentales utilizadas para el experimento de microarrays. Estos diferentes factores de transcripción es probable que hayan diferentes lugares de destino en el ADN. Incluso en la presencia de cuatro veces los genes extraños (ruido: relación señal es 4:1), el alcance es todavía mantiene el 50% de su exactitud en la predicción de los sitios 1.

Aunque ámbito contiene más de 2 millones de sinónimos de nombres de genes, a veces no logra identificar algunos nombres de genes. Estamos constantemente actualizando nuestras listas de sinónimos, pero a veces encontramos que los sinónimos se refieren a diferentes del mismo gen. En esos casos, no incluyen los sinónimos debido a la ambigüedad. si usted tiene un nombre de genes que no se encuentra en alcance, es recomendable que consulte el sitio específico del genoma para encontrar el nombre de un gen alternativo para el uso en su alcance. Algunos ejemplos de nombres de genes apropiados para cada especie se proporcionan por el ámbito.

ALCANCE actualmente contiene 72 especies con nuevas especies que se añade todo el tiempo. El sitio web contiene video de ayuda, así como preguntas frecuentes. El código fuente está disponible gratuitamente para los usuarios académicos por escrito a GD.

Disclosures

No hay conflictos de interés declarado.

Acknowledgments

Esta investigación fue financiada por una subvención a GHR de la Fundación Nacional de Ciencia, DBI-0445967.

References

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. van MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Tags

Genética Número 51 la regulación génica la biología computacional el algoritmo motivo secuencia promotora
Usando alcance para identificar posibles motivos de reglamentación en los genes coregulated
Play Video
PDF DOI

Cite this Article

Martyanov, V., Gross, R. H. UsingMore

Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter