Summary
直线前进和可靠的方法,共同调节的基因,以确定潜在的监管图案。范围并不需要任何用户参数和返回的图案代表监管信号的优秀人选。的监管信号的识别,有助于理解基本生物学。
Abstract
范围是一个集合图案取景器使用并行的三个组成部分的算法,以确定潜在的监管图案代表性和图案的位置偏好1。每个组件算法进行了优化,找到一种不同的图案。通过采取这三种方式的最佳,范围的性能优于任何单一算法, 即使在1噪声数据的存在。在这篇文章中,我们利用研究端粒维持有关的基因的范围2的网页版本。范围已纳入至少还有另外两个方案3,4图案,并已在 5-8其他研究使用。
三种算法组成范围梁9,发现非退化图案(ACCGGT),棱镜10,发现变质的图案(ASCGWT),间隔11,发现较长的双边图案(ACCnnnnnnnnGGT) 。这三种算法进行了优化,找到自己的相应类型的Motif。总之,他们允许的范围,执行得非常好。
一旦基因组进行了分析,并确定候选图案,范围可以寻找其他基因包含的图案,当添加到原来的设置,将改善图案得分。这可以通过陈述或图案位置偏好发生。工作与部分基因生物验证转录因子结合位点,范围是能够识别其余大部分也由特定的转录因子调节的基因。
从范围输出显示候选图案,其重要意义,表和其他信息作为一个图形化的主题地图。常见问题及视频教程可在示波器的网站,其中还包括一个“示例搜索”按钮,允许用户进行试运行。
范围有一个非常友好的用户界面,使新手用户访问,而无需成为在生物信息学专家发现图案算法的全功率。作为输入,范围可以利用的基因,或FASTA格式的序列列表。这些都可以在浏览器中的文本字段输入,或从文件中读取。从范围的输出包含了所有与他们的成绩,出现的次数,含有基因图案的一小部分,用于识别图案的算法确定图案的列表。对于每一个图案,结果的详细信息,包括一个共识代表性的图案,序列标识,位置权重矩阵,每一个图案发生的实例列表(确切位置和“链”表示)。在浏览器窗口,也可以选择通过电子邮件返回结果。以前的论文中详细 1,2,9-11描述的范围算法。
Protocol
Discussion
范围提供了一个功能强大的工具来使用的协调监管的基因组中潜在的监管图案鉴定研究员。用户不需要猜测Motif或者发现网站需要许多其他图案的图案出现数量的大小。这些参数基本上都是不可知的,直到确定的主题是。该接口是非常简单的,既为输入序列或基因的名称,并查看输出。
范围输出提供所确定的所有图案的详细信息,使用三个不同的图案代表的方式。在所有的基因为主题的每个实例是上市的位置和“链”的信息。图形结果的主题地图的形式提供了一个可视化的显示,是很容易理解,并提供了一个直观的方式看到存在的图案模式。
的范围是非常强大的数据中的噪声。通常,这需要额外基因实际上并不可能与其他基因共同调控的出发设置的形式。在微阵列实验中共同表达的基因启动时,这种情况经常发生。有时实验嘈杂,或可能有几个转录激活因素,在芯片实验所用的实验条件。这些不同的转录因子可能会在DNA上有不同的目标网站。即使在4倍(噪声信号的比例是4:1)无关的基因的存在,范围仍保持着50%的准确性,在预测网站1。
虽然范围包含超过200万基因的名称的同义词,它有时会无法识别某些基因的名称。我们不断更新我们的代名词列出,但有时会发现不同的同义词,是指同一基因。在这种情况下,我们不包括因为含糊不清的同义词。如果你有一个基因的名称,范围不被发现,它是建议你参考基因组特定的网站找到一个替代的基因名称使用范围。范围提供适当的基因名称,每个物种的例子。
范围目前包含了72种新物种被加入所有的时间。该网站包含视频以及常见问题的帮助。源代码是自由学术用户可通过书面形式向兰登书屋。
Disclosures
没有利益冲突的声明。
Acknowledgments
这项研究是由来自美国国家科学基金会,DBI - 0445967 RHG授予支持。
References
- Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
- Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
- Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. van MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
- Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
- Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
- Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
- Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
- Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
- Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
- Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
- Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).