Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Coregulated遺伝子の潜在的な規制モチーフを特定するためにスコープの使用

Published: May 31, 2011 doi: 10.3791/2703

Summary

共同調節遺伝子の潜在的な規制のモチーフを識別するために、単純明快かつ堅牢な方法が提示される。 SCOPEは、規制信号のための優れた候補者を表す任意のユーザのパラメータとリターンのモチーフを必要としません。そのような調節シグナルの同定には、基礎生物学を理解するのに役立ちます。

Abstract

SCOPEは、過剰表現とモチーフの位置の設定1で潜在的な規制のモチーフを識別するために、並列で3つのコンポーネントのアルゴリズムを使用してアンサンブルのモチーフのファインダーです。各コンポーネントのアルゴリズムは、モチーフの異なる種類を見つけるために最適化されています。これら3つのアプローチのベストを取ることにより、SCOPEは、ノイズの多いデータ1の存在下で、任意の単一のアルゴリズムよりもパフォーマンスが良くなります。この記事では、テロメアの維持に関与する遺伝子を調べるためにスコープ2のWeb版を利用する。 SCOPEは、プログラム3,4を見つける少なくとも2つの他のモチーフに組み込まれており、他の研究5-8で使用されています。

SCOPEを構成する3つのアルゴリズムは、モチーフ(ASCGWT)、及び(ACCnnnnnnnnGGT)長い二部のモチーフを見つけるとスペーサ11を 、縮退が見つかる非退化モチーフ(ACCGGTを)見つけたビーム9、、プリズム10、です。これらの3つのアルゴリズムは、モチーフのそれらに対応するタイプを見つけるために最適化されています。一緒に、彼らは、SCOPEは非常によく実行することができます。

遺伝子セットを分析し、候補のモチーフが特定されたら、SCOPEは、元のセットに追加すると、モチーフのスコアを向上させる、モチーフを含む他の遺伝子を探すことができます。これは過剰表現やモチーフの位置の設定によって発生する可能性があります。生物学的に転写因子結合部位を確認してから部分的な遺伝子セットでの作業、SCOPEはまた、特定の転写因子によって制御される遺伝子の残りの大部分を識別することができた。

SCOPEからの出力は、候補をモチーフに、その意義、そしてテーブルのような、グラフィカルなモチーフのマップとしても他の情報を示しています。よくある質問とビデオチュートリアルは、ユーザが試運転を実行できるようにする"サンプルの検索"ボタンを含むスコープのウェブサイトで入手できます。

範囲は、初心者ユーザーがモチーフの発見のバイオインフォマティクスの専門家になることなく、アルゴリズムの完全な電源へのアクセスを可能にする非常に友好的なユーザインタフェースを持っています。入力として、SCOPEは、遺伝子、またはFASTAシーケンスのリストを取ることができます。これらは、ブラウザのテキストフ​​ィールドに入力、またはファイルから読み取ることができます。スコープからの出力は、そのスコア、出現回数、モチーフを含む遺伝子の割合で、モチーフを識別するために使用されるアルゴリズムと特定されたすべてのモチーフのリストが含まれています。それぞれのモチーフの場合、結果の詳細は、モチーフのコンセンサスの表現、シーケンスのロゴ、位置の重み行列、およびすべてのモチーフの発生のためのインスタンスのリストを(正確な位置と示されている"鎖"を持つ)が含まれます。結果がブラウザウィンドウにし、また必要に応じて電子メールで返送されています。以前の論文では詳細1,2,9-11のSCOPEのアルゴリズムを説明します。

Protocol

Discussion

SCOPEは協調制御される遺伝子のセット内の潜在的な規制モチーフの同定に使用する強力なツールと研究者を提供します。ユーザーは、モチーフの大きさや部位を必要を見つける他の多くのモチーフとしてモチーフの出現回数を推測する必要はありません。モチーフが識別されるまで、これらのパラメータは、基本的に不可知です。インタフェースは、配列または遺伝子名を入力するため、出力を表示するための両方非常に簡単です。

SCOPEの出力は、モチーフの表現の3つの異なる方法を使用して、識別されるモチーフのすべてについての詳細な情報を提供します。遺伝子のすべてのモチーフの各インスタンスは、位置と"鎖"の情報が記載されています。モチーフのマップの形でグラフィカルに結果が理解しやすいと存在するモチーフのパターンを確認するための直感的な方法を提供するビジュアル表示を提供します。

SCOPEは、データのノイズの存在に非常に堅牢です。通常、これは実際に遺伝子の残りの部分と同じ場所に規制されていない可能性があります開始セットに存在する余分な遺伝子の形式をとります。マイクロアレイ実験で共発現される遺伝子で始まるときによく起こります。時々の実験ではノイズが多い、またはマイクロアレイ実験に用いる実験条件で活性化いくつかの転写因子があるかもしれません。これらの異なる転写因子には、おそらくDNA上の異なる標的部位を持つことになります。であっても4倍外来遺伝子(ノイズ:信号の比は4:1である)の存在下で、SCOPEは、まだサイト1を予測する上で、その精度の50%を維持しています。

SCOPEは、遺伝子名の200万以上の同義語が含まれていますが、それは時々いくつかの遺伝子の名前を識別するために失敗します。我々は常に我々のシノニムのリストを更新するが、時には別の同義語は同じ遺伝子を参照していることを確認されています。これらのケースでは、我々は理由あいまいさの同義語が含まれていません。 [スコープで検出されない遺伝子の名前を持っている場合、それはあなたがスコープ内に使用​​する代替の遺伝子名を検索するゲノムの特定のサイトを参照することをお勧めします。それぞれの種のための適切な遺伝子名の例は、SCOPEで提供されています。

SCOPEは、現在すべての時間を追加される新しい種は72種が含まれています。ウェブサイトは、ビデオのヘルプだけでなく、よくある質問(FAQ)が含まれています。ソースコードは、RHGに書き込むことにより、アカデミックユーザーに自由にご利用いただけます。

Disclosures

利害の衝突は宣言されません。

Acknowledgments

この研究は、国立科学財団、DBI - 0445967からRHGに助成金によって支えられている。

References

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. van MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Tags

遺伝学、問題51、遺伝子制御、計算生物学、アルゴリズム、プロモーター配列のモチーフ
Coregulated遺伝子の潜在的な規制モチーフを特定するためにスコープの使用
Play Video
PDF DOI

Cite this Article

Martyanov, V., Gross, R. H. UsingMore

Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter