October 8th, 2017
DNA シーケンス データとは異なり、エピゲノムのデータはテキスト ベースの検索に容易に服従しません。エピゲノム データと DNA 要素の百科事典を含む利用可能なオンラインのデータベースを比較することで類似のパターン ベースの検索を行う GeNemo、web ベースのバイオインフォマティクス ツールのアップグレードされたバージョンを使用する手順は、ここで紹介ユーザーのデータ。
このビデオの全体的な目標は、エピジェネティック研究の分野の研究者に、プログラムGeNemoを使用して、異なるエピジェネティックマークと異なる細胞タイプ間の類似領域を取得する方法を示すことです。このプログラムを作成する上での私たちの目標は、研究者が自分のデータセル機能をEncodeやMousingtonなどの膨大な既知の公開データベースと比較できるようにすることでした。キーワードによる典型的な調査による情報検索。
瀬戸際では、細胞は3つのK4プライマイゼーションまたは他の特定の曲線です。これらの混乱は便利ですが、GeNemoは、データの説明の類似性ではなく、実際のデータのアドインを検索することもできます。例えば、DNAと戦う新しいタンパク質があり、彼らがどのようなエピジェネティックな修飾や細胞数に関係していると予想されるかについて、アプリオリな知識がない、またはほとんど
ないと仮定します。GeNemoは、潜在的なターゲットを絞り込むのに役立ちます。GeNemoは、数学やギリシャ語など、さまざまな形式のファイルを読み取ることができ、さまざまなパターンマッチング方法を使用します。また、類似性スコアに基づいてオフプット領域を解決し、データエクスポートオプションを提供します。そして今、GeNemo検索を実行する方法を示します。
GeNemoを使用するには、独自のデータファイルとBED(BIG WIG形式)が必要であり、UCSCゲノムブラウザなどの一般的なバイオインフォマティクスツールを使用して実験生データから変換できます。まず、GeNemo.org に進みます。メインページには、仕様オプションを含む検索ボックスが表示されます。
データを比較する種を選択します。このチュートリアルでは、ホモサピエンスを参照種として使用します。次に、GeNemoにアップロードする独自のファイルを選択します。
このファイルは、オンラインまたはローカルドライブでホストできます。データがオンラインの場合は、URLをコピーしてこのボックスに貼り付けます。または、下のボタンをクリックしてローカルデータファイルをアップロードします。
このチュートリアルでは、サンプル ファイルを使用します。検索が完了するまでに時間がかかる場合があります。待ちたくない場合は、このボックスにメールアドレスを入力できます。
また、検索が完了すると、結果へのリンクが記載されたメールが届きます。独自のデータをBED形式で提供している場合は、表示目的で大きなかつらファイルをアップロードするための別のURLがあります。このボックスで検索範囲を指定することもできます。
検索範囲を指定するには、染色体番号と塩基対の範囲を指定する必要があります。次の 2 つの入力は同じように読み取られます。染色体1:1-1000000。または、句読点をスペース (BED ファイル形式) に置き換えます。
染色体1 1 1000000。次に、データ選択ボタンをクリックして、検索するトラックタイプを選択します。各データサンプルの横にあるチェックボックスをクリックして検索することもできますが、フィルター機能もあります。
フィルター機能は、同時に多くのトラックを選択するのに便利です。ここでは、フィルタリングするカテゴリを選択したり、タブの下部にあるボタンを使用したりできます。最初の3つのボタンは、かなり一目瞭然です。
フィルターは、選択したカテゴリに属さないすべてのトラックをオフにします。アンドゲートのようなものです。一方、除外すると、選択したカテゴリがオフになります。
ノットゲートのように。準備ができたら、検索ボタンをクリックして検索を開始します。多数のトラックを検索する場合、または検索範囲を小さく指定していない場合は、検索に時間がかかることがあります。
結果ボックスには、指定した 1 つ以上のトラック配列でデータファイルと検索種が類似しているゲノムのさまざまなセクションが表示されます。「BED ファイルのダウンロード」をクリックすると、一致する領域のリストを含むファイルをダウンロードできます。各ボックスの表示ボタンをクリックして、一致するセクションを視覚化します。
表示セクションには、独自のデータファイルトラックと、一致するトラックが表示されます。上流または下流に移動するには、ベースペアラベルのある上部のバーをスライドします。この例でわかるように、この山は 2 つのトラック間で類似しています。
このビデオを見れば、GeNemoを使用して異なるエピジェネティックマーカー間の類似領域を取得する方法についてよく理解できるはずです。GeNemo検索の結果には、エピジェネティックマーカー、転写因子の所見、DNAメチル化、発色アクセシビリティ、または関心のあるデータに対して特定のゲノム位置で同様のパターンを持つさまざまな組織タイプにわたる他のタイプのシグナルが含まれます。そこから、このDNA結合タンパク質が何らかの転写因子や調節要素と相互作用しているのか、それともクロマチン構造などと関係があるのかを指摘できるかもしれません。
さらに、データセットと最も高い類似性を持つ組織の種類に注意することもでき、これにより、目的のタンパク質の発生機能が適用される可能性があります。このような広範な検索を行うことにより、GeNemoは比較的短い時間で暫定的な領域、メーカー、および/または細胞タイプを返すことができます。これらの結果から、問題のタンパク質に適した細胞株の選択、特定の転写因子との相互作用のテスト、Co IP、30C、4C、5C、またはHiCによるエピジェネティックな修飾など、将来の実験を導き出すための潜在的な関心領域を絞り込むことも可能になります。
このチュートリアルがお役に立てば幸いですし、常にGeNemoの改善に取り組んでいます。そのために、どんなフィードバックも歓迎します。
この記事では、エピゲノムデータのパターンベース検索用に設計されたウェブベースのバイオインフォマティクスツール、GeNemoの使用方法に関するチュートリアルを紹介します。研究者は、広範な公開データベースとデータを比較して、異なるエピジェネティックマークと細胞タイプ間での類似領域を特定できます。