May 22nd, 2018
Proteogenomic ツールの紹介ポゴと高速、量的なポスト翻訳の修正、変形のためのプロトコルの参照ゲノム上に質量分析法によってペプチド マッピングを有効にします。このツールは統合、proteogenomic や個人的なプロテオーム研究直交ゲノム解析データとのインタ フェースを表示するために使用します。
このソフトウェアプロトコルの全体的な目標は、PoGoを使用して、関連する翻訳後修飾および質量分析実験からの定量情報を持つペプチドをマッピングし、参照ゲノムにマッピングし、直交ゲノミクスデータとの統合と可視化を可能にすることを実証することです。このツールは、質量分析プロテオミクス検索によって生成されたペプチドリストにゲノム情報を追加するのに役立ち、RNAシーケンシングデータとの統合を容易にすることができます。このツールの主な利点は、使いやすく、高速で、翻訳後修飾、定量、アミノ酸分散などの追加情報をサポートしていることです。
まず、このビデオで示されているソフトウェアをダウンロードしてインストールします。付属のテキスト プロトコルで説明されています。インストールが完了したら、PoGo GUI実行可能ファイルフォルダーに移動し、PoGoGUIアイコンをダブルクリックしてプログラムを起動します。PoGo実行可能ファイルの横にある選択ボタンを使用します。
次に、executablesフォルダ内を関連するオペレーティングシステムサブフォルダに移動し、実行可能なPoGoファイルを選択します。開くボタンをクリックして選択を確定します。次に、selectをクリックして、タンパク質配列の参照入力ファイルを選択します。
データフォルダに移動し、translation fast dayファイルを選択します。[開く]をクリックして選択を確定します。選択ボタンを使用してトランスクリプト注釈ファイルを選択します。
次に、データフォルダに移動し、注釈GTFファイルを選択して、[開く]をクリックします。ペプチドファイルの横にある追加ボタンを使用して、ペプチド同定ファイルを追加します。ここでは、サポートされている形式の MZ タブ、MZ Ident ML、または MZ ID のファイル、またはタブ区切りの 4 列形式のファイルを選択します。
さらに、出力形式の選択で BED NGTF の横にあるチェックボックスをオフにします。PTM BEDとGCTはオンのままにします。次に、ドロップダウン選択からデータに適切な種を選択し、[開始]をクリックしてマッピングを開始します。
まず、_ptm.ベッドで終わるPoGo出力ファイルを統合ゲノミクスビューアにロードします。繰り返して、_noptm.bed で終わるファイルも読み込みます。
このファイルには、修飾せずに見つかったすべてのペプチドが含まれています。トラックを並べ替えるには、トラックをリスト内の目的の位置にドラッグアンドドロップします。各ファイルは、トラックを識別するファイル名とともに個別のトラックとして表示されます。
各トラックは、最初は折りたたまれた状態で表示されます。展開するには、トラック名を右クリックして「expanded」を選択すると、配列を含むペプチドの全体像が表示されます。次に、gctで終わるファイルをロードします。
このファイルには、ペプチド定量情報が含まれています。以前にロードされたファイルとは異なり、注釈が付けられた各サンプルは個別のトラックとしてロードされます。必要に応じて、ドラッグ&ドロップ操作を使用してサンプルを再編成します。
ドロップダウンメニューで染色体を選択するか、染色体の一部をクリックしてズームインするか、ゲノム座標を入力して、ゲノム内を移動します。PoGoマッピングは、グラフィカルユーザーインターフェースまたはコマンドラインインターフェースを使用して実行できます。プロトコルのこの部分では、互換性を強調するためにコマンドラインインターフェイスが使用されます。
テキストプロトコルの前のステップで取得したバリアントペプチドを参照ゲノムにマッピングするには、コマンドプロンプトを開き、PoGoのexecutablesフォルダに移動します。次に、ここに示すコマンドを入力します。Enterキーを押して実行を確認し、実行が終了するまで待ってから先に進みます。
ミスマッチなしおよびミスマッチのあるペプチドにマッピングされたペプチドを、統合ゲノミクスビューアで可視化します。PoGoグラフィカルユーザーインターフェースソフトウェアで、ペプチドファイルの横にある追加ボタンを使用してペプチド同定ファイルを追加し、単一または複数のファイルを選択し、ペプチドファイルの下の空白フィールドにドラッグアンドドロップします。次に、出力形式セクションのPTM BED、GTF、およびGCTの横にあるチェックボックスをオフにし、BEDのみをオンのままにします。
さらに、複数の入力ファイルを 1 つの出力にマージするオプションを選択します。これにより、入力ファイルのすべてのペプチドを組み合わせた単一の出力ファイルが作成されます。このオプションを選択しないままにすると、各入力ファイルに対してプログラムが順次実行されます。
次に、Fast Day NGTFファイルと一致するドロップダウンからデータに適切な種を選択します。選択したら、開始ボタンをクリックしてマッピングを開始します。マッピングされたペプチドからトラックハブを生成するには、ターミナルウィンドウを開き、コマンドプロンプトに次のコマンドを入力します。
Enterキーを押して実行を確認します。実行は、完了するまでに少し時間がかかります。終了したら、生成されたトラックハブとそのすべてのコンテンツをWebアクセス可能なFTPサーバーまたはGitHubに転送します。
Webブラウザで、UCSC Genomeブラウザに移動し、[My Data Track Hubs]を選択します。次に、[マイハブ]タブをクリックします。トラックハブのURLをテキストフィールドにコピーし、[ハブの追加]をクリックしてトラックハブをロードします。
最後に、ゲノムブラウザを選択してブラウザビューに入ります。カスタムトラックハブがリストの上部に表示されます。複数の BED ファイルがトラック ハブの基礎として構築されている場合、各ファイルはハブ内の個別のトラックとして表されます。
ここでは、PoGoと他の2つのプロテオゲノミクスマッピングツールの全体的なメモリ使用量と分析ランタイムについて比較します。PoGoは、速度とメモリの両方で他のツールを大幅に上回り、ペプチドに関連する翻訳後修飾と定量情報をゲノムにマッピングすることができます。PoGoは、カラーリングオプションを利用して、ゲノム内のペプチドマッピングの一意性に関して簡単な視覚補助を提供します。
赤のマッピングは単一の転写産物への一意性を示し、ブロックは単一の遺伝子へのマッピングを強調しています。グレーのマッピングは、複数の遺伝子間で共有されるペプチドを示します。PoGoのPTM BEDオプションは、修飾されたアミノ酸残基に厚いブロックを持つ修飾の位置を示す、さまざまなタイプの翻訳後修飾に対応するようにカラーコードを再定義します。
ここに示されている大腸癌のプロテオームデータでは、2つのペプチドのみが同定されており、それぞれが単一のリン酸化を示していました。出力GCTファイルの情報は、ペプチドがカバーするゲノム領域の定量値を提供します。スプライスジャンクションにまたがるペプチドは、接続せずにそれらの部分に分割されます。
スプライシングに関するより包括的な情報を得るには、出力 GTF ファイルが追加で必要です。参照タンパク質の配列とアノテーションをダウンロードしてセットアップすると、配列の不一致を許さずに、数千のペプチドを5分以内にゲノム座標にマッピングできます。PoGoを使用してペプチドを参照ゲノムにマッピングする際には、タンパク質をコードする転写産物の翻訳配列と関連する転写産物アノテーションを使用することを忘れないようにすることが重要です。
このビデオを見れば、PoGoおよびPoGo GUIを使用して、プロテオミクス質量分析実験のペプチドと関連情報を参照されたゲノムにマッピングし、それらを視覚化する方法を十分に理解できるはずです。
この記事では、ポストトランスレーショナル修飾されたペプチドを質量分析から参照ゲノムに高速かつ定量的にマッピングするためのプロテオゲノミクスツールであるPoGoについて説明します。これにより、プロテオゲノミクスデータと直交するゲノミクスデータの統合と可視化が容易になります。