リボソームプロファイリング実験によって生成されたシーケンシングデータの解釈は、mRNA上のリボソームの翻訳活性を定量的に測定し、翻訳調節のメカニズムを研究するために重要です。本プロトコルでは、リボソームプロファイリングデータを利用するための計算手順と、mRNA翻訳をゲノムワイドスケールかつ一塩基分解能で解読するコマンドラインツールであるRiboCodeについて説明する。この方法は、注釈付きタンパク質コード遺伝子の外側のゲノム領域から生じる新規ペプチドを探索することを可能にし、mRNA翻訳速度を定量する機会を提供する。
まず、Linux ターミナルウィンドウを開き、コマンドを実行して conda 環境を作成します。作成した環境に切り替え、コマンドを実行してRiboCodeと依存関係をインストールします。参照配列のゲノム参照ファイルを取得するには、Ensembl の Web サイトにアクセスし、[ダウンロード] をクリックし、[FTP ダウンロード] をクリックします。
DNA FASTA列のFASTAオプションをクリックし、ウェブサイトページの表に示されている種がヒトである行を選択します。Ensembl Web サイトのページで、テキストに記載されているリンクをコピーし、コマンドを実行してターミナル内のファイルをダウンロードして解凍します。参照アノテーションのために、最後に開いた Web ページの列遺伝子セットの GTF を右クリックします。
リンクをコピーし、コマンドを使用してダウンロードします。rRNA配列を取得するには、UCSCゲノムブラウザを開き、[ツール]をクリックし、ドロップダウンリストでテーブルブラウザを選択します。UCSC ゲノム ブラウザー ページで、クレードに哺乳類、ゲノムにヒト、グループにすべてのテーブル、テーブルに R マスク、領域にゲノムを指定します。
[フィルター] で、[作成] をクリックして新しいページに移動し、rRNA と一致するように rep クラスを設定します。[送信] をクリックし、出力形式を sequence に設定し、ファイル名をHG38_rRNAとして出力します。ファ。最後に、[出力を取得] をクリックし、[シーケンスの取得] を選択して rRNA シーケンスを取得します。
シーケンス読み取りアーカイブからリボソームプロファイリングデータセットを取得するには、si-eIFe 処理グループの複製サンプルをダウンロードし、コマンドを実行して名前を変更します。次に、制御グループの複製サンプルをダウンロードし、コマンドを実行して名前を変更します。rRNA コンタミネーションを除去するには、コマンドを実行して rRNA 参照配列のインデックス作成を開始します。
インデックス作成後、コマンドを実行して、読み取りを rRNA 参照に合わせ、rRNA からの読み取りを除外します。まず、コマンドを実行してゲノムインデックスを作成します。次に、コマンドを実行して、rRNA汚染のないクリーン読み取りを作成された参照にアライメントし、コマンドを実行してファイルをソートおよびインデックス付けします。
コマンドを実行してトランスクリプト注釈を準備します。特定の長さのリボソーム保護フラグメントを選択し、コマンドを実行してそれらのPサイト位置を特定します。各サンプルの構成ファイルを編集し、マージします。
次に、コマンドを実行して RiboCode を実行します。リードの長さの頻度分布は、ほとんどのリボソーム保護断片が25〜35ヌクレオチドに対応することを示した。異なる長さのリボソーム保護断片のPサイト位置は、それらの5つの素数端から注釈付き開始コドンおよび終止コドンまでの距離を調べることによって決定された。
マッピング結果は、10, 394の遺伝子が注釈付きオープンリーディングフレームをコードすることを示している。さらに、509および168の遺伝子が上流および下流のオープンリーディングフレームをコードする一方、939の遺伝子が上流または下流のオープンリーディングフレームのいずれかをコードする、既知の注釈付きオープンリーディングフレームと重複している。さらに、68のタンパク質コード遺伝子および2,601の非コード遺伝子が、新規なオープンリーディングフレームをコードする。
長さ分布は、上流、下流、新規、および重なり合ったオープンリーディングフレームが、注釈付きオープンリーディングフレームよりも短いことを示した。リボソーム保護断片の相対数は、各オープンリーディングフレームについて計算され、上流のオープンリーディングフレームのリボソーム密度は、対照細胞よりもeIF3e欠損細胞において有意に高かったことが明らかになった。メタジーン解析により、開始コドンの下流のコドン25と75の間でリボソームの塊が失速していることが明らかになり、eIF3e欠損細胞では翻訳伸長が早期に遮断される可能性が示唆された。
PSMA6の上流オープンリーディングフレームおよび遺伝子SENP3-EIF4A1のダウンストリームオープンリーディングフレームのPサイト密度プロファイルを調べ、リボソーム保護断片の周期性パターンおよび密度を実証した。既知のタンパク質コード領域の開始コドンおよび終止コドンの周りのリードの位置を確認することは、各長さのリードの周期的特性を評価するために必要である。RiboCodeは、別のコマンドラインツールとともに、品質管理や、予測されたオープンリーディングフレーム上のリボソーム占有率の定量化や視覚化などの複数の分析を実行することもできます。
この計算ツールは、特定の生理学的文脈におけるリボソームプロファイリングデータを使用して非正規の翻訳イベントを識別するための高スループットの方法を提供し、刺激に応答して翻訳がどのように変調するかを提供します。