Method Article

DiCoExpress による多因子 RNA-Seq 実験の解析

DOI:

10.3791/62566

July 29th, 2022

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

DiCoExpress は、品質管理から共発現までの RNA-Seq 分析を実行するために R に実装されたスクリプトベースのツールです。DiCoExpressは、最大2つの生物学的要因まで完全でアンバランスな設計を処理します。このビデオチュートリアルでは、DiCoExpressのさまざまな機能について説明します。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NGSデータ分析で統計モデリングを適切に使用するには、高度な専門知識が必要です。最近、RNA-Seqデータの微分解析に一般化線型モデルを使用することと、共発現解析を実行するための混合モデルの利点について、コンセンサスが高まっています。これらのモデリングアプローチを使用するための管理された設定を提供するために、RNA-Seq分析を実行するための標準化されたRパイプラインを提供するDiCoExpressを開発しました。統計学やRプログラミングの知識がなくても、一般化線型モデル内のコントラストに基づく微分解析により、品質管理から共発現まで、完全なRNA-Seq解析を実行できます。エンリッチメント解析は、発現差のある遺伝子のリストと、共発現遺伝子クラスターの両方で提案されています。このビデオチュートリアルは、ユーザーがDiCoExpressとRNA-Seq実験の生物学的解釈を強化する可能性を最大限に活用するのに役立つステップバイステップのプロトコルとして考案されています。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

次世代RNAシーケンシング(RNA-Seq)技術は、トランスクリプトーム解析のゴールドスタンダードとなっています1。この技術の黎明期から、バイオインフォマティシャンと生物統計学者の共同の努力により、マッピングから転写産物の定量化まで、トランスクリプトーム解析のすべての重要なステップに取り組む多数の方法が開発されました2。生物学者が現在利用できるツールのほとんどは、統計計算とグラフ3のためのRソフトウェア環境内で開発されており、生物学的データ分析のための多くのパッケージはBioconductorリポジトリ4で利用可能です。これらのパッケージは、分析の完全な制御とカスタマイズを提供しますが、コマンドラインインターフェイスの広範な使用を犠牲にしています。多くの生物学者は「ポイントアンドクリック」アプローチ5により慣れているため、RNA-Seq分析の民主化には、よりユーザーフレンドリーなインターフェースまたはプロトコルの開発が必要です6。例えば、Shiny7 を使用して R パッケージの Web インターフェイスを構築することができ、R-studio8 インター....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. ディコエクスプレス

  1. R スタジオ セッションを開き、ディレクトリを Template_scripts に設定します。
  2. R スタジオで DiCoExpress_Tutorial.R スクリプトを開きます。
  3. DiCoExpress 関数を以下のコマンドを使用して R セッションにロードします。
    >ソース("../出典/Load_Functions.R")
    > Load_Functions()
    > Data_Directory = "../データ"
    > Results_Directory = "../結果/"
  4. 次のコマンドを使用して、R セッションにデータ・ファイルをロードします。
    > Project_Name = "チュートリアル"
    > フィルター = NULL
    > 9月="\t"
    > Data_Files = Load_Data_Files(Data_Directory、Project_Name、フィルター、9月)
  5. オブジェクトData_Filesをいくつかのオブジェクトに分割して、簡単に操作できるようにします。
    > Project_Name = Data_Files$Project_Name
    >ターゲット = Data_Files$ターゲット
    > Raw_Counts = Data_Files$Raw_Counts
    >アノテーション = Data_File....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

すべての DiCoExpress 出力は Tutorial/ ディレクトリに保存され、それ自体が Results/ ディレクトリ内に配置されます。ここでは、分析の全体的な品質を評価するためのガイダンスを提供します。

品質管理
Quality_Control/ ディレクトリにある品質管理出力は、RNA-Seq分析結果が信頼できることを確認するために不可欠です。Data_Quality_Control.pdfファイルには、生データと正規化されたデータで得られたいくつかのプロットが含まれており、データに関する潜在的な問題を特定するために使用できます。サンプルごとの正規化度数の合計は、条件内条件と条件間の両方を比較する場合、類似している必要があります。さらに、正規化された遺伝子発現カウントは、条件内および条件間の両方で同様の中央値および分散を示すと予想されます(図3A)。そうしないと、条件間の類似性のない分散の兆候である可能性があり、モデル適合に問題となる可能性があります。

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

RNA-Seqは生物学的研究においてユビキタスな方法となっているため、汎用性とユーザーフレンドリーな分析ツールの開発が常に必要とされています。ほとんどの分析ワークフローにおける重要なステップは、多くの場合、生物学的条件および/または治療間で発現差のある遺伝子を自信を持って同定することです15。信頼性の高い結果を生み出すには、適切な統計モデリングが必要であり、これがDiCoExpressの開発の動機となっています。

DiCoExpressは、生物学者がDEGを探す際に中立的な比較研究の可能性を最大限に活用するのを助けることを目的としたRに実装されたスクリプトベースのツールですDiCoExpressは、データ構造と品質を評価する機会を提供する標準化されたパイプラインを提供し、したがって、最良のモデリングアプローチが選択されることを保証します。統計学やRプログラミングの知識がなくても、一般化線型モデル内のコントラストに基づく微分解析を通じて、品質管理から共発現まで、完全なRNA-Seq解析を実行できます。DiCoExpressはRNA-Se.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者らは開示するものは何もありません

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究は主にANR PSYCHE(ANR-16-CE20-0009)によって支援された。著者らは、DiCoExpressのコンテナの建設についてF. Desprezに感謝する。KBの作業は、未来への投資ANR-10-BTBR-01-01 Amaizing Programによってサポートされています。GQEおよびIPS2研究所は、Saclay Plant Sciences-SPS(ANR-17-EUR-0007)の支援を受けています。

....

Access restricted. Please log in or start a trial to view this content.

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10 (1), 57-63 (2009).
  2. Yang, I. S., Kim, S. Analysis of Whole Transcriptome Sequencing Data: Workflow and Software. Genomics & Informatics.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

RNA Seq AnalysisDifferential AnalysisCo Expression AnalysisGeneralized Linear ModelEnrichment AnalysisQuality ControlGene ExpressionNormalization MethodPrincipal Component AnalysisDiCoExpress Pipeline

Related Articles