IR-TEx:マラリアベクトルアノフェレスガンビア用に設計されたビッグデータトランスクリプトミクスのためのオープンソースデータ統合ツール

Biology
 

Summary

IR-TExは、種アノフェレスガンビアで殺虫剤耐性関連転写プロファイルを探索します。ここでは、アプリケーションの使用方法、複数のトランスクリプトミック データセットを探索するための変更、およびフレームワークを使用して、任意のプラットフォームで生成された任意の生物からのトランスクリプトミクトミック データの収集用の対話型データベースを構築するための完全な手順について説明します。

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

IR-TExは、アノフェレスガンビア蚊の殺虫剤耐性表現型に関連する発現(ならびに関数の割り当て)の発現の探索を可能にするシャイニー(Rパッケージ)で書かれたアプリケーションです。アプリケーションは、オンラインで使用したり、ダウンロードして誰でもローカルに使用することができます。ローカル アプリケーションを変更して、複数の -omics プラットフォームから生成された新しい殺虫剤耐性データセットを追加できます。このガイドでは、新しいデータセットを追加し、不足しているデータを処理する方法を示します。さらに、IR-TExは、あらゆる実験データからオミクスデータセットを使用するように完全かつ簡単に再コード化できるため、多くの研究者にとって貴重なリソースとなっています。このプロトコルは、ミクロソームグルタチオントランスフェラーゼ、GSTMS1を用いた新しい殺虫剤耐性候補を同定する際のIR-TExの有用性を例として示す。このトランスクリプトは、コートジボワールとブルキナファソから複数のピレスロイド耐性集団でアップレギュレートされています。共相関転写物の同定は、この遺伝子の述語的役割に関するさらなる洞察を提供する。

Introduction

マイクロアレイプラットフォームとRNAseq技術を通じて多数のトランスクリプトの発現を同時に測定する能力は、モデルおよび非モデル生物の両方で特定の表現型と転写表現を関連付ける膨大なデータセットの生成をもたらしました。これらのデータセットは、研究者にとって非常に豊富なリソースであり、ビッグデータ統合アプローチで関連するセットを組み合わせることで、そのパワーを高めることができます。しかし、この方法論は、特定のバイオインフォマティクスのスキルを持つものに限定されます。ここで説明するプログラムであるIR-TEx(以前はIngham et al.1.によって公開された)は、Shiny2と呼ばれるRパッケージで書かされ、バイオインフォマティクスの訓練がほとんどないユーザーがこれらのデータセットを比較的簡単に統合して尋問することを可能にします。

HTTP://WWW.LSTMED.AC.UK/PROJECTS/IR-TEXで発見されたIR-TExは、アフリカの主要なマラリアベクター1であるアノフェレスガンビアにおける殺虫剤耐性に関連する転写物を探索するために書かれた。マラリアは、メスのアノフェレス蚊の咬傷を介してヒト間で伝染するマラリア原虫によって引き起こされる寄生虫病である。蚊ベクターを殺虫剤で標的にすることは、アフリカにおけるマラリア関連の罹患率と死亡率を予防する最も効果的な手段であることが証明されている。ツール(すなわち、長期的な殺虫網)のスケールアップは、2000年3年以来、マラリア症例の劇的な減少においても極めて重要である。殺虫剤の数が非常に限られているため、蚊に強い進化圧力があり、アフリカのマラリアベクター4では耐性が広がっています。

さらに、標的部位突然変異5および殺虫剤の代謝クリアランス6、7は依然として抵抗性の主要な研究メカニズムであるが、他の強力な耐性機構は現在1を出現している。これらの新しいメカニズムの多くは、これまで殺虫剤耐性と関連していなかったが、IR-TExアプリを用いて複数の耐性集団にわたる遺伝子発現の共通パターンを探索し、その後ゲノムアプローチによって機能的に検証されることによって検出された。

ここでは、WEB 上とローカルにインストールする場合の両方で IR-TEx を使用する手順を説明します。このプロトコルは、新しい殺虫剤耐性データセットを既存のパッケージに統合する方法を説明し、欠落しているデータを操作する方法について説明します。最後に、殺虫剤耐性とは無関係の他の -omics データセットでこのソフトウェアを使用する方法について説明します。

Protocol

1. IR-TEx Web アプリケーションの使用

  1. Web ブラウザーでのアプリケーションの実行
    1. ir-TEx Web アプリケーションを開くには、http://www.lstmed.ac.uk/projects/IR-TExにあるページの下部にあるリンクをクリックします。
    2. Web ページが初期化されたら、ページの上部にある[アプリケーション] ボタンをクリックすると、アプリケーションと関連する出力が表示されます。
    3. AGAP008212-RA (CYP6M2) のデフォルトエントリに関連する各出力を、次の条件を持つトランスクリプト ID ボックスで読み取ります: (i) ピレスロイド系殺虫剤または(ii)殺虫剤クラスに曝露されていないコルジイデータセット、および|r|>0.98.
  2. 興味のあるトランスクリプトの表現を探る
    1. 目的のトランスクリプトを選択するには、トランスクリプト ID を [トランスクリプト ID]ボックスに入力し、トランスクリプトが目的の等方に依存して-RXで終わることを覚えておいてください。
    2. (i) 国の関連ボックスにチェックを入れ、問い合わせるデータセットを選択します。(ii) 被ばく状態、(iii) 対象種;(iv) 対象の殺虫剤クラスは、これらの基準が >1 に含まれるデータセットをもたらすことを保証しながら(Ingham et al.1の補足表 1 を参照)。
      注:(iii)は、ユーザが興味を持ったAn.ガンビア種複合体のメンバーを指す。現在、An. coluzziiAn. arabiensisのデータが利用可能です。
    3. 選択メニューの下部にある「ビューの更新」をクリックするか、Returnを押して絶対相関値を無視します (現時点では)。
    4. アプリケーションの更新時間を指定します。
    5. 最初のグラフを読む: ステップ1.2で選択した基準を満たす各データセット全体の対象トランスクリプトの耐性集団とラボの影響を受けやすい蚊の集団の間のログ 2 倍の変化 (図 1) 。すべてのデータセットの詳細については、Ingham et al.1を参照してください。
    6. グラフの下の情報を読む:補正されたp値(Q)に加えて、関連するデータセットごとに耐性と影響を受けやすい蚊の間の折り畳み変化。各行は、マイクロアレイ上の個々のプローブを表します。グラフィカル表示の方法論は、以前に1.
    7. 対象のトランスクリプトが有意な実験の数と、ステップ 1.2 で選択した基準に一致する実験の総数として、以下の追加の表をお読みください。
    8. タブ区切り形式でデータをダウンロードするには、2 つのテーブルの下にある [ダウンロード]ボタンをクリックします。これにより、ユーザーは Excel などのプログラムを使用して、より簡単にデータを探索できます。
    9. マップを次のように解釈する: 各ポイントは、対象のトランスクリプトが差分的に表現されている各データセット内の耐性蚊のおおよその収集サイトを表します。色は、アプリで説明されている信号システムに従います (図 2)。
    10. 手順 1.2.5 および 1.2.8 では、右クリックして [イメージに名前を付けて保存] をクリックし、適切なフォルダを選択して、グラフィカル出力を保存します。
      注: アプリケーションによる出力エラーの場合、入力された条件に一致するデータセットがない可能性があります。これが発生した場合は、Ingham et al. 1 の補足表1を確認してください。
  3. 関心のあるトランスクリプトの可分性関数/経路の同定
    1. 複数のデータセットにまたがるトランスクリプトの発現パターンの相関(入力された最小r2値)を使用して、トランスクリプト関数を予測し、同じ経路から共調節されたトランスクリプトを解明する可能性があります。インガムら1 (AGAP001076-RA;CYP4G16) を参照 )、上記のセクションの手順 1.2.1 ~ 1.2.2 に従って、最大の電力を与えるすべてのデータセットを選択します。
    2. [ビューの更新] をクリックする前に、[絶対相関値] スライダを 0.85 に移動し、[ビューの更新] をクリックするか、Returnキーを押します。
    3. 相関テーブル (一番下の表) を調べて、現在表示され、入力されたトランスクリプトと相関している複数のトランスクリプト (|r| = 0.85) を見つけます。
    4. [絶対相関値]スライダを操作し、一番下のグラフとテーブルの変化を観察します。ステップ 1.3.2 からの出力は変更されません。図 3に示すように (|r| > 0.9, |r| > 0.8)、 相関値のストリンジェンシーを下げると、より多くのトランスクリプトが表示されますが、より多くのノイズが発生します。
    5. グラフィカル出力の下の表を読んでください(ステップ 1.2.6 で説明したパラメータに加えて)、各トランスクリプトの相関値が含まれています。
    6. タブ区切りの形式でデータをダウンロードするには、[ダウンロード] ボタンをクリックします。
    7. 機能エンリッチメント分析は、DAVID分析8を使用してダウンロードしたトランスクリプトIDリストに対して実行できます。DAVID Web サイト(https://david.ncifcrf.gov/にあります) で、[機能分析]を選択します。完全な遺伝子リストを貼り付け、遺伝子 ID を使用して [-RX なしの識別子, 体系的な ID の右側に列を挿入し、=LEFT(X1,10)と入力して Excel で実行できます。[VectorBase_IDおよび遺伝子リストとして識別子を選択し、[リストの送信] をクリックします。
    8. [機能アノテーションクラスタリング]ボタンをクリックすると、この相関ネットワークにあるエンリッチメントの概要が表示され、潜在的な機能をトランスクリプトに割り当てることができます。さまざまなカテゴリを調べ、それぞれの[+]ボタンをクリックし、その後で[グラフ] をクリックして、詳細な情報付加を調べます。

2. IR-TEx をローカルでダウンロードして実装する

  1. IR-TEx のダウンロードと実行
    1. http://github.com/LSTMScientificComputing/IR-TExにあるリンクに移動します。をクリックし、[複製] または [ダウンロード] |Zipをダウンロードします。選択したフォルダに移動し、そのフォルダ内のファイルを解凍します。
    2. http://cran.r-project.org/mirrors.htmlにあるリンクから、適切なオペレーティング システム用の最新バージョンの R ソフトウェアダウンロードします。プログラムをインストールします。
    3. 最新のR Studioソフトウェアをダウンロードしてインストールし、http://www.rstudio.com/products/rstudio/download/にあるリンクから適切なオペレーティングシステム用にもう一度インストールします。
    4. インストールが完了したら、R Studio |補足コーディングファイル 1を実行し、各行を実行して IR-TEx のシステムをセットアップします。
    5. すべてのパッケージが正常にインストールされ、必要に応じて更新されたら、[ファイル|を開き、IR-TEx.Rを見つけ、強調表示して開きます。これはR Studioの上部ウィンドウに表示されます。
    6. アプリを実行するには、ウィンドウの右上にある [アプリの実行] ボタンを押すと、アプリが読み込まれる 2 つ目のウィンドウがポップアップ表示されます。読み込みが完了したら、すべての機能を使用するには、読み込まれたウィンドウの右上にある[ブラウザーで開く] をクリックします。
  2. IR-TExへの抵抗データセットの追加(アノフェレスガンビア15kアジレントアレイを使用して生成)
    1. 同じマイクロアレイ プラットフォーム (A-MEXP-2196) で生成された新しい分析済みデータセットを使用可能なデータセットに追加するには、アプリをダウンロードし、セクション 2.1 でダウンロードした解凍されたフォルダーを見つけます。
    2. A-MEXP-2196 1のリマ解析からの出力を表す追加ファイル 1を開きます。Excel を使用して、列 H1 にFold_Changeを書き込み、H2 で=2^B2を書き込みます。列 H 全体にこれを適用して、生の折りたたみの変更を生成します。
    3. 列 A が ID、列 B が列 H からの折りたたみ変更 (列 H のコピー、列 B の強調表示、右クリックして値の貼り付け)、列 C が調整済み p 値となるように追加ファイル 1を配置します。他のすべての列を削除し、タブ区切りファイルとして保存します。
    4. 補足コーディング ファイル 2 を開き、手順2.2.3で生成したタブ区切りシートを使用して実行します。
      NEWFILE_FC = c(「国」、「暴露ステータス」、「種」、「殺虫剤」)
      NEWFILE_Q = c(「国」、「暴露ステータス」、「種」、「殺虫剤」)
      注 : 単一引用符内のフィールドは、新しいデータセットの情報を反映するように変更する必要があります。暴露状態とは、殺虫剤暴露(露光/露出なし)に続いてサンプルが採取されたかどうかをいう。殺虫剤:「露出していない」場合は、「なし」を使用します。Fold_Changes.txt を参照してください。(他のサンプルからのメタデータの場合)。スペルが一貫していることを確認します。
    5. geography.txtを開き、最後の占有行までスクロールして、下を選択します。データセットの名前を入力し、次にQNEWFILE_Q列 1、列 2 のサンプル コレクション サイトの緯度、および列 3 の経度を入力します。変更を保存します。
    6. データセット内で選択できない新しいエントリ (つまり、ガンビア) が使用されている場合 (Ingham et al. 補足表 11を参照)、これらをコードに追加する必要があります。これを行うには、RStudio で IR-TEx.R を開き、RStudio で示されているように 26 行目を見つけます。
      'サイドバーパネル(....'.
      注: 進行中の各行は、手順 2.2.5 で Fold_Changes.txt のデータセット名の下の行に入力されたメタデータの項目に関連しています。
    7. 新しいメタデータを追加するには、選択したメタデータの行の末尾までスクロールし、用語 'selected=' を見つけます。この直後には、コンマと閉じた角かっこを指定する必要があります。この位置で、閉じた角かっこ内のカーソルをクリックします。最後のアポストロフィの後に、コンマの後にアポストロフィを入力し、その後に新しいメタデータ(例えば「ガンビア」)を入力し、変更を保存します。例については、以下を参照してください。
      チェックボックスグループ入力(「カントリー入力」、「関連国を選択する」)、c(「ブルキナファソ」、「コートジボワール」、「カメルーン」、「赤道ギニア」、「ザンビア」、「タンザニア」、「スーダン」、「ウガンダ」、「トーゴ」、 'ガンビア')、選択=c=c(「ブルキナファソ」、「コートジボワール」、「カメルーン」、「赤道ギニア」、「ザンビア」、「タンザニア」、「スーダン」、「ウガンダ」))
    8. アプリを実行します。新しいメタデータエントリは、該当する見出しの下に選択されていないチェックボックスとして表示されます。ユーザーが選択する場合は、次に示すように、選択した =c(...) の後に追加する必要があります。
      チェックボックスグループ入力(「カントリー入力」、「関連国を選択する」)、c(「ブルキナファソ」、「コートジボワール」、「カメルーン」、「赤道ギニア」、「ザンビア」、「タンザニア」、「スーダン」、「ウガンダ」、「トーゴ」、 'ガンビア')、選択=c=c('ブルキナファソ'、'コートジボワール'、カメルーン'、'赤道ギニア'、'ザンビア'、'タンザニア'、'スーダン'、'ウガンダ'、'トーゴ'、'ガンビア')
    9. A-MEXP-2196 で実行されない抵抗データセットを追加するには、セクション 3 を参照してください。

3. 異なるデータセットで使用する IR-TEx の変更

  1. 複数の -omics プラットフォームで使用し、欠落データを処理する
    1. データセットで "0" を続行するには、データセット ソースで "0" の特定の意味を調べるようにします。"0" は (控えめに) "NA" に置き換えられることをお勧めします。生の折り畳み変化(B/A)と同様に、「0」は実験条件Bにおいて検出されない信号を示す。実験条件Aが実質的な発現を示す場合には、ユーザは小さな折り畳み変化値を適用することができる。
    2. 追加ファイル 2.txtを開く , Uyhelji らから適応した RNAseq ファイル.9. 9 .このファイルは、新しいデータの基になるテンプレートを表します: 列 A = 識別子、列 B = 生の折り畳み変更、および列 C = 調整された p 値。このファイルを使用して、次の手順を実行します。
    3. R コードを実行して、プラットフォーム間で識別子を 1 つのタブ区切りファイルに一致させ、データを整理して正規化します (補足コーディング ファイル 2)。命令はファイル内に含まれています。FILEPATH は、MacOS の場合は "/" で区切られ、Windows の場合は "//" で区切られます (表示される "\" から変更します)。
    4. 補足コーディング・ファイル 2の最後に作成されたファイルを、ステップ 3.1.5 で使用する任意の場所に出力します。補足コーディング ファイル 2は、新しいFold_Changes.txtファイルを出力します。元のファイルをバックアップします。
    5. 補足コーディング ファイル 3に含まれるコードを実行します。FILEPATHとして指定されたフォルダでFC_distribPlot.pngという名前の出力ファイルを検索します。ログ2フォールド変更の分布をチェックして、ログ2フォールド変更分布がデータセット間でほぼ同一であることを確認します。
    6. 手順 2.2.6 の指示に従って、追加のファイルを編集し、新しいFold_Changes.txt の互換性を確認します。
  2. まったく新しいデータセットで使用する IR-TEx の変更
    1. RStudio でIR-TEx.Rを開き、次で始まる行 (23 ~ 34) を見つけます。
      'タブパネル('
      と終わる:
      送信ボタン(「ビューの更新」、アイコン(「更新」))
      ),
    2. 以下の行にあるAGAP008212-RAを、新しいデータに対する関心のあるトランスクリプトに変更します。
      テキスト入力('テキスト入力','トランスクリプト ID',値='AGAP008212-RA')
    3. 次の 4 つのオプションを見つけます。
      チェックボックスグループ入力(
      これらのオプションは、ユーザーが新しいデータをフィルター処理する重要なメタデータを表すように変更できます。各インスタンスで、ユーザーは[関連国の選択] を変更する必要があります。[露出ステータス]を選択します。関連する種を選択します。データを表す殺虫剤クラスを選択します(すなわち、組織タイプを選択してください。セックスを選択します。[年齢ブラケット] を選択します。病気の状態を選択).
    4. データセットと入力に関連付けられているメタデータを識別し、最初のc(' 'の直後の既存のオプションを置き換えます。各インスタンスでは、オプションは音声マーク内に含まれ、次の選択範囲からコンマで区切られます。最後の選択後、角かっこを閉じる必要があります。[疾患の状態を選択する] の例を次に示します。
      c(「感染」、「感染していない」、「不明」)
    5. アプリを開くときに、これらのメタデータのどれを選択するかを選択します。これらは、selected=c('の後にオプションを変更することによって変更できます。[疾患の状態を選択する] の例を次に示します。
      選択=c(「感染」、「感染していない」)
      これにより、最初の読み込み時にこれらの条件に一致するデータセットのみを選択するようにアプリに指示します。
    6. 新しいデータ テーブルを作成するには、Fold_Changes.txtのレイアウトとセクション 2 の手順に従います。メタデータを、コードに記述したとおりに、手順 3.2.4 で概説したそれぞれの変更に変更します (R では大文字と小文字が区別されます)。解毒列に、遺伝子名を入力し、および転写タイプ列に、各転写物の遺伝子記述を入力する。新しいデータセットを追加する場合は、セクション 3.2 に従ってください。
    7. マッピングが実験要件に関連しない場合は、次のコード行を見つけて、'#' を前に配置します。
      49–51 行目:
      br(),br(),
      withスピナー(プロット出力(「地理」)、
      テキスト出力('Geography_legend')
      493 行目の開始行:
      出力$地理 <- レンダープロット({
      602 行の終了行まで:
      出力$Geography_legend
      貼り付け ("有意なトランスクリプトのみ (p", as.expression("<="),"0.05): FC > 5 = 赤、 FC > 1 = アンバー、FC < 1 = 緑 "、sep="")
      })

Representative Results

IR-TExに含まれるFold_Changes.txtファイルを使用して、耐性アノフェレス・コルッツィーアノフェレス・ガンビアのデータセットで有意に差別的に表現されたトランスクリプトを、コートジボワールとブルキナファソの影響を受けやすいコントロールと比較しました。これにより、関心のある 18 個のトランスクリプトが作成されました (表 1;この検索は、Excel、R、またはその他のプログラムを使用して実行できます)。これらのうちの2つは、ATPase(AGAP006879)およびα-クリスタリン(AGAP007160)が、前者がピレスロイド抵抗1に有意な影響を有すると以前に報告されている。これら2つの転写物に加えて、GSTMS1(FCμ= 1.95および1.85)およびUGT306A2(FCμ=2.29および2.28)の2つの解毒転写物が存在した。

これらの転写物のうちの2つのqPCR検証(GSTMS1、解毒転写物;およびAGAP009110-RAは、β-1,3-グルカン結合ドメインを含む未知の蚊特異的転写物)先に説明したように行った。分析は、追加ファイル3で説明したプライマーセットを使用して行われ、これらのトランスクリプトはコートジボワール(ティアサレ)とブルキナファソ(バンフォラ)からの多耐性集団で有意にアップレギュレーションされたことを示しました(図4A)。

両方の転写物が各耐性集団で有意なアップレギュレーションを示したので、RNAi誘発ノックダウンはLSTM実験室ティアサレコロニーからの蚊に対して行われた。このコロニーはコートジボワールに由来し、前述の1、10で説明したように、公衆衛生で使用されるすべての主要なクラスの殺虫剤に耐性があります。GSTMS1の発現の減衰は、GFP注入対照と比較してデルタメトリン曝露後の死亡率の有意な増加(p=0.021)をもたらし、ピレスロイド耐性におけるこの転写物の重要性を実証した(4B)。逆に、AGAP009110-RAノックダウンは、暴露後の死亡率の有意な変化(p = 0.082)を生じさせず(4B)。

GSTMS1はミクロソームGSTであり、A.ガンビア11に見られる3つのうちの1つです。GSTのイプシロンおよびデルタクラスのメンバーは、以前に殺虫剤解毒12、13、14に関与していたが、これはピレスロイド抵抗15におけるミクロソームGSTの役割に関する我々の知識に対する最初の証拠である。アノフェレスガンビアsl蚊におけるこの転写物の推定機能を調べるために、IR-TExにおける発現および相関を同定した。GSTMS1は、バイオコ島を除き、これらの種で利用可能な21のデータセットのうち20データセットで有意に過剰発現しました。各場所では、過剰表現は影響を受けやすい集団に比べて5倍未満でした(図5)。

ミクロソームGSTは、潜在的な殺虫剤の解熱剤としてほとんど無視されてきたので、殺虫剤耐性15におけるその役割についてはほとんど知られていない。他の転写物の共相関を探索することにより、併置機能は、同じ経路における共調節または関与の仮定を通じて解明することができる。相関ネットワークの電力を最大化するために、IR-TEx に存在するすべてのマイクロアレイ データセットが選択され、|r|の >0.75 が選択されました。表 2に、IR-TEx からの出力を示します。

これらの転写物は、DAVIDの機能的注釈ツール8におけるオキシオレダクターゼ活性およびグルコース/炭水化物代謝に富む。グルコース-6-リン酸デヒドロゲナーゼおよびシタチオンガンマリアゼは、哺乳動物細胞16、17におけるグルタチオンのレベルを維持ししたがって、グルタチオン-SトランスフェラーゼであるGSTMS1と直接リンクする。カタレーゼは、反応性酸素種の損傷から細胞を保護する速効性酸化ストレスレスポンダーであり、ピレスロイド暴露の副産物である。バラシクロビルヒドロラーゼは、哺乳動物細胞18における解毒に役割を果たし得るヒドロラーゼである。CYP4H17は相関ネットワークにも存在する。シトクロムp450sは、ピレスロイド殺虫剤の直接代謝産物であり、これらの分解産物はGSTによってさらに代謝することができる。最後に、CYP4H17A.フネストゥス19におけるピレスロイド耐性に関与している。これらのデータをまとめると、異種解毒におけるGSTMS1の役割を強く支持する。

Figure 1
図 1: すべてのデータセットで AGAP002865-RA の折りたたみ変更をログ2 に記録します。X 軸は、さまざまなデータセットの詳細を示し、前のパブリケーション1の補足表 1 に記載されている情報と、Y 軸は対象トランスクリプトの対数2倍の変化を示します。明るい灰色の点線は、有意性のおおよそのしきい値を示し、ここで使用すると 、<0.8 の折りたたみ変更または >1.2 の折りたたみ変更になります。黒い点線は、折り目が 1 の変化を示します (つまり、耐性集団と影響を受けやすい集団の間の表現に違いはありません)。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 2
図2:耐性集団におけるAGAP002865-RAの有意な微分発現を示すマイクロアレイの分布折りたたみの変更は、<1 の緑色の折り目の変更、>1 のオレンジ色の折り目の変更、および >5 の赤い折り変えという信号システムで表されます。有意な (p ≤ 0.05) 微分式を持つデータセットのみが表示されます。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 3
図 3: AGAP001076-RA の相関ネットワーク (CYP4G16)ペアワイズ相関は、31マイクロアレイデータセット全体のすべてのトランスクリプトで計算され、ユーザー定義のカットオフが適用されます。ここに示されている (A) |r |> 0.9 および (B) |r |> 0.8.グラフに表示されるすべてのトランスクリプトは、この基準を満たし、AGAP001076-RAの式の変化に従います。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 4
4:GSTMS1およびAGAP009110-RAの減衰時のmRNA発現および表現型。(A)コートジボワールとブルキナファソの2つの多耐性An.コルッツィー集団におけるGSTMS1およびAGAP009110-RAのmRNA発現。レベルは、ラボの影響を受けやすいAn.コルッツィイ・ヌグーッソと比較された。ポストホックダネットの検定でANOVAによって計算された有意水準。(B)GFP注入対照と比較した両方の転写物のRNAi誘発減衰。GSTMS1減衰は、デルタメトリン暴露後の死亡率の有意な増加を示す(ポストホックTukey検定でANOVAによって計算される;*p ≤ 0.05,**p ≤ 0.01)。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 5
図5:アノフェレスガンビアおよびアノフェレス・コルジイ集団におけるGSTMS1の発現使用可能なマイクロアレイ データセットにおけるGSTMS1の有意差分式を示すマップ。GSTMS1は、21個のマイクロアレイデータセットのうち20個で有意に差分であることが判明した。この図の大きなバージョンを表示するには、ここをクリックしてください。

トランスクリプト ID 説明 ブルキナファソ コートジボワール
AGAP006879-RA Atpase 27.94 43.05
AGAP007160-RB a-クリスタリン 11.49 10.58
AGAP007160-RC a-クリスタリン 11.14 10.38
AGAP007160-RA a-クリスタリン 9.78 9.84
AGAP009110-RA 未知 9.26 5.96
AGAP007780-RA NADHデヒドロゲナーゼ 10.49 3.77
AGAP006383-RA オリゴサッカリルトランスフェラーゼ複合サブユニットベータ 3.69 5.57
AGAP007249-RB フライトイン 4.61 3.86
AGAP003357-RA RAG1活性化タンパク質1様タンパク質 4.31 4.05
AGAP007249-RA フライトイン 4.48 3.46
AGAP001998-RA mRpS10 3.46 2.85
AGAP007589-RA UGT306A2 2.29 2.28
AGAP000165-RA GSTMS1 1.95 1.85
AGAP002101-RA イソレウシル-tRNA合成酵素 0.57 0.59
AGAP002969-RA アスパラギンニル-tRNA合成酵素 0.45 0.45
AGAP004199-RA 溶質担体ファミリー5(ナトリウム結合モノカルボン酸トランスポーター)、部材8 0.35 0.48
AGAP004684-RA rRNA処理タンパク質 CGR1 0.36 0.22
AGAP006414-RA Cht8 0.024 0.36

表1:ブルキナファソとコートジボワールの集団間で同じ折り変わり方向の有意な差An. coluzziiおよびAn. ガンビアの集団を表す 2 つの国の各データセットのトランスクリプト ID、遺伝子記述、および平均フォールド変更。

相関 体系的な名前 トランスクリプトの種類
1 AGAP000165-RA GSTMS1
0.82 AGAP004904-RA カタラーゼ
0.76 AGAP007243-RA 26Sプロテアーゼ調節サブユニット 8
0.79 AGAP008358-RA CYP4H17
0.76 AGAP009436-RA バラシクロビルヒドロラーゼ
0.75 AGAP010739-RA グルコース-6-リン酸-1-デヒドロゲナーゼ
0.85 AGAP011172-RA シスタチオニンガンマライアゼ
0.76 AGAP012678-RA グルコース-6-リン酸-1-デヒドロゲナーゼ

表 2: GSTMS1との共同相関のトランスクリプト 。次の表は、IR-TEx 上のGSTMS1の相関ネットワークの出力を示しています。>0.75 のを参照してください。表は、各共相関転写物のスピアマンの相関、トランスクリプトID、および遺伝子記述を示しています。

追加ファイル 1: リマで分析された A-MEXP-2196 アレイからの出力ファイル。このファイルは、配列エクスプレス(E-MTAB-4043)および別の以前の出版物1で詳しく説明されているGFPコントロールアレイと比較してMetノックダウンから発生します。列は AGAP 識別子 (システマチックネーム)、ログフォールド変更 (logFC)、ログ式の値 (AveExpr)、t 統計 (t)、補正されていない p 値 (P.Value)、調整された p 値 (adj) を表します。P.Val)、および B 統計量 (B)20.このファイルの目的のために、蚊はコートジボワールのアノフェレス・コルッツィであり、それぞれ-5.4と6.0のコレクションの緯度と経度を持つ殺虫剤にさらされておらず、殺虫剤にさらされておらずます。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

追加ファイル 2: RNAeq 実験からの出力ファイル。50%の生卵性にさらされた場合のアノフェレス蚊の転写の変化を記述したUyheljiらから採取されたRNAseq分析。このファイルは、パブリケーションの表 S2 から適合され、AGAP 識別子 (システマチック ID)、生のフォールド変更 (Fold_Change)、および調整済み p 値 (q_value) が含まれます。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

追加ファイル 3: 代表的な結果の入門リスト。AGAP識別子、遺伝子名、dsRNAフォワード、dsRNAリバース、qPCRフォワード、および各転写物のqPCR逆プライマーセット。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

補足コーディング ファイル 1.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

補足コーディング ファイル 2.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

補足コーディング ファイル 3.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

Discussion

ビッグデータトランスクリプトミクスは、実験条件ごとに差分表現された数千ものトランスクリプトのリストを生成します。これらの実験の多くは、関連する生物や表現型に対して行われ、ほぼ独占的に独立した実験として分析されます。これらの豊富なデータソースを一見的に調べることによって、理論的な仮定なしに1)新しい候補者のトランスクリプトの同定につながり、2)生体内1で検証する情報が多すぎるという理由だけで貴重なデータの破棄を防ぎます。

IR-TEx は、複数のデータセットを簡単に調べ、データセットの変更を視覚化し、関連する情報1をダウンロードする機能を備えた、限られたバイオインフォマティクスの背景をユーザーに提供します。IR-TEx は、各検索で複数のトランスクリプトの検索をサポートしていませんが、ユーザーは Excel、R、またはその他の適切なプログラムを使用するだけで、関連するFold_Changes.txt ファイルを調べることができます。IR-TExのさらなる有用性は、転写機能を予測する相関ネットワークの使用、未知の機能を有する架空タンパク質または転写物の入力、および濃縮を検索するための下流ソフトウェアの使用に由来する1.

このプロトコルで示されている例では、IR-TEx は元の関数に従って使用されます。ここでは、殺虫剤耐性に関連する転写物の探索と、マッピンググラフィックスを通じた過剰および過量発現の分布の可視化を可能にする。目的の転写物は、与えられた転写物の過剰または過少発現が観察された表現型1(例えば殺虫剤耐性)に寄与するかどうかを決定するために生体内で検証される。ここで示したように、前述の1では、データセットを仮説主導型のアプローチで使用して、国固有の目的のトランスクリプトを識別できることが示されました。IR-TEx は、1) トランスクリプトの表現を探索し、2) 各 -omics データセットに含まれるすべてのトランスクリプトにペアワイズ相関ネットワークを適用することで、トランスクリプトの関数をコンテキスト化するために使用できます。ここで、GSTMS1は、解毒に関与する他の多数の転写物と共相関していることが示された。このデータ(殺虫剤暴露後の死亡率の有意な増加をもたらしたトランスクリプトのノックダウンと共に)は、異生物クリアランスにおけるこの転写物の重要性を示す。

IR-TExは、ウェブ上で殺虫剤耐性関連のトランスクリプトを探索したり、ローカルアプリケーションを使用するための貴重なリソースを表します。このプロトコルは、異なる -omics プラットフォームとまったく新しいデータの IR-TEx を変更する方法を示します。このガイドでは、IR-TEx を使用して、複数の -omics プラットフォームおよびデータセットのデータを欠落データと統合する方法と、単に IR-TEx を再コード化して、トランスクリプトミクスト データセットを調査するユーザーに役立つ方法について説明します。

Disclosures

著者たちは何も開示する必要はない。

Acknowledgments

この作品は、MRCスキル開発フェローシップからV.I.(MR/R024839/1)とロイヤル・ソサエティ・チャレンジ・グラント(CH160059)からH.R.に資金提供されました。

Materials

Name Company Catalog Number Comments
Laptop with browser Any - -
R Program The R Project for Statistical Computing - https://www.r-project.org/
R Studio R Studio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9, (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. shiny: Web Application Framework for R. (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526, (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32, (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25, (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41, (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4, (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8, (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25, (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18, (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4, (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14, (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15, (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274, (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5, (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270, (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7, (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (1), 3 (2004).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics