Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator と Filigree: メタボロミクスデータのデータ駆動型ネットワーク解析ツール

Published: November 10, 2023 doi: 10.3791/65512

Summary

本稿では、メタボロミクスデータのデータ駆動型ネットワーク構築と解析のための2つのツールであるCorrelationCalculatorとFiligreeを紹介します。 CorrelationCalculator は、発現データに基づく代謝物の単一の相互作用ネットワークの構築をサポートし、Filigree は差動ネットワークの構築と、それに続くネットワークのクラスタリングと濃縮分析を可能にします。

Abstract

オミクスデータの解析における重要な課題は、実用的な生物学的知識を抽出することです。メタボロミクスも例外ではありません。個々の代謝産物のレベルの変化を特定の生物学的プロセスに関連付けるという一般的な問題は、ノンターゲット液体クロマトグラフィー質量分析(LC-MS)研究に存在する多数の未知の代謝物によって悪化します。さらに、二次代謝と脂質代謝は、既存のパスウェイデータベースでは十分に表現されていません。これらの限界を克服するために、私たちのグループでは、データ駆動型ネットワークの構築と解析のためのいくつかのツールを開発しました。これらには、CorrelationCalculator と Filigree が含まれます。どちらのツールも、代謝物の数がサンプル数を超えた場合に、実験メタボロミクスデータから部分相関ベースのネットワークを構築できます。CorrelationCalculator は 1 つのネットワークの構築をサポートしますが、Filigree では 2 つのサンプル グループからのデータを利用して差分ネットワークを構築し、その後にネットワーク クラスタリングとエンリッチメント分析を行うことができます。本稿では、実際のメタボロミクスデータを解析するための両ツールの有用性と応用について述べる。

Introduction

過去10年間で、メタボロミクスは、ガスクロマトグラフ質量分析(GC-MS)や液体クロマトグラフィー質量分析(LC-MS)などの分析技術の進歩により、オミクス科学として登場しました。これらの技術により、数百から数千の低分子代謝物を同時に測定し、複雑な多次元データセットを作成できます。メタボロミクス実験は、ターゲットモードまたはノンターゲットモードで実行できます。ターゲットメタボロミクス実験では、特定のクラスの代謝物を測定します。それらは通常仮説主導型ですが、ノンターゲットアプローチはできるだけ多くの代謝物を測定しようとし、本質的に仮説を生成します。ターゲットアッセイには通常、内部標準が含まれているため、目的の代謝物の絶対定量が可能です。対照的に、ノンターゲットアッセイでは相対定量が可能で、多くの未知の代謝物が含まれています1。

メタボロミクスデータの解析は、多くの専用ソフトウェアツールを活用する多段階のプロセスです1。大きく分けて、(1)データ処理と品質管理、(2)統計解析、(3)生物学的データの解釈の3つに分けられます。ここで説明するツールは、解析の後半のステップを可能にするように設計されています。

メタボロミクスデータを解釈する直感的で一般的な方法は、実験測定値を代謝経路にマッピングすることです。この2,3,4,5を実現するために、私たちのグループ6によって開発されたMetscapeを含む多くのツールが設計されました。パスウェイマッピングは、多くの場合、最も重要なパスウェイを特定するのに役立つエンリッチメント分析と組み合わされます7,8。これらの手法は、遺伝子発現データの解析において最初に注目され、プロテオミクスおよびエピゲノミクスデータの解析に応用されてきました9,10,11,12,13。しかし、メタボロミクスデータの解析には、知識ベースのアプローチには多くの課題があります。まず、メタボロミクスアッセイでは、内因性代謝物に加えて、栄養やその他の環境源に由来するものを含む外因性化合物を測定します。これらの化合物は、細菌によって産生される代謝産物と同様に、他の真核生物のヒトまたは代謝経路にマッピングすることはできません。さらに、二次代謝および脂質代謝の経路カバレッジは、現在、データの生物学的解釈を容易に支持するレベルでの高解像度マッピングを可能にしていない14,15

データ駆動型のネットワーク解析手法は、これらの課題の克服に役立ちます。例えば、相関ベースのネットワークは、既知および未知の両方の代謝物間の関係を導出し、未知物質のアノテーションを容易にする16。ピアソンの相関係数を計算することは、代謝物間の線形関係を確立するための最も簡単なアプローチですが、欠点は、直接的および間接的な関連性17,18,19の両方を捉えることです。別の方法として、直接的な関連性と間接的な関連性を区別できる偏相関係数を計算する方法があります。ガウス グラフィカル モデリング (GGM) を使用して、偏相関ネットワークを推定できます。ただし、GGMでは、サンプルサイズと特徴の数が同等である必要があります。この条件は、何千もの代謝特性の測定値を含むノンターゲット LC-MS データではめったに満たされません。正則化手法は、この制限を克服するために利用できます。グラフィカルななげなわ(Glasso)とノードワイズ回帰は、偏相関ネットワーク16,20の正則化推定のための一般的な方法です。

ここで紹介するバイオインフォマティクスツールの最初の CorrelationCalculator16 は、偏りのない疎部分相関 (DSPC) アルゴリズムに基づいています。DSPC は、疎分散化されたグラフィカルななげなわモデリングに依存しています。アルゴリズムの根底にある仮定は、代謝産物間の結合の数がサンプル数よりもかなり少ない、つまり代謝産物の偏相関ネットワークが疎であるということです。この仮定により、DSPCは、正則化された回帰手法を活用して、より少ないサンプルで多数の代謝物間の接続性を発見できます。さらに、正則化された回帰推定値にバイアス除去ステップを使用して、信頼区間を構築し、関心のある仮説(たとえば、単一またはエッジのグループの有無)をテストするために使用できるエッジパラメータのサンプリング分布を取得します。したがって、偏相関ネットワークにおけるエッジの有無は、計算されたp値を使用して正式にテストできます。

CorrelationCalculator は、単一グループ分析に非常に役立つことが証明されました16。しかし、多くのメタボロミクス実験の目的は、2つ以上の条件の差動分析です。CorrelationCalculator を各グループで個別に使用して、各条件の偏相関ネットワークを生成できますが、この方法では、ネットワーク生成に使用できるサンプルの数が制限されます。データドリブン解析では、サンプルサイズが十分に大きいことが最大の考慮事項の1つであるため、データ内の利用可能なすべてのサンプルを活用してネットワークを構築できる手法が強く望まれます。このアプローチは、ここで紹介する 2 番目のツールである Filigree21 に実装されています。Filigreeは、以前に公開された差分ネットワークエンリッチメント分析(DNEA)アルゴリズム22に依存しています。 表 1 は、両方のツールのアプリケーションとワークフローを示しています。

実験条件数(k) k = 1 k = 2
ソフトウェアツール 相関電卓 細工
入力データ • 代謝物 x サンプルデータマトリックス • 代謝物 x サンプルデータマトリックス
• 実験グループ
ワークフロー
•前処理
• ネットワーク推定
• ネットワーク クラスタリング
• エンリッチメント分析

•ログ変換。自動スケーリング
• DSPC (英語)
•外部アプリ経由
•いいえ

•ログ変換。自動スケーリング
• 共同ネットワーク推定
• コンセンサスクラスタリング
• NetGSAの
データの可視化 外部アプリ(例:Cytoscape)経由 外部アプリ(例:Cytoscape)経由
関心のある結果との関連について代謝モジュールをテストする(オプション) 外部アプリ経由 外部アプリ経由

表1:CorrelationCalculatorとFiligreeの適用範囲とワークフロー。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1.相関電卓

  1. http://metscape.med.umich.edu/kora_data_240.csv での実験的測定値を含む代謝物のリストを含むサンプルのコンマ区切り入力ファイルをダウンロードします。
  2. ダウンロードしたサンプルファイルをダブルクリックして開きます。
    1. ファイルにサンプルと代謝物の両方のラベルが含まれていることを確認します。
    2. サンプルは行単位であるため、最初の列がサンプル名、最初の行が代謝物名であることを確認します。
  3. CorrelationCalculator Java アプリケーション (http://metscape.med.umich.edu/calculator.html) をダウンロードします。ダウンロードした .jar ファイルをダブルクリックして、アプリケーションを起動します。
  4. 「入力」タブで、「参照」ボタンをクリックして入力ファイルをアップロードします。
  5. [ ファイル形式の指定] で、ドロップダウン矢印を使用して適切な入力ファイル形式を選択します。行内の サンプル を選択します(補足図1)。
  6. ウィンドウの右下にある [Next >>] ボタンをクリックして、[Data Normalization] タブに移動します。
  7. [Select Method(s)] で、[Log2-Transform Data] の横のチェックボックスをオンにします。[データの自動スケーリング] の横にあるチェックボックスをオンにします。
  8. [データの正規化] で [実行] ボタンをクリックします。
    注: 正規化が完了したら、[データの正規化] の下にある [正規化されたデータの表示] ボタンをクリックし、更新されたデータセットを確認します (補足図 2)。
  9. [ データの正規化] で [ 保存 ] ボタンをクリックし、新しいデータ ファイルを保存します。
  10. ウィンドウの右下にある「次の>>」ボタンをクリックして、「データ分析」タブに移動します。
  11. ピアソンの相関の計算で、実行をクリックします。データに最適なピアソンの相関範囲を決定します。
    1. [ ヒストグラムの表示 ] ボタンをクリックします。特徴量ごとの最大ピアソン相関スコアの頻度を確認します。
    2. [ ヒートマップの表示 ] ボタンをクリックします。ピアソンの相関行列の表現を確認します。
  12. ピアソンの相関関係によるフィルターで、0.00から1.00の範囲でフィルターするデフォルトの数値のままにします
    注: 右端の小さな青い矢印を 1 からスライドさせ、左側の小さな青い矢印を 0 からスライドさせて、フィルターを変更します。テキストボックスに特定の番号を入力することもできます。
  13. [ Select Partial Correlation Method] で、目的の [ DSPC Method] を選択します。
    注:代謝物の数がデータセット内のサンプル数よりも少ない場合は、DSPC法のみを使用できます。
  14. [Calculate Partial Correlations] で [Run] ボタンをクリックします (補足図 3)。
  15. [ CSV ファイルの表示 ] をクリックし、結果を表示します。[ 保存 ] ボタンをクリックして、結果を保存します。
  16. [ MetScape で表示 ] ボタンをクリックして、対話型の相関ネットワークを起動します。
    MetScape の使用の詳細については、Karnovsky, A. et al.6 を参照してください。
    注:MetScapeは、相関ネットワークの作成と探索を可能にするCytoscapeアプリケーションです。

2.フィリグリー

  1. http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv での代謝物測定値を含むサンプルのカンマ区切り入力ファイルをダウンロードします。
  2. ダウンロードしたサンプルファイルをダブルクリックして開きます。
    1. ファイルの列 1 にサンプル名が含まれ、列 2 にグループ割り当てが含まれていることを確認します。残りのカラムに代謝物/脂質が含まれていることを確認します。
    2. 各行がサンプルを表していることを確認します。
      注:代謝物の測定値は、特徴の集約を実行しない限り、対数変換および自動スケーリングする必要があり、その場合は測定値は対数変換のみにする必要があります。
  3. Filigree Java アプリケーション (http://metscape.med.umich.edu/filigree.html) をダウンロードします。
    注意: 詳細なユーザーマニュアルは http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf で入手できます。
  4. ダウンロードした .jar ファイルをダブルクリックして、アプリケーションを起動します。
  5. [ データ ] タブで [ 参照 ] ボタンをクリックして、入力ファイルをアップロードします。
  6. [ Specify Columns/Rows] で、[ Sample ID ] の横にあるドロップダウン矢印をクリックして、入力ファイルから対応する列/行名を選択します。[ サンプル] を選択します。
  7. [列/行の指定]で、[グループ]の横にあるドロップダウン矢印をクリックして、入力ファイルから対応する列/行を選択します。[グループ] を選択します。
  8. [ サンプル グループの指定] で、各グループの横にあるドロップダウン矢印をクリックして、入力ファイルから対応する グループ 列を選択します。 [グループ 1] で [ 糖尿病] を選択します。 [グループ 2] で [ 非糖尿病] を選択します。
  9. [Feature Grouping] で、目的の方法の [Calculate Feature Groups] の横にあるチェックボックスをオンにします。
  10. [ ヒートマップの表示 ] ボタンをクリックします。ヒートマップを表示し、必要な削減率を決定します。
  11. [ 特徴量削減] スライダーを使用して、特徴量の削減率を選択します。減少率が 1.25 の特徴とサンプルの比率を示すまで、小さな円をスライドさせます(補足図 4)。
  12. ウィンドウの右下にある[次へ>>]ボタンをクリックして、[分析]タブに移動します。
  13. 「出力ディレクトリの選択」で、「参照」ボタンをクリックし、生成された出力ファイルを保存する ディレクトリの場所を選択します。
  14. ウィンドウの左下にある[ 分析の実行 ]ボタンをクリックします。プログレスバーは、分析コンポーネントごとに更新されます(補足図5)。ポップアップウィンドウの[ OK ]ボタンをクリックして、「 Analysis Completed Successfully」というメッセージを表示します。
  15. [ 解析 ] タブで [ネットワーク の参照 ] ボタンをクリックして、対話型のフィリグリー サブネットワークをブラウザー タブで開きます。
  16. [サブネットワーク名] 列の下にある [サブネットワーク 1] リンクをクリックします。
  17. さまざまなボタンを使用して対話型サブネットワークを探索します。 [+ ] ボタンをクリックして、ネットワークの一部を拡大します。[-] ボタンをクリックしてズームアウトします (補足図 6)。
  18. グループノードをクリックしてドラッグし、サブネットワーク内で再配置します。
    注:ノードの色はアップ/ダウンレギュレーションを表し、色の不透明度は高/低のフォールドの変化を表します。エッジの色は、グループ間の差分状態を表します。
  19. ページの右上にある [フィーチャの展開 ] ボタンをクリックして、すべてのグループ ノードを展開します。グループ ノードを構成する特定のコンパウンドを確認します。
  20. ページの右上にある [ フィーチャを折りたたむ ] ボタンをクリックして、最近展開したグループ ノードを折りたたみます。
  21. ページの右上にある [ サンプル グループ別 ] ボタンをクリックして、ビューを 1 つのサブネットワークからグループで分割された複数のサブネットワークに変更します。このサブネットワークのビューを使用して、グループを探索して比較します (補足図 7)。
  22. [ すべてのサンプル ] ボタンをクリックして、1 つのサブネットワーク ビューに戻ります。
  23. ページの右上にある [ 次へ ] ボタンをクリックして、次のサブネットワークを表示します。
  24. サブネットワークごとに手順 2.19 から 2.23 を繰り返します。
  25. ウィンドウの上部中央にある [ 差分ネットワーク情報付加解析結果 ] リンクをクリックして、すべてのサブネットワークをリストしたサマリー テーブル ビューに戻ります。
    注:エッジやノードの出力ファイルをCytoscape23などの別のソフトウェアツールにインポートして、追加のネットワーク可視化を作成します。

3. その他の考慮事項

  1. Big Sur(OSX 11.2)以降を実行しているMacコンピュータの場合は、 Appleメニュー>システム環境設定>セキュリティとプライバシー>一般で ツールを承認し、タブの下部にある[ 許可 ]を選択します。
  2. さらに、左側のメニューで「ファイルとフォルダ」を選択し、右側のメニューで「フィリグリー」を選択して、Apple メニュー>システム環境設定>セキュリティとプライバシー>ファイルへのアクセスを Filigree に許可します。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

CorrelationCalculatorの使用を説明するために Krumsiek et al.24に記載されているKORA集団研究のメタボロミクスデータのサブセットを使用して偏相関ネットワークを構築しました。データセットには、151 の代謝物と 240 のサンプルが含まれていました。 図1 は、Cytoscapeで可視化した偏相関ネットワークを示しています。ネットワークには 148 個のノードと 272 個のエッジが含まれています。ノードの色は異なる化学クラスに属する代謝物を表し、エッジは偏相関係数の調整済みp値(調整済みp値<0.05)を表します。特に、事前情報を使用していないにもかかわらず、CorrelationCalculatorは化学的に関連する代謝物をグループ化することができました。例えば、ホスファチジルコリンとリゾホスファチジルコリンはネットワーク内で密接に接続されています。このタイプのネットワークのコンテキストで代謝物の変化を視覚化することで、仮説の生成が容易になり、将来の実験計画や原稿作成が可能になります。偏相関代謝物ネットワークを利用した潜在的なワークフローを説明するために、Ma et al.22に記載されているようにコンセンサスネットワーククラスタリングを実行し、9つのサブネットワークまたは代謝モジュールを同定しました。これらのモジュールは化学クラスと良好に一致しており、同じ化学クラスに属する代謝産物は同じ代謝モジュールの一部である傾向がありました。ユーザーは、https://github.com/Karnovsky-Lab/clusterNet でクラスタリングツールclusterNetにアクセスできます。

Figure 1
図1:CorrelationCalculatorネットワークの代表的な例。 このネットワークは、240 人の被験者にわたる151の代謝物で構成されるKORA集団研究メタボロミクスデータ24のサブセットから構築されました。ノードは代謝物を表し、それらを接続するエッジは、偏相関係数の調整済み p 値 (調整済み p 値 < 0.05) によって重み付けされます。ノードの形状は異なる代謝クラスを表し、色はコンセンサスクラスタリング法を使用してネットワークをクラスタリングすることによって得られた代謝モジュールを表します。 この図の拡大版をご覧になるには、ここをクリックしてください。

I型糖尿病(T1D)のマウスモデルからのデータセットを解析することにより、フィリグリーの応用を説明します25,26。T1Dマウスと非糖尿病(NOD)マウスの血漿代謝物測定値を使用して、微分偏相関ネットワークを生成しました(図2)。特に、非糖尿病グループではネットワーク接続の度合いが高いことが観察されます。解析の次のステップでは、12の代謝モジュールが同定され、そのうち9つはT1Dマウスと非糖尿病マウスで有意に異なっていた(FDR < 0.05)。この分析から導き出される生物学的結論へのさらなる洞察のために、読者に元の出版物を参照してください21

Figure 2
図2:フィリグリーネットワークの代表例。差動ネットワークは、71匹のマウス(30匹のT1Dと41匹の非T1D)の163個の代謝物のレベルを利用して構築されました25,26。T1Dグループと非T1Dグループ間の差分エッジは、それぞれピンクと青で示されています。ノードは、折り目の変化に基づいて色分けされます。この表は、フィリグリーによって生成された濃縮結果を示しています。同定された 12 のサブネットワークのうち 9 つは、T1D と非 T1D で有意に異なっていました (調整済み p 値 < 0.05)。この図の拡大版をご覧になるには、ここをクリックしてください。

補足図1:CorrCalc_InputTab。Correlation Calculator の [入力] タブのスクリーンショット。このファイルをダウンロードするには、ここをクリックしてください。

補足図2:CorrCalc_DataNormTab。 Correlation Calculator の [Data Normalization ] タブのスクリーンショット。 [Log-2 Transform Data] と [ Autoscale Data ] がチェックされます。 このファイルをダウンロードするには、ここをクリックしてください。

補足図3:CorrCalc_DataAnalTab。 相関計算機の [データ分析 ] タブのスクリーンショットで、ピアソンの 0-0.8 の相関へのフィルター処理を示しています。さらに、 DSPC方式 が選択されています。 このファイルをダウンロードするには、ここをクリックしてください。

補足図4:Filigree_DataTab。 Filigree の [データ] タブのスクリーンショット。列、行、およびグループが指定されています。特徴量 グループの計算 方法が選択され、特徴量とサンプルの比率が 1.25 倍に減少しています。 このファイルをダウンロードするには、ここをクリックしてください。

補足図5:Filigree_AnalysisTab。 Filigree の [分析] タブのスクリーンショットで、さまざまな 分析 コンポーネントの進行状況が表示されています。 このファイルをダウンロードするには、ここをクリックしてください。

補足図6:Filigree_Subnetwork1。 フィリグリーから生成されたサブネットワーク。ノードの色はアップ/ダウンレギュレーションを表し、色の不透明度は高い/低い倍率の変化を表します。エッジの色は、グループ間の差分状態を表します。 このファイルをダウンロードするには、ここをクリックしてください。

補足図7:Filigree_Subnetwork_SampleGroup。 グループで区切られたサブネットワーク。左のネットワークは糖尿病のサンプルを表し、右のネットワークは非糖尿病のサンプルを表します。ノードの色は、グループ平均に比例した式レベルを表します。 このファイルをダウンロードするには、ここをクリックしてください。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

CorrelationCalculator と Filigree に実装された部分相関ベースのネットワーク解析手法は、特に未知の代謝物の有病率が高く、代謝経路のカバレッジが限られているデータセット(リピドミクスデータなど)において、知識ベースの代謝経路解析の限界を克服するのに役立ちます。これらのツールは、幅広いメタボロミクスおよびリピドミクスデータを分析するために研究コミュニティで広く使用されています14,22,27,28,29,30。たとえば、CorrelationCalculatorは、マイクロバイオームや植物から人間の病気に至るまで、多くの生物学的システムからのデータを分析するために使用されています31323334ここでは、当社のツールによって可能になるデータ駆動型ネットワーク分析をクラスタリングおよび回帰分析と組み合わせて、目的の表現型に関連する代謝モジュールを特定する方法を説明します。

CorrelationCalculator と Filigree を使用して生成された偏相関ネットワークは、グラフ クラスタリング アルゴリズムを使用してクラスタリングし、代謝モジュールを生成できます。これらのモジュールは、化学的または機能的に互いに関連している代謝物を含む傾向があります。このようなモジュールは、視覚化の観点からだけでなく、生物学的関連性の観点からも非常に有用です。代謝モジュールと関心のある表現型アウトカム(生存アウトカムなど)との関係を研究することで、個々の代謝物を検査する場合と比較して、より多くの統計的検出力が得られ、追加の生物学的洞察を得ることができます。

ネットワーククラスタリングアプローチによって同定された代謝モジュールは、濃縮分析にも使用できます。フィリグリーは、事前に定義された生物学的経路の代わりに、コンセンサスクラスタリングによって特定された代謝モジュールを使用します。部分相関に基づく代謝モジュールは経路と同一ではありませんが、化学的および生化学的に類似した代謝物(例:.、アミノ酸、アシルカルニチン、同じクラスの脂質など)を一貫してグループ化します。Filigreeはさらに、NetGSAアルゴリズム22,35を使用してこれらのモジュールの重要性をテストします。差分ノードに加えて、NetGSA はネットワーク構造の疾患固有の違いを考慮します。

「実生活」のメタボロミクスおよびリピドミクスデータの分析にCorrelationCalculatorとFiligreeを使用する際に考慮すべき問題の1つは、特定の実験における代謝物の数とサンプル数の関係です。数千のサンプルを含む大規模な疫学研究が一般的になりつつありますが、メタボロミクス実験の大部分のサンプルサイズは依然として控えめです。これは、生物学的変異が少ないと予想されるシステム(細胞株や遺伝的に均質な動物モデルなど)を含む機構研究に特に当てはまります。両方のツールに実装されている統計アルゴリズムは、代謝物の数がサンプル数を超える状況に適用できますが、その比率の増加により、より疎なネットワークになります。

本明細書に記載のツールの適用に関するもう1つの重要な考慮事項は、同位体、化学付加物、インソースフラグメント、および夾雑物を含み得る、多数の冗長または縮重な特徴36を含むことが知られている非標的メタボロミクスデータの分析に関する。多くの縮重した特徴は同じ代謝物に由来するため、それらは高度な相関を持つ傾向があります。このようなデータの偏相関ベースの分析では、慎重なアノテーションと縮退した特徴の除去が必要になる場合があります。

結論として、ここで紹介するツールは、メタボロミクスデータを解釈するための知識ベースのパスウェイ解析ツールの実行可能な代替手段を提供します。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

著者は競合する金銭的利害関係を持っていません。

Acknowledgments

この研究は、NIH 1U01CA235487助成金の支援を受けました。

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

生物学、第201号、
CorrelationCalculator と Filigree: メタボロミクスデータのデータ駆動型ネットワーク解析ツール
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter