Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator e filigrana: strumenti per l'analisi di rete basata sui dati di metabolomica

Published: November 10, 2023 doi: 10.3791/65512

Summary

Presentiamo CorrelationCalculator e Filigree, due strumenti per la costruzione di reti basate sui dati e l'analisi dei dati metabolomici. CorrelationCalculator supporta la creazione di una singola rete di interazione di metaboliti basata sui dati di espressione, mentre Filigree consente di creare una rete differenziale, seguita dal clustering della rete e dall'analisi dell'arricchimento.

Abstract

Una sfida significativa nell'analisi dei dati omici è l'estrazione di conoscenze biologiche utilizzabili. La metabolomica non fa eccezione. Il problema generale di mettere in relazione le variazioni dei livelli dei singoli metaboliti con specifici processi biologici è aggravato dal gran numero di metaboliti sconosciuti presenti negli studi di cromatografia liquida e spettrometria di massa (LC-MS) non mirati. Inoltre, il metabolismo secondario e il metabolismo lipidico sono scarsamente rappresentati nei database di pathway esistenti. Per superare queste limitazioni, il nostro gruppo ha sviluppato diversi strumenti per la costruzione e l'analisi di reti basate sui dati. Questi includono CorrelationCalculator e Filigree. Entrambi gli strumenti consentono agli utenti di costruire reti basate sulla correlazione parziale a partire da dati di metabolomica sperimentale quando il numero di metaboliti supera il numero di campioni. CorrelationCalculator supporta la costruzione di una singola rete, mentre Filigree consente di creare una rete differenziale utilizzando i dati di due gruppi di campioni, seguiti dal clustering della rete e dall'analisi dell'arricchimento. Descriveremo l'utilità e l'applicazione di entrambi gli strumenti per l'analisi di dati metabolomici reali.

Introduction

Nell'ultimo decennio, la metabolomica è emersa come scienza omica grazie ai progressi nelle tecnologie analitiche come la gascromatografia-spettrometria di massa (GC-MS) e la cromatografia liquida-spettrometria di massa (LC-MS). Queste tecniche consentono la misurazione simultanea di centinaia o migliaia di metaboliti di piccole molecole, creando complessi set di dati multidimensionali. Gli esperimenti di metabolomica possono essere eseguiti in modalità mirata o non mirata. Esperimenti mirati di metabolomica misurano classi specifiche di metaboliti. Di solito sono guidati da ipotesi, mentre gli approcci non mirati tentano di misurare il maggior numero possibile di metaboliti e sono di natura generatrice di ipotesi. I saggi mirati di solito includono standard interni e consentono quindi una quantificazione assoluta dei metaboliti di interesse. Al contrario, i saggi non mirati consentono una quantificazione relativa e includono molti metaboliti sconosciuti1.

L'analisi dei dati metabolomici è un processo in più fasi che sfrutta molti strumenti software specializzati1. Può essere suddiviso nelle seguenti tre fasi principali: (1) elaborazione dei dati e controllo di qualità, (2) analisi statistica e (3) interpretazione dei dati biologici. Gli strumenti qui descritti sono progettati per consentire l'ultima fase dell'analisi.

Un modo intuitivo e popolare per interpretare i dati metabolomici è quello di mappare le misurazioni sperimentali sulle vie metaboliche. Per raggiungere questo obiettivo sono stati progettati numerosi strumenti 2,3,4,5, tra cui Metscape, sviluppato dal nostro gruppo6. La mappatura dei percorsi è spesso combinata con l'analisi dell'arricchimento, che aiuta a identificare i percorsi più significativi 7,8. Queste tecniche hanno acquisito importanza nell'analisi dei dati di espressione genica e sono state applicate con successo per l'analisi dei dati di proteomica ed epigenomica 9,10,11,12,13. Tuttavia, l'analisi dei dati metabolomici presenta una serie di sfide per gli approcci basati sulla conoscenza. In primo luogo, oltre ai metaboliti endogeni, i saggi metabolomici misurano i composti esogeni, compresi quelli che provengono dalla nutrizione e da altre fonti ambientali. Questi composti, così come i metaboliti prodotti dai batteri, non possono essere mappati sulle vie umane o metaboliche di altri organismi eucarioti. Inoltre, la copertura del pathway del metabolismo secondario e del metabolismo lipidico attualmente non consente una mappatura ad alta risoluzione al livello che supporterebbe facilmente l'interpretazione biologica dei dati14,15.

Le tecniche di analisi di rete basate sui dati possono aiutare a superare queste sfide. Ad esempio, le reti basate sulla correlazione possono aiutare a derivare relazioni tra metaboliti noti e sconosciuti e facilitare l'annotazione delle incognite16. Mentre il calcolo dei coefficienti di correlazione di Pearson è l'approccio più semplice per stabilire le relazioni lineari tra i metaboliti, lo svantaggio è che cattura sia le associazioni dirette che indirette17,18,19. Un'alternativa consiste nel calcolare coefficienti di correlazione parziale in grado di distinguere tra associazioni dirette e indirette. La modellazione grafica gaussiana (GGM) può essere utilizzata per stimare le reti di correlazione parziale. Tuttavia, GGM richiede che la dimensione del campione e il numero di feature siano comparabili. Questa condizione è raramente soddisfatta nei dati LC-MS non mirati che contengono misurazioni per migliaia di caratteristiche metaboliche. Le tecniche di regolarizzazione possono essere utilizzate per superare questa limitazione. Il lazo grafico (Glasso) e la regressione per nodo sono metodi popolari per la stima regolarizzata della rete di correlazione parziale 16,20.

Il primo degli strumenti bioinformatici qui presentati, CorrelationCalculator16, si basa sull'algoritmo di correlazione parziale sparsa distorta (DSPC). DSPC si basa sulla modellazione lazo grafica de-sparsificata. L'ipotesi alla base dell'algoritmo è che il numero di connessioni tra i metaboliti è considerevolmente inferiore al numero di campioni, cioè la rete di correlazione parziale dei metaboliti è scarsa. Questa ipotesi consente al DSPC di scoprire la connettività tra un gran numero di metaboliti utilizzando un minor numero di campioni, sfruttando tecniche di regressione regolarizzata. Inoltre, utilizzando un passaggio di debiasing per le stime di regressione regolarizzate, ottiene distribuzioni di campionamento per i parametri del bordo che possono essere utilizzate per costruire intervalli di confidenza e testare ipotesi di interesse (ad esempio, presenza/assenza di un singolo o di un gruppo di bordi). La presenza o l'assenza di un bordo nella rete di correlazione parziale può quindi essere formalmente verificata utilizzando i valori p calcolati.

CorrelationCalculator si è rivelato molto utile per l'analisi a gruppo singolo16; Tuttavia, l'obiettivo di molti esperimenti di metabolomica è l'analisi differenziale di due o più condizioni. Mentre CorrelationCalculator può essere utilizzato su ciascuno dei gruppi separatamente per generare reti di correlazione parziale per ogni condizione, questo approccio limita il numero di campioni che possono essere usati per la generazione di rete. Poiché una dimensione del campione sufficientemente grande è una delle considerazioni più importanti nell'analisi basata sui dati, i metodi in grado di sfruttare tutti i campioni disponibili nei dati per costruire reti sono altamente desiderabili. Questo approccio è implementato nel secondo strumento qui presentato, chiamato Filigrana21. Filigree si basa sull'algoritmo DNEA (Differential Network Enrichment Analysis) pubblicato in precedenza22. La tabella 1 mostra le applicazioni e il flusso di lavoro di entrambi gli strumenti.

Numero di condizioni sperimentali (k) k = 1 k = 2
Strumento software Calcolatore di correlazione Filigrana
Dati di input • Matrice di dati Metaboliti x Campioni • Matrice di dati Metaboliti x Campioni
• Gruppi sperimentali
Flusso di lavoro
•Pretrattamento
• Stima della rete
• Clustering di rete
• Analisi dell'arricchimento

• Trasformazione dei log; Scalabilità automatica
• DSPC
• Tramite app esterne
•No

• Trasformazione dei log; Scalabilità automatica
• Stima della rete congiunta
• Clustering del consenso
• NetGSA
Visualizzazione dei dati Tramite app esterna, ad es. Cytoscape Tramite app esterna, ad es. Cytoscape
Test dei moduli metabolici per l'associazione con esito di interesse (opzionale) Tramite app esterne Tramite app esterne

Tabella 1: L'ambito di applicazione e il flusso di lavoro di CorrelationCalculator e Filigree.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Calcolatore di correlazione

  1. Scaricare un file di input delimitato da virgole di esempio contenente un elenco di metaboliti con misurazioni sperimentali a http://metscape.med.umich.edu/kora_data_240.csv.
  2. Fare doppio clic sul file di esempio scaricato per aprirlo.
    1. Assicurarsi che il file contenga etichette sia per i campioni che per i metaboliti.
    2. Poiché i campioni sono divisi in righe, verificare che la prima colonna sia costituita dai nomi dei campioni e che la prima riga sia costituita dai nomi dei metaboliti.
  3. Scaricare l'applicazione Java CorrelationCalculator (http://metscape.med.umich.edu/calculator.html). Fare doppio clic sul file .jar scaricato per avviare l'applicazione.
  4. Nella scheda Input fare clic sul pulsante Sfoglia per caricare il file di input.
  5. In Specifica formato file, utilizzare la freccia a discesa per selezionare il formato di file di input appropriato. Selezionare i campioni in righe (figura 1 supplementare).
  6. Passare alla scheda Normalizzazione dati facendo clic sul pulsante Avanti >> nella parte inferiore destra della finestra.
  7. In Seleziona metodo/i, seleziona la casella accanto a Dati di trasformazione log2. Selezionare la casella accanto a Dati di scalabilità automatica.
  8. In Normalizza dati fare clic sul pulsante Esegui .
    NOTA: una volta completata la normalizzazione, fare clic sul pulsante Visualizza dati normalizzati , situato in Normalizza dati, ed esaminare il set di dati aggiornato (Figura 2 supplementare).
  9. In Normalizza dati, fare clic sul pulsante Salva e salvare il nuovo file di dati.
  10. Passare alla scheda Analisi dati facendo clic sul pulsante Avanti >> nella parte inferiore destra della finestra.
  11. In Calcola correlazione di Pearson, fare clic su Esegui. Determinare il miglior intervallo di correlazione di Pearson per i dati.
    1. Fare clic sul pulsante Visualizza istogramma . Esaminare la frequenza dei punteggi di correlazione massimi di Pearson per caratteristica.
    2. Fare clic sul pulsante Visualizza mappa termica . Esamina la rappresentazione della matrice di correlazione di Pearson.
  12. In Filtra per correlazioni di Pearson, lasciare che i numeri predefiniti filtrino in base a un intervallo compreso tra 0,00 e 1,00
    NOTA: Far scorrere la piccola freccia blu all'estremità destra da 1 e la piccola freccia blu a sinistra da 0 per cambiare il filtro. È anche possibile immettere numeri specifici nelle caselle di testo.
  13. In Seleziona metodo di correlazione parziale selezionare il metodo desiderato, Metodo DSPC.
    NOTA: se il numero di metaboliti è inferiore al numero di campioni nel set di dati, è possibile utilizzare solo il metodo DSPC.
  14. In Calcola correlazioni parziali, fare clic sul pulsante Esegui (Figura 3 supplementare).
  15. Fare clic su Visualizza file CSV e visualizzare i risultati. Fare clic sul pulsante Salva e salvare i risultati.
  16. Fare clic sul pulsante Visualizza in MetScape per avviare una rete di correlazione interattiva.
    Vedere Karnovsky, A. et al.6 per ulteriori informazioni sull'utilizzo di MetScape.
    NOTA: MetScape è un'applicazione Cytoscape che consente la creazione e l'esplorazione di reti di correlazione.

2. Filigrana

  1. Scaricare un file di input delimitato da virgole di esempio contenente le misurazioni dei metaboliti all'http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Fare doppio clic sul file di esempio scaricato per aprirlo.
    1. Assicurarsi che il file contenga i nomi dei campioni nella colonna 1 e le assegnazioni dei gruppi nella colonna 2. Verificare che le colonne rimanenti contengano metaboliti/lipidi.
    2. Assicurarsi che ogni riga rappresenti un campione.
      NOTA: le misurazioni dei metaboliti devono essere trasformate in log e ridimensionate automaticamente, a meno che non si esegua l'aggregazione delle caratteristiche, nel qual caso le misurazioni devono essere trasformate solo in log.
  3. Scaricare l'applicazione Java Filigree (http://metscape.med.umich.edu/filigree.html).
    NOTA: Un manuale utente dettagliato è disponibile all'indirizzo http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Fare doppio clic sul file .jar scaricato per avviare l'applicazione.
  5. Nella scheda Dati fare clic sul pulsante Sfoglia per caricare il file di input.
  6. In Specifica colonne/righe, fare clic sulla freccia a discesa accanto a ID campione per selezionare il nome di colonna/riga corrispondente dal file di input. Selezionare Esempio.
  7. In Specifica colonne/righe, fare clic sulla freccia a discesa accanto a "Gruppo" per selezionare la colonna/riga corrispondente dal file di input. Seleziona Gruppo.
  8. In Specifica gruppi di esempio, fare clic sulle frecce a discesa accanto a ciascun gruppo per selezionare la colonna del gruppo corrispondente dal file di input. Per Gruppo 1, seleziona Diabetico. Per Gruppo 2, selezionare Non diabetico.
  9. In Raggruppamento di feature, selezionare la casella accanto al metodo desiderato, Calcola gruppi di feature.
  10. Fai clic sul pulsante Visualizza mappe termiche . Visualizzare la mappa di calore e determinare la percentuale di riduzione desiderata.
  11. Utilizzare il dispositivo di scorrimento Riduzione feature per selezionare la percentuale di riduzione desiderata delle feature . Far scorrere il cerchietto fino a quando la riduzione percentuale non mostra un rapporto caratteristica/campione di 1,25 (Figura 4 supplementare).
  12. Passare alla scheda Analisi facendo clic sul pulsante >> successivo in basso a destra della finestra.
  13. In Seleziona directory di output, fare clic sul pulsante Sfoglia e selezionare il percorso della directory desiderato per l'archiviazione dei file di output generati.
  14. Fare clic sul pulsante Esegui analisi situato nella parte inferiore sinistra della finestra. Le barre di stato vengono aggiornate per ogni componente dell'analisi (Figura 5 supplementare). Fare clic sul pulsante OK nella finestra popup in cui viene visualizzato il messaggio Analisi completata correttamente.
  15. Nella scheda Analisi , fare clic sul pulsante Sfoglia reti per aprire le sottoreti interattive Filigree in una scheda del browser.
  16. Fare clic sul collegamento Sottorete 1 nella colonna Nome sottorete .
  17. Esplora la sottorete interattiva utilizzando i vari pulsanti. Fare clic sul pulsante + e ingrandire la parte della rete. Fare clic sul pulsante - e rimpicciolire (Figura 6 supplementare).
  18. Fare clic su un nodo di gruppo e trascinarlo per riposizionarlo all'interno della sottorete.
    NOTA: il colore del nodo rappresenta la regolazione verso l'alto/verso il basso e l'opacità del colore rappresenta il cambiamento di piega superiore/inferiore. Il colore del bordo rappresenta lo stato differenziale tra i gruppi.
  19. Fare clic sul pulsante Espandi feature in alto a destra della pagina per espandere tutti i nodi del gruppo. Esamina i composti specifici che compongono i nodi del gruppo.
  20. Fare clic sul pulsante Comprimi feature in alto a destra della pagina per comprimere i nodi del gruppo espansi di recente.
  21. Fare clic sul pulsante Per gruppo di esempio in alto a destra della pagina per modificare la visualizzazione da una singola sottorete a più sottoreti suddivise da un gruppo. Esplorare e confrontare i gruppi utilizzando questa vista delle sottoreti (Figura 7 supplementare).
  22. Fare clic sul pulsante Tutti gli esempi per tornare alla visualizzazione della singola sottorete.
  23. Per visualizzare la sottorete successiva, fare clic sul pulsante Avanti in alto a destra nella pagina.
  24. Ripetere i passaggi 2.19-2.23 per ogni sottorete.
  25. Fare clic sul collegamento Risultati dell'analisi dell'arricchimento della rete differenziale nella parte superiore centrale della finestra per tornare alla visualizzazione della tabella di riepilogo che elenca tutte le sottoreti.
    NOTA: Importare i file di output dei bordi e/o dei nodi in uno strumento software diverso, ad esempio Cytoscape23, per creare ulteriori visualizzazioni di rete.

3. Considerazioni aggiuntive

  1. Per i computer Mac con Big Sur (OSX 11.2) o versioni successive, approva lo strumento in Menu Apple > Preferenze di Sistema > Sicurezza e Privacy > Generali e seleziona Consenti nella parte inferiore del pannello.
  2. Inoltre, consenti a Filigree di accedere ai file in Menu Apple > Preferenze di Sistema > Sicurezza e Privacy > Privacy selezionando File e cartelle nel menu a sinistra e quindi selezionando Filigrana nel menu a destra.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Per illustrare l'uso di CorrelationCalculator, abbiamo costruito una rete di correlazione parziale utilizzando un sottoinsieme dei dati metabolomici dello studio sulla popolazione KORA descritto in Krumsiek et al.24. Il set di dati conteneva 151 metaboliti e 240 campioni. La Figura 1 mostra la rete di correlazione parziale risultante che è stata visualizzata in Cytoscape. La rete contiene 148 nodi e 272 archi. Il colore dei nodi rappresenta i metaboliti che appartengono a diverse classi chimiche, mentre gli spigoli rappresentano il valore p aggiustato dei coefficienti di correlazione parziale (valore p aggiustato < 0,05). In particolare, nonostante non abbia utilizzato alcuna informazione preliminare, CorrelationCalculator è stato in grado di raggruppare metaboliti chimicamente correlati. Ad esempio, le fosfatidilcoline e le lisofosfatidilcoline sono strettamente collegate nella rete. La visualizzazione dei cambiamenti dei metaboliti nel contesto di questo tipo di rete può facilitare la generazione di ipotesi, aiutare a pianificare esperimenti futuri e consentire la preparazione di manoscritti. Per illustrare un potenziale flusso di lavoro che utilizza una rete di metaboliti di correlazione parziale, abbiamo eseguito il clustering della rete di consenso come descritto in Ma et al.22, con conseguente identificazione di 9 sottoreti o moduli metabolici. Questi moduli avevano un buon accordo con le classi chimiche, cioè i metaboliti appartenenti alla stessa classe chimica tendevano a far parte dello stesso modulo metabolico. L'utente può accedere allo strumento di clustering clusterNet all'https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Figura 1: Esempio rappresentativo di una rete CorrelationCalculator. La rete è stata costruita a partire da un sottoinsieme dei dati metabolomici dello studio di popolazione KORA24 , composto da 151 metaboliti in 240 soggetti. I nodi rappresentano i metaboliti e gli archi che li collegano sono ponderati in base al valore p aggiustato dei coefficienti di correlazione parziale (valore p aggiustato < 0,05). La forma dei nodi rappresenta diverse classi metaboliche e il colore rappresenta i moduli metabolici ottenuti raggruppando la rete utilizzando il metodo del clustering del consenso. Fare clic qui per visualizzare una versione più grande di questa figura.

Illustriamo l'applicazione di Filigree analizzando un set di dati da un modello murino di diabete di tipo I (T1D)25,26. Le misurazioni dei metaboliti plasmatici di topi T1D e non diabetici (NOD) sono state utilizzate per generare una rete di correlazione parziale differenziale (Figura 2). In particolare, osserviamo un grado più elevato di connettività di rete nel gruppo non diabetico. Le fasi successive dell'analisi hanno identificato dodici moduli metabolici, nove dei quali erano significativamente diversi tra T1D e topi non diabetici (FDR < 0,05). Rimandiamo il lettore alla pubblicazione originale per ulteriori approfondimenti sulle conclusioni biologiche che possono essere tratte da questa analisi21.

Figure 2
Figura 2: Esempio rappresentativo di una rete Filigrana. La rete differenziale è stata costruita utilizzando i livelli di 163 metaboliti di 71 topi (30 T1D e 41 non-T1D)25,26. I bordi differenziali tra i gruppi T1D e non T1D sono indicati rispettivamente in rosa e blu. I nodi vengono colorati in base al cambio di piega. La tabella mostra i risultati dell'arricchimento prodotti da Filigree. Nove delle dodici sottoreti identificate erano significativamente diverse tra T1D e non-T1D (valore p aggiustato < 0,05). Fare clic qui per visualizzare una versione più grande di questa figura.

Figura 1 supplementare: CorrCalc_InputTab. Screenshot della scheda Input del calcolatore di correlazione. Fare clic qui per scaricare il file.

Figura 2 supplementare: CorrCalc_DataNormTab. Screenshot della scheda Normalizzazione dei dati del calcolatore di correlazione. Vengono controllati i dati di trasformazione Log-2 e i dati di scalabilità automatica . Fare clic qui per scaricare il file.

Figura supplementare 3: CorrCalc_DataAnalTab. Screenshot della scheda Analisi dati del calcolatore di correlazione che mostra il filtro alla correlazione di Pearson di 0-0,8. Inoltre, è stato selezionato il metodo DSPC . Fare clic qui per scaricare il file.

Figura supplementare 4: Filigree_DataTab. Screenshot della scheda Dati di Filigree. Sono state specificate colonne, righe e gruppi. Il metodo Calcola gruppi di feature è stato selezionato con una riduzione delle feature di 1,25 per il rapporto feature-sample. Fare clic qui per scaricare il file.

Figura supplementare 5: Filigree_AnalysisTab. Screenshot della scheda Analisi di Filigree che mostra l'avanzamento dei diversi componenti di analisi. Fare clic qui per scaricare il file.

Figura supplementare 6: Filigree_Subnetwork1. Una sottorete generata da Filigree. Il colore del nodo rappresenta la regolazione verso l'alto/verso il basso e l'opacità del colore rappresenta il cambiamento di piega superiore/inferiore. Il colore del bordo rappresenta lo stato differenziale tra i gruppi. Fare clic qui per scaricare il file.

Figura supplementare 7: Filigree_Subnetwork_SampleGroup. Sottorete separata per gruppo. La rete di sinistra rappresenta i campioni diabetici e la rete di destra rappresenta i campioni non diabetici. Il colore del nodo rappresenta il livello di espressione proporzionale alla media del gruppo. Fare clic qui per scaricare il file.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

I metodi di analisi di rete basati sulla correlazione parziale implementati in CorrelationCalculator e Filigree aiutano a superare alcuni dei limiti delle analisi delle vie metaboliche basate sulla conoscenza, in particolare per i set di dati con un'elevata prevalenza di metaboliti sconosciuti e una copertura limitata delle vie metaboliche (ad esempio, dati lipidomici). Questi strumenti sono stati ampiamente utilizzati dalla comunità di ricerca per analizzare un'ampia gamma di dati metabolomici e lipidomici 14,22,27,28,29,30. Ad esempio, CorrelationCalculator è stato utilizzato per analizzare i dati di molti sistemi biologici che vanno dal microbioma e dalle piante alle malattie umane31,32,33,34. Qui illustriamo come l'analisi di rete basata sui dati, abilitata dai nostri strumenti, può essere combinata con il clustering e l'analisi di regressione per individuare i moduli metabolici associati al fenotipo di interesse.

Le reti di correlazione parziale generate utilizzando CorrelationCalculator e Filigree possono essere raggruppate utilizzando algoritmi di clustering di grafi per produrre moduli metabolici. Questi moduli tendono a comprendere metaboliti chimicamente o funzionalmente correlati tra loro. Tali moduli sono molto utili non solo dal punto di vista della visualizzazione, ma anche dal punto di vista della rilevanza biologica. Lo studio delle relazioni tra i moduli metabolici e gli esiti fenotipici di interesse (ad esempio, l'esito della sopravvivenza) può fornire una maggiore potenza statistica e generare ulteriori informazioni biologiche rispetto all'analisi dei singoli metaboliti.

I moduli metabolici identificati attraverso approcci di clustering di rete possono essere utilizzati anche nell'analisi di arricchimento. Filigree utilizza moduli metabolici identificati attraverso il clustering del consenso invece di percorsi biologici predefiniti. Sebbene i moduli metabolici basati sulla correlazione parziale non siano identici alle vie, raggruppano costantemente metaboliti chimicamente e biochimicamente simili (ad esempio, amminoacidi, acilcarnitine, lipidi della stessa classe, ecc.). Filigree verifica ulteriormente l'importanza di questi moduli utilizzando l'algoritmo NetGSA22,35. Oltre ai nodi differenziali, NetGSA tiene conto delle differenze specifiche della malattia nella struttura della rete.

Uno dei problemi da considerare quando si utilizzano CorrelationCalculator e Filigree per l'analisi dei dati di metabolomica e lipidomica "nella vita reale" è la relazione tra il numero di metaboliti rispetto al numero di campioni in un determinato esperimento. Mentre gli studi epidemiologici su larga scala che coinvolgono migliaia di campioni stanno diventando sempre più comuni, la dimensione del campione nella maggior parte degli esperimenti di metabolomica rimane modesta. Ciò è particolarmente vero per gli studi meccanicistici che coinvolgono sistemi in cui è prevista una bassa variazione biologica (ad esempio, linee cellulari o modelli animali geneticamente omogenei). Gli algoritmi statistici implementati in entrambi gli strumenti possono essere applicati in situazioni in cui il numero di metaboliti supera il numero di campioni, ma l'aumento di tale rapporto porta a reti più sparse.

Un'altra considerazione importante per l'applicazione degli strumenti qui descritti riguarda l'analisi di dati metabolomici non mirati che sono noti per contenere un gran numero di caratteristiche ridondanti o degeneri36, che possono includere isotopi, addotti chimici, frammenti in-source e contaminanti. Poiché molte caratteristiche degeneri hanno origine dallo stesso metabolita, tendono ad avere un alto grado di correlazione. L'analisi parziale basata sulla correlazione di tali dati può richiedere un'attenta annotazione e rimozione di caratteristiche degeneri.

In conclusione, gli strumenti qui presentati forniscono una valida alternativa agli strumenti di analisi dei percorsi basati sulla conoscenza per l'interpretazione dei dati metabolomici.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non hanno interessi finanziari concorrenti.

Acknowledgments

Questo lavoro è stato supportato dalla sovvenzione NIH 1U01CA235487.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biologia Numero 201
CorrelationCalculator e filigrana: strumenti per l'analisi di rete basata sui dati di metabolomica
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter