Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator en Filigree: tools voor datagestuurde netwerkanalyse van metabolomics-gegevens

Published: November 10, 2023 doi: 10.3791/65512

Summary

We presenteren CorrelationCalculator en Filigree, twee tools voor datagestuurde netwerkconstructie en analyse van metabolomics-gegevens. CorrelationCalculator ondersteunt het bouwen van een enkel interactienetwerk van metabolieten op basis van expressiegegevens, terwijl Filigree het mogelijk maakt om een differentieel netwerk te bouwen, gevolgd door netwerkclustering en verrijkingsanalyse.

Abstract

Een belangrijke uitdaging bij de analyse van omics-gegevens is het extraheren van bruikbare biologische kennis. Metabolomics is geen uitzondering. Het algemene probleem van het relateren van veranderingen in niveaus van individuele metabolieten aan specifieke biologische processen wordt nog verergerd door het grote aantal onbekende metabolieten dat aanwezig is in ongerichte vloeistofchromatografie-massaspectrometrie (LC-MS)-studies. Verder zijn secundair metabolisme en lipidenmetabolisme slecht vertegenwoordigd in bestaande pathway-databases. Om deze beperkingen te overwinnen, heeft onze groep verschillende tools ontwikkeld voor datagestuurde netwerkconstructie en -analyse. Deze omvatten CorrelationCalculator en Filigree. Beide tools stellen gebruikers in staat om op partiële correlatie gebaseerde netwerken op te bouwen op basis van experimentele metabolomics-gegevens wanneer het aantal metabolieten groter is dan het aantal monsters. CorrelationCalculator ondersteunt de bouw van een enkel netwerk, terwijl Filigree het mogelijk maakt om een differentieel netwerk te bouwen met behulp van gegevens van twee groepen monsters, gevolgd door netwerkclustering en verrijkingsanalyse. We zullen het nut en de toepassing van beide tools beschrijven voor de analyse van real-life metabolomics-gegevens.

Introduction

In het afgelopen decennium is metabolomics naar voren gekomen als een omics-wetenschap als gevolg van vooruitgang in analytische technologieën zoals gaschromatografie-massaspectrometrie (GC-MS) en vloeistofchromatografie-massaspectrometrie (LC-MS). Deze technieken maken het mogelijk om honderden tot duizenden metabolieten van kleine moleculen gelijktijdig te meten, waardoor complexe multidimensionale datasets ontstaan. Metabolomics-experimenten kunnen worden uitgevoerd in gerichte of niet-gerichte modi. Gerichte metabolomics-experimenten meten specifieke klassen van metabolieten. Ze zijn meestal hypothese-gedreven, terwijl ongerichte benaderingen proberen zoveel mogelijk metabolieten te meten en hypothese-genererend van aard zijn. Gerichte assays bevatten meestal interne standaarden en maken dus een absolute kwantificering van metabolieten van belang mogelijk. Daarentegen maken ongerichte assays relatieve kwantificering mogelijk en bevatten ze veel onbekendemetabolieten1.

Analyse van metabolomics-gegevens is een proces dat uit meerdere stappen bestaat en dat gebruikmaakt van veel gespecialiseerdesoftwaretools1. Het kan worden onderverdeeld in de volgende drie hoofdstappen: (1) gegevensverwerking en kwaliteitscontrole, (2) statistische analyse en (3) interpretatie van biologische gegevens. De hier beschreven tools zijn ontworpen om de laatste stap van de analyse mogelijk te maken.

Een intuïtieve en populaire manier om metabolomics-gegevens te interpreteren, is door de experimentele metingen in kaart te brengen op metabole routes. Er zijn tal van tools ontworpen om ditte bereiken 2,3,4,5, waaronder Metscape, ontwikkeld door onze groep6. Het in kaart brengen van paden wordt vaak gecombineerd met verrijkingsanalyse, wat helpt bij het identificeren van de belangrijkste routes 7,8. Deze technieken kregen voor het eerst bekendheid in de analyse van genexpressiegegevens en zijn met succes toegepast voor de analyse van proteomics- en epigenomics-gegevens 9,10,11,12,13. De analyse van metabolomics-gegevens brengt echter een aantal uitdagingen met zich mee voor op kennis gebaseerde benaderingen. Ten eerste meten metabolomics-assays naast de endogene metabolieten exogene verbindingen, inclusief verbindingen die afkomstig zijn van voeding en andere milieubronnen. Deze verbindingen, evenals metabolieten die door bacteriën worden geproduceerd, kunnen niet in kaart worden gebracht op menselijke of metabole routes van andere eukaryote organismen. Verder maakt de routedekking van secundair metabolisme en lipidenmetabolisme het momenteel niet mogelijk om met hoge resolutie in kaart te brengen op het niveau dat de biologische interpretatie van de gegevens gemakkelijk zou ondersteunen14,15.

Datagestuurde netwerkanalysetechnieken kunnen helpen deze uitdagingen het hoofd te bieden. Op correlaties gebaseerde netwerken kunnen bijvoorbeeld helpen bij het afleiden van relaties tussen zowel bekende als onbekende metabolieten en het annoteren van de onbekenden vergemakkelijken16. Hoewel het berekenen van de correlatiecoëfficiënten van Pearson de meest eenvoudige benadering is om de lineaire relaties tussen metabolieten vast te stellen, is het nadeel dat het zowel directe als indirecte associaties vastlegt17,18,19. Een alternatief is het berekenen van partiële correlatiecoëfficiënten die onderscheid kunnen maken tussen directe en indirecte associaties. Gaussiaanse grafische modellering (GGM) kan worden gebruikt om partiële correlatienetwerken te schatten. GGM vereist echter dat de steekproefomvang en het aantal kenmerken vergelijkbaar zijn. Aan deze voorwaarde wordt zelden voldaan in ongerichte LC-MS-gegevens die metingen bevatten voor duizenden metabole kenmerken. Regularisatietechnieken kunnen worden gebruikt om deze beperking te overwinnen. Grafische lasso (Glasso) en knoopsgewijze regressie zijn populaire methoden voor geregulariseerde schatting van het partiële correlatienetwerk 16,20.

De eerste van de hier gepresenteerde bio-informaticatools, CorrelationCalculator16, is gebaseerd op het DSPC-algoritme (Debiased Sparse Partiële Correlatie). DSPC vertrouwt op gedesparsificeerde grafische lasso-modellering. De onderliggende aanname van het algoritme is dat het aantal verbindingen tussen de metabolieten aanzienlijk kleiner is dan het aantal monsters, d.w.z. dat het partiële correlatienetwerk van metabolieten schaars is. Deze aanname stelt DSPC in staat om de connectiviteit tussen grote aantallen metabolieten te ontdekken met behulp van minder monsters, gebruikmakend van geregulariseerde regressietechnieken. Verder verkrijgt het, met behulp van een debiasing-stap voor de geregulariseerde regressieschattingen, steekproefverdelingen voor de randparameters die kunnen worden gebruikt om betrouwbaarheidsintervallen te construeren en interessante hypothesen te testen (bijv. aan- of afwezigheid van een enkele of een groep randen). De aan- of afwezigheid van een rand in het partiële correlatienetwerk kan dus formeel worden getest met behulp van de berekende p-waarden.

CorrelationCalculator bleek zeer nuttig te zijn voor analyse van één groep16; Het doel van veel metabolomics-experimenten is echter de differentiële analyse van twee of meer aandoeningen. Hoewel CorrelationCalculator op elk van de groepen afzonderlijk kan worden gebruikt om gedeeltelijke correlatienetwerken voor elke voorwaarde te genereren, beperkt deze benadering het aantal monsters dat kan worden gebruikt voor het genereren van netwerken. Aangezien een voldoende grote steekproefomvang een van de grootste overwegingen is bij datagestuurde analyse, zijn methoden die alle beschikbare steekproeven in de gegevens kunnen benutten om netwerken te bouwen zeer wenselijk. Deze aanpak wordt geïmplementeerd in de tweede tool die hier wordt gepresenteerd, genaamd Filigree21. Filigraan is gebaseerd op het eerder gepubliceerde Differential Network Enrichment Analysis (DNEA)-algoritme22. Tabel 1 toont de toepassingen en de workflow van beide tools.

Aantal experimentele omstandigheden (k) k = 1 k = 2
Software-instrument CorrelatieCalculator Filigraan
Gegevens invoeren • Metabolieten x Monsters datamatrix • Metabolieten x Monsters datamatrix
• Experimentele groepen
Werkwijze
•Voorbehandeling
• Schatting van het netwerk
• Netwerk clustering
• Verrijkingsanalyse

• Log transformatie; Automatisch schalen
• DSPC
• Via externe apps
•Nee

• Log transformatie; Automatisch schalen
• Gezamenlijke netwerkraming
• Clustering van consensus
• NetGSA
Data visualisatie Via externe app, bijv. Cytoscape Via externe app, bijv. Cytoscape
Metabole modules testen op de associatie met de uitkomst van belang (optioneel) Via externe apps Via externe apps

Tabel 1: Het toepassingsgebied en de workflow van CorrelationCalculator en Filigree.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. CorrelatieCalculator

  1. Download een voorbeeld van een door komma's gescheiden invoerbestand met een lijst van metabolieten met experimentele metingen op http://metscape.med.umich.edu/kora_data_240.csv.
  2. Dubbelklik op het gedownloade voorbeeldbestand om het te openen.
    1. Zorg ervoor dat het bestand labels bevat voor zowel de monsters als de metabolieten.
    2. Aangezien de monsters in rijen staan, moet u controleren of de eerste kolom de namen van de monsters bevat en de eerste rij de namen van de metabolieten.
  3. Download de toepassing CorrelationCalculator Java (http://metscape.med.umich.edu/calculator.html). Dubbelklik op het gedownloade .jar bestand om de applicatie te starten.
  4. Klik op het tabblad Invoer op de knop Bladeren om het invoerbestand te uploaden.
  5. Gebruik onder Bestandsindeling opgeven de vervolgkeuzepijl om de juiste invoerbestandsindeling te selecteren. Selecteer monsters in rijen (aanvullende figuur 1).
  6. Ga naar het tabblad Gegevensnormalisatie door op de knop Volgende >> rechtsonder in het venster te klikken.
  7. Vink onder Methode(n) selecteren het vakje naast Log2-Transform Data aan. Vink het vakje naast Gegevens automatisch schalen aan.
  8. Klik onder Gegevens normaliseren op de knop Uitvoeren .
    OPMERKING: Zodra de normalisatie is voltooid, klikt u op de knop Genormaliseerde gegevens weergeven , onder Gegevens normaliseren, en bekijkt u de bijgewerkte gegevensset (aanvullende afbeelding 2).
  9. Klik onder Gegevens normaliseren op de knop Opslaan en sla het nieuwe gegevensbestand op.
  10. Ga naar het tabblad Gegevensanalyse door op de knop Volgende >> rechtsonder in het venster te klikken.
  11. Klik onder Correlatie van Pearson berekenen op Uitvoeren. Bepaal het beste correlatiebereik van Pearson voor de gegevens.
    1. Klik op de knop Histogram weergeven . Bekijk de frequentie van de maximale correlatiescores van Pearson per kenmerk.
    2. Klik op de knop Heatmap weergeven . Bekijk de weergave van de correlatiematrix van Pearson.
  12. Laat onder Filteren op correlaties van Pearson de standaardgetallen filteren op een bereik van 0,00 tot 1,00
    NOTITIE: Schuif de kleine blauwe pijl aan de rechterkant van 1 en de kleine blauwe pijl aan de linkerkant van 0 om het filter te vervangen. Het invoeren van specifieke getallen in de tekstvakken is ook een optie.
  13. Selecteer onder Gedeeltelijke correlatiemethode selecteren de gewenste methode, DSPC-methode.
    OPMERKING: Als het aantal metabolieten kleiner is dan het aantal monsters in de dataset, kan alleen de DSPC-methode worden gebruikt.
  14. Klik onder Partiële correlaties berekenen op de knop Uitvoeren (aanvullende afbeelding 3).
  15. Klik op de CSV-bestand bekijken en bekijk de resultaten. Klik op de knop Opslaan en sla de resultaten op.
  16. Klik op de knop Weergeven in MetScape om een interactief correlatienetwerk te starten.
    Zie Karnovsky, A. et al.6 voor meer informatie over het gebruik van MetScape.
    OPMERKING: MetScape is een Cytoscape-applicatie die het mogelijk maakt om correlatienetwerken te creëren en te verkennen.

2. Filigraan

  1. Download een voorbeeld van een door komma's gescheiden invoerbestand met metabolietmetingen op http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Dubbelklik op het gedownloade voorbeeldbestand om het te openen.
    1. Zorg ervoor dat het bestand voorbeeldnamen bevat in kolom 1 en groepstoewijzingen in kolom 2. Controleer of de overige kolommen metabolieten/lipiden bevatten.
    2. Zorg ervoor dat elke rij een voorbeeld vertegenwoordigt.
      OPMERKING: De metabolietmetingen moeten log-getransformeerd en automatisch geschaald worden, tenzij er functie-aggregatie wordt uitgevoerd, in welk geval de metingen alleen log-getransformeerd mogen worden.
  3. Download de Filigree Java-applicatie (http://metscape.med.umich.edu/filigree.html).
    OPMERKING: Een gedetailleerde gebruikershandleiding is beschikbaar op http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Dubbelklik op het gedownloade .jar bestand om de applicatie te starten.
  5. Klik op het tabblad Gegevens op de knop Bladeren om het invoerbestand te uploaden.
  6. Klik onder Kolommen/rijen opgeven op de vervolgkeuzepijl naast Voorbeeld-ID om de bijbehorende kolom-/rijnaam uit het invoerbestand te selecteren. Selecteer Voorbeeld.
  7. Klik onder Kolommen/rijen opgeven op de vervolgkeuzepijl naast "Groeperen" om de bijbehorende kolom/rij uit het invoerbestand te selecteren. Selecteer Groeperen.
  8. Klik onder Voorbeeldgroepen opgeven op de vervolgkeuzepijlen naast elke groep om de bijbehorende groepskolom uit het invoerbestand te selecteren. Selecteer bij Groep 1 Diabeticus. Selecteer voor groep 2 Niet-diabetisch.
  9. Vink onder Functiegroepering het vakje aan naast de gewenste methode, Functiegroepen berekenen.
  10. Klik op de knop Heatmaps bekijken . Bekijk de heatmap en bepaal een gewenste procentuele reductie.
  11. Gebruik de schuifregelaar Functiereductie om de gewenste procentuele reductie van functies te selecteren. Schuif de kleine cirkel totdat de procentuele reductie een kenmerk-tot-monsterverhouding van 1,25 laat zien (aanvullende afbeelding 4).
  12. Ga naar het tabblad Analyse door op de knop Volgende >> rechtsonder in het venster te klikken.
  13. Klik onder Selecteer uitvoermap op de knop Bladeren en selecteer de gewenste maplocatie voor het opslaan van de gegenereerde uitvoerbestanden.
  14. Klik op de knop Analyse uitvoeren linksonder in het venster. De voortgangsbalken worden voor elk analyseonderdeel bijgewerkt (aanvullende figuur 5). Klik op de knop OK in het pop-upvenster met het bericht Analyse succesvol voltooid.
  15. Klik op het tabblad Analyse op de knop Bladeren door netwerken om de interactieve filigraansubnetwerken in een browsertabblad te openen.
  16. Klik op de link Subnetwerk 1 onder de kolom Subnetwerknaam .
  17. Verken het interactieve subnetwerk met behulp van de verschillende knoppen. Klik op de knop + en zoom in op het deel van het netwerk. Klik op de knop - en zoom uit (aanvullende afbeelding 6).
  18. Klik op een groepsknooppunt en sleep het om het binnen het subnetwerk te verplaatsen.
    OPMERKING: De kleur van de knooppunten staat voor opwaartse/neerwaartse regeling en de kleurdekking staat voor een hogere/lagere vouwverandering. De randkleur geeft de differentiële status tussen groepen aan.
  19. Klik op de knop Functies uitvouwen in de rechterbovenhoek van de pagina om alle groepsknooppunten uit te vouwen. Bekijk de specifieke verbindingen waaruit de groepsknooppunten bestaan.
  20. Klik op de knop Functies samenvouwen in de rechterbovenhoek van de pagina om de onlangs uitgevouwen groepsknooppunten samen te vouwen.
  21. Klik op de knop Op voorbeeldgroep in de rechterbovenhoek van de pagina om de weergave te wijzigen van één subnetwerk naar meerdere subnetwerken die zijn opgesplitst in een groep. Onderzoek en vergelijk de groepen met behulp van deze weergave van de subnetwerken (aanvullende figuur 7).
  22. Klik op de knop Alle voorbeelden om terug te gaan naar de weergave van één subnetwerk.
  23. Bekijk het volgende subnetwerk door op de knop Volgende rechtsboven op de pagina te klikken.
  24. Herhaal stap 2.19-2.23 voor elk subnetwerk.
  25. Klik op de koppeling Resultaten differentiële netwerkverrijkingsanalyse bovenaan in het midden van het venster om terug te keren naar de overzichtstabelweergave met alle subnetwerken.
    OPMERKING: Importeer de edge- en/of node-uitvoerbestanden in een andere softwaretool, zoals Cytoscape23, om aanvullende netwerkvisualisaties te maken.

3. Aanvullende overwegingen

  1. Voor Mac-computers met Big Sur (OSX 11.2) of hoger keur je de tool goed in het Apple-menu > Systeemvoorkeuren > 'Beveiliging en privacy' > 'Algemeen' en selecteer je ' Sta toe ' onder aan het tabblad.
  2. Daarnaast kun je Filigraan toegang geven tot de bestanden in het Apple-menu > Systeemvoorkeuren > Beveiliging en privacy > Privacy door ' Bestanden en mappen ' te selecteren in het menu aan de linkerkant en vervolgens ' Filigraan' in het menu aan de rechterkant.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Om het gebruik van CorrelationCalculator te illustreren, hebben we een partieel correlatienetwerk geconstrueerd met behulp van een subset van de metabolomics-gegevens uit de KORA-populatiestudie beschreven in Krumsiek et al.24. De dataset bevatte 151 metabolieten en 240 monsters. Figuur 1 toont het resulterende partiële correlatienetwerk dat werd gevisualiseerd in Cytoscape. Het netwerk bevat 148 nodes en 272 edges. De kleur van de knopen vertegenwoordigt metabolieten die tot verschillende chemische klassen behoren, terwijl de randen de aangepaste p-waarde van de partiële correlatiecoëfficiënten vertegenwoordigen (aangepaste p-waarde < 0,05). Ondanks het feit dat CorrelationCalculator geen eerdere informatie gebruikte, was het met name in staat om chemisch verwante metabolieten te groeperen. Zo zijn fosfatidylcholines en lysofosfatidylcholines nauw met elkaar verbonden in het netwerk. Het visualiseren van metabolietveranderingen in de context van dit type netwerk kan het genereren van hypothesen vergemakkelijken, toekomstige experimenten helpen plannen en manuscriptvoorbereiding mogelijk maken. Om een mogelijke workflow te illustreren met behulp van een partiële correlatie metaboliet netwerk, voerden we consensus netwerk clustering uit zoals beschreven in Ma et al.22, resulterend in de identificatie van 9 subnetwerken of metabole modules. Deze modules hadden een goede overeenkomst met de chemische klassen, d.w.z. metabolieten die tot dezelfde chemische klasse behoorden, maakten meestal deel uit van dezelfde metabole module. De gebruiker heeft op https://github.com/Karnovsky-Lab/clusterNet toegang tot de clusteringtool clusterNet.

Figure 1
Figuur 1: Representatief voorbeeld van een CorrelationCalculator netwerk. Het netwerk is opgebouwd uit een subset van de metabolomics-gegevens van de KORA-populatiestudie24 , bestaande uit 151 metabolieten bij 240 proefpersonen. De knooppunten vertegenwoordigen metabolieten en de randen die ze verbinden worden gewogen door de aangepaste p-waarde van partiële correlatiecoëfficiënten (aangepaste p-waarde < 0,05). De vorm van de knooppunten vertegenwoordigt verschillende metabolische klassen en de kleur vertegenwoordigt metabole modules die zijn verkregen door het netwerk te clusteren met behulp van de consensusclustermethode. Klik hier om een grotere versie van deze figuur te bekijken.

We illustreren de toepassing van Filigraan door een dataset te analyseren van een muismodel van diabetes type I (T1D)25,26. Plasmametabolietmetingen van T1D- en niet-diabetische (NOD) muizen werden gebruikt om een differentieel partieel correlatienetwerk te genereren (Figuur 2). We zien met name een hogere mate van netwerkconnectiviteit in de niet-diabetische groep. De volgende stappen van de analyse identificeerden twaalf metabole modules, waarvan er negen significant verschilden tussen T1D en niet-diabetische muizen (FDR < 0,05). We verwijzen de lezer naar de oorspronkelijke publicatie voor meer inzicht in de biologische conclusies die uit deze analyse kunnen worden getrokken21.

Figure 2
Figuur 2: Representatief voorbeeld van een filigraannetwerk. Het differentiële netwerk werd geconstrueerd met behulp van de niveaus van 163 metabolieten van 71 muizen (30 T1D en 41 niet-T1D)25,26. Differentiële randen tussen T1D- en niet-T1D-groepen worden respectievelijk in roze en blauw aangegeven. De knooppunten zijn gekleurd op basis van de vouwverandering. De tabel toont de verrijkingsresultaten van Filigree. Negen van de twaalf geïdentificeerde subnetwerken verschilden significant tussen T1D en niet-T1D (gecorrigeerde p-waarde < 0,05). Klik hier om een grotere versie van deze figuur te bekijken.

Aanvullende figuur 1: CorrCalc_InputTab. Schermafbeelding van het tabblad Invoer van de Correlatiecalculator. Klik hier om dit bestand te downloaden.

Aanvullende figuur 2: CorrCalc_DataNormTab. Schermafbeelding van het tabblad Gegevensnormalisatie van de Correlatiecalculator. Log-2 Gegevens transformeren en Gegevens automatisch schalen zijn aangevinkt. Klik hier om dit bestand te downloaden.

Aanvullende figuur 3: CorrCalc_DataAnalTab. Schermafbeelding van het tabblad Gegevensanalyse van de Correlatiecalculator met filtering naar Pearson's Correlatie van 0-0,8. Daarnaast is gekozen voor de DSPC-methode . Klik hier om dit bestand te downloaden.

Aanvullende figuur 4: Filigree_DataTab. Schermafbeelding van het tabblad Gegevens van Filigree. Er zijn kolommen, rijen en groepen opgegeven. De methode Functiegroepen berekenen is geselecteerd met een kenmerkreductie van 1,25 kenmerk-tot-steekproefverhouding. Klik hier om dit bestand te downloaden.

Aanvullende figuur 5: Filigree_AnalysisTab. Schermafbeelding van het tabblad Analyse van Filigree met de voortgang van de verschillende analysecomponenten. Klik hier om dit bestand te downloaden.

Aanvullende figuur 6: Filigree_Subnetwork1. Een subnetwerk gegenereerd uit Filigree. Knooppuntkleur staat voor opwaartse/neerwaartse regulatie en kleurdekking staat voor hogere/lagere vouwverandering. De randkleur geeft de differentiële status tussen groepen aan. Klik hier om dit bestand te downloaden.

Aanvullende figuur 7: Filigree_Subnetwork_SampleGroup. Subnetwerk gescheiden door groep. Het linkernetwerk vertegenwoordigt diabetische monsters en het rechternetwerk vertegenwoordigt niet-diabetische monsters. De kleur van het knooppunt vertegenwoordigt het expressieniveau dat evenredig is met het groepsgemiddelde. Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Partiële correlatie-gebaseerde netwerkanalysemethoden geïmplementeerd in CorrelationCalculator en Filigree helpen enkele van de beperkingen van op kennis gebaseerde metabole routeanalyses te overwinnen, met name voor de datasets met een hoge prevalentie van onbekende metabolieten en een beperkte dekking van metabole routes (bijv. lipidomics-gegevens). Deze tools zijn op grote schaal gebruikt door de onderzoeksgemeenschap om een breed scala aan metabolomics- en lipidomics-gegevens te analyseren 14,22,27,28,29,30. CorrelationCalculator is bijvoorbeeld gebruikt om de gegevens van vele biologische systemen te analyseren, variërend van microbioom en planten tot menselijke ziekten31,32,33,34. Hier illustreren we hoe datagestuurde netwerkanalyse, mogelijk gemaakt door onze tools, kan worden gecombineerd met clustering en regressieanalyse om de metabole modules te lokaliseren die verband houden met het fenotype van belang.

Partiële correlatienetwerken die worden gegenereerd met behulp van CorrelationCalculator en Filigree kunnen worden geclusterd met behulp van algoritmen voor het clusteren van grafieken om metabole modules te produceren. Deze modules bevatten meestal metabolieten die chemisch of functioneel aan elkaar gerelateerd zijn. Dergelijke modules zijn zeer nuttig, niet alleen vanuit een visualisatieperspectief, maar ook vanuit het oogpunt van biologische relevantie. Het bestuderen van de relaties tussen metabole modules en fenotypische uitkomsten die van belang zijn (bijv. overlevingsuitkomst) kan meer statistische kracht opleveren en aanvullende biologische inzichten genereren in vergelijking met het testen van individuele metabolieten.

Metabole modules die zijn geïdentificeerd door middel van netwerkclusterbenaderingen kunnen ook worden gebruikt bij verrijkingsanalyse. Filigraan maakt gebruik van metabole modules die zijn geïdentificeerd door middel van consensusclustering in plaats van vooraf gedefinieerde biologische routes. Hoewel op partiële correlatie gebaseerde metabole modules niet identiek zijn aan routes, groeperen ze consequent chemisch en biochemisch vergelijkbare metabolieten (bijv. aminozuren, acylcarnitines, lipiden van dezelfde klasse, enz.). Filigree test verder de betekenis van deze modules met behulp van NetGSA-algoritme22,35. Naast differentiële knooppunten houdt NetGSA rekening met ziektespecifieke verschillen in netwerkstructuur.

Een van de aandachtspunten bij het gebruik van CorrelationCalculator en Filigree voor de analyse van 'real life' metabolomics- en lipidomics-gegevens is de relatie tussen het aantal metabolieten en het aantal monsters in een bepaald experiment. Hoewel grootschalige epidemiologische studies met duizenden monsters steeds gebruikelijker worden, blijft de steekproefomvang in de meeste metabolomics-experimenten bescheiden. Dit geldt met name voor mechanistische studies met systemen waarbij een lage biologische variatie wordt verwacht (d.w.z. cellijnen of genetisch homogene diermodellen). De statistische algoritmen die in beide tools zijn geïmplementeerd, kunnen worden toegepast in situaties waarin het aantal metabolieten groter is dan het aantal monsters, maar de toename van die verhouding leidt tot dunnere netwerken.

Een andere belangrijke overweging voor de toepassing van de hier beschreven instrumenten betreft de analyse van ongerichte metabolomics-gegevens waarvan bekend is dat ze een groot aantal redundante of gedegenereerde kenmerken bevatten36, waaronder isotopen, chemische adducten, in-source fragmenten en contaminanten. Omdat veel gedegenereerde kenmerken afkomstig zijn van dezelfde metaboliet, hebben ze de neiging om een hoge mate van correlatie te hebben. Gedeeltelijke correlatie-gebaseerde analyse van dergelijke gegevens kan een zorgvuldige annotatie en verwijdering van gedegenereerde kenmerken vereisen.

Concluderend kunnen we stellen dat de hier gepresenteerde tools een levensvatbaar alternatief bieden voor op kennis gebaseerde pathways analysetools voor de interpretatie van metabolomics-gegevens.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben geen concurrerende financiële belangen.

Acknowledgments

Dit werk werd ondersteund door NIH 1U01CA235487-subsidie.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biologie nummer 201
CorrelationCalculator en Filigree: tools voor datagestuurde netwerkanalyse van metabolomics-gegevens
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter