Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator og Filigran: Værktøjer til datadrevet netværksanalyse af metabolomicsdata

Published: November 10, 2023 doi: 10.3791/65512

Summary

Vi præsenterer CorrelationCalculator og Filigree, to værktøjer til datadrevet netværkskonstruktion og analyse af metabolomics data. CorrelationCalculator understøtter opbygning af et enkelt interaktionsnetværk af metabolitter baseret på ekspressionsdata, mens Filigran gør det muligt at opbygge et differentielt netværk efterfulgt af netværksklynger og berigelsesanalyse.

Abstract

En væsentlig udfordring i analysen af omics-data er at udtrække handlingsrettet biologisk viden. Metabolomics er ingen undtagelse. Det generelle problem med at relatere ændringer i niveauerne af individuelle metabolitter til specifikke biologiske processer forværres af det store antal ukendte metabolitter, der er til stede i ikke-målrettede væskekromatografi-massespektrometriundersøgelser (LC-MS). Endvidere er sekundær metabolisme og lipidmetabolisme dårligt repræsenteret i eksisterende pathway databaser. For at overvinde disse begrænsninger har vores gruppe udviklet flere værktøjer til datadrevet netværkskonstruktion og analyse. Disse omfatter CorrelationCalculator og Filigree. Begge værktøjer giver brugerne mulighed for at opbygge delvise korrelationsbaserede netværk fra eksperimentelle metabolomics-data, når antallet af metabolitter overstiger antallet af prøver. CorrelationCalculator understøtter opbygningen af et enkelt netværk, mens Filigran tillader opbygning af et differentieret netværk ved hjælp af data fra to grupper af prøver, efterfulgt af netværksklynger og berigelsesanalyse. Vi vil beskrive anvendeligheden og anvendelsen af begge værktøjer til analyse af virkelige metabolomics-data.

Introduction

I det sidste årti er metabolomics opstået som en omics-videnskab på grund af fremskridt inden for analytiske teknologier såsom gaskromatografi-massespektrometri (GC-MS) og væskekromatografi-massespektrometri (LC-MS). Disse teknikker tillader samtidig måling af hundreder til tusinder af små molekylemetabolitter, hvilket skaber komplekse flerdimensionelle datasæt. Metabolomics eksperimenter kan udføres i målrettede eller ikke-målrettede tilstande. Målrettede metabolomics-eksperimenter måler specifikke klasser af metabolitter. De er normalt hypotesedrevne, mens ikke-målrettede tilgange forsøger at måle så mange metabolitter som muligt og er hypotesegenererende i naturen. Målrettede assays omfatter normalt interne standarder og muliggør således absolut kvantificering af relevante metabolitter. I modsætning hertil tillader ikke-målrettede assays relativ kvantificering og omfatter mange ukendte metabolitter1.

Analyse af metabolomics-data er en proces i flere trin, der udnytter mange specialiserede softwareværktøjer1. Det kan opdeles i følgende tre hovedtrin: (1) databehandling og kvalitetskontrol, (2) statistisk analyse og (3) fortolkning af biologiske data. De værktøjer, der beskrives her, er designet til at muliggøre det sidste trin i analysen.

En intuitiv og populær måde at fortolke metabolomics data på er at kortlægge de eksperimentelle målinger på metaboliske veje. Talrige værktøjer er designet til at opnå denne 2,3,4,5, herunder Metscape, udviklet af vores gruppe6. Pathway kortlægning kombineres ofte med berigelsesanalyse, som hjælper med at identificere de mest betydningsfulde veje 7,8. Disse teknikker fik først fremtrædende plads i analysen af genekspressionsdata og er med succes blevet anvendt til analyse af proteomics og epigenomics data 9,10,11,12,13. Analysen af metabolomics-data giver imidlertid en række udfordringer for videnbaserede tilgange. For det første måler metabolomics-assays ud over de endogene metabolitter eksogene forbindelser, herunder dem, der kommer fra ernæring og andre miljøkilder. Disse forbindelser, såvel som metabolitter produceret af bakterier, kan ikke kortlægges på humane eller metaboliske veje af andre eukaryote organismer. Desuden tillader vejdækning af sekundær metabolisme og lipidmetabolisme i øjeblikket ikke kortlægning i høj opløsning på det niveau, der let ville understøtte den biologiske fortolkning af dataene14,15.

Datadrevne netværksanalyseteknikker kan hjælpe med at overvinde disse udfordringer. For eksempel kan korrelationsbaserede netværk hjælpe med at udlede relationer mellem både kendte og ukendte metabolitter og lette annoteringen af de ukendte16. Mens beregning af Pearsons korrelationskoefficienter er den mest ligetil tilgang til etablering af de lineære forhold mellem metabolitter, er ulempen, at den fanger både direkte og indirekte foreninger17,18,19. Et alternativ er at beregne delvise korrelationskoefficienter, der kan skelne mellem direkte og indirekte foreninger. Gaussisk grafisk modellering (GGM) kan bruges til at estimere delvise korrelationsnetværk. GGM kræver dog, at stikprøvestørrelsen og antallet af funktioner er sammenlignelige. Denne betingelse er sjældent opfyldt i ikke-målrettede LC-MS-data, der indeholder målinger for tusindvis af metaboliske egenskaber. Regulariseringsteknikker kan bruges til at overvinde denne begrænsning. Grafisk lasso (Glasso) og nodevis regression er populære metoder til reguleret estimering af det partielle korrelationsnetværk 16,20.

Det første af de bioinformatikværktøjer, der præsenteres her, CorrelationCalculator16, er baseret på DSPC-algoritmen (Debiased Sparse Partial Correlation Algorithm). DSPC er afhængig af de-sparsificeret grafisk lassomodellering. Den underliggende antagelse for algoritmen er, at antallet af forbindelser mellem metabolitterne er betydeligt mindre end antallet af prøver, dvs. det partielle korrelationsnetværk af metabolitter er sparsomt. Denne antagelse gør det muligt for DSPC at opdage forbindelsen mellem et stort antal metabolitter ved hjælp af færre prøver ved at udnytte regulerede regressionsteknikker. Ved hjælp af et debiasing-trin til de regulerede regressionsestimater opnår den desuden prøveudtagningsfordelinger for kantparametrene, der kan bruges til at konstruere konfidensintervaller og teste hypoteser af interesse (f.eks. tilstedeværelse/fravær af en enkelt eller en gruppe kanter). Tilstedeværelsen eller fraværet af en kant i det partielle korrelationsnetværk kan således formelt testes ved hjælp af de beregnede p-værdier.

CorrelationCalculator viste sig at være meget nyttig til enkeltgruppeanalyse16; Formålet med mange metabolomics-eksperimenter er imidlertid differentiel analyse af to eller flere tilstande. Mens CorrelationCalculator kan anvendes på hver af grupperne separat for at generere delvise korrelationsnetværk for hver tilstand, begrænser denne tilgang antallet af prøver, der kan bruges til netværksgenerering. Da en tilstrækkelig stor stikprøvestørrelse er en af de største overvejelser i datadrevet analyse, er metoder, der kan udnytte alle tilgængelige prøver i dataene til at konstruere netværk, meget ønskelige. Denne tilgang implementeres i det andet værktøj, der præsenteres her, kaldet Filigran21. Filigran er afhængig af den tidligere offentliggjorte Differential Network Enrichment Analysis (DNEA) algoritme22. Tabel 1 viser applikationerne og arbejdsgangen for begge værktøjer.

Antal forsøgsbetingelser (k) k = 1 k = 2
Software værktøj Korrelationberegner Filigran
Input data • Metabolitter x Prøver datamatrix • Metabolitter x Prøver datamatrix
• Eksperimentelle grupper
Arbejdsproces
•Forbehandling
• Estimering af netværk
• Netværk klynger
• Berigelsesanalyse

• Log transformation; Automatisk skalering
• DSPC
• Via eksterne apps
•Nej

• Log transformation; Automatisk skalering
• Fælles netværksestimering
• Konsensus klyngedannelse
• NetGSA
Visualisering af data Via ekstern app, f.eks. Cytoscape Via ekstern app, f.eks. Cytoscape
Test af metaboliske moduler til associering med resultat af interesse (valgfrit) Via eksterne apps Via eksterne apps

Tabel 1: Anvendelsesområdet og arbejdsgangen for CorrelationCalculator og Filigran.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. KorrelationBeregner

  1. Download et eksempel på en kommasepareret inputfil, der indeholder en liste over metabolitter med eksperimentelle målinger ved http://metscape.med.umich.edu/kora_data_240.csv.
  2. Dobbeltklik på den downloadede prøvefil for at åbne den.
    1. Sørg for, at filen indeholder etiketter for både prøverne og metabolitterne.
    2. Da prøverne er i rækker, skal du bekræfte, at den første kolonne er prøvenavnene, og den første række er metabolitnavnene.
  3. Hent programmet CorrelationCalculator Java (http://metscape.med.umich.edu/calculator.html). Dobbeltklik på den downloadede .jar fil for at starte applikationen.
  4. På fanen Input skal du klikke på knappen Gennemse for at uploade inputfilen.
  5. Brug rullepilen under Angiv filformat til at vælge det relevante inputfilformat. Vælg prøver i rækker (supplerende figur 1).
  6. Gå til fanen Datanormalisering ved at klikke på knappen Næste >> nederst til højre i vinduet.
  7. Under Vælg metode(r) skal du markere afkrydsningsfeltet ud for Log2-Transformér data. Markér afkrydsningsfeltet ud for Autoskalering af data.
  8. Under Normaliser data skal du klikke på knappen Kør .
    BEMÆRK: Når normaliseringen er fuldført, skal du klikke på knappen Vis normaliserede data, der findes under Normaliser data, og gennemse det opdaterede datasæt (supplerende figur 2).
  9. Under Normaliser data skal du klikke på knappen Gem og gemme den nye datafil.
  10. Gå til fanen Dataanalyse ved at klikke på knappen Næste >> nederst til højre i vinduet.
  11. Under Beregn Pearsons korrelation skal du klikke på Kør. Bestem det bedste Pearson's Correlation interval for dataene.
    1. Klik på knappen Vis histogram . Gennemgå hyppigheden af den maksimale Pearsons korrelationsscore pr. funktion.
    2. Klik på Se varmekort knap. Gennemgå repræsentationen af Pearsons korrelationsmatrix.
  12. Under Filtrer efter Pearsons korrelationer skal du lade standardtallene filtrere efter et interval fra 0,00 til 1,00
    BEMÆRK: Skub den lille blå pil i højre ende fra 1 og den lille blå pil til venstre fra 0 for at skifte filter. Indtastning af bestemte tal i tekstfelterne er også en mulighed.
  13. Under Vælg delvis korrelationsmetode skal du vælge den ønskede metode, DSPC-metode.
    BEMÆRK: Hvis antallet af metabolitter er mindre end antallet af prøver i datasættet, kan kun DSPC-metoden bruges.
  14. Under Beregn delvise korrelationer skal du klikke på knappen Kør (supplerende figur 3).
  15. Klik på Vis CSV-fil , og se resultaterne. Klik på Gem knappen og gem resultaterne.
  16. Klik på knappen Vis i MetScape for at starte et interaktivt korrelationsnetværk.
    Se Karnovsky, A. et al.6 for mere information om brug af MetScape.
    BEMÆRK: MetScape er en Cytoscape-applikation, der giver mulighed for oprettelse og udforskning af korrelationsnetværk.

2. Filigran

  1. Download et eksempel på en kommasepareret inputfil, der indeholder metabolitmålinger ved http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Dobbeltklik på den downloadede prøvefil for at åbne den.
    1. Sørg for, at filen indeholder eksempelnavne i kolonne 1 og gruppetildelinger i kolonne 2. Bekræft, at de resterende kolonner indeholder metabolitter/lipider.
    2. Sørg for, at hver række repræsenterer en prøve.
      BEMÆRK: Metabolitmålingerne skal logtransformeres og skaleres automatisk, medmindre der udføres funktionsaggregering, i hvilket tilfælde målingerne kun skal logtransformeres.
  3. Hent Filigran Java-programmet (http://metscape.med.umich.edu/filigree.html).
    BEMÆRK: En detaljeret brugervejledning findes på http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Dobbeltklik på den downloadede .jar fil for at starte applikationen.
  5. På fanen Data skal du klikke på knappen Gennemse for at uploade inputfilen.
  6. Under Angiv kolonner/rækker skal du klikke på rullepilen ud for Eksempel-id for at vælge det tilsvarende kolonne-/rækkenavn fra inputfilen. Vælg Eksempel.
  7. Under Angiv kolonner / rækker skal du klikke på rullemenuen ud for "Gruppe" for at vælge den tilsvarende kolonne / række fra inputfilen. Vælg Gruppe.
  8. Under Angiv eksempelgrupper skal du klikke på rullepilene ud for hver gruppe for at vælge den tilsvarende gruppekolonne fra inputfilen. For Gruppe 1 skal du vælge Diabetiker. For gruppe 2 skal du vælge Ikke-diabetiker.
  9. Under Funktionsgruppering skal du markere afkrydsningsfeltet ud for den ønskede metode, Beregn funktionsgrupper.
  10. Klik på Se varmekort knap. Se varmekortet, og bestem en ønsket procentvis reduktion.
  11. Brug skyderen Funktionsreduktion til at vælge den ønskede procentvise reduktion af funktioner. Skub den lille cirkel, indtil reduktionsprocenten viser et forhold mellem funktion og prøve på 1,25 (supplerende figur 4).
  12. Gå til fanen Analyse ved at klikke på knappen Næste >> nederst til højre i vinduet.
  13. Under Vælg outputmappe skal du klikke på knappen Gennemse og vælge den ønskede mappeplacering til lagring af de genererede outputfiler.
  14. Klik på knappen Kør analyse nederst til venstre i vinduet. Statuslinjerne opdateres for hver analysekomponent (supplerende figur 5). Klik på OK knappen i pop op-vinduet, der viser meddelelsen Analyse afsluttet med succes.
  15. Klik på knappen Gennemse netværk under fanen Analyse for at åbne de interaktive filigranundernetværk under en browserfane.
  16. Klik på linket Undernetværk 1 under kolonnen Undernetværksnavn .
  17. Udforsk det interaktive undernetværk ved hjælp af de forskellige knapper. Klik på knappen + , og zoom ind på den del af netværket. Klik på knappen - og zoom ud (supplerende figur 6).
  18. Klik på en gruppenode , og træk den for at flytte den inden for undernetværket.
    BEMÆRK: Nodefarve repræsenterer op/ned-regulering, og farveopacitet repræsenterer højere/lavere foldændring. Kantfarven repræsenterer differentieringsstatus mellem grupper.
  19. Klik på knappen Udvid funktioner øverst til højre på siden for at udvide alle gruppenoder. Gennemgå de specifikke forbindelser, der udgør gruppeknudepunkterne.
  20. Klik på knappen Skjul funktioner øverst til højre på siden for at skjule de nyligt udvidede gruppenoder.
  21. Klik på knappen Efter eksempelgruppe øverst til højre på siden for at ændre visningen fra et enkelt undernetværk til flere undernetværk, der er opdelt af en gruppe. Udforsk og sammenlign grupperne ved hjælp af denne visning af undernetværkene (supplerende figur 7).
  22. Klik på knappen Alle eksempler for at gå tilbage til visningen af det enkelte undernetværk.
  23. Se det næste undernetværk ved at klikke på knappen Næste øverst til højre på siden.
  24. Gentag trin 2.19-2.23 for hvert undernetværk.
  25. Klik på linket Differential Network Enrichment Analysis Results øverst midt i vinduet for at vende tilbage til oversigtstabelvisningen med alle undernetværkene.
    BEMÆRK: Importer kant- og/eller nodeoutputfilerne i et andet softwareværktøj, såsom Cytoscape23, for at oprette yderligere netværksvisualiseringer.

3. Yderligere overvejelser

  1. På Mac-computere, der kører Big Sur (OSX 11.2) eller nyere, skal du godkende værktøjet i Apple-menuen > Systemindstillinger > Sikkerhed & anonymitet > Generelt og vælge Tillad nederst på fanen.
  2. Tillad desuden Filigran adgang til arkiverne i Apple-menuen > Systemindstillinger > Sikkerhed & anonymitet > anonymitet ved at vælge Filer og mapper i menuen til venstre og derefter vælge Filigran i menuen til højre.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

For at illustrere brugen af CorrelationCalculator konstruerede vi et delvist korrelationsnetværk ved hjælp af en delmængde af metabolomics-data fra KORA-populationsundersøgelsen beskrevet i Krumsiek et al.24. Datasættet indeholdt 151 metabolitter og 240 prøver. Figur 1 viser det resulterende partielle korrelationsnetværk, der blev visualiseret i Cytoscape. Netværket indeholder 148 noder og 272 kanter. Farven på knuderne repræsenterer metabolitter, der tilhører forskellige kemiske klasser, mens kanterne repræsenterer den justerede p-værdi af de partielle korrelationskoefficienter (justeret p-værdi < 0, 05) . Især på trods af ikke at bruge nogen forudgående information var CorrelationCalculator i stand til at gruppere kemisk relaterede metabolitter. For eksempel er phosphatidylcholiner og lysophosphatidylcholiner tæt forbundet i netværket. Visualisering af metabolitændringer i forbindelse med denne type netværk kan lette hypotesegenerering, hjælpe med at planlægge fremtidige eksperimenter og muliggøre manuskriptforberedelse. For at illustrere en potentiel arbejdsgang ved hjælp af et delvist korrelationsmetabolitnetværk udførte vi konsensusnetværksklynger som beskrevet i Ma et al.22, hvilket resulterede i identifikation af 9 undernetværk eller metaboliske moduler. Disse moduler havde en god overensstemmelse med de kemiske klasser, dvs. metabolitter, der tilhører den samme kemiske klasse, havde tendens til at være en del af det samme metaboliske modul. Brugeren kan få adgang til klyngeværktøjet clusterNet på https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Figur 1: Repræsentativt eksempel på et CorrelationCalculator-netværk. Netværket blev opbygget ud fra en delmængde af KORA population study metabolomics data24 bestående af 151 metabolitter på tværs af 240 forsøgspersoner. Knuderne repræsenterer metabolitter, og kanterne, der forbinder dem, vægtes med den justerede p-værdi af partielle korrelationskoefficienter (justeret p-værdi < 0,05). Formen på knuderne repræsenterer forskellige metaboliske klasser, og farven repræsenterer metaboliske moduler opnået ved klyngedannelse af netværket ved hjælp af konsensusklyngemetoden. Klik her for at se en større version af denne figur.

Vi illustrerer anvendelsen af filigran ved at analysere et datasæt fra en musemodel af type I-diabetes (T1D)25,26. Plasmametabolitmålinger fra T1D og ikke-diabetiske (NOD) mus blev brugt til at generere et differentielt partielt korrelationsnetværk (figur 2). Især observerer vi en højere grad af netværksforbindelse i den ikke-diabetiske gruppe. De næste trin i analysen identificerede tolv metaboliske moduler, hvoraf ni var signifikant forskellige mellem T1D og ikke-diabetiske mus (FDR < 0,05). Vi henviser læseren til den oprindelige publikation for yderligere indsigt i biologiske konklusioner, der kan drages af denne analyse21.

Figure 2
Figur 2: Repræsentativt eksempel på et Filigran netværk. Differentialnetværket blev konstrueret ved hjælp af niveauerne af 163 metabolitter fra 71 mus (30 T1D og 41 ikke-T1D)25,26. Differentielle kanter mellem T1D og ikke-T1D grupper er angivet i henholdsvis pink og blå. Knuderne er farvet baseret på foldændringen. Tabellen viser Filigran berigelsesresultater. Ni ud af de tolv identificerede delnetværk var signifikant forskellige mellem T1D og ikke-T1D (justeret p-værdi < 0,05). Klik her for at se en større version af denne figur.

Supplerende figur 1: CorrCalc_InputTab. Skærmbillede af fanen Input i korrelationsberegneren. Klik her for at downloade denne fil.

Supplerende figur 2: CorrCalc_DataNormTab. Skærmbillede af fanen Datanormalisering i korrelationsberegneren. Log-2 Transformér data og Autoskaleringsdata er markeret. Klik her for at downloade denne fil.

Supplerende figur 3: CorrCalc_DataAnalTab. Skærmbillede af fanen Dataanalyse i korrelationsberegneren, der viser filtrering til Pearsons korrelation på 0-0,8. Derudover er DSPC-metoden valgt. Klik her for at downloade denne fil.

Supplerende figur 4: Filigree_DataTab. Skærmbillede af fanen Data i Filigree. Kolonner, rækker og grupper er angivet. Metoden Beregn funktionsgrupper er valgt med en funktionsreduktion på 1,25 funktions-til-stikprøve-forhold. Klik her for at downloade denne fil.

Supplerende figur 5: Filigree_AnalysisTab. Skærmbillede af fanen Analyse i Filigran viser status for de forskellige analysekomponenter. Klik her for at downloade denne fil.

Supplerende figur 6: Filigree_Subnetwork1. Et undernetværk genereret fra Filigree. Nodefarve repræsenterer op/ned-regulering, og farveopacitet repræsenterer højere/lavere foldændring. Kantfarven repræsenterer differentieringsstatus mellem grupper. Klik her for at downloade denne fil.

Supplerende figur 7: Filigree_Subnetwork_SampleGroup. Undernetværk adskilt efter gruppe. Det venstre netværk repræsenterer diabetiske prøver, og det højre netværk repræsenterer ikke-diabetiske prøver. Nodefarve repræsenterer udtryksniveau, der er proportionalt med gruppens middelværdi. Klik her for at downloade denne fil.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Partielle korrelationsbaserede netværksanalysemetoder implementeret i CorrelationCalculator og Filigran hjælper med at overvinde nogle af begrænsningerne ved videnbaserede metaboliske vejanalyser, især for datasæt med en høj forekomst af ukendte metabolitter og begrænset dækning af metaboliske veje (f.eks. lipidomics-data). Disse værktøjer er blevet brugt i vid udstrækning af forskersamfundet til at analysere en bred vifte af metabolomics og lipidomics data 14,22,27,28,29,30. For eksempel er CorrelationCalculator blevet brugt til at analysere data fra mange biologiske systemer lige fra mikrobiom og planter til menneskelig sygdom31,32,33,34. Her illustrerer vi, hvordan datadrevet netværksanalyse, muliggjort af vores værktøjer, kan kombineres med klyngedannelse og regressionsanalyse for at lokalisere de metaboliske moduler, der er forbundet med fænotypen af interesse.

Delvise korrelationsnetværk genereret ved hjælp af CorrelationCalculator og Filigran kan grupperes ved hjælp af grafklyngealgoritmer til at producere metaboliske moduler. Disse moduler har tendens til at omfatte metabolitter, der er kemisk eller funktionelt relateret til hinanden. Sådanne moduler er meget nyttige ikke kun fra et visualiseringsperspektiv, men også fra et biologisk relevanssynspunkt. Undersøgelse af forholdet mellem metaboliske moduler og fænotypiske resultater af interesse (fx overlevelsesresultat) kan give mere statistisk styrke og generere yderligere biologisk indsigt sammenlignet med test af individuelle metabolitter.

Metaboliske moduler identificeret gennem netværksklyngemetoder kan også anvendes i berigelsesanalyse. Filigran bruger metaboliske moduler identificeret gennem konsensusklynger i stedet for foruddefinerede biologiske veje. Selvom partielle korrelationsbaserede metaboliske moduler ikke er identiske med veje, grupperer de konsekvent kemisk og biokemisk lignende metabolitter (fx aminosyrer, acylcarnitiner, lipider af samme klasse osv.). Filigran tester yderligere betydningen af disse moduler ved hjælp af NetGSA-algoritme22,35. Ud over differentielle noder tegner NetGSA sig for sygdomsspecifikke forskelle i netværksstruktur.

Et af de spørgsmål, der skal overvejes, når man bruger CorrelationCalculator og Filigran til analyse af 'real life' metabolomics og lipidomics data, er forholdet mellem antallet af metabolitter vs. antallet af prøver i et givet eksperiment. Mens store epidemiologiske undersøgelser, der involverer tusindvis af prøver, bliver mere almindelige, forbliver prøvestørrelsen i de fleste metabolomics-eksperimenter beskeden. Dette gælder især for mekanistiske undersøgelser, der involverer systemer, hvor der forventes lav biologisk variation (dvs. cellelinjer eller genetisk homogene dyremodeller). De statistiske algoritmer, der implementeres i begge værktøjer, kan anvendes i situationer, hvor antallet af metabolitter overstiger antallet af prøver, men stigningen i dette forhold fører til mere sparsomme netværk.

En anden vigtig overvejelse for anvendelsen af de værktøjer, der er beskrevet her, vedrører analysen af ikke-målrettede metabolomics-data, der vides at indeholde et stort antal overflødige eller degenererede egenskaber36, som kan omfatte isotoper, kemiske addukter, in-source-fragmenter og forurenende stoffer. Da mange degenererede træk stammer fra den samme metabolit, har de tendens til at have en høj grad af korrelation. Delvis korrelationsbaseret analyse af sådanne data kan kræve omhyggelig annotering og fjernelse af degenererede funktioner.

Afslutningsvis giver de værktøjer, der præsenteres her, et levedygtigt alternativ til videnbaserede vejanalyseværktøjer til fortolkning af metabolomics-data.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingen konkurrerende økonomiske interesser.

Acknowledgments

Dette arbejde blev støttet af NIH 1U01CA235487 bevilling.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biologi udgave 201
CorrelationCalculator og Filigran: Værktøjer til datadrevet netværksanalyse af metabolomicsdata
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter