Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator og Filigree: Verktøy for datadrevet nettverksanalyse av metabolomics-data

Published: November 10, 2023 doi: 10.3791/65512

Summary

Vi presenterer CorrelationCalculator og Filigree, to verktøy for datadrevet nettverkskonstruksjon og analyse av metabolomics-data. CorrelationCalculator støtter bygging av et enkelt interaksjonsnettverk av metabolitter basert på uttrykksdata, mens Filigree tillater å bygge et differensialnettverk, etterfulgt av nettverksklynger og anrikningsanalyse.

Abstract

En betydelig utfordring i analysen av omics-data er å trekke ut handlingsbar biologisk kunnskap. Metabolomics er ikke noe unntak. Det generelle problemet med å relatere endringer i nivåer av individuelle metabolitter til spesifikke biologiske prosesser forsterkes av det store antallet ukjente metabolitter som er tilstede i ikke-målrettede væskekromatografi-massespektrometri (LC-MS) studier. Videre er sekundær metabolisme og lipidmetabolisme dårlig representert i eksisterende banedatabaser. For å overvinne disse begrensningene har vår gruppe utviklet flere verktøy for datadrevet nettverkskonstruksjon og analyse. Disse inkluderer CorrelationCalculator og Filigree. Begge verktøyene tillater brukere å bygge partielle korrelasjonsbaserte nettverk fra eksperimentelle metabolomics-data når antall metabolitter overstiger antall prøver. CorrelationCalculator støtter bygging av et enkelt nettverk, mens Filigree gjør det mulig å bygge et differensialnettverk ved hjelp av data fra to grupper av prøver, etterfulgt av nettverksklynger og berikelsesanalyse. Vi vil beskrive nytten og anvendelsen av begge verktøyene for analyse av virkelige metabolomics-data.

Introduction

I det siste tiåret har metabolomikk dukket opp som en omics-vitenskap på grunn av fremskritt innen analytiske teknologier som gasskromatografi-massespektrometri (GC-MS) og væskekromatografi-massespektrometri (LC-MS). Disse teknikkene tillater samtidig måling av hundrevis til tusenvis av småmolekylære metabolitter, og skaper komplekse flerdimensjonale datasett. Metabolomics eksperimenter kan utføres i målrettede eller ikke-målrettede moduser. Målrettede metabolomics-eksperimenter måler spesifikke klasser av metabolitter. De er vanligvis hypotesedrevet, mens ikke-målrettede tilnærminger forsøker å måle så mange metabolitter som mulig og er hypotesegenererende i naturen. Målrettede analyser inkluderer vanligvis interne standarder og tillater dermed absolutt kvantifisering av metabolitter av interesse. I motsetning til dette tillater ikke-målrettede analyser relativ kvantifisering og inkluderer mange ukjente metabolitter1.

Analyse av metabolomics data er en multi-trinns prosess som utnytter mange spesialiserte programvareverktøy1. Det kan deles inn i følgende tre hovedtrinn: (1) databehandling og kvalitetskontroll, (2) statistisk analyse og (3) tolkning av biologiske data. Verktøyene beskrevet her er utformet for å muliggjøre det siste trinnet i analysen.

En intuitiv og populær måte å tolke metabolomics-data på er å kartlegge eksperimentelle målinger på metabolske veier. Tallrike verktøy er designet for å oppnå denne 2,3,4,5, inkludert Metscape, utviklet av vår gruppe6. Trasékartlegging kombineres ofte med berikelsesanalyse, som bidrar til å identifisere de viktigste veiene 7,8. Disse teknikkene ble først fremtredende i analysen av genuttrykksdata og har blitt brukt til analyse av proteomikk og epigenomikkdata 9,10,11,12,13. Analysen av metabolomics-data gir imidlertid en rekke utfordringer for kunnskapsbaserte tilnærminger. For det første, i tillegg til de endogene metabolittene, måler metabolomics-analyser eksogene forbindelser, inkludert de som kommer fra ernæring og andre miljøkilder. Disse forbindelsene, så vel som metabolitter produsert av bakterier, kan ikke kartlegges på menneskelige eller metabolske veier til andre eukaryote organismer. Videre tillater trasédekning av sekundær metabolisme og lipidmetabolisme for tiden ikke høyoppløselig kartlegging på det nivået som lett vil støtte den biologiske tolkningen av dataene14,15.

Datadrevne nettverksanalyseteknikker kan bidra til å overvinne disse utfordringene. For eksempel kan korrelasjonsbaserte nettverk bidra til å utlede relasjoner mellom både kjente og ukjente metabolitter og lette annotasjonen av de ukjente16. Mens beregning av Pearsons korrelasjonskoeffisienter er den enkleste tilnærmingen til å etablere de lineære forholdene mellom metabolitter, er ulempen at den fanger opp både direkte og indirekte assosiasjoner17,18,19. Et alternativ er å beregne partielle korrelasjonskoeffisienter som kan skille mellom direkte og indirekte sammenhenger. Gaussisk grafisk modellering (GGM) kan brukes til å estimere partielle korrelasjonsnettverk. GGM krever imidlertid at utvalgsstørrelsen og antall funksjoner er sammenlignbare. Denne tilstanden er sjelden oppfylt i ikke-målrettede LC-MS-data som inneholder målinger for tusenvis av metabolske egenskaper. Regulariseringsteknikker kan benyttes for å overvinne denne begrensningen. Grafisk lasso (Glasso) og nodevis regresjon er populære metoder for regularisert estimering av det partielle korrelasjonsnettverket16,20.

Det første av bioinformatikkverktøyene som presenteres her, CorrelationCalculator16, er basert på den debiased sparse partial correlation (DSPC) algoritmen. DSPC er avhengig av de-sparsifisert grafisk lassomodellering. Den underliggende antagelsen i algoritmen er at antall forbindelser mellom metabolittene er betydelig mindre enn antall prøver, dvs. det partielle korrelasjonsnettverket av metabolitter er sparsomt. Denne antagelsen gjør det mulig for DSPC å oppdage sammenhengen mellom et stort antall metabolitter ved å bruke færre prøver, ved å utnytte regulariserte regresjonsteknikker. Videre, ved å bruke et debiasing-trinn for de regulariserte regresjonsestimatene, oppnår den prøvefordelinger for kantparametrene som kan brukes til å konstruere konfidensintervaller og teste hypoteser av interesse (f.eks. tilstedeværelse / fravær av en enkelt eller en gruppe kanter). Tilstedeværelsen eller fraværet av et fortrinn i det partielle korrelasjonsnettverket kan dermed formelt testes ved hjelp av de beregnede p-verdiene.

CorrelationCalculator viste seg å være svært nyttig for enkeltgruppeanalyse16; Målet med mange metabolomics-eksperimenter er imidlertid differensialanalysen av to eller flere forhold. Mens CorrelationCalculator kan brukes på hver av gruppene separat for å generere delvise korrelasjonsnettverk for hver tilstand, begrenser denne tilnærmingen antall prøver som kan brukes til nettverksgenerering. Siden en tilstrekkelig stor utvalgsstørrelse er en av de største hensynene i datadrevet analyse, er metoder som kan utnytte alle tilgjengelige prøver i dataene for å konstruere nettverk, svært ønskelige. Denne tilnærmingen er implementert i det andre verktøyet som presenteres her, kalt Filigree21. Filigree er avhengig av den tidligere publiserte Differential Network Enrichment Analysis (DNEA) algoritmen22. Tabell 1 viser programmene og arbeidsflyten til begge verktøyene.

Antall eksperimentelle betingelser (k) k = 1 k = 2
Programvare verktøy Korrelasjonskalkulator Filigran
Inndata • Metabolitter x Prøver datamatrise • Metabolitter x Prøver datamatrise
• Eksperimentelle grupper
Arbeidsflyt
• Forbehandling
• Estimering av nettverk
• Nettverksklynger
• Berikelse analyse

• Logg transformasjon; Autoskalering
• DSPC
• Via eksterne apper
•Nei

• Logg transformasjon; Autoskalering
• Estimering av felles nettverk
• Konsensus clustering
• NetGSA
Datavisualisering Via ekstern app, f.eks. Via ekstern app, f.eks.
Testing av metabolske moduler for assosiasjon med utfall av interesse (valgfritt) Via eksterne apper Via eksterne apper

Tabell 1: Anvendelsesområdet og arbeidsflyten til CorrelationCalculator og Filigree.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Korrelasjonskalkulator

  1. Last ned et eksempel på kommadelt inndatafil som inneholder en liste over metabolitter med eksperimentelle målinger på http://metscape.med.umich.edu/kora_data_240.csv.
  2. Dobbeltklikk på den nedlastede eksempelfilen for å åpne den.
    1. Kontroller at filen inneholder etiketter for både prøvene og metabolittene.
    2. Siden prøvene er i rader, må du bekrefte at den første kolonnen er prøvenavnene og den første raden er metabolittnavnene.
  3. Last ned CorrelationCalculator Java-applikasjonen (http://metscape.med.umich.edu/calculator.html). Dobbeltklikk på den nedlastede .jar filen for å starte programmet.
  4. I kategorien Input klikker du på Bla gjennom-knappen for å laste opp inndatafilen.
  5. Under Specify File Format, bruk rullegardinpilen for å velge riktig inndatafilformat. Velg Eksempler i rader (tilleggsfigur 1).
  6. Gå til Datanormalisering-fanen ved å klikke på Neste >> -knappen nederst til høyre i vinduet.
  7. Under Velg metode(r) merker du av i boksen ved siden av Log2-Transform Data. Merk av i boksen ved siden av Autoskalering av data.
  8. Under Normaliser data klikker du Kjør-knappen .
    MERK: Når normaliseringen er fullført, klikker du på Vis normaliserte data-knappen, som ligger under Normaliser data, og ser gjennom det oppdaterte datasettet (tilleggsfigur 2).
  9. Under Normaliser data klikker du Lagre-knappen og lagrer den nye datafilen.
  10. Gå til Dataanalyse-fanen ved å klikke på Neste >> -knappen nederst til høyre i vinduet.
  11. Under Beregn Pearsons korrelasjon klikker du Kjør. Bestem det beste Pearsons korrelasjonsområde for dataene.
    1. Klikk på Vis histogram-knappen . Se gjennom frekvensen for de maksimale Pearsons korrelasjonspoengsummene per funksjon.
    2. Klikk på Vis varmekart-knappen . Se gjennom fremstillingen av Pearsons korrelasjonsmatrise.
  12. Under Filtrer etter Pearsons korrelasjoner lar du standardtallene filtrere med et område fra 0,00 til 1,00
    MERK: Skyv den lille blå pilen i høyre ende fra 1 og den lille blå pilen til venstre fra 0 for å endre filteret. Å skrive inn bestemte tall i tekstboksene er også et alternativ.
  13. Under Velg delvis korrelasjonsmetode velger du ønsket metode, DSPC-metode.
    MERK: Hvis antallet metabolitter er mindre enn antall prøver i datasettet, kan bare DSPC-metoden brukes.
  14. Under Beregn partielle korrelasjoner klikker du Kjør-knappen (tilleggsfigur 3).
  15. Klikk på Vis CSV-fil og se resultatene. Klikk på Lagre-knappen og lagre resultatene.
  16. Klikk på Vis i MetScape-knappen for å starte et interaktivt korrelasjonsnettverk.
    Se Karnovsky, A. et al.6 for mer informasjon om bruk av MetScape.
    MERK: MetScape er et Cytoscape-program som gjør det mulig å opprette og utforske korrelasjonsnettverk.

2. Filigran

  1. Last ned et eksempel på kommadelt inndatafil som inneholder metabolittmålinger ved http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Dobbeltklikk på den nedlastede eksempelfilen for å åpne den.
    1. Kontroller at filen inneholder eksempelnavn i kolonne 1 og gruppetilordninger i kolonne 2. Bekreft at de resterende kolonnene inneholder metabolitter/lipider.
    2. Kontroller at hver rad representerer et utvalg.
      MERK: Metabolittmålingene skal loggtransformeres og skaleres automatisk med mindre funksjonsaggregering utføres, i så fall skal målingene bare loggtransformeres.
  3. Last ned Filigree Java-applikasjonen (http://metscape.med.umich.edu/filigree.html).
    MERK: En detaljert brukerhåndbok er tilgjengelig på http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Dobbeltklikk på den nedlastede .jar filen for å starte programmet.
  5. I kategorien Data klikker du på Bla gjennom-knappen for å laste opp inndatafilen.
  6. Under Specify Columns/Rows klikker du på rullegardinpilen ved siden av Sample ID for å velge det tilsvarende kolonne-/radnavnet fra inndatafilen. Velg Eksempel.
  7. Under Spesifiser kolonner / rader klikker du på rullegardinpilen ved siden av "Gruppe" for å velge den tilsvarende kolonnen / raden fra inndatafilen. Velg Gruppe.
  8. Under Specify Sample Groups, klikk på rullegardinpilene ved siden av hver gruppe for å velge den tilsvarende gruppekolonnen fra inndatafilen. For gruppe 1 velger du Diabetiker. For gruppe 2 velger du Ikke-diabetiker.
  9. Under Funksjonsgruppering merker du av i boksen ved siden av den ønskede metoden, Beregn funksjonsgrupper.
  10. Klikk på Vis varmekart-knappen . Se varmekartet og bestem en ønsket prosentreduksjon.
  11. Bruk glidebryteren Funksjonsreduksjon til å velge ønsket prosentvis reduksjon av funksjoner. Skyv den lille sirkelen til prosentreduksjonen viser et funksjons-til-utvalg-forhold på 1,25 (tilleggsfigur 4).
  12. Gå til kategorien Analyse ved å klikke på Neste >> -knappen nederst til høyre i vinduet.
  13. Under Velg utdatakatalog klikker du på Bla gjennom-knappen og velger ønsket katalogplassering for lagring av de genererte utdatafilene.
  14. Klikk på Kjør analyse-knappen nederst til venstre i vinduet. Fremdriftslinjene oppdateres for hver analysekomponent (tilleggsfigur 5). Klikk på OK knappen i popup-vinduet som viser meldingen Analysen er fullført.
  15. I kategorien Analyse klikker du på Bla gjennom nettverk-knappen for å åpne de interaktive filigran-delnettverkene i en nettleserfane.
  16. Klikk på koblingen Subnetwork 1 under kolonnen Subnetwork Name .
  17. Utforsk det interaktive delnettverket ved hjelp av de forskjellige knappene. Klikk på + -knappen og zoom inn på den delen av nettverket. Klikk på --knappen og zoom ut (tilleggsfigur 6).
  18. Klikk på en gruppenode og dra den for å flytte den i delnettverket.
    MERK: Nodefarge representerer opp/ned-regulering, og fargeopasitet representerer høyere/lavere foldeendring. Kantfargen representerer differensialstatusen mellom grupper.
  19. Klikk på Utvid funksjoner-knappen øverst til høyre på siden for å utvide alle gruppenodene. Se gjennom de spesifikke forbindelsene som utgjør gruppenodene.
  20. Klikk knappen Skjul funksjoner øverst til høyre på siden for å skjule de nylig utvidede gruppenodene.
  21. Klikk knappen Etter eksempelgruppe øverst til høyre på siden for å endre visningen fra ett enkelt delnettverk til flere undernettverk delt av en gruppe. Utforsk og sammenlign gruppene ved hjelp av denne visningen av undernettverkene (tilleggsfigur 7).
  22. Klikk Alle eksempler-knappen for å gå tilbake til visningen for ett enkelt delnettverk.
  23. Vis neste delnettverk ved å klikke på Neste-knappen øverst til høyre på siden.
  24. Gjenta trinn 2.19–2.23 for hvert delnettverk.
  25. Klikk koblingen Differential Network Enrichment Analysis Results øverst i midten av vinduet for å gå tilbake til sammendragstabellvisningen som viser alle undernettverkene.
    MERK: Importer kant- og/eller nodeutdatafilene i et annet programvareverktøy, for eksempel Cytoscape23, for å opprette flere nettverksvisualiseringer.

3. Ytterligere hensyn

  1. For Mac-maskiner som kjører Big Sur (OSX 11.2) eller nyere, godkjenner du verktøyet i Apple-menyen > Systemvalg > Sikkerhet og personvern > Generelt og velger Tillat nederst i fanen.
  2. I tillegg gir du Filigree tilgang til filene i Apple-menyen > Systemvalg > Sikkerhet og personvern > personvern ved å velge Filer og mapper i menyen til venstre og deretter velge Filigree i menyen til høyre.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

For å illustrere bruken av CorrelationCalculator konstruerte vi et partielt korrelasjonsnettverk ved hjelp av en delmengde av metabolomics-dataene fra KORA-populasjonsstudien beskrevet i Krumsiek et al.24. Datasettet inneholdt 151 metabolitter og 240 prøver. Figur 1 viser det resulterende partielle korrelasjonsnettverket som ble visualisert i Cytoscape. Nettverket inneholder 148 noder og 272 kanter. Fargen på nodene representerer metabolitter som tilhører forskjellige kjemiske klasser, mens kantene representerer den justerte p-verdien av de partielle korrelasjonskoeffisientene (justert p-verdi < 0, 05) . Spesielt, til tross for ikke å bruke noen tidligere informasjon CorrelationCalculator var i stand til å gruppere sammen kjemisk relaterte metabolitter. For eksempel er fosfatidylkoliner og lysofosfatidylkoliner nært forbundet i nettverket. Visualisering av metabolittendringer i sammenheng med denne typen nettverk kan lette hypotesegenerering, bidra til å planlegge fremtidige eksperimenter og muliggjøre manuskriptforberedelse. For å illustrere en potensiell arbeidsflyt ved hjelp av et delvis korrelasjonsmetabolittnettverk, utførte vi konsensusnettverksklynger som beskrevet i Ma et al.22, noe som resulterte i identifisering av 9 undernettverk eller metabolske moduler. Disse modulene hadde en god overensstemmelse med de kjemiske klassene, dvs. metabolitter som tilhører samme kjemiske klasse hadde en tendens til å være en del av den samme metabolske modulen. Brukeren kan få tilgang til clustering tool clusterNet på https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Figur 1: Representativt eksempel på et korrelasjonskalkulatornettverk. Nettverket ble konstruert fra en undergruppe av KORA-populasjonsstudien metabolomics data24 bestående av 151 metabolitter på tvers av 240 personer. Nodene representerer metabolitter, og kantene som forbinder dem vektes med den justerte p-verdien av partielle korrelasjonskoeffisienter (justert p-verdi < 0,05). Formen på nodene representerer forskjellige metabolske klasser, og fargen representerer metabolske moduler oppnådd ved å klynge nettverket ved hjelp av konsensusklyngemetoden. Klikk her for å se en større versjon av denne figuren.

Vi illustrerer anvendelsen av filigran ved å analysere et datasett fra en musemodell av type I diabetes (T1D)25,26. Plasmametabolittmålinger fra T1D og ikke-diabetiske (NOD) mus ble brukt til å generere et differensialpartielt korrelasjonsnettverk (figur 2). Spesielt observerer vi en høyere grad av nettverkstilkobling i ikke-diabetesgruppen. De neste trinnene i analysen identifiserte tolv metabolske moduler, hvorav ni var signifikant forskjellige mellom T1D og ikke-diabetiske mus (FDR < 0,05). Vi henviser leseren til den opprinnelige publikasjonen for ytterligere innsikt i biologiske konklusjoner som kan trekkes fra denne analysen21.

Figure 2
Figur 2: Representativt eksempel på et filigransnettverk. Differensialnettverket ble konstruert ved å utnytte nivåene av 163 metabolitter fra 71 mus (30 T1D og 41 ikke-T1D)25,26. Differensialkanter mellom T1D- og ikke-T1D-grupper er angitt i henholdsvis rosa og blått. Nodene er farget basert på brettendringen. Tabellen viser anrikningsresultatene produsert av filigran. Ni av de tolv identifiserte undernettverkene var signifikant forskjellig mellom T1D og ikke-T1D (justert p-verdi < 0,05). Klikk her for å se en større versjon av denne figuren.

Tilleggsfigur 1: CorrCalc_InputTab. Skjermbilde av kategorien Inndata i Korrelasjonskalkulator. Klikk her for å laste ned denne filen.

Tilleggsfigur 2: CorrCalc_DataNormTab. Skjermbilde av kategorien Datanormalisering i Korrelasjonskalkulator. Log-2 Transformer data og Autoskaleringsdata kontrolleres. Klikk her for å laste ned denne filen.

Tilleggsfigur 3: CorrCalc_DataAnalTab. Skjermbilde av kategorien Dataanalyse i Korrelasjonskalkulator som viser filtrering til Pearsons korrelasjon på 0–0,8. I tillegg er DSPC-metoden valgt. Klikk her for å laste ned denne filen.

Tilleggsfigur 4: Filigree_DataTab. Skjermbilde av Filigrees Data-fane . Kolonner, rader og grupper er angitt. Beregn funksjonsgrupper-metoden er valgt med en funksjonsreduksjon på 1,25 funksjons-til-utvalg-forhold. Klikk her for å laste ned denne filen.

Tilleggsfigur 5: Filigree_AnalysisTab. Skjermbilde av Filigrees Analyse-fane som viser fremdriften for de ulike analysekomponentene. Klikk her for å laste ned denne filen.

Tilleggsfigur 6: Filigree_Subnetwork1. Et undernettverk generert fra Filigree. Nodefarge representerer opp/ned-regulering, og fargetetthet representerer høyere/lavere foldeendring. Kantfargen representerer differensialstatusen mellom grupper. Klikk her for å laste ned denne filen.

Tilleggsfigur 7: Filigree_Subnetwork_SampleGroup. Undernettverk atskilt etter gruppe. Det venstre nettverket representerer diabetesprøver, og det høyre nettverket representerer ikke-diabetiske prøver. Nodefarge representerer uttrykksnivå proporsjonalt med gruppens gjennomsnitt. Klikk her for å laste ned denne filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Partielle korrelasjonsbaserte nettverksanalysemetoder implementert i CorrelationCalculator og Filigree bidrar til å overvinne noen av begrensningene i kunnskapsbaserte metabolske veianalyser, spesielt for datasettene med høy prevalens av ukjente metabolitter og begrenset dekning av metabolske veier (f.eks. lipidomikkdata). Disse verktøyene har blitt mye brukt av forskningsmiljøet for å analysere et bredt spekter av metabolomics og lipidomics data 14,22,27,28,29,30. For eksempel har CorrelationCalculator blitt brukt til å analysere dataene fra mange biologiske systemer som spenner fra mikrobiom og planter til menneskelig sykdom31,32,33,34. Her illustrerer vi hvordan datadrevet nettverksanalyse, muliggjort av våre verktøy, kan kombineres med klynge- og regresjonsanalyse for å finne de metabolske modulene assosiert med fenotypen av interesse.

Delvise korrelasjonsnettverk generert ved hjelp av CorrelationCalculator og Filigree kan grupperes ved hjelp av grafklyngealgoritmer for å produsere metabolske moduler. Disse modulene har en tendens til å omfatte metabolitter som er kjemisk eller funksjonelt beslektet med hverandre. Slike moduler er svært nyttige, ikke bare fra et visualiseringsperspektiv, men også fra et biologisk relevanssynspunkt. Å studere forholdet mellom metabolske moduler og fenotypiske utfall av interesse (f.eks. overlevelsesutfall) kan gi mer statistisk kraft og generere ytterligere biologisk innsikt sammenlignet med testing av individuelle metabolitter.

Metabolske moduler identifisert gjennom nettverksklyngetilnærminger kan også brukes i anrikningsanalyse. Filigree bruker metabolske moduler identifisert gjennom konsensusklynger i stedet for forhåndsdefinerte biologiske veier. Selv om partielle korrelasjonsbaserte metabolske moduler ikke er identiske med veier, grupperer de konsekvent kjemisk og biokjemisk lignende metabolitter (f.eks. aminosyrer, acylcarnitiner, lipider av samme klasse, etc.). Filigree tester videre betydningen av disse modulene ved hjelp av NetGSA-algoritme22,35. I tillegg til differensialnoder står NetGSA for sykdomsspesifikke forskjeller i nettverksstruktur.

Et av problemene å vurdere når du bruker CorrelationCalculator og Filigree for analyse av "virkelige liv" metabolomics og lipidomics data er forholdet mellom antall metabolitter vs antall prøver i et gitt eksperiment. Mens store epidemiologiske studier som involverer tusenvis av prøver blir vanligere, er prøvestørrelsen i de fleste metabolomics-eksperimenter fortsatt beskjeden. Dette gjelder spesielt for mekanistiske studier som involverer systemer der lav biologisk variasjon forventes (dvs. cellelinjer eller genetisk homogene dyremodeller). De statistiske algoritmene implementert i begge verktøyene kan brukes i situasjoner når antall metabolitter overstiger antall prøver, men økningen i dette forholdet fører til mer sparsomme nettverk.

Et annet viktig hensyn for anvendelsen av verktøyene beskrevet her gjelder analyse av ikke-målrettede metabolomikkdata som er kjent for å inneholde et stort antall overflødige eller degenererte egenskaper36, som kan omfatte isotoper, kjemiske addukter, fragmenter i kilden og forurensninger. Siden mange degenererte egenskaper stammer fra samme metabolitt, har de en tendens til å ha en høy grad av korrelasjon. Delvis korrelasjonsbasert analyse av slike data kan kreve nøye merknader og fjerning av degenererte funksjoner.

Avslutningsvis gir verktøyene som presenteres her et levedyktig alternativ til kunnskapsbaserte analyseverktøy for tolkning av metabolomics-data.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingen konkurrerende økonomiske interesser.

Acknowledgments

Dette arbeidet ble støttet av NIH 1U01CA235487 stipend.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biologi utgave 201
CorrelationCalculator og Filigree: Verktøy for datadrevet nettverksanalyse av metabolomics-data
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter