Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization

Mustafa Bulut; Alisdair R. Fernie; Saleh Alseekh

doi:10.3791/62732

JoVE Journal > Biochemistry

Biochemistry

Store multiomikk Genom-brede foreningsstudier (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Published: July 27, 2021

doi:

10.3791/62732

Mustafa Bulut, Alisdair R. Fernie², Saleh Alseekh²

¹Max-Planck-Institute of Molecular Plant Physiology, ²Center of Plant Systems Biology and Biotechnology

Summary

I denne protokollen presenterer vi en optimalisert arbeidsflyt, som kombinerer en effektiv og rask prøvepreparering av mange prøver. I tillegg gir vi en trinnvis veiledning for å redusere analytiske variasjoner for evaluering av høy gjennomstrømning av metabolske GWAS-studier.

Abstract

Både gasskromatografi-massespektrometri (GC-MS) og flytende kromatografi-massespektrometri (LC-MS) er mye brukt metabolomics tilnærminger for å oppdage og kvantifisere hundretusener av metabolittfunksjoner. Anvendelsen av disse teknikkene på et stort antall prøver er imidlertid gjenstand for mer komplekse interaksjoner, spesielt for genom-brede assosiasjonsstudier (GWAS). Denne protokollen beskriver en optimalisert metabolsk arbeidsflyt, som kombinerer en effektiv og rask prøvepreparering med analyse av et stort antall prøver for belgfrukter. Denne litt modifiserte ekstraksjonsmetoden ble opprinnelig utviklet for analyse av plante- og dyrevev og er basert på utvinning i metyl tert-butyl eter: metanolløsningsmiddel for å tillate fangst av polare og lipidmetabolitter. I tillegg gir vi en trinnvis veiledning for å redusere analytiske variasjoner, som er avgjørende for den høye gjennomstrømningsevalueringen av metabolsk varians i GWAS.

Introduction

Store “omics” tilnærminger har gjort det mulig å analysere komplekse biologiske systemer ^1,2,3 og videre forståelse av sammenhengen mellom genotyper og de resulterende fenotypene⁴. Metabolomics ved hjelp av ultra-høy ytelse flytende kromatografi-masse spektrometri (UHPLC-MS) og GC-MS aktivert påvisning av en mengde metabolittiske funksjoner, hvorav bare noen er kommentert til en viss grad, noe som resulterer i en høy andel av ukjente metabolitter. Komplekse interaksjoner kan utforskes ved å kombinere storskala metabolomikk med den underliggende genotypiske variasjonen av en mangfoldig populasjon⁵. Håndtering av store prøvesett er imidlertid iboende forbundet med analytiske variasjoner, noe som forvrenger evalueringen av metabolsk varians for lenger nedstrømsprosesser. Spesielt er store problemstillinger som fører til analytiske variasjoner basert på maskinytelse og instrumentell drift over tid⁶. Integreringen av parti-til-parti-variasjon er utfordrende og spesielt problematisk ved analyse av store strukturerte plantepopulasjoner. Flere normaliseringsprosedyrer ble foreslått å korrigere for ikke-biologiske variasjoner, for eksempel bruk av interne, eksterne og isotopmerkede interne standarder for å korrigere for analytiske feil, hvorav hver er iboende forbundet med kjente problemer og fallgruver 7,8,9,10.

I tillegg til analytisk variasjon varierer valget av utvinningsprotokoller generelt avhengig av analysemetoden. Til syvende og sist er det ønskelig å redusere material- og arbeidskostnader, samt nødvendigheten av å bruke flere aliquots av samme prøve for ulike analytiske prosesser ved å utføre faseseparasjonsbaserte ekstraksjonsmetoder. Disse metodene ble først introdusert ved hjelp av kloroform: metanol / vannløsemidler for å fraksjonere polare og hydrofobe forbindelser¹¹.

Denne protokollen beskriver en rask rørledning med høy gjennomstrømning for en multi-omics plattform for å profilere både polare metabolitter og lipider i belgfruktarter. Videre viser den hvordan disse datasettene kan korrigeres riktig for analytisk variasjon og normaliseres før de integrerer genotypisk informasjon for å oppdage metabolitt kvantitativ egenskap loci (QTL) ved å utføre GWAS.

Protocol

1. Eksperimentell design og plantedyrking MERK: Sett opp eksperimentet avhengig av eksperimentell hypotese, for eksempel ved hjelp av en storskala GWAS-populasjon reduserer nødvendigheten av flere replikeringer, da statistisk testing vil bli utført basert på haplotypene til alle de enkelte SNPene i stedet for tiltredelsen. I motsetning til dette er flere replikeringer uunnværlige i andre eksperimentelle tilnærminger. Følgende punkter må vurderes mens du forbereder eksperimentet. Inkluder nok biologiske repliker, avhengig av eksperimentell hypotese. Tilfeldiggjøre det biologiske replikerer blokkmessig for å redusere lokale miljøskjevheter under dyrking, for eksempel drivhus, felt. Sørg for riktig vedlikehold av anlegget under vekst. Behandle planter homogent for å redusere skjevheter. 2. Fremstilling av biologisk plantemateriale Høst forberedelse Etiketthøstingsrør (20 ml) som inneholder to metallperler med 5 mm og to metallperler med 8 mm diameter for homogenisering. Fyll opp en dewar med flytende nitrogen.MERK: Planter bør være i vegetativt stadium for fersk blad- og rotvevshøsting. Høst biologiske prøver ved flash-frysing i flytende nitrogen. Høst så raskt som mulig for å utelukke påvirkning av circadian oscillasjon på metabolisme under langvarig høstingvarigheter 12,13. Oppbevar høstet ferskblad og rotvev for videre behandling ved -80 °C.MERK: Bladskjæring til blitsfrysing bør ikke ta lengre tid enn noen få sekunder, da etter bladspalting vil aktive biologiske prosesser endre metabolske profiler på grunn av sår. For røtter, preclean røttene ved å vaske med vann før flash-frysing i flytende nitrogen. Overflødig vann på rotoverflaten skal være gjennomvåt med papirvev. Tørkede frø kan lagres ved romtemperatur; ingen frysing i flytende nitrogen er nødvendig. Grind vevet ved hjelp av en vevsblandermølle. Forkjøl rørholderne i flytende nitrogen i et par minutter for å opprettholde en lav temperatur mens du sliper vevet. Transporter de biologiske prøvene i en nitrogenholdig dewar etter å ha tatt dem ut fra -80 °C fryseren. Grind vevet for å oppnå homogent pulver; bruk 25 Hz i 1 min og gjenta etter frysing i flytende nitrogen hvis vevet ikke er homogent malt. For sliping av tørkede frø, legg frøene i en slipeburk med en metallperle med en diameter på 15 mm. Bruk samme frekvens og klokkeslett som nevnt i 2.3.3.MERK: Rene og ferdigkjølte mørtel og pestles kan brukes hvis en vevsblandermølle ikke er tilgjengelig. Precool merket 2 ml mikrosentrifugerør med sikker lås. Vei 50 mg med en feil på ±5 mg ferskt plantemateriale ved hjelp av en analytisk skala. Forkjøl verktøyene som brukes til overføring av plantemateriale i flytende nitrogen. Sørg for at plantematerialet forblir frosset under veieprosessen.MERK: Ikke utsett ferskt plantemateriale for lenge til romtemperatur, da biologiske prosesser aktiveres ved å øke temperaturen, og endre metabolske profiler14. Generer ekstra kvalitetskontrollprøver (QC) ved å samle en andel av hver prøve og veie 50 mg med en feil på ±5 mg samlet ferskt plantemateriale i forhåndskjølte 2 ml mikrosentrasjerør.MERK: Minst tre QC-prøver anbefales for hver 60. QC-prøvene er avgjørende for nedstrømskorreksjon, normalisering og analyser. 3. Ekstraksjonsreagenser Friskt vev, f.eks.MERK: Prøveuttrekking er basert på en tidligere beskrevet protokoll15. Denne protokollen er endret basert på nåværende behov, for eksempel flere vev, forskjellige interne standarder og store eksperimenter. I tillegg er alle volumer og instrumentinnstillinger nevnt nedenfor justert til interne analytiske enheter. Protokollbrukere bør justere disse i henhold til deres analytiske enhet og biologiske prøver, basert på testprøver. Ekstraksjonsblanding 1 (EM1): metyl tert-butyl eter (MTBE)/metanol (MeOH) (3:1 v/v) Forbered en blanding av MTBE/MeOH i et 3:1-forhold. For 100 ml ekstraksjonsløsningsmiddel blander du 75 ml MTBE med 25 ml MeOH i en ren glassflaske.MERK: Løsemidler bør håndteres forsiktig i avtrekkshetten med riktig sikkerhetsutstyr. Tilsett 45 μL 1,2-diheptadecanoyl-sn-glysero-3-fosfocholin (1 mg/ml i kloroform) som en intern standard for DEN UHPLC-MS-baserte lipidanalysen, 400 μL ribitol (1 mg/ml i vann) som intern standard for GC-MS-basert analyse, og 125 μL isovittxin (1 mg/ml i MeOH/vann (1:1 v/v)) for UHPLC-MS-basert metabolittanalyse.MERK: Tilsetning av interne standarder er nødvendig for normalisering etter analyse i henhold til analytiske behov. Siden 1 ml EM1 er nødvendig for hver prøve, kan du lage en lagerløsning i henhold til den eksperimentelle prøvestørrelsen, som skal brukes til hele eksperimentet. EM1 må oppbevares ved -20 °C. Kontroller fraværet av den brukte interne standarden og overlappende med andre forbindelser i de undersøkte artene. Flere standarder kan brukes; valget av interne standarder i denne protokollen var basert på tidligere tester ved hjelp av vanlige bønneekstrakter16. Ekstraksjonsblanding 2 (EM2) vann/metanol (MeOH) (3:1 v/v) For 100 ml EM2, tilsett 75 ml dobbeltdestillert vann og 25 ml MeOH i en ren glassflaske. Tilsett 500 μL EM2 per prøve, og lag en lagerløsning i henhold til den eksperimentelle prøvestørrelsen, som skal brukes til hele eksperimentet. Oppbevar EM2 ved 4 °C. Tørkede frø Ekstraksjonsblanding 3 (EM3) metanol (MeOH)/ vann (7:3 v/v) For 100 ml EM3, tilsett 70 ml MeOH og 30 ml dobbeltdestillert vann i en ren glassflaske. Forbered 1 ml EM3 for hver prøve. Tilsett 400 μL ribitol (1 mg/ml i vann) som interne standarder for GC-MS-basert analyse og 125 μL Isovitexin (1 mg/ml i MeOH/vann (1:1 v/v)) for UHPLC-MS-basert metabolittanalyse.MERK: Forbered en lagerløsning i henhold til den eksperimentelle prøvestørrelsen og bruk den til hele eksperimentet. Oppbevar EM3 ved 4 °C. 4. Prøveuttrekking Friskt vev, f.eks. Forbered tre 1,5 ml mikrosenterrør med sikker lås for hver prøve. Oppbevar EM1 i et væskekjølesystem på -20 °C. Overfør de ferske prøvene fra -80 °C fryseren til tørris eller flytende nitrogen for transport. Tilsett 1 ml ferdigkjølt EM1 til hver 50 mg aliquot og virvel kort før du holder på is. Inkuber prøvene på en orbital shaker ved 800 × g i 10 min ved 4 °C. Soniker prøvene i et iskjølt sonikeringsbad i 10 min. Tilsett 500 μL EM2 ved hjelp av en flerkanals pipette for å unngå variasjon i ekstra volumer. Virvel prøvene kort for å blande ekstraksjonsblandingene før sentrifugering ved 11.200 × g i 5 min ved 4 °C. Etter faseseparasjon oppstår, overfør 500 μL av den øvre lipidholdige fasen til et forhåndsmerket 1,5 ml sikkerlås mikrosenterrør. Fjern resten av den øvre fasen.MERK: Vær forsiktig når du overfører, da denne øvre fasen har et høyt damptrykk og har en tendens til å lekke ut fra pipetten. Overfør 150 μL og 300 μL av de nedre polare og semi-polare metabolittholdige fasene i to 1,5 ml sikkerlås mikrocentrifugerør som brukes til henholdsvis GC-MS- og UHPLC-MS-analyse. Konsentrer alle ekstraherte fraksjoner ved å la løsningsmidlene fordampe uten oppvarming ved hjelp av en vakuumkonsentrator og lagre ved -80 °C. Tørkede frø Forbered to 1,5 ml mikrosenterrør med sikker lås for hver prøve. Hold EM3 på is. Plasser en metallperle med en diameter på 5 mm i prøven aliquots. Tilsett 1 ml EM3 i hver 50 mg aliquot og homogeniser prøvene ved 25 Hz i 2-3 minutter før du legger dem på is. Soniker prøvene i et iskjølt sonikeringsbad i 10 min. Virvel prøvene kort før sentrifugering ved 11.200 × g i 5 min ved 4 °C. Overfør 150 μL og 300 μL av supernatanten i to 1,5 ml sikkerlås mikrosentrifugerør som brukes til henholdsvis GC-MS- og UHPLC-MS-analyse. Konsentrer alle ekstraherte fraksjoner ved å la løsningsmidlene fordampe uten oppvarming ved hjelp av en vakuumkonsentrator og oppbevar ved -80 °C.MERK: Basert på erfaring anbefales brukere å utføre trinn 4.2 for halvpolede metabolitter og avledede metabolittanalyser i tørkede frø. Utfør ekstraksjon trinn 4.1 for tørket frø lipid analyse. 5. Analyse av lipider ved bruk av UHPLC-MS Re-suspendere de tørkede lipidfraksjonene i 250 μL acetonitril:2-propanol (7:3, vol/vol). Soniker lipidfasen i 5 min, sentrifuge ved 11.200 × g i 1 min. Overfør 90 μL av supernatanten til et hetteglass med glass for LC-MS. Injiser 2 μL av ekstraktene i LC-MS. Utfør lipidfraksjonering på en omvendt fase C8 søyle holdt ved 60 °C løping med en strøm på 400 μL/min med gradvise endringer av eluent A og B som vist i tabell 1. Skaff massespektraet i positiv iioniseringsmodus med et masseområde på 150-1500 m / z. Inkluder flere QC-prøver i alle daglige partier og et tomt felt for å sikre korreksjon for analytisk variasjon. Tilfeldiggjør prøver blokkmessig i sekvensiell rekkefølge. 6. Analyse av polare og halvpolede metabolitter ved bruk av UHPLC-MS Re-suspendere den tørkede polarfasen i 180 μL UHPLC-klasse metanol: vann (1:1 v/v). Soniker polarfasen i 2 min, sentrifuge ved 11.200 × g i 1 min. Overfør 90 μL av supernatanten til et hetteglass med glass for LC-MS. Injiser 3 μL av ekstraktene i LC-MS. Utfør metabolittfraksjonering på en omvendt fase C18 søyle holdt ved 40 °C som går med en strøm på 400 μL/min med gradvise endringer av eluent A og B som vist i tabell 1. Skaff massespektraet i et masseområde på 100-1500 m/z i en full MS-skanning og all ionfragmentering (AIF) indusert av høyenergikollisjonell dissosiasjon (HCD) på 40 keV.MERK: Bruk begge iioniseringsmodusene. På grunn av begrenset kapasitet mens du kjører et stort antall prøver, kjører du imidlertid testprøver i begge iioniseringsmodusene for å bestemme den foretrukne iioniseringsmodusen. Inkluder flere QC-prøver i alle daglige partier og et tomt felt for å sikre korreksjon for analytisk variasjon. Tilfeldiggjør prøver blokkmessig i sekvensiell rekkefølge. Kjør en samlet QC i dataavhengig MS2 i både negative og positive iioniseringsmoduser. Bruk det oppnådde massespektraet i et senere trinn (8.5) for merknad. 7. Analyse av avledede metabolitter ved bruk av GC-MS17,18 MERK: Analysen av avledede metabolitter er basert på en tidligere beskrevet protokoll17. Håndter alle avledningsreagenser i avtrekkshetten. Påse at N-metyl-N-(trimetylsilyl)trifluoracetamid (MSTFA) ikke kommer i kontakt med vann og fuktighet. Avledningsreagens 1 (DR1) Løs opp metoksyaminhydroklorid i pyrid for å oppnå en konsentrasjon på 30 mg/ml DR1. Bruk 40 μL DR1 for hver prøve. Forbered en lagerløsning i henhold til prøvestørrelsen, og lagre ved romtemperatur. Avledningsreagens 2 (DR2) Løs opp MSTFA med 20 μL fettsyremetylestere (FAMEs) per 1 ml MSTFA. Bruk 70 μL DR2 for hver prøve. Forbered en lagerløsning i henhold til prøvestørrelsen. Oppbevar MSTFA ved 4 °C og FAMEene ved -20 °C.MERK: FAMEs inkluderer metylcaprylat, metyl pelargonat, metylcaprate, metyllaurat, metylmyristat, metylpalmitat, metylstearate, metyleicosanoat, metyldofosanoat, lignocersyremetylester, metylhexacosanoat, metyloctakosanoat og triakontanoinsyremetylester, som oppløses i CHCl3 i en konsentrasjon på henholdsvis 0,8 μL/ml eller 0,4 mg/ml for flytende eller faste standarder. Tørk pelletsen på nytt fra polarfasen (lagret ved -80 °C) ved hjelp av en vakuumkonsentrator i 30 minutter for å unngå forstyrrelser av H2O som oppstår under lagringen med løsningsmidlene som brukes til nedstrøms avledning. Tilsett 40 μL DR1. Rist prøvene ved 950 × g i 2 timer ved 37 °C ved hjelp av en orbital shaker, etterfulgt av en kort spin-down av væsken. Tilsett 70 μL DR2. Rist igjen ved 950 × g i 30 min ved 37 °C ved hjelp av en orbital shaker. Sentrifuger kort ved romtemperatur før du overfører 90 μL til glassflasker for GC-MS-analyse. Injiser 1 μL i GC-MS splitless-modus, avhengig av metabolittkonsentrasjonene, med en konstant heliumbærergassstrøm på 2 ml / min. Injeksjonstemperaturen er satt til 230 °C ved hjelp av en 30 m MDN-35 kapillærkolonne.MERK: Tilleggsinformasjon, for eksempel temperaturgradient, finnes i tabell 1. Masseområdet er satt til 70-600 m/z med 20 skanninger/min. Inkluder delte moduser for å muliggjøre kvantifisering av putative overbelastningsforbindelser, noe som sparer kostnader og tid for ekstraktavledning i slike tilfeller. Inkluder flere QC-prøver i alle daglige partier og et tomt felt for å sikre korreksjon for analytisk variasjon. Tilfeldiggjør prøver riktig blokkmessig i sekvensiell rekkefølge. 8. Chromatogram behandling og sammensatt merknad Filtrer kjemisk støy ved å definere intensitetsterskler. Inkluder alle QC-prøver under behandling av kromatogrammer.MERK: For store data er støyfiltrering avgjørende for å redusere databehandlingstiden og prosessorkraften. Juster kromatogrammene ved å definere et tidsforskyvningsvindu for oppbevaring. Kontroller kromatogrammene fra hver batch for å vurdere intra- og interpartivariasjonen. Utfør toppregistrering avhengig av toppformen, for eksempel høyde og bredde for full bredde ved beregninger av halv maksimum (FWHM). Klyngeisotoper for å redusere overflødige signaler og filtrere ut singletons.MERK: Se materialfortegnelse for detaljer om programvare som brukes til kromatogrambehandling. Dyptgående protokoller om hvordan du behandler kromatogrammer ved hjelp av forskjellige fritt tilgjengelige programvareverktøy, for eksempel MS-DIAL, MetAlign, MzMine og Xcalibur 19,20,21, leveres. Bruk ddMS2-dataene i et samlet QC-utvalgseksempel for sammensatt merknad. Vurder den molekylære strukturen ved å bestemme den monoisotopiske massen og observere vanlige nøytrale tap, kjente ladede aglykoner og forskjellige typer spaltinger, for eksempel homolytisk eller heterolytisk16,22. For rapportering av metabolittdata, følg anbefalingen beskrevet i Fernie et al. 201123.MERK: Ulike beregningsmessige metabolomics tilnærminger kan brukes til å analysere metabolomics data 24,25,26. 9. Normalisering av storskala metabolomics datasett Kontroller fordelingen av de interne standardene og normaliser ved å korrigere for respons av enkle eller flere interne standarder. Korriger toppintensitetene oppnådd fra kromatogrammet over den nøyaktige prøvevekten ved å dele toppintensitetene med den alisiterte homogeniserte prøvevekten fra trinn 2.5. Riktig for intensitetsdrift på tvers av flerpartiserier. Utfør QC-baserte korrigeringsmetoder som lokalt estimert scatterplotutjevning (LOESS)27 ved hjelp av R.MERK: Flere verktøy og pakker er tilgjengelige for å adressere driften av MS-ytelsen under oppkjøpet av hele batchene28,29. Sikre normal fordeling av egenskaper ved datatransformasjon, for eksempel Box-Cox transformasjon30 ved hjelp av boxcox () -funksjonen fra R-pakken MASS for å utføre GWAS. Utføre dataskalering, for eksempel Pareto-skalering, for multivariat analyse for å sikre riktig veiing av lave rikelige forbindelser31.MERK: Hvis det er mulig, utfør en restitusjonsanalyse for å unngå matriseeffekter, for eksempel ionundertrykking14. 10. Genom-brede assosiasjonsstudier (GWAS)32 Kall enkelt nukleotidpolymorfisme (SNP) eller strukturelle varianter (SV) fra sekvenseringsdataene33,34. Filtergenotypiske data for mindre allelfrekvens (MAF) 10 % for å unngå lavfrekvent skjevhet ved bruk av Dusk35. Beregn beste lineære objektive prediksjoner (BLUPer) for hver normaliserte funksjon over eksperimentelle repetisjoner for å eliminere skjevheter som stammer fra miljøfaktorer (tilfeldige effekter) ved hjelp av R-pakken Ime436. Bruk BLUPer for hver funksjon individuelt for å utføre GWAS ved hjelp av rMVP-pakken i R37.MERK: Hver metabolomikkfunksjon ses her som en individuell frittstående fenotype. Når du utfører GWAS, korrigere for populasjonsstruktur ved hjelp av hovedkomponentanalyse (PCA) og identitet etter tilstand (IBS) eller vanRaden for å minimere forvirrende effekter. Videre bør du vurdere å bruke en blandet lineær modell (MLM) eller en multi-locus blandet modell (MLMM), da blandede modeller inneholder faste og tilfeldige effekter. 11. QTL-deteksjon Sjekk SNPene som viser betydelig assosiasjon, og ta Manhattan-tomtene i betraktning, for linkage disequilibrium (LD) beregninger for å bestemme den underliggende genetiske regionen. Utfør LD-beregninger ved hjelp av R-pakkens LD-varmekart eller Dusk 5. Kontroller de tilknyttede SNPene for effektstørrelsen over egenskapen ved å undersøke trekknivåene for statistiske endringer mellom haplotyper for å finne potensielle årsakssammenhenger, for eksempel SNPer som fører til en aminosyreendring i proteinkodingssekvensen, noe som kan forklare fenotypisk variasjon.MERK: Siden SNP-trekkforeninger ikke nødvendigvis gir årsakssammenheng, er det avgjørende å bestemme den genomiske regionen. Sammensatt identitet ved funksjonsmerknad kan hjelpe enormt med å finne de riktige kandidatgenene i en bestemt genomisk region. Vi foreslår å kombinere alle oppdagede QTL forbundet med visse forbindelser i et pleiotropisk kart for å understreke de genetiske områdene38, som vist i figur 4. For validering av kandidatgener kan flere tilnærminger utføres (se diskusjonen).

Representative Results

Vellykkede GWAS-eksperimenter med metabolomics bør begynne med en riktig eksperimentell design, etterfulgt av utvalgsinnsamling, ekstraksjon, datainnsamling og prosessering, som illustrert i figur 1. I denne protokollen ble MTBE-metoden15 brukt til å trekke ut og analysere hundrevis av metabolitter som tilhører flere sammensatte klasser. Kromatografi avhenger sterkt av egenskapene til den brukte kolonnen samt elutionbufferblandinger. Figur 2 viser kromatogrammer av QC-prøver, noe som indikerer elutionmønsteret til noen store lipidklasser i dette analytiske systemet. De påførte forløpningene for hver plattform er angitt i tabell 1. Det ble lagt stor vekt på håndtering av systemiske feil i store eksperimenter. Utføre storskala metabolomics er iboende forbundet med systemiske feil. For demonstrasjon analyserte vi lipidomiske data på tvers av flere vanlige bønnearter. Supplerende tabell 1 gir de ekstraherte rå lipidomiske dataene som er innhentet etter kromatogrambehandling ved hjelp av programvaren som er angitt i materialtabellen. Etter denne protokollen kunne vi omgå store problemer med å håndtere omics-data, spesielt når vi håndterer store eksempelsett. Normaliseringsprosedyren gir nøyaktig korreksjon av batchvise analytiske feil, som vist i figur 3. Selv om økning av antall QC-prøver vil øke normaliseringens kraft, er dette ikke alltid mulig på grunn av kostnads- og tidsbegrensninger. For høy-gjennomstrømning metabolomics GWAS med ikke-målrettede metabolske funksjoner, er det viktig å illustrere høyere antall trekk-markør assosiasjon hensiktsmessig. Et pleiotropisk kart38 som kombinerer flere GWAS-resultater, kan brukes til å fremheve de genomiske områdene som flere trekk er knyttet til (figur 4). Figur 1: Flytskjema for metabolomikkbaserte GWAS i planter. Flere trinn som starter fra eksperimentell design opp til påvisning av QTL vises i venstre panel. I høyre panel vises flere figurer for å støtte flere trinn som er nevnt i venstre panel. Fra høyre topp vises (1) en foreslått sekvens av prøver for LC-MS, (2) pre- og post-normaliserte scoreplott av PCA, inkludert en representativ funksjonsdistribusjon før- og etterbehandling, med rød som indikerer QC-prøveintensiteter, og (3) et Manhattan-plott med betydelige assosiasjoner som LD- og haplotypedistribusjoner ble generert til. Forkortelser: GWAS = genom-brede assosiasjonsstudier; QTL = kvantitativ egenskap loci; PCA = hovedkomponentanalyse; QC = kvalitetskontroll; LD = linkage disequilibrium; MS = massespektrometri; LC-MS = flytende kromatografi-massespektrometri; GC-MS = gasskromatografi-massespektrometri; LOESS = lokalt estimert scatterplot utjevning; MLM/MLMM = blandet lineær modell/multi-locus blandet modell. Klikk her for å se en større versjon av denne figuren. Figur 2: Behandling av kromatogram. To QC-kromatogrammer (basistopp, lipiddata) fra forskjellige grupper demonstrerer den batchvise variasjonen for visse lipidklasser i de samlede QC-prøvene. Fire store lipidklasser er indikert med sine respektive elutionvinduer i det interne LC-MS-systemet. Kromatogrammene ble eksportert fra MzMine21. Forkortelser: QC = kvalitetskontroll; LC-MS = flytende kromatografi-massespektrometri. Klikk her for å se en større versjon av denne figuren. Figur 3: Retting av systematisk feil. Hovedkomponentanalyse av innhentede lipidomiske data, pre- (venstre, rådata) og postkorrigering for systemiske feil (høyre, batch loess). De nedre panelene illustrerer funksjonsfordelingen (Cluster_00005) over prøvene (n=650) og partiene (n=10) pre- (venstre) og postkorrigering (høyre) for analytisk variasjon. Forkortelser: PCA = hovedkomponentanalyse; QC = kvalitetskontroll; LOESS = lokalt estimert spredningsutjevning. Klikk her for å se en større versjon av denne figuren. Figur 4: Pleiotropisk kart som illustrerer de kombinerte GWAS-resultatene. Det pleiotrope kartet fremhever regioner i hele genomet som er forbundet med flere egenskaper. Tallene på de ytre ringene indikerer de tilsvarende kromosomene. Hver circlet representerer et individuelt trekk med sine betydelig tilknyttede SNPer. Fargene representerer forskjellige sammensatte klasser (grå = sammensatt klasse 1; grønn = sammensatt klasse 2; lilla = sammensatt klasse 3; gul = sammensatt klasse 4). Når det gjelder inter-sammensatte klasseforeninger med samme genomiske region, fremheves gener. Den indre grå sirkelen viser summen av alle signifikante SNPer knyttet til en bestemt genomisk posisjon. Tilknytningene som vises i denne figuren, genereres kunstig bare for illustrasjon. Forkortelser: GWAS = genom-brede assosiasjonsstudier; SNPer = polymorfismer med ett nukleotid. Klikk her for å se en større versjon av denne figuren. UHPLC-MS-innstillinger for lipider Tid [min] Eluent A til B [%]* Informasjon 0 – 1.00 45 % A Eluent A: 1% 1M NH 4-Acetat, 0,1% eddiksyre i vann (UHPLC-klasse) 1.00 – 4.00 lg 45% – 25% A Eluent B: 1% 1M NH 4-acetat, 0,1% eddiksyre i acetonitril/2-propanol 7:3 (UHPLC-klasse) 4.00 – 12.00 lg 25% – 11% A Strømningshastighet: 400 μL/min 12.00 – 15.00 lg 11% – 0% A Injeksjonsvolum: 2 μL 15.00 – 19.50 cw 0 % A 19.50-19.51 0 % – 45 % A 19.51-24.00 eq 45 % UHPLC-MS/MS-innstillinger for polare og halvpolede metabolitter Tid [min] Eluent A og B [%]* Informasjon 0 – 1.00 99 % A Eluent A: 0,1% maursyre i vann (UHPLC-klasse) 1.00 – 11.00 lg 99% -60% A Eluent B: 0,1 % maursyre i acetonitril (UHPLC-grad) 11.00 – 13.00 lg 60% – 30% A Strømningshastighet: 400 μL/min 13.00 – 15.00 lg 30% – 1% A Injeksjonsvolum: 3 μL 15.00 – 16.00 cw 1 % A 16.00 – 17.00 lg 1% – 99% A 17.00 – 20.00 eq 99 % A GC-MS-innstillinger for avledede metabolitter Tid [min] Temperatur [°C] Informasjon 0 – 2.00 85 Gass til bærebølgen: Helium 2.00 – 18.66 lg 80 – 330 Strømningshastighet: 2 ml/min 18.66 – 24.66 cw 330 Temperaturgradient: 15 °C/min 24.66 rask kjøling Injeksjonsvolum: 1 μL Tabell 1: Graderingsinnstillinger for hver av de analytiske plattformene7. Forkortelser: lg = lineær gradient; cw = kolonnevask; eq = likevekt; UHPLC-MS = ultra-høy ytelse flytende kromatografi-masse spektrometri; UHPLC-MS/MS = ultra-høy ytelse flytende kromatografi-tandem masse spektrometri; GC-MS = gasskromatografi-massespektrometri. * = prosentverdien tilsvarer eluent A; gjenværende prosentverdi tilsvarer eluent B. Supplerende tabell 1: Rå lipidomiske data. Angir toppintensitetene for hver av de oppdagede sektorgruppene over hvert utvalg. Klikk her for å laste ned denne tabellen.

Discussion

Både GC-MS og LC-MS er mye brukt verktøy for profilering av komplekse blandinger av ulike metabolittklasser. Håndtering av store datasett med disse verktøyene er iboende forbundet med en ikke-biologisk variasjon, for eksempel analytisk variasjon, som forstyrrer og fordommer tolkningen av resultatene. Denne protokollen presenterer en robust og høy-gjennomstrømning ekstraksjon rørledning for omfattende metabolsk profilering for å eliminere variasjon av ikke-biologisk opprinnelse og gjennomføre store “omics” studier. Volumene og konsentrasjonene som ble brukt i denne protokollen ble justert for belgfruktarter i forskjellige vev. Imidlertid kan disse parametrene også endres litt og brukes til store metabolske prøver fra andre plantearter.

De tidligere¹⁵ beskrevne MTBE-baserte ekstraksjonene kan brukes til å analysere avledede metabolitter, halvpolerte metabolitter og lipider. Dette kan utvides for protein- og plantehormonekstraksjoner³⁹, som var utenfor omfanget av denne protokollen. Andre ekstraksjonsprotokoller er avhengige av dichloromethane:etanolblandinger^40,41. Av disse ekstraksjonsprotokollene gir MTBE:metanolutvinningsprotokollen et gunstig og mindre farlig alternativ til de eksisterende kloroformbaserte ekstraksjonsprotokollene⁴² og resulterer ikke i en proteinpellet som en interfase mellom polar- og lipidfasene. Videre er MTBE-metoder allerede brukt i flere studier for ulike biologiske prøver 43,44,45.

Denne protokollen drøfter flere viktige trinn som kan føre til potensiell variasjon mens du håndterer et stort antall prøver, for eksempel under høsting av ^12,13, ekstraksjon¹⁴, samt randomisering⁴⁶. Videre er det flere problemer som ikke er diskutert i denne protokollen som må vurderes for å sikre metabolomiske data av høy kvalitet, for eksempel matriseeffekt og ionundertrykkelse¹⁴.

Kraften til QC-baserte normaliseringsmetoder avhenger iboende av antall QC-prøver i hver batch. Som nevnt tidligere, selv om økningen av antallet ville øke kraften, er den intrapartivariasjonen av QC-ene relativt marginal sammenlignet med variasjon mellom partiene i disse analysesystemene, som illustrert i figur 3. Totalt sett er det andre QC-baserte normaliseringsmetoder, for eksempel systemisk feilfjerning ved hjelp av tilfeldig skog (SERRF), som har vist seg å overgå de fleste av de andre normaliseringsmetodene som batch-wise-ratio, normalisering ved hjelp av et optimalt utvalg av flere interne standarder (NOMIS), og probabilistisk kvotient normalisering (PQN)⁴⁷ . SERRF er imidlertid avhengig av flere QC-prøver i hver batch, for eksempel hver tiende prøve, noe som ikke er mulig under håndtering av et stort antall prøver. Den største fordelen med QC-basert normalisering i forhold til andre datadrevne eller interne standardbaserte metoder er at den beholder den essensielle biologiske variasjonen samtidig som den imøtekommer uønsket teknisk variasjon²⁸. Leserne kan henvise til denne gjennomgangen om håndteringen av variant²⁸.

Et hovedproblem i GWAS er frekvensen av falske positiver, som hovedsakelig stammer fra årsakssammenheng og ikke-årsakssammenhenger^48,49. For det andre er de konservative statistiske korreksjonsmetodene, for eksempel Bonferroni og FDR, korrekte for antall uavhengige tester, som ikke er lik antall analyserte SNPer i GWAS på grunn av koblingen mellom proksimale SNPer^50,51 Derfor er det faktiske antallet uavhengige tester ofte lavere. En annen måte å redusere den konservative statistiske terskelen på ville være å redusere antall testede SNPer som brukes for GWAS basert på koblingsforfall over definerte genomiske regioner⁵². DEN GWAS-integrerte metabolomics-plattformen med høy gjennomstrømning som er beskrevet i denne protokollen, har et bredt spekter av applikasjoner. Spesielt vil det lette forbedringer i avlingsavl ved å endre metabolitt / lipidsammensetningen for industrielt og ernæringsmessig ønskede nivåer. Totalt sett har metabolomics gitt en grundig innsikt i den genetiske arkitekturen til en mengde metabolitter og metabolsk diversifisering som skjedde under avlings domesticering de siste tiårene, noe som indikerer det enorme potensialet for metabolomics-assosiert avl⁵³. De molekylære biologiske tilnærmingene for nedstrøms QTL-validering inkluderer genereringen av CRISPR / Cas9 mutantlinjer⁵⁴, T-DNA-innsettingslinjer⁵⁵, stabile og / eller forbigående overekspressionslinjer⁵⁶, VIGS, ex vivo metabolomics nærmer seg⁵⁷ ved siden av den konvensjonelle tilnærmingen i å generere kryss F2-populasjoner samt kryssvalidering i forskjellige populasjoner.

Ved å utføre den nødvendige korreksjonen for de analytiske variasjonene som beskrevet ovenfor, kan flere integrerte tilnærminger utføres i tillegg til GWAS, for eksempel metabolitt-metabolitt, metabolitt-lipid korrelasjonsanalyse, korrelasjonsanalyse til fenomiske data for å belyse mer komplekse egenskaper, og / eller samuttrykksanalyse for å ytterligere avdekke grunnlaget for biologiske systemer⁵⁸.

Disclosures

The authors have nothing to disclose.

Acknowledgements

M.B. støttes av IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. og S.A. anerkjenner den økonomiske støtten til EU Horizon 2020 Research and Innovation Programme, prosjektet PlantaSYST (SGA-CSA No. 739582 under FPA No. 664620), og prosjektØKNING (GA 862862).

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC)	Avanti Polar Lipids	850360P	Internal standard for lipids
Chloroform	Supleco	67-66-3	FAME solvent
Isovitexin	Sigma Aldrich	38953-85-4	Internal standard for metabolites
Lignoceric Acid Methylester	Sigma Aldrich	2442-49-1	FAME
Methanol (MeOH)	Biosolve Chemicals	13684102	ULC-MS grade
Methoxyamin -hydrochlorid	Sigma Aldrich	593-56-6	Metabolite deriviatization
Methyl laurate	Sigma Aldrich	111-82-0	FAME
Methyl myristate	Sigma Aldrich	124-10-7	FAME
Methyl palmitate	Sigma Aldrich	112-39-0	FAME
Methyl stearate	Sigma Aldrich	112-61-8	FAME
Methyl tert-butyl ether (MTBE)	Biosolve Chemicals	13890602	HPLC grade
Methyl-caprat	Sigma Aldrich	110-42-9	FAME
Methylcaprylat	Sigma Aldrich	111-11-5	FAME
Methyldocosanoat	Sigma Aldrich	929-77-1	FAME
Methyleicosanoat	Sigma Aldrich	1120-28-1	FAME
Methyl-hexacosanoat	Sigma Aldrich	5802-82-4	FAME
Methyl-octacosanoat	Sigma Aldrich	55682-92-3	FAME
Methyl-pelargonate	Sigma Aldrich	1731-84-6	FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA)	Macherey-Nagel	24589-78-4	Metabolite deriviatization
Pyridine	Supleco	110-86-1	Metabolite deriviatization
Ribitol	Supleco	22566-17-2	Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester	TCI Chemicals	629-83-4	FAME
Water	Biosolve Chemicals	23214102	ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes	Eppendorf	3120086
2 mL Safe-lock microcentrifuge tubes	Eppendorf	3120094
Balance	Sartorius Corporation	14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm	Aglient	123-3832	Analysis of derivatized metabolites
GC-MS system	Leco Pegasus HT TOF-MS (LECO Corporation)		Analysis of derivatized metabolites
Grinding Balls, Stainless Steel	OPS DIAGNOSTICS	GBSS 196-2500-10
MS system	Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific)		Analysis of lipids
MS system	Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific)		Analysis of metabolites
Refrigerated microcentrifuge	Eppendorf, model 5427R	22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles)	Waters	186002878	Analysis of lipids
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles)	Waters	186003539	Analysis of metabolites
Shaker	Eppendorf Thermomixer 5436	2050-100-05
Sonicator	USC 300 TH	142-0084
Tissue grinding mixer mill	Retsch, Mixer Mill MM 300	20.746.0001
UPLC system	Waters Acquity UPLC system (Waters)
Vacuum concentrator	Scan Speed Maxi Vac Alpha Evaporators	7.008.500.002
Vortex mixer	Vortex-Genie 2, Model G560	SI-0236
Software
MetAlign			Chromatogram processing
MzMine			Chromatogram processing
R package "data.table"
R package "fujiplot"			pleiotrpoic map
R package "genetics"
R package "Ime4"			BLUPs calculation
R package "LDheatmap"			LD plots
R package "MASS"			transformation
R package "rMVP"			GWAS
R version 4.0.4
RefinerMS			Chromatogram processing
RefinerMS Genedata	Expressionist		Chromatogram processing
Tassel 5			Genotype filtering
Xcalibur	Thermo Fisher Scientific	OPTON-30965	Chromatogram processing

References

Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
Chambers, J. M. . Statistical models in S. , (1991).
Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

Store multiomikk Genom-brede foreningsstudier (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Store multiomikk Genom-brede foreningsstudier (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below