I denne protokollen presenterer vi en optimalisert arbeidsflyt, som kombinerer en effektiv og rask prøvepreparering av mange prøver. I tillegg gir vi en trinnvis veiledning for å redusere analytiske variasjoner for evaluering av høy gjennomstrømning av metabolske GWAS-studier.
Både gasskromatografi-massespektrometri (GC-MS) og flytende kromatografi-massespektrometri (LC-MS) er mye brukt metabolomics tilnærminger for å oppdage og kvantifisere hundretusener av metabolittfunksjoner. Anvendelsen av disse teknikkene på et stort antall prøver er imidlertid gjenstand for mer komplekse interaksjoner, spesielt for genom-brede assosiasjonsstudier (GWAS). Denne protokollen beskriver en optimalisert metabolsk arbeidsflyt, som kombinerer en effektiv og rask prøvepreparering med analyse av et stort antall prøver for belgfrukter. Denne litt modifiserte ekstraksjonsmetoden ble opprinnelig utviklet for analyse av plante- og dyrevev og er basert på utvinning i metyl tert-butyl eter: metanolløsningsmiddel for å tillate fangst av polare og lipidmetabolitter. I tillegg gir vi en trinnvis veiledning for å redusere analytiske variasjoner, som er avgjørende for den høye gjennomstrømningsevalueringen av metabolsk varians i GWAS.
Store “omics” tilnærminger har gjort det mulig å analysere komplekse biologiske systemer 1,2,3 og videre forståelse av sammenhengen mellom genotyper og de resulterende fenotypene4. Metabolomics ved hjelp av ultra-høy ytelse flytende kromatografi-masse spektrometri (UHPLC-MS) og GC-MS aktivert påvisning av en mengde metabolittiske funksjoner, hvorav bare noen er kommentert til en viss grad, noe som resulterer i en høy andel av ukjente metabolitter. Komplekse interaksjoner kan utforskes ved å kombinere storskala metabolomikk med den underliggende genotypiske variasjonen av en mangfoldig populasjon5. Håndtering av store prøvesett er imidlertid iboende forbundet med analytiske variasjoner, noe som forvrenger evalueringen av metabolsk varians for lenger nedstrømsprosesser. Spesielt er store problemstillinger som fører til analytiske variasjoner basert på maskinytelse og instrumentell drift over tid6. Integreringen av parti-til-parti-variasjon er utfordrende og spesielt problematisk ved analyse av store strukturerte plantepopulasjoner. Flere normaliseringsprosedyrer ble foreslått å korrigere for ikke-biologiske variasjoner, for eksempel bruk av interne, eksterne og isotopmerkede interne standarder for å korrigere for analytiske feil, hvorav hver er iboende forbundet med kjente problemer og fallgruver 7,8,9,10.
I tillegg til analytisk variasjon varierer valget av utvinningsprotokoller generelt avhengig av analysemetoden. Til syvende og sist er det ønskelig å redusere material- og arbeidskostnader, samt nødvendigheten av å bruke flere aliquots av samme prøve for ulike analytiske prosesser ved å utføre faseseparasjonsbaserte ekstraksjonsmetoder. Disse metodene ble først introdusert ved hjelp av kloroform: metanol / vannløsemidler for å fraksjonere polare og hydrofobe forbindelser11.
Denne protokollen beskriver en rask rørledning med høy gjennomstrømning for en multi-omics plattform for å profilere både polare metabolitter og lipider i belgfruktarter. Videre viser den hvordan disse datasettene kan korrigeres riktig for analytisk variasjon og normaliseres før de integrerer genotypisk informasjon for å oppdage metabolitt kvantitativ egenskap loci (QTL) ved å utføre GWAS.
Både GC-MS og LC-MS er mye brukt verktøy for profilering av komplekse blandinger av ulike metabolittklasser. Håndtering av store datasett med disse verktøyene er iboende forbundet med en ikke-biologisk variasjon, for eksempel analytisk variasjon, som forstyrrer og fordommer tolkningen av resultatene. Denne protokollen presenterer en robust og høy-gjennomstrømning ekstraksjon rørledning for omfattende metabolsk profilering for å eliminere variasjon av ikke-biologisk opprinnelse og gjennomføre store “omics” studier. Volumene og konsentrasjonene som ble brukt i denne protokollen ble justert for belgfruktarter i forskjellige vev. Imidlertid kan disse parametrene også endres litt og brukes til store metabolske prøver fra andre plantearter.
De tidligere15 beskrevne MTBE-baserte ekstraksjonene kan brukes til å analysere avledede metabolitter, halvpolerte metabolitter og lipider. Dette kan utvides for protein- og plantehormonekstraksjoner39, som var utenfor omfanget av denne protokollen. Andre ekstraksjonsprotokoller er avhengige av dichloromethane:etanolblandinger40,41. Av disse ekstraksjonsprotokollene gir MTBE:metanolutvinningsprotokollen et gunstig og mindre farlig alternativ til de eksisterende kloroformbaserte ekstraksjonsprotokollene42 og resulterer ikke i en proteinpellet som en interfase mellom polar- og lipidfasene. Videre er MTBE-metoder allerede brukt i flere studier for ulike biologiske prøver 43,44,45.
Denne protokollen drøfter flere viktige trinn som kan føre til potensiell variasjon mens du håndterer et stort antall prøver, for eksempel under høsting av 12,13, ekstraksjon14, samt randomisering46. Videre er det flere problemer som ikke er diskutert i denne protokollen som må vurderes for å sikre metabolomiske data av høy kvalitet, for eksempel matriseeffekt og ionundertrykkelse14.
Kraften til QC-baserte normaliseringsmetoder avhenger iboende av antall QC-prøver i hver batch. Som nevnt tidligere, selv om økningen av antallet ville øke kraften, er den intrapartivariasjonen av QC-ene relativt marginal sammenlignet med variasjon mellom partiene i disse analysesystemene, som illustrert i figur 3. Totalt sett er det andre QC-baserte normaliseringsmetoder, for eksempel systemisk feilfjerning ved hjelp av tilfeldig skog (SERRF), som har vist seg å overgå de fleste av de andre normaliseringsmetodene som batch-wise-ratio, normalisering ved hjelp av et optimalt utvalg av flere interne standarder (NOMIS), og probabilistisk kvotient normalisering (PQN)47 . SERRF er imidlertid avhengig av flere QC-prøver i hver batch, for eksempel hver tiende prøve, noe som ikke er mulig under håndtering av et stort antall prøver. Den største fordelen med QC-basert normalisering i forhold til andre datadrevne eller interne standardbaserte metoder er at den beholder den essensielle biologiske variasjonen samtidig som den imøtekommer uønsket teknisk variasjon28. Leserne kan henvise til denne gjennomgangen om håndteringen av variant28.
Et hovedproblem i GWAS er frekvensen av falske positiver, som hovedsakelig stammer fra årsakssammenheng og ikke-årsakssammenhenger48,49. For det andre er de konservative statistiske korreksjonsmetodene, for eksempel Bonferroni og FDR, korrekte for antall uavhengige tester, som ikke er lik antall analyserte SNPer i GWAS på grunn av koblingen mellom proksimale SNPer50,51 Derfor er det faktiske antallet uavhengige tester ofte lavere. En annen måte å redusere den konservative statistiske terskelen på ville være å redusere antall testede SNPer som brukes for GWAS basert på koblingsforfall over definerte genomiske regioner52. DEN GWAS-integrerte metabolomics-plattformen med høy gjennomstrømning som er beskrevet i denne protokollen, har et bredt spekter av applikasjoner. Spesielt vil det lette forbedringer i avlingsavl ved å endre metabolitt / lipidsammensetningen for industrielt og ernæringsmessig ønskede nivåer. Totalt sett har metabolomics gitt en grundig innsikt i den genetiske arkitekturen til en mengde metabolitter og metabolsk diversifisering som skjedde under avlings domesticering de siste tiårene, noe som indikerer det enorme potensialet for metabolomics-assosiert avl53. De molekylære biologiske tilnærmingene for nedstrøms QTL-validering inkluderer genereringen av CRISPR / Cas9 mutantlinjer54, T-DNA-innsettingslinjer55, stabile og / eller forbigående overekspressionslinjer56, VIGS, ex vivo metabolomics nærmer seg57 ved siden av den konvensjonelle tilnærmingen i å generere kryss F2-populasjoner samt kryssvalidering i forskjellige populasjoner.
Ved å utføre den nødvendige korreksjonen for de analytiske variasjonene som beskrevet ovenfor, kan flere integrerte tilnærminger utføres i tillegg til GWAS, for eksempel metabolitt-metabolitt, metabolitt-lipid korrelasjonsanalyse, korrelasjonsanalyse til fenomiske data for å belyse mer komplekse egenskaper, og / eller samuttrykksanalyse for å ytterligere avdekke grunnlaget for biologiske systemer58.
The authors have nothing to disclose.
M.B. støttes av IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. og S.A. anerkjenner den økonomiske støtten til EU Horizon 2020 Research and Innovation Programme, prosjektet PlantaSYST (SGA-CSA No. 739582 under FPA No. 664620), og prosjektØKNING (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |