Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

Storskaliga Multi-omics Genome-wide Association Studies (Mo-GWAS): Riktlinjer för provberedning och normalisering

Published: July 27, 2021 doi: 10.3791/62732

Summary

I detta protokoll presenterar vi ett optimerat arbetsflöde som kombinerar en effektiv och snabb provberedning av många prover. Dessutom tillhandahåller vi en steg-för-steg-guide för att minska analytiska variationer för utvärdering med hög genomströmning av metaboliska GWAS-studier.

Abstract

Både gaskromatografi-masspektrometri (GC-MS) och vätskekromatografi-masspektrometri (LC-MS) används ofta metabolomikmetoder för att detektera och kvantifiera hundratusentals metabolitfunktioner. Tillämpningen av dessa tekniker på ett stort antal prover är dock föremål för mer komplexa interaktioner, särskilt för genomomfattande associeringsstudier (GWAS). Detta protokoll beskriver ett optimerat metaboliskt arbetsflöde, som kombinerar en effektiv och snabb provberedning med analys av ett stort antal prover för baljväxtgrödor. Denna något modifierade extraktionsmetod utvecklades ursprungligen för analys av växt- och djurvävnader och är baserad på extraktion i metyltert-butyleter: metanollösningsmedel för att möjliggöra infångning av polära och lipidmetaboliter. Dessutom tillhandahåller vi en steg-för-steg-guide för att minska analytiska variationer, vilket är viktigt för utvärdering av metabolisk varians med hög genomströmning i GWAS.

Introduction

Storskaliga "omics" -metoder har möjliggjort analys av komplexa biologiska system 1,2,3 och ytterligare förståelse av kopplingen mellan genotyper och de resulterande fenotyperna4. Metabolomik med ultrahögprestanda flytande kromatografi-masspektrometri (UHPLC-MS) och GC-MS möjliggjorde detektion av en uppsjö av metabolitfunktioner, varav endast vissa kommenteras till en viss grad, vilket resulterar i en hög andel okända metaboliter. Komplexa interaktioner kan utforskas genom att kombinera storskalig metabolomik med den underliggande genotypiska variationen hos en mångfaldig population5. Hantering av stora provuppsättningar är emellertid i sig förknippad med analytiska variationer, vilket snedvrider utvärderingen av metabolisk varians för ytterligare nedströmsprocesser. Specifikt baseras stora frågor som leder till analytiska variationer på maskinprestanda och instrumentell drift över tid6. Integrationen av batch-till-batch-variation är utmanande och särskilt problematisk när man analyserar storskaliga strukturerade växtpopulationer. Flera normaliseringsprocedurer föreslogs för att korrigera för icke-biologiska variationer, t.ex. användningen av interna, externa och isotopmärkta interna standarder för att korrigera för analytiska fel, varav var och en i sig är förknippad med kända problem och fallgropar 7,8,9,10.

Förutom analytisk variation varierar valet av extraktionsprotokoll i allmänhet beroende på analysmetoden. I slutändan är det önskvärt att minska material- och arbetskraftskostnaderna samt nödvändigheten av att använda flera alikvoter av samma prov för olika analytiska processer genom att utföra fasseparationsbaserade extraktionsmetoder. Dessa metoder introducerades först med användning av kloroform: metanol / vattenlösningsmedel för att fraktionera polära och hydrofoba föreningar11.

Detta protokoll beskriver en snabb pipeline med hög genomströmning för en multi-omics-plattform för att profilera både polära metaboliter och lipider i baljväxtarter. Vidare visar den hur dessa datamängder kan korrigeras på lämpligt sätt för analytisk variation och normaliseras innan genotypisk information integreras för att detektera metabolit quantitative trait loci (QTL) genom att utföra GWAS.

Protocol

1. Experimentell design och växtodling

OBS: Ställ in experimentet beroende på den experimentella hypotesen, t.ex. att använda en storskalig GWAS-population minskar behovet av flera replikat, eftersom statistisk testning kommer att utföras baserat på haplotyperna för alla enskilda SNP istället för anslutningen. Däremot är flera replikat oumbärliga i andra experimentella metoder. Följande punkter måste beaktas när experimentet förbereds.

  1. Inkludera tillräckligt med biologiska replikat, beroende på den experimentella hypotesen.
  2. Randomisera de biologiska replikaten blockvis för att minska lokal miljöförspänning under odling, t.ex. växthus, fält.
  3. Se till att växten underhålls korrekt under tillväxten. Behandla växter homogent för att minska förspänningen.

2. Beredning av biologiskt växtmaterial

  1. Förberedelse av skörd
    1. Etikettskördrör (20 ml) som innehåller två metallpärlor med en diameter på 5 mm och två 8 mm för homogenisering. Fyll upp en dewar med flytande kväve.
      OBS: Växter bör vara i vegetativt stadium för skörd av färskt blad och rotvävnad.
  2. Skörda biologiska prover genom blixtfrysning i flytande kväve. Skörda så snabbt som möjligt för att utesluta påverkan av cirkadisk svängning på ämnesomsättningen under förlängd skördelängd12,13. Förvara de skördade färska blad- och rotvävnaderna för vidare bearbetning vid -80 °C.
    OBS: Bladskärning till blixtfrysning bör inte ta längre tid än några sekunder eftersom aktiva biologiska processer efter bladklyvning skulle förändra metaboliska profiler på grund av sår. För rötter, preclean rötterna genom att tvätta med vatten innan blixtfrysning i flytande kväve. Överskott av vatten på rotytan bör blötläggas med pappersvävnad. Torkade frön kan förvaras vid rumstemperatur; ingen frysning i flytande kväve krävs.
  3. Slipa vävnaden med en vävnadsblandare.
    1. Förkyl rörhållarna i flytande kväve i ett par minuter för att bibehålla en låg temperatur medan du slipar vävnaden.
    2. Transportera de biologiska proverna i en kvävehaltig dewar efter att ha tagit ut dem från frysen på -80 °C.
    3. Slipa vävnaderna för att erhålla homogent pulver; använd 25 Hz i 1 min och upprepa efter frysning i flytande kväve om vävnaden inte är homogent mald.
  4. För slipning av torkade frön, placera fröna i en slipburk med en metallpärla med en diameter på 15 mm. Använd samma frekvens och tid som nämns i 2.3.3.
    OBS: Rena och förkylda murbruk och mortelstötar kan användas om en vävnadsblandare inte är tillgänglig.
  5. Precool-märkta 2 ml säkra mikrocentrifugrör. Väg upp 50 mg vid ett fel på ±5 mg färskt växtmaterial med hjälp av en analytisk skala. Förkyl de verktyg som används för överföring av växtmaterial i flytande kväve. Se till att växtmaterialet förblir fryst under vägningsprocessen.
    OBS: Utsätt inte färskt växtmaterial för länge för rumstemperatur eftersom biologiska processer aktiveras genom att öka temperaturen, vilket förändrar metaboliska profiler14.
  6. Generera ytterligare kvalitetskontrollprover (QC) genom att slå samman en andel av varje prov och väga 50 mg med ett fel på ±5 mg poolat färskt växtmaterial i förkylda 2 ml säkra mikrocentrifugrör.
    OBS: Minst tre QC-prover rekommenderas för varje 60 prover. QC-proverna är viktiga för nedströmskorrigering, normalisering och analyser.

3. Extraktionsreagenser

  1. Färsk vävnad, t.ex. löv och rötter
    OBS: Provextraktion baseras på ett tidigare beskrivet protokoll15. Detta protokoll har modifierats baserat på nuvarande behov, t.ex. flera vävnader, olika interna standarder och storskaliga experiment. Dessutom justeras alla volymer och instrumentinställningar som nämns nedan till interna analysenheter. Protokollanvändare bör justera dessa enligt sin analysenhet och biologiska prover, baserat på testprover.
    1. Extraktionsblandning 1 (EM1): metyltert-butyleter (MTBE)/metanol (MeOH) (3:1 v/v)
      1. Bered en blandning av MTBE/MeOH i förhållandet 3:1. För 100 ml extraktionsmedel, blanda 75 ml MTBE med 25 ml MeOH i en ren glasflaska.
        OBS: Lösningsmedel ska hanteras försiktigt i dragskåpet med rätt säkerhetsutrustning.
      2. Tillsätt 45 μL 1,2-diheptadecanoyl-sn-glycero-3-fosfokolin (1 mg/ml i kloroform) som intern standard för UHPLC-MS-baserad lipidanalys, 400 μl ribitol (1 mg/ml i vatten) som intern standard för den GC-MS-baserade analysen och 125 μl isovitexin (1 mg/ml i MeOH/vatten (1:1 v/v)) för UHPLC-MS-baserad metabolitanalys.
        OBS: Tillägget av interna standarder är nödvändigt för normalisering efter analys enligt analytiska behov. Eftersom 1 ml EM1 behövs för varje prov, förbered en stamlösning enligt experimentprovstorleken, som bör användas för hela experimentet. EM1 måste förvaras vid -20 °C. Kontrollera om den använda interna standarden inte finns och att den överlappar andra föreningar i den undersökta arten. Flera standarder kan användas; valet av de interna standarderna i detta protokoll baserades på tidigare tester med vanliga bönextrakt16.
    2. Extraktionsblandning 2 (EM2) vatten/metanol (MeOH) (3:1 v/v)
      1. För 100 ml EM2, tillsätt 75 ml dubbeldestillerat vatten och 25 ml MeOH i en ren glasflaska.
      2. Tillsätt 500 μl EM2 per prov och bered en stamlösning enligt försöksprovets storlek, som ska användas för hela experimentet. Förvara EM2 vid 4 °C.
  2. Torkade frön
    1. Extraktionsblandning 3 (EM3) metanol (MeOH)/vatten (7:3 v/v)
      1. För 100 ml EM3, tillsätt 70 ml MeOH och 30 ml dubbeldestillerat vatten i en ren glasflaska. Bered 1 ml EM3 för varje prov.
      2. Tillsätt 400 μl ribitol (1 mg/ml i vatten) som interna standarder för den GC-MS-baserade analysen och 125 μl isovitexin (1 mg/ml i MeOH/vatten (1:1 v/v)) för UHPLC-MS-baserad metabolitanalys.
        OBS: Förbered en stamlösning enligt den experimentella provstorleken och använd den för hela experimentet. Förvara EM3 vid 4 °C.

4. Extraktion av prover

  1. Färsk vävnad, t.ex. löv och rötter
    1. Förbered tre 1,5 ml säkra mikrocentrifugrör för varje prov. Förvara EM1 i ett vätskekylsystem på -20 °C. Överför de färska proverna från frysen -80 °C till torris eller flytande kväve för transport. Tillsätt 1 ml förkyld EM1 till varje 50 mg alikvot och virvel en kort stund innan du lägger på is.
    2. Inkubera proverna på en orbitalskakare vid 800 × g i 10 minuter vid 4 °C.
    3. Ultraljudsbehandling proverna i en iskyld ultraljudsbehandling bad för 10 min.
    4. Tillsätt 500 μL EM2 med hjälp av en flerkanalig pipett för att undvika variation i tillsatta volymer.
    5. Virvla proverna kort för att blanda extraktionsblandningarna innan de centrifugeras vid 11,200 × g i 5 min vid 4 °C.
    6. Efter att fasseparation inträffar, överför 500 μL av den övre lipidinnehållande fasen till ett förmärkt 1,5 ml säkert låsmikrocentrifugrör. Ta bort resten av den övre fasen.
      OBS: Var försiktig när du överför eftersom denna övre fas har ett högt ångtryck och tenderar att läcka ut från pipetten.
    7. Överför 150 μl och 300 μl av de nedre polära och halvpolära metabolitinnehållande faserna i två 1,5 ml safe-lock mikrocentrifugrör som används för GC-MS respektive UHPLC-MS-analys.
    8. Koncentrera alla extraherade fraktioner genom att låta lösningsmedlen avdunsta utan upphettning med hjälp av en vakuumkoncentrator och förvara vid -80 °C.
  2. Torkade frön
    1. Förbered två 1,5 ml säkra mikrocentrifugrör för varje prov. Håll EM3 på is. Placera en metallpärla med en diameter på 5 mm i alikvoterna.
    2. Tillsätt 1 ml EM3 i varje 50 mg alikvot och homogenisera proverna vid 25 Hz i 2-3 minuter innan du lägger dem på is.
    3. Ultraljudsbehandling proverna i en iskyld ultraljudsbehandling bad för 10 min.
    4. Virvla proverna kort innan de centrifugeras vid 11,200 × g i 5 minuter vid 4 °C.
    5. Överför 150 μl och 300 μl av supernatanten i två 1,5 ml säkra mikrocentrifugrör som används för GC-MS respektive UHPLC-MS-analys.
    6. Koncentrera alla extraherade fraktioner genom att låta lösningsmedlen avdunsta utan upphettning med hjälp av en vakuumkoncentrator och förvara vid -80 °C.
      OBS: Baserat på erfarenhet rekommenderas användare att utföra steg 4.2 för halvpolära metaboliter och derivatiserad metabolitanalys i torkade frön. Utför extraktionssteg 4.1 för lipidanalys av torkat frö.

5. Analys av lipider med användning av UHPLC-MS

  1. Suspendera de torkade lipidfraktionerna i 250 μl acetonitril:2-propanol (7:3, vol/vol).
  2. Ultraljudsbehandling lipidfasen i 5 min, centrifugera vid 11,200 × g i 1 min.
  3. Överför 90 μl av supernatanten till en injektionsflaska av glas för LC-MS.
  4. Injicera 2 μl av extrakten i LC-MS.
  5. Utför lipidfraktionering på en omvänd fas C8-kolonn som hålls vid 60 °C och som löper med ett flöde på 400 μL/min med gradvisa förändringar av elueringsmedlet A och B enligt tabell 1. Skaffa masspektra i positivt joniseringsläge med ett massområde på 150-1 500 m/z.
  6. Inkludera flera QC-prover i alla dagliga satser och ett blankprov för att säkerställa korrigering för analytisk variation. Randomisera prover blockvis i sekventiell ordning.

6. Analys av polära och halvpolära metaboliter med användning av UHPLC-MS

  1. Suspendera den torkade polarfasen på nytt i 180 μl metanol av UHPLC-kvalitet: vatten (1:1 v/v).
  2. Ultraljudsera polarfasen i 2 min, centrifugera vid 11 200 × g i 1 min.
  3. Överför 90 μl av supernatanten till en injektionsflaska av glas för LC-MS.
  4. Injicera 3 μl av extrakten i LC-MS.
  5. Utför metabolitfraktionering på en omvänd fas C18-kolonn som hålls vid 40 °C och som löper med ett flöde på 400 μl/min med gradvisa förändringar av elueringsmedlet A och B enligt tabell 1. Förvärva masspektra i ett massområde på 100-1 500 m / z i en fullständig MS-skanning och all jonfragmentering (AIF) inducerad av högenergikollisionsdissociation (HCD) på 40 keV.
    OBS: Använd båda joniseringslägena. På grund av begränsad kapacitet när du kör ett stort antal prover kör du dock testprover i båda joniseringslägena för att bestämma det föredragna joniseringsläget.
  6. Inkludera flera QC-prover i alla dagliga satser och ett blankprov för att säkerställa korrigering för analytisk variation. Randomisera prover blockvis i sekventiell ordning.
  7. Kör en poolad QC i databeroende MS2 i både negativa och positiva joniseringslägen. Använd de erhållna masspektra i ett senare steg (8.5) för annotering.

7. Analys av derivatiserade metaboliter med GC-MS17,18

OBS: Analysen av derivatiserade metaboliter baseras på ett tidigare beskrivet protokoll17. Hantera alla derivatiseringsreagenser i dragskåpet. Se till att N-metyl-N-(trimetylsilyl)trifluoracetamid (MSTFA) inte kommer i kontakt med vatten och fukt.

  1. Derivatiseringsreagens 1 (DR1)
    1. Lös upp metoxiaminhydroklorid i pyridin för att erhålla en koncentration av 30 mg / ml DR1. Använd 40 μl DR1 för varje prov. Förbered en stamlösning enligt provstorleken och förvara vid rumstemperatur.
  2. Derivatiseringsreagens 2 (DR2)
    1. Lös upp MSTFA med 20 μl fettsyrametylestrar (FAME) per 1 ml MSTFA. Använd 70 μL DR2 för varje prov. Bered en stamlösning enligt provstorleken. Förvara MSTFA vid 4 °C och FAME vid -20 °C.
      OBS: FAME inkluderar metylkaprylat, metylpelargonat, metylkaprat, metyllaurat, metylmyristat, metylpalmitat, metylstearat, metyleikosanoat, metyldokosanoat, lignocerinsyrametylester, metylhexacosanoat, metyloctacosanoat och triakontansyrametylester, som löses iCHCl3 i en koncentration av 0,8 μL / ml eller 0,4 mg / ml för flytande respektive fasta standarder.
  3. Torka pelleten från polarfasen (lagrad vid -80 °C) med hjälp av en vakuumkoncentrator i 30 minuter för att undvika störningar avH2Osom härrör från lagringen med de lösningsmedel som används för derivatiseringen nedströms.
  4. Tillsätt 40 μl DR1.
  5. Skaka proverna vid 950 × g i 2 timmar vid 37 °C med en orbitalskakare, följt av en kort nedrullning av vätskan.
  6. Tillsätt 70 μL DR2.
  7. Skaka igen vid 950 × g i 30 minuter vid 37 °C med en orbitalskakare.
  8. Centrifugera kort vid rumstemperatur innan du överför 90 μL till glasflaskor för GC-MS-analys.
  9. Injicera 1 μL i splitlessläge GC-MS, beroende på metabolitkoncentrationerna, med ett konstant heliumbärargasflöde på 2 ml/min. Injektionstemperaturen ställs in på 230 °C med en 30 m MDN-35 kapillärkolonn.
    ANMÄRKNING: Ytterligare information, t.ex. temperaturgradient, finns i tabell 1. Massområdet är inställt på 70-600 m/z med 20 skanningar/min. Inkludera delningslägen för att möjliggöra kvantifiering av förmodade överbelastningsföreningar, vilket sparar kostnader och tid för återderivatisering av extrakt i sådana fall.
  10. Inkludera flera QC-prover i alla dagliga satser och ett blankprov för att säkerställa korrigering för analytisk variation. Randomisera prover ordentligt blockvis i sekventiell ordning.

8. Kromatogrambehandling och sammansatt anteckning

  1. Filtrera kemiskt brus genom att definiera intensitetströsklar. Inkludera alla QC-prover medan du bearbetar kromatogrammen.
    För storskaliga data är brusfiltrering avgörande för att minska beräkningstiden och processorkraften.
  2. Justera kromatogrammen genom att definiera ett fönster för kvarhållningstidsförskjutning. Kontrollera kromatogrammen från varje sats för att bedöma variationen inom och mellan satser.
  3. Utför toppdetektering beroende på toppform, t.ex. höjd och bredd för full bredd vid halvmaximum (FWHM) beräkningar.
  4. Klusterisotoper för att minska redundanta signaler och filtrera bort singletons.
    OBS: Se materialtabellen för mer information om programvara som används för kromatogrambehandling. Fördjupade protokoll om hur man bearbetar kromatogram med hjälp av olika fritt tillgängliga programvaruverktyg, t.ex. MS-DIAL, MetAlign, MzMine och Xcalibur 19,20,21, tillhandahålls.
  5. Använd ddMS2-data för ett poolat QC-prov för sammansatt anteckning. Bedöm den molekylära strukturen genom att bestämma den monoisotopiska massan och observera vanliga neutrala förluster, kända laddade aglykoner och olika typer av klyvningar, t.ex. homolytiska eller heterolytiska16,22.
  6. För rapportering av metabolitdata, följ rekommendationen som beskrivs i Fernie m.fl.2011 23.
    OBS: Olika beräkningsmetabolomikmetoder kan användas för att analysera metabolomikdata 24,25,26.

9. Normalisering av storskalig metabolomikdatamängd

  1. Kontrollera fördelningen av de interna standarderna och normalisera genom att korrigera för svaret från en eller flera interna standarder.
  2. Korrigera de toppintensiteter som erhålls från kromatogrammet över den exakta provvikten genom att dividera toppintensiteterna med den alikvoterade homogeniserade provvikten från steg 2.5.
  3. Rätt för intensitetsavdrift över flera batchserier. Utföra QC-baserade korrigeringsmetoder såsom lokalt uppskattad scatterplot-utjämning (LOESS)27 med hjälp av R.
    OBS: Flera verktyg och paket finns tillgängliga för att hantera avdriften av MS-prestanda under förvärvet av helabatcherna 28,29.
  4. Säkerställ normal fördelning av egenskaper genom datatransformation, t.ex. Box-Cox transformation30 med boxcox () -funktionen från R-paketet MASS för att utföra GWAS.
  5. Utför dataskalning, t.ex. Pareto-skalning, för multivariat analys för att säkerställa korrekt vägning av föreningar med låg riklighalt 31.
    OBS: Om möjligt, utför en återställningsanalys för att undvika matriseffekter, t.ex. jonundertryckning14.

10. Genomomfattande associeringsstudier (GWAS)32

  1. Anropa enstaka nukleotidpolymorfism (SNP) eller strukturella varianter (SV) från sekvenseringsdata33,34.
  2. Filtrera genotypiska data för mindre allelfrekvens (MAF) < 5% och saknad hastighet på >10% för att undvika lågfrekvent bias med Tassel35.
  3. Beräkna bästa linjära opartiska förutsägelser (BLUP) för varje normaliserad funktion över de experimentella repetitionerna för att eliminera bias som härrör från miljöfaktorer (slumpmässiga effekter) med hjälp av R-paketet Ime436.
  4. Använd BLUP:er för varje funktion individuellt för att utföra GWAS med rMVP-paketet i R37.
    OBS: Varje metabolomikfunktion ses här som en individuell fristående fenotyp.
  5. När du utför GWAS, korrigera för befolkningsstruktur med hjälp av huvudkomponentanalys (PCA) och identitet efter tillstånd (IBS) eller vanRaden för att minimera förvirrande effekter. Överväg dessutom att använda en blandad linjär modell (MLM) eller en blandad modell med flera locus (MLMM), eftersom blandade modeller innehåller fasta och slumpmässiga effekter.

11. QTL-identifiering

  1. Kontrollera SNP: erna som visar betydande samband, med hänsyn till Manhattan-tomterna, för beräkningar av obalans i länkning (LD) för att bestämma den underliggande genetiska regionen. Utför LD-beräkningar med hjälp av R-paketet LD heatmap eller Tassel 5.
  2. Kontrollera de associerade SNP: erna för effektstorleken över egenskapen genom att undersöka egenskapsnivåerna för statistiska förändringar mellan haplotyper för att hitta potentiella kausala SNP, t.ex. SNP som leder till en aminosyraförändring i den proteinkodande sekvensen, vilket kan förklara den fenotypiska variationen.
    OBS: Eftersom SNP-egenskapsassociationer inte nödvändigtvis ger kausal association är det viktigt att bestämma den genomiska regionen. Sammansatt identitet genom funktionsanteckning kan hjälpa oerhört att hitta rätt kandidatgener i en specifik genomisk region. Vi föreslår att kombinera alla detekterade QTL associerade med vissa föreningar i en pleiotrop karta för att understryka de genetiska regionerna38, som visas i figur 4. För validering av kandidatgener kan flera tillvägagångssätt utföras (se diskussionen).

Representative Results

Framgångsrika metabolomics GWAS-experiment bör börja med en korrekt experimentell design, följt av provinsamling, extraktion, datainsamling och bearbetning, som illustreras i figur 1. I detta protokoll användes MTBE-metoden15 för att extrahera och analysera hundratals metaboliter som tillhör flera sammansatta klasser. Kromatografi beror mycket på egenskaperna hos den använda kolonnen samt elueringsbuffertblandningar. Figur 2 visar kromatogram av QC-prover, vilket indikerar elueringsmönstret för några större lipidklasser i detta analytiska system. De tillämpade gradienterna för varje plattform anges i tabell 1. Stor vikt lades vid att hantera systemfel i storskaliga experiment. Att utföra storskalig metabolomik är i sig förknippat med systemfel. För demonstration analyserade vi lipidomiska data över flera vanliga bönarter. Kompletterande tabell 1 tillhandahåller de extraherade råa lipidomiska data som erhållits efter kromatogrambehandling med hjälp av programvaran som anges i materialförteckningen. Att följa detta protokoll gjorde det möjligt för oss att kringgå stora problem vid hantering av omics-data, särskilt vid hantering av stora provuppsättningar. Normaliseringsförfarandet ger en noggrann korrigering av batchvisa analysfel, vilket visas i figur 3. Även om en ökning av antalet QC-prover skulle öka normaliseringens kraft, är detta inte alltid genomförbart på grund av kostnads- och tidsbegränsningar. För metabolomik med hög genomströmning GWAS med icke-riktade metaboliska egenskaper är det viktigt att illustrera högre antal egenskapsmarkörassociationer på lämpligt sätt. En pleiotrop karta38 som kombinerar flera GWAS-resultat kan användas för att markera de genomiska regioner som flera egenskaper är kopplade till (figur 4).

Figure 1
Figur 1: Flödesschema över metabolomikbaserade GWAS i växter. Flera steg från den experimentella designen upp till detekteringen av QTL visas i den vänstra panelen. I den högra panelen visas flera figurer för att stödja flera steg som nämns i den vänstra panelen. Med utgångspunkt från den högra toppen visas (1) en föreslagen sekvens av prover för LC-MS, (2) för- och efternormaliserade poängdiagram för PCA, inklusive en representativ funktionsfördelning före och efter bearbetning, med rött som indikerar QC-provintensiteter, och (3) en Manhattan-plot med signifikanta associationer till vilka LD- och haplotypfördelningar genererades. Förkortningar: GWAS = genomomfattande associeringsstudier; QTL = kvantitativ egenskap loci; PCA = analys av huvudkomponent; QC = kvalitetskontroll; LD = obalans i koppling; MS = masspektrometri; LC-MS = vätskekromatografi-masspektrometri; GC-MS = gaskromatografi-masspektrometri; LOESS = lokalt uppskattad spridningsplotsutjämning; MLM/MLMM = blandad linjär modell/multi-locus mixed-model. Klicka här för att se en större version av denna siffra.

Figure 2
Figur 2: Kromatogrambehandling. Två QC-kromatogram (bastopp; lipiddata) från olika satser visar den batchvisa variationen för vissa lipidklasser i de sammanslagna QC-proverna. Fyra stora lipidklasser indikeras med sina respektive elueringsfönster i det interna LC-MS-systemet. Kromatogrammen exporterades från MzMine21. Förkortningar: QC = kvalitetskontroll; LC-MS = vätskekromatografi-masspektrometri. Klicka här för att se en större version av denna siffra.

Figure 3
Figur 3: Korrigering av systematiska fel. Huvudkomponentanalys av förvärvade lipidomiska data, pre- (vänster, rådata) och efterkorrigering för systemfel (höger, batch loess). De nedre panelerna illustrerar funktionsfördelningen (Cluster_00005) över proverna (n = 650) och batcherna (n = 10) före (vänster) och efter (höger) korrigering för analytisk variation. Förkortningar: PCA = huvudkomponentanalys; QC = kvalitetskontroll; LOESS = lokalt uppskattad spridningsplotsutjämning. Klicka här för att se en större version av denna siffra.

Figure 4
Figur 4: Pleiotropisk karta som illustrerar de kombinerade GWAS-resultaten. Den pleiotropa kartan belyser regioner i hela genomet som är associerade med flera egenskaper. Siffrorna på de yttre ringarna indikerar motsvarande kromosomer. Varje cirkel representerar ett individuellt drag med dess signifikant associerade SNP. Färgerna representerar olika sammansatta klasser (grå = sammansatt klass 1; grön = sammansatt klass 2; lila = sammansatt klass 3; gul = sammansatt klass 4). Vid inter-sammansatta klassassociationer med samma genomiska region markeras gener. Den inre grå cirkeln visar summan av alla signifikanta SNP som är associerade med en specifik genomisk position. Föreningarna som visas i denna figur genereras artificiellt endast för illustration. Förkortningar: GWAS = genomomfattande associeringsstudier; SNP = en-nukleotidpolymorfismer. Klicka här för att se en större version av denna siffra.

UHPLC-MS-inställningar för lipider
Tid [min] Eluent A till B [%]* Information
0 - 1.00 45% A Elueringsmedel A: 1% 1MNH4-acetat, 0,1% ättiksyra i vatten (UHPLC-kvalitet)
1.00 - 4.00 lg 45% - 25% A Elueringsmedel B: 1% 1MNH4-acetat, 0,1% ättiksyra i acetonitril/ 2-propanol 7: 3 (UHPLC-kvalitet)
4.00 - 12.00 lg 25% - 11% A Flödeshastighet: 400 μl / min
12.00 - 15.00 lg 11% - 0% A Injektionsvolym: 2 μl
15.00 - 19.50 cw 0% A
19.50-19.51 0% - 45% A
19.51-24.00 eq 45%
UHPLC-MS/MS-inställningar för polära och halvpolära metaboliter
Tid [min] Eluent A och B [%]* Information
0 - 1.00 99% A Elueringsmedel A: 0,1% myrsyra i vatten (UHPLC-kvalitet)
1.00 - 11.00 lg 99% -60% A Elueringsmedel B: 0,1% myrsyra i acetonitril (UHPLC-klass)
11.00 - 13.00 lg 60% - 30% A Flödeshastighet: 400 μl / min
13.00 - 15.00 Lg 30% - 1% A Injektionsvolym: 3 μl
15.00 - 16.00 cw 1% A
16.00 - 17.00 lg 1% - 99% A
17.00 - 20.00 eq 99% A
GC-MS-inställningar för derivatiserade metaboliter
Tid [min] Temperatur [°C] Information
0 - 2.00 85 Bärgas: Helium
2.00 - 18.66 Lg 80 - 330 Flödeshastighet: 2 ml / min
18.66 - 24.66 cw 330 Temperaturgradient: 15 °C/min
24.66 snabb kylning Injektionsvolym: 1 μl

Tabell 1: Gradientinställningar för var och en av analysplattformarna7. Förkortningar: lg = linjär gradient; cw = kolonntvätt; eq = jämvikt; UHPLC-MS = ultrahögprestanda flytande kromatografi-masspektrometri; UHPLC-MS/MS = ultrahögprestanda flytande kromatografi-tandem masspektrometri; GC-MS = gaskromatografi-masspektrometri. * = procentvärde motsvarar elueringsmedel A; återstående procentvärde motsvarar elueringsmedel B.

Kompletterande tabell 1: Rå lipidomikdata. Anger toppintensiteterna för vart och ett av de identifierade klustren över varje prov. Klicka här för att ladda ner denna tabell.

Discussion

Både GC-MS och LC-MS är allmänt använda verktyg för profilering av komplexa blandningar av olika metabolitklasser. Att hantera stora datamängder med dessa verktyg är i sig förknippat med en icke-biologisk variation, t.ex. analytisk variation, som stör och snedvrider tolkningen av resultaten. Detta protokoll presenterar en robust extraktionspipeline med hög genomströmning för omfattande metabolisk profilering för att eliminera variation av icke-biologiskt ursprung och genomföra storskaliga "omics" -studier. Volymerna och koncentrationerna som användes i detta protokoll justerades för baljväxtarter i olika vävnader. Dessa parametrar kan dock modifieras något och användas för storskaliga metaboliska prover från andra växtarter också.

De tidigare15 beskrivna MTBE-baserade extraktionerna kan användas för att analysera derivatiserade metaboliter, halvpolära metaboliter och lipider. Detta kan utökas för protein- och växthormonextraktioner39, som inte omfattades av detta protokoll. Andra extraktionsprotokoll bygger på diklormetan:etanolblandningar40,41. Av dessa extraktionsprotokoll ger MTBE: metanolextraktionsprotokollet ett gynnsamt och mindre farligt alternativ till de befintliga kloroformbaserade extraktionsprotokollen42 och resulterar inte i en proteinpellets som en interfas mellan polar- och lipidfaserna. Vidare har MTBE-metoder redan använts i flera studier för olika biologiska prover 43,44,45.

Detta protokoll diskuterar flera viktiga steg som kan leda till potentiell variation vid hantering av ett stort antal prover, t.ex. under skördav 12,13, extraktion14 samt randomisering46. Dessutom finns det ytterligare frågor som inte har diskuterats i detta protokoll som måste beaktas för att säkerställa högkvalitativa metabolomiska data, t.ex. matriseffekt och jonundertryckning14.

Kraften hos QC-baserade normaliseringsmetoder beror i sig på antalet QC-prover i varje sats. Som tidigare nämnts, även om en ökning av antalet skulle öka effekten, är variationen inom batchen av QC: erna relativt marginell jämfört med variationen mellan satser i dessa analytiska system, vilket illustreras i figur 3. Sammantaget finns det andra QC-baserade normaliseringsmetoder, såsom systemisk felborttagning med slumpmässig skog (SERRF), som har visat sig överträffa de flesta andra normaliseringsmetoder som batch-wise-ratio, normalisering med ett optimalt urval av flera interna standarder (NOMIS) och probabilistisk kvotnormalisering (PQN)47 . SERRF förlitar sig dock på flera QC-prover i varje sats, t.ex. vart tionde prov, vilket inte är möjligt vid hantering av ett stort antal prover. Den största fördelen med QC-baserad normalisering jämfört med andra datadrivna eller interna standardbaserade metoder är att den behåller den väsentliga biologiska variationen samtidigt som den tillgodoser oönskad teknisk variation28. Läsarna kan hänvisa till denna recension om hanteringen av variant28.

Ett huvudproblem i GWAS är frekvensen av falska positiva resultat, som främst härrör från kopplingen mellan kausala och icke-kausala platser48,49. För det andra korrigerar de konservativa statistiska korrigeringsmetoderna, t.ex. Bonferroni och FDR, för antalet oberoende tester, vilket inte är lika med antalet analyserade SNP i GWAS på grund av kopplingen mellan närliggande SNP50,51 Därför är det faktiska antalet oberoende tester ofta lägre. Ett annat sätt att minska den konservativa statistiska tröskeln skulle vara att minska antalet testade SNP som används för GWAS baserat på länkningsförfall över definierade genomiska regioner52. Den GWAS-integrerade metabolomikplattformen med hög genomströmning som beskrivs i detta protokoll har ett brett spektrum av applikationer. I synnerhet kommer det att underlätta förbättringar i växtförädling genom att ändra metabolit/ lipidkompositionen för industriellt och näringsmässigt önskade nivåer. Sammantaget har metabolomik gett en djupgående inblick i den genetiska arkitekturen hos en uppsjö av metaboliter och metabolisk diversifiering som inträffade under grödans domesticering under de senaste decennierna, vilket indikerar den stora potentialen för metabolomikassocierad avel53. De molekylärbiologiska metoderna för nedströms QTL-validering inkluderar generering av CRISPR / Cas9-mutantlinjer54, T-DNA-insättningslinjer55, stabila och / eller övergående överuttryckslinjer56, VIGS, ex vivo metabolomikmetoder57 bredvid det konventionella tillvägagångssättet för att generera kors F2-populationer samt korsvalidering i olika populationer.

Genom att utföra den nödvändiga korrigeringen för de analytiska variationerna som beskrivs ovan kan flera integrerade tillvägagångssätt utföras utöver GWAS, såsom metabolit-metabolit, metabolit-lipidkorrelationsanalys, korrelationsanalys till fenomeniska data för att belysa mer komplexa egenskaper och / eller samuttrycksanalys för att ytterligare riva upp grunden för biologiska system58.

Disclosures

Författarna har inga intressekonflikter att deklarera.

Acknowledgments

MB stöds av IMPRS-PMPG "Primary Metabolism and Plant Growth". A.R.F. och S.A. erkänner det ekonomiska stödet från EU:s forsknings- och innovationsprogram Horisont 2020, projektet PlantaSYST (SGA-CSA nr 739582 enligt FPA nr 664620) och projektet INCREASE (GA 862862).

Materials

Name Company Catalog Number Comments
Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) Avanti Polar Lipids 850360P Internal standard for lipids
Chloroform Supleco 67-66-3 FAME solvent
Isovitexin Sigma Aldrich 38953-85-4 Internal standard for metabolites
Lignoceric Acid Methylester Sigma Aldrich 2442-49-1 FAME
Methanol (MeOH) Biosolve Chemicals 13684102 ULC-MS grade
Methoxyamin -hydrochlorid Sigma Aldrich 593-56-6 Metabolite deriviatization
Methyl laurate Sigma Aldrich 111-82-0 FAME
Methyl myristate Sigma Aldrich 124-10-7 FAME
Methyl palmitate Sigma Aldrich 112-39-0 FAME
Methyl stearate Sigma Aldrich 112-61-8 FAME
Methyl tert-butyl ether (MTBE) Biosolve Chemicals 13890602 HPLC grade
Methyl-caprat Sigma Aldrich 110-42-9 FAME
Methylcaprylat Sigma Aldrich 111-11-5 FAME
Methyldocosanoat Sigma Aldrich 929-77-1 FAME
Methyleicosanoat Sigma Aldrich 1120-28-1 FAME
Methyl-hexacosanoat Sigma Aldrich 5802-82-4 FAME
Methyl-octacosanoat Sigma Aldrich 55682-92-3 FAME
Methyl-pelargonate Sigma Aldrich 1731-84-6 FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) Macherey-Nagel 24589-78-4 Metabolite deriviatization
Pyridine Supleco 110-86-1 Metabolite deriviatization
Ribitol Supleco 22566-17-2 Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester TCI Chemicals 629-83-4 FAME
Water Biosolve Chemicals 23214102 ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes Eppendorf 3120086
2 mL Safe-lock microcentrifuge tubes Eppendorf 3120094
Balance Sartorius Corporation 14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm Aglient 123-3832 Analysis of derivatized metabolites
GC-MS system Leco Pegasus HT TOF-MS (LECO Corporation) Analysis of derivatized metabolites
Grinding Balls, Stainless Steel OPS DIAGNOSTICS GBSS 196-2500-10
MS system Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) Analysis of lipids
MS system Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™
Massenspektrometer, Thermo Fisher Scientific)
Analysis of metabolites
Refrigerated microcentrifuge Eppendorf, model 5427R 22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column
(100 mm × 2.1 mm containing 1.7 μm diameter particles)
Waters 186002878 Analysis of lipids
RP High Strength Silica (HSS) T3 column
(100 mm × 2.1 mm containing 1.8 μm diameter particles)
Waters 186003539 Analysis of metabolites
Shaker Eppendorf Thermomixer 5436 2050-100-05
Sonicator USC 300 TH 142-0084
Tissue grinding mixer mill Retsch, Mixer Mill MM 300 20.746.0001
UPLC system Waters Acquity UPLC system (Waters)
Vacuum concentrator Scan Speed Maxi Vac Alpha Evaporators 7.008.500.002
Vortex mixer Vortex-Genie 2, Model G560 SI-0236
Software
MetAlign Chromatogram processing
MzMine Chromatogram processing
R package "data.table"
R package "fujiplot" pleiotrpoic map
R package "genetics"
R package "Ime4" BLUPs calculation
R package "LDheatmap" LD plots
R package "MASS" transformation
R package "rMVP" GWAS
R version 4.0.4
RefinerMS Chromatogram processing
RefinerMS Genedata Expressionist Chromatogram processing
Tassel 5 Genotype filtering
Xcalibur Thermo Fisher Scientific OPTON-30965 Chromatogram processing

DOWNLOAD MATERIALS LIST

References

  1. Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
  2. Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
  3. Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
  4. Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
  5. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  6. Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
  7. Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
  8. Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
  9. Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
  10. vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
  11. Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
  12. Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
  13. Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
  14. Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
  15. Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
  16. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
  17. Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
  18. Osorio, S., Do, P. T., Fernie, A. R. Plant Metabolomics: Methods and Protocols. Hardy, N. W., Hall, R. D. , Humana Press. 101-109 (2012).
  19. De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
  20. Perez de Souza,, Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
  21. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  22. Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , John Wiley & Sons, Ltd. 315 (2007).
  23. Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
  24. Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
  25. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  26. Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
  27. Chambers, J. M. Statistical models in S. , CRC Press, Inc. (1991).
  28. Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
  29. Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
  30. Sakia, R. M. The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
  31. vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
  32. Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
  33. Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
  34. Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
  35. Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  36. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
  37. Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
  38. Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
  39. Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
  40. Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
  41. Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
  42. Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
  43. Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
  44. Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
  45. Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
  46. Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
  47. Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
  48. Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
  49. Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
  50. Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
  51. Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
  52. Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
  53. Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
  54. Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
  55. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  56. Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
  57. Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
  58. Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Tags

Biokemi utgåva 173
Storskaliga Multi-omics Genome-wide Association Studies (Mo-GWAS): Riktlinjer för provberedning och normalisering
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Bulut, M., Fernie, A. R., Alseekh,More

Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter