Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Een Pathway Association Study Tool voor GWAS-analyses van metabole Pathway-informatie

Published: July 1, 2020 doi: 10.3791/61268

ERRATUM NOTICE

Summary

Door de Pathway Association Study Tool (PAST) uit te voeren, hetzij via de Shiny-applicatie of via de R-console, kunnen onderzoekers een dieper inzicht krijgen in de biologische betekenis van hun genoombrede associatiestudie (GWAS) -resultaten door de betrokken metabole routes te onderzoeken.

Abstract

Onlangs is een nieuwe implementatie van een eerder beschreven methode voor het interpreteren van genoombrede associatiestudie (GWAS) -gegevens met behulp van metabole route-analyse ontwikkeld en vrijgegeven. De Pathway Association Study Tool (PAST) is ontwikkeld om problemen aan te pakken met gebruiksvriendelijkheid en traag lopende analyses. Deze nieuwe gebruiksvriendelijke tool is uitgebracht op Bioconductor en Github. Bij het testen voerde PAST analyses uit in minder dan een uur die voorheen vierentwintig of meer uur nodig hadden. In dit artikel presenteren we het protocol voor het gebruik van de Shiny-toepassing of de R-console om PAST uit te voeren.

Introduction

Genome-wide association studies (GWAS) zijn een populaire methode voor het bestuderen van complexe eigenschappen en de genomische regio's die ermee geassocieerd zijn1,2,3. In dit type onderzoek worden honderdduizenden single nucleotide polymorphism (SNP) markers getest op hun associatie met de eigenschap en wordt de significantie van de associaties beoordeeld. Marker-trait associaties die voldoen aan de false discovery rate (FDR) drempel (of een ander type significantie drempel) worden behouden voor het onderzoek, maar echte associaties kunnen worden uitgefilterd. Voor complexe, polygene eigenschappen kan het effect van elk gen klein zijn (en dus uitgefilterd), en sommige allelen worden alleen uitgedrukt in specifieke omstandigheden die mogelijk niet aanwezig zijn in het onderzoek3. Dus, hoewel veel SNP's kunnen worden behouden zoals geassocieerd met de eigenschap, kan elk een zeer klein effect hebben. Te veel SNP-oproepen zullen ontbreken en een interpretatie van de biologische betekenis en genetische architectuur van de eigenschap kan onvolledig en verwarrend zijn. Metabole route-analyse kan helpen om enkele van deze problemen aan te pakken door zich te concentreren op de gecombineerde effecten van genen gegroepeerd volgens hun biologische functie4,5,6.

Verschillende studies werden voltooid met behulp van een eerdere implementatie van de methode die in dit artikel wordt beschreven. Aflatoxine accumulatie7, maïsoorwormresistentie8en oliebiosynthese 9 werdenallemaal bestudeerd met de vorige implementatie. Hoewel deze analyses succesvol waren, was het analyseproces ingewikkeld, tijdrovend en omslachtig, omdat de analysetools waren geschreven in een combinatie van R, Perl en Bash en de pijplijn niet geautomatiseerd was. Vanwege de specialistische kennis die nodig is om deze methode voor elke analyse aan te passen, is er nu een nieuwe methode ontwikkeld die gedeeld kan worden met andere onderzoekers.

De Pathway Association Study Tool (PAST)10 is ontworpen om de tekortkomingen van de vorige methode aan te pakken door minder kennis van programmeertalen te vereisen en door analyses in een kortere periode uit te voeren. Hoewel de methode werd getest met maïs, maakt PAST geen soortspecifieke aannames. PAST kan worden uitgevoerd via de R-console, als een Shiny-app, en een online versie zal naar verwachting binnenkort beschikbaar zijn op MaizeGDB.

Protocol

1. Instellen

  1. Installeer R, als het nog niet is geïnstalleerd.
    OPMERKING: PAST is geschreven in R en vereist daarom dat de gebruikers R hebben geïnstalleerd. Op het moment van schrijven vereist het installeren van PAST rechtstreeks vanuit Bioconductor R4.0.  Oudere versies van PAST kunnen worden geïnstalleerd vanuit Bioconductor voor R3.6 en PAST kan worden geïnstalleerd vanuit Github voor gebruikers met R3.5. R installatie-instructies kunnen worden gedownload via de volgende link: https://www.r-project.org/.
  2. Installeer de nieuwste versie van RStudio Desktop of werk RStudio bij (optioneel).
    OPMERKING: RStudio is een handige omgeving voor het werken met de R-taal. De installatie ervan wordt aanbevolen, vooral voor degenen die ervoor kiezen om PAST op de opdrachtregel uit te voeren in plaats van via de Shiny GUI-applicatie. RStudio en de installatie-instructies zijn te vinden op de volgende link: https://rstudio.com/products/rstudio/.
  3. Installeer PAST van Bioconductor11 door de instructies op Bioconductor te volgen.
    OPMERKING: Installatie via Bioconductor moet de installatie van de afhankelijkheden van PAST afhandelen. Bovendien kan PAST worden geïnstalleerd vanuit Github12, maar installeren vanuit Github zal niet automatisch afhankelijkheden installeren.
  4. Installeer PAST Shiny (optioneel). Download het bestand "app. R" op de pagina Releases van de Github-repository: https://github.com/IGBB/PAST/releases/ en onthoud waar het gedownloade bestand zich bevindt.
    OPMERKING: PAST kan worden gebruikt door de methoden rechtstreeks met R aan te roepen, maar gebruikers die minder bekend zijn met R kunnen de PAST Shiny-applicatie uitvoeren, die een begeleide gebruikersinterface biedt. PAST Shiny is een R-script dat beschikbaar is in de shiny_app tak van de PAST Github-repository. PAST Shiny zal proberen zijn afhankelijkheden te installeren tijdens de eerste run.
  5. Begin de analyse door de toepassing op een van de drie hieronder beschreven manieren te starten.
    1. PAST Shiny met RStudio
      1. Maak met RStudio een nieuw project in de map waarin de app zich bevindt. R bevindt zich. Klik op Bestand | Nieuw Project en selecteer die map.
      2. Zodra een nieuw project is gemaakt, opent u de app. R-bestand eerder gedownload. RStudio herkent die app. R is een Shiny-app en maakt een Knop App uitvoeren op de balk boven de weergegeven broncode. Klik op App uitvoeren. RStudio start dan een venster waarin de toepassing PAST Shiny wordt weergegeven.
    2. PAST Shiny met R Console
      1. Start R en voer de volgende code uit om de PAST Shiny-applicatie te starten: shiny::runApp('path/to/folder/with/shiny/app. R'. Vervang de tekst tussen aanhalingstekens door de map naar welke app. R is gedownload en bewaar de citaten.
    3. VERLEDEN zonder R Shiny
      1. Voer library(PAST) uit in een R-console om PAST te laden.

2. Pas shiny analyse aan (optioneel)

  1. Wijzig de titel van de analyse van "Nieuwe analyse" in iets dat beter het type analyse weergeeft dat wordt uitgevoerd, wat helpt om meerdere analyses bij te houden (zie figuur 1).

Figure 1
Figuur 1. Klik hier om een grotere versie van deze figuur te bekijken.

  1. Wijzig het aantal kernen en de modus. Stel het aantal kernen in op een willekeurig getal tussen 1 en het totale aantal op de machine, maar houd er rekening mee dat het besteden van meer bronnen aan PAST andere bewerkingen op de machine kan vertragen. Stel de modus in op basis van de beschrijving in sectie 6.

3. Laad GWAS-gegevens

OPMERKING: Controleer of de GWAS-gegevens door tabs zijn gescheiden. Zorg ervoor dat het associatiebestand de volgende kolommen bevat: eigenschap, markernaam, locus of chromosoom, positie op het chromosoom, p-waarde en R2-waarde voor de marker. Zorg ervoor dat het effectenbestand de volgende kolommen bevat: eigenschap, markernaam, locus of chromosoom, positie op het chromosoom en effect. De volgorde van deze kolommen is niet belangrijk, omdat de gebruiker de namen van de kolommen kan opgeven bij het laden van de gegevens. Eventuele extra kolommen worden genegeerd. TASSEL13 kan worden gebruikt om deze bestanden te produceren.

  1. Laad GWAS-gegevens met PAST Shiny.
    1. Selecteer een koppelingsbestand en een effectbestand met behulp van de selectievakken Associatiebestand en Effectbestand. Wijzig de kolomnamen in de invoervakken Naam van koppelingskolom en Naam van effectkolommen onder de bestandsselectievakken om de kolomnamen in de gegevens weer te geven.

Figure 2
Figuur 2. Klik hier om een grotere versie van deze figuur te bekijken.

  1. Laad GWAS-gegevens met PAST in de R-console.
    1. Wijzig en voer de volgende code uit:
      gwas_data = load_GWAS_data("path/to/association_file.tsv", "path/to/effects_file.tsv", association_columns = c("Trait", "Marker", "Locus", "Site", "p", "marker_R2"), effects_columns = c("Trait", "Marker", "Locus", "Site", "Effect")
  2. OPMERKING: Wijzig de paden naar de werkelijke locatie van de GWAS-bestanden. De waarden voor association_columns en effects_columns zijn de standaardwaarden. Als de namen niet overeenkomen met de standaardwaarden, geeft u de kolomnamen op. Anders kunnen deze worden weggelaten.

4. Load linkage disequilibrium (LD) gegevens

OPMERKING: Controleer of de linkage disequilibrium (LD)-gegevens door tabs zijn gescheiden en de volgende typen gegevens bevatten: Locus, Position1, Site1, Position2, Site2, Distance in base pairs between Position1 and Position2, en R2 value.

  1. Laad LD-gegevens met PAST Shiny.
    1. Selecteer het bestand met LD-gegevens. Wijzig indien nodig de kolomnamen in de invoervakken LD-kolomnamen onder het bestandsselectievak om overeen te komen met de kolomnamen in de LD-gegevens.

Figure 3
Figuur 3. Klik hier om een grotere versie van deze figuur te bekijken.

  1. Laad LD-gegevens met PAST in de R-console.
    1. Wijzig en voer de volgende code uit om LD-gegevens te laden:
      LD = load_LD("path/to/LD.tsv", LD_columns = c("Locus1", "Position1", "Site1", "Position2", "Site2", "Dist_bp", "R.2")
      OPMERKING: Wijzig het pad naar de werkelijke locatie van het LD-bestand. De waarden voor LD_columns zijn de standaardwaarden. Als de namen niet overeenkomen met deze standaardwaarden, geeft u de juiste namen van de kolommen op. anders kunnen deze worden weggelaten.

5. Wijs SNP's toe aan genen

OPMERKING: Download annotaties in GFF-indeling of zoek ze anderszins. Deze annotaties zijn vaak te vinden in online databases voor specifieke organismen. Wees voorzichtig met annotaties van lage kwaliteit, omdat de kwaliteit van de annotatiesgegevens van invloed is op de kwaliteit van de pathway-analyse. Controleer of de eerste kolom van deze annotaties (het chromosoom) overeenkomt met het formaat van de locus/chromosoom in de associatie-, effecten- en LD-gegevens. De annotaties mogen bijvoorbeeld het eerste chromosoom niet "chr1" noemen als de GWAS- en LD-gegevensbestanden het eerste chromosoom "1" noemen.

  1. Wijs SNP's toe aan genen met PAST Shiny.
    OPMERKING: Meer informatie over het bepalen van een geschikte R2-cutoff is te vinden in Tang et al.6, in de sectie genaamd "SNP naar genalgoritme voor de pathway-analyse".
    1. Selecteer het bestand met SFF-annotaties. Overweeg welke venstergrootte en R 2-afsnijding het meest geschikt zijn voor de soort die wordt overwogen en wijzig deze als de standaardinstellingen niet geschikt zijn voor de geüploade gegevens.
      OPMERKING: Standaardwaarden in het VERLEDEN weerspiegelen voornamelijk waarden die geschikt zijn voor maïs. Het aantal kernen dat aan het begin van de PAST Shiny-analyse (stap 2.2) is ingesteld, wordt in deze stap gebruikt.

Figure 4
Figuur 4. Klik hier om een grotere versie van deze figuur te bekijken.

  1. Wijs SNP's toe aan genen met PAST in de R Console.
    1. Wijzig en voer de volgende code uit om SNP's aan genen toe te wijzen:
      genen = assign_SNPs_to_genes(gwas_data, LD, "path/to/annotations.gff", c("gen"), 1000, 0.8, 2)
      OPMERKING: In deze voorbeeldcode worden verschillende standaardsuggesties gegeven: 1000 is de grootte van het venster rond de SNP om naar genen te zoeken; 0,8 de onderwaarde voor R2is; 2 is het aantal kernen dat wordt gebruikt voor parallelle verwerking. Het pad naar de annotaties moet ook worden gewijzigd in de werkelijke locatie van het annotatiesbestand.

6. Ontdek belangrijke paden

OPMERKING: Controleer of het pathways-bestand de volgende gegevens bevat in door tabs gescheiden indeling, met één regel voor elk gen in elk pathway: Pathway ID - een id zoals "PWY-6475-1"; routebeschrijving - een langere beschrijving van wat de routes doen, zoals "trans-lycopeen biosynthese"; gen - een gen in de route, dat moet overeenkomen met de namen in de annotaties. Route-informatie is waarschijnlijk te vinden in online databases voor specifieke organismen, zoals MaizeGDB. De tweede door de gebruiker opgegeven optie is de modus. "Toenemend" verwijst naar fenotypen die weerspiegelen wanneer een toenemende waarde van de gemeten eigenschap wenselijk is, zoals opbrengst, terwijl "afnemend" verwijst naar een eigenschap waarbij een afname van de gemeten waarden gunstig is, zoals insectenschadeclassificaties. De significantie van pathways wordt getest met behulp van eerder beschreven methoden4,6,14.

  1. Ontdek belangrijke paden met PAST Shiny.
    1. Selecteer het bestand met pathwaygegevens en zorg ervoor dat de modus is geselecteerd in de analyseopties. Verander indien nodig het aantal genen dat zich in een route moet hebben om het te behouden voor de analyse en het aantal permutaties dat wordt gebruikt om de nulverdeling te creëren om de significantie van het effect te testen.

Figure 5
Figuur 5. Klik hier om een grotere versie van deze figuur te bekijken.

OPMERKING: Het aantal kernen en de modus die aan het begin van de PAST Shiny-analyse (stap 2.2) is ingesteld, wordt in deze stap gebruikt. Het standaard aantal genen is momenteel ingesteld op 5 genen, dus paden met minder bekende genen zullen worden verwijderd. De gebruiker kan deze waarde verlagen tot 4 of 3, om kortere paden op te nemen, maar dit riskeert vals-positieve resultaten. Het verhogen van deze waarde kan de kracht van de analyse vergroten, maar zal meer paden uit de analyse verwijderen. Het wijzigen van het aantal gebruikte permutaties verhoogt en verlaagt het vermogen van de test.

  1. Ontdek belangrijke paden met PAST in de R Console.
    1. Wijzig en voer de volgende code uit om belangrijke paden te ontdekken:
      rugplots_data <- find_pathway_significance(genen, "path/to/pathways.tsv", 5, "toenemend", 1000, 2)
      OPMERKING: In deze voorbeeldcode worden verschillende voorgestelde standaardwaarden weergegeven. 5 is het minimum aantal genen dat zich in een pathway moet bevindt om de pathway in de analyse te houden, verhogen verwijst naar een toenemend deel van de gemeten eigenschap (het wordt aanbevolen dat de gebruiker zowel toenemend als afnemend uitvoert, ongeacht de eigenschap; gegevensinterpretatie zal echter verschillen voor de twee), 1000 is het aantal keren dat de effecten worden bemonsterd om de nulverdeling te bepalen, en 2 is het aantal kernen dat wordt gebruikt voor parallelle verwerking. Wijzig het pad naar de werkelijke locatie van het padenbestand.

7. Bekijk Rugplots

  1. Bekijk Rugplots met PAST Shiny.
    1. Zodra alle invoer is geüpload en ingesteld, klikt u op Analyse starten. Er verschijnt een voortgangsbalk die aangeeft welke stap van de analyse voor het laatst is voltooid. Wanneer de analyse is voltooid, schakelt PAST Shiny over naar het tabblad Resultaten. Een tabel met resultaten wordt weergegeven in de linkerkolom (met het label "pathways") en de Rugplots worden weergegeven in de rechterkolom (met het label "plots").
    2. Gebruik de schuifregelaar om de filterparameters te beheren. Wanneer het filterniveau bevredigend is, klikt u op de knop Resultaten downloaden linksonder om alle afbeeldingen en tabellen afzonderlijk te downloaden naar een ZIP-bestand met de naam van de analysetitel. Dit ZIP-bestand bevat de gefilterde tabel, de ongefilterde tabel en één afbeelding per pad in de gefilterde tabel.

Figure 6
Figuur 6. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 7
Figuur 7. Klik hier om een grotere versie van deze figuur te bekijken.

  1. Bekijk Rugplots met PAST in de R Console
    1. Wijzig en voer de volgende code uit om de resultaten op te slaan:
      plot_pathways(rugplots_data, "pvalue", 0,02, "increasing", "output_folder")
      OPMERKING: In deze voorbeeldcode worden verschillende voorgestelde standaardwaarden weergegeven. pvalue biedt de gegevens die kunnen worden gebruikt voor het filteren van onbeduidende paden nadat een significantiedrempel door de gebruiker is gekozen; 0.02 is de standaardwaarde die wordt gebruikt bij het filteren en verhogen verwijst naar een toenemend deel van de gemeten eigenschap (het wordt aanbevolen dat de gebruiker zowel verhogend als afnemend uitvoert, ongeacht de eigenschap; de interpretatie van de gegevens zal echter verschillen voor de twee); output_folder is de map waarin de afbeeldingen en tabellen worden geschreven (deze map moet bestaan voordat de functie wordt uitgevoerd). Een tabel met gefilterde resultaten, de ongefilterde resultaten en afzonderlijke afbeeldingen voor elk pad in de gefilterde resultaten worden naar deze map geschreven.

Representative Results

Als er geen resultaten worden geproduceerd na een run van de PAST-softwaretool, controleer dan of alle invoerbestanden correct zijn geformatteerd. Een succesvolle run met behulp van de voorbeeldgegevens in het PAST-pakket, die zijn gebaseerd op een maïs-GWAS van korrelkleur, is weergegeven in figuur 8. Deze tabel en de resulterende afbeelding kunnen worden gedownload met behulp van de knop Resultaten downloaden. Een voorbeeld van de gedownloade afbeelding is weergegeven in figuur 210. Onjuiste instellingen kunnen leiden tot resultaten die biologisch niet logisch zijn, maar het bepalen van onjuistheid moet aan de onderzoeker zijn, die de geldigheid van de gekozen instellingen dubbel moet controleren en al het bekende bewijs met betrekking tot de eigenschap van belang moet overwegen.

Figuur 910 toont de rugplot geproduceerd uit de padanalyse van GWAS-resultaten gemaakt met een maïspaneel van 288 inteeltlijnen die waren gefenotypeerd voor korrelkleur. Dit simplistische voorbeeld, waarbij de fenotypen "wit" of "geel" waren, werd gebruikt omdat de route die verantwoordelijk is voor het maken van de felgele carotenoïde pigmenten bekend is en verantwoordelijk zou moeten zijn voor het grootste deel van het fenotype. We verwachtten dus dat de trans-lycopeen biosyntheseroute (die carotenoïden produceert) aanzienlijk geassocieerd zou zijn met de korrelkleur, wat het is. Pad-ID en naam worden boven aan de grafiek weergegeven. De horizontale as van de grafiek rangschikt alle genen die in de analyse zijn opgenomen, gerangschikt van links naar rechts in volgorde van grootste effect op de eigenschap tot kleinste. Alleen de genen in de trans-lycopeen biosyntheseroute zijn echter gemarkeerd (bovenaan de grafiek, als hatch marks, verschijnend in de genrang van hun effect in vergelijking met alle andere genen in de analyse). Er zijn 7 genen in deze route. De lopende verrijkingsscore (ES) wordt uitgezet langs de verticale as. De ES voor elk gen wordt toegevoegd aan het lopende totaal in volgorde van effect en het totaal wordt aangepast aan het aantal geanalyseerde genen. De score verandert dus als men vlak langs de horizontale as beweegt en heeft de neiging om toe te nemen naarmate de grotere effectgenen worden opgenomen, maar op een gegeven moment is de toename van het effect kleiner dan de aanpassing voor het toevoegen van een ander gen en begint de hele score af te nemen. De top van de lopende ES-lijn is gemarkeerd met een gestippelde verticale lijn; dit is de ES voor het hele traject en wordt door het programma gebruikt om te bepalen of het traject wordt gekozen en gepresenteerd als een rugplot.

Figure 8
Figuur 8: Voltooide run van PAST Shiny. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 9
Figuur 9: Pathway afbeelding van voltooide run van PAST (of gedownload van Shiny). Dit cijfer is aangehaald uit Thrash et al.10. Klik hier om een grotere versie van deze figuur te bekijken.

Discussion

Een primair doel van PAST is om metabole routeanalyses van GWAS-gegevens naar een breder publiek te brengen, vooral voor niet-menselijke en niet-dierlijke organismen. Alternatieve methoden voor PAST zijn vaak opdrachtregelprogramma's die zich richten op mensen of dieren. Gebruiksvriendelijkheid was een primair doel bij de ontwikkeling van PAST, zowel bij de keuze om een Shiny applicatie te ontwikkelen als bij de keuze om R en Bioconductor te gebruiken om de applicatie vrij te geven. Gebruikers hoeven niet te leren hoe ze programma's moeten compileren om PAST te gebruiken.

Zoals bij de meeste soorten analysesoftware zijn de resultaten van PAST slechts zo goed als de invoergegevens; als de invoergegevens fouten bevatten of onjuist zijn geformatteerd, kan PAST niet worden uitgevoerd of niet-informatief resultaten opleveren. Ervoor zorgen dat de GWAS-gegevens, LD-gegevens, annotaties en pathways-bestanden correct zijn geformatteerd, is van cruciaal belang voor het ontvangen van de juiste uitvoer van PAST. PAST analyseert alleen bi-allelische markers en kan slechts één eigenschap uitvoeren voor elke set invoergegevens. Bovendien zullen GWAS-gegevens die worden geproduceerd door slechte genotypering of onjuiste of onnauwkeurige fenotypering waarschijnlijk ook geen duidelijke of herhaalbare resultaten opleveren. PAST kan helpen bij de biologische interpretatie van GWAS-resultaten, maar het is onwaarschijnlijk dat chaotische datasets worden verduidelijkt als omgevingsvariatie, experimentele fouten of populatiestructuur niet goed zijn verantwoord.

Gebruikers kunnen ervoor kiezen om sommige parameters van de analyse te wijzigen, zowel in de Shiny-applicatie als door deze parameters door te geven aan de functies van PAST in de R-console. Deze parameters kunnen de resultaten wijzigen die door PAST worden gerapporteerd en gebruikers moeten voorzichtig zijn bij het wijzigen van deze vanuit de standaardwaarden. Omdat LD wordt gemeten door de gebruikers, meestal met behulp van dezelfde markergegevensset die ook in de GWAS werd gebruikt, zijn de LD-metingen specifiek voor de populatie. Voor alle onderzoeken, met name voor andere soorten dan maïs (met name zelfbestuivende, polyploïde of zeer heterogene soorten), kunnen veranderingen in de standaardwaarden gerechtvaardigd zijn.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

Geen.

Materials

Name Company Catalog Number Comments
Computer NA NA Any computer with 8GB RAM should be sufficient
R R Project NA R 4.0 or greater is required to install from Bioconductor 3.11

DOWNLOAD MATERIALS LIST

References

  1. Rafalski, J. Association genetics in crop improvement. Current Opinion in Plant Biology. 13 (2), 174-180 (2010).
  2. Yan, J., Warburton, M., Crouch, J. Association Mapping for Enhancing Maize (Zea mays L.) Genetic Improvement. Crop Science. 51 (2), 433-449 (2011).
  3. Xiao, Y., Liu, H., Wu, L., Warburton, M., Yan, J. Genome-wide Association Studies in Maize: Praise and Stargaze. Molecular Plant. 10 (3), 359-374 (2017).
  4. Wang, K., Li, M., Bucan, M. Pathway-Based Approaches for Analysis of Genomewide Association Studies. The American Journal of Human Genetics. 81 (6), 1278-1283 (2007).
  5. Weng, L., et al. SNP-based pathway enrichment analysis for genome-wide association studies. BMC Bioinformatics. 12 (1), 99 (2011).
  6. Tang, J., Perkins, A., Williams, W., Warburton, M. Using genome-wide associations to identify metabolic pathways involved in maize aflatoxin accumulation resistance. BMC Genomics. 16 (1), 673 (2015).
  7. Warburton, M., et al. Genome-Wide Association Mapping of Aspergillus flavus and Aflatoxin Accumulation Resistance in Maize. Crop Science. 55 (5), 1857-1867 (2015).
  8. Warburton, M., et al. Genome-Wide Association and Metabolic Pathway Analysis of Corn Earworm Resistance in Maize. The Plant Genome. 11 (1), 170069 (2018).
  9. Li, H., Thrash, A., Tang, J., He, L., Yan, J., Warburton, M. Leveraging GWAS data to identify metabolic pathways and networks involved in maize lipid biosynthesis. The Plant Journal. 98 (5), 853-863 (2019).
  10. Thrash, A., Tang, J., DeOrnellis, M., Peterson, D., Warburton, M. PAST: The Pathway Association Studies Tool to Infer Biological Meaning from GWAS Datasets. Plants. 9 (1), 58 (2020).
  11. Adam, T., Mason, D. PAST: Pathway Association Study Tool (PAST). Bioconductor version: Release (3.10). , (2020).
  12. Thrash, A., DeOrnellis, M. IGBB/PAST. , at https://github.com/IGBB/PAST (2019).
  13. Bradbury, P., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  14. Subramanian, A., et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences U.S.A. 102, 15545-15550 (2005).

Tags

Genetica genoombrede associatieanalyse GWAS metabole route-analyse gegevensinterpretatie software R Bioconductor

Erratum

Formal Correction: Erratum: A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information
Posted by JoVE Editors on 10/08/2021. Citeable Link.

An erratum was issued for: A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. One of the affiliations was updated.

The second affiliation was updated from:

USDA-ARS Corn Host Plant Resistance Research Unit, Mississippi State University

to:

Corn Host Plant Resistance Research Unit, USDA-ARS

Een Pathway Association Study Tool voor GWAS-analyses van metabole Pathway-informatie
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Thrash, A., Warburton, M. L. AMore

Thrash, A., Warburton, M. L. A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. J. Vis. Exp. (161), e61268, doi:10.3791/61268 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter