A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information

Adam Thrash; Marilyn  L Warburton

doi:10.3791/61268

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

신진 대사 경로 정보의 GWAS 분석을 위한 통로 협회 연구 도구

Published: July 01, 2020

doi:

10.3791/61268

Adam Thrash, Marilyn L Warburton

¹Institute for Genomics, Biocomputing & Biotechnology,Mississippi State University, ²Corn Host Plant Resistance Research Unit,USDA-ARS

Summary

경로 협회 연구 도구 (과거)를 실행 하 여, 빛나는 응용 프로그램을 통해 또는 R 콘솔을 통해, 연구원은 그들의 게놈 전체 협회 연구의 생물학적 의미의 깊은 이해를 얻을 수 있습니다 (GWAS) 관련 된 신진 대사 경로 조사 하 여 결과.

Abstract

최근에는 대사경로 분석을 이용한 게놈 전체 협회 연구(GWAS) 데이터를 해석하기 위한 이전에 설명된 방법의 새로운 구현이 개발및 발표되고 있다. 경로 협회 연구 도구(PAST)는 사용자 친화성 및 느린 실행 분석으로 문제를 해결하기 위해 개발되었습니다. 이 새로운 사용자 친화적 인 도구는 바이오 컨덕터 및 Github에 출시되었습니다. 테스트에서 PAST는 이전에 24시간 이상 필요한 1시간 이내에 분석을 실행했습니다. 이 문서에서는 Shiny 응용 프로그램 또는 R 콘솔을 사용하여 PAST를 실행하기 위한 프로토콜을 제시합니다.

Introduction

게놈 전체 협회 연구(GWAS)는 복잡한 특성과 그들과 관련된 게놈^영역을연구하는 인기 있는 방법이다^1,^2,^3. 연구의 이 모형에서, 단 수십만개의 뉴클레오티드 다형성 (SNP) 마커는 특성과의 그들의 협회를 위해 시험되고, 협회의 중요성을 평가됩니다. 잘못된 발견률(FDR) 임계값(또는 다른 유형의 유의 임계값)을 충족하는 마커-특성 협회는 연구를 위해 유지되지만 진정한 연관성은 필터링될 수 있습니다. 복잡하고 다원성 특성의 경우, 각 유전자의 효과는 작을 수 있으며(따라서 여과됨), 일부 진상항제는 연구^3에존재하지 않을 수 있는 특정 조건에서만 발현된다. 따라서, 많은 SMP가 특성과 연관된 바와 같이 유지될 수 있지만, 각각은 매우 작은 효과를 가질 수 있다. 너무 많은 SNP 호출이 누락될 것이며, 특성의 생물학적 의미와 유전 적 구조에 대한 해석은 불완전하고 혼란 스러울 수 있습니다. 대사 경로 분석은 그들의 생물학적 기능에 따라 그룹화 된 유전자의 결합 된 효과에 초점을 맞추어 이러한 문제 중 일부를 해결하는 데 도움이 될 수 있습니다^4,^5,^6.

이 문서에서 설명한 메서드의 이전 구현을 사용하여 여러 연구가 완료되었습니다. 아플라톡신 축적^7,옥수수 귀벌레 저항^8,및 오일 생합성^9는 모두 이전 구현과 함께 연구되었다. 이러한 분석은 성공적이었지만 분석 도구가 R, Perl 및 Bash의 조합으로 작성되었으며 파이프라인이 자동화되지 않았기 때문에 분석 프로세스가 복잡하고 시간이 많이 걸리며 번거로울 수 있었습니다. 각 분석에 대해 이 방법을 수정하는 데 필요한 전문 지식으로 인해 다른 연구원과 공유할 수 있는 새로운 방법이 개발되었습니다.

경로 협회 연구 도구(PAST)^10은 프로그래밍 언어에 대한 지식이 적고 짧은 기간에 분석을 실행하여 이전 방법의 단점을 해결하도록 설계되었습니다. 이 방법은 옥수수로 테스트되었지만 PAST는 종별 가정을 하지 않습니다. 과거는 샤이니 앱으로 R 콘솔을 통해 실행할 수 있으며, 온라인 버전은 곧 MaizeGDB에서 사용할 수 있을 것으로 예상됩니다.

Protocol

1. 설정 아직 설치되지 않은 경우 R을 설치합니다.참고: 과거는 R로 작성되므로 사용자가 R을 설치해야 합니다. 이 글을 쓰는 시점에, 바이오 컨덕터에서 직접 과거를 설치하려면 R4.0이 필요합니다. 이전 버전의 PAST는 R3.6용 바이오 컨더덕터에서 설치할 수 있으며, 과거는 Github에서 R3.5를 가진 사용자를 위해 설치할 수 있습니다. R 설치 지침은 다음 링크에서 다운로드할 수 있습니다: https://www.r-project.org/. RStudio 데스크톱의 최신 버전을 설치하거나 RStudio(선택 사항)를 업데이트합니다.참고: RStudio는 R 언어로 작업하는 데 유용한 환경입니다. 특히 샤이니 GUI 응용 프로그램을 통해서가 아닌 명령줄에서 과거를 실행하기로 선택한 분은 설치를 권장합니다. RStudio 및 설치 지침은 다음 링크에서 찾을 수 있습니다: https://rstudio.com/products/rstudio/. 생체 전도체에 대한 지침에 따라 바이오 컨덕터11에서 과거를 설치하십시오.참고: 바이오 컨덕터를 통한 설치는 과거 종속성의 설치를 처리해야 합니다. 또한 과거는 Github12에서설치할 수 있지만 Github에서 설치하면 종속성을 자동으로 설치하지 않습니다. 과거 샤이니(선택 사항)를 설치합니다. 파일 “응용 프로그램을 다운로드합니다. Github 리포지토리의 릴리스 페이지에서 R” : https://github.com/IGBB/PAST/releases/ 다운로드한 파일이 있는 위치를 기억하십시오.참고: 과거는 R로 직접 메서드를 호출하여 사용할 수 있지만 R에 익숙하지 않은 사용자는 가이드 사용자 인터페이스를 제공하는 PAST Shiny 응용 프로그램을 실행할 수 있습니다. PAST 샤이니는 과거 Github 리포지토리의 shiny_app 지점에서 사용할 수 있는 R 스크립트입니다. 과거 샤이니는 첫 번째 실행 중에 종속성을 설치하려고 시도합니다. 아래에 설명된 세 가지 방법 중 하나에서 응용 프로그램을 시작하여 분석을 시작합니다. RStudio와 과거 샤이니 RStudio를 사용하여 앱이 있는 폴더에 새 프로젝트를 만듭니다. R이 있습니다. | 파일 클릭 새 프로젝트 및 해당 폴더를 선택합니다. 새 프로젝트가 만들어지면 앱을 엽니다. R 파일은 이전에 다운로드했습니다. RStudio는 해당 앱을 인식합니다. R은 샤이니 앱이며 표시된 소스 코드 위의 막대에 앱 실행 버튼을 만듭니다. 실행 앱을클릭합니다. 그런 다음 RStudio는 과거 샤이니 응용 프로그램을 표시하는 창을 시작합니다. R 콘솔과 과거 샤이니 R을 실행하고 과거 빛나는 응용 프로그램을 시작하기 위해 다음 코드를 실행 : runApp에 (‘경로 / 폴더 / / 반짝이 / 응용 프로그램. R’. 따옴표의 텍스트를 어떤 앱에 폴더로 바꿉다. R이 다운로드되고 따옴표를 유지합니다. R 샤이니없이 과거 R 콘솔에서 라이브러리(과거)를 실행하여 과거를 로드합니다. 2. 샤이니 분석 사용자 지정 (선택 사항) 분석 제목을 “새 분석”에서 여러 분석을 추적하는 데 도움이 되는 실행 중인 분석 유형을 더 잘 반영하는 것으로 변경합니다(그림 1참조). 그림 1. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 코어 수와 모드를 수정합니다. 코어 수를 1개에서 컴퓨터의 총 번호 사이에 임의로 설정하지만 PAST에 더 많은 리소스를 투입하면 컴퓨터의 다른 작업이 느려질 수 있다는 점에 유의하십시오. 섹션 6의 설명에 따라 모드를 설정합니다. 3. 로드 GWAS 데이터 참고: GWAS 데이터가 탭 구분이 없는지 확인합니다. 연결 파일에 특성, 마커 이름, 궤적 또는 염색체, 염색체의 위치, p 값 및 마커의 R2 값과 같은 열이 포함되어 있는지 확인합니다. 효과 파일에 특성, 마커 이름, 궤적 또는 염색체, 염색체 위치 및 효과와 같은 열이 포함되어 있는지 확인합니다. 사용자가 데이터를 로드할 때 열이름을 지정할 수 있기 때문에 이러한 열의 순서는 중요하지 않습니다. 추가 열은 무시됩니다. TASSEL13은 이러한 파일을 생성하는 데 사용할 수 있습니다. 과거 샤이니와 GWAS 데이터를 로드합니다. 연결 파일 및 효과 파일 선택 상자를 사용하여 연결 파일 및 효과 파일을 선택합니다. 파일 선택 상자 아래에 있는 연결 열 이름 및 효과 열 이름 입력 상자의 열 이름을 변경하여 데이터의 열 이름을 반영합니다. 그림 2. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 함께 GWAS 데이터를 로드합니다. 다음 코드를 수정하고 실행합니다.gwas_data = load_GWAS_data (“경로 / to/association_file.tsv”, “경로 / association_file/effects_file.tsv”, association_columns = c (“특성”, “마커”, “로커스”, “사이트”, “p”, “marker_R2”), effects_columns = c (“특성”, “마커”, “메쿠스”, “사이트”, “효과”) 참고: GWAS 파일의 실제 위치로 경로를 변경합니다. association_columns 및 effects_columns 위해 제공된 값은 기본 값입니다. 이름이 기본 값과 일치하지 않으면 열 이름을 지정합니다. 그렇지 않으면 생략할 수 있습니다. 4. 로드 연결 분리 (LD) 데이터 참고: 연결 분산(LD) 데이터가 탭 구분되어 있는지 확인하고 다음과 같은 유형의 데이터가 포함되어 있는지 확인합니다: 로커스, Position1, Site1, Position2, Site2, Position1과 Position2 사이의 기본 쌍의 거리 및 R2 값. 과거 샤이니와 LD 데이터를 로드합니다. LD 데이터가 포함된 파일을 선택합니다. 파일 선택 상자 아래에 있는 LD 열 이름 입력 상자의 열 이름을 변경하여 필요한 경우 LD 데이터의 열 이름과 일치합니다. 그림 3. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 LD 데이터를 로드합니다. LD 데이터를 로드하려면 다음 코드를 수정하고 실행합니다.LD = load_LD (“경로 /to/LD.tsv”, LD_columns = c (“Locus1”, “Position1”, “Site1”, “Position2”, “Site2”, “site2”, “Dist_bp”, “R.2”)참고: LD 파일의 실제 위치로 경로를 변경합니다. LD_columns 대해 제공된 값은 기본 값입니다. 이름이 이러한 기본값과 일치하지 않는 경우 열의 올바른 이름을 지정합니다. 그렇지 않으면 생략할 수 있습니다. 5. 유전자에 SNP를 할당 참고: GFF 형식으로 주석을 다운로드하거나 찾습니다. 이 주석은 종종 특정 유기체에 대한 온라인 데이터베이스에서 찾을 수 있습니다. 주석 데이터의 품질이 경로 분석의 품질에 영향을 미치기 때문에 품질이 낮은 주석에 주의하십시오. 이러한 주석의 첫 번째 열(염색체)이 협회, 효과 및 LD 데이터에서 궤색/염색체의 형식과 일치하는지 확인합니다. 예를 들어 GWAS 및 LD 데이터 파일이 첫 번째 염색체 “1”을 호출하는 경우 주석은 첫 번째 염색체 “chr1″을 호출해서는 안됩니다. 과거 샤이니와 유전자에 SNP를 할당합니다.참고: 적절한R2 차단을 결정하는 것에 대한 자세한 내용은 탕 외6,”통로 분석을 위한 유전자 알고리즘”이라는 섹션에서 찾을 수 있다. GFF 주석이 포함된 파일을 선택합니다. 기본값이 업로드된 데이터에 맞지 않는 경우 고려 중인 종에 가장 적합한 창 크기와 R2 컷오프가 가장 적합한 지 고려합니다.참고: 과거의 기본 값은 주로 옥수수에 적합한 값을 반영합니다. 과거 샤이니 분석(2.2단계)의 시작 부분에 설정된 코어 수가 이 단계에서 사용됩니다. 그림 4. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 유전자에 SNP를 할당합니다. 다음 코드를 수정하고 실행하여 유전자에 SMP를 할당합니다.유전자 = assign_SNPs_to_genes (gwas_data, LD, “경로/to/annotations.gff”, c(“유전자”), 1000, 0.8, 2)참고: 이 샘플 코드에서는 몇 가지 기본 제안이 제공됩니다: 1000은 유전자를 검색하기 위해 SNP 주변의 창 크기입니다. 0.8은 R2의컷오프 값입니다. 2는 병렬 처리에 사용되는 코어의 수입니다. 주석에 대한 경로도 주석 파일의 실제 위치로 변경해야 합니다. 6. 중요한 경로를 발견하십시오. 참고: 경로 파일에 탭 구분 형식의 다음 데이터가 포함되는지 확인하며, 각 경로의 모든 유전자에 대해 한 줄씩 포함되는지 확인합니다: 통로 ID – “PWY-6475-1″과 같은 식별자; 통로 설명 – 통로가 “트랜스 리코펜 생합성”과 같은 무엇을하는지에 대한 긴 설명; 유전자 – 주석에 제공된 이름과 일치해야 하는 통로의 유전자입니다. 경로 정보는 MaizeGDB와 같은 특정 유기체에 대한 온라인 데이터베이스에서 찾을 수 있습니다. 두 번째 사용자 지정 옵션은 모드입니다. “증가”는 수율과 같이 측정된 특성의 증가값이 바람직할 때 를 반영하는 표현형을 지칭하며, “감소”는 곤충 손상 등급과 같이 측정값의 감소가 유익한 특성을 의미한다. 경로의 중요성은 이전에 설명된 방법4,6,14를사용하여 테스트된다. 과거 샤이니와 함께 중요한 경로를 발견할 수 있습니다. 경로 데이터가 포함된 파일을 선택하고 분석 옵션에서 모드가 선택되었는지 확인합니다. 필요한 경우, 효과의 중요성을 테스트하기 위해 null 분포를 만드는 데 사용되는 분석 및 순열 수를 유지하기 위해 경로에 있어야 하는 유전자의 수를 변경합니다. 그림 5. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 참고: 과거 샤이니 분석(2.2단계)의 시작 부분에 설정된 코어 수와 모드가 이 단계에서 사용됩니다. 유전자의 기본 수는 현재 5개의 유전자에서 설정됩니다, 그래서 더 적은 알려진 유전자를 가진 통로는 제거될 것입니다. 사용자는 이 값을 4 또는 3으로 낮출 수 있으며, 더 짧은 경로를 포함할 수 있지만 그렇게 하면 거짓 긍정 결과가 발생할 수 있습니다. 이 값을 늘리면 분석의 힘이 증가할 수 있지만 분석에서 더 많은 경로를 제거할 수 있습니다. 사용되는 순열 수를 변경하면 테스트의 힘이 증가하고 감소합니다. R 콘솔에서 과거와 함께 중요한 경로를 발견하십시오. 다음 코드를 수정하고 실행하여 중요한 경로를 발견합니다.rugplots_data <- find_pathway_significance(유전자, "경로/경로/통로.tsv", 5, "증가", 1000, 2)참고: 이 샘플 코드에서는 제안된 몇 가지 기본값이 제공됩니다. 도 5는 분석에서 경로를 유지하기 위해 경로에 있어야 하는 최소한의 유전자 수이며, 증가하여 측정된 특성의 양이 증가하고 있음을 의미합니다(특성에 관계없이 사용자가 증가 및 감소하는 것이 좋습니다. 데이터 해석은 2가지에 대해 다를 것이다), 1000은 null 분포를 결정하는 효과를 샘플링하는 횟수이며, 및 2는 병렬 처리에 사용되는 코어의 수입니다. 경로 파일의 실제 위치로 경로를 변경합니다. 7. 러그플롯 보기 과거 샤이니와 함께 러그플롯을 볼 수 있습니다. 모든 입력이 업로드되고 설정되면 분석 시작을클릭합니다. 진행률 표시줄이 나타나고 마지막으로 완료된 분석 단계를 나타냅니다. 분석이 완료되면 과거 샤이니가 결과 탭으로 전환됩니다. 결과 테이블이 왼쪽 열(“경로”라고 표시)에 표시되고 Rugplots가 오른쪽 열에 표시됩니다(“플롯”이라고 표시). 슬라이더를 사용하여 필터링 매개 변수를 제어합니다. 필터링 수준이 만족스럽으면 왼쪽 하단의 결과 다운로드 버튼을 클릭하여 모든 이미지와 테이블을 분석 제목으로 명명된 ZIP 파일에 개별적으로 다운로드합니다. 이 ZIP 파일에는 필터링된 테이블, 필터링되지 않은 테이블 및 필터링된 테이블의 경로당 하나의 이미지가 포함되어 있습니다. 그림 6. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 7. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 함께 러그플롯 보기 결과를 저장하기 위해 다음 코드를 수정하고 실행합니다.plot_pathways(rugplots_data, “가치”, 0.02, “증가”, “output_folder”)참고: 이 샘플 코드에서는 제안된 몇 가지 기본값이 제공됩니다. pvalue는 유의 임계값이 사용자가 선택한 후 중요하지 않은 경로를 필터링하는 데 사용할 수 있는 데이터를 제공합니다. 0.02는 필터링에 사용되는 기본 값이며, 증가는 측정된 특성의 증가양을 의미합니다(특성에 관계없이 사용자가 증가 및 감소하는 것을 사용하는 것이 좋습니다. 데이터 해석은 둘 에 대해 다를 것입니다. output_folder 이미지와 테이블이 기록되는 폴더입니다(이 폴더는 함수를 실행하기 전에 존재해야 합니다). 필터링된 결과 테이블, 필터링되지 않은 결과 및 필터링된 결과의 모든 경로에 대한 개별 이미지가 이 폴더에 기록됩니다.

Representative Results

PAST 소프트웨어 도구 실행 후 결과가 생성되지 않은 경우 모든 입력 파일의 형식이 올바르게 지정되었는지 확인합니다. 곡색의 옥수수 GWAS를 기반으로 하는 PAST 패키지의 예제 데이터를 사용한 성공적인 실행은 그림 8에나와 있다. 이 테이블과 결과 이미지는 결과 다운로드 버튼을 사용하여 다운로드할 수 있습니다. 다운로드한 이미지의 예는 도 210에표시됩니다. 잘못된 설정은 생물학적 의미가없는 결과로 이어질 수 있지만 부정확성을 결정하는 것은 선택한 설정의 유효성을 다시 확인하고 관심의 특성에 관한 알려진 모든 증거를 고려해야하는 연구원에게 달려 있어야합니다. 도 910은 곡물 색에 대한 표현형이었던 288개의 근친선의 옥수수 패널로 생성된 GWAS 결과의 경로 분석에서 생성된 러그플롯을 나타낸다. 표현형이 “흰색” 또는 “노란색”이었던 이 단순한 예는 밝은 노란색 카로티노이드 안료를 만드는 통로가 알려져 있고 대부분의 표현형에 대한 책임이 있기 때문에 사용되었습니다. 따라서, 우리는 트랜스 리코펜 생합성 경로 (카로티노이드를 생산하는)가 곡물 색상과 현저하게 연관될 것으로 예상했습니다. 경로 ID와 이름은 그래프 상단에 나열됩니다. 그래프의 수평 축은 특성에 가장 큰 영향을 미치는 순서로 왼쪽에서 오른쪽으로 배열된 분석에 포함된 모든 유전자를 가장 작은 특성으로 평가합니다. 그러나, 트랜스 리코펜 생합성 경로에 있는 유전자만 표시된다 (그래프의 상단에, 해치 마크로, 분석에 있는 다른 모든 유전자에 비해 그들의 효과의 유전자 순위에 나타나는). 이 통로에 있는 7개의 유전자가 있습니다. 실행 보강 점수(ES)는 세로 축을 따라 플롯됩니다. 각 유전자에 대한 ES는 실행 합계로 추가되어 효과순으로, 총은 분석된 유전자의 수에 따라 조정된다. 따라서, 점수는 수평축을 따라 오른쪽으로 이동하여 더 큰 효과 유전자가 포함됨에 따라 증가하는 경향이 있지만, 어느 시점에서, 효과의 증가는 다른 유전자를 첨가한 조정보다 작으며, 전체 점수는 감소하기 시작한다. 실행 중인 ES 선의 정점은 점선세로 표시됩니다. 이것은 전체 경로에 대한 ES이며 경로가 선택되고 rugplot로 제시되는지 여부를 결정하는 프로그램에 의해 사용됩니다. 그림 8: 과거 샤이니의 완료 실행. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 9: 과거 (또는 샤이니에서 다운로드)의 완료 된 실행에서 경로 이미지. 이 수치는 Thrash 외10에서인용되었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Discussion

PAST의 주요 목표는 GWAS 데이터의 신진 대사 경로 분석을 더 넓은 청중에게, 특히 비 인간 및 비 동물 유기체에 가져오는 것입니다. 과거에 대한 대체 방법은 종종 인간이나 동물에 초점을 맞춘 명령줄 프로그램입니다. 사용자 친화성은 광택 응용 프로그램을 개발하기로 선택하고 응용 프로그램을 출시하기 위해 R 및 바이오 전도체를 사용하기로 선택하는 등 PAST 개발의 주요 목표였습니다. 사용자는 PAST를 사용하기 위해 프로그램을 컴파일하는 방법을 배울 필요가 없습니다.

대부분의 유형의 분석 소프트웨어와 마찬가지로 PAST의 결과는 입력 데이터만큼만 양호합니다. 입력 데이터에 오류가 있거나 잘못 포맷된 경우 PAST는 실행되지 않거나 정보 없는 결과를 생성하지 못합니다. GWAS 데이터, LD 데이터, 주석 및 경로 파일의 형식이 올바르게 지정되도록 하려면 PAST에서 올바른 출력을 받는 데 매우 중요합니다. 과거는 이중 동선 마커만 분석하고 각 입력 데이터 집합에 대해 하나의 특성만 실행할 수 있습니다. 또한, 불량 한 유전 또는 부정확한 phenotyping에 의해 생성 된 GWAS 데이터 도 명확하거나 반복 가능한 결과 생성 가능성이 없습니다. 과거는 GWAS 결과의 생물학적 해석에 도움이 될 수 있지만 환경 변화, 실험 적 오류 또는 인구 구조가 제대로 고려되지 않은 경우 혼란스러운 데이터 세트를 명확히 할 가능성은 낮습니다.

사용자는 Shiny 응용 프로그램에서 이러한 매개 변수를 R 콘솔의 PAST 함수에 전달하여 분석의 일부 매개 변수를 변경할 수 있습니다. 이러한 매개 변수는 PAST에서 보고한 결과를 변경할 수 있으며 사용자는 기본값에서 이를 수정할 때 주의해야 합니다. LD는 사용자에 의해 측정되기 때문에, 일반적으로 GWAS에서 도 사용 된 동일한 마커 데이터 세트를 사용하여, LD 측정은 인구에 특정. 모든 연구, 특히 옥수수 이외의 종에 대 한, (특히 자기 수 분, polyploid, 또는 높은 이종 종), 기본값의 변경 보증 될 수 있습니다.

Disclosures

The authors have nothing to disclose.

Acknowledgements

없음.

Materials

Computer	NA	NA	Any computer with 8GB RAM should be sufficient
R	R Project	NA	R 3.6 or greater is required to install from Bioconductor

References

Rafalski, J. Association genetics in crop improvement. Current Opinion in Plant Biology. 13 (2), 174-180 (2010).
Yan, J., Warburton, M., Crouch, J. Association Mapping for Enhancing Maize (Zea mays L.) Genetic Improvement. Crop Science. 51 (2), 433-449 (2011).
Xiao, Y., Liu, H., Wu, L., Warburton, M., Yan, J. Genome-wide Association Studies in Maize: Praise and Stargaze. Molecular Plant. 10 (3), 359-374 (2017).
Wang, K., Li, M., Bucan, M. Pathway-Based Approaches for Analysis of Genomewide Association Studies. The American Journal of Human Genetics. 81 (6), 1278-1283 (2007).
Weng, L., et al. SNP-based pathway enrichment analysis for genome-wide association studies. BMC Bioinformatics. 12 (1), 99 (2011).
Tang, J., Perkins, A., Williams, W., Warburton, M. Using genome-wide associations to identify metabolic pathways involved in maize aflatoxin accumulation resistance. BMC Genomics. 16 (1), 673 (2015).
Warburton, M., et al. Genome-Wide Association Mapping of Aspergillus flavus and Aflatoxin Accumulation Resistance in Maize. Crop Science. 55 (5), 1857-1867 (2015).
Warburton, M., et al. Genome-Wide Association and Metabolic Pathway Analysis of Corn Earworm Resistance in Maize. The Plant Genome. 11 (1), 170069 (2018).
Li, H., Thrash, A., Tang, J., He, L., Yan, J., Warburton, M. Leveraging GWAS data to identify metabolic pathways and networks involved in maize lipid biosynthesis. The Plant Journal. 98 (5), 853-863 (2019).
Thrash, A., Tang, J., DeOrnellis, M., Peterson, D., Warburton, M. PAST: The Pathway Association Studies Tool to Infer Biological Meaning from GWAS Datasets. Plants. 9 (1), 58 (2020).
Adam, T., Mason, D. . PAST: Pathway Association Study Tool (PAST). Bioconductor version: Release (3.10). , (2020).
Thrash, A., DeOrnellis, M. . IGBB/PAST. , (2019).
Bradbury, P., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
Subramanian, A., et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences U.S.A. 102, 15545-15550 (2005).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Thrash, A., Warburton, M. L. A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. J. Vis. Exp. (161), e61268, doi:10.3791/61268 (2020).

신진 대사 경로 정보의 GWAS 분석을 위한 통로 협회 연구 도구

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

신진 대사 경로 정보의 GWAS 분석을 위한 통로 협회 연구 도구

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below