1. 설정 아직 설치되지 않은 경우 R을 설치합니다.참고: 과거는 R로 작성되므로 사용자가 R을 설치해야 합니다. 이 글을 쓰는 시점에, 바이오 컨덕터에서 직접 과거를 설치하려면 R4.0이 필요합니다. 이전 버전의 PAST는 R3.6용 바이오 컨더덕터에서 설치할 수 있으며, 과거는 Github에서 R3.5를 가진 사용자를 위해 설치할 수 있습니다. R 설치 지침은 다음 링크에서 다운로드할 수 있습니다: https://www.r-project.org/. RStudio 데스크톱의 최신 버전을 설치하거나 RStudio(선택 사항)를 업데이트합니다.참고: RStudio는 R 언어로 작업하는 데 유용한 환경입니다. 특히 샤이니 GUI 응용 프로그램을 통해서가 아닌 명령줄에서 과거를 실행하기로 선택한 분은 설치를 권장합니다. RStudio 및 설치 지침은 다음 링크에서 찾을 수 있습니다: https://rstudio.com/products/rstudio/. 생체 전도체에 대한 지침에 따라 바이오 컨덕터11에서 과거를 설치하십시오.참고: 바이오 컨덕터를 통한 설치는 과거 종속성의 설치를 처리해야 합니다. 또한 과거는 Github12에서설치할 수 있지만 Github에서 설치하면 종속성을 자동으로 설치하지 않습니다. 과거 샤이니(선택 사항)를 설치합니다. 파일 “응용 프로그램을 다운로드합니다. Github 리포지토리의 릴리스 페이지에서 R” : https://github.com/IGBB/PAST/releases/ 다운로드한 파일이 있는 위치를 기억하십시오.참고: 과거는 R로 직접 메서드를 호출하여 사용할 수 있지만 R에 익숙하지 않은 사용자는 가이드 사용자 인터페이스를 제공하는 PAST Shiny 응용 프로그램을 실행할 수 있습니다. PAST 샤이니는 과거 Github 리포지토리의 shiny_app 지점에서 사용할 수 있는 R 스크립트입니다. 과거 샤이니는 첫 번째 실행 중에 종속성을 설치하려고 시도합니다. 아래에 설명된 세 가지 방법 중 하나에서 응용 프로그램을 시작하여 분석을 시작합니다. RStudio와 과거 샤이니 RStudio를 사용하여 앱이 있는 폴더에 새 프로젝트를 만듭니다. R이 있습니다. | 파일 클릭 새 프로젝트 및 해당 폴더를 선택합니다. 새 프로젝트가 만들어지면 앱을 엽니다. R 파일은 이전에 다운로드했습니다. RStudio는 해당 앱을 인식합니다. R은 샤이니 앱이며 표시된 소스 코드 위의 막대에 앱 실행 버튼을 만듭니다. 실행 앱을클릭합니다. 그런 다음 RStudio는 과거 샤이니 응용 프로그램을 표시하는 창을 시작합니다. R 콘솔과 과거 샤이니 R을 실행하고 과거 빛나는 응용 프로그램을 시작하기 위해 다음 코드를 실행 : runApp에 (‘경로 / 폴더 / / 반짝이 / 응용 프로그램. R’. 따옴표의 텍스트를 어떤 앱에 폴더로 바꿉다. R이 다운로드되고 따옴표를 유지합니다. R 샤이니없이 과거 R 콘솔에서 라이브러리(과거)를 실행하여 과거를 로드합니다. 2. 샤이니 분석 사용자 지정 (선택 사항) 분석 제목을 “새 분석”에서 여러 분석을 추적하는 데 도움이 되는 실행 중인 분석 유형을 더 잘 반영하는 것으로 변경합니다(그림 1참조). 그림 1. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 코어 수와 모드를 수정합니다. 코어 수를 1개에서 컴퓨터의 총 번호 사이에 임의로 설정하지만 PAST에 더 많은 리소스를 투입하면 컴퓨터의 다른 작업이 느려질 수 있다는 점에 유의하십시오. 섹션 6의 설명에 따라 모드를 설정합니다. 3. 로드 GWAS 데이터 참고: GWAS 데이터가 탭 구분이 없는지 확인합니다. 연결 파일에 특성, 마커 이름, 궤적 또는 염색체, 염색체의 위치, p 값 및 마커의 R2 값과 같은 열이 포함되어 있는지 확인합니다. 효과 파일에 특성, 마커 이름, 궤적 또는 염색체, 염색체 위치 및 효과와 같은 열이 포함되어 있는지 확인합니다. 사용자가 데이터를 로드할 때 열이름을 지정할 수 있기 때문에 이러한 열의 순서는 중요하지 않습니다. 추가 열은 무시됩니다. TASSEL13은 이러한 파일을 생성하는 데 사용할 수 있습니다. 과거 샤이니와 GWAS 데이터를 로드합니다. 연결 파일 및 효과 파일 선택 상자를 사용하여 연결 파일 및 효과 파일을 선택합니다. 파일 선택 상자 아래에 있는 연결 열 이름 및 효과 열 이름 입력 상자의 열 이름을 변경하여 데이터의 열 이름을 반영합니다. 그림 2. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 함께 GWAS 데이터를 로드합니다. 다음 코드를 수정하고 실행합니다.gwas_data = load_GWAS_data (“경로 / to/association_file.tsv”, “경로 / association_file/effects_file.tsv”, association_columns = c (“특성”, “마커”, “로커스”, “사이트”, “p”, “marker_R2”), effects_columns = c (“특성”, “마커”, “메쿠스”, “사이트”, “효과”) 참고: GWAS 파일의 실제 위치로 경로를 변경합니다. association_columns 및 effects_columns 위해 제공된 값은 기본 값입니다. 이름이 기본 값과 일치하지 않으면 열 이름을 지정합니다. 그렇지 않으면 생략할 수 있습니다. 4. 로드 연결 분리 (LD) 데이터 참고: 연결 분산(LD) 데이터가 탭 구분되어 있는지 확인하고 다음과 같은 유형의 데이터가 포함되어 있는지 확인합니다: 로커스, Position1, Site1, Position2, Site2, Position1과 Position2 사이의 기본 쌍의 거리 및 R2 값. 과거 샤이니와 LD 데이터를 로드합니다. LD 데이터가 포함된 파일을 선택합니다. 파일 선택 상자 아래에 있는 LD 열 이름 입력 상자의 열 이름을 변경하여 필요한 경우 LD 데이터의 열 이름과 일치합니다. 그림 3. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 LD 데이터를 로드합니다. LD 데이터를 로드하려면 다음 코드를 수정하고 실행합니다.LD = load_LD (“경로 /to/LD.tsv”, LD_columns = c (“Locus1”, “Position1”, “Site1”, “Position2”, “Site2”, “site2”, “Dist_bp”, “R.2”)참고: LD 파일의 실제 위치로 경로를 변경합니다. LD_columns 대해 제공된 값은 기본 값입니다. 이름이 이러한 기본값과 일치하지 않는 경우 열의 올바른 이름을 지정합니다. 그렇지 않으면 생략할 수 있습니다. 5. 유전자에 SNP를 할당 참고: GFF 형식으로 주석을 다운로드하거나 찾습니다. 이 주석은 종종 특정 유기체에 대한 온라인 데이터베이스에서 찾을 수 있습니다. 주석 데이터의 품질이 경로 분석의 품질에 영향을 미치기 때문에 품질이 낮은 주석에 주의하십시오. 이러한 주석의 첫 번째 열(염색체)이 협회, 효과 및 LD 데이터에서 궤색/염색체의 형식과 일치하는지 확인합니다. 예를 들어 GWAS 및 LD 데이터 파일이 첫 번째 염색체 “1”을 호출하는 경우 주석은 첫 번째 염색체 “chr1″을 호출해서는 안됩니다. 과거 샤이니와 유전자에 SNP를 할당합니다.참고: 적절한R2 차단을 결정하는 것에 대한 자세한 내용은 탕 외6,”통로 분석을 위한 유전자 알고리즘”이라는 섹션에서 찾을 수 있다. GFF 주석이 포함된 파일을 선택합니다. 기본값이 업로드된 데이터에 맞지 않는 경우 고려 중인 종에 가장 적합한 창 크기와 R2 컷오프가 가장 적합한 지 고려합니다.참고: 과거의 기본 값은 주로 옥수수에 적합한 값을 반영합니다. 과거 샤이니 분석(2.2단계)의 시작 부분에 설정된 코어 수가 이 단계에서 사용됩니다. 그림 4. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 유전자에 SNP를 할당합니다. 다음 코드를 수정하고 실행하여 유전자에 SMP를 할당합니다.유전자 = assign_SNPs_to_genes (gwas_data, LD, “경로/to/annotations.gff”, c(“유전자”), 1000, 0.8, 2)참고: 이 샘플 코드에서는 몇 가지 기본 제안이 제공됩니다: 1000은 유전자를 검색하기 위해 SNP 주변의 창 크기입니다. 0.8은 R2의컷오프 값입니다. 2는 병렬 처리에 사용되는 코어의 수입니다. 주석에 대한 경로도 주석 파일의 실제 위치로 변경해야 합니다. 6. 중요한 경로를 발견하십시오. 참고: 경로 파일에 탭 구분 형식의 다음 데이터가 포함되는지 확인하며, 각 경로의 모든 유전자에 대해 한 줄씩 포함되는지 확인합니다: 통로 ID – “PWY-6475-1″과 같은 식별자; 통로 설명 – 통로가 “트랜스 리코펜 생합성”과 같은 무엇을하는지에 대한 긴 설명; 유전자 – 주석에 제공된 이름과 일치해야 하는 통로의 유전자입니다. 경로 정보는 MaizeGDB와 같은 특정 유기체에 대한 온라인 데이터베이스에서 찾을 수 있습니다. 두 번째 사용자 지정 옵션은 모드입니다. “증가”는 수율과 같이 측정된 특성의 증가값이 바람직할 때 를 반영하는 표현형을 지칭하며, “감소”는 곤충 손상 등급과 같이 측정값의 감소가 유익한 특성을 의미한다. 경로의 중요성은 이전에 설명된 방법4,6,14를사용하여 테스트된다. 과거 샤이니와 함께 중요한 경로를 발견할 수 있습니다. 경로 데이터가 포함된 파일을 선택하고 분석 옵션에서 모드가 선택되었는지 확인합니다. 필요한 경우, 효과의 중요성을 테스트하기 위해 null 분포를 만드는 데 사용되는 분석 및 순열 수를 유지하기 위해 경로에 있어야 하는 유전자의 수를 변경합니다. 그림 5. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 참고: 과거 샤이니 분석(2.2단계)의 시작 부분에 설정된 코어 수와 모드가 이 단계에서 사용됩니다. 유전자의 기본 수는 현재 5개의 유전자에서 설정됩니다, 그래서 더 적은 알려진 유전자를 가진 통로는 제거될 것입니다. 사용자는 이 값을 4 또는 3으로 낮출 수 있으며, 더 짧은 경로를 포함할 수 있지만 그렇게 하면 거짓 긍정 결과가 발생할 수 있습니다. 이 값을 늘리면 분석의 힘이 증가할 수 있지만 분석에서 더 많은 경로를 제거할 수 있습니다. 사용되는 순열 수를 변경하면 테스트의 힘이 증가하고 감소합니다. R 콘솔에서 과거와 함께 중요한 경로를 발견하십시오. 다음 코드를 수정하고 실행하여 중요한 경로를 발견합니다.rugplots_data <- find_pathway_significance(유전자, "경로/경로/통로.tsv", 5, "증가", 1000, 2)참고: 이 샘플 코드에서는 제안된 몇 가지 기본값이 제공됩니다. 도 5는 분석에서 경로를 유지하기 위해 경로에 있어야 하는 최소한의 유전자 수이며, 증가하여 측정된 특성의 양이 증가하고 있음을 의미합니다(특성에 관계없이 사용자가 증가 및 감소하는 것이 좋습니다. 데이터 해석은 2가지에 대해 다를 것이다), 1000은 null 분포를 결정하는 효과를 샘플링하는 횟수이며, 및 2는 병렬 처리에 사용되는 코어의 수입니다. 경로 파일의 실제 위치로 경로를 변경합니다. 7. 러그플롯 보기 과거 샤이니와 함께 러그플롯을 볼 수 있습니다. 모든 입력이 업로드되고 설정되면 분석 시작을클릭합니다. 진행률 표시줄이 나타나고 마지막으로 완료된 분석 단계를 나타냅니다. 분석이 완료되면 과거 샤이니가 결과 탭으로 전환됩니다. 결과 테이블이 왼쪽 열(“경로”라고 표시)에 표시되고 Rugplots가 오른쪽 열에 표시됩니다(“플롯”이라고 표시). 슬라이더를 사용하여 필터링 매개 변수를 제어합니다. 필터링 수준이 만족스럽으면 왼쪽 하단의 결과 다운로드 버튼을 클릭하여 모든 이미지와 테이블을 분석 제목으로 명명된 ZIP 파일에 개별적으로 다운로드합니다. 이 ZIP 파일에는 필터링된 테이블, 필터링되지 않은 테이블 및 필터링된 테이블의 경로당 하나의 이미지가 포함되어 있습니다. 그림 6. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 7. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. R 콘솔에서 과거와 함께 러그플롯 보기 결과를 저장하기 위해 다음 코드를 수정하고 실행합니다.plot_pathways(rugplots_data, “가치”, 0.02, “증가”, “output_folder”)참고: 이 샘플 코드에서는 제안된 몇 가지 기본값이 제공됩니다. pvalue는 유의 임계값이 사용자가 선택한 후 중요하지 않은 경로를 필터링하는 데 사용할 수 있는 데이터를 제공합니다. 0.02는 필터링에 사용되는 기본 값이며, 증가는 측정된 특성의 증가양을 의미합니다(특성에 관계없이 사용자가 증가 및 감소하는 것을 사용하는 것이 좋습니다. 데이터 해석은 둘 에 대해 다를 것입니다. output_folder 이미지와 테이블이 기록되는 폴더입니다(이 폴더는 함수를 실행하기 전에 존재해야 합니다). 필터링된 결과 테이블, 필터링되지 않은 결과 및 필터링된 결과의 모든 경로에 대한 개별 이미지가 이 폴더에 기록됩니다.