Biology

게놈 넓은 식별 및 소문의 ATL E3 유비퀴틴 리가 유전자 가족의 식 메타 분석을 위한 포괄적인 워크플로

Published: December 22, 2017 doi: 10.3791/56626

Pietro Ariani*¹, Elodie Vandelle*¹, Darren Wong², Alejandro Giorgetti¹, Andrea Porceddu³, Salvatore Camiolo³, Annalisa Polverari¹

¹Dipartimento di Biotecnologie, Università degli Studi di Verona, ²Ecology and Evolution, Research School of Biology, The Australian National University, ³Dipartimento di Agraria, SACEG, Università degli Studi di Sassari

* These authors contributed equally

Summary

이 문서에서는 식별 및 Levadura에 애기 Tóxicos (ATL) E3 유비퀴틴 ligases 제품군에 적용 하는 소문에 유전자 가족의 특성에 대 한 절차를 설명 합니다.

Abstract

분류 및 명명법 가족에 있는 유전자의 인코딩된 단백질의 다양성의 설명 하 고 특히 또는 시퀀스 모티프의 존재 등 여러 가지 기능에 대해 가족 기능 예측에 크게 기여할 수 있다 포스트 번역 상 수정 및 다른 조건에서 가족 구성원의 식 프로 파일에 대 한 사이트. 이 작품에서는 유전자 가족 특성에 대 한 상세한 프로토콜을 설명합니다. 여기, 프로시저 Levadura에서 애기 Tóxicos (ATL) E3 유비퀴틴 리가 소문에는 가족의 특성에 적용 됩니다. 단백질 지역화 및 인 산화 위치의 예측, 보존된 단백질 모티프의 분석, 유전자 지역화, 구조, 그리고 복제의 특성, 가족 구성원의 게놈 넓은 id를 포함 하는 방법 뿐만 아니라 유전자 표현에서 서로 다른 데이터 집합에 가족 프로 파일링. 실험 목적에 따라 추가 분석 연장 될 수 있는, 그런 절차는 게놈 데이터 사용할 수 있습니다, 어떤 식물 종에 어떤 유전자 가족에 적용 될 수 하 고 재미 있는 후보를 식별 하기 위해 귀중 한 정보를 제공 합니다. 기능 연구에 대 한 그들의 환경에 적응 하는 식물의 분자 메커니즘에 대 한 통찰력을 주는.

Introduction

지난 10 년 동안 많은 연구 grapevine 유전체학에서 실시 했다. Grapevine 인정된 경제적으로 관련 작물 이다, 과일 개발 연구 biotic 및 abiotic 스트레스에 나무가 우거진 식물의 응답에 대 한 모델 되고있다. 이러한 맥락에서 2007¹ 왕 vinifera cv PN40024. 게놈 및 2011² 의 업데이트 된 버전의 릴리스 "Omics"-규모 데이터의 급속 한 축적 하 고 높은 처리량 연구의 주도. 게시 된 시퀀스 데이터를 바탕으로, 주어진된 유전자 가족 (일반적으로 보존된 모티브, 구조적 및 기능적 유사성과 진화 관계를 공유 하는 단백질의 구성)의 포괄적인 분석 수행할 수 있는 지금 밝히기는 분자 기능, 진화, 고 진 식 프로필. 이러한 분석은 유전자 가족 게놈 넓은 수준에 생리 적 프로세스를 제어 하는 방법을 이해 하는 데 기여할 수 있다.

플랜트 라이프 사이클의 여러 측면 유비퀴틴 중재 일반 세포 프로세스를 미세 조정된 회전율을 필요로 하는 주요 단백질의 저하에 의해 통제 된다. 중요 한 저하 유비퀴틴 중재 프로세스의 구성 요소는 E3 유비퀴틴 ligases는 특정 대상³의 채용 덕분에 시스템 유연성에 대 한 책임이 있습니다. 따라서 이러한 효소 예측 애기 thaliana 게놈⁴, 각 E3 유비퀴틴 리가 특정 대상 단백질의 ubiquitination에 대 한 행동에 약 1400 E3 리가 인코딩 유전자와 거 대 한 유전자 가족을 나타냅니다. 식물에 있는 세포 기질-관련 ubiquitination의 중요성에도 불구 하 고 약간 ubiquitination 통로 규제 하는 방법에 대 한 알려져 있다 하 고 대상 단백질 몇 가지 경우에만 확인 되었습니다. 이러한 특이성 및 규제 메커니즘의 해독 의존 먼저 식별 하 고 특히에서 시스템의 다른 구성 요소의 E3 ligases 합니다. 유비퀴틴 ligases 중 ATL 인도의 91 회원 A. thaliana 반지-h 2 손가락 도메인⁵^,⁶, 방어와 호르몬 응답⁷역할 그들 중 일부를 표시에서 확인 된 특징 이다.

새로운 유전자 가족의 구성원을 정의 하는 첫 번째 중요 한 단계 합의 모티프, 주요 도메인, 단백질 시퀀스 특성 등 가족 기능의 정확한 정의 이다. 실제로, 모든 유전자 가족의 폭발 분석에 따라 신뢰할 수 있는 검색 일부 필수 시퀀스 특성을 단백질 기능/활동, 단백질 서명으로 봉사에 대 한 책임 특정 단백질 도메인에 필요 합니다. 이 상 일반적인 시퀀스를 격리 하기 위해 다른 식물 종, 동일한 가족에 속하는 다른 유전자를 분석 하 여 달성 하거나 다른 식물 종에는 동일한 유전자 가족의 이전 특성에 의해 촉진 될 수 있습니다. 가족 구성원 수 있습니다 다음 개별적으로 작성 된 특정된 식물 종에 대 한 국제 컨소시엄에 의해 해결 하는 일반적인 규칙에 따라. Grapevine에 예를 들어, 이러한 절차 수립 등 V. vinifera A. thaliana 계통 발생 나무의 건설 포도 유전자 주석 (sNCGGa)에 대 한 슈퍼 전문 어 위원회의 권고를 복종 된다 유전자 가족 유전자 주석 있도록 뉴클레오티드 시퀀스⁸에 따라.

가족 구성원 및 유전자 중복 조사 염색체 현지화 전체 게놈 또는 협동 중복된 유전자의 존재를 강조 하실 수 있습니다. 이러한 정보가 나타납니다 이후 표시 기능 중복 되거나 다른 상황, 즉, 비 기능화, 네오-기능화, 또는 하위 기능화⁹공개 될 상 상속 유전자 기능을 해명 하는 데 유용. 두 네오-및 하위-functionalization는 환경¹⁰변화에 적응 하는 식물에 대 한 새로운 세포 구성 요소를 제공 하는 유전 참신을 만드는 중요 한 이벤트. 특히, 조상의 유전자의 중복과 새로운 유전자의 생산 매우 자주 grapevine 게놈의 진화 하는 동안 되었고 grapevine에 인접 하 고 협동 중복에서 발생 하는 새로 형성된 된 유전자를 새로운 생산 가능성이 있었다 함수¹¹.

또 다른 주요 요소 유전자 가족 기능 해독 transcriptomic 프로필입니다. Transcriptomic 데이터의 엄청난 금액을 액세스를 부여 하는 공용 데이터베이스의 가용성은 대규모 철에 식 분석을 사용 하 여 유전자 가족에 상 상속 기능을 할당 하 따라서 악용 될 수 있습니다. 실제로, 특정 식물 기관 또는 특정 스트레스에 대 한 응답에 일부 유전자의 독특한 표현 정의 된 조건에서 해당 단백질의 상 상속 역할에 관한 몇 가지 힌트를 줄 수 있고 가능한에 대 한 가설에 지원을 제공합니다 다른도 전에 대응 하는 유전자 중복된의 하위 기능화. 그 목적, 여러 데이터 집합을 고려 하는 것이 중요 하다:이 식을 행렬, grapevine 기관과 발달 단계¹², 게놈 넓은 transcriptomic 아틀라스 등 이미 유전자 수 또는 애드혹 으로 건축 될 수 있다 transcriptomic를 정의 거쳤다 특정 식물 종에 대 한 데이터 집합을 검색 합니다. 또한, 두 행렬을 사용 하는 간단한 방법, 인덱스도 유사성 데이터와 인덱스도 공동 식 계수와 함께 다른 하나 적용할 수 있는 유전자 가족 내에서 시퀀스 유사성과 표현의 패턴 간의 관계를 평가 하.

이 작품의 목적은 잘 달성 하기 위해 단백질 현지화 및 인 산화 사이트의 예측으로 유전자 구조, 보존된 단백질 모티프, 염색체 위치, 유전자 중복, 및 식 패턴을 정의 하는 글로벌 접근 방식을 제공 하는 식물에서 유전자 가족의의 완전 한 특성화 이러한 포괄적인 접근 방식은 여기 소문에 ATL E3 유비퀴틴 리가 가족의 특성에 적용 됩니다. 신흥 멤버 역할의 ATL 인도의 주요 세포질 과정⁷조절에,에 따르면이 작품 수 있습니다 잘 기능 연구에 대 한 강한 후보자의 식별을 지원 하 고 결국 경 세 하는 분자 메커니즘을 해명는 이 중요 한 작물의 환경에의 적응입니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 상 상속 ATL 유전자 가족의 신분증

PSI 폭발 웹 버전
1. 폭발 웹 페이지¹³ 열고 단백질 폭발 섹션을 클릭 합니다.
2. "입력 쿼리 시퀀스" 필드에서 다른 가족 구성원을 식별 하는 프로브로 사용 됩니다 (여기 VIT_05s0077g01970) 단백질의 아미노산 시퀀스를 입력 합니다.
  참고: 좋은 대표적인 단백질 이어야 한다 (모든 중요 한 기능을 가족의 특성을 표시 하는 단백질)을 사용.
3. 필드 "선택 검색 설정"에서 "단백질 참조" 데이터베이스 (refseq_protein)과 관심 (V. vinifera -taxid:29760)의 유기 체를 선택 합니다.
4. 필드 "프로그램 선택", PSI 폭발 알고리즘을 선택 하 고 폭발 버튼 분석 실행을 클릭 합니다.
  참고: "알고리즘 매개 변수"를 클릭 하 여 그것이 가능 (최대 대상 시퀀스, 점수 행렬, PSI 폭발 임계값, 등) 일부 고급 매개 변수를 조정 합니다.
5. 라운드 첫 번째 폭발 검색 쿼리 관련 항목을 표시 하는 모든 시퀀스 (선택 된 임계값-기본적으로 위의 e 값이이 실험에서 0.001, 0.005). "PSI-폭발에 대 한 선택" 열에서 눈금을 클릭 하 여 시험에서 가족에 속한다 고 단계 1.1.4에서 폭발 단추를 클릭 하 여 두 번째 PSI 폭발 반복을 실행 하지 않습니다 명확 하 게 모든 항목을 선택 취소.
6. 새로 확인된 된 시퀀스는 노란색으로 강조 표시 됩니다. 명확 하 게 잘못 검색된 안타를 선택을 취소 하 고 반복 단계 1.1.5에서에서 설명한 대로 추가 폭로.
7. 계속 반복 하는 알고리즘 관련 항목을 찾지 못하면 또는 융합 (새로운 항목이 발견)에 도달할 때까지. 추가 분석에 대 한 상 상속 유전자 가족 구성원의 목록 다운로드. 잘못 된 반응의 존재를 피하기 위해 각 반복에서 검색 된 조회 수를 않았는지 살펴보십시오.
PSI 폭발 독립 실행형 버전
1. 폭발 홈 페이지¹³에 "폭발 다운로드" 버튼을 클릭 하 여 폭발의 독립 실행형 버전을 다운로드.
  참고: 독립 실행형 폭발 소프트웨어 전에 설명 하는 웹 인터페이스의 명령줄 버전입니다. 사용자 지정 로컬 또는 원격 데이터베이스에 대 한 PSI-BLAST 검색 실행 수 있습니다. 또한, 검색으로 미리 정의 된 위치 특정 점수 행렬 (PSSM) 수 있습니다.

2. 수동 검사 PSI 폭발 식별 하는 가족 구성원의

여러 정렬
1. 이전 FASTA 형식의 파일에서 확인 된 아미노 산 성 시퀀스를 수집 하 고 여러 맞춤으로 진행 하는 메가 소프트웨어¹⁴ 에 업로드.
2. 메가 소프트웨어를 열고, "정렬" 버튼을 클릭, "편집/빌드 정렬"를 클릭, "새로운 정렬 만들기" 클릭, "단백질"을 클릭 합니다.
3. "순서에서 파일 삽입" 하 고 정렬 메뉴에서 "편집"을 클릭 합니다. 전에 만든 FASTA 파일 이동한 모든 조사 시퀀스의 업로드를 확인 합니다.
4. 맞춤 메뉴와 "근육에 의해 정렬"에서 "정렬"를 클릭 합니다. 기본 매개 변수를 사용 하 여, "계산" 버튼을 클릭 하 고 여러 정렬의 완료를 기다립니다.
5. 시각적으로 잘못 예측 된 가족 구성원을 제외 하려면 여러 정렬을 검사 합니다. 정식 CxxC (13 x) PxCxHxxHxxCxxxW (7 x) CxxCW 모티브, (특히 3 시스테인 전에 프롤린 잔류물의 존재)에 ATL 가족 구성원을 정의 하는 데 필요한 주요 기능입니다.
특정 로고의 분석
1. 가족에 걸쳐 보존된 주제를 정의 하 주제 도출 (MEME)¹⁵ 에 대 한 여러 전각을 (96 grapevine 시퀀스 ATL을 고려해 야 할 요구 사항을 충족) 가족 구성원의 최종 명단을 제출 합니다.
2. MEME 홈 페이지에서 "MEME" 버튼을 클릭 하 고 "데이터 제출 양식" 특정 정보 가족에 대 한 관심의 완료.
3. MEME 분석을 사용 하 여 시간과 grapevine ATL 가족 구성원, 즉, 반지-H2 GLD 모티브 두 예상된 모티프의 존재 확인.
또는, 단계 2.1과 2.2 생물 정보학 소프트웨어 제품군을 사용 하 여 동시에 ( 재료의 표참조).
1. FASTA 파일 업로드 (2.1.1 단계 참조) 제품군으로. 메뉴에서 다음 "가져오기" 클릭 "파일" "파일"을 선택 합니다. FASTA 파일을 "열기"를 클릭 합니다.
2. 목록에서 가져온된 모든 시퀀스를 선택 하 고 도구 모음에서 "맞춤/조립" 버튼을 클릭 다음 "쌍 여러 정렬"를 클릭 합니다. "근육 정렬"을 선택 하 고 "확인" 기본 매개 변수를 사용 하 여 정렬 실행을 클릭 합니다.
3. 맞춤 로고를 시각화 하려면 "그래프" → "옵션"을 클릭 하 고 "순서 로고"를 선택 합니다.

3. 단백질 실제 매개 변수 및 도메인 분석

조사 가족 구성원의 다른 물리적 매개 변수 정의 중요 한 가족의 포괄적인 설명으로, 특정 웹 도구를 가족 구성원의 목록을 제출.
1. 전자 점 (pI) 및 분자량 (kDa)에 대 한 기본 매개 변수가 있는 Expasy 웹사이트에 ProtParam 도구¹⁶ 을 사용 합니다.
2. 단백질 subcellular 지 방화, 단백질 추적자 subcellular 지 방화 v1.2^{19과 기본 설정, 기본 설정, targetP v1.1¹⁸ ngLOC v1.0¹⁷ 등 더 신뢰할 수 있는 예측을 얻기 위해 다른 도구 사용}0.5의 확률의 인하와 함께. 인 산화 사이트에 대 한 기본 매개 변수가 있는 MUsite v1.0 웹 도구²⁰ 를 사용 합니다.
가족 구성원에 추가 단백질 도메인을 조사.
1. Pfam 데이터베이스 웹 페이지²¹, "시퀀스 검색" 도구를 선택, 쿼리 상자에서 단백질 시퀀스를 제출 열고 "가"는 분석을 실행 하려면 클릭 합니다.
  참고: 각 단백질 시퀀스는 개별적으로 분석 된다. 기본 설정에서 1.0의 e 값 중요 하 고 중요 한 비 안타 사이 차별 수 있습니다.
2. 생물학 순서 분석 상 상속 막 횡단 영역의 존재를 조사 하기 위한 센터에서²² TMHMM 서버 엽니다.

쿼리 상자에 모든 단백질 시퀀스를 동시에 붙여 (또는 양자 택일로 FASTA 형식의 모든 단백질 시퀀스를 포함 하 여 텍스트 파일을 업로드)는 분석을 실행 하려면 "제출"을 클릭 합니다.

Putative 소수 성 영역을 식별 하기 위해 ProtScale 도구 TMHMM (3.2.2), 단계에 따라 예측된 막 횡단 도메인, 부족 한 단백질을 분석 합니다. 오픈 ProtScale 웹 페이지²³. 쿼리 상자에 각 단백질 시퀀스를 붙여넣기 하 고 선택 "Hphob. / Kyte & 두 리틀 "아미노산 비율으로. 분석을 실행 하려면 "제출"을 클릭 합니다.

4. 염색체 분배, 중복, 그리고 엑손 intron 조직

포도 게놈 CRIBI 생명 공학 센터 웹사이트²⁴에서 검색 된 정보에 따라 염색체에 ATL 가족 구성원을 매핑하십시오.
1. PhenoGram 웹사이트 홈페이지²⁵를 찾습니다. "입력 파일" 탭으로 구분 된 텍스트 파일로 유전자의 특정 기능을 작성 제공된 된 파일 경로 다음의 편집에 관한 예제와 철저 한 지침에 따라 염색체에 매핑할 수 "Phenogram" → " 문서"→"옵션"→" 입력 파일 ".
2. 작품의 "제목"을 작성 합니다. 얻을 수 게놈을 선택 합니다. 포도 게놈 같은 소프트웨어에 구현 되지 않은 유전자에 대 한 드롭 다운 메뉴에서 "기타"을 선택 합니다. 작성 지침 및 예제를 제공 하 고, 경로 따라 게놈 파일 "Phenogram" → "문서" → "옵션" → "게놈", 그리고 그것을 업로드.
3. 각각 메뉴에 "표현 형 간격", "형 색", "이미지 포맷", 또는 선택 대안의 기본 매개 변수를 사용 하 고 "플롯" 염색체에 유전자의 시각화를 클릭 합니다.
²⁶MCScanX 소프트웨어 사용 하 여 가족 구성원의 복제 상태를 정의 합니다.
1. 다운로드 하 고 실행 하는 명령 라인 1 (보충 파일 1) 로컬 컴퓨터에 MCscanX의 사본을 압축 해제. MCscanX 폴더를 입력 하 고 실행 하는 명령 라인 2 (보조 파일 1) 필요한 실행 파일을 만듭니다.
  참고: MCscanX의 설치 기능 chdir에 관한 문제로 인해 일부 리눅스 64 비트 기계에 실패 알려져 있다. 오류 메시지가 반환 됩니다 만들기 시이 함수에 관련 된 명령 실행 명령 라인 3 (보조 파일 1) 실행 해야 하 고 "확인" 명령 이후에 시도 한다.
2. V. vinifera 단백질 및 실행 명령 라인 4 (보충 파일 1) 주석 파일을 다운로드 합니다.
  참고: 압축 되도록 grapevine 주석 파일의 요구와 명령 라인 5 (보조 파일 1)을 실행 하 여 고유한 파일에 단일 염색체 정보 고양이.
3. "모두 모두 대" blastp 검색 쿼리 및 주제 V. vinifera 단백질 파일을 사용 하 여 실행 합니다.
4. V. vinifera 단백질 파일 실행 명령 라인 6 (보충 파일 1)를 사용 하 여 검색 가능한 폭발 데이터베이스를 만듭니다. V. vinifera 단백질 파일 쿼리를 사용 하 여 blastp 검색 수행 명령 라인 7 (보충 파일 1)을 실행 하 여 이전에 만든 데이터베이스에 대해.
5. MCScanX에 대 한 적합 한 형식 주석 파일을 변환 합니다. 명령 라인 8 (보충 파일 1) 사용자 지정 perl 스크립트 parseMSCanXgff.pl 다운로드를 실행 합니다. 명령 라인 9 (보조 파일 1)을 실행 하는 분석을 수행 합니다.
  참고 파일 vitis.gff 유전자 좌표 형식으로 보유 하 고 생성 됩니다.:
  sp # 유전자 시작 끝 위치 위치
  "#"는 발판의 이름을 어디에 "sp" 종 (grapevine Vv)에 대 한 두 문자 코드가입니다. 참고 제공 된 사용자 지정 perl 스크립트는 대부분의 변환에 적합 일부 코드 수정 사용할 수 있는 주석 파일에 제공 된 정보의 다양성으로 인해 일부 특정 경우에 필요할 수 있습니다.
6. MCScanX 커맨드 라인 10 (보충 파일 1) 실행을 시작 합니다.
  참고: "왕" 주석 및 폭발 출력 파일의 접두사입니다. 이것은 소프트웨어 실행에 대 한 필수 요구 사항을 나타냅니다.
7. MCScanX 결과 분석 합니다. MCScanX 생성 한 텍스트 파일 "vitis.collinearity" 일 직선상 블록을 포함 합니다. 이러한 파일은 텍스트 편집기에 의해 검열 될 수 있다 (예를 들어 출력 1 보충 파일 1참조).
  참고: "mcscaxOutput.html" 디렉터리 html 파일이 각 참조 염색체에 대 한 선적 블록의 여러 정렬 기능 생성 됩니다. 이 파일은 웹 브라우저를 통해 검사 수 있습니다.
8. Paralogous 유전자 염색체 11 (보충 파일 1) 명령줄 실행에 그들의 상대적 위치에 따라 분류 합니다.
  참고: Paralogous 유전자 분류 보충 표 2에 설명 되어 있습니다. 생성 된 출력 파일 "vitis.gene_type"는 간단한 탭 구분 형식으로 모든 근원 정보를 포함 되어 있습니다.
9. 농축 분석 유전자 가족은 prevalently 명령줄 12 (보충 파일 1)을 실행 하는 특정 메커니즘에 의해 발생 하는 여부를 평가 수행 합니다.
  참고: 파일 "vitis.gene_type" 생성 단계 4.2.8, 반면 파일 "gene_family_file" (예, ATL_genes)는 가족의 이름을 가족에 속하는 모든 유전자에 대 한 로커 스 이름으로 다음 한 줄 텍스트 파일을 나타냅니다. 탭으로 구분. 농축에 대 한 적용된 통계 테스트는 피셔 정확한 테스트 및 p-값이 다른 근원의 "outputFile.txt" 파일에 저장 됩니다.
디스플레이, 주석, 및 계통 발생 나무의 관리에 대 한 대화형 생명의 나무 (iTOL)²⁷, 온라인 도구를 사용 하 여 유전자의 엑손 intron 조직 시각화.
1. 업로드 iTOL 웹사이트의 "업로드" 섹션에서 계통 발생 나무. 나무 아래 5 항에 따라 만들어집니다. 각 가족 구성원 유전자에 대 한 유전자 구조 예측 grapevine 게놈 (위에 인용 하는 CRIBI 웹사이트)의 V1 주석에서 검색 합니다. (Bp)의 길이 putative exons, introns, 그리고 번역 되지 않은 영역 (Utr)을 계산 합니다.
2. Exon intron 패턴의 그래픽 시각화에 대 한 "단백질 도메인" 데이터 집합을 사용 합니다.

다음 "경로 도움말" → "도움 페이지" → "데이터 집합 유형" → "단백질 도메인" iTOL 웹사이트²⁷제공 사양에 따라 계산 된 길이 포함 하 여 일반 텍스트 파일을 작성 합니다. "단백질 도메인" 데이터 집합을 사용 하 여, "사각형 (RE)"와 "사각형 갭 (GP)" 형태는 exon과 Utr, 각각 나타냅니다.

5. 계통 발생 분석 및 명명법

ATL 고품질 계통 발생 나무의 건설 및 가족 명칭의 정의 통해 가족 구성원 간의 관계를 분석 합니다.
1. Grapevine 유전자 가족에 대 한⁸Grapevine 슈퍼 전문 어 위원회 의해 설립 규칙을 따릅니다.
2. UniProt 데이터베이스²⁸ 에서 grapevine 유전자 명명법⁸에 대 한 참조로 필요한 A. thaliana ATL 시퀀스를 검색 합니다.
3. FASTA 파일 grapevine와 계통 발생 분석에 포함 시킬 A. thaliana 유전자 가족의 모든 뉴클레오티드 시퀀스를 포함 하 여 작성 합니다. 뉴클레오티드 시퀀스 (단백질 시퀀스에 비해) 가족 구성원 간의 가변성의 최대를 수 있습니다.
계통 발생 나무
참고: Phylogeny.fr ²⁹ 파이프라인의 사용은 고품질 계통 발생 나무를 권장 하지만 필수 사항 아님.
1. Phylogeny.fr 홈페이지²⁹일을 "계통 발생 분석" 파이프라인을 선택 합니다.
  참고: "1 클릭 하십시오" 대부분의 경우에 적합 하지만 그것을 필요 하다 면 특정 고급 설정 ("고급") 또는 심지어 완전히 사용자 정의 분석을 선택할 수 ("단품"; 단계 5.2.5 참조).
2. 쓰기는 분석의 "이름", 업로드 FASTA 파일 이전에 만든 (단계 5.2.1, 그리고 클릭 "제출"는 분석을 실행 하려면.
3. 또는, 절차 (단계 5.2.1, 5.2.2) 위에서 설명한 경우 개별적으로, 다음과 같은 오류 메시지가 결과 계통 스위트 파이프라인의 각 단계를 완료.
  1. 근육 소프트웨어 홈페이지³⁰에서 "1 단계"에서 FASTA 파일 업로드 "피어슨/FASTA" "출력 형식"에서 "2 단계", 및 "제출"을 클릭 "3 단계" 쿼리 시퀀스 정렬에서 선택 합니다.
  2. "정렬 파일 다운로드"를 클릭 하 고 추가 단계 FASTA 파일로 저장.
  3. 프로세스 제대로 제거 하는 맞춤 FASTA 파일 위치 Gblocks 서버 도구³¹를 사용 하 여 정렬. 맞춤 FASTA 파일 업로드 "유형의 시퀀스"로 "DNA"를 선택 하 고 (예를 들어, grapevine ATL 유전자 가족 선택 하기 때문에 모든 세 가지 옵션 "덜 엄격한 선택"에 대 한 제안에 대 한 분석에 가장 적합 하는 엄중의 옵션을 선택 높은 순서 차이). "블록"에 도착 분석 실행을 클릭 합니다.
  4. 출력 페이지의 하단에 "결과 정렬"를 클릭 하 고 새 FASTA 파일로 결과 저장.
  5. ²⁹Phylogeny.fr 홈페이지 "계통 발생 분석" 파이프라인으로 "A 메뉴"를 선택 합니다. 그런 다음, "여러 정렬"을 선택 해제 및 "정렬 변호사". "워크플로 만들기"를 클릭 하십시오, Gblocks 큐레이터 FASTA 파일 (단계 5.2.5.4) 업로드 "설정"의 기본 매개 변수가 있는 "Bootstrapping 절차"를 선택 하 고 "제출"는 분석을 실행 하려면.
4. 제대로 지원 축소 분기 (즉, 부트스트랩 값 < 70%)를 클릭 하 여 "선택한 작업" 섹션에서 "분기 축소" 및 추가 분석에 Newick 형태로 최종 결과 다운로드.
계통에 따라 유전자 이름을 지정 합니다.
1. (단원 4.3) 위의 인용 iTOL 제품군으로 그것을 업로드 하 여 트리 구조의 안정성을 평가 하는 계통 발생 나무를 검토 합니다.
2. 각 가족 구성원을 수동으로 유전자 이름을 할당 합니다. 일대일 orthologues 경우 애기를 할당-이름 처럼 (예를 들어, AtATL3 → VviATL3). Grapevine 유전자 숫자, 또는 애기 유전자 숫자로 끝나는 경우 문자 사용 하 여 동일한 계통 발생 거리와 단일 애기 체에서 파생 하는 (두 개 이상의) 차별화 (예를 들어, AtATL23 → VviATL23a, VviATL23b).
3. 한 대 다 또는 다 대 다 orthologues 경우 할당 애기의 새로운 유전자 이름-이름 처럼 (여기, "ATL") 이미 vinifera 대 와 애기에 사용 되는 가장 높은 번호 보다 높은 숫자와 결합 (예., VviATL83).
4. 상단에서 하강 하는 계통 발생 나무 바닥을 새로 정의 된 가족의 명명법을 완료 합니다.

6. 소문 오르간과 무대 식 프로 파일링

가족 구성원에 대 한 작업 데이터 매트릭스 포함 식 데이터를 생성 합니다.
1. ³²ResearchGate 플랫폼 배포 하는 링크에서는 V. vinifera cv. Corvina 유전자 표현 아틀라스 datamatrix 다운로드. 이 파일에 다음 단계에서 사용할 정규화 RMA 식 값을 포함 되어 있습니다.
2. Atlas datamatrix에서 각 가족 유전자에 대 한 식 값을 추출 하 고 작성 "작업 datamatrix" 아틀라스 datamatrix로 동일한 머리글 행을 포함 하. "작업 datamatrix" 탭으로 구분 된 텍스트 파일로 저장 합니다.
멀티 실험 뷰어 (MeV) 소프트웨어를 사용 하 여 계층적 bi 클러스터 분석을 수행 합니다.
1. 다운로드 및 설치 MeV 소프트웨어³³.
2. "작업 datamatrix" 업로드 (6.1.2 단계) 경로 따라 "파일" → "데이터 로드" → "찾아보기" 선택한 텍스트 파일. "단일 색상 배열"을 선택 하 고 자동 주석이 제공 되지 않을 때 "부하 주석"에서 진드기를 제거. 식 테이블 미리 보기의 상단 왼쪽에 있는 식 값을 선택 하 고 "로드" 버튼을 클릭 합니다.
3. Log2 변환 ("조정 데이터" → "로그 변환" → "Log2 변환") 및 유전자/행 정규화 ("조정 데이터" → "유전자/행 조정" → "중간 센터 유전자/행")을 적용 하는 데이터를 조정 합니다. 적절 한 규모 제한 ("표시" → "설정 색상 규모 제한")을 설정 합니다.
4. 계층적 클러스터링 경로 "분석"을 따라 계산 → "클러스터링" → "HCL".

"연결 방법 선택" 필드에서 "유전자 잎 순서 최적화"와 "최적화 샘플 잎 순서" "주문 최적화 분야", "거리 매트릭스 선택" 필드, "평균 연계 클러스터링"에서 "피어슨 상관 관계"를 선택 합니다. 그런 다음 "확인"는 분석을 실행 하려면 클릭 합니다.

창의 왼쪽된 패널에 있는 "분석 결과" → "HCL" 메뉴에서 결과 보기 "파일" 메뉴에서 "이미지 저장"을 클릭 하 여 열 지도를 내보냅니다.

7. 식 Biotic 및 Abiotic 스트레스에 대 한 응답에서 프로 파일링

각 간행물 및 grapevine biotic 및 abiotic 스트레스 조사 연구에서 얻은 GSE 가입 id 단계 6.1 반복 합니다. 예를 들어 포도 열매 Botrytis cinerea NimbleGen 포도 전체-게놈 microarray를 사용 하 여 곰 팡이 병원 체와 감염의 transcriptome 프로필을 제공 하는 실험 GSE52586의 GSE id 찾아 수 있다. 6.1.1 및 6.1.2 단계를 반복 합니다.
NCBI 시퀀스 읽는 아카이브³⁴ SRA/BioProject id (예를 들어, SRP055458 또는 PRJNA275778 "grapevine 꽃 음영" 실험에 대 한)을 검색 하 고 모든 관련된 원시 순서 읽기를 다운로드. 많은 다른 연구에서 RNA-seq 데이터 일관성에 대 한 단일 파이프라인을 사용 하 여 처리 됩니다.
1. 간단히, 원시 시퀀스 FASTQ 읽기 (및 쌍-일자형) 트림 및 Trimmomatic³⁵품질 필터. AVGQUAL 및 MINLEN 각각 20와 40, 필터 사용 하 고 모든 매개 변수 기본.
2. 인덱스는 12 X grapevine 게놈¹ Bowtie2³⁶을 사용 하 여 참조 합니다. Bowtie2 명령을 실행 하기 전에 12 X grapevine 참조 게놈 (예를 들어, bowtie2 빌드)를 다운로드 합니다.
3. Htseq-수³⁷ grapevine V1 유전자 모델 주석 (GFF/GTF) 파일을 사용 하 여 함께 수 매트릭스 테이블을 가져옵니다.
R³⁸ limma³⁹ 라이브러리에 대 한 RMA 정규화 행렬 및 수 매트릭스 테이블 각각 7.1.1과 7.2.1, 단계에서 얻은 DESeq2⁴⁰ 라이브러리에서에서 차동 진 식 (re-) 분석을 수행 합니다.
1. 비교 작업에서 표준 2-그룹 "" (즉, "치료" / "제어"). "제어"와 "치료" 조건의 디자인 매트릭스/그룹 제대로 지정 되어 확인 하십시오.
  참고: 일반적으로 설계 microarray 차동 식 분석 (GSE52586)에 대 한 감염 Botrytis cinerea 제어 (건강 한) 열매에 대 한 동일한 개발 단계에서 limma 커맨드 라인을 실행으로 엘-33 열매를 비교 하 13 보충 파일 1에 표시 됩니다. RNA-seq 차동 식 분석 (SRP055458 또는 PRJNA275778) DESeq2 실행 하는 명령 라인 14 꽃 (모자-가 후에 7 일)에서 컨트롤에 대 한 음영 처리에서 비교에 대 한 일반적인 디자인은 보조 파일 1에에서 표시 된 .
2. 각 대비 limma에서 차동 표현한 유전자 (DEG)의 목록을 사용 하는 함수 lmFit(), eBayes(), 다음 가져오고 topTable() 함수, DESeq2를 위해 사용 하는 DESeqDataSetFromMatrix(), DESeq()및 results() 기능. 아래, 따라야 하는 일반적인 워크플로.
  1. Microarray 차동 식 분석을 위해 명령줄 15 (보충 파일 1)를 참조 하십시오. RNA-seq 차동 식 분석에 대 한 명령 라인 16 (보충 파일 1)를 참조 하십시오. 위의 단계를 반복 하 여 다른 적절 한 디자인 스키마 (단계 7.3.1의 예제 참조)와 모든 다른 대조에 대 한
ATL V1 취득에 해당, log2 접어 변경 (치료/제어)를 포함 하는 열을 유지 하는 모든 행을 추출 DEGs 생성의 목록에서 > | 0.5 | 조정 p-값 (루즈벨트) < 0.05, 그리고 병합 따라 행렬 테이블에 여부 연구에 빠진다 "비 생물 적인" 또는 "생물/병원 체 상호 작용" compendia 그들.
R gplots라이브러리 사용 하 여 계층적 클러스터 된 heatmaps (abiotic 및 생물 compendia)를 생성 합니다.
참고: 각 매트릭스 테이블에서 행 dendrograms 함께 heatmap을 구성 heatmap.2 함수를 호출 합니다. Cellnote 를 사용 하 여 추가 인수 차동 표현 구별 하는 데 도움이 작동 (log2FC > 0.5, 루즈벨트 < 0.05)에 의해 실험 조건의 넓은 범위에 걸쳐 각 비교에서 ATL 유전자는 * 기호. R 명령줄 17 (보충 파일 1) 실행에 일반적인 워크플로 적용 또는 양자 택일로, 반복 단계 6.2.2 6.2.5 MeV 소프트웨어를 사용 하 여 heatmaps를 생성 하.

8. Paralogous 시퀀스과 유전자 공동 발현 사이 관계의 분석

인덱스도 유사성을 포함 하는 행렬을 생성 합니다. 유사성 행렬의 요소가 없음을 단백질 줄 맞춤에서 계산 순서 유사성의 값입니다.
1. 인덱스도 시퀀스 정렬 하 고 텍스트 파일로 저장을 기본 설정으로 볼록 바늘 웹 서버⁴¹ 를 사용 합니다. 출력 텍스트 파일을 열고 열 및 행 이름 "similarityTable.txt" 라는 파일을 생성 하기 위해 함께 모든 주석 줄을 제거 합니다.
  참고: 표에서 유사성 값 없음을 정렬의 각 계산을 보고 각 ATL 유전자에 대 한 라인을 갖추고 있습니다. 행과 열에 loci의 순서는 같은 대칭 행렬의 대각선 값 생성 됩니다.
피어슨 상관 계수를 계산 하 여 공동 식 데이터 매트릭스를 생성 합니다. 다음 절차에는 R과 펄 모듈 PDL 필요합니다.
1. 식 값 실행 명령 라인 18 (보충 파일 1) 터미널 내에서 96 ATL 유전자에 대 한 다운로드. 명령 라인 19 (보충 파일 1)을 실행 하 여 다운로드 받을 수 있는 사용자 지정 perl 스크립트를 사용 하 여 공동 식 분석을 수행 합니다. 이러한 스크립트는 이전 보고 ATL loci의 쌍 사이 피어슨 상관 계수를 계산 합니다.
2. 명령 라인 20 (보충 파일 1)을 실행 하는 스크립트를 실행 하 고 출력 지침을 따르십시오.

스크립트 단계 8.1 (벽난로 테스트 실행 아래 참조 하십시오 필수적 이다이 주문)에서 얻은 매트릭스 같은 로커 스 이름 순서를 갖춘 공동 식 매트릭스를 포함 하는 출력 파일 (즉 "coexpressionTable.txt")을 생산할 예정 이다.

8.1와 8.2 단계에서 얻은 데이터 매트릭스 사이 벽난로 테스트를 수행 합니다. R 환경 (터미널 내에서 "R" 명령을 실행)을 입력 한 후 다음 명령을 사용 하 여 ade4 라이브러리를 로드: library(ade4)

두 개의 데이터 행렬을 로드 하 고 "nrep" 순열 수를 나타내는와 21 (보충 파일 1), 명령줄을 실행 하는 통계를 수행 하 여 벽난로 테스트를 실행 합니다. 이 행렬의 요소 간의 상관 관계를 계산, permuting는 매트릭스 및 다음 동일한 테스트 통계를 다시 계산 시험에 의하여 이루어져 있다.
참고: 통계 테스트의 모든 획득된 값 참조 분포 통계 시험, p를 계산 하는 데 사용 됩니다 구축 하 되-의미 테스트 값. 순열 수 정의 된 정밀도 p-값을 얻을 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

VIT_05s0077g01970 유전자, 식별 되는 가장 비슷한 A. thaliana ATL2 (At3g16720) BLASTp 검색을 통해이 포도 게놈에서 ATL 가족 구성원 조사에 프로브로 사용 되었다 (V. vinifera 이력서 피노 누아 PN40024). PSI 폭발 분석 융합 몇 주기 (그림 1A) grapevine ATL 유전자 가족에 속하는 상 상속 유전자의 목록이 공개 후. 각 후보에 대 한 정식 반지-H2 도메인의 존재 분석 (그림 1B)에서 식별 된 모든 항목의 근육 정렬의 시각적인 검사에 의해 평가 되었다. 포함 된 올바르게 간격된 보존된 아미노산, 두 개의 히스티딘 잔류물 프롤린 잔류물 3 시스테인 전에 유전자만 애기⁵에서 원래 ATL 정의 따르면 ATLs로 간주 됐다. 총 96 grapevine 유전자의 요구 사항을 충족 하 고 추가 특성에 대 한 고려 되었다. 각 ATL 가족 유전자 및 해당 인코딩된 단백질, 즉, 막 횡단 또는 소수 성 풍부한 지역, subcellular 반지-H2, 외에 다른 알려진된 도메인의 존재의 특정 한 특성을 정의 하기 위해 분석 지역화, 그리고 상 상속 인 산화 사이트 (표 1 및 표 2).

그림 1: PSI 폭발 조사 및 상 상속 grapevine ATLs의. (A) 스크린샷 미끼로 단백질 시퀀스 VIT_05s0077g01970를 사용 하 여 첫 번째 PSI 폭발 반복 검색의 상위 10 안타. 그들의 반지-H2 도메인 및 해당 로고를 보여주는 putative ATLs 분자 생물학의 스위트를 사용 하 여 얻은 96 선택 된 소문의 정렬의 (B) 부분 ( 재료의 표참조). Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현.이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

이름	유전자 ID	유전자 길이 (bp)	Intron 번호	UniProt ID	단백질 길이 (aa)	반지-H2 주제	TM/H 도메인 수	다른 도메인
VviATL3	VIT_09s0002g00220	1245	0	F6HXK6	304	PxC	1
VviATL4 [VviRHX1A]	VIT_15s0021g00890	1827	3	D7SM36	203	PxC	0
VviATL18	VIT_11s0118g00780	1113	2	F6HCI8	193	PC	0
VviATL23a	VIT_18s0001g01060	935	0	F6H0E4	114	PxC	0.5
VviATL23b	VIT_18s0001g01050	399	0	E0CQX3	132	PxC	1
VviATL24	VIT_17s0000g06460	4466	4	D7SI89	217	PxC	1
VviATL27	VIT_00s0264g00020	2554	4	D7T1R5	235	PxC	1
VviATL43	VIT_11s0052g00530	1576	2	D7SQD9	457	PxC	3
VviATL54a	VIT_18s0001g06640	3221	1	F6H0Y5	405	PxC	1
VviATL54b	VIT_03s0017g00670	2774	1	F6HTI0	427	PxC	1
VviATL55 [VviRING1]	VIT_07s0191g00230	1844	0	F6HRP9	372	PxC	1
VviATL63	VIT_06s0004g06930	804	0	D7SJU6	267	PxC	1
VviATL65	VIT_03s0063g01890	2068	0	F6HQI8	396	PxC	1
VviATL82	VIT_01s0026g02540	820	0	F6HPQ9	233	PC	0.5
VviATL83	VIT_17s0000g08400	1887	0	F6GSQ4	143	PC	0
VviATL84	VIT_06s0004g00120	1853	0	F6GUP5	368	PC	0.5	zf-RING_3
VviATL85	VIT_12s0034g01400	786	0	F6H965	261	PC	0.5
VviATL86	VIT_12s0034g01390	1434	1	D7T016	451	PC	0.5
VviATL87	VIT_18s0001g03270	1002	0	F6H0T2	333	PC	0.5	zf-RING_3
VviATL88	VIT_08s0040g00590	1320	0	F6HQR2	314	PC	0	zf-RING_3

표 1: 첫 번째 20 VviATL 유전자와 해당 단백질의 순서 특성. TM: 막 횡단; H: 소수 성; 0.5 이상의 소수 성 영역의 존재를 나타냅니다. Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현.

Table 2
표 2: 첫 번째 20에 VviATL 유전자 위치에 V. vinifera 게놈, 복제 상태 및 ATL 단백질 physico-화학 특성 및 위치. Musite;에 의해 (a) 인 산화 위치의 수 예측 (b) 유사한 예측 2 소프트웨어와 함께 얻은 강조 표시 됩니다에 굵게; TargetP v1.1와 단백질 추적자 Subcellular 지 방화 0.5의 확률의 인하와 함께 사용 하는 반면 ngLOC은 기본 설정으로 사용 되었다. 엔 유씨, 핵; MIT, 미토 콘 드리 아; CHL, 엽록체; PLA, 원형질 막; S, 분 비 통로 (신호 펩 티 드의 존재); M, 미토 콘 드리 아; C, 엽록체; O 또는-, 다른 위치; nd, 결정 되지 않는다 (즉, 임계값 값). Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현. 이 파일을 다운로드 하려면 여기를 클릭 하십시오.

계통 발생 분석 참조 A. thaliana ATL 유전자 가족의 시퀀스 함께 발견된 grapevine ATL 인코딩 유전자의 뉴클레오티드 시퀀스를 포함 하 여 소문 ATL 명명법의 지침에 따라 사용 되었다 sNCGGa⁸. V. vinifera 와 A. thaliana, 96 및 83 뉴클레오티드 시퀀스 각각 안정적인 계통 발생 나무를 Phylogeny.fr 파이프라인을 받게 했다.후자의 시퀀스 주석을 추가 하 고 견고한 관계 (그림 2)에 근거 하 여 그 유전자의 이름을 나중에 사용 되었다. 이 방법은 다음 13의 96 grapevine ATLs 받은 특정 식별자는 A. thaliana ATL.와 그들의 일대일 orthology 고려 다른 83 유전자의 이름은 진보 위쪽에서 아래쪽으로 번호 보다 높은 숫자에 사용 된 A. thalianaATL 유전자 수에서 시작 된 계통 발생 나무에 따라 할당 되었다.

그림 2: V. vinifera와 A. thaliana ATL E3 유비퀴틴 리가 인코딩 유전자의 계통 발생 나무. 닦된 트리 생성 된 Phylogeny.fr 스위트 (V. vinifera (녹색)에서 그리고 A. thaliana (노란색)으로 UniProt 데이터베이스에서 보고의 83 ATL 유전자. 지점 지원 값 100 부트스트랩 복제에서 얻은 했다. 붉은 별 BCA2 아연 손가락 (BZF) 도메인에서 해당 단백질의 존재를 나타냅니다. Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Grapevine 염색체에 유전자 ATL 인코딩 매핑 게놈, 소문에 ATL 유전자 가족의 확장에 중요 한 진화 힘으로 전체 게놈 중복 제안에 걸쳐 넓은 분포를 보였다. 실제로, 31 ATLs 단편 또는 전체 게놈 복제 이벤트에서 발생 하는 잠재적으로 동종 염색체 지구에서 발견 되었다. 또한, 동일한 분석 강조 13 tandemly 복제 된 유전자, 한 근 중복, 그리고 51 분산된 중복 (그림 3). ATL 가족에 중복된 유전자의 매우 큰 숫자, 고려 우리 게놈 분류 하는 동안 복제 된 유전자의 우선적 보존을 확인 하는 농축 테스트 (피셔의 정확한 시험)을 수행 합니다. P-값 < 0.001,이 테스트 ATL 유전자 중복 가설 이상 임의로 예상, grapevine 적응과 진화 하는 동안 ATL 유전자 가족에 대 한 역할을 제안 유지 했다 확인 했다.

그림 3: Grapevine ATL 인코딩 유전자 분포 V. vinifera 염색체와 중복 상태에. 정확한 염색체 정보는 데이터베이스에서 사용할 수 있는 96 grapevine ATL 유전자 V. vinifera 염색체 19에 매핑 했다. 색상은 원래 중복 이벤트를 나타냅니다. 세로 검은 줄과 빨간 줄 각각 탠덤 중복 및 전체 게놈 중복에서 파생 하는 쌍을 식별 합니다. Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

추가 조사 grapevine에 ATLs의 상 상속 생물 학적 기능, 메타 분석 Corvina 글로벌 유전자 발현 아틀라스¹²의 V. vinifera cv.에 실행 되었다. 데이터 집합 54 다른 grapevine 기관과 발달 단계 전체 게놈 식 값을 포함 하 고 계층적 bi 클러스터 분석을 수행 하는 데 사용 되었다. 결과 뿐만 아니라 모든 96 ATLs 54 조직/단계 중 하나 이상을 표현 했다 하지만 또한 식 프로필 (그림 4A)의 5 개 주요 클러스터의 존재를 지적 확인. 간단히, 클러스터 A 및 E 동작, 반대 했다 특히 첫 번째 특징은 청소년 샘플, 베리 초기, 젊은 잎, 이루고, 화 서, 그리고 새싹 단계의 대부분을 포함 하 여 ATL 유전자의 일반적인 downregulation입니다. 다른 한편으로, 동일한 클러스터 A, 숙성 및 수확 후 열매 등 성숙한 샘플 단계, 우 디, 조직과 주된 upregulation 보여 종자 개발 ATL 유전자의 늦은 단계가 늙 지. 클러스터 c에서 유전자 동안 ATL 유전자 클러스터 D에서에서 종종 upregulated 베리 발달의 후반 단계에서 주로 downregulated, 샘플의 대부분에서을 했다. 마지막으로, 클러스터 B 식 프로필에 어떤 관련성이 높은 변이 보여주지 않았다.

비슷한 접근 grapevine ATL 가족 biotic 및 abiotic 스트레스에 대 한 응답에서이 목적을 위해 만들어진 특정 데이터 집합을 사용 하 여의 식을 공부에 적용 되었습니다. Microarray 및 RNA-seq 실험에서 파생 하는 식 데이터의 엄청난 양의 유전자 식 옴니 버스 (지 오)와 ArrayExpress 같은 공용 액세스 데이터베이스에서 사용할 수 있습니다. 일단 수집 하 고 편리 하 게 표준화, 정보에 대 한 추가 스트레스에 식물 응답에서 ATLs의 잠재적인 기능 악용 했다. 62 중 96 성적 중요 한 변조 보였다 밝혀 grapevine ATLs biotic 스트레스에 대 한 응답에서의 식 프로필 분석 (log2 배 변화 (FC) > | 0.5 |) 틀린 발견 비율 (FDR)와 두 개 이상의 조건에서 < 0.05 ( 그림 4B)입니다. 수는 81만 단일 조건에서 루즈벨트 임계값을 고려 증가 합니다. 이러한 결과 강력 하 게 소문에도 병원 균에 대 한 응답에서 ATL 유전자 가족의 직접 참여를 제안 했다. 특히, 12 유전자 (VviATL3-27-54b-55-90-97-123-144-148-149-156)의 그룹 강하게 biotrophic 및 necrotrophic 균 류 및 herbivores를 포함 하 여 대부분 병원 균에 대 한 응답에서 upregulated 되었고 따라서,에 대 한 관심을 받을 자격이 추가 기능 분석입니다.

그림 4: ATL 유전자 발현 grapevine 아틀라스와 grapevine biotic 스트레스 관련 데이터 집합에서 계층적 clusteringof. (A) 변형 로그 식 아틀라스¹² 소문에 소문 ATL 유전자의 값 피어슨의 거리 통계에 따라 계층적 클러스터 분석을 위해 사용 되었다. (레드) 색상 규모 나타냅니다 더 높은 또는 낮은 (녹색) 식 모든 샘플에서 각 유전자의 중간 성적표 풍요에 존경으로 레벨. 오른쪽에 편지 A E 식별 하는 다른 클러스터를 나타냅니다.AB: 후 버스트; B: 버스트; 버드-w: 겨울 새싹; F: 꽃; FB: 꽃 시작; FS: 과일 세트; G: 그린; 미스터: 중순-숙성; PFS: 후 과일 세트; PHWI-ⅱ-3: 후 1, 2, 3 개월; 늙 지 수확 R: 숙성; S: 노화; 줄기-w: 나무가 우거진 줄기; V: veraison; WD: 잘 개발; Y: 영입니다. (B) 색상 규모 또는 증가 (빨간색)을 나타냅니다 (파란색) 배 각 조건에 대 한 컨트롤에 비해 감염 된 샘플에 grapevine ATL 유전자 발현의 변화를 감소. 별표 나타냅니다 중요 한 차동 식 (루즈벨트 < 0.05)의 해당 조건 하에서 각 ATL. Ariani 외. ⁴²크리에이 티브 커먼즈 저작자 표시 4.0 국제 라이센스 하에서 허가 된에서 재현. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

보충 표 1: ATL 유전자 후보 양자 택일 접합. (한) ATL 유전자 ID V1 포도 유전자 예측 및 주석, (b) ATL 유전자 ID V2 포도 유전자 예측 및 주석⁴³, 변종의 putative ATL 대체 접합, (d) (c) 수에 따라 코딩 각 putative ATL variant의 순서에 정보. 이 파일을 다운로드 하려면 여기를 클릭 하십시오.

보충 표 2: 이 파일을 다운로드 하려면 여기를 클릭 하십시오.

보조 파일 1: 이 파일을 다운로드 하려면 여기를 클릭 하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

게놈 시대에 많은 유전자 가족 깊이 여러 종의 식물에 특징 되어 있다. 이 정보 기능 연구 예비 이며 가족의 다른 구성원의 역할을 자세히 조사 하는 프레임을 제공 합니다. 이러한 맥락에서 중복 때 이름을 할당 하지 독립적으로 다른 유전자를 다양 한 연구 그룹에 의해 발생할 수 있는 혼란을 피하는 가족의 각 구성원을 고유 하 게 식별 하는 명명법 시스템 허용에 대 한 필요 또한 있다.

신중한 고려 후, grapevine 과학계 애기 유전자 유사성에 따라 가족에서 이름 grapevine 유전자에 동의 하 고 일련 grapevine에 새로운 유전자 가족을 설명 하기 위해 적용 해야 하는 규칙의 설립 기본적으로 포도 애기 가족 구성원⁸사이 뉴클레오티드 시퀀스의 계통 발생 비교에서 출발. 따라서, 이미 주석이 고 애기에 제대로 라는 유일한 유전자 grapevine 명명법에 사용할 수 있습니다. 여기서 설명 하는 애기에 grapevine ATL orthologues의 식별을 위해 적용 하는 절차 할당 올바른 grapevine 유전자 가족 전문 어의 요구 사항을 충족 하만 따라서 수행 되었다. 그럼에도 불구 하 고, 다른 식물 종, 대안 옵션 될 수 있습니다. 예를 들어, orthology 수 수 유추 orthologues 더 비슷한 두 종에 있는 유전자의 쌍으로 정의 된 양방향 폭발 안타 (BBH)을 사용 하 여 (즉, 높은 정렬 점수가) 서로 보다는 다른 다른 유전자 종⁴⁴. 그러나,이 방법은 식물 및 동물⁴⁵와 같은 유전자 복제의 높은 속도 경우 많은 orthologues 놓칠 수 있습니다. 또한, ATL 인코딩 유전자의 경우 BBH 부족 (를 포함 하 여 프롤린 잔류물) 정확한 ATL 형 링-H2 구조 유전자를 검색할 수 있습니다 또는 주석 하 고 애기에 ATLs 서는 유전자. 진화의 관점에서이 검색 관련성이 있을 수 있습니다, 비록 주석 하지 orthologues 검색 것가지고 이루어지지 grapevine ATL 유전자 가족 주석 및 명명법, orthologues ATLs로 주석 하지의 범위 이름 grapevine 가족 구성원을 사용할 수 없습니다. 또 다른 가능성은 orthology 같은 워크플로 과학계에 의해 명시적으로 권장 하지 않습니다 쓰 신 아미노산 뉴클레오티드 시퀀스 InParanoid⁴⁶또는 가장 최근의 Hieranoid 2⁴⁷를 사용 하 여 대신에 따라 추정 하는 것 이다.

식 메타 분석, 연구 하 고 결합 하는 식 데이터의 공개적으로 사용 가능한 데이터 집합 저장소 다른 체계적인 접근 방법으로 정의 될 수 있는 다양 한 조건에서에서 공유 및 다른 분자 메커니즘을 강조 수 있습니다. 따라서, 여러 대규모 transcriptomic 실험에서 유전자 표현 정보를 통합 하 여 향상 시킬 수 있습니다 유전자 가족의 특성 실험, 최소화를 통해 가족 구성원의 식 프로필을 정의 하 여는 실험 관련 요인과 특정 프로세스에 상 상속 유전자 기능의 더 강력한 가정 지원의 영향. 그러나, microarray 데이터를 사용 하 여 자신의 한계를 고려 하 고 다른 플랫폼으로 얻은 식 데이터의 통합을 요구 한다. 예를 들어, grapevine Nimblegen microarray 플랫폼, 해당 유전자 배열에 표시에 대 한 probesets의 상당한 비율에에서 (~ 13000 유전자)는 잠재적으로 간 교 잡 문제⁴⁸. Grapevine ATL 가족의 경우 15 유전자 같은 현상에 의해 영향을 받을 수 있습니다. 역시, 크레이 머 그 외 여러분 에 의해 논의 ⁴⁸을 동일한 프로브에 의해 매우 유사한 유전자 가족 구성원의 간 식별 특정 조건에서 단일 유전자의 뿐만 아니라 2 높은 순서를 공유 하는 더 많은 유전자의 표현에 관한 재미 있는 정보를 제공할 수 있습니다. 유사성, 따라서 잠재적으로 공유 대상 그리고 기능. Microarray 데이터 집합에 관련 된 또 다른 잠재적인 문제는 매우 민감한 microarray 플랫폼의 식 검출 한계입니다. 모두를 해결 하기 위해 우려, 즉., 간 교 잡 및 신호 감도, 가능한 솔루션만 RNAseq 식 데이터 집합 고려 될 수 있습니다. 그러나, RNAseq 많은 다른 연구에서 매우 큰 데이터 집합의 데이터에 대 한 메타 분석 매우 시간이 많이 소요 될 수 있고 많은 전산 자원과 높은 전문 필요할 수 있습니다.

그것은 확실히 더 수 있지만 접근 완전 한 될 것을 목표로 여기에 제시, 다른 분석 보완. 첫째, 분자 진화 및 식물에 유전자 가족 구성원 간의 계통 발생 관계를 더 달성 하기 위해, 계통 발생 분석 연장 될 수 있습니다 가족 구성원의 여러 시퀀스 정렬을 사용 하 여 계통 발생 나무를 건축 여러 식물 종에서. 그것도 Ks 값을 결정 하 여 가족 유전자, 진화, 동안 그들의 동의어와 비 동의어 대체의 추정의 진화 시간을 계산 가능 (에 동의어 사이트 당 동의어 대체의 숫자는 주어진 시간 기간)와 카 (같은 기간에 비 동의어 사이트 당 nonsynonymous 대체의 수). Ka/Ks 비율 그들의 조상에서 분기 후 유전자 복제 이벤트의 메커니즘을 추론 하는 데 사용 됩니다. Ka/Ks의 값 = 1 제안 중립 선택, Ka/Ks 값 < 1 제안 선택 및 Ka/Ks 값 정화 > 1 긍정적인 선택⁴⁹나왔다. 또한, 유전자 구조 분석 결과 introns의 존재, 경우 유전자 가족 특성화 확장할 수 있습니다 더 이체를 접합 하는 대안의 검출. 실제로, 이러한 ATLs (참조에 대 한 2에서 16에 이르기까지 isoforms의 잠재적인 번호로 대체 접합 이벤트에 대 한 강한 후보는 ATLs RNA-seq 및 데이터를 다른 조직, 스트레스 조건 genotypes⁴³, (96)의 21의 깊은 조사에 따라 보충 표 1)입니다. 대체 성적표 자주 아미노산 시퀀스에서 다른 단백질 isoforms를 생산 하 고 이러한 단백질의 세포 속성을 변경할 수 있습니다 변화와 유전자 제품의 기능의 손실에 미묘한 변조에서 변경 될 수 있습니다. 그 이유로, 대안 접합 이벤트 스트레스 반응, 질병 저항, 광합성, 및 꽃⁵⁰^,⁵¹를 포함 하 여 중요 한 식물 기능에 참여 했습니다.상 상속 cis을 포함 하는 ATL 유전자 발기인 정보 통합-규제 요소⁵² 또는 분자 (예, 예측에 관한 고 오래 비 코딩 RNA) 잠재적으로 대상 ATLs⁵³ 찾는에 보완 될 수 있습니다 복잡 한 분자 규정과 grapevine ATLs의 상호 작용에 대 한 시스템 통찰력을 계시 한다.

결론적으로, 종의 식물에서 새로운 유전자 가족의 특성에 적용 하는 절차 뿐만 아니라 수행 하는 분석의 선택은 주로 구동 유전자 가족 id의 범위 뿐만 아니라 과학적 커뮤니티 규칙에 의해. 정보 세트를 이용할 것입니다, 가능한 후속 조사 단계를 명심 하는 것이 중요 하다 식물 종, 게놈 구조 설명, 또는 선택에 대 한 신뢰할 수 있는 후보자 유전자 진화 기능에 포함 된 중 연구입니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 없다.

Acknowledgments

일 공동 프로젝트 2014 (grapevine에 ATL 유전자 가족의 그리고 Plasmopara viticola저항에의 참여의 특성화) 프레임 내 베로나의 대학에 의해 지원 되었다.

Materials

Name	Company	Catalog Number	Comments
Personal computer
Basic Local Alignment Search Tool (BLAST)			https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA)			http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME)			http://meme-suite.org/
Geneious	Biomatters Limited		http://www.geneious.com/
ProtParam Tool			http://web.expasy.org/protparam/
ngLOC			http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server			http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler			http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite			http://musite.sourceforge.net/
Pfam			http://pfam.xfam.org/
TMHMM Server v. 2.0			http://www.cbs.dtu.dk/services/TMHMM/
ProtScale			http://web.expasy.org/protscale/
Grape Genome Database (CRIBI)			http://genomes.cribi.unipd.it/grape/
PhenoGram			http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX			http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL)			http://itol.embl.de/
UniProt			http://www.uniprot.org/
Phylogeny.fr			http://www.phylogeny.fr/index.cgi
MUSCLE			http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server			http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix			https://www.researchgate.net/publication/273383414_54sample_ datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV)			http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA)			https://www.ncbi.nlm.nih.gov/sra
R			https://www.r-project.org/
EMBOSS Needle (EMBL-EBI)			http://www.ebi.ac.uk/Tools/psa/emboss_needle/

DOWNLOAD MATERIALS LIST

References

Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. , Science Publishers. 211-234 (2011).
Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
BLAST. BLAST2.6.0. , Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
MEGA. MEGA7.0.25 build 7170412. , Available from: http://www.megasoftware.net/ (2017).
MEME. MEME Suite Version 4.11.4. , Available from: http://meme-suite.org/ (2017).
ProtParam. ExPASy Server. , Available from: http://web.expasy.org/protparam/ (2005).
ngLOC v1.0. , Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
TargetP v1.1 Server. , Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
Prowler v1.2. , Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
MuSite v1.0. , Available from: http://musite.sourceforge.net/ (2010).
Pfam. Pfam version 31.0. , Available from: http://pfam.xfam.org/ (2016).
TMHMM v2.0c. , Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
ExPASy. ProtScale. , Available from: http://web.expasy.org/protscale/ (2005).
CRIBI. Grape genome database. , Available from: http://genomes.cribi.unipd.it/grape/ (2012).
PhenoGram. , Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
ScanX v0.8. , Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
Interactive Tree Of Life (iTOL). Version3.5.3. , Available from: http://itol.embl.de/ (2016).
UniProt. , Available from: http://www.uniprot.org/ (2016).
Phylogeny.fr. , Available from: http://www.phylogeny.fr/index.cgi (2008).
MUSCLE. , Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
Gblocks Server. Version 0.91b. , Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
Vitis vinifera cv. Corvina gene expression Atlas. , Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
Multiple Experiment Viewer (MeV). Version 4.8.1. , Available from: http://mev.tm4.org/ (2017).
Sequence Read Archive (SRA). , Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
R. Version 3.4.1. , Available from: https://www.r-project.org/ (2017).
Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
EMBL-EBI. EMBOSS Needle. , Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Biology

게놈 넓은 식별 및 소문의 ATL E3 유비퀴틴 리가 유전자 가족의 식 메타 분석을 위한 포괄적인 워크플로

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.