Immunology and Infection

사용 하 여 계통 발생 분석은 진 핵 유전자 원산지 조사

Published: August 14, 2018 doi: 10.3791/56684

Dechun Zhang*¹, Xianzhao Kan*², Sarah Elizabeth Huss³, Lan Jiang², Li-Qing Chen³, Yibing Hu⁴

¹Key Laboratory of Three Gorges Regional Plant Genetics and Germplasm Enhancement (CTGU)/Biotechnology Research Center, China Three Gorges University, ²The Institute of Bioinformatics, College of Life Sciences, Anhui Normal University, ³Department of Plant Biology, University of Illinois at Urbana-Champaign, ⁴College of Resources & Environmental Sciences, Nanjing Agricultural University

* These authors contributed equally

Summary

순서 상 동 자의 진핵생물과 SemiSWEETs에서 prokaryotes에서에 따라 계통 발생 나무를 구성 하는 방법을 설명 합니다. 계통 발생 분석은 다른 유기 체 그룹에서 동종 단백질 또는 유전자 진화 relatedness를 설명 하는 유용한 도구.

Abstract

계통 발생 분석을 사용 하 여 뉴클레오티드 또는 아미노산 시퀀스 또는 다른 매개 변수를 도메인 시퀀스 등 3 차원 구조는 분자에서 다른 taxa (분류 단위) 사이 진화 관계를 표시 하는 트리를 구성 수준입니다. 계통 발생 분석 사용할 수 있습니다 개별 taxon, 내 도메인 관계 조사를 실질적인 받은 생물 형태학과 생리학, 하지만 어떤 연구자 부족으로 인해 화석 증거에 대 한 변경에 대 한 특히는 생물의 긴 진화 역사 또는 담았다의 부족.

이 텍스트는 계통 발생 방법, 아미노산 순서 정렬 Clustal 오메가, 그리고 둘 다 최대 가능성 (ML) 분자 진화 유전학의를 사용 하 여 후속 계통 발생 나무 건축을 사용 하 여를 사용 하 여에 대 한 자세한 프로토콜 설명 분석 (메가) 및 MrBayes 통해 베이지안 추론. 진 핵 설탕 것 이다 결국 수출 전송기 수 (달콤한) 유전자의 기원 조사, 228 과자 35 달콤한 단백질에서 단 세포 진핵생물과 원핵생물에서 57 약간 단 단백질을 포함 하 여 분석 되었다. 흥미롭게도, SemiSWEETs 원핵생물에서 찾아냈다 그러나 과자는 진핵생물에서 발견 됐다. 이론적으로 다른 방법을 사용 하 여 건설의 계통 발생 나무 2 개는 지속적으로 첫 번째 핵 달콤한 유전자 세균성 약간 단 유전자와 archaeal 약간 단 유전자의 융합에서 줄기 수 있습니다 제안 했다. 그것은 하나는 결론을 끌기 위해는 계통 발생 분석에만 기반으로 어렵거나 심지어 실험 방법을 통해 분별 하는 다른 taxa 사이의 기본 관계를 설명 하는 데 유용 하지만 신중 해야 지적 가치 .

Introduction

DNA 또는 RNA 순서 생리 및 생 화 확 적인 방법을 통해 분석 하거나 형태학 및 화석 증거를 통해 관찰 될 수 있는 기본 고기에 대 한 유전 정보를가지고. 의미에서 유전 정보 외부 고기 때문에 전자는 후자에 대 한 기초 평가 보다 더 안정적입니다. 진화 연구, 화석 증거에서는 매우 직접적이 고 설득력 있는입니다. 그러나, 미생물와 같은 많은 유기 체를 긴 지질 시대 화석 형성 작은 기회가 있다. 따라서, 뉴클레오티드 시퀀스 및 관련된 현존 생물에서 아미노산 시퀀스 등 분자 정보 진화 관계¹을 탐험에 대 한 가치는 있습니다. 현재 연구에서 기본적인 계통 발생 지식과 배우기 쉬운 프로토콜의 간단한 소개 자신의 계통 발생 나무를 구성 하는 이민자를 위한 제공 했다.

동종 유전자, 세포, 또는 심지어 유기²계통 발생 관계를 추론 (뉴클레오티드) DNA와 단백질 (아미노산) 시퀀스를 사용할 수 있습니다. DNA 시퀀스 동안 진화 변화에 의해 영향을 받을 가능성이 더 높습니다. 대조적으로, 아미노산 시퀀스는 훨씬 더 안정 주어진 뉴클레오티드 시퀀스에 동의어 돌연변이 아미노산 시퀀스에서 돌연변이 발생 하지 않습니다. 그 결과, DNA 시퀀스는 반면 아미노산 시퀀스는 먼 관련된 생물³에서 동종 유전자에 대 한 적절 한 밀접 하 게 관련된 유기 체에서 동종 유전자의 비교를 위해 유용 합니다.

아미노산의 맞춤으로 시작 하는 계통 발생 분석 또는 시퀀스, FASTA 형식, 즉, 상 상속 또는 표현 단백질에 나열 된 뉴클레오티드 시퀀스⁴ 한 주석된 게놈 시퀀싱 데이터베이스⁵ 에서 검색 RNA 순서 또는 DNA 순서. 그것은 높은-품질 시퀀스 분석을 위해 수집 하는 것이 중요 하만 동종 시퀀스 계통 발생 관계를 분석 하는 데 사용할 수 있습니다. 많은 다른 플랫폼 Clustal W, Clustal X, 근육, T-커피, MAFFT, 시퀀스 정렬에 사용할 수 있습니다. Clustal 오메가⁶^,⁷ (http://www.ebi.ac.uk/Tools/msa/clustalo/), 온라인으로 사용할 수 또는 무료로 다운로드 될 수 있다는 가장 널리 사용 되는. 정렬 도구는 많은 매개 변수를 기본 매개 변수는 대부분의 경우에서 잘 작동 하지만 사용자 정렬, 시작 하기 전에 조정할 수 있습니다. 프로세스가 완료 되 면 정렬된 시퀀스 다음 단계에 대 한 올바른 형식으로 저장 해야 합니다. 그들은 다음 편집 한다 또는 메가 하 여 계통 발생 나무 건축 (를 포함 하 여 아미노산 약어 및 하이픈 길이가 되도록 시퀀스 필요 하기 때문에 BioEdit, 같은 편집 소프트웨어를 사용 하 여 손질. 정렬 된 시퀀스에는 아미노산 또는 뉴클레오티드 없이 어떤 위치 든 지 하이픈으로 표시는 "-"). 일반적으로, 튀어나온 아미노산 또는 뉴클레오티드 맞춤의 양쪽 끝에 모두 제거 되어야 한다. 또한, 열 맞춤에서 잘못 정렬 된 시퀀스를 포함 하는 그들은 약간 귀중 한 정보를 전달 하 고 때로는 혼란 또는 거짓 정보³를 줄 수 있기 때문에 삭제할 수 있습니다. 이 시간에 또는 이후 트리 건설 단계에서 하나 이상의 하이픈을 포함 하는 열을 삭제할 수 있습니다. 또는, 그들은 계통 발생 계산에 사용할 수 있습니다. 순서 정렬 및 트리밍 완료 되 면, 정렬된 시퀀스 FASTA 형식, 또는 차후 사용을 위해 원하는 포맷에 저장 한다.

많은 소프트웨어 플랫폼 다른 방법 또는 알고리즘을 사용 하 여 트리 건설 기능을 제공 합니다. 일반적으로 메서드는 거리 매트릭스 방법 또는 개별 데이터 방법으로 나눌 수 있다. 거리 매트릭스 방법 간단 하 고 빠른 계산, 개별 데이터 메서드는 복잡 하 고 시간이 많이 걸리는 동안에. 공유의 아미노산 또는 뉴클레오티드 순서, 거리 행렬 방법의 높은 수준으로 매우 밀접 하 게 관련된 taxa에 대 한 (이웃 합류: 뉴저지; 산술 평균 unweighted 쌍 그룹 방법: UPGMA) 적합 한; 먼 관련된 taxa, 개별 데이터 방법에 대 한 (최대 가능성: ML; 최대 간결: MP; 베이지안 추론) 최적의³^,⁸입니다. 이 연구에서는 메가 (6.0.6) 및 베이지안 추론 (MrBayes 3.2) ML 방법 계통 발생 나무⁹를 생성에 적용 했다. 이상적으로, 적절 한 모델 및 매개 변수 사용 하는 다른 방법에서 파생 된 결과 일치, 있을 수 있습니다 그리고 그들은 따라서 더 안정적이 고 설득력 있는.

¹⁰메가 사용 하 여 건설 ML 계통 발생 나무에 대 한 프로그램으로 FASTA 형태로 정렬된 시퀀스 파일을 업로드 해야 합니다. 첫 번째 단계는 다음 업로드 된 데이터에 대 한 최적의 대체 모델을 선택 하는 것입니다. 업로드 된 순서에 따라 모든 사용할 수 있는 대체 모델을 비교 하 고 그들의 최종 점수 결과 테이블에 표시 됩니다. (테이블에 처음 나열) 작은 베이지안 정보 기준 (의 BIC) 점수와 모델을 선택 권장 모델 ML 매개 변수를 설정 하 고 계산을 시작. 계산 시간 로드 데이터 (길이 시퀀스 및 taxa의 수)의 복잡 하 고 프로그램은 실행 하는 컴퓨터의 성능에 따라 몇 일 분에서 변화 한다. 계산이 완료 되 면, 계통 발생 나무는 새 창에 표시 됩니다. "FileName.mat"로 파일을 저장 합니다. 나무의 모양을 지정 하는 매개 변수를 설정한 후 다시 한 번 저장 합니다. 이 메서드를 사용 하 여 메가 게시 학년 계통 발생 나무 그림을 생성할 수 있습니다.

MrBayes¹¹나무 건설, 대 한 첫 번째 단계는 넥서스 형식 (파일 형식으로.nex)으로 보통 FASTA 형태로 나열 된 정렬 된 순서를 변환 하입니다. FASTA 파일 넥서스 형식으로 변형 하는 것은 메가에서 처리할 수 있습니다. 다음, 넥서스 형태로 정렬된 순서 MrBayes에 업로드할 수 있습니다. 파일이 성공적으로 업로드 하는 경우 트리 계산에 대 한 상세한 매개 변수를 지정 합니다. 이러한 매개 변수 커플링, ngen 번호 아미노산 대체 모델, 변형 률, 체인 번호 마르코프 연쇄 몬테 카를로 (MCMC)에 대 한 세부 정보를 포함, 분할 주파수의 표준 편차를 평균 하 고. 이러한 매개 변수를 지정한 후 계산을 시작 합니다. 결국, ASC II 코드, 보여주는 하나의 clade 신뢰성 및 다른 표시 지점 길이, 2 개의 나무 숫자는 화면에 표시 됩니다.

나무 결과 "FileName.nex.con"으로 자동으로 저장 됩니다. 이 트리 파일을 열 수 및 기관에 의해 편집 그리고 기관에 표시 하는 그림 추가 수 있도록 게시를 위해 더 적당 한 수정할 수 있습니다.

이 연구에서는 단 세포 진핵생물에서 35 자와 원핵생물에서 57 SemiSWEETs를 포함 하 여 228 달콤한 단백질, 예를 들어 분석 했다. 과자 및 SemiSWEETs는 막¹²^,¹³에 걸쳐 포도 당과 당, 또는 자당 전송기 특징 이었다. 계통 발생 분석 과자 포함 된 두 개의 MtN3/타 액 도메인 archaeon¹⁴와 세균성 SemiSWEET의 진화 융합에서 파생 될 수 있습니다 제안 합니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 시퀀스 정렬

진 핵 정하고 별도 문서에 간결한 SemiSWEET의 아미노산 시퀀스를 수집 하 고 FASTA 형태로 그들을 나열. 유사성 검색 기본 로컬 맞춤 검색 도구 (폭발) 도구를 사용 하 여 생명 공학 정보 (NCBI), 유럽 분자 생물학 실험실 (EMBL), 및 일본 (DDBJ) 데이터베이스의 DNA 데이터 은행에 대 한 국립 센터에서 시퀀스 다운로드.
1. 예제 파일에서 진핵생물과 원핵생물의 단일 MtN3/타 액 도메인 (3 막 횡단 나선)를 소지 하는 57 약간 단 단백질 시퀀스의 두 MtN3/타 액 도메인 (7 막 횡단 나선)를 소지 하는 228 putative 달콤한 단백질 시퀀스를 수집 ¹³.
2. 프로세스를 단순화 하려면 계통 발생 나무 건축을 위해 228 putative 과자 중 단 세포 진 핵 생물에서 35 후보 달콤한 단백질을 선택 합니다. 이러한 시퀀스는 독자가 실제 데이터 세트에 연습 수 있도록 연결 됩니다.
35 달콤한 시퀀스 정렬 Clustal 오메가 (http://www.ebi.ac.uk/Tools/msa/clustalo/)으로 그들을 입력 하 여.
1. 복사 및 붙여 단백질 시퀀스 FASTA 형태로 입력된 상자 또는 FASTA 형식의 시퀀스 파일 업로드. 그들은 ' 1 단계 ' 단원의 풀 다운 메뉴에서 아이콘을 클릭 하 여 아미노산 시퀀스는 지정 합니다.
2. 필요한 경우 ' 2 단계 ' 섹션에서 출력 형식 및 다른 매개 변수를 지정 합니다. 이 연구를 위해 "clustal 번호 없이",으로 출력 포맷을 설정 하 고 다른 매개 변수를 기본 설정에 두고. 대부분의 경우에서 기본 매개 변수는 어떤 사양 하지 않고 잘 작동합니다.
제출 하 고 ' 3 단계 ' 단원의 맞춤을 실행 합니다. 그것은 분 맞춤 완료 될 때까지 몇 초에서 아무 데도 걸릴 수 있습니다. 결과 요약 패널에서 "CLUSTAL 형식에서 맞춤"에서 링크를 마우스 오른쪽 단추로 클릭 하 고 "35.clustal" (그림 1)으로 정렬 된 시퀀스를 저장 합니다.
BioEdit에서 정렬 결과 파일을 엽니다.
1. BioEdit의 주 패널에서 "시퀀스"를 클릭 첫 번째 풀 다운 메뉴에서 "편집 분위기"를 선택한 다음 하위 메뉴 (그림 2)에서 "편집 잔류물"를 클릭.
2. 정렬 (선택한 시퀀스는 검정색으로 표시 됩니다) 커서의 왼쪽에 튀어나온 시퀀스를 선택 합니다 (그림 3) 선택 된 시퀀스를 제거 하려면 "편집" 메뉴에서 "Delete" 아이콘을 클릭 합니다.
3. 선택 및 첫 번째 MtN3/타 액 도메인의 오른쪽에 튀어나온 시퀀스를 삭제 하 고 35-I.fas (그림 4)으로 트림된 첫 번째 MtN3/타 액 도메인 시퀀스를 저장 합니다. 마찬가지로, 왼쪽 및 오른쪽 튀어나온 두 번째 MtN3/타 액 도메인의 시퀀스를 삭제 하 고 35-II.fas로 저장. 첫 번째 및 두 번째 MtN3/타 액 도메인 시퀀스 수 있습니다 예측할 수 리듬 (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) 또는 TMHMM (http://www.cbs.dtu.dk/services/TMHMM/)와 함께 사전에.
메가, 파일 35-I.fas를 열고 "정렬" 메시지가 표시 되 면 클릭 합니다. "편집" 메뉴에서 "모두 선택"을 클릭 "선택 애"; 이름과 시퀀스는 taxa의 블랙 (그림 5)에서 선택 됩니다.
1. 시퀀스를 클립보드에 복사 하려면 "편집" 메뉴에서 "복사"를 선택 하 고 복사 된 시퀀스는 doc 파일에 붙여 넣습니다.
2. 모든 "#" doc 파일에서 바꿉니다 ">", FASTA 형식 변환 관련 없는 문자가 삭제. 추가 "-I" 첫 번째 MtN3/타 액 도메인 시퀀스로 표시 각 taxon 이름 끝에. 다음과 같은 메서드를 두 번째 MtN3/타 액 도메인 시퀀스를 처리 하 고 추가 "-II" 각 taxon 이름.
첫 번째 및 두 번째 MtN3/타 액 도메인 시퀀스 FASTA 형식의 문서 파일에 결합 합니다.
1. Clustal 오메가에 결합 된 시퀀스를 다시 로드 하 고 위에서 설명한 대로 시퀀스를 정렬. "35 realigned.clustal"로 결과 저장 합니다.
2. BioEdit에서 "35 realigned.clustal" 파일을 열고, 정렬 된 시퀀스의 양쪽 끝에 고르지 (튀어나온) 아미노산 잔류물을 삭제 하 고 시퀀스 "35 realigned.fas"로 저장. 일부 비표준 문자를 저장할 수 없습니다 경고 때 "예"를 클릭 합니다.

2입니다. 계통 발생 나무의 계산

메가에서 "35 realigned.fas"를 엽니다.
1. "수출 맞춤", "데이터" 메뉴를 클릭 선택한 맞춤 PAUP 형식 (넥서스) "35.nex" MrBayes (그림 6)에서 나중에 사용 하기 위해 저장 합니다.
2. 한편, 메가의 메인 패널에 "모델" 아이콘을 클릭 하 고 선택한 "찾을 최고의 DNA/단백질 모델 (ML)", 팝업 창에서 "확인"을 클릭 합니다. 프로세스 (그림 7)를 검색 하는 모델을 시작으로 "계산"을 클릭 합니다. 새로운 진행률 패널을 열 것 이다; 이 과정의 로드 시퀀스 컴퓨터의 성능과 복잡성에 따라 몇 일 분 정도 지속 됩니다.
  참고: 테이블 보여주는 모델 검색 프로세스가 완료 되 면 결과 열립니다 ( 그림 8). 작은 빅 점수 나열 됩니다 첫째, 뒤에 점차 빅 점수를 증가 함께 다른 모델의 시리즈. 작은 빅 점수와 함께 첫 번째 모델 "LG + G + F" ML 트리 "35 realigned.fas" 파일에 대 한 권장된 모델이입니다.
메가의 메인 패널에 "계통" 아이콘 "구문/테스트 최대 가능성 나무"를 누르고 팝업 패널에서 "예"를 클릭. 새 창이 나타납니다 다른 표시 되어야 하는 매개 변수 지정 (그림 9).
1. 첫째, 계통 상자;의 시험에서 부트스트랩 값을 설정 500 또는 1000은 대부분의 경우에 적합 합니다. 대체 모델에서 대체 형식으로 "아미노산"을 선택 합니다. 대체 모델 선택의 목적은 그들의 현재 주³에 따라 시퀀스의 진정한 차이 예측 것입니다.
2. 선택 하는 "lg 전자는 Freqs와 함께. (+F) 모델 "(LG + F) 모델/메서드 상자에. 속도 패턴 상자에서 선택 "감마 배포" (G) 사이트, 즉속도 변화를 설명 하기 위해.,³사이트 천천히 진화에서 변화에 더 많은 무게를 주는. 데이터 하위 집합 상자에서 "전체 삭제" 하는 것을 선택 모든 하이픈을 포함 하는 열을 제거 하려면.
3. 그들의 기본 상태 (그림 9)에 다른 모든 매개 변수를 유지. 이러한 매개 변수 지정 후 계산을 시작 하려면 "계산" 아이콘을 클릭 합니다.

3. 계통 발생 나무의 프레 젠 테이 션

참고: 계통 발생 ML 트리 나타납니다 메가 사용 하 여 계산 완료 되 면 (그림 10).

트리 패널에 있는 "파일" 아이콘의 풀 다운 메뉴에서 선택 "" 결과 저장 하려면 현재 세션을 저장 (.mas는 기본 파일 형식). 현재 연구 결과 "35.mas"로 저장 되었다. 트리 패널에 clade의 길이 포함 하 여 많은 매개 변수 트리 스타일, 트리 토폴로지, taxon 이름, 크기, 및 색깔의 글꼴 표시 되 고 다른 옵션을 설정할 수 있습니다.
이미지 아이콘을 클릭 하 여 최종 트리 파일 저장 다른 형식으로 그림을 저장 하거나 사진 편집에 대 한 원본으로 이미지를 복사.

4. 과자 및 정렬 순서를 사용 하 여 SemiSWEETs의 관계 분석

참고:이 단계를이 수행 하지 일반 시퀀스 분석에 필요할 수 있습니다.

228 진 핵 자와 57 간결한 SemiSWEETs Clustal 오메가 위에서 설명한 대로 맞춥니다. 정렬 결과 Clustal 오메가, 통합 이며 복사 사진 편집기 (그림 11)에 저장 하는 Jalview에 표시 될 수 있습니다.
참고: 예제에서는 정렬에 α-Proteobacteria에서 일부 SemiSWEETs 정렬 됩니다 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인 반면 달콤한 시퀀스의 두 번째 MtN3/타 액 도메인 SemiSWEETs Methanobacteria (archaea)에서 정렬 됩니다.

5. 계통 발생 나무 건축 MrBayes

베이즈 추론 MrBayes와,에 대 한 MrBayes 실행 파일 열고 도스 인터페이스 새 창에서 올 것 이다. 첫 번째 단계는 넥서스 데이터 ﬁle를 읽을 수 있다. 입력 "execute 35.nex" 프롬프트 후 (35. nex 파일의 MrBayes 실행 파일 같은 디렉터리에 저장 하거나 그것을 업로드 하기 전에 파일의 통로 지적 기억). 다음 나열 된 taxa (그림 12)의 마지막 "성공적인 읽기 매트릭스" 메시지가 표시 됩니다. 35. nex 파일 이미 준비 되었으며 메가에 저장 (위의 2.1 참조).
진화 모델을 설정 합니다.
1. 입력을 한 후 "prset aamodelpr = fixed(lg); lset 요금 = g ". "Lg 전자"와 "g" 메가에 설정 되는 "lg 전자"와 "G" 모델에 해당 합니다. 모델을 성공적으로 설정한 후 입력 "mcmc nchains = 4 ngen 5000000 =" 프롬프트 후. 사용은 "nchains = 4" 항목 한 콜드 체인 및 대도시 커플링에 대 한 3 개의 뜨거운 체인의 총 수를 나타냅니다. "ngen 5000000 =" 춥고 뜨거운 체인의 융합을 위한 대도시 커플링의 5000000 세대를 실행 하는 것을 의미. 이 연구에서 평균 표준 편차 0.01 분할 주파수의 따뜻한 것과 차가운 체인의 융합으로 간주 되었다.
2. Ngen 번호는 프로세스의 시작 부분에 정확 하 게 예측할 수 없습니다와 일반적으로 조정에 따라 분할 주파수의 평균 표준 편차에 변화. 또한, 융합을 위한 ngen 번호 수 있습니다 때 동일한 데이터를 기반 프로그램을 실행 하는 각 시간.
실행 분석: 이 단계는 컴퓨터의 성능과 입력된 데이터의 복잡성에 따라 몇 일 분에서 지속. 미리 계산을 완료 한 후 프롬프트가 묻습니다 "계속 분석 (예/아니요)?" "아니오" 입력 하는 경우 프롬프트 후, 컴퓨팅 (그림 13), 중지 됩니다 그렇지 않으면 계속 됩니다 추가 세대 수 입력 후 계산 하. 계산이 완료 되 면 (분할 주파수의 평균 표준 편차와 < 0.01 또는 0.05), 후 문의 프롬프트 "no"를 입력 하 여 계산을 중지.
참고: 0.01은 엄격한 기준, 0.05 온건 하 고 일반적으로 적절 한.
샘플 요약: 모델 매개 변수 (그림 14)의 샘플 요약을 프롬프트 후 "기름 통"을 입력 합니다. 다음 입력 "sumt relburnin 예 burninfrac = 0.25 =" 요약 트리 샘플 프롬프트 후. 계통 발생 나무 건축에 대 한 자세한 내용은 그림 15, 두 나무 그림 화면, 보여주는 하나의 clade 신뢰성 및 다른 표시 지점 길이에 ASC II 코드에 나타납니다 다음 처럼 표시 됩니다. 동시에 "35.nex.con"의 이름 가진 나무 파일을 자동으로 저장 됩니다.
계통 발생 나무의 더 나은 프레 젠 테이, 기관 도구 (http://tree.bio.ed.ac.uk/software/figtree/) "35.nex.con" 트리 파일을 열고, 스타일 또는 크기 (그림 16) 결과 표시를 선택 또는 심지어 그것을 사진 편집기에서 편집 더 리더-친절 한.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

계통 발생 나무 35 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인의 모든 한 clade와 다른 clade로 클러스터 달콤한 시퀀스의 두 번째 MtN3/타 액 도메인으로 클러스터를 표시 합니다. 또한, 과자 및 SemiSWEETs의 정렬 결과 표시 일부 SemiSWEETs α-Proteobacteria에서 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인으로 정렬 SemiSWEETs Methanobacteria (archaea)에서 두 번째 MtN3/타 액과 정렬 하는 반면 달콤한 시퀀스의 도메인입니다. 이 결과 함께 과자 포함 된 두 개의 MtN3/타 액 도메인 archaeon¹⁴와 세균성 SemiSWEET의 진화 융합에서 파생 될 수 있습니다 것이 좋습니다.

그림 1 : 35 putative 진 핵 자의 정렬된 시퀀스 Clustal 오메가 통해 "35.clustal"로 저장. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 2 : "35.clustal," Clustal 오메가 준비의 정렬 된 시퀀스를 트림 BioEdit에서 경로 선택. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 3 : 선택 하 고 삭제 BioEdit에서 35 putative 진 핵과의 첫 번째 MtN3/타 액 도메인 시퀀스의 왼쪽된 면에 고르지 못한 시퀀스. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 4 : BioEdit에서 35 putative 진 핵과의 첫 번째 MtN3/타 액 도메인의 트림된 시퀀스. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 5 : 선택한 메가에 35 putative 진 핵 자의 첫 번째 MtN3/타 액 도메인 시퀀스를 복사. 복사 된 시퀀스 편집에 대 한 doc 파일에 붙여넣어집니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 6 : 변환 "35 realigned.fas" "35.nex" (PAUP 형식) 베이지안 추론에 대 한 나중의 단계에. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 7 : "35 realigned.fas" 파일을 기반으로 최대 가능성 (ML) 계통 발생 나무 건축을 위해 메가 의해 최적된 대체 모델에 대 한 검색. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 8 : ML 트리 "35 realigned.fas" 파일에 대 한 최적된 대체 모델의 테이블 계산. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 9 : ML 트리 계산 "35 realigned.fas" 메가에 대 한 최적된 대체 모델에 기반에 대 한 매개 변수 지정. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 10 : "35 realigned.fas"에 따라 메가 의해 건설 하는 원래 ML 트리. 이 단계, 그림 스타일, 크기, 색상, 등등에 대 한 많은 옵션., 사용할 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 11 : 228 진 핵 자와 Clustal 오메가 57 간결한 SemiSWEETs의 맞춤. 결과 Jalview, Clustal 오메가에 통합에 표시 했다. 정렬, α-Proteobacteria에서 일부 SemiSWEETs SemiSWEETs Methanobacteria (archaea)에서 달콤한 시퀀스의 두 번째 MtN3/타 액 도메인 정렬 했다 반면 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인으로 정렬 했다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 12 : "35.nex" 파일을 DOS 창에서 MrBayes에 로드. 전체 결과 표시 하려면 콘텐츠를 유사 했다 그림 길이를 줄일 수 삭제 되었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 13 : MrBayes를 사용 하 여 "35.nex" 파일의 계산 후 화면에 표시 되는 정보. 전체 결과 표시 하려면 콘텐츠를 유사 했다 그림 길이 줄이기 위해 삭제 되었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 14 : "35.nex" 파일에 대 한 모델 매개 변수 샘플 요약. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 15 : "35.nex" 파일의 트리 샘플 요약. 전체 결과 표시 하려면 콘텐츠를 유사 했다 그림 길이 줄이기 위해 삭제 되었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

그림 16 : "35.nex.con" 기관에 의해 표시의 계통 발생 나무. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

그것은 뉴클레오티드 또는 아미노산 시퀀스⁸에 따라 계통 발생 나무를 만들기 위해 생물 학적 연구에 점점 더 인기 끌고있다. 일반적으로, 시퀀스 정렬, 계통 발생 나무 계산 결과의 시각화 및 적당 한 방법 또는 알고리즘, 정렬 된 시퀀스의 평가 포함 하는 실천의 세 가지 중요 한 단계가 있습니다. 제시 연구에서 열 정렬의 3 라운드 실시 했다: 첫째, 첫 번째 및 두 번째 MtN3/타 액 도메인을 포함 하 여 감 미로 운 단백질 시퀀스 정렬 했다; 둘째, 각각의 독립적인 taxon로 과자 개별 MtN3/타 액 도메인 시퀀스는 수집 되었고 정렬 함께; 그리고 마지막으로, 약간 단 시퀀스와 달콤한 시퀀스 공동으로 정렬 했다. Phylogenic 트리 건설 순서 줄 맞춤의 한 라운드 일반적으로 필요 합니다.

예비 단계에서 동종 시퀀스 NCBI 또는 다른 데이터베이스에서 다운로드할 수 있습니다. 이러한 다운로드 한 시퀀스 잘 주석 하지 경우 상영 할 수 있습니다. 첫 번째 및 두 번째 단계에서 정렬 및 계산 시작할 수 없습니다 경우 시퀀스 형식이 올바르지 않습니다. 예를 들어 Clustal 오메가 시퀀스 파일에 FASTA 형식의 모든 출발을 거부 합니다. 계산 단계에서 아미노산 또는 뉴클레오티드와 하이픈을 포함 하는 시퀀스 길이 메가 의해 평가 되 고 전에 같이 필요가 note.

방법 및 사용할 수 있는 트리 건설에 대 한 모델의 재산에도 불구 하 고 그들 중 누구도 절대 안전한입니다. 강력 하 고 설득력 있는 결과 그 때 다른 알고리즘 또는 모델 같은 데이터¹⁵를 평가 하는 데 사용 됩니다 서로와 일치 하는. ML 방법에 크게 트리 토폴로지 신뢰성 각 clade;의 부트스트랩 값에 따라 70 이상의 부트스트랩 값은 일반적으로 신뢰할 수 간주 된다. 현재의에서 연구, 첫 번째 MtN3/타 액의 시퀀스를 도메인의 모든 83의 부트스트랩 값으로 큰 clade로 클러스터 된. 그러나 모든 두 번째 MtN3/타 액 도메인 시퀀스를 포함 하는 다른 clade의 가치는, (그림 10) 6만 이었다. 트리 구조를 확인 하려면 완전히 다른 방법을¹⁶ ml를 사용 하 여, MrBayes는 taxa의 관계를 분석 하 사용 되었다. MrBayes에서 얻은 첫 번째 및 두 번째 도메인 clades의 후부 확률¹⁶ 되었고 100 68, 각각 (그림 16).

또 다른 한계는 ML 및 MrBayes 계산의 둘 다 실행 수입니다. 멀티 코어 프로세서와 그래픽 처리 장치 (GPU)는 컴퓨터를 사용 하 여 계산 성능을 개선 하 고¹⁷^,¹⁸속도 도움이 됩니다. MrBayes의 작업에 대 한 개별 그래픽 카드와 적절 한 CUDA 드라이버 컴퓨터 크게 가능성 계산¹¹가속화할 수 있다.

계통 발생 나무 계산에 대 한 적절 한 모델을 선택 하는 것은 조금 경험을 가진 사람들을 위해 어렵다입니다. 이 점에서 메가 후보 모델의 빅 점수를 비교 하 여 최고의 모델을 발견 하는 쉬운 방법을 제공 합니다. 또한, 최근 업그레이드 된 메가 6.0 통합 같은 몇 가지 시퀀스 정렬 도구 근육과 Clustal W¹⁰를 사용 하 여 매우 편리 합니다. 그것은 또한 모두는 시퀀스 편집 및 계통 발생 나무 건축 기능을 제공합니다. 이러한 기능은 부분적으로 계산 분자 진화 분야에서이 소프트웨어는 그렇게 인기가 왜 설명 한다. MrBayes에 관해서는 상당한 활용이이 도구는 그것은 함께 혼합된 데이터를 처리할 수 있습니다 (예., 형태학 및 분자 데이터)¹¹및 따라서 결과 보다 포괄적입니다.

결론적으로, 현재 연구 진화 하는 동안 중복 또는 수평 한 유전자 이동 (HGT) 후 융합 등 복잡 한 변화 받은 단백질 암호화 유전자의 분자 근원 분석 하는 방법을 제공 합니다. 바라 건 대, 더 많은 연구 결과 진화 연구 분야에서 계통 발생 분석의 광범위 한 응용 프로그램으로 계시 될 것 이다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 없다.

Acknowledgments

이 작품은 국립 자연 과학 재단의 중국 (31371596), 바이오 기술 연구 센터, 중국 3 협곡 대학 (2016KBC04), 그리고 장쑤 성, 중국 (BK20151424)의 자연 과학 재단에 의해 지원 되었다.

Materials

Name	Company	Catalog Number	Comments
Adobe Illustration			a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit			a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega			a package for making multiple sequence alignments of amino acid or nucleotide sequences. http://www.clustal.org/
CorelDRAW			a graphic design software. Copyright © 2017 Corel Corporation
FigTree			a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA			MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes			an Bayesian phylogenetic inference tool
NVIDIA			a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP			Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop			a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM			a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM			a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter			4 GB memory, Core 2 or above CPU. Windows 7, Windows 10