Immunology and Infection

Ökaryotik gen kökenli araştırmaya filogenetik analizi kullanılarak

Published: August 14, 2018 doi: 10.3791/56684

Dechun Zhang*¹, Xianzhao Kan*², Sarah Elizabeth Huss³, Lan Jiang², Li-Qing Chen³, Yibing Hu⁴

¹Key Laboratory of Three Gorges Regional Plant Genetics and Germplasm Enhancement (CTGU)/Biotechnology Research Center, China Three Gorges University, ²The Institute of Bioinformatics, College of Life Sciences, Anhui Normal University, ³Department of Plant Biology, University of Illinois at Urbana-Champaign, ⁴College of Resources & Environmental Sciences, Nanjing Agricultural University

* These authors contributed equally

Summary

Tatlılar prokaryot üzerinden sıra Homoloji Ökaryotlar ve SemiSWEETs dayalı bir filogenetik ağaç oluşturma yöntemi açıklanmıştır. Filogenetik analiz homolog proteinler veya genler arasındaki evrimsel ilişkisi farklı organizma gruplarından açıklamak için yararlı bir araçtır.

Abstract

Filogenetik analiz nükleotit veya amino asit dizileri veya etki alanı dizileri ve üç boyutlu yapısı, gibi diğer parametreleri farklı özellikleri (sınıflandırma birimleri) arasında evrimsel ilişkiyi moleküler göstermek için bir ağaç oluşturmak için kullanılır düzeyi. Filogenetik analizi de kullanılabilir etki alanı ilişkileri içinde bireysel bir takson araştırmak için özellikle önemli uğramıştır organizmalar Morfoloji ve fizyoloji, ama hangi araştırmacılar nedeniyle fosil kanıt eksikliği için değiştirmek için organizmaların uzun evrimsel geçmişi veya fosilleşmenin kıtlığı.

Bu metinde, amino asit dizi hizalaması Clustal Omega ve maksimum her iki olasılık (ML) moleküler evrim genetik kullanarak sonraki filogenetik ağaç İnşaat kullanma da dahil olmak üzere filogenetik yöntemini kullanarak için detaylı bir protokol anlatılan Analiz (MEGA) ve MrBayes ile çıkarsama Bayesian. Ökaryotik Şekerler olacak taşıyıcılar ihraç olmak sonunda (tatlı) genleri kökenini araştırmak için 228 tatlılar tek hücreli ökaryotlarda üzerinden 35 tatlı proteinler ve prokaryotlar gelen 57 SemiSWEET proteinler gibi analiz edildi. İlginçtir, SemiSWEETs prokaryotlarda bulundu ancak tatlılar ökaryotlarda bulunamadı. Teorik olarak farklı yöntem kullanılarak inşa iki filogenetik ağaç sürekli olarak ilk ökaryotik tatlı gene bir bakteriyel SemiSWEET gen ve arke SemiSWEET gen füzyonu kaynaklanıyor tavsiye ettiler. Bunu zor ya da hatta deneysel yollarla ayırt etmek imkansız farklı özellikleri arasındaki temel ilişkiyi açıklamak yararlı olmasına rağmen sadece filogenetik analizi, dayalı bir sonuç çıkarmak için dikkatli olmalısınız fazlalaştı .

Introduction

DNA veya RNA dizilerinin fizyolojik ve biyokimyasal yöntemlerle analiz veya morfolojik ve fosil kanıtları gözlenen temel fenotipleri için genetik bilgi taşırlar. Bir anlamda, genetik bilgi daha eski ikinci temeli olduğu için dış fenotipleri değerlendirmek daha güvenilirdir. Evrimsel çalışmada, Fosil kanıtlar çok doğrudan ve ikna edici. Ancak, mikroorganizmalar gibi birçok organizmalar bir fosil uzun jeolojik çağ boyunca forma şansı var. Bu nedenle, nükleotit dizileri ve amino asit dizileri üzerinden ilgili kaybolmamış organizmalar gibi moleküler bilgiyi evrimsel ilişkiler¹keşfetmek için değer vardır. Bu da çalışmanın, basit bir giriş temel filogenetik bilgi ve bir öğrenmek kolay iletişim kuralı bir filogenetik ağaç kendi oluşturmak için ihtiyacı olan yeni gelenler için sağlandı.

DNA (nükleotit) ve protein (amino asit) diziler arasında homolog genler, organelleri veya bile organizmalar²filogenetik ilişkiler anlaması için kullanılabilir. DNA dizileri evrimi sırasında değişikliklerden etkilenen olasılığı daha yüksektir. Buna ek olarak, eş anlamlı nükleotit dizileri mutasyonların amino asit serilerinde mutasyonlar neden değil verilen bu amino asit dizileri çok daha stabildir. Sonuç olarak, amino asit dizileri uzaktan ilgili organizmalar³homolog genler için uygun ise DNA dizileri yakından ilgili organizmalar, homolog genler karşılaştırılması için yararlı olur.

Filogenetik analiz amino asit hizalama ile başlar veya veritabanı⁵ sıralama bir ek açıklama eklenen genom alındı nükleotit dizileri⁴ listelenen FASTA formatı, yani, sözde veya ifade protein içinde dizileri, RNA dizileri , veya DNA dizileri. Bu yüksek kaliteli dizileri analizi için toplamak için önemlidir ve sadece homolog dizileri filogenetik ilişkileri analiz etmek için kullanılabilir fazlalaştı. Birçok farklı platformlarda Clustal W, Clustal X, kas gibi T-kahve, MAFFT, dizi hizalaması için kullanılabilir. En çok kullanılan online kullanılabilir veya ücretsiz indirilebilir Clustal Omega⁶^,⁷ (http://www.ebi.ac.uk/Tools/msa/clustalo/), olduğunu'dir. Hizalama aracı Kullanıcı hizalama başlatmadan önce ayarlayabilirsiniz, ancak varsayılan parametreleri de çoğu zaman işe fazla parametre var. İşlem tamamlandıktan sonra sonraki adım için doğru biçimde hizalanmış dizileri kaydedilmesi gerekir. Onlar o zaman düzenlenmesi gerekir veya BioEdit gibi bir düzenleme yazılımı kullanarak filogenetik ağaç inşaat MEGA tarafından (amino asit kısaltmalar ve kısa çizgileri dahil. eşit uzunluğu olmak dizileri gerektirdiğinden kesilmiş Hizalanmış sırayla amino asit veya nükleotid olmayan herhangi bir pozisyon bir kısa çizgiyle temsil edilir "-"). Genel olarak, tüm çıkıntılı amino asitler veya nükleotid hizalama iki ucundaki kaldırılması gerekir. Buna ek olarak, çünkü onlar küçük değerli bilgileri iletmek ve bazen kafa karıştırıcı veya yanlış bilgi³verebilir kötü hizalanmış hizalama serilerinde içeren sütunlar silinebilir. Bir veya daha fazla tire içeren sütunlar şu anda veya daha sonra ağaç inşaat aşamasında silinebilir. Alternatif olarak, onlar-ebilmek var kullanılmış filogenetik hesaplama için. Dizi hizalaması ve düzeltme bittiğinde hizalanmış dizileri FASTA formatı veya daha sonra kullanmak istediğiniz biçimde kaydedilmesi gerekir.

Birçok yazılım platformları farklı yöntemler veya algoritmalar kullanarak ağaç inşaat işlevleri sağlar. Genel olarak, Yöntemler mesafe matris yöntemleri veya ayrı veri yöntemleri olarak sınıflandırılabilir. Mesafe matris ayrı veri yöntemleri karmaşık ve zaman alıcı iken hesaplamak için hızlı ve basit yöntemlerdir. Amino asit veya nükleotid sırası kimliği, bir mesafe matris yöntemi paylaşım yüksek derecesi ile çok yakından ilişkili özellikleri için (komşu katılma: NJ; Aritmetik ortalama ile unweighted çifti grubu yöntemi: UPGMA) uygundur; Uzaktan ilgili takson, ayrı veri yöntemi için (maksimum olabilirlik: ML; Maksimum cimrilik: MP; Bayesian çıkarımı) en iyi³^,⁸' dir. Bu çalışmada, MEGA (6.0.6) ve Bayesian kesmesi (MrBayes 3.2) ML yöntemlerde filogenetik ağaç⁹oluşturmak için uygulandı. İdeal olarak, uygun model ve parametreler kullanıldığında, farklı yöntemler elde edilen sonuçları tutarlı olabilir ve böylece daha güvenilir ve inandırıcı.

MEGA¹⁰kullanılarak inşa bir ML filogenetik ağaç için FASTA formatı hizalanmış sıra dosyasında programa yüklenmiş olması gerekir. İlk adım, karşıya yüklenen veriler için en iyi oyuncu değişikliği modeli seçmektir. Tüm kullanılabilir ikame modelleri karşıya yüklenen dizileri dayalı karşılaştırılır ve son puanları sonuçları tabloda gösterilecek. (İlk tabloda listelenen) en küçük Bayesian bilgileri ölçüt (BIC) puan ile modeli seçin, önerilen modele göre ML parametrelerini ayarlamak ve hesaplama başlatmak. Hesaplama zaman yüklenen verileri (uzunluk dizileri ve takson sayısı) karmaşıklığı ve programların çalıştığı bilgisayarın performansını bağlı olarak birkaç gün için birkaç dakika değişir. Hesaplama tamamlandığında, bir filogenetik ağaç yeni bir pencerede gösterilecek. "FileName.mat" kaydedin. Ağaç görünümünü belirtmek için parametreleri ayarladıktan sonra bir kez daha kaydedin. Bu yöntemi kullanarak, MEGA yayın notu filogenetik ağaç şekiller oluşturabilirsiniz.

MrBayes¹¹ile ağaç yapımı için genellikle FASTA biçiminde listeleniyorsa, hizalanmış sıra nexus biçimi (.nex dosya türü olarak) dönüştürmek için ilk adımdır. FASTA dosyaları nexus biçime dönüştürme MEGA işlenebilir. Ardından, nexus biçimi hizalanmış sırayla MrBayes yüklenebilir. Dosya başarıyla karşıya yüklendiğinde, ağaç hesaplama detaylı parametrelerini belirtin. Bu parametreler amino asit ikame modeli, değişim oranları, Markov zinciri Monte Carlo (MCMC) için zincir numarası gibi ayrıntıları kaplin, ngen numarası dahil, standart sapma split frekansların ortalama ve benzeri. Bu parametreleri belirttikten sonra Hesaplama başlatmak. Sonunda, ASC II kodu, bir gösteren clade güvenilirlik ve diğer gösteren dal uzunlukları, iki ağaç resimler ekranda görüntülenir.

Ağaç sonuç otomatik olarak "FileName.nex.con" olarak kaydedilir. Bu ağaç dosya açıldı ve FigTree tarafından düzenlenmiş ve FigTree içinde görüntülenen resim daha fazla yayın için daha uygun yapmak için değiştirilebilir.

Bu çalışmada, örnek olarak tek hücreli ökaryotlarda 35 tatlılar ve prokaryot, gelen 57 SemiSWEETs de dahil olmak üzere 228 tatlı proteinleri analiz edildi. Tatlılar ve SemiSWEETs glikoz, fruktoz veya sukroz taşıyıcılar membranlar¹²^,¹³arasında karakterize. Filogenetik analiz tatlılar içeren iki MtN3/tükürük etki alanları bir bakteriyel SemiSWEET ve bir archaeon¹⁴evrimsel bir füzyon elde göstermektedir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. dizi hizalaması

Ökaryotik tatlı ve ayrı belgeler prokaryotik SemiSWEET amino asit dizileri toplamak ve onları FASTA biçiminde listelenmektedir. Dizileri Ulusal Merkezi'nden biyoteknoloji bilgi (NCBI), Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) ve Japonya (DDBJ) veritabanları DNA veri Bankası için benzerlik arama temel yerel hizalama arama aracı (patlama) aracı ile karşıdan yükleyin.
1. İki MtN3/tükürük etki (7 transmembran sarmal) Ökaryotlar ve prokaryotlar tek MtN3/tükürük etki alanı (3 transmembran sarmal) sahip 57 SemiSWEET protein sahneleri sahip 228 sözde tatlı protein sequences örnek dosyalarını toplamak ¹³.
2. Basitleştirmek için tek hücreli ökaryotlarda filogenetik ağaç traversler 228 sözde tatlılar arasında 35 aday tatlı proteinler seçin. Böylece okuyucu bir gerçek veri setinde pratik olabilir bu dizilere bağlıdır.
35 tatlı dizileri hizalayın onları Clustal Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/) giren tarafından.
1. Ve protein sequences FASTA biçiminde giriş kutusuna yapıştırın veya FASTA biçiminde bir dizi dosya yükleyin. Amino asit dizini altında 'Adım 1' bölümündeki açılan menüsünde simgesini tıklatarak olduğunu belirtin.
2. Çıkış biçimi ve diğer parametreleri 'Adım 2' bölümünde, gerekirse belirtin. Bu çalışma için "numarası w/o clustal" olarak çıktı biçimini ayarlamak ve diğer parametreler varsayılan ayarları bırakın. Çoğu durumda, varsayılan parametreleri de herhangi bir belirtme ezelî iş.
'Adım 3' bölümünde hizalamayı çalıştırmak ve gönderin. Her yerde hizalamayı tamamlanana kadar dakika için birkaç saniye sürebilir. "Sonuç Özeti" panelinde "Hizalama" CLUSTAL biçiminde altında bağlantısını sağ tıklatın ve hizalanmış dizileri "35.clustal" (Şekil 1) kaydedin.
Hizalama sonucu dosya BioEdit içinde açın.
1. BioEdit ana panelde "Sequence" ve "Ruh düzenlemek" ilk açılan menüden seçin ardından "Düzenlemek artıkları" alt menü (Şekil 2) tıklatın.
2. Hizalama imleci (seçili sıra siyah gösterilecek) ile sol tarafındaki çıkıntılı serileri seçmek ve seçili sıraları (Şekil 3) kaldırmak için "Düzenle" menüsünün altında "Sil" simgesini tıklatın.
3. Seçin ve ilk MtN3/tükürük etki alanı sağ tarafındaki çıkıntılı dizileri silmek ve kesilmiş ilk MtN3/tükürük etki alanı dizileri (Şekil 4) 35-I.fas kaydedin. Aynı şekilde, silmek belgili tanımlık sol ve sağ tarafta ikinci MtN3/tükürük etki alanı dizileri çıkıntılı ve 35-II.fas kaydedin. İlk ve ikinci MtN3/tükürük etki alanı dizileri ritim (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) veya TMHMM (http://www.cbs.dtu.dk/services/TMHMM/) ile önceden tahmin edilebilir.
Dosya 35-I.fas MEGA ile açın ve "istendiğinde Hizala"'ı tıklatın. "Düzen" menüsü altında "Tümünü Seç" seçin, ardından "Sequence(s)" seçin; adları ve özellikleri dizileri siyah (Şekil 5)-ecek var olmak seçme.
1. "Kopya" dizileri panoya kopyalamak için "Düzenle" menüsünden seçin ve sonra kopyalanan dizileri bir doc dosyasına yapıştırın.
2. Doktor dosyasında tüm "#" yerine ">" ve FASTA biçimde onları dönüştürmek için ilgili olmayan tüm karakterleri silin. Eklemek "-Ben" onları ilk MtN3/tükürük etki alanı sırası olarak işaretlemek için her takson adının sonundaki. Tabi aynı yöntem ikinci MtN3/tükürük etki alanı dizi işlemek ve eklemek "-II" takson adından sonra.
Doc dosya biçiminde FASTA birinci ve ikinci MtN3/tükürük etki alanı dizileri birleştirin.
1. Kombine dizileri Clustal Omega yeniden yükleyin ve yukarıda açıklandığı gibi dizileri hizalayın. Sonucu "35 realigned.clustal" kaydedin.
2. BioEdit içinde "35 realigned.clustal" dosyasını açın, düzensiz (çıkıntılı) amino asit kalıntıları hizalanmış dizileri iki ucundaki silin ve sonra dizileri "35 realigned.fas" kaydedin. "Ne zaman bazı standart olmayan karakter kaydedilemiyor uyardı Evet" i tıklatın.

2. hesaplama filogenetik ağaç

"35 realigned.fas" MEGA içinde açın.
1. "Veri" menüsünü tıklatın ve "İhracat hizalama" seçin ve hizalamayı PAUP biçiminde (nexus) MrBayes (Şekil 6) daha sonra kullanmak için "35.nex" olarak kaydedin.
2. Bu arada, MEGA ana bölmesine "Modelleri" simgesine tıklayın, "bulmak en iyi DNA/Protein modelleri (ML)" seçin ve açılan pencerede "Tamam" düğmesini tıklatın. "İşlem (Şekil 7) arama modeli başlamak için hesaplaması"'ı tıklatın. Yeni bir ilerleme panel açılır; Bu işlem dolu diziler ve bilgisayarın performansını karmaşıklığına bağlı olarak birkaç gün için birkaç dakika sürer.
  Not: model arama süreci tamamlandıktan sonra sonuçları açın gösteren bir tablo ( Şekil 8). En küçük BIC puan ilk olarak, yavaş yavaş artan BIC puanları ile farklı modeller bir dizi ardından listelenir. En küçük BIC puan ile ilk modeli "LG + G + F" ML ağacı "35 realigned.fas" dosyasını temel alan için önerilen yöntemdir.
MEGA ana bölmesine "Phylogeny" simgesine tıklayın, "Yapı/Test maksimum olabilirlik Tree"'ı tıklatın ve sonra açılır panelde "Evet"'i tıklatın. Farklı gösteren yeni bir pencere açılacaktır olması gereken parametreleri belirtilen (Şekil 9).
1. İlk olarak, önyükleme phylogeny kutusu testinde ayarlayın; 500 ya da 1000 çoğu durumda yeterli. Oyuncu değişikliği modeli altında "amino asit" değiştirme türünü seçin. Bir ikame modeli seçme amacı onların mevcut Birleşik³dayalı dizileri arasındaki gerçek fark tahmin etmektir.
2. Seçin "LG frekansları ile. (+F) modeli "(LG + F) modeli/yöntemi kutusunda. "Gamma dağıtılmış" (siteler arasında yanioranı varyasyonları açıklamak için G) oranları ve desen kutusuna seçin., yavaş yavaş gelişen, değişiklikleri daha fazla ağırlık veren siteleri³. "Silme işlemi tamamlamak" veri alt küme küme küme kutusunda seçin tire içeren sütunların tümünü kaldırmak için.
3. Diğer tüm parametreleri varsayılan durumlarına (Şekil 9) içinde tutun. Bu parametrelerin tayini sonra Hesaplama başlatmak için "Hesaplama" simgesini tıklatın.

3. sunum filogenetik ağaç

Not: MEGA kullanarak hesaplama tamamlandığında bir filogenetik ML ağaç sunulacak (Şekil 10).

"Dosya" simgesi ağaç panelindeki aşağı açılır menüsünün altında "Kaydetmek geçerli oturum"-sonucunu kaydetmek için seçin (.mas olan varsayılan dosya türü). Bu da çalışmanın, sonuç "35.mas" kaydedildi. Ağaç panelde clade, uzunluğu dahil olmak üzere birçok parametreleri ağaç, ağaç topolojisi, takson adı, boyutu ve rengi, yazı tipi görüntülenir ve farklı seçenekleri ayarlayabilirsiniz.
Görüntü simgesini tıklatarak son ağaç dosyayı kaydedin ve rakam farklı biçimlerde kaydedebilir veya fotoğraf düzenleme için kaynak olarak görüntüyü kopyalayın.

4. analiz tatlılar ve dizi hizalaması kullanarak SemiSWEETs ilişkisi

Not: Bu adımı sıradan dizi analizi gerekmeyebilir.

228 ökaryotik tatlılar ve Clustal yukarıda açıklandığı gibi Omega 57 prokaryotik SemiSWEETs hizalayın. Hizalama sonuçları Clustal Omega entegre ve bir fotoğraf editörü (Şekil 11) kaydetmek için kopyalanan Jalview gösterilebilir.
Not: SemiSWEETs Methanobacteria (Arkeler) gelen tatlı dizileri ikinci MtN3/tükürük etki ile uyumlu, ancak örnek uyum içinde bazı SemiSWEETs α-bakteri gelen tatlı sıraları, ilk MtN3/tükürük etki ile hizalanır.

5. filogenetik ağaç inşaat MrBayes ile

Bayesian çıkarımlar MrBayes ile MrBayes yürütülebilir dosyasını açın ve DOS arayüzey-ecek gelmek yukarıya içinde a yeni pencere. İlk adım nexus veri ﬁle okumaktır. Giriş "yürütmek 35.nex" sonra istemi (35. nex dosya MrBayes yürütülebilir dosyanın aynı dizine kaydedin veya karşıya yüklemeden önce dosyanın yolu gelin unutmayın). "Başarılı okuma matrix" ileti son listelenen özellikleri (Şekil 12) aşağıdaki gösterilir. 35. nex dosya zaten hazırlanan ve MEGA içinde kaydedilen (2.1 Yukarıdaki bakın).
Evrimsel modeli ayarlayın.
1. Sonra-e sevketmek, tip "prset aamodelpr = fixed(lg); LSet gore g = ". "Lg" ve "g" MEGA içinde ayarla "LG" ve "G" modeline karşılık gelir. Model başarıyla ayarladıktan sonra yazın "mcmc nchains = 4 ngen 5.000.000 =" istemi sonra. Kullanımı "nchains = 4" Giriş bir soğuk zincir ve Metropolis kaplin için üç sıcak zincirler toplam sayısını belirtir. "ngen 5.000.000 =" Metropolis kaplin 5.000.000 nesiller sıcak ve soğuk zincir ve yakınsama için çalıştırmak anlamına gelir. Bu çalışmada, ortalama standart sapması 0,01 altındaki split frekansları sıcak ve soğuk zincir yakınsama kabul edildi.
2. Ngen numarasını doğru işleminin başında öngörülen edemiyor ve genellikle ayarlanması gereken Not ortalama standart sapma split frekans değişikliği temel. Buna ek olarak, yakınsama için ngen numarası ne zaman program çalıştıran aynı verilere göre her zaman farklı olabilir.
Analizler: Bu adımı verilerin karmaşıklığı ve bilgisayarın performansını bağlı olarak birkaç gün için birkaç dakika sürer. Hazır ayar hesaplama tamamladıktan sonra bir istemi "analizi ile (Evet/Hayır) devam edilsin mi?" soracaktır "Hayır" sonra istemi yazdıysanız, bilgi işlem (Şekil 13), keser misin yoksa bu daha fazla nesil sayısı girdikten sonra hesaplamak devam edecektir. Hesaplama tamamlandığında (split frekansların bir ortalama standart sapma ile < 0,01 veya 0,05), hesaplama sorgulama istemi sonra "Hayır" yazarak durdurun.
Not: 0,01 sıkı bir kriterdir, 0,05 orta ve genellikle yeterli.
Örneklerin özetleme: "Karter" modeli Parametreler (Şekil 14) örnekleri özetlemek için istemi sonra yazın. Sonra yazın "sumt relburnin Evet burninfrac = 0.25 =" ağaç örnekleri özetlemek ister sonra. Filogenetik ağaç İnşaat hakkında detaylı bilgi-ecek var olmak göstermek Şekil 15ASC II kod ekran, bir gösteren clade itibarını ve diğer gösteren dal uzunlukları görünür iki ağaç rakamlar ardından, olduğu gibi. Aynı zamanda, "35.nex.con" adlı bir ağaç dosya otomatik olarak kaydedilir.
Daha iyi bir sunum filogenetik ağaç için FigTree Aracı (http://tree.bio.ed.ac.uk/software/figtree/) ile "35.nex.con" ağaç dosyasını açın, bir stil veya sonucu (Şekil 16) görüntülemek için boyut seçin veya bile bunu yapmak için bir fotoğraf Düzenleyicisi'nde düzenleyin daha fazla okuyucu dostu.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Filogenetik ağaç tüm ilk MtN3/tükürük etki 35 tatlı sıralarının bir clade ve ikinci MtN3/tükürük alan adları başka bir clade kümelenmiş tatlı sıralarının olarak kümelenmiş göster. SemiSWEETs Methanobacteria (Arkeler) üzerinden ikinci MtN3/tükürük ile uyumlu, ancak buna ek olarak, Hizalama sonuçlarını tatlılar ve SemiSWEETs bazı SemiSWEETs α-bakteri gelen tatlı sıraları, ilk MtN3/tükürük etki ile uyumlu göstermek TATLI sıralarının etki alanı. Bu sonuçlar birlikte şeker içeren iki MtN3/tükürük etki alanları bir bakteriyel SemiSWEET ve bir archaeon¹⁴evrimsel bir füzyon elde öneririz.

Resim 1 : 35 sözde ökaryotik tatlılar hizalanmış dizileri Clustal Omega üzerinden "35.clustal" olarak kaydedin. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Resim 2 : BioEdit "35.clustal, Clustal Omega içinde hazırlanan" hizalanmış dizisi kırpmaya select yolunda. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 3 : Seçin ve düzensiz diziler 35 sözde ökaryotik tatlılar BioEdit ilk MtN3/tükürük etki alanı sıralarının sol tarafındaki Sil. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 4 : İlk MtN3/tükürük etki alanı 35 sözde ökaryotik tatlılar BioEdit kesilmiş dizisi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 5 : MEGA içinde ilk MtN3/tükürük etki alanı dizileri 35 sözde ökaryotik tatlılar kopyalayın. Düzenleme için doc dosyasına kopyalanan dizileri yapıştırılır. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 6 : "35 realigned.fas" "35.nex" (PAUP formatında) Bayesian kesmesi için daha sonraki bir aşamada dönüştürmek. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 7 : MEGA tarafından en uygun oyuncu değişikliği modeli maksimum olabilirlik (ML) filogenetik ağaç traversler için arama dayalı "35 realigned.fas" dosyada. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 8 : En uygun oyuncu değişikliği modeli bir tablo hesaplanan "35 realigned.fas" dosyasını temel alan ML ağacı için. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 9 : "35 realigned.fas" MEGA için en uygun oyuncu değişikliği modeli dayalı ML ağaç hesaplama parametrelerini belirtin. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 10 : "35 realigned.fas" dayalı MEGA tarafından inşa orijinal bir ML ağacı. Bu aşamada, şekil stili, boyut, renk, vbiçin birçok seçenek., mevcuttur. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 11 : 228 ökaryotik tatlılar ve Clustal Omega tarafından 57 prokaryotik SemiSWEETs. Sonuçlar Jalview, Clustal Omega entegre olarak gösterildi. SemiSWEETs Methanobacteria (Arkeler) gelen tatlı dizileri ikinci MtN3/tükürük etki ile uyumlu, ancak uyum içinde tatlı sıraları, ilk MtN3/tükürük etki ile bazı SemiSWEETs α-bakteri üzerinden uyumlu. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 12 : "35.nex" dosya MrBayes DOS penceresinde yüklemek. Genel sonuçları göstermek için benzer içerik şekil uzunluğu azaltmak için silindi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 13 : "35.nex" dosyasını MrBayes kullanarak hesaplama sonra ekranda görüntülenen bilgileri. Genel sonuçları göstermek için benzer içerik şekil uzunluğu azaltmak için silindi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 14 : Modeli Parametreler için "35.nex" dosya örnekleri özetlenen. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 15 : "35.nex" dosyasının ağaç örnekleri özetlenen. Genel sonuçları göstermek için benzer içerik şekil uzunluğu azaltmak için silindi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 16 : "FigTree tarafından görüntülenen 35.nex.con" filogenetik ağaç. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Biyolojik araştırmalarda nükleotit veya amino asit dizileri⁸temel bir filogenetik ağaç yapmak için giderek daha popüler hale geliyor. Genel olarak, dizi hizalaması, hizalanmış diziler için uygun yöntem veya algoritma ile değerlendirilmesi ve filogenetik ağaç olarak hesaplama sonucunun görselleştirme dahil olmak üzere uygulama üç kritik aşama vardır. Sunulan çalışmada, dizi hizalaması üç tur yapılmıştır: ilk olarak, birinci ve ikinci MtN3/tükürük etki de dahil olmak üzere tatlı protein sequences uyumlu; İkinci olarak, her biri tek tek MtN3/tükürük etki alanı dizileri tatlılar bağımsız bir takson olarak toplandı ve birlikte uyumlu; ve son olarak, SemiSWEET dizileri ve tatlı dizileri ortaklaşa uyumlu. Sadece bir tur dizi hizalaması, genellikle phylogenic ağaç yapımı için gereklidir.

İlk aşamada,-ebilmek var olmak downloaded homolog dizileri NCBI veya diğer veritabanları. İndirilen bu DNA dizileri de açıklamalı değil eğer taranması gerekebilir. Dizi biçimi hatalıysa birinci ve ikinci aşamada, hizalama ve hesaplama başlatılamıyor. Örneğin, Clustal Omega sıra dosyasında FASTA biçiminde herhangi bir kalkış reddeder. Hesaplama aşamasında amino asitler veya nükleotid ve tireler gibi sırası uzunlukları MEGA tarafından hesaplanmadan önce eşit olmak unutmayınız.

Yöntemleri ve kullanılabilir modeller ağaç traversler zenginlik rağmen hiçbiri-in onları kusursuz olduğunu. Sağlam ve inandırıcı sonuçları farklı algoritmaları veya modelleri aynı veri¹⁵değerlendirmek için kullanılan zaman birbirleri ile tutarlı olan bunlar. ML yönteminde ağaç topolojisi güvenilirliğini büyük ölçüde her clade önyükleme değeri temel bağlıdır; 70 veya daha fazla önyükleme değeri genellikle güvenilir kabul edilir. Mevcut çalışma, tüm ilk MtN3/tükürük etki alanı dizileri 83 önyükleme değerinde büyük bir clade olarak kümelenmiş. Tüm ikinci MtN3/tükürük etki alanı serilerinde, içeren diğer clade değerini ancak, sadece 6 (Şekil 10) oldu. Ağaç mimari doğrulamak için tamamen farklı bir yöntem¹⁶ ML daha istihdam, MrBayes ilişki özellikleri analiz etmek için kullanıldı. MrBayes elde edilen birinci ve ikinci etki alanı clades posterior olasılıklar¹⁶ yaşında 100 ve 68, sırasıyla (Şekil 16).

Başka bir sorumluluğun ML ve MrBayes hesaplama her ikisi de çalıştırmak zaman alıcı olmasıdır. Çok çekirdekli işlemci ve grafik işleme birimi (GPU) ile bir bilgisayar kullanarak hesaplama performansını artırmak ve¹⁷^,¹⁸hızlandırmak yararlıdır. MrBayes çalışması için bir ayrık grafik kartı ve uygun CUDA sürücüleri içeren bir bilgisayar kadar olasılığını hesaplamaları¹¹önemli ölçüde hızlandırabilir.

Filogenetik ağaç hesaplama için uygun modeli seçme küçük deneyimi olanlar için zordur. Bu bağlamda, MEGA aday modelleri BIC puanları karşılaştırarak en iyi modeli bulmak için kolay bir yol sağlar. Ayrıca, son zamanlarda yükseltilen MEGA 6.0 kullanmak çok uygun olan kas ve Clustal W¹⁰gibi bazı sıra hizalama araçlar entegre. Ayrıca hem sırasını düzenleme ve filogenetik ağaç inşaat işlevi sağlar. Bu özellikler kısmen neden bu bilgisayar yazılımı Hesaplamalı moleküler evrim alanında kadar popüler olduğunu açıkla. MrBayes gelince, o birlikte karışık veri türleri işleyebilir bu aracın önemli bir avantaj olduğunu (Örn., morfolojik ve moleküler verileri)¹¹ve böylece sonuçları daha kapsamlı.

Sonuç olarak, bu da çalışmanın evrim sırasında çoğaltılması veya yatay gen transferi (HGT) sonra füzyon gibi karmaşık değişim geçirmiş protein kodlama genlerin moleküler kökeni analiz etmek için bir yöntem sağlar. Umut verici bir biçimde, daha fazla bulgular geniş uygulama evrimsel araştırma alanındaki filogenetik analizi ile ortaya çıkacak.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar ifşa gerek yok.

Acknowledgments

Bu eser Ulusal Doğa Bilimleri Vakfı Çin (31371596), Bio-teknoloji araştırma merkezi, Çin üç Gorges Üniversitesi (2016KBC04) ve Jiangsu Province, Çin (BK20151424) doğal Bilim Vakfı tarafından desteklenmiştir.

Materials

Name	Company	Catalog Number	Comments
Adobe Illustration			a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit			a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega			a package for making multiple sequence alignments of amino acid or nucleotide sequences. http://www.clustal.org/
CorelDRAW			a graphic design software. Copyright © 2017 Corel Corporation
FigTree			a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA			MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes			an Bayesian phylogenetic inference tool
NVIDIA			a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP			Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop			a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM			a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM			a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter			4 GB memory, Core 2 or above CPU. Windows 7, Windows 10