Mit der phylogenetischen Analyse zu eukaryotischen Gens Herkunft untersuchen

* These authors contributed equally
Immunology and Infection

Your institution must subscribe to JoVE's Immunology and Infection section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

Eine Methode des Konstruierens einer phylogenetischen Stammbaum basierend auf Sequenzhomologie von Süßigkeiten von Eukaryoten und SemiSWEETs von Prokaryoten wird beschrieben. Phylogenetische Analyse ist ein nützliches Werkzeug für die Erklärung der evolutionären Verwandtschaft zwischen Homologen Proteine oder Gene aus verschiedenen Organismengruppen.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L. Q., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Phylogenetische Analyse verwendet Nucleotid- oder Aminosäuresequenzen oder andere Parameter, wie Domain-Sequenzen und dreidimensionale Struktur, um einen Baum um zu zeigen, die evolutionäre Beziehung zwischen den verschiedenen Taxa (Klassifizierung Einheiten) in der molekularen konstruieren Ebene. Phylogenetische Analyse kann auch zu untersuchen, Domänen-Verhältnisse innerhalb einer einzelnen Taxon verwendet werden, vor allem für Organismen, die erhebliche unterzogen wurden zu ändern, in der Morphologie und Physiologie, sondern für die Forscher fossile Beweise fehlen die Organismen langen evolutionären Geschichte oder Knappheit der Versteinerung.

In diesem Text wird ein detailliertes Protokoll beschrieben nach der phylogenetischen Methode, einschließlich der Aminosäure Sequenzalignment mit Clustal Omega und anschließende phylogenetischen Baum Bau verwenden beide maximale Wahrscheinlichkeit (ML) der molekularen Evolutionäre Genetik Analyse (MEGA) und Bayesian Inference über MrBayes. Um den Ursprung der eukaryotic Zucker wird schließlich Transporter exportiert werden (SÜß) Gene zu untersuchen, wurden 228 Süßigkeiten einschließlich 35 süße aus einzelligen Eukaryoten und 57 halbsüß Proteine von Prokaryoten analysiert. Interessanterweise fanden sich SemiSWEETs in Prokaryoten, aber Süßigkeiten fanden sich in den Eukaryotes. Zwei Stammbäumen mit theoretisch unterschiedliche Methoden konstruiert haben durchweg vorgeschlagen, dass das erste eukaryotische süße gen aus der Verschmelzung von einer bakteriellen halbsüß gen und eine Archaeen halbsüß gen stammen könnte. Es ist erwähnenswert, dass man eine phylogenetische Analyse nur anhand Schluss zu ziehen, obwohl es empfiehlt sich, erklären die grundlegende Beziehung zwischen verschiedenen Taxa, die schwierig oder sogar unmöglich zu erkennen, mit experimentellen Mitteln ist vorsichtig sein sollte .

Introduction

DNA- oder RNA-Sequenzen tragen genetischen Information für zugrunde liegende Phänotypen, die durch physiologische und biochemische Methoden analysiert oder durch morphologische und fossilen Beweise beobachtet werden kann. In gewisser Weise ist genetischer Information zuverlässiger als externe Phänotypen zu bewerten, da erstere die Grundlage für Letzteres ist. In evolutionären Studie ist Fossilien sehr direkt und überzeugend. Jedoch haben viele Organismen, wie z. B. Mikroorganismen, kaum eine Chance, ein Fossil in langen geologischen Zeitaltern zu bilden. Daher molekularer Informationen wie Nukleotidsequenzen und Aminosäure-Sequenzen von verwandten extant Organismen sind von Wert für die Erkundung evolutionären Beziehungen1. In der vorliegenden Studie lieferte eine einfache Einführung phylogenetische Grundkenntnisse und ein einfach zu erlernendes Protokoll für Neulinge, die einen phylogenetischen Stammbaum auf eigene Faust zu konstruieren müssen.

DNA (Nukleotide) und Proteinsequenzen (Aminosäure) können zur phylogenetische Beziehungen zwischen homologen Gene, Organellen oder sogar Organismen2ableiten. DNA-Sequenzen sind eher im Laufe der Evolution von Änderungen betroffen sein. Im Gegensatz dazu sind Aminosäure-Sequenzen wesentlich stabiler, da die Synonyme Mutationen im Nukleotidsequenzen in Aminosäuresequenzen keine Mutationen verursachen. Dadurch eignen sich DNA-Sequenzen zum Vergleich homologer Gene von eng verwandten Organismen, während Aminosäuresequenzen für Homologe Gene von weitläufig verwandten Organismen3geeignet sind.

Eine phylogenetische Analyse beginnt mit der Ausrichtung der Aminosäure oder Nukleotid-Sequenzen4 abgerufen aus einer kommentierten Genom Sequenzierung Datenbank5 aufgeführt im FASTA-Format, d. h., vermeintliche oder exprimierten Protein-Sequenzen, RNA-Sequenzen , oder DNA-Sequenzen. Es ist erwähnenswert, dass es entscheidend für qualitativ hochwertige Sequenzen für die Analyse zu sammeln, und nur homologe Sequenzen können zur phylogenetische Beziehungen zu analysieren. Viele verschiedene Plattformen wie Clustal W, Clustal X, Muskel, T-Coffee, MAFFT, eignet sich für Sequenzalignment. Die am weitesten verbreitete Clustal Omega6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/), die online verwendet werden oder kann kostenlos heruntergeladen werden ist kostenlos. Das Alignment-Tool hat viele Parameter, die der Benutzer kann vor dem Start der Ausrichtung anpassen, sondern die Standardparameter arbeiten in den meisten Fällen gut. Nachdem der Vorgang abgeschlossen ist, sollte die ausgerichteten Sequenzen in das richtige Format für den nächsten Schritt gespeichert werden. Sie sollten dann bearbeitet werden oder getrimmt mit einem Bildbearbeitungs-Software, wie z. B. BioEdit, weil phylogenetischen Baum Bau von MEGA die Sequenzen erfordert von gleicher Länge (einschließlich Aminosäure Abkürzungen und Bindestriche. In der abgestimmten Reihenfolge jeder Position ohne eine Aminosäure oder ein Nukleotid ist vertreten durch einen Bindestrich "-"). Im Allgemeinen sollten alle hervorstehenden Aminosäuren oder Nukleotide an beiden Enden der Achse entfernt werden. Darüber hinaus können Spalten mit schlecht ausgerichtete Sequenzen in der Achse gelöscht werden, da sie wenig wertvolle Informationen zu vermitteln, und manchmal verwirrend oder falsche Informationen3geben können. Die Spalten, in denen ein oder mehrere Bindestriche können zu diesem Zeitpunkt oder in der späteren Bauphase Baum gelöscht werden. Alternativ können sie für die phylogenetische Berechnung verwendet werden. Wenn Sequenzalignment und Trimmen ist beendet, sollte die ausgerichteten Sequenzen im FASTA-Format oder das gewünschte Format für die spätere Verwendung gespeichert werden.

Viele Software-Plattformen bieten Baum Bau Funktionen mit unterschiedlichen Methoden und Algorithmen. Die Methoden können in der Regel als Distance Matrix-Methoden oder diskrete Datenmethoden klassifiziert werden. Distance Matrix-Methoden sind einfach und schnell zu berechnen, während diskrete Datenmethoden kompliziert und zeitaufwändig sind. Für sehr eng verwandten Taxa mit ein hohes Maß an Austausch der Aminosäure- oder Nukleotid-Sequenz Identität, eine Distance Matrix-Methode (Nachbar Beitritt: NJ; Ungewichtete paar Gruppe Methode mit arithmetisches Mittel: UPGMA) ist angebracht; für weitläufig verwandten Taxa, eine diskrete Daten-Methode (Maximum Likelihood: ML; Maximale Sparsamkeit: MP; Bayesian Inference) ist optimale3,8. In dieser Studie wurden die ML-Methoden in MEGA (6.0.6) und Bayesian Inference (MrBayes 3.2) angewendet, um Stammbäumen9zu konstruieren. Ideal, wenn das richtige Modell und die Parameter verwendet werden, die Ergebnisse aus den unterschiedlichen Verfahren abgeleitet möglicherweise konsistent, und sie sind so zuverlässig und überzeugend.

Für ML phylogenetischen Baum mit MEGA10konstruiert muss die ausgerichteten Sequenz Datei im FASTA-Format in das Programm hochgeladen werden. Der erste Schritt ist dann der optimale Ersatz-Modell für die hochgeladenen Daten auswählen. Alle verfügbaren Ersatz-Modelle sind anhand der hochgeladenen Sequenzen verglichen, und ihre endgültige Ergebnisse in einer Ergebnistabelle angezeigt werden. Wählen Sie das Modell mit dem kleinsten Bayes-Kriterium (BIC)-Score (zuerst in der Tabelle aufgeführt), stellen Sie ML-Parameter nach dem empfohlenen Modell ein und starten Sie die Berechnung. Die Berechnungszeit hängt von einigen Minuten bis zu mehreren Tagen, abhängig von der Komplexität der geladenen Daten (Länge der Sequenzen und Anzahl der Taxa) und die Leistung des Computers, auf dem die Programme ausgeführt werden. Wenn die Berechnung beendet ist, wird ein phylogenetischer Baum in einem neuen Fenster angezeigt. Speichern Sie die Datei als "FileName.mat". Nach dem Einstellen der Parameter für das Erscheinungsbild des Baumes festzulegen, einmal mehr sparen. Mit dieser Methode kann MEGA Publikation Grade phylogenetischen Stammbaum Zahlen generieren.

Für Baum Bau mit MrBayes11ist der erste Schritt zur Nexus-Format (.nex als Dateityp) ausgerichtete Sequenz, die in der Regel im FASTA-Format aufgeführt ist, verwandeln. Nexus-Format FASTA Dateien verwandeln kann in MEGA verarbeitet werden. Als nächstes kann die abgestimmte Sequenz im Nexus-Format in MrBayes hochgeladen werden. Wenn die Datei erfolgreich hochgeladen wurde, geben Sie detaillierte Parameter für die Berechnung der Baum. Diese Parameter umfassen Details wie Aminosäure-Substitution Modell, Variante Raten, Anzahl der Kette für Markov Chain Monte Carlo (MCMC) Kupplung, Ngen Anzahl, durchschnittliche Standardabweichung der geteilten Frequenzen und so weiter. Nachdem diese Parameter angegeben haben, starten Sie die Berechnung. Am Ende zwei Baum-Figuren im ASC II-Code, eine Vorführung Clade Glaubwürdigkeit und die andere zeigt Zweig Längen, erscheint auf dem Bildschirm.

Das Baum-Ergebnis wird automatisch als "FileName.nex.con" gespeichert werden. Dieser Baum-Datei kann geöffnet und bearbeitet von Volksheiligen und in Volksheiligen angezeigte Zahl weiter um es besser geeignet für die Veröffentlichung geändert werden kann.

In dieser Studie wurden 228 süße Proteine, einschließlich 35 Süßigkeiten aus einzelligen Eukaryoten und 57 SemiSWEETs von Prokaryoten, exemplarisch analysiert. Die Süßigkeiten und SemiSWEETs zeichneten sich als Glukose, Fruktose oder Saccharose Transporter über Membranen12,13. Phylogenetische Analyse deutet darauf hin, dass die beiden MtN3/Speichel-Domänen mit Süßigkeiten aus eine evolutionäre Mischung aus einer bakteriellen SemiSWEET und ein Archaeon14abgeleitet werden könnte.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

(1) Sequenzalignment

  1. Aminosäure-Sequenzen von eukaryotischen SÜß und prokaryotischen SemiSWEET in separaten Dokumenten zu sammeln und in der Liste im FASTA-Format. Sequenzen von National Center für Biotechnology Information (NCBI), European Molecular Biology Laboratory (EMBL) und der DNA Data Bank of Japan (DDBJ) Datenbanken durch Ähnlichkeitssuche mit dem Tool grundlegende lokale Alignment Search Tool (BLAST) herunterladen.
    1. In der Beispiel-Dateien sammeln Sie 228 vermeintliche süße Proteinsequenzen besitzen zwei MtN3/Speichel Domänen (7 transmembranen Helices) von Eukaryoten und 57 halbsüß Proteinsequenzen, die eine einzelne MtN3/Speichel-Domäne (3 transmembranen Helices) von Prokaryoten besitzen 13.
    2. Um den Prozess zu vereinfachen, wählen Sie 35 Kandidaten süße Proteine aus einzelligen Eukaryonten unter 228 vermeintlichen Süßigkeiten für phylogenetischen Baum Bau. Diese Sequenzen sind befestigt, so dass der Leser auf eine Reihe von realen Daten üben kann.
  2. Richten Sie die 35 süße Sequenzen durch Eingabe sie in Clustal Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/).
    1. Kopieren Sie und fügen Sie die Proteinsequenzen im FASTA-Format in das Eingabefeld ein ein, oder Hochladen Sie eine Sequenz-Datei im FASTA-Format. Geben Sie an, dass sie Aminosäure-Sequenz durch Klicken auf das Symbol unter dem Pull-Down-Menü im Abschnitt "Schritt 1".
    2. Geben Sie ggf. Ausgabeformat und andere Parameter im Abschnitt "Schritt2" ein. Für diese Studie als "Clustal w/o Anzahl" festlegen Sie Ausgabeformat, und lassen Sie die anderen Parameter auf Standard-Einstellungen. In den meisten Fällen arbeiten die Default-Parameter auch ohne jede Spezifikation.
  3. Senden Sie und führen Sie die Ausrichtung im Abschnitt "Schritt 3". Es kann dauern einige Sekunden bis Minuten bis die Ausrichtung abgeschlossen ist. Im Fenster "Zusammenfassung" mit der rechten Maustaste des Link unter "Ausrichtung im CLUSTAL-Format" und speichern die ausgerichteten Sequenzen als "35.clustal" (Abbildung 1).
  4. Öffnen Sie die Ergebnisdatei Ausrichtung in BioEdit.
    1. Auf dem Hauptfeld des BioEdit "Sequence" und wählen Sie "Bearbeiten-Stimmung" in der ersten Pull-Down-Menü klicken Sie auf "Bearbeiten Rückstände" im Untermenü (Abbildung 2).
    2. Wählen Sie die überstehenden Sequenzen auf der linken Seite der Achse mit dem Cursor (die gewählte Reihenfolge werden in schwarz angezeigt) und klicken Sie auf das Symbol "Löschen" im Menü "Bearbeiten" um die ausgewählten Sequenzen (Abbildung 3) zu entfernen.
    3. Wählen Löschen Sie die überstehenden Sequenzen auf der rechten Seite der ersten MtN3/Speichel Domäne und speichern Sie die getrimmten erste MtN3/Speichel Domäne Sequenzen als 35-I.fas (Abbildung 4). Ebenso löschen Sie Links und rechts hervorstehenden Sequenzen der zweiten MtN3/Speichel Domäne und speichern Sie es als 35-II.fas. Die erste und die zweite MtN3/Speichel Domäne Sequenzen können mit Rhythmus (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) oder TMHMM (http://www.cbs.dtu.dk/services/TMHMM/) im Voraus vorhergesagt werden.
  5. Öffnen Sie die Datei 35-I.fas mit MEGA, und klicken Sie auf "align", wenn Sie aufgefordert werden. Klicken Sie unter dem Menü "Bearbeiten" auf "Alle auswählen" und klicken Sie auf "Wählen Sie Sequenzen"; die Namen und Sequenzen der Taxa werden in schwarz (Abbildung 5) ausgewählt werden.
    1. Wählen Sie "Kopieren" im Menü "Bearbeiten", die Sequenzen in die Zwischenablage zu kopieren, und fügen Sie die kopierten Sequenzen in eine Doc-Datei.
    2. In der Doc-Datei ersetzen alle "#" durch ">", und löschen Sie dann alle unabhängigen Zeichen um FASTA-Format konvertiert. Hinzufügen "-Ich" am Ende jedes Taxon Name, als die ersten MtN3/Speichel Domäne Sequenzen zu markieren. Die zweite MtN3/Speichel-Domäne-Sequenz, die nach der gleichen Methode und fügen "-II" nach jedem Taxon-Namen.
  6. Die ersten und zweiten MtN3/Speichel Domäne Sequenzen im FASTA-Format in eine Doc-Datei zu kombinieren.
    1. Laden Sie die kombinierten Sequenzen in Clustal Omega wieder und richten Sie die Sequenzen, wie oben beschrieben. Speichern Sie das Ergebnis als "35 realigned.clustal".
    2. Öffnen Sie die Datei "35 realigned.clustal" in BioEdit, löschen Sie ungleichmäßige (vorstehenden) Aminosäurereste an beiden Enden der ausgerichteten Sequenzen und speichern Sie dann die Sequenzen als "35 realigned.fas". Klicken Sie auf "Yes", wenn Sie davor gewarnt, dass einige nicht standardmäßigen Zeichen können nicht gespeichert werden.

2. Berechnung der phylogenetischen Stammbaum

  1. Öffnen Sie "35 realigned.fas" in MEGA.
    1. Klicken Sie im Menü "Daten" und wählen Sie "Exportieren Ausrichtung", und speichern Sie die Ausrichtung in PAUP Format (Nexus) als "35.nex" für den späteren Einsatz in MrBayes (Abbildung 6).
    2. Unterdessen klicken Sie "Modelle" auf dem Hauptfeld des MEGA, wählen Sie "finden Sie beste DNA/Protein Modelle (ML)", und klicken Sie auf das Popup-Fenster "OK". Klicken Sie auf "Berechnen", um das Modell suchen (Abbildung 7) zu beginnen. Es öffnet sich ein neues Panel Fortschritte; Dieser Prozess dauert einige Minuten bis zu mehreren Tagen, abhängig von der Komplexität der geladene Sequenzen und die Leistung des Computers.
      Hinweis: Eine Tabelle mit die Ergebnissen werden geöffnet, nachdem das Modell Suchvorgang abgeschlossen ist ( Abbildung 8). Die kleinste BIC Partitur werden zuerst, gefolgt von einer Reihe von verschiedenen Modellen mit allmählich zunehmender BIC Resultate aufgelistet. Das erste Modell "LG + G + F" mit dem kleinsten BIC Score ist das empfohlene Modell für ML Baum basierend auf der "35 realigned.fas"-Datei.
  2. Klicken Sie auf den Hauptbereich "" Mega "Stammesgeschichte", klicken Sie auf "Konstrukt/Test the maximale Wahrscheinlichkeit Tree", und klicken Sie dann auf "Ja" im Popup-Fenster. Ein neues Fenster wird geöffnet, verschiedene Parameter, die müssen angegeben (Abbildung 9).
    1. Legen Sie zunächst den bootstrap Wert im Test der Phylogenie Box; 500 oder 1.000 ist in den meisten Fällen ausreichend. Wählen Sie unter den Ersatz-Modell "Aminosäure" als Ersatz-Typ. Der Zweck der Wahl eines Ersatz-Modells ist, den wirkliche Unterschied zwischen Sequenzen basierend auf ihrer gegenwärtigen Staaten3zu schätzen.
    2. Wählen Sie "LG mit Freqs. (+F) Modell "(LG + F) im Feld Modell/Methode. Die Preise und Muster-Box, wählen Sie "Gamma verteilte" (G), Rate Variationen über Standorte, dhzu beschreiben.,3Seiten Änderungen bei sich langsam entwickelnden mehr Gewicht verleihen. Wählen Sie im Feld Daten Teilmenge "Komplett löschen" alle Spalten mit Bindestriche entfernen.
    3. Halten Sie alle anderen Parameter in ihrem Standardzustand (Abbildung 9). Klicken Sie nach Angabe dieser Parameter auf "Berechnen" um die Berechnung zu starten.

3. Vorstellung der phylogenetischen Stammbaum

Hinweis: Ein phylogenetischer Baum ML präsentiert werden nach Abschluss die Berechnung mit MEGA (Abbildung 10).

  1. Unter den Pull-Down-Menü "Datei"-Icon auf das Baum-Panel, wählen Sie "Aktuelle Sitzung speichern", um das Ergebnis zu speichern (.mas ist der Standard-Datei-Typ). In der vorliegenden Studie wurde das Ergebnis als "35.mas" gespeichert. Im Feld Baum viele Parameter einschließlich der Länge der Clade, baumstil, Baum-Topologie, Schriftart des Taxons Name, Größe und Farbe, werden angezeigt und können verschiedene Optionen eingestellt werden.
  2. Speichern Sie die letzten Baum-Datei durch Klicken auf das Bild-Symbol, und speichern Sie die Figur in verschiedenen Formaten zu oder kopieren Sie das Bild als Quelle für Fotobearbeitung.

4. Analyse des Verhältnisses von Süßigkeiten und SemiSWEETs mit Sequenzalignment

Hinweis: Dieser Schritt kann nicht in der normalen Reihenfolge Analyse erforderlich.

  1. Richten Sie die 228 eukaryotischen Süßigkeiten und 57 prokaryotische SemiSWEETs in Clustal Omega wie oben beschrieben. Der ausrichtergebnisse können in Jalview, die in Clustal Omega integriert, und kopiert, dass es in ein Bildbearbeitungsprogramm (Abbildung 11) speichern angezeigt werden.
    Hinweis: In der Beispiel-Ausrichtung, sind einige SemiSWEETs aus α-Proteobakterien mit der ersten MtN3/Speichel-Domäne der süßen Sequenzen ausgerichtet, während SemiSWEETs von Methanobacteria (Archaea) mit der zweiten MtN3/Speichel-Domäne der süßen Sequenzen ausgerichtet sind.

(5) phylogenetischer Baum Bau mit MrBayes

  1. Bayesian Rückschlüsse mit MrBayes die MrBayes ausführbare Datei zu öffnen und eine DOS-Oberfläche wird in einem neuen Fenster kommen. Der erste Schritt ist die Nexus-Daten-Datei zu lesen. Eingabe "35.nex"nach Ausführen der Eingabeaufforderung (denken Sie daran, die 35. nex-Datei im selben Verzeichnis der ausführbaren Datei MrBayes speichern, oder der Pfad der Datei vor dem Hochladen hinweisen). Eine "erfolgreiche lesen Sie Matrix" Meldung erscheint nach dem letzten der genannten Taxa (Abbildung 12). 35. nex Datei bereits vorbereitet und im MEGA gespeichert wurde (siehe 2.1 oben).
  2. Legen Sie das evolutionäre Modell.
    1. Geben Sie nach der Aufforderung "Prset Aamodelpr = fixed(lg); LSet Preise = g ". "Lg" und "g" entsprechen der "LG" und "G" Modell, das in MEGA festgelegt ist. Nachdem Sie erfolgreich das Modell haben, geben Sie "Mcmc Nchains = 4 Ngen = 5.000.000" nach der Aufforderung. Nutzen Sie die "Nchains = 4" Eintrag bedeutet eine Gesamtanzahl von einer Kühlkette und drei heiße Ketten zur Metropole Kopplung. "Ngen = 5.000.000" bedeutet 5.000.000 Generationen der Metropole Kupplung für die Konvergenz der kalten und warmen Ketten laufen. In dieser Studie galt durchschnittliche Standardabweichung der geteilten Frequenzen unterhalb 0.01 als Konvergenz der warmen und kalten Ketten.
    2. Beachten Sie, dass die Ngen-Anzahl kann nicht genau vorhergesagt werden, am Anfang des Prozesses, in der Regel angepasst werden muss, basierend auf die Veränderung der durchschnittlichen Standardabweichung der geteilten Frequenzen. Darüber hinaus kann die Ngen-Anzahl für die Konvergenz jedes Mal anders sein beim Ausführen des Programms der gleichen Daten anhand.
  3. Führen Sie die Analyse: Dieser Schritt dauert einige Minuten bis mehrere Tage, je nach der Komplexität der Eingabedaten und die Leistung des Computers. Nach Abschluss der voreingestellte Berechnung, wird eine Eingabeaufforderung Fragen "Weiter mit Analyse (Ja/Nein)?" Wenn "Nein" nach der Eingabeaufforderung eingegeben wird, weiterhin das computing (Abbildung 13), stoppt sonst berechnen, nachdem die Anzahl der weiteren Generationen eingegeben wird. Wenn die Berechnung beendet ist (mit einer durchschnittlichen Standardabweichung von geteilten Frequenzen < 0,01 oder 0,05), die Berechnung durch Eingabe von "Nein" nach der Untersuchung Aufforderung zu stoppen.
    Hinweis: 0,01 ist ein strenges Kriterium, 0,05 ist gemäßigt und in der Regel ausreichend.
  4. Fassen die Proben: Geben Sie "Sumpf", nach der Eingabeaufforderung, um Proben von Modellparametern (Abbildung 14) zusammenfassen. Geben Sie dann "Sumt Relburnin ja Burninfrac = 0,25 =" nach der Aufforderung zum Baum Proben zusammenfassen. Detaillierte Informationen zu phylogenetischen Baum Bau wird angezeigt wie in Abbildung 15, gefolgt von zwei Baum-Figuren, die im ASC II-Code auf dem Bildschirm, eine Vorführung Clade Glaubwürdigkeit und die andere zeigt Zweig Längen angezeigt werden. Zur gleichen Zeit wird automatisch eine Baum-Datei mit dem Namen "35.nex.con" gespeichert.
  5. Öffnen Sie für eine bessere Darstellung der phylogenetischen Stammbaum die Datei "35.nex.con" Baum mit dem Volksheiligen-Tool (http://tree.bio.ed.ac.uk/software/figtree/), wählen Sie einen Stil oder Größe um das Ergebnis (Abbildung 16) anzuzeigen, oder sogar in einem Fotoeditor zu bearbeiten leserfreundlicher.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Phylogenetische Bäume zeigen, dass alle ersten MtN3/Speichel Domänen der 35 süße Sequenzen als ein Clade und die zweite MtN3/Speichel-Domänen der süßen Sequenzen zusammengefasst als ein anderes Clade gruppierten. Darüber hinaus zeigen ausrichtergebnisse an Süßigkeiten und SemiSWEETs, dass einige SemiSWEETs aus α-Proteobakterien abgestimmt auf die erste MtN3/Speichel-Domäne der süßen Sequenzen, während SemiSWEETs von Methanobacteria (Archaea) mit dem zweiten MtN3/Speichel ausgerichtet Domäne der süßen Sequenzen. Diese Ergebnisse legen nahe zusammen, dass die beiden MtN3/Speichel-Domänen mit Süßigkeiten aus eine evolutionäre Mischung aus einer bakteriellen SemiSWEET und ein Archaeon14abgeleitet werden könnte.

Figure 1
Abbildung 1 : Speichern ausgerichteten Sequenzen der 35 vermeintlichen eukaryotischen Süßigkeiten als "35.clustal" über Clustal Omega. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 2
Abbildung 2 : Wählen Sie Pfad in BioEdit zu trimmen die ausgerichteten Sequenzen von "35.clustal", die in Clustal Omega vorbereitet wurde. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 3
Abbildung 3 : Wählen Sie und löschen Sie die ungleichmäßigen Sequenzen auf der linken Seite der ersten MtN3/Speichel Domäne Sequenzen der 35 vermeintliche eukaryotischen Bonbons in BioEdit. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 4
Abbildung 4 : Die getrimmten Sequenzen der ersten MtN3/Speichel-Domäne der 35 vermeintliche eukaryotischen Bonbons in BioEdit. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 5
Abbildung 5 : Markieren und kopieren Sie die erste MtN3/Speichel Domäne Sequenzen der 35 vermeintlichen eukaryotischen Süßigkeiten in MEGA. In eine Doc-Datei für die Bearbeitung werden die kopierten Sequenzen eingefügt. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 6
Abbildung 6 : "35 realigned.fas" in "35.nex" (PAUP-Format) für Bayesian Inference zu einem späteren Zeitpunkt konvertieren. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 7
Abbildung 7 : Suche nach dem am besten geeigneten Ersatz-Modell nach MEGA für maximale Wahrscheinlichkeit (ML) phylogenetischer Baum Bau anhand der "35 realigned.fas"-Datei. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 8
Abbildung 8 : Eine Tabelle mit den am besten geeigneten Ersatz-Modell berechnet für ML Baum basierend auf der "35 realigned.fas"-Datei. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 9
Abbildung 9 : Geben Sie die Parameter für ML Baum Berechnung basierend auf dem am besten geeigneten Ersatz-Modell für "35 realigned.fas" Mega. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 10
Abbildung 10 : Ein original ML Baum von MEGA basierend auf "35 realigned.fas" gebaut. In diesem Stadium, viele Optionen für die Abbildung Art, Größe, Farbe, etc.., stehen zur Verfügung. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 11
Abbildung 11 : Ausrichtung von 228 eukaryotischen Süßigkeiten und 57 prokaryotische SemiSWEETs von Clustal Omega. Die Ergebnisse zeigten sich in Jalview, Clustal Omega integriert. In der Ausrichtung waren einige SemiSWEETs aus α-Proteobakterien mit der ersten MtN3/Speichel-Domäne der süßen Sequenzen ausgerichtet, während SemiSWEETs von Methanobacteria (Archaea) mit der zweiten MtN3/Speichel-Domäne der süßen Sequenzen ausgerichtet waren. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 12
Abbildung 12 : Die Datei "35.nex" in MrBayes im DOS-Fenster laden. Um die Ergebnisse zu zeigen, wurde Inhalt, die ähnlich war gelöscht, um die Abbildung zu verkürzen. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 13
Abbildung 13 : Informationen auf dem Bildschirm angezeigt, nach der Berechnung der "35.nex" Datei mit MrBayes. Um die Gesamtergebnisse zeigen, wurde Inhalte, die ähnlich war gelöscht, um die Abbildung zu verkürzen. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 14
Abbildung 14 : Proben der Modellparameter für die Datei "35.nex" zusammengefasst. Bitte klicken Sie hier, um eine größere Version dieser Figur. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 15
Abbildung 15 : Baum-Proben der Datei "35.nex" zusammengefasst. Um die Gesamtergebnisse zeigen, wurde Inhalte, die ähnlich war gelöscht, um die Abbildung zu verkürzen. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 16
Abbildung 16 : Der phylogenetischen Stammbaum von "35.nex.con" angezeigt, indem Volksheiligen. Bitte klicken Sie hier für eine größere Version dieser Figur.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Es wird in der biologischen Forschung einen Phylogenetischen Baum ausgehend von Nukleotid oder Aminosäure-Sequenzen8immer beliebter. Generell gibt es drei wichtige Phasen der Übung einschließlich Sequenzalignment, Bewertung der ausgerichteten Sequenzen mit der richtigen Methode oder Algorithmus und Visualisierung von das rechnerische Ergebnis als phylogenetischer Baum. In der vorliegenden Studie wurden drei Runden von Sequenzalignment durchgeführt: Zunächst waren die süßen Proteinsequenzen, einschließlich der ersten und zweiten MtN3/Speichel-Domäne ausgerichtet; Zweitens wurden jeweils die einzelnen MtN3/Speichel Domäne Sequenzen von Süßigkeiten als eine unabhängige Taxon gesammelt und gemeinsam ausgerichtet; und zu guter Letzt halbsüß Sequenzen und süßen Sequenzen wurden gemeinsam ausgerichtet. Für phylogenetischen Baum Bau ist in der Regel nur eine Runde von Sequenzalignment erforderlich.

In der Vorbereitungsphase können homologe Sequenzen von NCBI oder anderen Datenbanken heruntergeladen werden. Diese heruntergeladene Sequenzen müssen untersucht werden, wenn sie nicht gut beschriftet sind. In der ersten und zweiten Stufe können Ausrichtung und Berechnung gestartet werden, wenn die Sequenz-Format nicht korrekt ist. Clustal Omega wird beispielsweise jede Abweichung von der FASTA-Format in der Sequenz Datei ablehnen. Beachten Sie in der computergestützten Phase, dass die Sequenz Länge einschließlich Aminosäuren oder Nukleotide und Bindestriche erforderlich sind, um gleich vor von MEGA ausgewertet werden.

Trotz der Fülle von Methoden und Modellen für Baum Bau, die verfügbar sind, ist keiner von ihnen narrensicher. Robust und überzeugende Ergebnisse sind diejenigen, die stehen im Einklang mit einander wenn unterschiedliche Algorithmen oder Modelle verwendet werden, um die gleichen Daten15zu bewerten. In der ML-Methode hängt die Zuverlässigkeit der Baum-Topologie der bootstrap Wert jedes Clade; ein bootstrap Wert von 70 oder mehr gilt als zuverlässig. In der vorliegenden Studie, alle von der ersten MtN3/Speichel Domäne Sequenzen gruppiert als eine große Clade bootstrap Wert von 83. Der Wert der anderen Clade enthält alle zweiten MtN3/Speichel Domäne Sequenzen, war jedoch nur 6 (Abbildung 10). Überprüfen Sie die Baum-Architektur, wurde MrBayes, die eine völlig andere Methode16 ml beschäftigt, zur Analyse der Beziehung der Taxa. Die posteriore Wahrscheinlichkeiten16 von der ersten und zweiten Domäne Clades gewonnenen MrBayes wurden 100 und 68, bzw. (Abbildung 16).

Eine weitere Einschränkung der ML und der MrBayes-Berechnung ist, dass beide zeitaufwändig zu laufen. Mit einem Computer mit Multi-Core-Prozessoren und grafische Verarbeitungseinheiten (GPU) ist hilfreich, Verbesserung der Rechenleistung und Geschwindigkeit17,18. Für den Betrieb des MrBayes kann ein Computer mit einer diskreten Grafikkarte und die entsprechenden CUDA-Treiber die Wahrscheinlichkeit Berechnungen11erheblich beschleunigen.

Wählen das richtige Modell für die Berechnung der phylogenetischen Stammbaum ist schwierig für Personen mit wenig Erfahrung. In dieser Hinsicht bietet MEGA eine einfache Möglichkeit, das beste Modell zu finden, durch den Vergleich der BIC-Resultate von Kandidatenmodellen. Darüber hinaus integriert die kürzlich aktualisierten MEGA 6.0 mehrere Sequenz ausrichtungswerkzeuge wie Muskel- und Clustal W10, die sehr bequem zu bedienen sind. Freuen Sie sich auf eine Sequenz bearbeiten und der phylogenetischen Baum Baumfunktion. Diese Funktionen erklären teilweise, warum diese Software im Bereich computational Molekulare Evolution so beliebt ist. Für MrBayes, ein wesentlicher Vorteil dieses Tools ist, dass gemischte Datentypen zusammen verarbeitet werden können (zB., morphologischen und molekularen Daten)11, und somit die Ergebnisse sind umfassender.

Abschließend stellt die vorliegende Studie eine Methode zur Analyse des molekularen Ursprungs des Protein-Kodierung Gene, die komplexe Variation wie Fusion nach Vervielfältigung oder horizontaler Gentransfer (HGT) im Laufe der Evolution durchlaufen haben. Hoffentlich werden weitere Erkenntnisse mit der breiten Anwendung der phylogenetischen Analyse auf dem Gebiet der Evolutionsforschung enthüllt werden.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts preisgeben.

Acknowledgments

Diese Arbeit wurde von der National Natural Science Foundation of China (31371596), Bio-Technology Research Center, China drei-Schluchten-Universität (2016KBC04) und die naturwissenschaftlichen Grundlage der Provinz Jiangsu, China (BK20151424) unterstützt.

Materials

Name Company Catalog Number Comments
Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4 GB memory, Core 2 or above CPU. Windows 7, Windows 10

DOWNLOAD MATERIALS LIST

References

  1. Nei, M., Kumar, S. Molecular Evolution and Phylogenetics. Oxford University Press. Oxford. (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics