August 16th, 2017
Das Ziel dieses Protokolls ist es, eine Referenz für unterschiedliche Proteine in einer Gruppe zu entwickeln, die kohärente Kriterien für Nomenklatur und Klassifizierung fehlt. Dieser Verweis erleichtert die Analyse und Diskussion der Gruppe als Ganzes und kann neben etablierten Namen verwendet werden.
Das übergeordnete Ziel dieses Verfahrens ist es, mit Hilfe von Standard-Tabellenkalkulationssoftware eine Referenz für divergente Proteine in einer Gruppe zu entwickeln, für die es keine kohärenten Kriterien für die Nomenklatur und Klassifikation gibt. Diese Methode kann helfen, Beziehungen zwischen verwandten Proteinen zu klären, die eine verwirrende oder inkonsistente Nomenklatur aufweisen, wie z. B. die Cystein-stabilisierte Alpha-Beta-Superfamilie der defensiven Peptide, zu der auch die Abwehrkräfte von Wirbellosen gehören. Der Hauptvorteil dieser Technik besteht darin, dass sie eine einfache visuelle Darstellung der interessierenden Proteine ermöglicht.
Identifizieren Sie zunächst die definierenden Merkmale der interessierenden Proteingruppe. Zum Beispiel definiert die CS-alpha-beta-Faltung in der Lösungsstruktur der Insektenabwehr und -hilfe von Phormia terraenovae die CS-alpha-beta-Superfamilie. Diese Falte enthält auch ein kleineres Motiv, die Cystein-stabilisierte Helix, die durch CXXXC stromaufwärts einer CXC identifiziert wird.
Die vier Cysteine bilden zwei Disulfidbindungen. Um das CS-alpha-beta-Motiv zu vervollständigen, wird eine dritte Disulfidbindung durch ein zusätzliches Paar Cysteine gebildet. Letztendlich ist es wichtig, zumindest einige wichtige Merkmale im Zusammenhang mit der Struktur oder Funktion des Proteins zu kennen.
Ohne dies gibt es keine Grundlage für die Generierung einer Referenz. Geben Sie nun diese definierenden Merkmale in eine Tabelle ein. Verwenden Sie Spalten für die beibehaltenen Features und zur Darstellung der Abstände zwischen diesen Features.
Halten Sie die Spalten breit genug, um Zahlen aufzunehmen, und geben Sie ihnen eine einheitliche Breite. Beschreiben Sie in den Zeilen die Sequenzen. Um eine Sequenz als Feature zu kennzeichnen, füllen Sie das Feature-Feld mit der Füllfunktion mit Farbe aus.
Um dann den Abstand zwischen den Features anzugeben, geben Sie die Anzahl der Aminosäuren in das Feld dazwischen ein. Fügen Sie nun repräsentative Sequenzen hinzu, die zuvor auf der Grundlage von Strukturdatenbanken und veröffentlichten Ergebnissen als Mitglieder der Gruppe festgelegt wurden. Fügen Sie bei Bedarf Features hinzu, die wahrscheinlich eine Untergruppe von Sequenzen definieren, z. B. ein zusätzliches Cystein.
Wenn in einer bestimmten Sequenz Merkmale fehlen, lassen Sie das Feld unausgefüllt und kombinieren Sie es mit Feldern, die intervenierende Aminosäuren darstellen. Verwenden Sie dazu die Funktion Zusammenführen und Zentrieren. Nachdem repräsentative Sequenzen eingegeben wurden, identifizieren Sie Gruppen von eindeutig verwandten Sequenzen.
Fassen Sie dann die Merkmale dieser Gruppen zusammen. Wenn die Anzahl der Aminosäuren zwischen den Merkmalen variiert, verwenden Sie einen Bindestrich, um einen Bereich anzugeben, oder Schrägstriche, um einige bestimmte Zahlen anzugeben. Kommentieren Sie bei Bedarf kreativ Funktionen, die möglicherweise relevant sind oder nicht häufig genug sind, um sie in die Referenz aufzunehmen.
Da zum Beispiel Cysteine in der Überfamilie wichtig sind, kann das Vorhandensein von zusätzlichen Cysteinen markiert werden. Manchmal, wenn neu identifizierte Sequenzen zur Tabelle hinzugefügt werden, fallen die Sequenzen einer Art in mehrere verschiedene Gruppen der Überfamilie, z. B. bei Bärtierchen. Sobald dies abgeschlossen ist, können die Zeilen der Tabelle sortiert werden, um die Variation innerhalb einer Art oder die Variation zwischen taxonomischen Gruppen hervorzuheben.
Bei dieser Demonstration wird die frei verfügbare Software MEGA 6 verwendet. Andere Software kann jedoch ähnlich verwendet werden. Um eine neue Achse zu starten, wählen Sie auf der Registerkarte Ausrichten die Option Achse bearbeiten/erstellen aus.
Wählen Sie dann im angezeigten Feld die Option Neue Achse erstellen aus, und klicken Sie auf OK. Wählen Sie dann Protein aus. Wählen Sie nun im Menü Bearbeiten die Option Sequenz aus Datei einfügen aus, um die Sequenzen zu importieren. Die Sequenzen müssen im FASTA-Format vorliegen.
Hintergrundfarben, die verschiedene Aminosäuretypen widerspiegeln, werden standardmäßig angezeigt und können mit einem Umschalter im Menü "Anzeige" deaktiviert werden. Sobald alle Sequenzen eingegeben wurden, klicken Sie auf das Symbol für den beugenden Arm und dann auf Protein ausrichten, um die Sequenzen mit dem Muskelalgorithmus auszurichten. Wenn die Meldung Nichts für Ausrichtung ausgewählt.
Alles auswählen? wird angezeigt, wählen Sie OK aus. Einige Parameter können im Popup-Fenster geändert werden, aber für diese Demonstration reichen die Standardwerte aus. Überprüfen Sie nun die Ausrichtung basierend auf den wichtigen Merkmalen der Protein-Superfamilie.
Der obere Balken zeigt ein Sternchen an jeder Position, an der die Aminosäure vollständig konserviert ist. Die initiale Ausrichtung identifiziert drei der vier konservierten Cysteine. Eine Sequenz ist eindeutig falsch ausgerichtet.
Um eine falsch ausgerichtete Sequenz zu korrigieren, markieren Sie die Striche und drücken Sie die Entf-Taste, ohne versehentlich Aminosäuren zu löschen. Verschieben Sie dann die Aminosäuren in die richtige Ausrichtung, indem Sie Leerzeichen hinzufügen. Beachten Sie nach dem manuellen Ausrichten der Sequenz, dass das letzte Cystein des CXXXC-Motivs während des gesamten Alignments erhalten bleibt.
Oft ist eine manuelle Anpassung notwendig, um die wichtigsten Merkmale der Sequenzen zu priorisieren. Die Tabellenausrichtung der zuvor etablierten CS alpha-beta-Superfamilie zeigte fünf grundlegende Muster der Anleihenbildung. Die neu identifizierten Bärtierchen-Sequenzen fielen in das gesamte Spektrum dieser Muster.
Anschließend wurde mit phylogenetischen Analysen untersucht, wie sich diese Gruppe von Proteinen entwickelt haben könnte. Die Sequenzen sind jedoch in der Regel kurz und sehr divergent. Die resultierenden Bäume waren daher schlecht aufgelöst und boten wenig Aufschluss.
Das multiple Sequenz-Alignment wurde anhand der Referenz optimiert, aber es gab immer noch eine schlechte Auflösung in der Maximum-Likelihood-Analyse und in der Bayes'schen phylogenetischen Analyse. Die meisten Kladen hatten nur eine geringe Unterstützung. Fünf kleine Gruppen wurden jedoch in mindestens einem der beiden Bäume unterstützt.
Sequenzen mit unterschiedlichen Cysteinzahlen innerhalb einer taxonomischen Gruppe können enger verwandt sein als Sequenzen mit dem gleichen Muster aus verschiedenen Gruppen. Nachdem Sie sich dieses Video angesehen haben, sollten Sie ein gutes Verständnis dafür haben, wie Sie Tabellenkalkulationssoftware verwenden, um eine einfache Visualisierung wichtiger Proteineigenschaften zu erstellen. Beim Versuch dieses Verfahrens ist es wichtig, sich daran zu erinnern, dass die Bestimmung der relevantesten Eigenschaften für die Gruppe von Proteinen oft ein iterativer Prozess ist und wahrscheinlich eine Überarbeitung der Referenz erforderlich sein wird.
Neue Sequenzen können jederzeit zu einer Tabelle hinzugefügt werden, und es ist einfach, mehrere Versionen zu haben, die es ermöglichen, neue Funktionen hinzuzufügen, die für die Klassifizierung und Analyse nützlich sein können. Obwohl die Ausrichtung der Tabellenkalkulation eine einfache Visualisierung von strukturellen und funktionellen Merkmalen ermöglicht, können auch andere Methoden wie phylogenetische Analysen durchgeführt werden, um zusätzliche Einblicke in evolutionäre Beziehungen zu erhalten.
View the full transcript and gain access to thousands of scientific videos
Dieses Protokoll zielt darauf ab, eine Referenz für divergierende Proteine innerhalb einer Gruppe zu schaffen, der derzeit eine kohärente Nomenklatur und Klassifizierungskriterien fehlen. Durch die Klärung der Beziehungen zwischen verwandten Proteinen wird diese Referenz Diskussionen und Analysen der Gruppe verbessern.