Umfassenden Workflow zur genomweiten Identifizierung und Ausdruck Meta-Analyse von der ATL E3 Ubiquitin Ligase Genfamilie in Grapevine

* These authors contributed equally
Biology

Your institution must subscribe to JoVE's Biology section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

Dieser Artikel beschreibt das Verfahren für die Identifizierung und Charakterisierung einer Genfamilie in Grapevine, die zur Familie der Arabidopsis Tóxicos in Levadura (ATL) E3 Ubiquitin Ligases angewendet.

Cite this Article

Copy Citation | Download Citations

Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Klassifizierung und Nomenklatur der Gene in einer Familie können erheblich zur Beschreibung von der Vielfalt der kodierten Proteine und die Vorhersage von Familienfeiern basierend auf einige Features, wie beispielsweise das Vorhandensein von Sequenzmotive oder bestimmten beitragen Standorte für Post-translationale Modifikation und das Expressionsprofil Familienmitglieder unter verschiedenen Bedingungen. Diese Arbeit beschreibt ein detailliertes Protokoll für gen-Familie-Charakterisierung. Hier wird das Verfahren bis hin zur Charakterisierung der Arabidopsis Tóxicos in Levadura (ATL) E3 Ubiquitin Ligase Familie in Grapevine angewendet. Die Methoden umfassen die genomweite Identifizierung von Familienangehörigen, die Charakterisierung des Gens Lokalisation, Struktur und Vervielfältigung, die Analyse der erhaltenen Protein Motive, die Vorhersage von Protein-Lokalisierung und Phosphorylierung-Sites sowie gen Expression profiling innerhalb der Familie in verschiedenen Datensätzen. Solches Verfahren, die zu weiteren Analysen je nach experimentellen Zwecken verlängert werden konnten, angewandt werden, für jede Genfamilie in alle Pflanzenarten für die genomische Daten verfügbar sind, und es liefert wertvolle Informationen um interessante Kandidaten zu identifizieren für funktionelle Studien geben Einblicke in die molekularen Mechanismen der Pflanze Anpassung an ihre Umwelt.

Introduction

In den letzten zehn Jahren wurde viel Forschung in Grapevine Genomics durchgeführt. Weinrebe ist eine anerkannte wirtschaftlich relevanten Ernte, die ein Modell für die Forschung auf Fruchtentwicklung und die Reaktionen von Gehölzen auf biotischen und abiotischen Stress geworden ist. In diesem Zusammenhang die Freilassung von Vitis Vinifera CV PN40024 Genom in 20071 und seine aktualisierte Version in 20112 führte zu einer schnellen Ansammlung von "Omics" angelegte Daten und einen Ausbruch von Hochdurchsatz-Studien. Basierend auf die publizierten Sequenzdaten, die umfassende Analyse einer bestimmten gen-Familie (in der Regel bestehend aus Proteinen Austausch konservierte Motive, strukturelle und funktionelle Gemeinsamkeiten und evolutionären Beziehungen), kann jetzt durchgeführt werden, um zu entdecken sein molekulare Funktionen, Evolution und gen Expressionsprofile. Diese Analysen können tragen zum Verständnis, wie Genfamilien physiologische Prozesse auf eine genomweite Ebene steuern.

Ubiquitin vermittelten Abbau von wichtigen Proteinen, erfordern einen fein abgestimmte Umsatz um regelmäßige zelluläre Prozesse zu gewährleisten, sind viele Aspekte des Lebenszyklus der Anlage geregelt. Wichtige Bestandteile des Ubiquitin-vermittelten Abbauprozess E3 Ubiquitin Ligases, die für die Flexibilität des Systems, durch die Rekrutierung von Einzelzielen3verantwortlich sind. Dementsprechend stellen diese Enzyme eine riesige Genfamilie mit rund 1.400 E3 Ligase-Kodierung Gene in Arabidopsis Thaliana Genom4, jedes E3-Ubiquitin-Ligase handeln für Ubiquitination von zielgruppenspezifischen Proteinen vorhergesagt. Trotz der Bedeutung der Substrat-spezifische Ubiquitination in zellulären Verordnung in Pflanzen ist wenig bekannt über wie Ubiquitination-Signalweg reguliert wird und Zielproteine wurden nur in wenigen Fällen identifiziert. Die Entschlüsselung dieser Spezifität und Verordnung Mechanismen stützt sich zunächst auf die Identifizierung und Charakterisierung der verschiedenen Komponenten des Systems, insbesondere E3 Ligases. Unter Ubiquitin Ligases ist ATL Unterfamilie geprägt von 91 Mitglieder in A. Thaliana anzeigen eine RING-H2 Finger Domäne5,6, einige von ihnen spielt eine Rolle in der Verteidigung und Hormon Antworten7identifiziert.

Der erste entscheidende Schritt zu definieren, die Mitglieder einer neuen gen-Familie ist die genaue Definition der Family-Features, z. B. Konsens Motive Schlüsselbereichen und Protein-Sequenz-Eigenschaften. In der Tat erfordert das zuverlässige Abrufen aller gen Familienmitglieder BLAST Analyse einige obligatorische Sequenz Merkmale in bestimmten Proteins Domänen verantwortlich für Protein-Funktion/Tätigkeit, als Protein-Signatur. Dies kann durch vorherige Charakterisierung derselben Genfamilie in anderen Pflanzenarten erleichtert oder erreicht durch die Analyse verschiedener Gene, die vermeintlich aus der gleichen Familie in verschiedenen Pflanzenarten, allgemeine Sequenzen zu isolieren. Die Familienmitglieder können dann individuell benannt werden, nach gemeinsamen Regeln, die von internationalen Konsortien für einen bestimmten Pflanzenarten besiedelt. Weinrebe zum Beispiel solche Verfahren auf die Empfehlungen des Ausschusses Super-Nomenklatur für Traube gen Annotation (sNCGGa), über den Bau einer phylogenetischen Baum einschließlich V. Vinifera und A. Thaliana unterliegt gen Familienmitglieder gen Anmerkung erlauben ausgehend von Nukleotid-Sequenzen8.

Chromosom Lokalisierung von Familienmitgliedern und gen Doppelarbeit Umfrage ermöglichen das Vorhandensein von Vollständiggenom oder Tandem duplizierten Genen Hervorhebung. Solche Informationen erscheint sinnvoll, vermeintliche Genfunktionen zu lüften, da es vielleicht funktionelle Redundanz zeigen oder unterschiedliche Situationen, d. h., nicht-Funktionalisierung, Neo-Funktionalisierung oder Sub-Funktionalisierung9 zeigen. Beiden Neo - und sub - functionalization sind wichtige Ereignisse, die genetischen Neuheit, Pflanze Anpassung an sich verändernde Umgebungen10neue zelluläre Komponenten zur erstellen. Insbesondere Vervielfältigungen von ancestral Genen und Produktion neuer Gene wurden sehr häufig während der Evolution des Genoms Weinrebe und neugeformten Gene aus proximalen und Tandem Duplikationen in Grapevine waren wahrscheinlicher, produzieren neue Funktionen11.

Ein weiterer wichtiger Faktor bei der Entschlüsselung Familie Genfunktion ist das transkriptomischen-Profil. Die Verfügbarkeit von öffentlichen Datenbanken den Zugriff auf eine riesige Menge an transkriptomischen Daten kann so ausgenutzt werden, um gen Familienmitglieder mit groß angelegten in Silico Expressionsanalysen mutmaßliche Funktionen zuweisen. In der Tat der eigentümliche Ausdruck einiger Gene in bestimmten Pflanzenorganen oder als Reaktion auf bestimmte Belastungen geben einige Hinweise auf die vermeintlichen Rollen der entsprechenden Proteine unter definierten Bedingungen und Hypothesen über mögliche Unterstützung zukommen Sub-Funktionalisierung von duplizierten Genen, verschiedene Herausforderungen zu reagieren. Zu diesem Zweck ist es wichtig, mehrere Datasets zu berücksichtigen: Diese können bereits vorhandene gen Ausdruck Matrizen, wie z. B. die genomweite transkriptomischen Atlas der Weinrebe Organe und Entwicklungsstadien12, oder ad-hoc durch gebaut werden können Abrufen von transkriptomischen Datensätzen für die bestimmten Pflanzenarten definierten Belastungen ausgesetzt. Darüber hinaus können ein einfacher Ansatz mit zwei Matrizen, eines mit paarweisen Ähnlichkeit Daten und eines mit paarweisen Co Ausdruck Koeffizienten angewendet werden um die Beziehungen zwischen Reihenfolge Ähnlichkeit und Ausdruck Muster innerhalb einer Genfamilie zu bewerten.

Diese Arbeit soll einen globalen Ansatz, Definition der Genstruktur, konserviertes Protein Motive, chromosomalen Position, gen Duplikationen und Expressionsmuster, als auch die Vorhersage von Protein Lokalisierung und Phosphorylierung Websites erreichen eine vollständige Charakterisierung einer Genfamilie in Pflanzen. Ein umfassender Ansatz wird hier auf die Charakterisierung der ATL E3 Ubiquitin Ligase Familie in Grapevine angewendet. Entsprechend der neuen Rolle des ATL Unterfamilie Mitglieder bei der Regulierung der wichtige zelluläre Prozesse7, diese Arbeit gut helfen die Identifizierung der starke Kandidaten für funktionelle Studien, und schließlich die molekularen Mechanismen zu entwirren der Anpassung von diesem wichtigen Kulturpflanzen auf seine Umgebung.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Identifizierung des vermeintlichen ATL Genfamilie Mitglied(er)

  1. PSI-BLAST-Web-version
    1. Öffnen Sie BLAST Webseite13 , und klicken Sie auf Abschnitt Protein BLAST.
    2. Geben Sie im Feld "Enter Abfrage Sequence" die Aminosäure-Sequenz des Proteins (hier VIT_05s0077g01970), der als Sonde verwendet wird, um die anderen Familienmitglieder zu identifizieren.
      Hinweis: Ein guter Vertreter Protein sollte sein (ein Protein zeigt alle wichtigen Features, die die Familie charakterisieren) verwendet.
    3. Wählen Sie im Feld "Wählen Sie Suchgruppe" der "Referenz-Protein" Datenbank (Refseq_protein) und den Organismus von Interesse (V. Vinifera - Taxid:29760).
    4. Wählen Sie in das Feld "Programmauswahl" PSI-BLAST-Algorithmus aus und klicken Sie auf die Schaltfläche "BLAST", um die Analyse zu starten.
      Hinweis: Durch Klicken auf die "Algorithmusparameter" ist es möglich, einige erweiterte Parameter (Max Zielsequenzen, Scoring Matrix, PSI-BLAST-Schwelle, etc.).
    5. Die erste Explosion Runde ruft alle Sequenzen, die relevanten Treffer mit der Abfrage anzeigen (e-Wert über dem ausgewählten Schwellenwert - standardmäßig 0,005; 0,001 in diesem Experiment). Deaktivieren Sie alle Einträge, die eindeutig nicht gehören zur Familie Prüfung durch einen Klick auf das Häkchen in der Spalte "Select für PSI-BLAST" und die zweite PSI-BLAST-Iteration durch Klicken auf die Schaltfläche "BLAST", wie in Schritt 1.1.4 laufen.
    6. Neu identifizierte Sequenzen sind gelb markiert. Deaktivieren Sie der eindeutig falsch abgerufen am Hits und entdecken Sie weitere Iterationen wie in Schritt 1.1.5 beschrieben.
    7. Fahren Sie mit Iterationen, bis der Algorithmus keine Eintragung findet oder Konvergenz (es werden keine neuen Einträge gefunden) erreicht. Laden Sie die Liste der vermeintlichen gen Familienmitglieder für weitere Analysen. Überprüfen Sie die abgerufenen Hits in jeder Iteration, die Anwesenheit der Fehlalarme zu vermeiden.
  2. PSI-BLAST-Standalone-version
    1. Download der Standalone-Version von BLAST durch Anklicken des Buttons "download BLAST" auf der BLAST-Startseite-13.
      Hinweis: Die Standalone-BLAST-Software ist eine Kommandozeilen-Version des Web-Interfaces beschrieben vor. Es ermöglicht die PSI-BLAST-Suche anhand einer benutzerdefinierten Datenbank lokal oder remote ausführen. Darüber hinaus erlaubt es, mit einer vordefinierten Position bestimmte Punktzahl Matrix (PSSM) suchen.

2. manuelle Inspektion der PSI-BLAST-identifiziert Familienmitglieder

  1. Mehrfache Ausrichtung
    1. Sammeln Sie die amino sauren Sequenzen, die zuvor in einer FASTA-formatierten Datei identifiziert und laden Sie sie in die MEGA Software14 mit mehreren Ausrichtung vorzugehen.
    2. Öffnen Sie die MEGA-Software, klicken Sie auf "Align", klicken Sie auf "Edit/Build Ausrichtung", klicken Sie "Erstellen eine neue Ausrichtung", klicken Sie auf "Protein".
    3. Klicken Sie auf "Bearbeiten" aus dem Menü Ausrichtung und "Sequenz aus Datei einfügen". Die FASTA-Datei erstellt, bevor suchen Sie und bestätigen Sie den Upload der untersuchten Sequenzen.
    4. Klicken Sie auf "Ausrichtung" aus dem Menü Ausrichtung und "Ausrichten von Muskel". Default-Parameter zu verwenden, klicken Sie auf "Berechnen" und warten auf die Fertigstellung der mehrfache Ausrichtung.
    5. Überprüfen Sie die mehrfache Ausrichtung nicht falsch vorhergesagte Familienmitglieder auszuschließen. Das kanonische CxxC (13 X) PxCxHxxHxxCxxxW (7 X) CxxCW-Motiv (insbesondere das Vorhandensein von Prolin Rückstände vor der dritten Cystein), ist das Hauptmerkmal verpflichtet, die ATL-Familienmitglieder zu definieren.
  2. Analyse der spezifischen LOGO
    1. Legt die definitive Liste der Familienmitglieder (96 Weinrebe Sequenzen erfüllen die Anforderungen gelten ATL) mehrere Em Motiv Erhebung (MEME)15 , konservierte Motive innerhalb der Familie zu definieren.
    2. Klicken Sie von der MEM-Homepage auf "MEME" und füllen Sie das "Daten Vorlage Formular" mit bestimmten Informationen über die Familie von Interesse.
    3. Verwenden Sie MEME Analyse auf um das Vorhandensein der zwei erwarteten Motive innerhalb der Weinrebe ATL Familienmitglieder, d.h., der RING-H2 und die GLD-Motive zu bestätigen.
  3. Alternativ führen Sie Schritte 2.1 und 2.2 gleichzeitig mit Hilfe der Bioinformatik-Software-Suite (siehe Tabelle der Materialien).
    1. FASTA-Datei hochladen (siehe Schritt 2.1.1) in die Suite. Wählen Sie "Datei" aus dem Menü, dann "Importieren" und klicken Sie auf "aus Datei". Durchsuchen Sie die FASTA-Datei und klicken Sie auf "Öffnen".
    2. Wählen Sie die importierte Sequenzen in der Liste und klicken Sie auf "Align/zusammenfügen" Schaltfläche in der Symbolleiste, und klicken Sie dann "Paarweise Multiple Alignment". Wählen Sie "Muskel-Achse" und klicken Sie auf "OK", um die Ausrichtung mit Default-Parametern zu starten.
    3. Um das LOGO der Achse zu visualisieren, klicken Sie auf "Grafiken" → "Optionen" und wählen Sie "Sequenz-Logo".

3. Analyse der physikalischen Parameter Protein und Domains

  1. Wie die Definition der verschiedenen physikalischen Parameter der Befragten Familienmitglieder wichtig, eine umfassende Beschreibung der Familie haben, senden Sie die Liste der Familienmitglieder zu spezifischen Web-Tools.
    1. Verwenden Sie zum isoelektrischen Punkt (pI) und Molekulargewicht (kDa) ProtParam Werkzeug16 auf der Expasy-Website mit Standardparametern.
    2. Verwenden Sie für Protein subzelluläre Lokalisation verschiedene Werkzeuge, eine zuverlässige Vorhersage wie NgLOC v1. 017 mit Standardeinstellungen, TargetP v1. 118 mit Standardeinstellungen und Protein Prowler subzelluläre Lokalisierung v1. 219 zu erhalten mit einem Cut-off der Wahrscheinlichkeit von 0,5. Verwenden Sie für Phosphorylierung Websites die MUsite v1. 0 Web Tool20 mit Standardparametern.
  2. Zusätzliche Protein Domänen in Familienmitglieder zu untersuchen.
    1. Öffnen Sie Pfam Datenbank Webseite21zu, wählen Sie "Sequenz" Suchwerkzeug reichen Sie Proteinsequenzen im Abfragefeld ein und klicken Sie auf "Go", um die Analyse zu starten.
      Hinweis: Jede Proteinreihenfolge ist einzeln analysiert. Ein e-Wert von 1,0 in der Standardeinstellung erlaubt Unterscheidung zwischen wesentlichen und nicht signifikant Hits.
    2. Öffnen Sie die TMHMM Server22 aus dem Zentrum für biologische Sequenz-Analyse auf das Vorhandensein von vermeintlichen transmembranen Regionen zu untersuchen.
Fügen Sie alle Proteinsequenzen gleichzeitig im Abfragefeld (oder alternativ eine Text-Datei, einschließlich alle Proteinsequenzen im FASTA-Format hochladen) und klicken Sie auf "Absenden", um die Analyse zu starten.
  • Analysieren Sie Proteine fehlen vorhergesagte transmembrane Domänen, nach TMHMM (Schritt 3.2.2), mit ProtScale Werkzeug, vermeintliche hydrophobe Regionen zu identifizieren. Öffnen Sie ProtScale Seite23. Fügen Sie jede Proteinsequenz im Abfragefeld ein und wählen Sie "Hphob. / Kyte & Doolittle "als Aminosäure-Skala. Klicken Sie auf "Absenden", um die Analyse zu starten.
  • (4) chromosomale Verteilung, Duplikationen und Exon-Intron-Organisation

    1. Ordnen Sie die ATL-Familienmitglieder auf den Chromosomen, die anhand der Informationen aus der Weinrebe Genom CRIBI Biotech Center Website24abgerufen werden.
      1. Durchsuchen Sie die PhenoGram Website Homepage25. Schreiben Sie "Input File" als tabulatorgetrennte Textdatei mit den Besonderheiten der Gene auf den Chromosomen nach der erschöpfenden Richtlinien und Beispiele über die Zusammenstellung der zur Verfügung gestellten Datei folgt man dem Weg zugeordnet werden "Phenogram" → " Dokumentation"→"Options"→"Input File".
      2. Der "Titel" des Werkes zu schreiben. Wählen Sie das Genom gezeichnet werden. Wählen Sie für Genome nicht implementiert in der Software, wie z. B. die Weinrebe Genom "Sonstiges" in der Drop-Down-Menü. Schreiben Sie die Genom-Datei nach den Richtlinien und Beispiele zur Verfügung gestellt, folgt man dem Weg "Phenogram" → "Dokumentation" → "Options" → "Genom" und laden Sie sie.
      3. Verwenden Sie Standard-Parameter "Phänotyp Abstand", "Phänotyp", "Bildformat", oder wählen Sie Alternativen in den jeweiligen Menüs, und klicken Sie auf "Plot", um die Visualisierung der Gene auf den Chromosomen zu erhalten.
    2. Definieren Sie den Stand der Vervielfältigung der Familienmitglieder mit der MCScanX Software26.
      1. Herunterladen Sie und entpacken Sie eine Kopie des MCscanX auf einem lokalen Computer ausführen Befehl Linien 1 (ergänzende Datei 1). Geben Sie den MCscanX-Ordner und erstellen Sie die erforderlichen Executables Befehlszeilen 2 (ergänzende Datei 1) ausgeführt.
        Hinweis: Installation von MCscanX ist bekannt, auf einigen Linux 64-Bit-Computern durch ein Problem im Zusammenhang mit der Funktion Chdir scheitern. Wenn eine Fehlermeldung im Zusammenhang mit dieser Funktion auf das Make zurückgegeben wird Befehlsausführung, die Befehlszeilen 3 (ergänzende Datei 1) ausgeführt werden soll und der Befehl "Make" sollte danach versucht werden.
      2. Download V. Vinifera -Proteine und die Anmerkungsdatei Befehlszeilen 4 (ergänzende Datei 1) ausgeführt.
        Hinweis: Die Weinrebe Annotation Datei muss entpackt werden und die einzelnen Chromosomen Informationen Katze in einer einzigen Datei durch Ausführen von Befehl Linien 5 (ergänzende Datei 1).
      3. Ausführen einer "alle gegen alle" Blastp mit V. Vinifera -Protein-Datei als die Abfrage und das Thema suchen.
      4. Erstellen Sie eine durchsuchbare Blast-Datenbank mithilfe der V. Vinifera Protein-Datei ausführen Befehl Linien 6 (ergänzende Datei 1). Führen Sie die Blastp-Suche mit dem V. Vinifera Proteine Datei als eine Abfrage gegen die Datenbank zuvor durch Ausführen von Befehlszeilen 7 (ergänzende Datei 1) erstellt.
      5. Konvertieren Sie die Annotation-Datei in ein geeignetes Format für MCScanX. Führen Sie Befehl Linien 8 (ergänzende Datei 1) benutzerdefinierte Perl Skript parseMSCanXgff.pl herunterladen. Führen Sie die Analyse Befehlszeilen 9 (ergänzende Datei 1) ausgeführt.
        Hinweis: Eine Datei vitis.gff wird generiert, die gen-Koordinaten im folgenden Format enthält:
        SP # gen Ausgangsposition Endposition
        wo "sp" ist ein zwei-Buchstaben-Code für die Spezies (Vv für Weinrebe), während "#" der Name des Gerüstes ist. Beachten Sie, dass die bereitgestellten benutzerdefinierten Perl-Skript für die meisten Konvertierung geeignet ist, obwohl einige Code-Änderungen in einigen spezifischen Fällen aufgrund der Vielfalt der Informationen in den verfügbaren Anmerkungsdatei erforderlich sein kann.
      6. Starten Sie MCScanX Befehl Linien 10 (ergänzende Datei 1) ausgeführt.
        Hinweis: Die "Vitis" ist das Präfix für die Anmerkung und die Explosion-Ausgabedatei. Dies ist eine zwingende Voraussetzung für die Ausführung der Software.
      7. MCScanX Ergebnisse zu analysieren. MCScanX erzeugt eine Textdatei "vitis.collinearity", die kollinearen Blöcke enthält. Eine solche Datei kann mit jedem Texteditor kontrolliert werden (siehe Beispiel Ausgabe 1 ergänzende Datei 1).
        Hinweis: Ein Verzeichnis "mcscaxOutput.html" wird generiert, die HTML-Dateien mit mehrere Ausrichtungen der kollinearen Blöcke gegen jedes Chromosom Verweis enthält. Diese Dateien können über einen Webbrowser eingesehen werden.
      8. Klassifizieren Sie paralogous Gene auf der Grundlage ihrer relativen Positionen in den Chromosomen Befehlszeilen 11 (ergänzende Datei 1) ausgeführt.
        Hinweis: Paralogous gen Klassifikation beschreibt Zusätzliche Tabelle II. Die generierte Ausgabedatei "vitis.gene_type" enthält alle Herkunftslandinformationen mit einem einfachen Registerkarte getrennt-Format.
      9. Analysieren der Bereicherung zu beurteilen, ob die Genfamilie hauptsächlich durch einen speziellen Mechanismus läuft Befehlszeilen 12 (ergänzende Datei 1) entstanden ist.
        Hinweis: Datei "vitis.gene_type" wird bei Schritt 4.2.8, generiert, während Datei "Gene_family_file" eine Textdatei zeilenweise darstellt, in der die Locus-Namen für alle die Gene, die aus der Familie der Name der Familie (z.B.ATL_genes) gefolgt getrennt durch einen Tabulator. Der angewandten statistischen Test für die Anreicherung ist ein exakter Test von Fisher und die p-Werte unterschiedlicher Herkunft sind in der Datei "outputFile.txt" gespeichert.
    3. Visualisieren der Exon-Intron-Organisation der Gene mit interaktiven Baum des Lebens (iTOL)27, ein Online-Tool für die Anzeige, Annotation und Verwaltung von Stammbäumen.
      1. Laden Sie einen phylogenetischen Stammbaum im Abschnitt "Upload" der Website iTOL. Der Baum ist nach Abschnitt 5 unten gebaut. Rufen Sie für jedes Familienmitglied gen gen Struktur Vorhersage von V1 Anmerkung des Genoms Weinrebe (CRIBI Webseite zitierten ab). Berechnen Sie die Länge (in bp) des vermeintlichen Exons und Introns unübersetzte Regionen (wo).
      2. Verwenden Sie das "Protein Domänen" Dataset zur grafischen Visualisierung der Exon-Intron-Muster.
    Schreiben einer Textdatei, einschließlich der berechneten Längen nach den Angaben nach den Pfad "Helfen" → "Hilfe-Seiten" → "Dataset-Typen" → "Protein-Domains" in der iTOL Webseite27. Mit "Protein Domänen" Dataset, repräsentieren das "Rechteck (RE)" und die "Rechteck Lücke (GP)" Formen das Exon und das wo.

    (5) phylogenetische Analyse und Nomenklatur

    1. Analysieren Sie die Beziehungen zwischen den ATL Familienmitglieder durch den Bau eines hochwertigen phylogenetischen Baumes und die Definition von Familie Nomenklatur.
      1. Folgen Sie für eine Weinrebe Genfamilie die Weinrebe Super Nomenklatur Ausschuss8festgelegten Regeln.
      2. Abrufen von A. Thaliana ATL-Sequenzen, die als Referenz für die Weinrebe gen Nomenklatur8, von der UniProt Datenbank28 erforderlich.
      3. Schreiben einer FASTA-Datei einschließlich aller Nukleotidsequenzen der Weinrebe und A. Thaliana gen Familienmitglieder in der phylogenetischen Analyse aufgenommen werden. Die Nukleotidsequenzen ermöglichen die maximale Variabilität innerhalb der Familie (im Vergleich zu Proteinsequenzen).
    2. Phylogenetischer Baum
      Hinweis: Die Verwendung der Phylogeny.fr- 29 -Pipeline ist empfehlenswert, eine qualitativ hochwertige phylogenetischen Stammbaum erhalten, jedoch nicht verpflichtend.
      1. Durchsuchen Sie die Phylogeny.fr Homepage29, und wählen Sie die "Phylogenie Analyse" Pipeline.
        Hinweis: "One Click" eignet sich in den meisten Fällen, aber wenn es nötig ist möglich, bestimmte erweiterte Einstellungen ("Advanced") oder sogar eine individuelle Analyse auszuwählen ("a la Carte"; siehe Schritt 5.2.5).
      2. Schreiben der "Name der Analyse", laden Sie die FASTA-Datei zuvor erstellte (Schritt 5.2.1, und klicken Sie auf "Absenden", um die Analyse zu starten.
      3. Alternativ, wenn das Verfahren beschrieben (Schritte 5.2.1, 5.2.2) führt zu einer Fehlermeldung schließen Sie jeden Schritt der Phylogenie Suite Pipeline einzeln, wie folgt.
        1. Der Muskel Software Homepage30Upload der FASTA-Datei in "Schritt 1", wählen Sie "Pearson/FASTA" als "Ausgabeformat" in "Schritt 2", und klicken Sie auf "Absenden" in "Schritt 3" Abfrage Sequenzen ausrichten.
        2. Klicken Sie auf "Ausrichtung Datei herunterladen" und speichern Sie als FASTA-Datei für weitere Schritte.
        3. Prozess der Ausrichtung FASTA-Datei, schlecht zu beseitigen ausgerichtet mit Gblocks Server Tool31Positionen. Die Ausrichtung FASTA-Datei hochladen, wählen Sie "DNA" als "Typ der Sequenz" und wählen Sie die Option(en) Stringenz, die am besten mit der Analyse (z.B.Weinrebe ATL gen Familie wählen Sie für alle drei Optionen für "weniger strenge Auswahl" vorgeschlagen, weil der hohe Sequenz Divergenz). Klicken Sie auf "Blöcke" führen Sie die Analyse.
        4. Klicken Sie auf "Resultierende Achse" am unteren Rand der Seite "Output" und speichern Sie die Ergebnisse als eine neue FASTA-Datei.
        5. Die Phylogeny.fr Homepage29wählen Sie "A La Carte" als "Phylogenie Analyse" Pipeline. Deaktivieren Sie "Multiple Alignment" und "Ausrichtung Kuration". Klicken Sie "Workflow erstellen", hochladen Sie Gblocks kuratiert FASTA (Schritt 5.2.5.4), wählen Sie "Replikationsverwaltungs Verfahren" mit Default-Parameter in "Einstellungen" und klicken Sie auf "Absenden", um die Analyse zu starten.
      4. Zusammenbruch schlecht unterstützt Zweige (d.h., bootstrap Werte < 70 %) durch Klicken auf "Collapse Zweige" im Abschnitt "Select and Action" und laden Sie die endgültigen Ergebnisse in Newick Format auf weitere Analysen.
    3. Weisen Sie einen gen-Namen anhand der Phylogenie.
      1. Überprüfen Sie den phylogenetischen Baum um die Zuverlässigkeit der Baumstruktur zu bewerten, hochladen, in die iTOL Suite zitierten (Abschnitt 4.3).
      2. Weisen Sie manuell einen gen Namen jedes Familienmitglied zu. Bei eins zu eins Orthologe zuweisen der Arabidopsis-wie der Name (z.B.AtATL3 → VviATL3). Weinrebe-Gene (zwei oder mehr) ableiten von einem einzigen Arabidopsis Homolog mit dem gleichen phylogenetischen Entfernung mit Zahlen oder Buchstaben mit einer Zahl endet das Arabidopsis-gen zu unterscheiden (z.B., AtATL23 → VviATL23a, VviATL23b).
      3. Bei 1: n oder n-Orthologe benennen neue gen bestehend aus Arabidopsis-wie Namen (in diesem Fall "ATL") gepaart mit eine Zahl höher als die höchste Zahl, die bereits für V. Vinifera und Arabidopsis genutzt (zB., VviATL83).
      4. Vervollständigen Sie die Nomenklatur der neu definierten Familie absteigend von oben nach unten von der phylogenetischen Stammbaum.

    (6) Grapevine Orgel und Bühne Expression Profiling

    1. Generieren Sie Daten Matrix enthaltende Ausdruck Arbeitsdaten für die Familienmitglieder.
      1. Laden Sie die V. Vinifera CV Corvina gen Ausdruck Atlas Datamatrix über den Link auf die ResearchGate Plattform32verteilt. Diese Datei enthält die RMA normalisiert Ausdruckswerte in folgenden Schritten verwendet werden.
      2. Die Atlas-Datamatrix Ausdruckswerte für jede Familie gen entziehen und schreiben ein "Working Datamatrix", enthält die gleiche Kopfzeile als Atlas Datamatrix. Speichern Sie die "Arbeitsgruppe Datamatrix" als tabulatorgetrennte Textdatei.
    2. Führen Sie die hierarchische Bi-Cluster-Analyse mit Multi-Experiment-Viewer (MeV) Software.
      1. Downloaden Sie und installieren Sie MeV Software33.
      2. "Arbeiten Datamatrix" hochladen (Schritt 6.1.2) folgt man dem Weg "Datei" → "Daten laden" → "Durchsuchen" und wählen Sie die Textdatei. Wählen Sie "einfarbige Array" und entfernen Sie das Häkchen von "Last Annotation", wenn eine automatische Annotation nicht vorgesehen ist. Wählen Sie den oberen linken Ausdruckswert der Ausdruck Tabelle Vorschau, und klicken Sie auf die Schaltfläche "Laden".
      3. Stellen Sie die Daten, die Anwendung von Log2 Umwandlung ("Daten anpassen" → "Log Transformationen" → "Log2 Transform") und Gene/Zeile Normalisierung ("Daten anpassen" → "Gen/Zeile Einstellungen" → "Median Center gen/Row"). Legen Sie den richtigen Maßstab Grenzwert ("Anzeigen" → "Set Farbe Skalierungsgrenzen").
      4. Berechnen Sie die hierarchische Clustering folgt man dem Weg "Analyse" → "Clustering" → "HCL".
    Wählen Sie "Optimieren gen Blatt Order" und "Optimieren Blatt Beispielauftrag" "Bestellung Optimierung Wiese", "Pearson Korrelation" in die "Ferne Matrix Auswahlfeld" und "Durchschnittliche Linkage clustering" im Feld "Verknüpfung Methode Selection". Klicken Sie auf "OK", um die Analyse zu starten.
  • Die Ergebnisse werden im Menü "Ergebnisse" → "HCL" auf der linken Seite des Fensters angezeigt. Exportieren Sie die Heatmap, indem Sie auf "Bild speichern" im Menü "Datei".
  • (7) Expression Profiling als Reaktion auf biotischen und abiotischen Stress

    1. Wiederholen Sie Schritt 6.1 mit der GSE Beitritt ID aus entsprechenden Publikationen und Studien zur Untersuchung von biotischen und abiotischen Stress auf Reben gewonnen. Beispielsweise können bietet das Transkriptom-Profil der Weinrebe Beeren infiziert mit dem pilzliche Erreger Botrytis Cinerea mit NimbleGen Traube Vollständiggenom Microarray Experimente mit GSE-ID des GSE52586 durchsucht werden. Wiederholen Sie 6.1.1 und 6.1.2.
    2. Suchen Sie das NCBI Reihenfolge liest Archiv34 mit der SRA/BioProject-ID (z.B.SRP055458 oder PRJNA275778 für "Weinrebe Blume Schattierung" Experimente) und herunterladen Sie aller damit verbundenen rohen Reihenfolge liest. RNA-Seq-Datasets aus vielen verschiedenen Studien werden mit eine einzelne Rohrleitung für Konsistenz verarbeitet.
      1. Kurz, trim roh Sequenz FASTQ liest (Einzel- und paar-Ende) und Qualität mit Trimmomatic35filtern. Verwenden Sie eine AVGQUAL und MINLEN jeweils von 20 bis 40, Filtern und alle Parameter standardmäßig.
      2. Index der 12 X Weinrebe Bezug Genom1 mit Bowtie236. Download der 12 X Weinrebe Bezug Genom (z.B. bowtie2-Build) vor dem bowtie2 Befehl ausführen.
      3. Erhalten Sie Zahlentabellen Matrix mit Htseq-Count37 mit der Weinrebe V1 gen Annotation (GFF/GTF) Modelldatei.
    3. Führen Sie differenzielle Genanalyse Ausdruck (Re-) in R38 mit Limma39 für RMA-normalisiert Matrizen und DESeq240 Bibliotheken für Matrix Zahlentabellen Schritte 7.1.1 und 7.2.1, bzw. eingeholt.
      1. Einen standard "zwei-Gruppe" Abgleich (d.h., "Behandlung" / "control"). Sicherstellen Sie, dass die Design-Matrix/Gruppierungen "kontrolliert" und "Behandlung" Bedingungen ordnungsgemäß angegeben sind.
        Hinweis: Ein typisches Design für Microarray differentielle Expressionsanalyse (GSE52586), EL-33 Beeren infiziert mit Botrytis Cinerea gegen Kontrolle (gesunden) Beeren im gleichen Entwicklungsstadium mit Limma Befehlszeilen ausführen zu vergleichen 13 zeigt zusätzliche Datei 1. Ergänzende Datei 1 zeigt ein typisches Design für RNA-Seq differentielle Expressionsanalyse (SRP055458 oder PRJNA275778), Blume (nach 7 Tagen nach GAP-Fall) unter Schatten Behandlung gegen die Kontrolle mit DESeq2 laufen Befehlszeilen 14 vergleichen .
      2. Erhalten Sie die Listen der differentiell exprimierten Genen (DEG) jedes dagegen für Limma, verwenden Sie die Funktionen lmFit(), gefolgt von eBayes(), und dann durch TopTable() Funktionen, während für DESeq2, verwenden Sie die DESeqDataSetFromMatrix(), DESeq()und results() Funktionen. Unter einem typischen Workflow einzuhalten.
        1. Microarray differentielle Expressionsanalyse finden Sie unter Befehlszeilen 15 (ergänzende Datei 1). RNA-Seq differentielle Expressionsanalyse finden Sie unter Befehl Linien 16 (ergänzende Datei 1). Wiederholen Sie die obigen Schritte für alle anderen Kontraste mit verschiedenen passenden Design-Schema (siehe Beispiele im Schritt 7.3.1)
    4. Aus den Listen der Grad erzeugt, extrahieren Sie alle Zeilen, die nicht entsprechen den ATL V1 Beitritt, Spalten, in denen die log2 Falten Änderung (Therapiekontrolle) behalten > | 0,5 | und p-Werte (FDR) < 0,05 und verschmelzen Sie entsprechend in eine Matrixtabelle, ob eine Studie fällt in "abiotische" oder "biotische/Erreger-Interaktion" Kompendien.
    5. Konstruieren Sie die hierarchische Cluster Heatmaps (abiotische und biotische Kompendien) in R mit den Bibliotheken Gplots.
      Hinweis: Aufruf der heatmap.2 Funktion der Heatmap zusammen mit Zeile Dendrogramme aus den jeweiligen Matrixtabellen erstellt. Zusätzliche Argumente mit Cellnote Funktion hilft, differentiell exprimierten zu unterscheiden (log2FC > 0,5, FDR < 0,05) ATL Gene in jedem Vergleich über eine Vielzahl von experimentellen Bedingungen durch ein * Symbol. Gelten Sie die typischen Workflow in R Befehlszeilen 17 (ergänzende Datei 1) ausgeführt oder alternativ, wiederholen Sie die Schritte 6.2.2 zu 6.2.5 die Heatmaps mit MeV Software zu konstruieren.

    8. Analyse der Beziehungen zwischen Paralogous Sequenz Divergenz und Co Genexpression

    1. Die Matrix mit paarweisen Ähnlichkeit zu konstruieren. Die Elemente der Ähnlichkeitsmatrix sind den Werten der Sequenzähnlichkeit aus paarweise Protein Achsen berechnet.
      1. Verwenden Sie EMBOSS Nadel Web Server41 mit Standardeinstellungen paarweisen Reihenfolge Ausrichtungen und als Textdatei speichern. Öffnen Sie die Ausgabe-Text-Datei zu und entfernen Sie alle Kommentarzeilen, zusammen mit Spalten- und Namen eine Datei namens "similarityTable.txt" zu erzeugen.
        Hinweis: Diese Tabelle verfügt über eine Zeile für jedes ATL-gen Berichterstattung die Ähnlichkeit Werte in jedem der paarweisen Achse berechnet. Die Reihenfolge der Loci in Zeilen und Spalten ist dasselbe, so dass eine symmetrische Matrix mit Bezug auf die Diagonale Werte erzeugt wird.
    2. Konstruieren Sie die Matrix mit Co-Daten durch die Berechnung der Pearson-Korrelationskoeffizient. Die folgende Prozedur erfordert R und die Perl-Modul PDL.
      1. Laden Sie die Ausdruckswerte für die 96 ATL-Gene Befehlszeilen 18 (ergänzende Datei 1) innerhalb eines Terminals ausgeführt. Führen Sie ein Co Expressionsanalyse mithilfe einer benutzerdefinierten Perl-Skripts, die heruntergeladen werden kann, indem Sie ausführen Befehl Zeilen 19 (ergänzende Datei 1 aus). Solches Skript berechnet der Pearson-Korrelationskoeffizient zwischen Paaren von ATL Loci wie bereits früher berichtet.
      2. Starten Sie das Skript ausführen Befehl Linien 20 (ergänzende Datei 1) und befolgen Sie die Ausgabe.
    Das Skript erzeugt eine Ausgabedatei (nämlich "coexpressionTable.txt"), enthält eine Co-Matrix mit den gleichen Locus Namen Ordnung der Matrix im Schritt 8.1 (diese Reihenfolge ist wichtig, den Mantel Testlauf, siehe unten) erhalten.
  • Führen Sie einen Mantel-Test zwischen der Daten-Matrizen in Schritten 8.1 und 8.2 erhalten. Nach dem Betreten der R-Umgebung (Befehl "R" in einem Terminal ausgeführt), laden Sie die ade4-Bibliothek mit dem folgenden Befehl: library(ade4)
    1. Führen Sie den Mantel-Test, indem Sie laden die beiden Daten-Matrizen und die Statistiken laufen Befehlszeilen 21 (ergänzende Datei 1), mit "Nrep", die Anzahl der Permutationen darstellt. Der Test besteht aus Berechnung der Korrelation zwischen den Elementen dieser Matrizen, Permutation Matrizen und dann berechnen die gleichen Teststatistik wieder.
      Anmerkung: Die erhaltenen Werte des statistischen Tests dienen eine Referenzverteilung des statistischen Tests zu bauen, die verwendet wird, um ein pberechnen-Wert, um Bedeutung zu testen. Die Anzahl der Permutationen definiert die Präzision, mit denen der p-Wert erzielt werden.
  • Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    Das VIT_05s0077g01970-gen, als am ähnlichsten A. Thaliana ATL2 (At3g16720) durch eine BLASTp Suche, diente als Sonde um die ATL Familienmitglieder in das Genom der Weinrebe Umfrage identifiziert (V. Vinifera cv Pinot Noir PN40024). Die PSI-BLAST-Analyse kamen nach ein paar Zyklen zeigt eine Liste der vermeintlichen Gene aus der Weinrebe ATL Genfamilie (Abbildung 1A). Das Vorhandensein der kanonischen RING-H2-Domäne für jeden Kandidaten wurde durch die visuelle Inspektion der Muskel Ausrichtung aller Einträge, die bei der Analyse (Abbildung 1 b) festgestellten bewertet. Nur diejenigen Gene, die mit richtig Abstand erhaltenen Aminosäuren sowie die zwei Histidin-Rückstände und Prolin Rückstände vor der dritten Cystein galten als ATLs nach der ursprünglichen Definition der ATL in Arabidopsis5. Insgesamt 96 Weinrebe Gene Anforderungen erfüllt und galten für die weitere Charakterisierung. Jedes Familienmitglied ATL wurde analysiert, um die Besonderheiten des Gens und das entsprechende codierte Protein, d. h., die Anwesenheit von anderen bekannten Domänen neben der RING-H2, transmembranen oder hydrophoben reichen Regionen, subzelluläre definieren Lokalisierung und vermeintliche Phosphorylierung Websites (Tabelle 1 und Tabelle 2).

    Figure 1
    Abbildung 1: PSI-BLAST-Umfrage und Ausrichtung der vermeintlichen Weinrebe ATLs. (A) Screenshot der Top-10 Hits des ersten PSI-BLAST Iteration Suche die Proteinsequenz VIT_05s0077g01970 als Köder zu verwenden. (B) Teil der Achse der 96 ausgewählte Weinrebe vermeintliche ATLs zeigt ihren RING-H2-Domäne und das entsprechende LOGO mit einer Suite der Molekularbiologie erzielt (siehe Tabelle der Materialien). Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42.Bitte klicken Sie hier, um eine größere Version dieser Figur.

    Name Gen ID Gen Länge (bp) Intron-Anzahl UniProt-ID Protein-Länge (aa) RING-H2-Motiv TM/H Domäne Anzahl Andere domains
    VviATL3 VIT_09s0002g00220 1245 0 F6HXK6 304 PxC 1
    VviATL4 [VviRHX1A] VIT_15s0021g00890 1827 3 D7SM36 203 PxC 0
    VviATL18 VIT_11s0118g00780 1113 2 F6HCI8 193 PC 0
    VviATL23a VIT_18s0001g01060 935 0 F6H0E4 51° PxC 0,5
    VviATL23b VIT_18s0001g01050 399 0 E0CQX3 132 PxC 1
    VviATL24 VIT_17s0000g06460 4466 4 D7SI89 217 PxC 1
    VviATL27 VIT_00s0264g00020 2554 4 D7T1R5 235 PxC 1
    VviATL43 VIT_11s0052g00530 1576 2 D7SQD9 457 PxC 3
    VviATL54a VIT_18s0001g06640 3221 1 F6H0Y5 405 PxC 1
    VviATL54b VIT_03s0017g00670 2774 1 F6HTI0 427 PxC 1
    VviATL55 [VviRING1] VIT_07s0191g00230 1844 0 F6HRP9 372 PxC 1
    VviATL63 VIT_06s0004g06930 804 0 D7SJU6 267 PxC 1
    VviATL65 VIT_03s0063g01890 2068 0 F6HQI8 396 PxC 1
    VviATL82 VIT_01s0026g02540 820 0 F6HPQ9 233 PC 0,5
    VviATL83 VIT_17s0000g08400 1887 0 F6GSQ4 143 PC 0
    VviATL84 VIT_06s0004g00120 1853 0 F6GUP5 368 PC 0,5 ZF-RING_3
    VviATL85 VIT_12s0034g01400 786 0 F6H965 261 PC 0,5
    VviATL86 VIT_12s0034g01390 1434 1 D7T016 451 PC 0,5
    VviATL87 VIT_18s0001g03270 1002 0 F6H0T2 333 PC 0,5 ZF-RING_3
    VviATL88 VIT_08s0040g00590 1320 0 F6HQR2 314 PC 0 ZF-RING_3

    Tabelle 1: erste 20 VviATL Gene und Sequenz-Eigenschaften der entsprechenden Proteine. TM: transmembranen; H: hydrophob; 0,5 zeigt das Vorhandensein von einem oder mehreren hydrophobe Regionen. Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42.

    Table 2
    Tabelle 2: Details über die ersten 20 VviATL gen Position im V. Vinifera Genom, Doppelarbeit Zustand und ATL Protein physikalisch-chemischen Eigenschaften und Lage. (ein) vorhergesagt Phosphorylierung Standplätzen von Musite; (b) ähnliche Vorhersagen mit mindestens zwei Software erzielt werden hervorgehoben Fett; NgLOC war mit Standardeinstellungen verwendet, während TargetP v1. 1 und Protein Prowler subzelluläre Lokalisation mit einem Cut-off der Wahrscheinlichkeit von 0,5 verwendet wurden. NUC, Kern; MIT Mitochondrien; CHL, Chloroplasten; PLA, Plasmamembran; S, sekretorischen Weg (Vorhandensein von ein Signalpeptid); M, Mitochondrien; C, Chloroplasten; O oder -, andere Orte; ND, nicht bestimmt (d.h. Wert unterhalb des Schwellenwerts). Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42. Bitte klicken Sie hier, um diese Datei herunterladen.

    Eine phylogenetische Analyse einschließlich die Nukleotidsequenzen der identifizierten Weinrebe ATL-Kodierung Gene zusammen mit den Sequenzen der Referenz A. Thaliana ATL-Genfamilie diente Weinrebe ATL Nomenklatur, nach den Richtlinien des die sNCGGa8. Sechsundneunzig und 83 Nukleotidsequenzen von V. Vinifera und A. Thaliana, wurden jeweils die Phylogeny.fr-Pipeline zu einem zuverlässigen phylogenetischen Baum unterzogen.Die letzten Sequenzen dienten später kommentieren und Weinrebe Gene auf der Grundlage von soliden Beziehungen (Abbildung 2) zu nennen. Nach diesem Ansatz erhielt 13 von 96 Weinrebe ATLs eine spezifische Kennung, unter Berücksichtigung ihrer persönlichen Orthopädie mit einem A. Thaliana ATL. Die Namen der anderen 83 Gene wurden basierend auf der phylogenetischen Baum mit einer progressiven Nummerierung von oben nach unten, ausgehend von einer ATL-gen Zahl höher als die höchste Nummer verwendet in A. Thalianazugewiesen.

    Figure 2
    Abbildung 2: Phylogenetischen Stammbaum V. Vinifera und A. Thaliana ATL E3 Ubiquitin Ligase-Kodierung Gene. Die unbewurzelte Baum entstanden mit der Phylogeny.fr-Suite (V. Vinifera (in grün) und die 83 ATL-Gene von A. Thaliana berichtet in der UniProt Datenbank (in gelb). Filiale Unterstützungswerte wurden von 100 bootstrap Wiederholungen erhalten. Die roten Sterne deuten auf das Vorhandensein einer BCA2-Zink-Finger (BZF)-Domäne in die entsprechenden Proteine. Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42. Bitte klicken Sie hier für eine größere Version dieser Figur.

    Zuordnung von ATL-Kodierung Gene zu Weinrebe Chromosomen zeigten eine weite Verbreitung im gesamten Genom, Vollständiggenom Vervielfältigung als wichtige evolutionäre Kraft in die Erweiterung der ATL-Genfamilie in Grapevine vorschlagen. In der Tat wurden 31 ATLs in homologen chromosomalen Regionen, die potenziell aus segmentalen oder ganze Genom Vervielfältigung Veranstaltungen gefunden. Darüber hinaus markiert die gleiche Analyse 13 tandemly duplizierten Genen, einem proximalen Duplikat und 51 verteilte Duplikate (Abbildung 3). In Anbetracht der sehr großen Anzahl von duplizierten Genen in der ATL-Familie haben wir einen Bereicherung-Test (Fishers exakter Test) um zu überprüfen, die bevorzugte Beibehaltung der duplizierten Gene im Genom Fraktionierung durchgeführt. Mit einem p-Wert < 0,001, dieser Test bestätigt die Hypothese, die ATL Gene vervielfältigt wurden nach dem Zufallsprinzip mehr als erwartet, was eine Rolle für die ATL-Genfamilie während Weinrebe Anpassung und Weiterentwicklung beibehalten.

    Figure 3
    Abbildung 3: Grapevine ATL-Kodierung gen Verteilung auf V. Vinifera Chromosomen und Doppelarbeit Zustand. Die 96 Weinrebe ATL Gene mit genauen chromosomalen Informationen in der Datenbank wurden 19 V. Vinifera Chromosomen zugeordnet. Die Farben zeigen das ursprüngliche Ereignis duplizieren. Vertikale schwarze Linien und rote Linien identifiziert Paare Tandem Duplikationen und ganze Genom Duplikationen, bzw. abgeleitet. Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42. Bitte klicken Sie hier für eine größere Version dieser Figur.

    Um die vermeintlichen biologischen Funktionen von ATLs in Grapevine weiter zu untersuchen, wurde eine Meta-Analyse auf die V. Vinifera CV Corvina globalen Genexpression Atlas12durchgeführt. Das Dataset enthält Vollständiggenom Ausdruckswerte 54 verschiedenen Weinrebe Organe und Entwicklungsstadien und wurde verwendet, um eine hierarchische Bi-Cluster-Analyse durchzuführen. Ergebnisse bestätigt nicht nur, dass alle 96 ATLs in mindestens eines der 54 Gewebe/Stadien ausgedrückt, aber auch darauf, das Vorhandensein von fünf wichtigsten Clustern von Expressionsprofile (Abb. 4A hingewiesen). Kurz, Cluster A und E zeigte gegenüber Verhalten, insbesondere das erste allgemeine Herabregulation von ATL-Genen in juvenile Proben, einschließlich Frühstadium Beere, junges Blatt, ranken, Blütenstand und die meisten der Knospe Etappen zeichnet sich durch. Auf der anderen Seite im gleichen Cluster A, Reife Proben wie Beeren heranreifen und nach der Ernte welken Bühnen, holzigen Gewebe und späten Stadien der Samen Entwicklung ATL Gene zeigte eine vorherrschende Hochregulation. Gene in Cluster C waren hauptsächlich herunterreguliert in den meisten Proben, während ATL Gene in Cluster D oft hochreguliert in späten Entwicklungsstadien Beere. Zu guter Letzt zeigte Cluster B nicht relevanten Abweichungen in der Expressionsprofile.

    Ein ähnlicher Ansatz wurde angewandt, um den Ausdruck der Weinrebe ATL Familienmitglieder als Reaktion auf biotische und abiotische betont, mit bestimmten Datasets, die für diesen Zweck gebaut zu studieren. Eine riesige Menge von Daten aus Microarray und RNA-Seq-Experimente sind Public-Access-Datenbanken wie Gene Expression Omnibus (GEO) und ArrayExpress ab. Einmal gesammelt und bequem normalisiert, wurde die Information für weitere Einblicke in die mögliche Funktion der ATLs Pflanze als Reaktion auf Stress ausgenutzt. Analyse der Expressionsprofile der Weinrebe ATLs als Reaktion auf biotische betont ergab, dass 62 von 96 Transkripte eine deutliche Modulation zeigte (log2 Falte-Wechsel (FC) > | 0,5 |) in mindestens zwei Bedingungen mit einer false Discovery Rate (FDR) < 0,05 () Abbildung 4 b). Die Zahl steigt auf 81 unter Berücksichtigung nur die FDR-Schwelle in eine einzelne Bedingung. Diese Ergebnisse schlug stark eine direkte Beteiligung von ATL-Genfamilie im Kampf gegen Krankheitserreger auch in Grapevine. Insbesondere eine Gruppe von 12 Gene (VviATL3-27-54b-55-90-97-123-144-148-149-156) wurden stark hochreguliert in Reaktion auf die meisten Krankheitserreger, einschließlich biotrophe und nekrotrophe Pilze und Pflanzenfresser, und somit verdienen Aufmerksamkeit für weitere funktionale Analysen.

    Figure 4
    Abbildung 4: hierarchische Clusteringof ATL-gen-Expression in Grapevine Atlas und in Grapevine biotische stressbedingte Dataset. (A) der Log umgewandelt Ausdruck, die Werte der Weinrebe ATL Gene in der Rebe Atlas12 für hierarchische Clusteranalyse basierend auf Pearsons Abstand Metrik verwendet wurden. Die Farbe Skala stellt höhere (rot) oder unten (grün) Ausdruck Ebenen mit Respekt für die mediane Transkript Fülle an jedes Gen über alle Proben. Buchstaben A bis E auf der rechten Seite zeigen die verschiedenen Cluster identifiziert.AB: nach dem Platzen; B: Platzen Sie; Bud-w: Winter Knospe; F: blühend; FB: Blüte beginnt; FS: Obst gesetzt; G: grün; MR: Mitte-Reifung; PFS: nach dem Fruchtansatz; PHWI-II-III: nach der Ernte welken 1, 2 und 3 Monaten; R: Reifung; S: seneszenten; Stamm-W: holzigen Stamm; V: Veraison; WD: gut entwickelt; Y: junge. (B) die Farbe Skala stellt erhöhte (rot) oder verringert (blau) Falte Änderungen der Weinrebe ATL Genexpression in infizierten Proben im Vergleich zu Kontrollen für jede Bedingung. Sternchen geben die signifikante differentielle Expression (FDR < 0,05) von jeder ATL unter den entsprechenden Bedingungen. Übernommen aus: Ariani Et Al. lizenziert unter einer Creative Commons Namensnennung 4.0 International License-42. Bitte klicken Sie hier für eine größere Version dieser Figur.

    Ergänzende Tabelle1: ATL Gene Kandidaten für das alternative Spleißen. (ein) ATL gen ID nach dem V1 Trauben gen Vorhersage und Annotation, (b) ATL gen ID nach der V2 Trauben gen Vorhersage und Anmerkung43, (c) Anzahl der vermeintlichen ATL Alternativen Spleißen Varianten, (d) Informationen über Codierung Sequenz jeder vermeintliche ATL-Variante. Bitte klicken Sie hier, um diese Datei herunterladen.

    Ergänzende Tabelle 2: Bitte klicken Sie hier, um diese Datei herunterladen.

    Ergänzende Datei 1: Bitte klicken Sie hier, um diese Datei herunterladen.

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    In der genomischen Ära wurden viele Genfamilien tief in mehreren Pflanzenarten charakterisiert. Diese Informationen sind Voraussetzung für funktionelle Studien und bieten einen Rahmen, um die Rolle der verschiedenen Mitglieder in einer Familie weiter zu untersuchen. In diesem Zusammenhang ist auch eine Notwendigkeit für eine Nomenklatur-System ermöglicht zur eindeutigen Identifizierung jedes Mitglied in einer Familie, Vermeidung von Redundanz und Verwirrungen, die entstehen können, wenn Namen von verschiedenen Forschergruppen unabhängig voneinander verschiedene Gene zugeordnet sind.

    Nach gründlich über alles der Weinrebe scientific Community Name Weinrebe Gene in einer Familie basierend auf Ähnlichkeiten mit Arabidopsis Genen vereinbart und eine Reihe von Regeln, die angewendet werden müssen, um neue Genfamilien Weinrebe zu beschreiben, im Grunde ausgehend von der phylogenetischen Vergleich von Nukleotidsequenzen zwischen Weinstock und Arabidopsis Familienmitglieder8. Daher können nur Gene, die bereits kommentiert und ordnungsgemäß in Arabidopsis genannt in der Weinrebe Nomenklatur verwendet werden. Das Verfahren für die Identifizierung der Weinrebe ATL Orthologe in Arabidopsis hier beschriebenen erfolgte daher ausschließlich auf um die Anforderung der Zuweisung der richtigen Weinrebe gen Familie Nomenklatur zu erfüllen. Dennoch könnte alternative Ansätze für andere Pflanzenarten eine Option sein. Zum Beispiel könnte Orthopädie abgeleitet werden, mit einem bidirektionalen BLAST Hits (BBH), wo werden Orthologe Gene in zwei Arten paarweise definiert, ähnlicher sind (d. h.mit Höchstnote Ausrichtung) miteinander als jedes andere gen in den anderen Art44. Allerdings könnte diese Methode viele Orthologe bei hohen Rate der Genduplikation, wie Pflanzen und Tiere45vermissen. BBH kann darüber hinaus bei ATL-Kodierung Gene, Gene fehlt die genaue ATL-Art RING-H2-Struktur (einschließlich des Prolin-Rückstands) abrufen oder Gene, die nicht kommentiert und ATLs in Arabidopsis genannt. Obwohl aus evolutionärer Perspektive diese Suche relevant sein könnten, würde der Abruf von Orthologe, die nicht beschriftet sind nicht erfüllt haben, den Umfang der Weinrebe ATL gen Familie Annotation und Nomenklatur und Orthologe, die nicht als ATLs beschriftet sind kann nicht Namen Weinrebe Familienmitgliedern verwendet werden. Eine andere Möglichkeit ist zu folgern Orthopädie basierend auf Aminosäure anstelle von Nukleotidsequenzen mit InParanoid46oder die neuesten Hieranoid 247, wenngleich solche Workflows von der wissenschaftlichen Gemeinschaft ausdrücklich nicht empfohlen werden.

    Ausdruck Meta-Analyse, die definiert werden können, als einen systematischen Ansatz zu studieren und kombinieren von verschiedenen öffentlich zugänglichen Dataset-Repositories von Daten ermöglicht, Hervorhebung der gemeinsamen und unterschiedlichen molekulare Mechanismen in einer Vielzahl von Bedingungen. So kann die Integration von gen-Ausdruck-Informationen aus mehrere groß angelegte transkriptomischen Experimenten die Charakterisierung einer Genfamilie verbessern, indem definieren die Expressionsprofile der Familienmitglieder über Experimente, minimiert die Auswirkungen der Experiment-spezifische Faktoren und eine stabilere Annahme der vermeintlichen Genfunktion in bestimmten Prozessen zu unterstützen. Die Verwendung von Microarray Daten erfordert jedoch die Integration von Daten erhalten mit verschiedenen Plattformen, unter Berücksichtigung ihrer eigenen Grenzen. Zum Beispiel in der Weinrebe Nimblegen Microarray Plattform, ein erheblicher Teil der Probesets für die entsprechenden Gene auf dem Array dargestellt (~ 13.000 Gene) haben möglicherweise Kreuz-Hybridisierung Fragen48. Im Fall der Weinrebe ATL Familie können 15 Gene solches Phänomen betroffen sein. Jedoch von Cramer Et Al. besprochen 48, konnte die Kreuz-Kennung des sehr ähnlichen gen Familienmitglieder von der gleichen Sonde bieten interessante Informationen über den Ausdruck, unter bestimmten Bedingungen, nicht nur von einem einzigen Gen, sondern von zwei und mehr Gene teilen hohe Sequenz Ähnlichkeiten, und damit potenziell sharing Ziele und Funktionen. Ein weiteres potenzielles Problem im Zusammenhang mit Microarray Datensätzen ist der Ausdruck Nachweisgrenze von Microarray Plattformen, die nicht sehr empfindlich sind. Beide lösen betrifft, d. h.., Kreuz-Hybridisierung und signal-Empfindlichkeit, eine mögliche Lösung bestünde darin, nur RNAseq Ausdruck Datasets zu betrachten. Jedoch kann der Meta-Analyse von RNAseq Daten von sehr großen Datenmengen aus vielen verschiedenen Studien sehr zeitintensive und erfordern viele computational Ressourcen und hohe Fachkompetenz.

    Obwohl der Ansatz hier Ziele auf Vollständigkeit vorgestellt, es ist sicherlich die weitere mit anderen Analysen ergänzt. Erstens, um weitere Einblicke in die molekulare Evolution und phylogenetischen Beziehungen innerhalb der Familie Gene in Pflanzen zu erreichen, die phylogenetische Analyse ließe sich Gebäude einen phylogenetischen Baum mit mehrere Sequence Alignments der Familienmitglieder aus mehreren Pflanzenarten. Es ist auch möglich, die evolutionäre Familie Gene, eine Schätzung der ihre gleichbedeutend und nicht gleichbedeutend Substitutionsraten im Laufe der Evolution, berechnen durch Bestimmung der Werte Ks (Anzahl der Synonyme Substitutionen pro gleichbedeutend Standort in einer bestimmten Zeitraum hinweg) und Ka (Anzahl der nonsynonymous pro nicht gleichbedeutend Standort im gleichen Zeitraum). Die Ka/Ks-Ratio wird verwendet, um die Mechanismen der gen Doppelarbeit Ereignisse nach der Abweichung von ihren Vorfahren ableiten. Ein Wert von Ka/Ks = 1 schlägt neutrale Auswahl, ein Ka/Ks-Wert von < 1 schlägt Reinigung Auswahl und ein Ka/Ks-Wert von > 1 schlägt Positivauswahl49. Darüber hinaus wenn gen-Struktur-Analyse die Anwesenheit von Introns zeigt, kann die gen-Familie-Charakterisierung für die Erkennung von Alternative splicing Varianten erweitert werden. In der Tat basieren auf einer tiefen Befragung von RNA-Seq-Daten aus verschiedenen Geweben, Stressbedingungen und Genotypen4321 (von 96) ATLs starke Kandidaten für alternatives Spleißen Veranstaltungen mit potenziellen Isoformen von 2 bis 16 für diese ATLs (siehe Zusätzliche Tabelle 1). Alternative Transkripte häufig produzieren Protein-Isoformen, die Aminosäure-Sequenzen variieren und diese Änderungen können die zellulären Eigenschaften der Proteine verändern und können dazu führen, dass Veränderungen von subtilen Modulation zum Verlust der Funktion des Genprodukts. Aus diesem Grund haben wichtige Pflanze Funktionen, einschließlich der Stressantwort, Krankheitsresistenz, Photosynthese und Blüte50,51alternative Spleißen Veranstaltungen beteiligt.Integration von ATL gen Veranstalter-Informationen, die vermeintliche Cisenthält-regulatorischen Elementen52 oder der Suche nach potenziell targeting ATLs-Moleküle (z.B., MicroRNA und lange nicht-kodierender RNA)53 ergänzt werden kann System-Einblicke in die komplexen molekularen Regulation und Interaktion der Weinrebe ATLs zu offenbaren.

    Zusammenfassend sind die Wahl der Analysen durchgeführt werden, sowie die Verfahren, die angewendet werden, um eine neue Genfamilie in einer Pflanzenart zu charakterisieren vor allem durch die wissenschaftliche Gemeinschaftsregeln sowie durch den Umfang der gen Familie Identifikation angetrieben. Es ist wichtig, im Hinterkopf behalten die mögliche spätere Untersuchung Schritte, die die Menge an Informationen nutzen werden, unter gen Entwicklung zwischen Pflanzenarten, Genom Strukturbeschreibung oder zuverlässigen Kandidaten zur Auswahl in funktionalen beinhaltet Studien.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Die Autoren haben nichts preisgeben.

    Acknowledgements

    Die Arbeit wurde von der Universität von Verona im Rahmen des gemeinsamen Projekts 2014 (Charakterisierung der ATL-Genfamilie im Weinstock und sein Engagement im Widerstand gegen Plasmopara Viticola) unterstützt.

    Materials

    Name Company Catalog Number Comments
    Personal computer
    Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME) http://meme-suite.org/
    Geneious Biomatters Limited http://www.geneious.com/
    ProtParam Tool http://web.expasy.org/protparam/
    ngLOC http://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
    Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsite http://musite.sourceforge.net/
    Pfam http://pfam.xfam.org/
    TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
    ProtScale http://web.expasy.org/protscale/
    Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
    PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanX http://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL) http://itol.embl.de/
    UniProt http://www.uniprot.org/
    Phylogeny.fr http://www.phylogeny.fr/index.cgi
    MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
    R https://www.r-project.org/
    EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    DOWNLOAD MATERIALS LIST

    References

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449, (7161), 463-467 (2007).
    2. Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. Science Publishers. 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6, (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10, (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62, (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6, (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7, (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3, (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92, (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31, (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24, (9), 3489-3505 (2012).
    13. BLAST. BLAST2.6.0. Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
    14. MEGA. MEGA7.0.25 build 7170412. Available from: http://www.megasoftware.net/ (2017).
    15. MEME. MEME Suite Version 4.11.4. Available from: http://meme-suite.org/ (2017).
    16. ProtParam. ExPASy Server. Available from: http://web.expasy.org/protparam/ (2005).
    17. ngLOC v1.0. Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
    18. TargetP v1.1 Server. Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
    19. Prowler v1.2. Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
    20. MuSite v1.0. Available from: http://musite.sourceforge.net/ (2010).
    21. Pfam. Pfam version 31.0. Available from: http://pfam.xfam.org/ (2016).
    22. TMHMM v2.0c. Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
    23. ExPASy. ProtScale. Available from: http://web.expasy.org/protscale/ (2005).
    24. CRIBI. Grape genome database. Available from: http://genomes.cribi.unipd.it/grape/ (2012).
    25. PhenoGram. Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
    26. ScanX v0.8. Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
    27. Interactive Tree Of Life (iTOL). Version3.5.3. Available from: http://itol.embl.de/ (2016).
    28. UniProt. Available from: http://www.uniprot.org/ (2016).
    29. Phylogeny.fr. Available from: http://www.phylogeny.fr/index.cgi (2008).
    30. MUSCLE. Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
    31. Gblocks Server. Version 0.91b. Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
    32. Vitis vinifera cv. Corvina gene expression Atlas. Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
    33. Multiple Experiment Viewer (MeV). Version 4.8.1. Available from: http://mev.tm4.org/ (2017).
    34. Sequence Read Archive (SRA). Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
    35. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30, (15), 2114-2120 (2014).
    36. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9, (4), 357-359 (2012).
    37. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31, (2), 166-169 (2015).
    38. R. Version 3.4.1. Available from: https://www.r-project.org/ (2017).
    39. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43, (7), e47 (2015).
    40. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, (12), 550 (2014).
    41. EMBL-EBI. EMBOSS Needle. Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
    42. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    43. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14, (1), 99 (2014).
    44. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96, (6), 2896-2901 (1999).
    45. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5, (10), 1800-1806 (2013).
    46. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314, (5), 1041-1052 (2001).
    47. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33, (8), (2017).
    48. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    49. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15, (9), 1292-1297 (2005).
    50. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20, (1), 45-58 (2010).
    51. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22, (12), 3142-3152 (2003).
    52. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24, (3), 311-326 (2017).
    53. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Comments

    0 Comments


      Post a Question / Comment / Request

      You must be signed in to post a comment. Please or create an account.

      Usage Statistics