Biology

Uitgebreide Workflow voor de genoom-brede identificatie en expressie Meta-analyse van de ATL E3 Ubiquitin Ligase Gene familie in Grapevine

Published: December 22, 2017 doi: 10.3791/56626

Pietro Ariani*¹, Elodie Vandelle*¹, Darren Wong², Alejandro Giorgetti¹, Andrea Porceddu³, Salvatore Camiolo³, Annalisa Polverari¹

¹Dipartimento di Biotecnologie, Università degli Studi di Verona, ²Ecology and Evolution, Research School of Biology, The Australian National University, ³Dipartimento di Agraria, SACEG, Università degli Studi di Sassari

* These authors contributed equally

Summary

Dit artikel beschrijft de procedure voor de identificatie en karakterisering van de familie van een gen in grapevine toegepast aan de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligases.

Abstract

Indeling en naamgeving van genen in een gezin kunnen aanzienlijk bijdragen aan de beschrijving van de diversiteit van gecodeerde eiwitten en de voorspelling van familiefeesten gebaseerd op verschillende functies, zoals de aanwezigheid van reeks motieven of van bepaalde sites voor de posttranslationele wijziging en het profiel van de expressie van familieleden in verschillende omstandigheden. Dit werk beschrijft een gedetailleerd protocol voor karakterisering van de familie van het gen. Hier wordt de procedure toegepast op de karakterisatie van de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligase in grapevine. De methoden omvatten de genoom-brede identificatie van familieleden, de karakterisatie van gene lokalisatie, structuur en duplicatie, de analyse van geconserveerde proteïne motieven, de voorspelling van eiwit lokalisatie en fosforylering sites, evenals gen expressie profilering over de familie in verschillende datasets. Dergelijke procedure, die kan worden verlengd tot verdere analyses afhankelijk van experimentele doeleinden, kan worden toegepast op elke gen familie in alle plantensoorten waarvoor genomic gegevens beschikbaar zijn, en biedt waardevolle informatie ter identificatie van interessante kandidaten voor functionele studies, geeft inzicht in de moleculaire mechanismen van plant aanpassing aan hun omgeving.

Introduction

Tijdens het laatste decennium, veel onderzoek verricht in grapevine genomica. Grapevine is een erkende economisch relevante gewas, die uitgegroeid een model voor onderzoek op fruit ontwikkeling en op de reacties van houtige gewassen op biotische en abiotische benadrukt tot is. In deze context, de vrijlating van de soort Vitis vinifera cv. PN40024 genoom in 2007¹ en de bijgewerkte versie in 2011² geleid tot een snelle ophoping van ' Omics '-schaal gegevens en tot een uitbarsting van high-throughput onderzoek. Op basis van de gepubliceerde reeks gegevens, de uitgebreide analyse van een bepaald gen familie (meestal opgebouwd uit eiwitten delen van geconserveerde motieven, structurele en/of functionele gelijkenissen en evolutionaire relaties), kan nu worden uitgevoerd om bloot te zijn moleculaire functies, evolutie en gen expressieprofielen. Deze analyses kunnen bijdragen aan inzicht hoe gen gezinnen fysiologische processen op het niveau van een genoom-brede te controleren.

Veel aspecten van de levenscyclus van de plant worden geregeld door ubiquitin-gemedieerde afbraak van belangrijke eiwitten, waarvoor een verfijnd omzet om regelmatige cellulaire processen. Belangrijke onderdelen van het proces van ubiquitin-gemedieerde afbraak zijn de E3 ubiquitin ligases, die belast zijn met systeem flexibiliteit, dankzij de aanwerving van specifieke doelstellingen³. Dienovereenkomstig, vertegenwoordigen deze enzymen een enorme gen-familie, met ongeveer 1.400 E3 ligase-encoding genen voorspeld in Arabidopsis thaliana genoom⁴, elke E3 ubiquitin ligase handelt voor de ubiquitination van specifieke doel eiwitten. Ondanks het belang van substraat-specifieke ubiquitination in cellulaire verordening in planten, is weinig bekend over hoe het traject ubiquitination is gereguleerd en doel eiwitten zijn geïdentificeerd alleen in een paar gevallen. De ontcijfering van dergelijke mechanismen specificiteit en de verordening berust eerst op de identificatie en karakterisering van de verschillende onderdelen van het systeem, met name de E3 ligases. Onder ubiquitin ligases, wordt de ATL onderfamilie gekenmerkt door 91 leden geïdentificeerd in A. thaliana weergeven van een RING-H2 vinger domein⁵^,⁶, sommigen van hen spelen een rol in de verdediging en hormoon reacties⁷.

De eerste cruciale stap om de leden van een nieuwe gen-familie te definiëren is de nauwkeurige definitie van de familie functies, zoals consensus motieven, sleutelgebieden en eiwit sequentie kenmerken. Inderdaad, het betrouwbare ophalen van alle gene familieleden op basis van BLAST analyse vereist enkele verplichte reeks kenmerken, in bepaalde eiwitten domeinen verantwoordelijk voor eiwit functie/activiteit, proteïne handtekening bijeenkomen. Dit kan worden vergemakkelijkt door eerdere karakterisering van hetzelfde gen gezin bij andere plantensoorten of bereikt door het analyseren van verschillende genen vermoedelijk die behoren tot dezelfde familie in verschillende plantensoorten, te isoleren van gemeenschappelijke sequenties. De familieleden kunnen vervolgens worden afzonderlijk genoemd volgens gemeenschappelijke regels geregeld door internationale consortia voor een bepaalde plantensoorten. In grapevine, bijvoorbeeld is zo'n procedure onderworpen aan de aanbevelingen van het Comité van de Super nomenclatuur voor druivenmost Gene aantekening (sNCGGa), tot oprichting van de bouw van een fylogenetische boom waaronder V. vinifera en A. thaliana familieleden van het gen dat gene annotatie gebaseerd op nucleotide sequences⁸.

Chromosoom lokalisatie van familieleden en gene dubbel enquête kunnen markeren van de aanwezigheid van geheel-genoom- of tandem gedupliceerde genen. Deze informatie verschijnt nuttig te ontrafelen van vermeende gene functies, aangezien het kan weergeven van functionele redundantie of verschillende situaties, dat wil zeggen, niet-functionalization, neo-functionalization of sub functionalization^{9 onthullen}. Beide neo - en sub - functionalization zijn belangrijke gebeurtenissen die genetische nieuwheid, plant aanpassing aan veranderende omgevingen¹⁰te voorzien in de nieuwe cellulaire componenten maken. In het bijzonder, doublures van voorouderlijke genen en productie van nieuwe genen waren zeer frequent gedurende de evolutie van het genoom van de grapevine en nieuw gevormde genen afkomstig van proximale en tandem doublures in grapevine waren meer kans op produceren nieuw functies¹¹.

Een andere belangrijke factor in het ontcijferen van de familie genfuncties is het profiel van de transcriptomic. De beschikbaarheid van openbare databanken die toegang geven tot een enorme hoeveelheid gegevens van de transcriptomic kan aldus worden benut om de vermeende functies toewijzen aan gene familieleden met behulp van grootschalige in silico expressie analyses. Inderdaad, de eigenaardige expressie van bepaalde genen in specifieke plant organen of in antwoord op bepaalde benadrukt kan geven enkele tips met betrekking tot de vermeende rol van de overeenkomstige eiwitten in welbepaalde omstandigheden, en steun geven aan hypothesen over mogelijke sub functionalization van gedupliceerde genen om verschillende uitdagingen aan. Voor dat doel, is het belangrijk om te overwegen verschillende datasets: dit kan reeds beschikbare gen expressie matrices, zoals de genoom-brede transcriptomic atlas van grapevine organen en ontwikkelingsstadia¹², of ad hoc door kan worden gebouwd het ophalen van transcriptomic datasets voor de bijzondere plantensoorten onderworpen aan gedefinieerde benadrukt. Bovendien, een eenvoudige benadering met behulp van twee matrices, een met paarsgewijze gelijkenis gegevens en de andere met paarsgewijze co expressie coëfficiënten kunnen worden toegepast om te evalueren van de relaties tussen reeks gelijkenis en expressie patronen binnen de familie van een gen.

Het doel van dit werk is bedoeld als een globale aanpak, gene structuur, Geconserveerde proteïne motieven chromosomale locatie, gene duplicaties en expressiepatronen, als ook de voorspelling van eiwit lokalisatie en fosforylering sites, om te bereiken definiëren een uitputtende karakterisatie van de familie van een gen in planten. Een dergelijke aanpak is hier toegepast op de karakterisatie van de ATL E3 ubiquitin ligase familie in grapevine. Volgens de nieuwe rol van ATL onderfamilie leden bij het reguleren van de belangrijke cellulaire processen⁷, dit werk kan ook helpen de identificatie van sterke kandidaten voor functionele studies, en uiteindelijk het ontrafelen van de moleculaire mechanismen inzake de aanpassing van dit belangrijk gewas aan zijn omgeving.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. identificatie van vermeende ATL Gene familie lid/leden

PSI-BLAST webversie
1. Open de webpagina BLAST¹³ en klik op de eiwit BLAST sectie.
2. Voer in het veld "Enter Query sequence" de volgorde van de aminozuur van het eiwit (hier VIT_05s0077g01970) die worden gebruikt als de sonde voor het identificeren van de andere gezinsleden.
  Opmerking: Een goede vertegenwoordiger eiwit moet worden gebruikt (een eiwit worden getoond alle belangrijke functies die kenmerkend zijn voor de familie).
3. Selecteer in het veld "Kies Zoek set", de "Verwijst naar eiwit" database (refseq_protein) en het organisme van belang (V. vinifera - taxid:29760).
4. In het veld "programma selectie", selecteer PSI-BLAST-algoritme en klik op de knop BLAST voor het uitvoeren van de analyse.
  Opmerking: Door te klikken op de "algoritme parameters" is het mogelijk om te passen sommige geavanceerde parameters (Max doel sequenties, Scoring matrix, PSI-BLAST drempel, enz.).
5. De eerste BLAST ronde haalt alle sequenties die relevante wedstrijden met de query weergeven (e-waarde boven de geselecteerde drempel - standaard 0.005; 0,001 in dit experiment). Deselecteer alle posten, die duidelijk niet behoren tot de familie onderzochte door te klikken op het vinkje in de kolom "uitgezocht voor PSI-BLAST" en de tweede iteratie van de PSI-BLAST uitvoeren door te klikken op de knop BLAST zoals in stap 1.1.4.
6. Nieuw geïdentificeerde sequenties worden benadrukt in geel. Unselect de duidelijk verkeerde opgehaalde hits en iteraties zoals beschreven in stap 1.1.5 verder te ontdekken.
7. Iteraties voortzetten totdat het algoritme niet elke relevante post vindt of het bereikt convergentie (geen nieuwe items zijn gevonden). Download de lijst van vermeende gene familieleden voor verdere analyses. Inspecteer visueel of de opgehaalde hits in elke iteratie de aanwezigheid van valse positieven te voorkomen.
PSI-BLAST standalone versie
1. De zelfstandige versie van BLAST downloaden door te klikken op de knop "download BLAST" op de home pagina BLAST¹³.
  Opmerking: De standalone BLAST software is een command line versie van de web-interface die voordien beschreef. Hierdoor is de PSI-BLAST zoekopdracht tegen een aangepaste lokale of externe database wordt uitgevoerd. Bovendien maakt het zoeken met een vooraf gedefinieerde positie specifieke Score Matrix (PSSM).

2. Handmatige inspectie van de PSI-BLAST-geïdentificeerd familieleden

Meerdere uitlijning
1. Verzamel de amino zuur sequenties die eerder geïdentificeerd in een bestand FASTA-indeling en upload het naar de MEGA software¹⁴ om door te gaan met de meerdere uitlijning.
2. De MEGA software niet openen, klik op de knop "Align", klik op "Edit/Build uitlijning", klik op "Maak een nieuwe uitlijning", "Protein".
3. Klik op 'Bewerken' in het menu van de uitlijning en de "Reeks van bestand invoegen". Blader naar het bestand van de FASTA gemaakt vóór en bevestigen het uploaden van alle ondervraagde sequenties.
4. Klik op "Uitlijning" in het menu van de uitlijning en de "Uitlijnen door spier". Gebruiken van standaardparameters, klikt u op "Berekenen" knop en wacht op de voltooiing van de meerdere uitlijning.
5. Inspecteer visueel of de meerdere uitlijning om uit te sluiten onjuist voorspelde familieleden. Het canonieke CxxC (13 x) PxCxHxxHxxCxxxW (7 x) CxxCW motief, (met name de aanwezigheid van het residu van de proline vóór het derde cysteïne), is het belangrijkste kenmerk zal moeten vaststellen van de ATL-gezinsleden.
Analyse van specifieke LOGO
1. De definitieve lijst van leden van de familie (96 grapevine sequenties voldoen aan de eisen te worden beschouwd als ATL) bij de meerdere Em voor Motif verdieping (MEME)¹⁵ te definiëren van geconserveerde motieven over de familie indienen.
2. De MEME home page, klikt u op de "MEME" knop en vul het "gegevens indiening formulier" met specifieke informatie met betrekking tot de familie van belang.
3. MEME-analyse gebruiken voor het bevestigen van de aanwezigheid van de twee verwachte motieven binnen de grapevine ATL familieleden, dat wil zeggen, de RING-H2 en de GLD-motieven.
U kunt ook stappen 2.1 en 2.2 gelijktijdig met behulp van de bio-informatica softwaresuite (Zie Tabel van materialen).
1. FASTA bestand uploaden (zie stap 2.1.1) in de suite. Selecteer "File" uit het menu, dan "Import" en klik op "bestand". Blader het FASTA-bestand en klik op "Open".
2. Selecteer alle de geïmporteerde sequenties in de lijst en klik op "Uitlijnen/Assemble" knop in de werkbalk, klik "Paarsgewijs meerdere uitlijning". Selecteer "Spier uitlijning" en klik "OK" om te starten de uitlijning met behulp van de standaardparameters.
3. Om te visualiseren het LOGO van de uitlijning, klik op "Grafieken" → "opties" en kies "Reeks Logo".

3. analyse van eiwit fysieke Parameters en domeinen

Zoals de definitie van de verschillende fysieke parameters van de ondervraagde familieleden belangrijk is om een uitgebreide beschrijving van de familie voorleggen van de lijst van leden van de familie aan specifieke webtools.
1. Gebruik het hulpprogramma ProtParam¹⁶ op de website van de Expasy met de standaardparameters voor elektrisch punt (pI) en molecuulgewicht (kDa).
2. Voor eiwit subcellular localisatie, verschillende hulpprogramma's te gebruiken voor het verkrijgen van een meer betrouwbare voorspelling zoals ngLOC v1.0¹⁷ met de standaardinstellingen, targetP v1.1¹⁸ met standaardinstellingen en eiwit prowler subcellular localisatie v1.2¹⁹met een licht-donkerscheiding van kans van 0,5. Voor fosforylatie sites, de MUsite v1.0 web tool²⁰ met standaardparameters te gebruiken.
Extra eiwit domeinen in familieleden onderzoeken.
1. Open de Pfam database webpagina²¹, selecteer "Reeks zoeken" gereedschap proteïne sequenties in het vak query indienen en klik op "Go" uitvoeren van de analyse.
  Opmerking: Elke eiwit sequentie wordt afzonderlijk geanalyseerd. Een e-waarde van 1.0 in de standaardinstelling maakt onderscheid tussen belangrijke en niet-significante hits.
2. Open de TMHMM Server²² van het Center for biologische sequentieanalyse om de aanwezigheid van vermeende transmembraan regio's te onderzoeken.

Plak alle proteïne sequenties gelijktijdig in het query-vak (of ook het uploaden van een tekstbestand met inbegrip van alle proteïne sequenties in FASTA formaat) en klik op "Verzenden" als u wilt uitvoeren van de analyse.

Analyseren van eiwitten ontbreekt van voorspelde transmembraan domeinen, volgens TMHMM (stap 3.2.2), met ProtScale gereedschap te identificeren van vermeende hydrofobe regio's. Open ProtScale webpagina²³. Elke eiwit sequentie in het vak query plakken en selecteer "Hphob. / Kyte & Doolittle "als aminozuur schaal. Klik op "Verzenden" als u wilt uitvoeren van de analyse.

4. chromosomale distributie, duplicaties en Exon-intron organisatie

Kaart van de ATL familieleden op de chromosomen op basis van de informatie ontvangen van de Grapevine genoom CRIBI Biotech Center website²⁴.
1. De PhenoGram website homepage²⁵bladeren. Schrijf de "Input File" als een door tabs gescheiden tekstbestand met de specifieke kenmerken van de genen worden toegewezen op de chromosomen, volgens de uitputtende richtlijnen en voorbeelden met betrekking tot de opstelling van het verstrekte bestand na het pad "Phenogram" → " Documentatie"→"Opties"→"Input bestand".
2. Schrijf de "titel" van het werk. Selecteer het genoom worden getrokken. Voor genomen niet ten uitvoer gelegd in de software, zoals het genoom van de wijnstok, selecteert u "andere" in het drop-down menu. Schrijven van het genoom bestand volgens de richtlijnen en voorbeelden verstrekt, na het pad "Phenogram" → "Documentatie" → "Opties" → "Genoom", en uploaden.
3. Standaardparameters "Fenotype afstand", of "Fenotype kleur", "Image format", selecteer alternatieven in de respectieve menu's, en klik op "Plot" te verkrijgen van de visualisatie van de genen op de chromosomen.
Het definiëren van de staat van de overlapping van de familieleden die met behulp van de MCScanX software²⁶.
1. Download en Decomprimeer een kopie van MCscanX op een lokale computer uitgevoerd opdrachtregels 1 (aanvullende bestand 1). Voer de map MCscanX en de vereiste uitvoerbare bestanden uitvoeren van opdrachtregels 2 (aanvullende bestand 1) maken.
  Opmerking: Installatie van MCscanX is te mislukken op sommige machines Linux 64 bits vanwege een probleem met betrekking tot de functie chdir bekend. Als een foutbericht wordt geretourneerd aan deze functie op het merk gerelateerde uitvoeren van de opdrachten, de opdrachtregels 3 (aanvullende bestand 1) moet worden uitgevoerd en daarna de opdracht "make" moet worden geprobeerd.
2. Download de eiwitten V. vinifera en het bestand van de aantekening met opdrachtregels 4 (aanvullende bestand 1).
  Opmerking: De grapevine aantekening bestand moet uitgepakt en de kat informatie één chromosomen in een uniek bestand door het uitvoeren van de opdracht lijnen 5 (aanvullende bestand 1).
3. Run een "all versus alle" blastp zoeken met behulp van het bestand V. vinifera eiwit als zowel de query en het onderwerp.
4. Maak een doorzoekbare blast-database met behulp van de V. vinifera eiwit bestand dat wordt uitgevoerd opdrachtregels 6 (aanvullende bestand 1). De blastp-zoekactie met behulp van de eiwitten V. vinifera bestand als een query wordt uitgevoerd tegen de database eerder gemaakt door opdrachtregels 7 (aanvullende bestand 1) uit te voeren.
5. Converteer het bestand van de aantekening in een geschikt formaat voor MCScanX. Opdrachtregels 8 (aanvullende bestand 1) voor het downloaden van de aangepaste perl script parseMSCanXgff.pl uitvoeren De analyses uitgevoerd opdrachtregels 9 (aanvullende bestand 1) uit te voeren.
  Opmerking: De vitis.gff van een bestand wordt gegenereerd die in het bezit van gene coördinaten in de volgende notatie:
  SP # gene uitgangspositie eindpositie
  waar "sp" is een tweeletterige code voor de soorten (Vv voor wijnstok) terwijl "#" de naam van de steiger is. Merk op dat de meegeleverde aangepaste perlmanuscript geschikt voor de meeste conversion, is hoewel sommige code wijziging in sommige specifieke gevallen als gevolg van de diversiteit van de informatie in het bestand beschikbaar aantekening kan worden geëist.
6. Lancering MCScanX met opdrachtregels 10 (aanvullende bestand 1).
  Opmerking: De "vitis" is het voorvoegsel van de aantekening én het uitvoerbestand blast. Dit is een verplichte eis voor de software uit te voeren.
7. MCScanX resultaten analyseren. MCScanX produceert een tekstbestand "vitis.collinearity", waarin collineaire blokken. Zo'n bestand kan worden geïnspecteerd door een willekeurige teksteditor (zie voorbeeld output 1 aanvullende bestand 1).
  Opmerking: Een "mcscaxOutput.html"-map wordt gegenereerd dat HTML-bestanden met meerdere uitlijning van collineaire blokken tegen elke verwijzing chromosoom bevat. Deze bestanden kunnen worden gecontroleerd via een webbrowser.
8. Classificeren paralogous genen op basis van hun relatieve positie in chromosomen met opdrachtregels 11 (aanvullende bestand 1).
  Opmerking: Paralogous gene classificatie wordt beschreven in de Aanvullende tabel II. De gegenereerde output bestand "vitis.gene_type" bevat alle oorsprong informatie met een eenvoudige door tabs gescheiden indeling.
9. Verrijking analyses om te evalueren of de gene familie prevalently afkomstig is van een specifiek mechanisme met opdrachtregels 12 (aanvullende bestand 1) uit te voeren.
  Opmerking: "Vitis.gene_type" bestand wordt gegenereerd bij stap 4.2.8, overwegende dat bestand "gene_family_file" een bestand van één regel tekst waarin de naam van de familie (bvATL_genes vertegenwoordigt) wordt gevolgd door de namen van de locus voor de alle de genen die behoren tot de familie gescheiden door een tab. De toegepaste statistische test voor verrijking is een Fisher exact test en de p-waarden van verschillende oorsprong worden opgeslagen in het bestand "outputFile.txt".
Visualiseer de exon-intron-organisatie van de genen die met behulp van interactieve Tree Of Life (iTOL)²⁷, een on-line tool voor het beeldscherm, aantekening en beheer van fylogenetische bomen.
1. Upload een fylogenetische boom in de "Upload" sectie van de website iTOL. De boom is gebouwd volgens sectie 5 hieronder. Ophalen voor elk familielid gen, gene structuur voorspelling van de V1-annotatie van het genoom van de grapevine (CRIBI website hierboven aangehaald). Bereken de lengte (in bp) van vermeende exons en introns onvertaalde regio's (UTRs).
2. Gebruik de dataset "Eiwit domeinen" voor grafische visualisatie van de exon-intron patroon.

Het schrijven van een platte tekstbestand met inbegrip van berekende lengtes volgens de specificaties na het pad "Help" → "Helppagina's" → "Dataset typen" → "Eiwit domeinen" in de iTOL website²⁷. Met 'Eiwit domeinen' dataset, vertegenwoordigen de "rechthoek (RE)" en de "rechthoek kloof (GP)" shapes de exon en de UTRs, respectievelijk.

5. de fylogenetische analyse en nomenclatuur

Het analyseren van de relatie tussen ATL familieleden door middel van de bouw van een hoge kwaliteit fylogenetische boom en de definitie van een familie nomenclatuur.
1. Volg de regels die door de Grapevine Super nomenclatuurcomité⁸voor een wijnstok gen-familie.
2. A. thaliana ATL sequenties, nodig als referentie voor de grapevine gene nomenclatuur⁸, van de UniProt database²⁸ ophalen.
3. Schrijf een FASTA bestand met inbegrip van alle nucleotidesequenties van grapevine en A. thaliana gene familieleden in de fylogenetische analyse moeten worden opgenomen. De nucleotidesequenties toestaan het maximum van variabiliteit tussen familieleden (ten opzichte van proteïne sequenties).
Fylogenetische boom
Opmerking: Het gebruik van de Phylogeny.fr ²⁹ pijpleiding is aanbevolen om de fylogenetische boom van een hoge kwaliteit, maar niet verplicht.
1. De Phylogeny.fr homepage²⁹bladeren en selecteer de pijpleiding "Fylogenie analyse".
  Opmerking: "Een klik" leent zich in de meeste gevallen, maar als het nodig is het mogelijk om specifieke geavanceerde instellingen ("Geavanceerd") of zelfs een volledig op maat gemaakte analyse te selecteren ("a la Carte"; Zie stap 5.2.5).
2. Schrijf de "naam van de analyse", upload het FASTA bestand gemaakt eerder (stap 5.2.1, en klik op "Verzenden" om uit te voeren van de analyse.
3. Als alternatief, als de procedure zoals hierboven (stappen 5.2.1, 5.2.2 beschreven) resulteert in een foutbericht, uitvoering van elke stap van de fylogenie suite pijpleiding individueel, als volgt.
  1. De spier software homepage³⁰, upload het bestand FASTA in "Stap 1", selecteer "Pearson/FASTA" als "Output formaat" in "Stap 2", en klik op 'Verzenden' in 'Stap 3' query sequenties worden uitgelijnd.
  2. Klik op "Download uitlijning bestand" en opslaan als FASTA bestand voor verdere stappen.
  3. Proces het bestand FASTA uitlijning te elimineren slecht uitgelijnd posities met behulp van de Gblocks Server gereedschap³¹. De uitlijning FASTA bestand uploaden, selecteer "DNA" als "Type van sequentie" en koos voor de optie meetcategorie die best bij de analyse (bijvoorbeeldvoor wijnstok ATL gene familie Selecteer alle drie opties voorgesteld voor "minder strenge selectie" past, omdat van hoge sequentie divergentie). Klik op "Get blokken" aan de analyse worden uitgevoerd.
  4. Klik op "Resulting uitlijning" aan de onderkant van de pagina van de uitvoer en de resultaten opslaan als een nieuw bestand FASTA.
  5. Vanuit de Phylogeny.fr homepage²⁹, kiest u "A la Carte" als "Fylogenie analyse" pijpleiding. Schakelt u "Meerdere uitlijning" en "Uitlijning curatie". Klik op "Create workflow", upload het bestand Gblocks-curator FASTA (stap 5.2.5.4), selecteer "Bootstrapping procedure" met standaardparameters in "Instellingen" en klik op "Verzenden" als u wilt uitvoeren van de analyse.
4. Takken van de ineenstorting slecht ondersteund (dat wil zeggen, bootstrap waarden < 70%) door te klikken op "Takken samenvouwen" in de sectie 'Selecteren en actie' en download de eindresultaten in de Newick indeling naar verdere analyses.
De naam van een gen op basis van de fylogenie toewijzen.
1. Bekijk de fylogenetische boom om te evalueren van de betrouwbaarheid van de boomstructuur door het te uploaden in de iTOL suite aangehaald (paragraaf 4.3).
2. Handmatig een gen naam toewijzen aan elk gezinslid. In het geval van individuele orthologues, het toewijzen van de Arabidopsis-zoals naam (bvAtATL3 → VviATL3). Differentiëren grapevine genen (twee of meer) die voortvloeien uit een enkele Arabidopsis -homolog met de dezelfde fylogenetische afstand met behulp van cijfers, of letters als het gen Arabidopsis met een nummer eindigt (bijvoorbeeld, AtATL23 → VviATL23a, VviATL23b).
3. In het geval van één-op-veel of veel-op-veel-orthologues, het toewijzen van een nieuwe gen naam samengesteld uit de Arabidopsis-zoals naam (hier "ATL") gecombineerd met een nummer hoger dan het hoogste nummer dat al gebruikt voor zowel V. vinifera en Arabidopsis (bv., VviATL83).
4. De nomenclatuur voor de nieuw gedefinieerde familie afdalend vanaf de top naar de onderkant van de fylogenetische boom te voltooien.

6. grapevine orgel en fase expressie profilering

De werken gegevens matrix met expressie gegevens genereren voor de familie leden.
1. Download de V. vinifera cv. Corvina gene expression Atlas datamatrix van de link verdeeld over het ResearchGate platform³². Dit bestand bevat de RMA genormaliseerd expressie waarden worden gebruikt stappen te volgen.
2. De waarden van de expressie voor elk familie gen halen uit de Atlas datamatrix en schrijven van een "werkende datamatrix" met de zelfde rij met kolomkoppen als de Atlas datamatrix. De "werkende datamatrix" als een door tabs gescheiden tekstbestand opslaan.
De hiërarchische bi-geclusterde analyses met behulp van Multi Experiment Viewer (MeV)-software uit te voeren.
1. Download en installeer MeV software³³.
2. Uploaden van de "werkende datamatrix" (stap 6.1.2) na het pad "Bestand" → "Load Data" → "Bladeren" en selecteer het tekstbestand. Selecteer "eenkleurige Array" en verwijder het vinkje uit "Load aantekening" wanneer een automatische aantekening is niet geleverd. Selecteer de waarde van de expressie van de linkerbovenhoek van de expressie tabel preview en klik op de "Laad" knop.
3. Pas de gegevens Log2 transformatie ("Gegevens aanpassen" → "Log transformaties" → "Log2 Transform") en Gene/rij normalisatie ("Gegevens aanpassen" → "Gene/rij aanpassingen" → "mediaan Center gen/rij") toe te passen. Stel de juiste schaal limiet ("Display" → "instellen kleur schaal grenzen").
4. Bereken de hiërarchische Clustering na het pad "Analyse" → "Clustering" → "HCL".

Selecteer "optimaliseren Gene blad" en "Optimaliseren monster blad orde" in "Bestellen optimalisatie veld", "Pearson correlatie" in het veld "Afstand Matrix Selection" en "Gemiddelde koppeling clustering" in het veld 'Linkage methode Selection'. Klik vervolgens op "OK" als u wilt uitvoeren van de analyse.

De resultaten bekijken in het menu "Resultaten van de analyse" → "HCL" op het linkerdeel van het venster. Exporteer de warmte kaart door te klikken op "Save Image" in het menu "Bestand".

7. expressie profilering in reactie op de biotische en abiotische stress

Herhaal stap 6.1 met de GSE toetreding ID respectievelijke publicaties en studies onderzoeken van biotische en abiotische stress op grapevine verkregen. Bijvoorbeeld, kunnen bieden de transcriptoom profiel van grapevine bessen besmet met de schimmel pathogeen Botrytis cinerea met behulp van de NimbleGen druif geheel-genoom microarray experimenten worden gebladerd met GSE ID van GSE52586. Herhaal stap 6.1.1 en 6.1.2.
Zoek de NCBI volgorde leest archief³⁴ met de SRA/BioProject-ID (bijvoorbeeldSRP055458 of PRJNA275778 voor "grapevine bloem arcering" experimenten) en alle bijbehorende rauwe volgorde leest downloaden. RNA-seq datasets van vele verschillende studies worden verwerkt met behulp van één pijpleiding voor consistentie.
1. Kort, trim rauwe reeks FASTQ leest (single - en paar-einde) en filteren van kwaliteit met Trimmomatic³⁵. Gebruik die een AVGQUAL en MINLEN van 20 en 40, respectievelijk filteren en alle parameters standaard.
2. Index van de 12 X grapevine referentie genoom¹ met behulp van Bowtie2³⁶. Download de 12 X grapevine referentie genoom (b.v., bowtie2-build) vooraleer lopende naar de troepenleiding bowtie2 .
3. Graaf matrix tabellen met htseq-graaf³⁷ met behulp van de grapevine V1 gen-modelbestand aantekening (GFF/GTF) verkrijgen.
Differentiële gen expressie (her-) analyses uit te voeren in R³⁸ met⁴⁰ limma³⁹ mediawisselaars voor RMA-genormaliseerd matrices en DESeq2 voor graaf matrix tabellen verkregen stappen 7.1.1 en 7.2.1, respectievelijk.
1. Uitvoeren van een standaard vergelijking van "twee-groep" (dat wil zeggen, "behandeling" / "control"). Ervoor zorgen dat de ontwerp-matrix/groeperingen van "controle" en "behandeling" voorwaarden correct zijn ingesteld.
  Opmerking: Een typisch ontwerp microarray differentiële expressie p.a. (GSE52586) om te vergelijken van EL-33 bessen besmet met Botrytis cinerea tegen controle (gezonde) bessen in de dezelfde ontwikkelingsfase met limma opdrachtregels uitvoeren 13 is vermeld in aanvullende bestand 1. Een typisch ontwerp p.a. RNA-seq differentiële expressie (SRP055458 of PRJNA275778) te vergelijken bloem (op 7 dagen na GLB-val) onder schaduw behandeling tegen het besturingselement met DESeq2 met opdrachtregels 14 wordt weergegeven in aanvullende bestand 1 .
2. Verkrijgen van de lijsten van differentially uitgedrukte genen (DEG) elke daarentegen voor limma, gebruik de functies lmFit(), gevolgd door eBayes(), en door topTable() functies, terwijl voor DESeq2, gebruik vervolgens de DESeqDataSetFromMatrix(), DESeq()en results() functies. Hieronder een doorsnee werkstroom moet worden gevolgd.
  1. Zie voor de analyse van de differentiële expressie van microarray, opdrachtregels 15 (aanvullende bestand 1). Differentiële expressie analyse Zie voor RNA-seq opdrachtregels 16 (aanvullende bestand 1). Herhaal de bovenstaande stappen voor alle andere contrasten met verschillende passende ontwerp schema (zie voorbeelden in stap 7.3.1)
Uittreksel uit de lijsten van DEGs gegenereerd, alle rijen die niet overeenkomen met ATL V1 toetreding, kolommen met de log2 vouwen verandering (behandeling/Control) behouden > | 0,5 | en aangepast van p-waarden (FDR) < 0,05 en samenvoegen hen dienovereenkomstig in een matrix-tabel, of een studie valt in "abiotische" of "biotische/pathogen interactions" compendia.
Construeer de hiërarchische geclusterde heatmaps (abiotische en biotische compendia) in R, met behulp van de bibliotheken gplots.
Opmerking: Oproepen van de functie heatmap.2 bouwt de heatmap samen met rij dendrograms uit de respectieve matrix-tabellen. Aanvullende argumenten met behulp van de cellnote functie helpt bij het onderscheiden van differentially uitgedrukte (log2FC > 0.5, FDR < 0.05) ATL genen in elke vergelijking over een groot aantal experimentele omstandigheden door een * symbool. De doorsnee werkstroom in R met opdrachtregels 17 (aanvullende bestand 1) van toepassing of als alternatief, herhaal stappen 6.2.2 tot en met 6.2.5 voor de bouw van de heatmaps MeV softwarematig.

8. analyse van de relaties tussen Paralogous reeks divergentie en co genexpressie

Construeer de matrix met paarsgewijze gelijkenis. De elementen van de matrix gelijkenis zijn de waarden van de reeks gelijkenis berekend op basis van de uitlijning van de paarsgewijze eiwit.
1. Gebruik het reliëf naald web server⁴¹ met standaardinstellingen Paarsgewijze sequentie aanpassingen aanbrengen en opslaan als tekstbestand. Open het tekstbestand uitvoer en verwijder alle regels met opmerkingen, samen met de namen van de kolom en rij voor het genereren van een bestand met de naam "similarityTable.txt".
  Opmerking: Zo'n tabel beschikt over een regel voor elk gen van de ATL rapportage van de gelijkenis waarden berekend in elk van de paarsgewijze uitlijning. De volgorde van de loci in rijen en kolommen is hetzelfde, zodat een symmetrische matrix wordt gegenereerd met respect van de diagonale waarden.
Construeer de matrix met co expressie gegevens door het berekenen van de correlatiecoëfficiënt van Pearson. De volgende procedure vereist R en de perl module PDL.
1. Download de waarden van de expressie voor de 96 ATL genen opdrachtregels 18 (aanvullende bestand 1) in een terminal uitvoeren. Een co expressie-analyses uit te voeren met behulp van een aangepaste perlmanuscript dat kan worden gedownload door het uitvoeren van opdrachtregels 19 (aanvullende bestand 1). Dergelijke script berekent de Pearson-correlatiecoëfficiënt tussen paren van ATL loci zoals eerder gemeld.
2. Start het script dat wordt uitgevoerd opdrachtregels 20 (aanvullende bestand 1) en volg de instructies van de uitvoer.

Het script zal produceren een uitvoerbestand (namelijk "coexpressionTable.txt") met een co expressie-matrix met dezelfde locus namen volgorde van matrix verkregen in stap 8.1 (deze volgorde is essentieel voor de Mantel-test uitvoeren, zie hieronder).

Het uitvoeren van een Mantel test tussen de matrices van de gegevens verkregen in stap 8.1 en 8.2. Na het invoeren van de R-omgeving (commando "R" uit in een terminal), het laden van de bibliotheek van de ade4 met de volgende opdracht: library(ade4)

De Mantel test uitvoeren door het laden van de gegevens van de twee matrices en het uitvoeren van de statistieken opdrachtregels 21 (aanvullende bestand 1), uitgevoerd met "nrep", dat het aantal PERMUTATIES vertegenwoordigt. De test bestaat uit de berekening van de correlatie tussen de elementen van deze matrices, verwisselen van de matrices en vervolgens het dezelfde statistische proefresultaat opnieuw berekend.
Opmerking: Alle verkregen waarden van de test van de statistiek worden gebruikt om te bouwen van een verdeling van de verwijzing van de statistiek-test, die zal worden gebruikt voor de berekening van een p-waarde om te testen voor betekenis. Het aantal PERMUTATIES definieert de precisie waarmee de p-waarde kan worden verkregen.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Het VIT_05s0077g01970 gen, geïdentificeerd als het meest vergelijkbaar met A. thaliana ATL2 (At3g16720) door een onderzoek van BLASTp, werd gebruikt als sonde enquête de ATL-familieleden in het genoom van de grapevine (V. vinifera cv Pinot Noir PN40024). De analyse van de PSI-BLAST geconvergeerde na een paar cycli onthullen een lijst van vermeende genen die behoren tot de grapevine ATL gene familie (figuur 1A). De aanwezigheid van het canonieke domein van de RING-H2 voor elke kandidaat werd beoordeeld door de visuele controle van de uitlijning van de spier van alle posten die in de analyse (figuur 1B). Alleen deze genen met de goed verdeelde geconserveerde aminozuren, de twee histidine residuen, alsmede het residu proline vóór het derde cysteïne werden beschouwd als ATLs volgens de oorspronkelijke definitie van ATL in Arabidopsis⁵. Een totaal van 96 grapevine genen voldoen aan de eisen en voor verdere karakterisering werden beschouwd. Elk gezinslid ATL werd geanalyseerd om te bepalen van de specifieke kenmerken van het gen en de bijbehorende gecodeerde proteïne, dat wil zeggen, de aanwezigheid van andere bekende domein(en) naast de RING-H2, transmembraan of hydrofobe rijke regio's, subcellular lokalisatie en vermeende fosforylatie sites (tabel 1 en tabel 2).

Figuur 1: PSI-BLAST enquête en de uitlijning van vermeende grapevine ATLs. (A) Screenshot van de top 10-hits van de eerste PSI-BLAST iteratie zoekactie met behulp van de eiwit-reeks VIT_05s0077g01970 als aas. (B) gedeelte van de uitlijning van de 96 geselecteerde grapevine putatief ATLs tonen hun RING-H2-domein en de bijbehorende LOGO verkregen met behulp van een suite van de moleculaire biologie (Zie Tabel van materialen). Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴².Klik hier voor een grotere versie van dit cijfer.

Naam	Gen-ID	Gene lengte (bp)	Intron nummer	UniProt ID	Eiwit lengte (aa)	RING-H2 motief	TM/H domein nummer	Andere domeinen
VviATL3	VIT_09s0002g00220	1245	0	F6HXK6	304	PxC	1
VviATL4 [VviRHX1A]	VIT_15s0021g00890	1827	3	D7SM36	203	PxC	0
VviATL18	VIT_11s0118g00780	1113	2	F6HCI8	193	PC	0
VviATL23a	VIT_18s0001g01060	935	0	F6H0E4	114	PxC	0,5
VviATL23b	VIT_18s0001g01050	399	0	E0CQX3	132	PxC	1
VviATL24	VIT_17s0000g06460	4466	4	D7SI89	217	PxC	1
VviATL27	VIT_00s0264g00020	2554	4	D7T1R5	235	PxC	1
VviATL43	VIT_11s0052g00530	1576	2	D7SQD9	457	PxC	3
VviATL54a	VIT_18s0001g06640	3221	1	F6H0Y5	405	PxC	1
VviATL54b	VIT_03s0017g00670	2774	1	F6HTI0	427	PxC	1
VviATL55 [VviRING1]	VIT_07s0191g00230	1844	0	F6HRP9	372	PxC	1
VviATL63	VIT_06s0004g06930	804	0	D7SJU6	267	PxC	1
VviATL65	VIT_03s0063g01890	2068	0	F6HQI8	396	PxC	1
VviATL82	VIT_01s0026g02540	820	0	F6HPQ9	233	PC	0,5
VviATL83	VIT_17s0000g08400	1887	0	F6GSQ4	143	PC	0
VviATL84	VIT_06s0004g00120	1853	0	F6GUP5	368	PC	0,5	ZF-RING_3
VviATL85	VIT_12s0034g01400	786	0	F6H965	261	PC	0,5
VviATL86	VIT_12s0034g01390	1434	1	D7T016	451	PC	0,5
VviATL87	VIT_18s0001g03270	1002	0	F6H0T2	333	PC	0,5	ZF-RING_3
VviATL88	VIT_08s0040g00590	1320	0	F6HQR2	314	PC	0	ZF-RING_3

Tabel 1: eerste 20 VviATL genen en kenmerken van de volgorde van de overeenkomstige eiwitten. TM: transmembraan; H: hydrofobe; 0,5 duidt op de aanwezigheid van een of meer hydrofobe regio's. Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴².

Table 2
Tabel 2: Details over de eerste 20 VviATL Gene positie in V. vinifera genoom, dubbel staat, en ATL eiwit fysisch-chemische eigenschappen en locatie. (een) aantal fosforylatie sites voorspeld door Musite; (b) vergelijkbare voorspellingen verkregen met ten minste twee software worden gemarkeerd in vet; ngLOC werd gebruikt met de standaardinstellingen, terwijl TargetP v1.1 en eiwit Prowler Subcellular Localisatie werden gebruikt met een licht-donkerscheiding van kans van 0,5. NOC, nucleus; MIT, mitochondriën; CHL, chloroplast; PLA, plasmamembraan; S, secretoire traject (aanwezigheid van een signaal peptide); M, mitochondriën; C, chloroplast; O of -, andere locaties; ND, niet bepaald (dat wil zeggen, waarde beneden de drempel). Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴². Klik hier om dit bestand te downloaden.

Een fylogenetische analyse, met inbegrip van de nucleotidesequenties van geïdentificeerde grapevine ATL-encoding genen samen met de sequenties van de referentie A. thaliana ATL gene familie werd gebruikt voor wijnstok ATL nomenclatuur, volgens de richtlijnen van de sNCGGa⁸. Zesennegentig en 83 nucleotidesequenties van V. vinifera en A. thaliana, respectievelijk, werden onderworpen aan de pijpleiding van de Phylogeny.fr naar het verkrijgen van een betrouwbare fylogenetische boom.De laatste sequenties werden later gebruikt aantekeningen maken en benoemen van grapevine genen op basis van solide relaties (Figuur 2). Na deze aanpak ontvangen 13 uit 96 grapevine ATLs een bepaalde identificatie gezien hun individuele orthology met een A. thaliana ATL. De namen van de andere 83 genen werden toegewezen op basis van de fylogenetische boom, met een progressieve nummering van boven naar beneden, vanaf een ATL gene nummer hoger dan het hoogste aantal gebruikte in A. thaliana.

Figuur 2: Fylogenetische boom van V. vinifera en A. thaliana ATL E3 ubiquitin ligase-encoding genen. De onbewortelde boom is gegenereerd met de Phylogeny.fr suite (V. vinifera (in groen) en de 83 ATL genen van A. thaliana gemeld in de UniProt database (in geel). Tak ondersteuning waarden werden verkregen uit 100 bootstrap wordt gerepliceerd. De rode sterren wijzen op de aanwezigheid van een BCA2 zink vinger (BZF) domein in de overeenkomstige eiwitten. Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴². Klik hier voor een grotere versie van dit cijfer.

ATL-encoding genen toe te wijzen aan de grapevine chromosomen toonde een brede verspreiding in het genoom, geheel-genoom dubbel als de grote evolutionaire kracht in de uitbreiding van de ATL gene familie in grapevine suggereren. Inderdaad, 31 ATLs werden gevonden in homologe chromosomen regio's mogelijk afkomstig van gesegmenteerde of hele genoom dubbel gebeurtenissen. Bovendien, dezelfde analyse gemarkeerd 13 tandem gedupliceerde genen, een proximale dupliceren en 51 verspreide duplicaten (Figuur 3). Gezien het zeer grote aantal gedupliceerde genen in de familie van de ATL, we een verrijking proef (Fisher's exacte) om te controleren de preferentiële bewaring van de gedupliceerde genen tijdens het genoom fractionering uitgevoerd. Met een p-waarde < 0.001, deze test bevestigd de hypothese dat genen van de ATL gedupliceerd bleven meer dan willekeurig verwacht, suggereren een rol voor de ATL gene familie tijdens de aanpassing van de grapevine en evolutie.

Figuur 3: Grapevine ATL-encoding gene distributie op V. vinifera chromosomen en dubbel staat. De 96 grapevine ATL genen met exacte chromosomale informatie beschikbaar in de database werden toegewezen aan de 19 V. vinifera chromosomen. De kleuren geven aan het oorspronkelijke evenement van duplicatie. Verticale zwarte lijnen en rode lijnen identificeren paren afgeleid van tandem duplicaties en hele genoom duplicaties, respectievelijk. Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴². Klik hier voor een grotere versie van dit cijfer.

Verder onderzoek doen naar de vermeende biologische functies van de ATLs in grapevine, werd een meta-analyse uitgevoerd op de V. vinifera cv. Corvina global genexpressie Atlas¹². De dataset omvat geheel-genoom expressie waarden van 54 verschillende grapevine organen en ontwikkelingsstadia en werd gebruikt om een hiërarchische bi-geclusterde analyses uit te voeren. Resultaten niet alleen bevestigd dat alle 96 ATLs werden uitgedrukt in ten minste één van de 54 weefsels/stadia, maar wees er ook op de aanwezigheid van de vijf belangrijkste clusters van expressieprofielen (figuur 4A). Kort, clusters A en E toonde tegenover gedrag, in het bijzonder de eerste wordt gekenmerkt door een algemene Downregulatie van ATL genen in jonge monsters, met inbegrip van de vroege stadia van berry, jonge blad, ranken, bloeiwijze en allermeest naar de knop stadia. Aan de andere kant, in hetzelfde cluster A, volwassen monsters zoals bessen rijpen en na de oogst verwelking stadia, woody weefsels en late stadia van zaad ontwikkeling ATL genen bleek van een overheersende opregulatie. Genen in Cluster C waren voornamelijk werden in de meeste van de monsters, terwijl ATL genen in cluster D vaak upregulated op de late stadia van ontwikkeling van berry waren. Cluster B bleek ten slotte niet elke relevante wijziging in de expressieprofielen.

Een soortgelijke aanpak werd toegepast om te bestuderen van de expressie van grapevine ATL familieleden in reactie op de biotische en abiotische stress, met behulp van specifieke datasets gebouwd voor dit doel. Een enorme hoeveelheid gegevens van de expressie die voortvloeien uit microarray en RNA-seq experimenten zijn verkrijgbaar bij de toegang van het publiek databases zoals Gene Expression Omnibus (GEO) en ArrayExpress. Zodra verzameld en gunstig genormaliseerd, werd de informatie geëxploiteerd voor verdere inzichten in de potentiële functie van ATLs plant reactie op stress. Analyseren van de expressieprofielen van grapevine ATLs naar aanleiding van biotische onderstreept geopenbaard dat 62 uit 96 afschriften een significante modulatie toonde (log2 vouw-verandering (FC) > | 0,5 |) in ten minste twee voorwaarden, met een valse ontdekking tarief (FDR) < 0,05 () Figuur 4B). Het aantal stijgt tot en met 81 overwegen alleen de FDR drempel in één voorwaarde. Deze resultaten sterk aangeraden een rechtstreekse betrokkenheid van de ATL gene familie in het antwoord voor ziekteverwekkers ook in grapevine. In het bijzonder, een groep van 12 genen (VviATL3-27-54b-55-90-97-123-144-148-149-156) waren sterk upregulated in antwoord op de meeste pathogenen, waaronder biotrophic en necrotrophic schimmels en herbivoren, en dus verdienen aandacht voor verdere functionele analyses.

Figuur 4: hiërarchische clusteringof ATL genexpressie in grapevine Atlas en in grapevine biotische stress-gerelateerde dataset. (A) de expressie van de log getransformeerd waarden van grapevine ATL genen in de grapevine Atlas¹² werden gebruikt voor de hiërarchische cluster-analyse op basis van Pearson's afstand metrisch. De kleur schaal vertegenwoordigt hoger (rood) of lager (groen) expressie niveaus met betrekking tot de overvloed van de mediane afschrift van elk gen over alle monsters. Letters A tot en met E aan de rechterkant geven de verschillende clusters geïdentificeerd.AB: na uitbarsting; B: barsten; Bud-W: winter bud; F: de bloei; FB: bloei begint; FS: fruit ingesteld; G: groen; MR: mid-rijping; PFS: na fruit set; PHWI-II-III: na de oogst verwelking van 1, 2 en 3 maanden; R: rijping; S: verouderend; stam-W: houtige stengel; V: veraison; WD: goed ontwikkeld; Y: de Jong. (B) de kleur schaal vertegenwoordigt van meer (rood) of verlaagd (blauw) vouw wijzigingen van de grapevine ATL genexpressie in besmette monsters in vergelijking met besturingselementen voor elke voorwaarde. Sterretjes geven aan de aanzienlijke differentiële expressie (FDR < 0.05) van elke ATL onder de bijbehorende voorwaarden. Gereproduceerd van Ariani et al. gelicentieerd onder een Creative Commons Naamsvermelding 4.0 internationaal-licentie⁴². Klik hier voor een grotere versie van dit cijfer.

Aanvullende tabel 1: ATL genen kandidaten voor alternatieve splicing. (een) ATL gene ID volgens de V1 druif gene voorspelling en annotatie, (b) ATL gene ID volgens de V2 druif gene voorspelling en annotatie⁴³, (c) aantal vermeende ATL alternatieve splicing varianten, (d) informatie over de codering van de opeenvolging van elke vermeende ATL-variant. Klik hier om dit bestand te downloaden.

Aanvullende tabel 2: Klik hier om dit bestand te downloaden.

Aanvullende bestand 1: Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

In de genomic era, veel gene gezinnen diep gekenmerkt in verschillende plantensoorten. Deze informatie is voorafgaand aan functionele studies en bieden een kader om de rol van verschillende leden in een gezin verder te onderzoeken. In dit verband is er ook een noodzaak om een nomenclatuur systeem ter identificatie van elk lid in een gezin, het vermijden van de redundantie en de verwarring die kunnen ontstaan wanneer de namen onafhankelijk zijn toegewezen aan verschillende genen door verschillende onderzoeksgroepen.

Na attent overweging, de wetenschappelijke gemeenschap van grapevine overeengekomen aan naam grapevine genen in een gezin, gebaseerd op gelijkenissen met Arabidopsis genen en een reeks regels die moeten worden toegepast om te beschrijven van nieuwe gen gezinnen in grapevine, vastgesteld in principe vanaf de fylogenetische vergelijking van nucleotidesequenties tussen grapevine en Arabidopsis familieleden⁸. Daarom kunnen de enige genen die al zijn aantekeningen en goed met de naam Arabidopsis in de grapevine-nomenclatuur worden gebruikt. De procedure voor de identificatie van grapevine ATL orthologues Arabidopsis hier beschreven toegepast werd daarom uitsluitend om te voldoen aan de eis van het toewijzen van de juiste grapevine gene familie nomenclatuur uitgevoerd. Toch, voor andere plantensoorten, alternatieve benaderingen zou een optie. Bijvoorbeeld, kan orthology worden afgeleid met behulp van een bidirectionele BLAST hits (BBH), waar de orthologues worden gedefinieerd als paren van genen in twee soorten die meer vergelijkbaar zijn (dat wil zeggen, met de hoogste score van de uitlijning) naar het een andere dan elke andere gen in de andere soorten⁴⁴. Deze methode kon echter vele orthologues in het geval van hoge tarief van gene duplicatie, zoals missen in planten en dieren⁴⁵. Bovendien, in het geval van ATL-encoding genen, BBH genen ontbreekt de precieze ATL-type RING-H2-structuur (met inbegrip van het residu proline) kan ophalen of genen die niet geannoteerd en ATLs Arabidopsis genoemd. Hoewel vanuit een evolutionair perspectief deze zoekopdracht relevant zijn kan, het ophalen van orthologues die niet zijn geannoteerd zou niet hebben voldaan aan de werkingssfeer van de grapevine ATL gene familie annotatie en nomenclatuur, en orthologues die niet als ATLs zijn geannoteerd aan leden van de familie van de grapevine naam kan niet worden gebruikt. Een andere mogelijkheid is het afleiden van orthology gebaseerd op de aminozuur in plaats van nucleotidesequenties via InParanoid⁴⁶, of de meest recente Hieranoid 2⁴⁷, zij deze werkstromen niet uitdrukkelijk door de wetenschappelijke gemeenschap aanbevolen worden.

Expressie meta-analyse, die kan worden gedefinieerd als een systematische aanpak te bestuderen en verschillende publiekelijk beschikbare dataset repositories van expressie gegevens te combineren, kunt markeren van moleculaire mechanismen van gedeelde en anders in een verscheidenheid van voorwaarden. Dus, de integratie van gen expressie informatie uit meerdere grootschalige transcriptomic experimenten de karakterisering van een gen-familie, kan verbeteren door het definiëren van de expressieprofielen van de familieleden over experimenten, dus het minimaliseren van de impact van experiment-specifieke factoren en ondersteuning van een robuustere aanname van de vermeende genfunctie in bepaalde processen. Het gebruik van microarray gegevens vereist echter de integratie van expressie gegevens die zijn verkregen met verschillende platforms, gelet op hun eigen beperkingen. Bijvoorbeeld, in de grapevine Nimblegen microarray platform, een aanzienlijk deel van de probesets voor overeenkomstige genen vertegenwoordigd op de array (~ 13.000 genen) hebben potentieel Kruis-hybridisatie kwesties⁴⁸. In het geval van de grapevine ATL familie, kunnen 15 genen worden beïnvloed door dergelijke fenomeen. Niettemin, zoals besproken door Cramer et al. ⁴⁸, het Kruis-identificatie van zeer soortgelijk gen familieleden door de dezelfde sonde kan bieden interessante informatie over de expressie, in specifieke omstandigheden, niet alleen van een enkel gen, maar van twee tot meer genen delen van hoge sequentie overeenkomsten, en dus mogelijk delen doelstellingen en functies. Een andere mogelijke kwestie met betrekking tot microarray datasets is de detectiegrens van de expressie van microarray platforms, die niet erg gevoelig zijn. Om op te lossen zowel betrekking heeft op, dwz., kruis-hybridisatie en signaal gevoeligheid, een mogelijke oplossing zou kunnen zijn te overwegen alleen RNAseq expressie datasets. Echter de meta-analyse van RNAseq gegevens van zeer grote datasets van vele verschillende studies kan worden zeer tijdrovend en kan vereisen veel rekenkracht en hoge expertise.

Hoewel de aanpak die hier doelstellingen volledig te zijn, het zeker verder kan worden aangevuld met andere analyses. Eerst, om te bereiken verder inzicht in de moleculaire evolutie en de fylogenetische relatie tussen familieleden van het gen in planten, de fylogenetische analyse kon worden uitgebreid, bouwen een fylogenetische boom met behulp van meerdere uitlijning van de reeks van familieleden van verschillende plantensoorten. Het is ook mogelijk om de evolutionaire tijd van familie genen, een schatting van hun tarieven synoniem en niet-synoniem vervanging tijdens evolutie, berekenen door de bepaling van de waarden Ks (aantal synoniem vervangingen per synoniem site in een bepaalde periode van tijd) en Ka (aantal nonsynonymous vervangingen per niet-synoniem site in dezelfde periode). De Ka/Ks-ratio wordt gebruikt voor het afleiden van de mechanismen van gene dubbel gebeurtenissen na afwijking van hun voorouders. Een waarde van Ka/Ks = 1 suggereert neutrale selectie, een Ka/Ks-waarde van < 1 suggereert zuiveren van selectie, en een Ka/Ks-waarde van > 1 suggereert positieve selectie⁴⁹. Bovendien als gene structuuranalyse de aanwezigheid van introns blijkt, kan de familie karakterisering van het gen worden uitgebreid tot de detectie van alternatieve splicing varianten. Inderdaad, op basis van een diep overzicht van RNA-seq gegevens uit verschillende weefsels, stress voorwaarden en genotypen⁴³21 (van de 96) ATLs zijn sterke kandidaten voor alternatieve splicing evenementen, met potentiële aantal isoforms variërend van 2 tot en met 16 voor deze ATLs (Zie Aanvullende tabel 1). Alternatieve transcripties vaak produceren eiwitten isoforms die in aminozuur sequenties variëren en deze veranderingen kunnen veranderen de cellulaire eigenschappen van eiwitten en wijzigingen van subtiele modulatie tot verlies van functie van het gen product kunnen veroorzaken. Om die reden, zijn alternatieve splicing gebeurtenissen betrokken geweest bij belangrijke plant functies, met inbegrip van de stressrespons, ziekteresistentie, fotosynthese en bloei⁵⁰^,⁵¹.Integratie van ATL gene promotor informatie waarin vermeende cis-regelgevende elementen⁵² of het vinden van moleculen (b.v., microRNA en lang niet-coderende RNA) potentieel targeting ATLs⁵³ kan ook worden aangevuld tot systeem inzicht in de complexe moleculaire verordening en de interactie van grapevine ATLs onthullen.

Kortom, worden de keuze van de analyses worden uitgevoerd, alsmede de procedures die moeten worden toegepast om te karakteriseren van een nieuwe familie van het gen in een plantensoorten voornamelijk gedreven door de wetenschappelijke gemeenschapsregels alsmede door het toepassingsgebied van gene familie identificatie. Het is belangrijk in gedachten te houden de stappen mogelijk daaropvolgend onderzoek, die gebruik van de verzameling van informatie maken zal, onder die gene evolutie onder plantensoorten, de beschrijving van de structuur van het genoom of betrouwbare kandidaten voor selectie in functionele omvat studies.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

Het werk werd gesteund door de Universiteit van Verona, in het kader van gezamenlijke Project 2014 (karakterisering van de ATL gene familie in grapevine en haar betrokkenheid bij weerstand tegen Plasmopara noordelijke).

Materials

Name	Company	Catalog Number	Comments
Personal computer
Basic Local Alignment Search Tool (BLAST)			https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA)			http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME)			http://meme-suite.org/
Geneious	Biomatters Limited		http://www.geneious.com/
ProtParam Tool			http://web.expasy.org/protparam/
ngLOC			http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server			http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler			http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite			http://musite.sourceforge.net/
Pfam			http://pfam.xfam.org/
TMHMM Server v. 2.0			http://www.cbs.dtu.dk/services/TMHMM/
ProtScale			http://web.expasy.org/protscale/
Grape Genome Database (CRIBI)			http://genomes.cribi.unipd.it/grape/
PhenoGram			http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX			http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL)			http://itol.embl.de/
UniProt			http://www.uniprot.org/
Phylogeny.fr			http://www.phylogeny.fr/index.cgi
MUSCLE			http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server			http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix			https://www.researchgate.net/publication/273383414_54sample_ datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV)			http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA)			https://www.ncbi.nlm.nih.gov/sra
R			https://www.r-project.org/
EMBOSS Needle (EMBL-EBI)			http://www.ebi.ac.uk/Tools/psa/emboss_needle/

DOWNLOAD MATERIALS LIST

References

Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. , Science Publishers. 211-234 (2011).
Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
BLAST. BLAST2.6.0. , Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
MEGA. MEGA7.0.25 build 7170412. , Available from: http://www.megasoftware.net/ (2017).
MEME. MEME Suite Version 4.11.4. , Available from: http://meme-suite.org/ (2017).
ProtParam. ExPASy Server. , Available from: http://web.expasy.org/protparam/ (2005).
ngLOC v1.0. , Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
TargetP v1.1 Server. , Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
Prowler v1.2. , Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
MuSite v1.0. , Available from: http://musite.sourceforge.net/ (2010).
Pfam. Pfam version 31.0. , Available from: http://pfam.xfam.org/ (2016).
TMHMM v2.0c. , Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
ExPASy. ProtScale. , Available from: http://web.expasy.org/protscale/ (2005).
CRIBI. Grape genome database. , Available from: http://genomes.cribi.unipd.it/grape/ (2012).
PhenoGram. , Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
ScanX v0.8. , Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
Interactive Tree Of Life (iTOL). Version3.5.3. , Available from: http://itol.embl.de/ (2016).
UniProt. , Available from: http://www.uniprot.org/ (2016).
Phylogeny.fr. , Available from: http://www.phylogeny.fr/index.cgi (2008).
MUSCLE. , Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
Gblocks Server. Version 0.91b. , Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
Vitis vinifera cv. Corvina gene expression Atlas. , Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
Multiple Experiment Viewer (MeV). Version 4.8.1. , Available from: http://mev.tm4.org/ (2017).
Sequence Read Archive (SRA). , Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
R. Version 3.4.1. , Available from: https://www.r-project.org/ (2017).
Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
EMBL-EBI. EMBOSS Needle. , Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Biology

Uitgebreide Workflow voor de genoom-brede identificatie en expressie Meta-analyse van de ATL E3 Ubiquitin Ligase Gene familie in Grapevine

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.