Summary

Omfattende arbeidsflyten for genomet-identifikasjon og uttrykk Meta-analyse av ATL E3 Ubiquitin Ligase Gene familien i Grapevine

Published: December 22, 2017
doi:

Summary

Denne artikkelen beskriver fremgangsmåten for identifikasjon og karakterisering av en genet familie i grapevine brukt av Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligases.

Abstract

Klassifisering og nomenklatur av gener i en kan betydelig grad bidra til beskrivelsen av mangfoldet av kodet proteiner og prediksjon av familien funksjoner basert på flere funksjoner, slik som tilstedeværelsen av sekvens motiver eller spesielt områder for post-translasjonell modifikasjon og profilen for expression av familiemedlemmer i ulike forhold. Dette verket beskriver en detaljert protokoll for genet familie karakterisering. Her brukes fremgangsmåten karakterisering av Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligase familien i grapevine. Metodene omfatter den genomet-identifikasjonen av familiemedlemmer, karakterisering av genet lokalisering, strukturen og duplisering, analyse av bevarte protein motiver, prediksjon av protein lokalisering og fosforylering områder som Gene expression profilering over familien i forskjellige datasets. Slike prosedyre, som kan utvides til videre analyser avhengig av eksperimentelle formål, kan brukes til alle genet familie i noen plantearter som genomic data er tilgjengelig, og det gir verdifull informasjon for å identifisere interessante kandidater for funksjonelle studier, gir innsikt i molekylære mekanismer av anlegget tilpasning til miljøet.

Introduction

I løpet av det siste tiåret, har mye forskning utført i grapevine genomics. Grapevine er en anerkjent økonomisk relevante avling, som har blitt en modell for forskning på frukt utvikling og svar av woody planter biotiske og abiotiske påkjenninger. I denne sammenheng førte utgivelsen av Vitis vinifera cv. PN40024 genomet i 20071 og oppdatert versjon i 20112 en rask akkumulering av “Omics”-skalaen data og et utbrudd av høy gjennomstrømming studier. Basert på publiserte sekvens, av en gitt genet familie (vanligvis består av proteiner deling bevarte motiver, strukturelle og/eller funksjonelle likheter og evolusjonære relasjonene), kan nå utføres for å avdekke sin molekylær funksjoner, utviklingen og gene uttrykket profiler. Disse analysene kan bidra til å forstå hvordan genet familier kontrollere fysiologiske prosesser på en genomet globalt.

Mange aspekter av livssyklusen til anlegg er regulert av ubiquitin-mediert nedbrytning av viktige proteiner, som krever en finjustert omsetning å sikre vanlige cellulære prosesser. Viktige komponenter av ubiquitin-mediert fornedrelse er E3 ubiquitin ligases, som er ansvarlig for systemet fleksibilitet, takket være rekruttering av konkrete mål3. Følgelig representerer disse enzymene en stor genet familie, med rundt 1400 E3 ligase-koding gener spådde i Arabidopsis thaliana genomet4, hver E3 ubiquitin ligase fungerer for ubiquitination av bestemt mål proteiner. Til tross for betydningen av underlaget-spesifikke ubiquitination i mobilnettet regulering i planter, lite er kjent om hvordan ubiquitination veien er regulert og målet proteiner er blitt identifisert bare i noen tilfeller. Å tyde av slike spesifisitet og regulering mekanismer avhengig først identifikasjon og karakterisering av de ulike komponentene i systemet, spesielt E3-ligases. Blant ubiquitin ligases, er ATL og preget av 91 medlemmer i A. thaliana viser en RING-H2 finger domene5,6, noen av dem spiller en rolle i forsvar og hormon svar7.

Første avgjørende skritt for å definere medlemmene av en ny gen-familie er de nyeste trendene i familien funksjoner, for eksempel konsensus motiver, viktige domener og protein sekvens egenskaper. Faktisk krever pålitelig henting av alle genet familiemedlemmer basert på BLAST analyse noen obligatorisk sekvens egenskaper, i spesielle proteinet domener ansvarlig for protein funksjon/aktivitet, som protein signatur. Dette kan være tilrettelagt av tidligere karakteristikk av samme genet familie i andre plantearter eller oppnådd ved å analysere ulike gener åpenbart tilhører samme familie i forskjellige plantearter, isolere vanlige rekkefølger. Familiemedlemmer kan deretter individuelt navngis etter felles regler avgjort av internasjonale konsortier for en gitt plantearter. I grapevine, for eksempel er slik prosedyre utsatt for anbefalingene fra super nomenklatur komiteen for drue Gene merknad (sNCGGa), etablering av et stamtre inkludert V. vinifera og A. thaliana gene familiemedlemmer tillate genet merknad basert på nukleotid sekvenser8.

Kromosom lokalisering av familiemedlemmer og gene duplisering undersøkelse kan merke tilstedeværelsen av hele-genome eller tandem duplisert gener. Slik informasjon vises nyttig å rakne antatte genet funksjoner, siden det kan vise funksjonelle redundans eller vise ulike situasjoner, dvs., ikke-functionalization, neo-functionalization eller sub functionalization9. Begge neo – og sub – functionalization er viktige hendelser som oppretter genetisk nyhet, gir nye cellulære komponenter for plante tilpasning til skiftende omgivelser10. Særlig duplikasjoner av forfedrenes gener og produksjon av nye gener var svært hyppig under utviklingen av grapevine genomet og nydannede gener fra proksimale og tandem duplikasjoner i grapevine var mer sannsynlig å produsere nye funksjoner11.

En annen viktig faktor i å avkode gen familie funksjon er transcriptomic profilen. Tilgjengeligheten av offentlige databaser gir tilgang til en enorm mengde transcriptomic data kan dermed utnyttes for å tilordne antatte funksjoner til genet familiemedlemmer bruke store i sili uttrykk analyser. Faktisk, særegne uttrykk for noen gener i bestemte anlegget organer eller som svar på bestemte stress kan gi noen hint om mulige rollene tilsvarende proteiner i definerte forhold, og gi støtte til hypoteser om mulig sub functionalization av dupliserte gener svare på ulike utfordringer. For dette formålet, er det viktig å vurdere flere datasett: disse kan allerede tilgjengelig gene expression matriser, som genomet hele transcriptomic atlas av grapevine organer og utviklingsstadier12, eller kan bygges adhoc av henter transcriptomic datasett for bestemt plantearter utsatt for definerte påkjenninger. Videre, en enkel tilnærming ved hjelp av to matriser, en parvis likheten data og den andre med parvis co uttrykk koeffisienter kan brukes for å vurdere relasjonene mellom sekvens likhet og uttrykk mønstre innen en genet.

Formålet med dette arbeidet er å gi en global tilnærming, definere genet struktur, konservert protein motiver, chromosomal plassering, gene duplikasjoner og uttrykk mønstre, som vel prediksjon av protein lokalisering og fosforylering nettsteder, oppnå en uttømmende karakterisering av en genet familie i planter. En slik omfattende tilnærming brukes her karakterisering av ATL E3 ubiquitin ligase familien i grapevine. Ifølge den nye rollen til ATL gruppe medlemmer i å regulere cellular nøkkelprosesser7, dette arbeidet kan også hjelpe identifisering av sterke kandidater for funksjonell studier, og til slutt greie de molekylære mekanismene som styrer den tilpasning av denne viktige beskjære omgivelsene.

Protocol

1. identifikasjon av antatte ATL Gene familie medlemmer PSI-BLAST web-versjonen Åpne BLAST webside13 og klikk på protein BLAST delen. I feltet “Enter spørringen sequence” Angi aminosyresekvens av protein (her VIT_05s0077g01970) som skal brukes som sonden for å identifisere andre familiemedlemmer.Merk: En god representant protein skal brukes (en protein viser alle de viktigste funksjonene som kjennetegner familien). I feltet “Ve…

Representative Results

VIT_05s0077g01970 genet, identifisert som den mest ligner A. thaliana ATL2 (At3g16720) gjennom et BLASTp søk, ble brukt som sonden for å kartlegge ATL familiemedlemmer i grapevine genomet (V. vinifera cv Pinot Noir PN40024). PSI-BLAST analyse konvergerte etter noen sykluser avsløre en liste over mulige gener grapevine ATL genet gultrefamilien (figur 1A). Tilstedeværelsen av kanoniske RING-H2 domenet for hver kandidat ble evaluert av visu…

Discussion

I genomisk era, har mange genet familier vært dypt preget i flere plantearter. Denne informasjonen er foreløpig funksjonelle studier og gir en ramme for å undersøke videre rollen annerledes medlemmer i en familie. I denne sammenheng finnes det også et behov for en nomenklatur som til å identifisere hvert medlem i familien, unngå redundans og forvirring som kan oppstå når navn er tildelt uavhengig ulike gener av forskjellige forskningsgrupper.

Etter gjennomtenkt vurdering, grapevine vi…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Arbeidet ble støttet av universitetet i Verona innenfor rammen av felles prosjekt 2014 (karakterisering av ATL genet familien i grapevine og sitt engasjement i motstand mot Plasmopara viticola).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video