Denne artikkelen beskriver fremgangsmåten for identifikasjon og karakterisering av en genet familie i grapevine brukt av Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligases.
Klassifisering og nomenklatur av gener i en kan betydelig grad bidra til beskrivelsen av mangfoldet av kodet proteiner og prediksjon av familien funksjoner basert på flere funksjoner, slik som tilstedeværelsen av sekvens motiver eller spesielt områder for post-translasjonell modifikasjon og profilen for expression av familiemedlemmer i ulike forhold. Dette verket beskriver en detaljert protokoll for genet familie karakterisering. Her brukes fremgangsmåten karakterisering av Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligase familien i grapevine. Metodene omfatter den genomet-identifikasjonen av familiemedlemmer, karakterisering av genet lokalisering, strukturen og duplisering, analyse av bevarte protein motiver, prediksjon av protein lokalisering og fosforylering områder som Gene expression profilering over familien i forskjellige datasets. Slike prosedyre, som kan utvides til videre analyser avhengig av eksperimentelle formål, kan brukes til alle genet familie i noen plantearter som genomic data er tilgjengelig, og det gir verdifull informasjon for å identifisere interessante kandidater for funksjonelle studier, gir innsikt i molekylære mekanismer av anlegget tilpasning til miljøet.
I løpet av det siste tiåret, har mye forskning utført i grapevine genomics. Grapevine er en anerkjent økonomisk relevante avling, som har blitt en modell for forskning på frukt utvikling og svar av woody planter biotiske og abiotiske påkjenninger. I denne sammenheng førte utgivelsen av Vitis vinifera cv. PN40024 genomet i 20071 og oppdatert versjon i 20112 en rask akkumulering av “Omics”-skalaen data og et utbrudd av høy gjennomstrømming studier. Basert på publiserte sekvens, av en gitt genet familie (vanligvis består av proteiner deling bevarte motiver, strukturelle og/eller funksjonelle likheter og evolusjonære relasjonene), kan nå utføres for å avdekke sin molekylær funksjoner, utviklingen og gene uttrykket profiler. Disse analysene kan bidra til å forstå hvordan genet familier kontrollere fysiologiske prosesser på en genomet globalt.
Mange aspekter av livssyklusen til anlegg er regulert av ubiquitin-mediert nedbrytning av viktige proteiner, som krever en finjustert omsetning å sikre vanlige cellulære prosesser. Viktige komponenter av ubiquitin-mediert fornedrelse er E3 ubiquitin ligases, som er ansvarlig for systemet fleksibilitet, takket være rekruttering av konkrete mål3. Følgelig representerer disse enzymene en stor genet familie, med rundt 1400 E3 ligase-koding gener spådde i Arabidopsis thaliana genomet4, hver E3 ubiquitin ligase fungerer for ubiquitination av bestemt mål proteiner. Til tross for betydningen av underlaget-spesifikke ubiquitination i mobilnettet regulering i planter, lite er kjent om hvordan ubiquitination veien er regulert og målet proteiner er blitt identifisert bare i noen tilfeller. Å tyde av slike spesifisitet og regulering mekanismer avhengig først identifikasjon og karakterisering av de ulike komponentene i systemet, spesielt E3-ligases. Blant ubiquitin ligases, er ATL og preget av 91 medlemmer i A. thaliana viser en RING-H2 finger domene5,6, noen av dem spiller en rolle i forsvar og hormon svar7.
Første avgjørende skritt for å definere medlemmene av en ny gen-familie er de nyeste trendene i familien funksjoner, for eksempel konsensus motiver, viktige domener og protein sekvens egenskaper. Faktisk krever pålitelig henting av alle genet familiemedlemmer basert på BLAST analyse noen obligatorisk sekvens egenskaper, i spesielle proteinet domener ansvarlig for protein funksjon/aktivitet, som protein signatur. Dette kan være tilrettelagt av tidligere karakteristikk av samme genet familie i andre plantearter eller oppnådd ved å analysere ulike gener åpenbart tilhører samme familie i forskjellige plantearter, isolere vanlige rekkefølger. Familiemedlemmer kan deretter individuelt navngis etter felles regler avgjort av internasjonale konsortier for en gitt plantearter. I grapevine, for eksempel er slik prosedyre utsatt for anbefalingene fra super nomenklatur komiteen for drue Gene merknad (sNCGGa), etablering av et stamtre inkludert V. vinifera og A. thaliana gene familiemedlemmer tillate genet merknad basert på nukleotid sekvenser8.
Kromosom lokalisering av familiemedlemmer og gene duplisering undersøkelse kan merke tilstedeværelsen av hele-genome eller tandem duplisert gener. Slik informasjon vises nyttig å rakne antatte genet funksjoner, siden det kan vise funksjonelle redundans eller vise ulike situasjoner, dvs., ikke-functionalization, neo-functionalization eller sub functionalization9. Begge neo – og sub – functionalization er viktige hendelser som oppretter genetisk nyhet, gir nye cellulære komponenter for plante tilpasning til skiftende omgivelser10. Særlig duplikasjoner av forfedrenes gener og produksjon av nye gener var svært hyppig under utviklingen av grapevine genomet og nydannede gener fra proksimale og tandem duplikasjoner i grapevine var mer sannsynlig å produsere nye funksjoner11.
En annen viktig faktor i å avkode gen familie funksjon er transcriptomic profilen. Tilgjengeligheten av offentlige databaser gir tilgang til en enorm mengde transcriptomic data kan dermed utnyttes for å tilordne antatte funksjoner til genet familiemedlemmer bruke store i sili uttrykk analyser. Faktisk, særegne uttrykk for noen gener i bestemte anlegget organer eller som svar på bestemte stress kan gi noen hint om mulige rollene tilsvarende proteiner i definerte forhold, og gi støtte til hypoteser om mulig sub functionalization av dupliserte gener svare på ulike utfordringer. For dette formålet, er det viktig å vurdere flere datasett: disse kan allerede tilgjengelig gene expression matriser, som genomet hele transcriptomic atlas av grapevine organer og utviklingsstadier12, eller kan bygges adhoc av henter transcriptomic datasett for bestemt plantearter utsatt for definerte påkjenninger. Videre, en enkel tilnærming ved hjelp av to matriser, en parvis likheten data og den andre med parvis co uttrykk koeffisienter kan brukes for å vurdere relasjonene mellom sekvens likhet og uttrykk mønstre innen en genet.
Formålet med dette arbeidet er å gi en global tilnærming, definere genet struktur, konservert protein motiver, chromosomal plassering, gene duplikasjoner og uttrykk mønstre, som vel prediksjon av protein lokalisering og fosforylering nettsteder, oppnå en uttømmende karakterisering av en genet familie i planter. En slik omfattende tilnærming brukes her karakterisering av ATL E3 ubiquitin ligase familien i grapevine. Ifølge den nye rollen til ATL gruppe medlemmer i å regulere cellular nøkkelprosesser7, dette arbeidet kan også hjelpe identifisering av sterke kandidater for funksjonell studier, og til slutt greie de molekylære mekanismene som styrer den tilpasning av denne viktige beskjære omgivelsene.
I genomisk era, har mange genet familier vært dypt preget i flere plantearter. Denne informasjonen er foreløpig funksjonelle studier og gir en ramme for å undersøke videre rollen annerledes medlemmer i en familie. I denne sammenheng finnes det også et behov for en nomenklatur som til å identifisere hvert medlem i familien, unngå redundans og forvirring som kan oppstå når navn er tildelt uavhengig ulike gener av forskjellige forskningsgrupper.
Etter gjennomtenkt vurdering, grapevine vi…
The authors have nothing to disclose.
Arbeidet ble støttet av universitetet i Verona innenfor rammen av felles prosjekt 2014 (karakterisering av ATL genet familien i grapevine og sitt engasjement i motstand mot Plasmopara viticola).
Personal computer | |||
Basic Local Alignment Search Tool (BLAST) | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
Molecular Evolutionary Genetics Analysis (MEGA) | http://www.megasoftware.net/ | ||
Motif-based sequence analysis tools (MEME) | http://meme-suite.org/ | ||
Geneious | Biomatters Limited | http://www.geneious.com/ | |
ProtParam Tool | http://web.expasy.org/protparam/ | ||
ngLOC | http://genome.unmc.edu/ngLOC/index.html | ||
TargetP v1.1 Server | http://www.cbs.dtu.dk/services/TargetP/ | ||
Protein Prowler | http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ | ||
MUsite | http://musite.sourceforge.net/ | ||
Pfam | http://pfam.xfam.org/ | ||
TMHMM Server v. 2.0 | http://www.cbs.dtu.dk/services/TMHMM/ | ||
ProtScale | http://web.expasy.org/protscale/ | ||
Grape Genome Database (CRIBI) | http://genomes.cribi.unipd.it/grape/ | ||
PhenoGram | http://visualization.ritchielab.psu.edu/phenograms/plot | ||
MCScanX | http://chibba.pgml.uga.edu/mcscan2/ | ||
Interactive Tree Of Life (iTOL) | http://itol.embl.de/ | ||
UniProt | http://www.uniprot.org/ | ||
Phylogeny.fr | http://www.phylogeny.fr/index.cgi | ||
MUSCLE | http://www.ebi.ac.uk/Tools/msa/muscle/ | ||
Gblocks Server | http://molevol.cmima.csic.es/castresana/Gblocks_server.html | ||
Vitis vinifera cv. Corvina gene expression Atlas datamatrix | https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 | ||
Multi Experiment Viewer (MeV) | http://mev.tm4.org/#/welcome | ||
Sequence Read Archive (SRA) | https://www.ncbi.nlm.nih.gov/sra | ||
R | https://www.r-project.org/ | ||
EMBOSS Needle (EMBL-EBI) | http://www.ebi.ac.uk/Tools/psa/emboss_needle/ |