I denne artikel beskrives fremgangsmåden for identifikation og karakterisering af et gen familie i grapevine anvendes til familien af Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligases.
Klassificering og nomenklatur af gener i en familie kan bidrage væsentligt til beskrivelsen af mangfoldigheden af kodede proteiner og forudsigelse af familien fungerer på basis af flere funktioner, såsom tilstedeværelsen af sekvens motiver eller af særlig websteder for posttranslationel modifikation og udtryk profil af familiemedlemmer i forskellige betingelser. Dette arbejde beskriver en detaljeret protokol for gen familie karakterisering. Her, anvendes proceduren, der til karakterisering af Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligase familie i grapevine. Metoderne omfatter genome-wide identifikation af familiemedlemmer, karakterisering af genet lokalisering, struktur og dobbeltarbejde, analyse af bevarede protein motiver, forudsigelse af protein lokalisering og fosforylering websteder samt gen expression profilering på tværs af familien i forskellige DataSet. En sådan procedure, som kunne udvides til at omfatte yderligere analyser afhængig af forsøgsformål, kunne anvendes på enhver gen familie i enhver plantearter som genomisk data er tilgængelige, og det giver værdifulde oplysninger til at identificere interessante kandidater funktionelle studier, giver indsigt i de molekylære mekanismer af vegetabilsk tilpasning til deres miljø.
I det sidste tiår, har megen forskning foretaget i grapevine genomforskning. Grapevine er en anerkendt økonomisk relevante afgrøde, som er blevet en model for forskning på frugt udvikling og svar af træagtige planter til biotiske og abiotiske understreger. I denne forbindelse, frigivelse af Vitis vinifera cv. PN40024 genom i 20071 og dens opdateret gengivelse i 20112 førte til en hurtig ophobning af “omik”-skala data og en byge af høj overførselshastighed undersøgelser. Baseret på offentliggjorte sekvens data, den omfattende analyse af et givent gen familie (generelt består af proteiner dele bevarede motiver, strukturelle og/eller funktionelle ligheder og evolutionære relationer), kan nu udføres for at afdække sin molekylære funktioner, evolution og gen expression profiler. Disse analyser kan bidrage til forståelsen af hvordan gen familier styrer fysiologiske processer på en genome-wide plan.
Mange aspekter af plante livscyklus er reguleret af ubiquitin-medieret nedbrydning af vigtige proteiner, der kræver en finjusteret omsætning for at sikre regelmæssig cellulære processer. Vigtige komponenter i ubiquitin-medieret nedbrydning-processen er E3 ubiquitin ligases, der er ansvarlig for systemet fleksibilitet, takket være rekruttering af specifikke mål3. Derfor, disse enzymer repræsenterer en enorm gen familie, med omkring 1.400 E3 ligase-kodning gener forudsagt i Arabidopsis thaliana genom4, hver E3 ubiquitin ligase handler for ubiquitination af specifikke mål proteiner. Trods vigtigheden af substrat-specifikke ubiquitination i cellulære regulering i planter, lidt om hvordan ubiquitination vej er reguleret og kun i et par tilfælde konstateret target proteiner. Afkodningen af sådanne mekanismer, specificitet og forordning bygger på identifikation og karakterisering af de forskellige komponenter i systemet, navnlig første E3 ligases. Blandt ubiquitin ligases, er ATL underfamilie karakteriseret ved 91 medlemmer identificeret i A. thaliana viser en RING-H2 finger domæne5,6, nogle af dem spiller en rolle i forsvaret og hormon svar7.
Det første afgørende skridt til at definere en ny gen familiemedlemmer er en præcis definition af de familie funktioner, såsom konsensus motiver, centrale domæner og protein sekvens karakteristika. Faktisk kræver pålidelige hentning af alle gen familiemedlemmer baseret på BLAST analyse nogle obligatoriske sekvens karakteristika, i bestemt protein domæner ansvarlig for protein funktion/aktivitet, der tjener som protein signatur. Dette kan lettes ved tidligere karakterisering af samme gen familie i andre plantearter eller opnået ved at analysere forskellige gener derfor tilhører den samme familie i forskellige plantearter, at isolere fælles sekvenser. Familiemedlemmer kan derefter individuelt navngives efter fælles regler afgjort af internationale konsortier for en given planteart. I grapevine, eksempelvis er en sådan procedure udsat for anbefalingerne fra den super-Nomenklaturudvalget for druemost gen Annotation (sNCGGa), om oprettelse af opførelsen af en Fylogenetisk træ herunder V. vinifera og A. thaliana gen familiemedlemmer til at tillade gen anmærkning baseret på nukleotid-sekvenser8.
Kromosom lokalisering af familiemedlemmer og gen dobbeltarbejde undersøgelse tillade fremhæve tilstedeværelsen af hele-genom eller tandem duplikerede gener. Disse oplysninger vises nyttige at trævle formodede genet funktioner, da det kan vise funktionel redundans eller afsløre forskellige situationer, dvs., ikke-functionalization, neo-functionalization eller sub functionalization9. Begge neo – og sub – functionalization er vigtige begivenheder, der skaber genetiske nyhed, om anlægget tilpasning til skiftende miljøer10nye cellulære komponenter. Især overlapning af forfædres gener og produktion af nye gener var meget hyppig under udviklingen i grapevine genome og nydannede gener med oprindelse fra proksimale og tandem gengangere i grapevine var mere tilbøjelige til at producere nye funktioner11.
En anden vigtig faktor i afkodningen genfunktion familie er transkriptom profil. Tilgængeligheden af offentlige databaser giver adgang til en enorm mængde af transkriptom data kan således udnyttes til at tildele formodede funktioner til gen familiemedlemmer ved hjælp af storstilet i siliciummangan udtryk analyser. Faktisk, den særegne udtryk for nogle gener i specifikke anlæg organer eller som svar på visse understreger kan give nogle gode råd med hensyn til de formodede roller i de tilsvarende proteiner i definerede betingelser, og give støtte til hypoteser om mulige sub functionalization af duplikerede gener til at reagere på forskellige udfordringer. Til dette formål, er det vigtigt at overveje flere datasæt: disse kan være allerede tilgængelige gen expression matrixer, såsom genome-wide transkriptom atlas over grapevine organer og udviklingsstadier12, eller kan bygges ad hoc- af hentning af transkriptom datasæt for de særlige plantearter underkastes definerede understreger. En simpel tilgang ved hjælp af to matrixer, kan en med parvise lighed data og den anden med parvise Co udtryk koefficienter desuden anvendes til at vurdere forholdet mellem sekvens lighed og udtryk mønstre inden for en gen familie.
Formålet med dette arbejde er at give en global tilgang, definere gen struktur, bevarede protein motiver, kromosomale placering, gen gengangere og udtryk mønstre, som godt forudsigelse af protein lokalisering og fosforylering sites, at opnå en udtømmende karakterisering af et gen familie i planter. Sådan en omfattende tilgang er anvendt her til karakterisering af ATL E3 ubiquitin ligase familie i grapevine. Ifølge ATL underfamilie medlemmer i at regulere cellulære nøgleprocesser7nye rolle, kan dette arbejde godt identificeringen af stærke kandidater til funktionelle studier, og til sidst optrævle de molekylære mekanismer, der regulerer de tilpasning af dette vigtige afgrøder til sine omgivelser.
I genomisk æra, har mange gen familier været dybt præget i flere plantearter. Denne information er forud funktionelle studier og giver en ramme for at undersøge yderligere rolle på forskellige medlemmer i en familie. I denne forbindelse er der også behov for en nomenklatur system giver mulighed for entydigt at identificere hver medlem i en familie og at undgå redundans og forvirring, der kan opstå, når navne er tildelt uafhængigt forskellige gener af forskellige forskergrupper.
Efter…
The authors have nothing to disclose.
Arbejdet var støttet af universitetet i Verona inden for rammen af fælles projekt 2014 (karakterisering af familien ATL gen i grapevine og af sin deltagelse i modstanden mod Plasmopara viticola).
Personal computer | |||
Basic Local Alignment Search Tool (BLAST) | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
Molecular Evolutionary Genetics Analysis (MEGA) | http://www.megasoftware.net/ | ||
Motif-based sequence analysis tools (MEME) | http://meme-suite.org/ | ||
Geneious | Biomatters Limited | http://www.geneious.com/ | |
ProtParam Tool | http://web.expasy.org/protparam/ | ||
ngLOC | http://genome.unmc.edu/ngLOC/index.html | ||
TargetP v1.1 Server | http://www.cbs.dtu.dk/services/TargetP/ | ||
Protein Prowler | http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ | ||
MUsite | http://musite.sourceforge.net/ | ||
Pfam | http://pfam.xfam.org/ | ||
TMHMM Server v. 2.0 | http://www.cbs.dtu.dk/services/TMHMM/ | ||
ProtScale | http://web.expasy.org/protscale/ | ||
Grape Genome Database (CRIBI) | http://genomes.cribi.unipd.it/grape/ | ||
PhenoGram | http://visualization.ritchielab.psu.edu/phenograms/plot | ||
MCScanX | http://chibba.pgml.uga.edu/mcscan2/ | ||
Interactive Tree Of Life (iTOL) | http://itol.embl.de/ | ||
UniProt | http://www.uniprot.org/ | ||
Phylogeny.fr | http://www.phylogeny.fr/index.cgi | ||
MUSCLE | http://www.ebi.ac.uk/Tools/msa/muscle/ | ||
Gblocks Server | http://molevol.cmima.csic.es/castresana/Gblocks_server.html | ||
Vitis vinifera cv. Corvina gene expression Atlas datamatrix | https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 | ||
Multi Experiment Viewer (MeV) | http://mev.tm4.org/#/welcome | ||
Sequence Read Archive (SRA) | https://www.ncbi.nlm.nih.gov/sra | ||
R | https://www.r-project.org/ | ||
EMBOSS Needle (EMBL-EBI) | http://www.ebi.ac.uk/Tools/psa/emboss_needle/ |