A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes

Christoph N. Schlaffner; Georg J. Pirklbauer; Andreas Bender; Judith A.J. Steen; Jyoti S. Choudhary

doi:10.3791/57633

JoVE Journal > Genetics

Genetics

En Fast og kvantitativ metode til posttranslationel modifikation og Variant aktiveret kortlægning af peptider til genomer

Published: May 22, 2018

doi:

10.3791/57633

Christoph N. Schlaffner^2,3, Georg J. Pirklbauer, Andreas Bender, Judith A.J. Steen, Jyoti S. Choudhary⁴

¹Department of Neurobiology, F. M. Kirby Neurobiology Center,Boston Children’s Hospital, Harvard Medical School, ²Proteomic Mass Spectrometry,Wellcome Trust Sanger Institute, Wellcome Genome Campus, ³Centre for Molecular Informatics, Department of Chemistry,University of Cambridge, ⁴Functional Proteomics Group, Chester Beatty Laboratories,Institute of Cancer Research

Summary

Her præsenterer vi værktøjet proteogenomic PoGo og protokoller for hurtig, kvantitative, posttranslationel modifikation og variant aktiveret kortlægning af peptider identificeret gennem massespektrometri på reference genomer. Dette værktøj er nyttig til at integrere og visualisere proteogenomic og personlige proteom undersøgelser grænseflade med ortogonale genomforskning data.

Abstract

Cross-talk mellem gener, udskrifter og proteiner er nøglen til cellulære svar; Derfor, analyse af molekylære niveauer som særskilte enheder langsomt bliver forlænget til Integrativ undersøgelser for at øge forståelsen af Molekylær dynamik inden for celler. Nuværende værktøjer til visualisering og integration af proteomics med andre omik datasæt er utilstrækkelige for store undersøgelser. Desuden, de kun fange grundlæggende sekvens identificere, udsmid posttranslationelle modifikationer og kvantitering. For at løse disse problemer, udviklet vi PoGo til at tilknytte peptider med tilhørende posttranslationelle modifikationer og kvantificering referere genom anmærkning. Derudover blev værktøjet udviklet for at aktivere tilknytning af peptider identificeret fra tilpassede sekvens databaser indarbejde enkelt aminosyre varianter. Mens PoGo er en befale kø værktøj, den grafiske grænseflade PoGoGUI muliggør ikke-Bioinformatik forskere nemt tilknytte peptider til 25 arter understøttes af Ensembl genom anmærkning. Den genererede output låner filformater fra feltet genomforskning, og derfor, visualisering understøttes i de fleste genom browsere. For store undersøgelser, er PoGo understøttet af TrackHubGenerator til at oprette web-tilgængelig repositories data knyttet til genomer, der også giver en nem deling af proteogenomics data. Med lille indsats, kan dette værktøj kort millioner af peptider til referencer genomer inden for kun et par minutter, udkonkurrerer de andre tilgængelige sekvens-identitet baseret værktøjer. Denne protokol viser de bedste metoder for proteogenomics kortlægning gennem PoGo med offentligt tilgængelige datasæt af kvantitative og fosfoproteomanalyse, såvel som omfattende undersøgelser.

Introduction

Påvirke hinanden til at modulere en reaktion på interne og eksterne stimuli og interagere med hinanden for at udføre specifikke opgaver fører til sundhed og sygdom i celler, genom, transkriptom og proteomet. Derfor, kendetegner og kvantificere gener, udskrifter og proteiner er afgørende for at fuldt ud forstå cellulære processer. Next generation sequencing (NGS) er en af de mest almindeligt anvendte strategier til at identificere og kvantificere gen og udskrift udtryk. Protein udtryk vurderes almindeligvis af massespektrometri (MS). Betydelige fremskridt i MS teknologi i det sidste årti har aktiveret mere en fuldstændig identificering og kvantificering af proteomes, at gøre dataene sammenlignelige med transcriptomics¹. Proteogenomics og multi-omik som måder at integrere NGS og MS data er blevet kraftig tilgange til at vurdere cellulære processer på tværs af flere molekylære niveauer, at identificere undertyper af kræft og fører til nye potentielle lægemiddel mål i kræft² ^, ³. det er vigtigt at bemærke, at proteogenomics blev oprindeligt brugt til at dokumentere proteom gen og udskrift anmærkninger⁴. Flere gener tidligere menes at være ikke-kodende har for nylig gennemgået revurdering overvejer omfattende menneskelige væv datasæt⁵^,⁶^,⁷. Derudover bruges proteom data med succes til at støtte anmærkning bestræbelser på ikke-modelorganismer⁸^,⁹. Dog proteogenomic dataintegration kan udnyttes yderligere fremhæve protein udtryk i forbindelse med genomisk funktioner og belyse cross-talk mellem udskrifter og proteiner ved at tilbyde en kombineret referencesystem og metoder til Co visualisering.

For at skabe en fælles reference for proteomics og transcriptomics genomforskning data, er talrige værktøjer blevet gennemført for kortlægning peptider identificeret gennem MS på genom koordinater¹⁰^,¹¹^,¹² ^,¹³^,¹⁴^,¹⁵^,¹⁶^,¹⁷. Tilgange forskellige aspekter såsom kortlægning reference, støtte af genom browsere, og graden af integration med andre proteomics værktøjer som vist i figur 1. Mens nogle værktøjer kort omvendt oversatte peptider ind på en genom¹⁶, bruger andre en søgning motor kommenteret position inden for et protein og gen annotation for at rekonstruere nucleotidsekvensen af peptid¹⁵. Stadig bruger andre en 3 – eller 6-frame oversættelse af genomet for at kortlægge peptider mod¹¹^,¹³. Endelig, flere værktøjer springe nukleotidsekvenser og bruge aminosyre sekvens oversættelser fra RNA-sekventering kortlagt udskrifter som et mellemprodukt, der skal tilknyttes den tilknyttede genom koordinater¹⁰^,¹²^{, peptider} ¹⁴^,¹⁷. Men oversættelsen af nukleotidsekvenser er en langsom proces og brugerdefinerede databaser er tilbøjelige til at fejl, som overføres til peptid kortlægning. For hurtig og høj overførselshastighed kortlægning er en lille og omfattende reference afgørende. Standardiserede protein reference med tilhørende genom koordinater er derfor afgørende for korrekt peptid genom kortlægning. Nye aspekter i proteogenomics, såsom indarbejdelse af varianter og posttranslationelle modifikationer (PTMs)²^,³, vinder momentum gennem de seneste undersøgelser. Disse er dog generelt ikke understøttes af aktuelle proteogenomic kortlægning værktøjer, som vist i figur 1. For at forbedre hastigheden og kvaliteten Mapping, blev PoGo udviklet, et værktøj, der giver mulighed for hurtig og kvantitativ kortlægning af peptider til genomer¹⁸. PoGo kan desuden kortlægning af peptider med op til to sekvens varianter og kommenteret posttranslationelle modifikationer.

PoGo er udviklet til at håndtere den hurtige stigning af kvantitative høj opløsning datasæt fanger proteomes og globale ændringer og giver en central hjælpeprogram for omfattende analyser som personlige variation og præcision medicin. Denne artikel beskriver anvendelsen af dette værktøj til at visualisere tilstedeværelsen af posttranslationel modifikation i forbindelse med genomisk funktioner. Desuden, denne artikel fremhæver identifikation af alternative splejsning begivenheder gennem tilknyttede peptider og kortlægning af peptider identificeret via brugerdefinerede variant databaser til en reference genom. Denne protokol beskæftiger offentligt tilgængelige datasæt hentet fra stolthed arkiv¹⁹ at demonstrere disse funktionaliteter på PoGo. Derudover beskriver denne protokol anvendelsen af TrackHubGenerator til oprettelse af online tilgængelige hubs af peptider tilknyttet genomer for storstilet proteogenomics undersøgelser.

Protocol

1. forberedelse, Download og installation Bemærk: I fil og omslag sti eksempler er vist i en Windows-format for at lette adgangen til standardbrugere. PoGo og PoGoGUI er også tilgængeligt til macOS og Linux operativsystemer. Download PoGo og PoGoGUI fra GitHub Åbn en webbrowser og navigere til PoGo på GitHub (http://github.com/cschlaffner/PoGo/). Vælg udgivelser og hente den nyeste udgivelse zip komprimerede fil. Uddrag den komprimerede fil i mappen eksekverbare filer (f.eks.C:\PoGo\executables\). Navigere i web gennemser hen til PoGoGUI på GitHub (http://github.com/cschlaffner/PoGoGUI/). Vælg udgivelser og hente den nyeste udgivelse jar fil (f.eks “PoGoGUI-v1.0.2.jar”). Gemme jar-filen i mappen eksekverbare filer. Download genom annotation og oversatte protein-kodning sekvenserBemærk: Download genom annotation og oversatte protein-kodning sekvenser for understøttede arter fra GENCODE7 (www.gencodegenes.org) eller Ensembl20 (www.ensembl.org) i den generelle overføre Format (GTF) og protein-sekvenser i FASTA format. I webbrowseren, navigere hen til www.gencodegenes.org og vælg Data | Menneskelige | Aktuelle udgave. Download omfattende-gen anmærkning via linket GTF og uddrag den gz-komprimeret fil til mappen data (f.eks.C:\PoGo\Data\) ved hjælp af en unzipping program (f.eks., 7-Zip). Download Protein-kodning udskrift oversættelse sekvenser via linket FASTA og uddrag den gz-komprimeret fil til mappen data genereret i det foregående trin. Alternativt, navigere i web gennemser hen til www.ensembl.org og vælg Downloads efterfulgt af downloade data via FTP. Finde en understøttet arter (f.eks.menneskerettigheder). Download den nyeste release-filen til udskrift anmærkning ved hjælp af GTF link i kolonnen gen sæt . Vælg fil med navnet struktur “species.release.gtf.gz” og uddrag den gz-komprimeret fil til mappen data. Download den nyeste release protein-kodning udskrift oversættelse sekvenser ved hjælp af FASTA link i kolonnen Protein rækkefølge (FASTA) . Vælg fil med navnet struktur “species.release.pep.all.fa.gz” og uddrag den gz-komprimeret fil til mappen data. Forberede peptid identifikation filerBemærk: PoGo understøtter kun 4 til kolonneformat, der indeholder sample id, peptid sekvens, antallet af peptid-spektrum-kampe (PSMs) og kvantitativ værdi. Men PoGoGUI understøtter standardiseret identifikation fil formater mzIdentML, mzid og mzTab, og konverterer dem til Pogo’s 4-kolonne format ved hjælp af offentligt tilgængelige ramme ms-data-kerne-api21. Filer i mzIdentML, mzid eller mzTab format kan downloades fra stolthed arkiv19. Alternativt kan dataene leveres i en tabulatorsepareret filformat med filtypenavnet .tsv eller .pogo. Formatet indeholder 4 kolonner med følgende kolonneoverskrifter: sample id (prøve), peptid sekvenser (peptid), antallet af peptid-spektrum-kampe (PSMs) og peptid kvantitering (Quant). Et eksempel er vist i figur 2. Download en eksempelfil i mzTab-format fra en proteomics undersøgelse på menneskelige testis fra stolthed arkiv19 (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files22). Gemme og udtrække den gz-komprimeret fil til mappen data skabt taktfast 1.2.1.Bemærk: Alternativt downloade eksempeldata for menneskelige fosfoproteomanalyse søges med MaxQuant fra stolthed arkiv (fil “Traktman_2013_MaxQuantOutput-full.zip” fra https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files23). Opspare og uddrag den zip-komprimeret fil i mappen data, der blev oprettet i trin 1.2.1. Åbn et tomt regneark og importere peptides.txt fil fra mappen C:/PoGo/Data/Traktman_2013_MaxQuantOutput-fuld/kombineret/txt/ved hjælp af indstillingen Data | Fra tekst/CSV. Klik på Redigeri vinduet åbning. Fjerne alle kolonner undtagen “Sekvens”, “Eksperiment BR1”, “Eksperiment BR2”, “Eksperiment BR3”, “Ratio H/L normaliserede BR1”, “Ratio H/L normaliserede BR2” og “Forholdet H/L normaliserede BR3”. Vælg kolonnerne “Ratio H/L normaliserede BR1”, “Ratio H/L normaliserede BR2” og “Forholdet H/L normaliserede BR3” og klik på Transform | Unpivot kolonner. Vælg kolonnerne “Eksperiment BR1”, “Eksperiment BR2” og “Eksperiment BR3” og Gentag handlingen unpivot. Vælg den resulterende kolonne “Attribut” og opdele indholdet ved hjælp af Transform | Opdele kolonne | Af afgrænser. Vælg plads som afgrænser i drop-down menuen. Gentag handlingen for kolonnen “Attribute.1”. Fjern de deraf følgende kolonner “Attribute.1.1”, “Attribute.2”, “Attribute.3” og “Attribute.1.1.1”. Tilføje en kolonne ved hjælp af Tilføj kolonne | Brugerdefinerede kolonne indstilling. Tilpasse kolonneformlen brugerdefinerede repræsenterer følgende: “= [Attribute.4]=[Attribute.1.2]”. Anvende et filter til den genererede brugerdefinerede kolonne til at filtrere alle linjer, der indeholder “Falsk”; kun linjer, der indeholder “TRUE” vil forblive. Fjern kolonnerne “Attribute.1.2” og “Brugerdefineret” og ændre rækkefølgen af de resterende kolonner med følgende: “Attribute.4”, “Sekvens”, “Value.1” og “Værdi”. Ændre kolonnenavne “Eksperiment”, “Peptid”, “PSMs” og “Quant”, henholdsvis. Indlæse filen ved hjælp af hjem | Luk & indlæse. Gem filen som en tabulatorsepareret fil ved hjælp af fil | Gem som , og vælg “Tekst (tabulatorsepareret) (*. txt)”. Ændre navn til “peptides_pogo.txt” og gemme det i mappen C:/PoGo/Data. 2. kortlægning af peptider med kommenteret posttranslationelle modifikationer og visualisering herunder kvantitering Bemærk: Den resulterende output-fil kan indlæses i en genom browser støtte browseren Extensible Data (BED) format. Et udvalg af browsere er Integrativ genom Browser (IGV)24 (som bruges i det følgende), UCSC genom Browser25og Ensembl genom Browser20. Det er vigtigt at bemærke, at de anmærkning GTF og protein FASTA versioner bruges til PoGo kortlægning svarer til versionen af genomet i genom-browser. For den menneskelige Ensembl udgivelser 57-75 og GENCODE versioner 3d-19, brug GRCh37/hg19; Ensembl versioner 76 eller højere og GENCODE 20 eller højere, bruge en GRCh38/hg38. Mus Ensembl versioner 74 eller højere og GENCODE M2 eller højere, benytte GRCm38. Kort peptider ved hjælp af PoGoGUI (se figur 3). Naviger til mappen eksekverbare filer. Start programmet ved at dobbeltklikke på ikonet PoGoGUI-vX.X.X.jar.Bemærk: Den grafiske brugergrænseflade vil starte og giver mulighed for nem og visuel markering af indstillinger. Brug knappen Vælg ud for “PoGo eksekverbare”. Derefter navigere i mappen eksekverbare filer til de relevante operativsystemer undermappe (f.eks.C:\PoGo\Executables\Windows\). Vælg eksekverbare af PoGo (f.eks.PoGo.exe) og bekræfte sit valg ved at klikke på knappen Åbn . Vælg reference inputfilen for protein sekvenser ved at klikke på Vælg. Navigere til data mappen og vælg FASTA oversættelsesfil. Bekræfte sit valg ved at klikke på knappen Åbn . Vælg filen udskrift anmærkning ved hjælp af knappen Vælg . Navigere til data mappen og vælg annotering GTF fil. Bekræfte valget ved at klikke på knappen Åbn . Tilføj filen peptid identifikation — fil flervalgstilstanden aktiveret — ved hjælp af knappen Tilføj ud for “Peptid filer”. Vælg en fil i understøttet format mzTab, mzIdentML eller mzid, eller i tabulatorsepareret 4-kolonneformatet downloadet og forberedt i trin 1.3. Fjern markeringen i afkrydsningsfelterne ved siden af SENGEN og GTF i output formater markering. Kun forlade PTM seng og GCT tjekket. Vælg den relevante art til dataene fra drop-down udvælgelse. Det er væsentligt, at filen FASTA, filen GTF og drop-down udvælgelse er for de samme arter. Start kortlægning ved at klikke på knappen START .Bemærk: Hvis det er nødvendigt, PoGoGUI vil konvertere input-filen til pogo format, give pogo filer i samme mappe for fremtidige bekvemmelighed og starte tilknytningsprocessen. Konvertering af en enkelt mzTab fil har hentet i trin 1.3.1 vil vare mellem 10-20 min før kortlægning påbegyndes. Visualisering i Integrativ genomforskning viewerBemærk: Se figur 4. Indlæse filen PoGo ender i “_ptm.bed” i IGV gennem fil | Belastning fra filen og vælge filen.Bemærk: På grund af størrelse, nogle filer kan kræve generation af indekstal til at tillade en hurtig genpålæsning og genomisk Regionsudvalget. IGV vil brugeren automatisk til generation. Følg instruktionerne er angivet. Gentag trinnet lastning for filen ender i “_noptm.bed”. Denne fil indeholder alle peptider fundet uden ændringer. Bemærk, at hver indlæst fil vil blive vist som separate spor med navnet på den fil identificere sporet. Omarrangere spor ved at trække og slippe dem til den ønskede placering på listen. Bemærk, at hvert spor er oprindeligt vist på en skjult måde. At udvide dem, skal du højreklikke på navnet spor og vælge enten udvidet til en fuld visning af peptider herunder sekvenser eller squished for en stablet visning. Gentag trinnet lastning for filen ender i “.gct”. Denne fil indeholder peptid kvantitering pr. kommenteret prøve. I modsætning til for de filer indlæses over, vil hver kommenteret prøve indlæses som et separat spor. Omorganisere prøver via træk og slip. Navigere i genomet ved at vælge et kromosom i drop-down menuen, Skriv genomisk koordinater, søge et gen symbol, eller klik på og hold nede for at vælge en sektion af et kromosom til at zoome ind. 3. kortlægning peptider identificeret gennem en brugerdefineret Variant Database til en Reference genom Bemærk: PoGo kortlægning kan udføres ved hjælp af den grafiske brugergrænseflade (GUI) eller via kommandolinjen interface. De er indbyrdes udskiftelige. I denne del af protokollen bruges kommandolinjen interface til at fremhæve udskiftelighed. Den anden del af denne protokoltjenesten kræver software værktøj R26. Kontroller, at pakken er installeret. Kort reference peptider til reference genom. Lukke op en befale lynhurtig (cmd), og navigere til mappen eksekverbare filer af PoGo (f.eks.C:\PoGo\Executables\). Skriv kommandoen nedenfor:PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES Erstat \PATH\TO\GTF, \PATH\TO\FASTA og \PATH\TO\IN med stier til anmærkning GTF, protein sekvens FASTA og peptid identifikation fil (i formatet 4-kolonne med fil slutter “.tsv” eller “.pogo”). Også erstatte MYSPECIES med de arter, der er konsistente med data (f.eks. menneskerettigheder). Bekræfte udførelsen ved at trykke på “Enter”-tasten. Vent til udførelsen er færdig før skrider alle yderligere.Bemærk: Dette kan tage et par minutter. Den resulterende fil vil blive gemt i samme mappe som filen peptid input og vil blive betragtet som \PATH\TO\OUT.pogo.bed i det følgende. Uddrag kun variant peptider fra inputfilen. Åbne R og belastning input filen \PATH\TO\IN ved hjælp af følgende kommando:inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t") Indlæse de allerede kortlagt peptider ved hjælp af kommandoen:mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE) Fjerne peptider, der var allerede afbildet fra inputdata:peptidesnotmapped <-inputdata [! () inputdata$ peptid % i % mappedpeptides$ V4)] Udskrive de ikke-tilknyttede peptider ind i en ny input fil:Write.table (peptidesnotmapped, “PATH\TO\IN.notmapped.pogo”, header = FALSE, sep = “\t”, col.names=TRUE,row.names=FALSE,quote=FALSE) Kortlægge de resterende peptider til reference genomet giver uoverensstemmelser. Som i trin 3.1, åbne kommandoprompten og navigere til mappen eksekverbare filer på PoGo. Skriv kommandoen nedenfor giver 1 aminosyre uoverensstemmelse og erstatte \PATH\TO\GTF, \PATH\TO\FASTA og \PATH\TO\IN.notmapped.pogo med stier til anmærkning GTF, protein sekvens FASTA og peptid identifikation fil oprettet i trin 3.2. Også erstatte MYSPECIES med de arter, der er konsistente med data (f.eks.menneskerettigheder). PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES -mm 1 Bekræfte den kommandoudførelse ved at trykke på “Enter”-tasten. Vent til udførelsen er færdig før skrider alle yderligere.Bemærk: Dette kan tage et par minutter. Den resulterende fil vil blive gemt i samme mappe som filen peptid input og vil blive betragtet som \PATH\TO\OUT.pogo_1MM.bed i det følgende. Visualisere peptider kortlagt uden og med uoverensstemmelse i IGV som beskrevet i trin 2.2. 4. kortlægning ved hjælp af flere filer og generere spor Hubs for store datasæt Kortlægning peptider fra flere filer ved hjælp af PoGoGUI Navigere hen til startbar mappen og starte programmet GUI ved at køre PoGoGUI-vX.X.X.jar. Vælg den PoGo eksekverbare fil til operativsystemet i brug (her Linux), samt reference input protein-sekvenser FASTA fil og filen anmærkning GTF, som beskrevet i protokollen trin 2.1.2 – 2.1.4. Tilføje peptid identifikation filer ved hjælp af knappen Tilføj ud for “Peptid filer”; flere valg-fil er aktiveret, samt træk og slip ind i det tomme felt nedenunder “Peptid filer”. Fjern markeringen i afkrydsningsfelterne ud for PTM seng, GTF og GCT i afsnittet output formater og kun forlade SENGEN tjekket. Vælg indstillingen Flet flere input filer til enkelt output.Bemærk: Dette vil resultere i en enkelt output-fil, der kombinerer alle peptider af input-filer. Forlader denne mulighed for unselected vil resultere i en sekventiel udførelse af programmet for hvert input fil separat. Vælg den relevante art til dataene fra drop-down udvælgelse konsekvent med FASTA og GTF-filer. Start kortlægning ved at klikke på knappen START . Hvis det er nødvendigt, vil programmet konvertere input-filer til pogo format. Dette kan tage noget tid at udføre. I mellemtiden, hente de nødvendige værktøjer og scripts for spor hub generation. Forberede banen hub generation Åbn en webbrowser, gå til https://github.com/cschlaffner/TrackHubGenerator og downloade filen “TrackHubGenerator.pl”. Gem filen til mappen eksekverbare filer. I webbrowseren, navigere hen til www.hgdownload.soe.ucsc.edu/admin/exe/ og vælge mappen til operativsystemet i brug (her Linux). Download værktøj bedToBigBed og scriptet fetchChromSizes i eksekverbare filer mappe27. Generere en track hub fra tilknyttede peptiderBemærk: Når PoGoGUI er færdig med kortlægning af peptider, et spor hub kan automatisk genereres for alle de resulterende filer i seng format gemmes i den samme mappe. Lukke op en terminal rude og skrive følgende kommando:Perl TrackHubGenerator.pl sti/til/navnet forsamling FBED UCSC E-mail Erstatte sti/til/navn med en sti og navn til hubben spor (f.eks., ~/PoGo/Data/Mytrackhub), forsamling med den genom forsamling som anmærkningen er baseret (f.eks.hg38 for human), FBED med stien til den mappe, der indeholder de BED filer som hubben spor vil være grundlag (fx, ~/PoGo/Data/), UCSC med den mappe, hvor værktøjerne hentet fra UCSC er gemt (f.eks., ~/PoGo/Executables/), og E-mail med en e-mail-adresse til den ansvarlige for sporet hub. Bekræfte udførelsen ved at trykke på tasten “Enter”; kun vil blive en kort tid at afslutte. Overføre genererede spor hub (dvs., oprettede mappe ~/PoGo/Data/Mytrackhub/) med alle dens indhold til en web-tilgængelig FTP server.Bemærk: En FTP-server med en tilhørende webserver muliggør adgang til hubben spor via protokollerne ftp og http foretrækkes. Repositories github (github.com) og figshare (figshare.com) understøtter denne type adgang og kan bruges i stedet for en FTP server. Visualisere en track hub i UCSC genom browser I en webbrowser, gå til https://genome.ucsc.edu/ og vælg MyData | Spore Hubs. Klik på fanen My Hubs. Kopier URL-adressen til hubben spor i tekstfeltet.Bemærk: URL’EN består af serveradressen, spor hub placering og navn og hub.txt fil (f.eks., http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt). Indlæse hubben spor ved at klikke på Tilføj Hub.Bemærk: Hub vil blive indlæst, og en kort besked vises, med angivelse af detaljer af hubben track som navn, kontaktoplysninger på den ansvarlige for hubben spor og genom-assembly bruges. Hjemmesiden vil vende tilbage til hovedsiden. Vælg GenomeBrowser at komme ind i browservisning.Bemærk: Brugerdefinerede spor hub bliver vist øverst på listen. Hvis flere BED filer bygget grundlaget for hubben spor, vil hver af filerne være repræsenteret som en separat spor inden for hub.

Representative Results

En grafisk skildring fremhæve hvor fasen i en regelmæssig proteom arbejdsprocessen PoGo18 anvendes, samt downstream muligheder for visualisering, er vist i figur 5. Shotgun proteomics (dvs., proteolytiske fordøjelsen af proteiner efterfulgt af væskekromatografi kombineret med tandem massespektrometri) er et forberedende skridt af proteogenomic kortlægning. De resulterende tandem massespektre sammenlignes almindeligt teoretisk spectra stammer fra protein sekvens databaser. Proteogenomics undersøgelser indføre oversættelse sekvenser af roman udskrifter med kodning potentielle og ikke-synonym enkelt nucleotid varianter (SNVs) i den database, hvilket gør det svært nemt relatere disse tilbage til reference genom8. Den grafiske brugergrænseflade i PoGo (PoGoGUI) understøtter filformater for standardiseret rapportering af peptid id’erne fra massespektrometri eksperimenter og konverterer dem til forenklet 4-kolonne pogo format. PoGoGUI ombrydes kommandolinjeværktøjet PoGo og dermed giver mulighed for kortlægning af peptider på genom koordinater udnytte reference anmærkning af protein-kodning gener almindeligt leveres i GTF og oversatte udskrift sekvenser i FASTA format. Forskellige output-formater er genereret af PoGo at aktivere visualisering af forskellige aspekter af peptider identificeret gennem massespektrometri, herunder posttranslationelle modifikationer og peptid niveau kvantificering. Outputfiler i SENGEN kan yderligere konverteret og kombineret i online tilgængelige mapper kaldet track hubs. Enkelt output-filer, samt spor hubs, kan så visualiseres i browsere såsom UCSC genom Browser25, Ensembl genom Browser20, IGV24og Biodalliance28 (Se figur 5 nederst). Vi anvendte PoGo til reanalyse af udkastet menneskelige proteomet kort filtreret ved høj betydning som beskrevet i Wright et al. 7 og sammenlignet det med to andre værktøjer for proteogenomic kortlægning, nemlig iPiG14 og PGx10. Datasættet består 233,055 unikke peptider på tværs af 59 voksne og føtale væv resulterer i alt over 3 millioner sekvenser. PoGo overgik disse værktøjer i runtime (6,9 x og 96.4 x hurtigere, henholdsvis) og hukommelse skik (20% og 60% mindre hukommelse, henholdsvis) som vist i figur 618. Et eksempel på et succesfuldt tilknyttede peptid er vist i figur 7. Mens PoGo betydeligt overgik de andre værktøjer i hastighed og hukommelse, er det også i stand til kortlægning posttranslationelle modifikationer og kvantitative oplysninger i forbindelse med peptider på genomet. Figur 8A forestiller skematisk visualisering af formatet BED i en genom-browser for peptider kortlægning til en exon og på tværs af splejse vejkryds. PoGo udnytter indstillingen farve til at give nem visuel støtte med hensyn til unikke ved peptid kortlægning i genomet. Tilknytninger i rød angiver entydighed til en enkelt udskrift, mens sort højdepunkter tilknytning til et enkelt gen. Men peptid deles mellem forskellige udskrifter. Grå tilknytninger Vis et peptid delt mellem flere gener. Disse er, for eksempel, mindre pålidelige for kvantificering af et gen eller utroværdig at kalde udtryk af et gen. Indstillingen PTM BED af PoGo omdefinerer farvekode for at imødekomme forskellige typer af posttranslationelle modifikationer, som vist i figur 8B. Derudover angives PTMs med tykke blokke (Se fig. 8B). En enkelt PTM af en type er fremhævet af en tyk blok på placeringen af den modificerede aminosyre rester, mens flere PTMs af samme type er kalibreret af en tyk blok fra den første ændrede aminosyre til det sidste. Vi anvendes PoGo og efterfølgende TrackHubGenerator til et datasæt af 50 kolorektal cancer cellelinjer herunder hele proteomet og phosphoproteome29. Mens spor hub indlæst i UCSC genom-Browser viser peptider knyttet til genomet og fremhæver unikke tilknytningerne og de fosforylering steder (Se figur 9), er yderligere data fastsat i den supplerende mappe. GCT filer derefter aktivere visualisering af peptid og phosphopeptide kvantitering i forbindelse med genomisk. GCT filer giver dog ikke en let visualisering af peptider der spænder over splice vejkryds (Se figur 10 top). Peptider på tværs af splice knudepunkter er opdelt i deres respektive dele tilknytning til exons. Mens det er muligt at identificere splice peptider gennem de samme kvantitative værdier af exon tilknytninger, lastning sekvens-baserede kortlægning filer såsom seng eller GTF der forbinder exons af en tynd intron spanning line support fortolkning (Se figur 10 nederst). For at fremhæve nytten af variant aktiveret kortlægning, anvendte vi PoGo i to konfigurationer til et datasæt af menneskelige testis proteomet søgte mod neXtProt at jage for manglende proteiner ved hjælp af en multi enzym strategi22. NeXtProt består udover reference protein sekvenser over 5 millioner enkelt aminosyre varianter30. Kortlægning af peptider identificeres med en enkelt aminosyre variant understøttes ikke af andre kortlægningsværktøjer. 177,012 unikke peptider alt blev identificeret. Af disse, blev 99,8% (176,694) peptider først med succes kortlagt uden at tillade uoverensstemmelser. At fjerne dem fra listen over identificerede peptid resulterede i 0,2% (318) peptider, der efterfølgende blev tilknyttet giver en aminosyre substitution. Dette resulterede i 3,446 tilknytninger af 162 peptider, der ikke ville have været knyttet til reference genom med alle andre tilgængelige værktøj. Mens det gennemsnitlige antal tilknytninger herunder en uoverensstemmelse er høj, var 62 peptider knyttet til kun en enkelt locus, der angiver sande variant sekvenser. Et eksempel på et peptid kortlagt med en enkelt aminosyre udskiftning er fremhævet med dets sekvens og den oversatte genomisk sekvens i Figur 11. Figur 1. Visuel sammenligning af forskellige peptid til genom kortlægningsværktøjer. Sammenligningen er vist med hensyn til forskellige aspekter. Disse aspekter omfatter en kortlægning reference, niveau af integration i rammer og støtte til online og offline browsere. Derudover fremhæves roman aspekter af proteogenomics og deres indslag opbakning separat. PoGo kun mangler evnen til at direkte tilknyttes en genomet sekvens i forhold til andre værktøjer. Det understøtter dog alle nye funktioner, som de fleste andre værktøjer ikke understøtter. Venligst klik her for at se en større version af dette tal. Figur 2. Eksempel inputfilen for kortlægning peptider. PoGo accepterer input data i et tabulatorsepareret format med 4 kolonner. Kolonneoverskrifterne i den første linje er ‘Eksperimentere’, ‘Peptid’, ‘PSMs’ og ‘Quant’, som angiver i følgende linjer forsøget eller prøven id, peptid sekvens, antallet af peptid-spektrum kampe og en kvantitativ værdi for peptid, henholdsvis. Filtypenavne, der understøttes er *.txt, *.tsv og *.pogo. Venligst klik her for at se en større version af dette tal. Figur 3. PoGoGUI interface med fremhævet fremgangsmåde til fil valg og parameterindstillinger. Figuren viser trin til valg og uploade alle nødvendige filer og valg af indstillinger for kortlægning peptider med posttranslationelle modifikationer på det menneskelige reference genom. Venligst klik her for at se en større version af dette tal. Figur 4. Screenshot af Integrativ genomforskning Viewer (IGV) data uploade procedure. Figuren understreger trin til at uploade PoGo outputfiler i IGV browser. Det viser endvidere, mulighed for at udvide spor af tilknyttede peptider at fremhæve kortlægning og sekvens. Venligst klik her for at se en større version af dette tal. Figur 5. Forenklet arbejdsgang af skridt fra LC-MS/MS til visualisering i genom browsere. PoGo kortlægning følger identifikationen af peptider fra tandem massespektre. For at opnå tilknytning til genomet, udnytter PoGo reference anmærkning leveres som genom annotation (GTF) og afskriften oversættelse sekvenser (FASTA). Forskellige output formater er genereret, der kan indlæses separat i genom browsere. Derudover kan filer i seng format kombineres ind i spor hubs understøtter visualisering af store datamængder. Venligst klik her for at se en større version af dette tal. Figur 6. Benchmarking PoGo mod PGx og iPiG. PoGo udkonkurrerer de andre værktøjer på benchmarking. PoGo kortlægning 233,055 unikke peptider på tværs af 59 voksne og føtale væv resulterer i mere end 3 millioner sekvenser, og var på 6,9 x og 96.4 x hurtigere end PGx og iPiG, henholdsvis. Derudover kræves PoGo 20% og 60% færre hukommelse i forhold til PGx og iPiG, henholdsvis. Mens PoGo og PGx fuldført, resulterede iPiG i en hukommelsesfejl på 16 GB. Venligst klik her for at se en større version af dette tal. Figur 7. UCSC genom browser eksempelvisning af tilknyttede peptider. Figuren viser peptider knyttet til gen mTOR. Mens den kombinerede bane viser peptider der spænder over splice vejkryds og kortlægning kun til en exon med de tilknyttede sekvenser, fremhæve væv-specifikke numre kun tilknytning i et komprimeret format. Venligst klik her for at se en større version af dette tal. Figur 8. Skematisk af kortlægning visualisering og farvekodning. (A) i den standard BED outputfil, peptider kortlægning til en exon er vist som enkelt blokke (venstre), mens peptider kortlægning på tværs af flere exons højdepunkt exon dækker dele som blokke (til højre). Introner vises som tynde, sammenkæde linjer. PoGo markerer unikke ved kortlægning eller peptider til gener og udskrifter ved hjælp af en 3-lags system. (B) ud over strukturen blok af formatet BED PTM BED output fremhæver posttranslationelle modifikationer stilling som tyk blokke. Tilstedeværelsen af en enkelt PTM af en type fremhæver den modificerede aminosyre rester med en tyk blok, mens flere steder i den samme PTM kombineres i lange blokke, der spænder fra først til den sidste ændring site. Peptid tilknytninger er yderligere opdelt på PTM type og farve codec baseret på ændringen. Venligst klik her for at se en større version af dette tal. Figur 9. Spore hub visning i UCSC genom browser kolorektal cancer proteomet og phosphoproteome data. Hubben spor omfatter hele proteomet data samt phosphoproteome. Mens den røde farve i proteomet og phosphoproteome spor viser unikke i tilknytning til de enkelt udskrift af SFN, Vis spor ender på _ptm fosforylering websteder inden for peptider. Her, angiver den røde farve typen af ændring som fosforylering. Kun to peptider er blevet identificeret med hver viser en enkelt fosforylering (tyk blokke). Venligst klik her for at se en større version af dette tal. Figur 10. Visning af kolorektal cancer phosphopeptides og tilknyttede kvantificering i IGV. Figuren viser et undersæt af 50 kræft cellelinjer. Det viser endvidere fire kolonner af blokke i forskellige nuancer af lys rød. Farven angiver den relative forekomst fra low (hvid) til høj (rød). Mens de fire kolonner kan i første omgang føre til, at der er 4 peptider, bliver det klart med associerede sekvens-baserede GTF outputfilen at disse er i virkeligheden to peptider, hver spænder over en splejsning junction. Venligst klik her for at se en større version af dette tal. Figur 11. Visning af peptid med aminosyren variant i IGV. Figuren viser en peptid med en enkelt aminosyre variant knyttet til reference genom starten oversættelse af genet GPSM1. Varianten er placeret på aminosyre rester 8 og resultater i substitution af alanin til valin (A→V). Oversættelse sekvenser af de kommenterede udskrifter (blå) fremhæve variant i forhold til peptid sekvens. Venligst klik her for at se en større version af dette tal.

Discussion

Denne protokol beskriver, hvordan softwareværktøjet PoGo og dens anskuelighed brugergrænseflade PoGoGUI aktiverer en hurtig kortlægning af peptider på genom koordinater. Værktøjet tilbyder unikke funktioner som kvantitative, posttranslationel modifikation og variant-aktiveret tilknytning til genomer bruger reference anmærkning. Denne artikel viser metode på en storstilet proteogenomic undersøgelse og fremhæver dens hastighed og hukommelse effektivitet i forhold til andre tilgængelige værktøjer¹⁸. I kombination med værktøjet TrackHubGenerator, som skaber online tilgængelige hubs af genomisk og genom knyttet data, PoGo, med dens anskuelighed brugergrænseflade, gør det muligt for storstilet proteogenomics undersøgelser hurtigt visualisere deres data i genomisk sammenhæng. Derudover viser vi de unikke kendetegn ved PoGo med datasæt søgte mod variant databaser og kvantitative fosfoproteomanalyse²²^,²⁹.

Enkelt filer, såsom filen GCT giver værdifulde visualisering og links mellem peptid funktioner og genomisk loci. Det er dog vigtigt at bemærke, at en fortolkning baseret på disse alene kan være vanskelige eller misvisende på grund af deres begrænsning til enkelt aspekter af proteogenomics som entydighed, posttranslationelle modifikationer og kvantitative værdier. Det er derfor vigtigt at omhyggeligt vælge hvilke output-filer, indstillinger og kombinationer er passende for proteogenomic spørgsmålet ved hånden og ændre kombinationerne. For eksempel kunne oplysninger om unikke i tilknytning til en bestemt genomisk locus være af stor værdi for anmærkning af genomisk funktion⁷, mens kvantificering på tværs af forskellige prøver kan være mere relevante for undersøgelser vedrørende Genomisk funktioner til ændringer i protein overflod²⁹. Outputtet skal genereres af PoGo for hver indstilling. I tilfælde af ingen output genereres, eller tomme filer vises i outputmappe, anbefales det at tjekke de input filer til det ønskede indhold og det påkrævede filformat. I tilfælde hvor den filformat eller indhold ikke følger PoGo forventninger (f.eks., FASTA filen, der angiveligt indeholder udskrift oversættelse sekvenser indeholder nukleotidsekvenser af afskrifter), fejl beskeder vil bede brugeren om at kontrollere de input filer.

Begrænsninger i protokollen og værktøjet er for det meste baseret på genbrug af filformater, der almindeligvis anvendes i genomforskning. Nyorientering filformater, der bruges i genomforskning for proteogenomic programmer er ledsaget af specifikke begrænsninger. Disse er på grund af de forskellige sæt af krav til genom centreret visualisering af genomisk og proteogenomic data, såsom behovet for at visualisere posttranslationelle ændringer fra proteomics data. Dette er begrænset i genomforskning filformater af enkelt funktion skik. Mange tilgange og værktøjer er blevet udviklet for proteomics til trygt lokalisere posttranslationelle ændringer inden for peptid sekvenser³¹^,³²^,³³^,³⁴. Dog hindres visualisering af flere ændringer i en unik og mærkbar måde på genomet af strukturen af genomisk filformater. Derfor enkelt blokken visualiseringen af flere PTMs af samme type udgør ikke nogen tvetydighed af ændring steder men er en følge af de forskellige krav fra Fællesskabets genomforskning kun visualisere enkelt funktioner på et tidspunkt. Ikke desto mindre, PoGo har fordel af kortlægning posttranslationelle modifikationer på genomisk koordinater til at aktivere undersøgelser fokuseret på effekten af genomisk funktioner som enkelt nucleotid varianter på posttranslationelle modifikationer. Ved hjælp af PoGo øger variant kortlægning antallet af samlede tilknytninger. Men den unikke farvekodning af tilknyttede peptider fremhæver pålidelige tilknytninger fra upålidelige ones. Kortlægning af variant peptider identificeret fra kendte enkelt nucleotid varianter kan ledsages af visualisere de tilknyttede peptider sammen med varianter i VCF format. Denne måde farvekode, der angiver en upålidelig kortlægning af en variant peptid er underkendt ved tilstedeværelsen af den kendte nukleotid variant.

Et kritisk trin for at bruge PoGo er brugen af de korrekte filer og formater. Brugen af oversatte udskrift sekvenser som protein-sekvenser til at ledsage anmærkning i GTF format er de vigtigste kriterier. Et andet vigtigt element når overvejer at bruge PoGo for at kortlægge peptider med aminosyren uoverensstemmelser er hukommelse. Mens hukommelse-højeffektive for en standard ansøgning, fører den betydeligt og eksponentielt stigende antal mulige tilknytninger med én eller to mismatchproblemer til en tilsvarende eksponentiel stigning i hukommelse skik¹⁸. Vi foreslår en trinvis kortlægning som beskrevet i denne protokol først kort peptider uden uoverensstemmelser og fjerne dem fra sættet. De efterfølgende tidligere ikke-tilknyttede peptider derefter kan tilknyttes ved hjælp af en uoverensstemmelse og proceduren kan gentages med to uoverensstemmelser for peptider resterende ikke-tilknyttede.

Da gennemløb af massespektrometri steget betydeligt og undersøgelser interfacing genomisk og proteom data bliver hyppigere i de seneste år, er værktøjer til let aktiverer interfacing disse typer af data i det samme koordinatsystem mere og mere uundværlig. Værktøjet præsenteres her vil støtte behovet for at kombinere genomisk og proteom data til at forbedre forståelsen af Integrativ undersøgelser på tværs af små og store serier af kortlægning peptider ind på en reference anmærkning. Det er opmuntrende, er PoGo blevet anvendt til at tilknytte peptider til gen kandidater i samme format som reference annotation som støtte anmærkning roman gener udtrykt i menneskelige testis³⁵. Præsenteres her er uafhængig af databaser, som anvendes for peptid identifikation. Protokollen kan støtte i identifikationen og visualisering af roman oversættelse produkter ved hjælp af tilpasset input filer fra oversættelse sekvenser og tilhørende GTF filer fra RNA-seq eksperimenter.

Flere metoder og værktøjer med en lang række særlige programscenarier skal tilknyttes genomisk koordinater, lige fra kortlægning peptider direkte til genomet sekvens RNA-sekventering guidede kortlægning, peptider blevet indført¹⁰^, ¹¹ ^, ¹² ^, ¹³ ^, ¹⁴ ^, ¹⁵ ^, ¹⁶ ^, ¹⁷. men disse kan føre til manglende korrekt kort peptider når posttranslationelle modifikationer er til stede og fejl i de underliggende kortlægning af RNA-sekventering læser kan overføres til peptid niveau. PoGo er blevet udviklet til specielt overvinde disse forhindringer og håndtere den hurtige stigning af kvantitative høj opløsning proteom datasæt kan integreres med ortogonale genomforskning platforme. Værktøjet beskrevet her kan integreres i høj overførselshastighed arbejdsprocesser. Gennem den grafiske brugerflade PoGoGUI værktøjet er enkel at bruge og kræver ingen specialist Bioinformatik uddannelse.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dette arbejde blev finansieret af Wellcome Trust (WT098051) og NIH grant (U41HG007234) til GENCODE projekt.

Materials

PoGo (software)	NA	NA	https://github.com/cschlaffner/PoGo
PoGoGUI (software)	NA	NA	https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software)	NA	NA	https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software)	NA	NA	http://software.broadinstitute.org/software/igv/
UCSC genome browser (website)	NA	NA	https://genome.ucsc.edu/
GENCODE (website)	NA	NA	http://gencodegenes.org
Ensembl (website)	NA	NA	http://ensembl.org
bedToBigBed (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/

References

Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
The R Development Core Team. . R: A Language and Environment for Statistical Computing. , (2008).
Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Steen, J. A., Choudhary, J. S. A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes. J. Vis. Exp. (135), e57633, doi:10.3791/57633 (2018).

En Fast og kvantitativ metode til posttranslationel modifikation og Variant aktiveret kortlægning af peptider til genomer

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

En Fast og kvantitativ metode til posttranslationel modifikation og Variant aktiveret kortlægning af peptider til genomer

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below