Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

En rask og kvantitativ metode for post-translasjonell modifikasjon og Variant aktivert tilordning av peptider å genomer

Published: May 22, 2018 doi: 10.3791/57633

Summary

Her presenterer vi proteogenomic verktøyet PoGo og protokoller for rask, kvantitativ, post-translasjonell modifikasjon og variant aktivert tilordning av peptider identifisert gjennom massespektrometri på referanse genomer. Dette verktøyet er bruk for integrerer og visualisere proteogenomic og personlig proteomic studier grensesnitt med ortogonale genomikk data.

Abstract

Kryss-snakk mellom gener, utskrifter og proteiner er nøkkelen til mobilnettet svar; Dermed blir analyse av molekylære nivåer som forskjellige enheter langsomt utvidet til integrerende studier for å forbedre forståelsen av molekylære dynamikk i celler. Gjeldende verktøy for visualisering og integrering av Proteomikk med andre omics datasett er utilstrekkelig for store studier. Videre, de bare fange grunnleggende sekvens identifisere, forkaster post-translasjonell modifikasjoner og kvantifisering. For å løse disse problemene, utviklet vi PoGo slik peptider med tilhørende post-translasjonell modifikasjoner og kvantifisering referanse genomet merknad. I tillegg ble verktøyet utviklet for å aktivere tilordningen av peptider identifisert fra tilpassede sekvens databaser omfatter enkelt aminosyre varianter. PoGo er en kommandere line verktøyet, det grafiske grensesnittet PoGoGUI kan ikke-bioinformatikk forskere enkelt tilordne peptider til 25 arter støttes av Ensembl genomet merknad. Genererte produksjonen låner filformater fra feltet genomics og derfor visualisering støttes i de fleste genomet nettlesere. For omfattende studier, er PoGo støttet av TrackHubGenerator opprette webtilgjengelig repositories data tilordnet genomer som også gjør en enkel deling av proteogenomics data. Med litt innsats, kan dette verktøyet tilordne millioner av peptider referanse genomer bare noen få minutter, overgått andre tilgjengelige sekvens-identitet basert verktøy. Denne protokollen viser de beste metodene for proteogenomics kartlegging gjennom PoGo med offentlig tilgjengelig datasett av kvantitative og phosphoproteomics, samt store studier.

Introduction

I celler påvirker Genova, transcriptome og proteom hverandre å modulere svar på interne og eksterne stimuli og samhandle med hverandre til å utføre bestemte funksjoner fører til helse og sykdom. Derfor er karakterisere og kvantifisere gener, utskrifter og proteiner avgjørende for å fullt ut forstå cellulære prosesser. Neste generasjons sekvensering (NGS) er en av de oftest brukte strategiene for å identifisere og telle gene og transkripsjon uttrykk. Men er protein uttrykk vanligvis vurdert av massespektrometri (MS). Betydelige fremskritt i MS teknologien det siste tiåret har aktivert mer en fullstendig identifikasjon og måling av proteomes, gjør dataene sammenlignbare med transcriptomics1. Proteogenomics og multi-omics som måter å integrere NGS og MS har blitt kraftig tilnærminger å vurdere cellulære prosesser over flere molekylær nivåer, identifisere undergrupper av kreft og fører til romanen mulige narkotika mål i kreft2 , 3. det er viktig å merke seg at proteogenomics ble opprinnelig brukt proteomic beviser for gene og transkripsjon merknader4. Flere gener tidligere antatt å være ikke-koding har nylig gjennomgått reevaluation vurderer store menneskelig vev datasett5,6,7. I tillegg er proteomic data brukt til å støtte merknad arbeid i ikke-modellen organismer8,9. Men proteogenomic dataintegrering kan utnyttes videre høydepunkt protein uttrykk i forhold til genomisk funksjoner og belyse kryss-snakk mellom utskrifter og proteiner ved å tilby en kombinert referanse og metoder for co visualisering.

For å gi en felles referanse for Proteomikk, transcriptomics og genomikk data, er mange verktøy gjennomført for kartlegging peptider identifisert gjennom MS på genomet koordinater10,11,12 ,13,14,15,16,17. Tilnærminger forskjellige aspekter som kartlegging referanse, støtte for genomet nettlesere og graden av integrasjon med andre Proteomikk som vist i figur 1. Mens noen verktøy tilordne omvendt oversatt peptider på en genomet16, bruker andre en søkemotoren kommenterte plasseringen i et protein og gene merknad for å rekonstruere nukleotid sekvensen av peptid15. Fortsatt bruker andre en 3 - eller 6-ramme oversettelse av genomet tilordne peptider mot11,13. Til slutt, flere verktøy hoppe nukleotid sekvenser og bruke aminosyre sekvens oversettelser fra RNA-sekvensering tilordnet utskrifter som en mellomliggende peptider tilordnet den tilknyttede genom koordinater10,12, 14,17. Men oversettelsen av nukleotid sekvenser er en langsom prosess og egendefinerte databaser er utsatt for feil som overføres til peptid tilordningen. For rask og høy gjennomstrømming kartlegging er en liten og omfattende referanse avgjørende. Derfor er en standardisert protein referanse med tilknyttede genomet koordinater avgjørende for nøyaktig peptid til genomet kartlegging. Romanen aspekter i proteogenomics, for eksempel innlemmelse av varianter og post-translasjonell endringer (PTMs)2,3, er frammarsj gjennom studier. Men støttes disse vanligvis ikke av gjeldende proteogenomic kartlegging verktøy som vist i figur 1. For å forbedre hastigheten og kvaliteten på kartlegging, ble PoGo utviklet, et verktøy som gir rask og kvantitative tilordningen av peptider til genomer18. I tillegg kan PoGo tilordningen av peptider med to sekvens varianter og kommentert post-translasjonell modifikasjoner.

PoGo er utviklet for å takle den raske økningen av kvantitative høyoppløste datasett fange proteomes og globale endringer og gir et sentralt verktøy for store analyser som personlig variasjon og presisjon medisin. Denne artikkelen beskriver bruk av dette verktøyet for å visualisere tilstedeværelsen av post-translasjonell modifikasjon i forhold til genomisk funksjoner. Videre fremhever denne artikkelen identifikasjon av alternativ skjøting arrangementer gjennom tilordnede peptider og kartlegging av peptider identifisert gjennom egendefinerte variant databaser til en referanse genom. Denne protokollen bruker offentlig tilgjengelige datasett dataoverførte fra stolthet arkiv19 å demonstrere disse funksjonene av PoGo. I tillegg beskriver denne protokollen anvendelsen av TrackHubGenerator for etableringen av online tilgjengelig huber av peptider tilordnet genomer for store proteogenomics studier.

Protocol

1. forberedelse, nedlasting og installasjon

Merk: Eksemplene fil- og banen vises i en Windows-format for enkel tilgang for vanlige brukere. PoGo og PoGoGUI er også tilgjengelig for macOS og Linux operativsystemer.

  1. Last ned PoGo og PoGoGUI fra GitHub
    1. Åpne en nettleser og gå til PoGo på GitHub (http://github.com/cschlaffner/PoGo/). Velg utgivelser og dataoverføre det nyeste løslate zip komprimert arkiv. Ekstra det komprimerte arkiv inn i kjørbare filer mappen (f.eksC:\PoGo\executables\).
    2. Navigere i nettleseren til PoGoGUI på GitHub (http://github.com/cschlaffner/PoGoGUI/). Velg utgivelser og laste ned den nyeste versjonen jar fil (f.eks "PoGoGUI-v1.0.2.jar"). Lagre jar fil i mappen kjørbare filer.
  2. Last ned genomet Merknad og oversatte protein-koding sekvenser
    Merk: Last ned genomet Merknad og oversatte protein-koding sekvenser for støttede arter fra GENCODE7 (www.gencodegenes.org) eller Ensembl20 (www.ensembl.org) i den generelle overføre Format (GTF) og protein sekvenser i FASTA format.
    1. Naviger til www.gencodegenes.org i webleseren, og velg Data | Menneskelige | Gjeldende versjon. Last ned omfattende genet merknad via koblingen GTF og ekstra det gz-komprimert arkiv i data-mappen (f.eksC:\PoGo\Data\) med en unzipping program (f.eks, 7-Zip).
    2. Dataoverføre Protein-koding transkripsjon oversettelse sekvenser via koblingen FASTA og ekstra gz-komprimerte filen i datamappen som er generert i forrige trinn.
      1. Alternativt, gå i nettleseren til www.ensembl.org og velge nedlastinger etterfulgt av laste ned data via FTP. Finne støttede Art (f.eksHuman). Last ned den nyeste versjon filen for transkripsjon merknaden bruke GTF kolonnen Gene satt . Velg filen med navnet struktur "species.release.gtf.gz" og pakke ut filen gz-komprimert i data-mappen.
    3. Dataoverføre det nyeste løslate protein-koding transkripsjon oversettelse sekvenser ved hjelp av FASTA koble i Protein sekvens (FASTA) -kolonnen. Velg filen med navnet struktur "species.release.pep.all.fa.gz" og pakke ut filen gz-komprimert i data-mappen.
  3. Klargjøre peptid identifikasjon filer
    Merk: PoGo støtter bare en 4-kolonne-format som inneholder eksempel identifikator, peptid sekvens, peptid-spekteret-kamper (PSMs) og kvantitative verdi. Men PoGoGUI støtter standardisert identifikasjonsfil formater mzIdentML, mzid og mzTab, og konverterer dem til Pogo's 4-kolonne-format ved hjelp av offentlig tilgjengelige rammeverk ms-data-kjerne-api21. Filene i mzIdentML, mzid eller mzTab-format kan lastes ned fra stolthet arkiv19. Data kan også leveres i et tabulatordelt format med filtypen TSV eller .pogo. Formatet inneholder 4 kolonner med følgende kolonneoverskrifter: eksempel identifikator (eksempel), peptid sekvenser (peptid), antall peptid-spekteret-kamper (PSMs) og peptid kvantifisering (Quant). Et eksempel er vist i figur 2.
    1. Laste ned en eksempelfil i mzTab-format fra en Proteomikk studie om menneskelig testikkel stolthet arkiv19 (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files22).
    2. Lagre og ekstra det gz-komprimert arkiv i datamappen opprettet i trinn 1.2.1.
      Merk: Alternativt, dataoverføre eksempeldata for menneskelig phosphoproteomics søkte med MaxQuant fra stolthet arkivet (filen "Traktman_2013_MaxQuantOutput-full.zip" fra https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files23).
    3. Lagre og pakke ut zip-komprimerte filen i datamappen som ble opprettet i trinn 1.2.1.
    4. Åpne et tomt regneark og importere filen peptides.txt i mappen C:/PoGo/Data/Traktman_2013_MaxQuantOutput-full/kombinert/txt/alternativet Data | Fra tekst/CSV. Klikk Redigeri åpningsvinduet.
    5. Fjerne alle kolonner unntatt "Sequence" «Experiment BR1», «Experiment BR2», «Experiment BR3», "Ratio H/L normalisert BR1", "Ratio H/L normalisert BR2" og "Forholdet H/L normalisert BR3".
    6. Velg kolonnene "Forholdet H/L normalisert BR1", "Ratio H/L normalisert BR2" og "Forholdet H/L normalisert BR3" og klikk Transform | Unpivot kolonner. Velg kolonnene «Experiment BR1», "Eksperiment BR2" og "Eksperiment BR3" gjenta operasjonen unpivot.
    7. Velg den resulterende kolonnen "Attributt" og dele innholdet med Transform | Delt kolonne | Med skilletegn. Velg mellomrom som skilletegn i det miste-ned menyen. Gjenta operasjonen for kolonnen "Attribute.1".
    8. Fjern kolonnene resulterende "Attribute.1.1", "Attribute.2", "Attribute.3" og "Attribute.1.1.1".
    9. Legge til en kolonne med Legg til kolonne | Egendefinerte kolonnen alternativet. Tilpasse egendefinert kolonneformelen representerer følgende: "= [Attribute.4]=[Attribute.1.2]".
    10. Bruke et filter på den genererte egendefinerte kolonnen å filtrere ut alle linjer som inneholder "Falske"; bare linjer som inneholder "TRUE" vil forbli.
    11. Fjern kolonnene "Attribute.1.2" og "Custom" og endre rekkefølgen på de gjenværende kolonnene til følgende: "Attribute.4", "Sequence", "Value.1" og "Verdi".
    12. Endre kolonnenavn «Experiment», "Peptid", "PSMs" og "Quant", henholdsvis. Laste inn filen med hjem | Lukk og laste.
    13. Lagre filen som en tabulatordelt fil som bruker filen | Lagre som og velg "Tekst (tabulatordelt) (*.txt)". Endre navnet til "peptides_pogo.txt" og lagre den i mappen C:/PoGo/Data.

2. kartlegging peptider med kommenterte post-translasjonell modifikasjoner og visualisering inkludert kvantifisering

Merk: Resulterende utdatafilen kan lastes i en genome nettleser støtte leseren Extensible Data (SENG) format. Et utvalg av nettlesere er integrerende genomet nettleser (IGV)24 (som brukes i følgende) og UCSC genomet nettleser25Ensembl genomet nettleser20. Det er viktig å merke seg at de merknad GTF og protein FASTA versjonene brukes for PoGo tilordning med versjonen av genomet i genomet leseren. For menneskelige Ensembl utgivelser 57-75 og GENCODE versjoner 3d-19, bruk GRCh37/hg19; for Ensembl versjoner 76 eller høyere og GENCODE 20 eller høyere, bruk GRCh38/hg38. For mus Ensembl versjoner 74 eller høyere og GENCODE M2 eller høyere, bruk GRCm38.

  1. Tilordne peptider ved hjelp av PoGoGUI (se fig. 3).
    1. Naviger til mappen kjørbare filer. Start programmet ved å dobbeltklikke PoGoGUI-vX.X.X.jar.
      Merk: Det grafiske brukergrensesnittet vil starte opp og tillate enkel og visuelle valg av alternativer.
    2. Bruk Velg -knappen ved siden av "PoGo kjørbare". Deretter navigere i mappen kjørbare filer til aktuelle operativsystemer undermappen (f.eksC:\PoGo\Executables\Windows\). Velg kjørbart av PoGo (f.eksPoGo.exe) og bekrefte sin valg ved å klikke Åpne -knappen.
    3. Velg referanse inndatafilen for protein sekvenser ved å klikke Velg. Gå til data-mappen og velg FASTA oversettingsfilen. Bekrefte sin valg ved å klikke Åpne -knappen.
    4. Velg utskrift merknadsfilen ved hjelp av Velg -knappen. Gå til data-mappen og velg GTF merknadsfilen. Bekreft valget ved å klikke Åpne -knappen.
    5. Legge til filen peptid identifikasjon-flere filvalg er aktivert, ved hjelp av Legg til -knappen ved siden av "Peptid filer". Velg en fil i understøttet formatter mzTab, mzIdentML eller mzid, eller i tabulatordelt 4-kolonneformatet lastet ned og forberedt i trinn 1.3.
    6. Rotete avmerkingsboksene ved siden av SENGEN og GTF i output formater utvalg. Bare la PTM SENG og GCT sjekket.
    7. Velg den egnede arten for data fra det miste-ned utvalget. Det er viktig at FASTA filen, filen GTF, og rullegardinmenyen utvalget er for de samme artene.
    8. Start kartlegging ved å klikke START -knappen.
      Merk: Om nødvendig PoGoGUI vil konvertere inndatafilen i pogo formatter, gi pogo filene i samme mappe for fremtidige bekvemmelighet og starte tilordningen. Konvertering av et enkelt mzTab arkiv dataoverførte i takt 1.3.1 vil vare mellom 10-20 min før kartlegging videre.
  2. Visualisere i integrerende genomics visningen
    Merk: Se Figur 4.
    1. Laste PoGo utdatafilen slutter på "_ptm.bed" i IGV gjennom fil | Last fra fil og velg filen.
      Merk: På grunn av størrelsen noen filer krever generering av en indeks som tillater en rask omlader av genomisk regioner. IGV vil be brukeren automatisk til generasjon. Instruksjonene angitt.
    2. Gjenta trinnet lasting for filen i "_noptm.bed". Denne filen inneholder alle peptider funnet uten endringer.
    3. Merk at hver lastet fil vises som separate spor med navnet identifisere sporet. Endre rekkefølgen sporene ved å dra og slippe dem til ønsket plassering i listen.
    4. Merk at hvert spor vises først på en skjult måte. For å utvide dem, høyreklikk på sporets navn og velg utvidet for full oversikt av peptider inkludert sekvenser eller squished stablet vise.
    5. Gjenta trinnet lasting for filen i ".gct". Denne filen inneholder peptid kvantifisering per kommenterte prøve.
    6. I motsetning til for filer lastet ovenfor, lastes hver kommenterte prøve som et eget spor. Omorganisere prøver gjennom dra og slipp-operasjoner.
    7. Navigere i genomet ved å velge et kromosom i drop-down menyen, Skriv inn genomisk koordinater, søke et gen symbol, eller klikk og hold for å velge en del av et kromosom inn.

3. tilordne peptider identifisert gjennom en tilpasset Variant Database til en referanse Genome

Merk: PoGo kartlegging kan transporteres ut ved hjelp av det grafiske brukergrensesnittet (GUI) eller gjennom kommandolinjegrensesnittet. De er utskiftbare. I denne delen av protokollen, kommandolinjegrensesnittet til å markere ombyttbarhet. Den andre delen av denne protokollen delen krever programvare verktøyet R26. Kontroller at pakken er installert.

  1. Tilordne referanse peptidene til referanse genomet.
    1. Åpen en kommandere spørsmål (cmd), og navigere til mappen kjørbare PoGo (f.eksC:\PoGo\Executables\).
    2. Skriv inn kommandoen nedenfor:
      PoGo.exe - gtf \PATH\TO\GTF - fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES
      1. Erstatte den \PATH\TO\GTF, \PATH\TO\FASTA og \PATH\TO\IN med baner til merknaden GTF, protein sekvens FASTA og peptid identifikasjonsfilen (i 4-kolonne-format med fil "TSV" eller ".pogo") henholdsvis. Også erstatte MYSPECIES med arter konsekvent med data (f.eks Human).
    3. Bekreft kjøring ved å trykke "Enter"-tasten. Vent til kjøring er fullført før du utvikle noen ytterligere.
      Merk: Dette kan ta noen minutter. Filen lagres i samme mappe som peptid inndatafilen og anses som \PATH\TO\OUT.pogo.bed nedenfor.
  2. Pakk ut bare variant peptider fra inndatafilen.
    1. Åpne R og laste input fil \PATH\TO\IN bruke følgende kommando:
      inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t")
    2. Laste allerede tilordnet peptidene kommandoen:
      mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE)
    3. Fjerne peptider som var allerede tilordnet fra inputdata:
      peptidesnotmapped <-inputdata [! () inputdata$ peptid % i % mappedpeptides$ V4)]
    4. Skrive ut ikke-tilordnede peptidene til en ny inndatafilen:
      Write.Table (peptidesnotmapped, "PATH\TO\IN.notmapped.pogo", hodet = FALSE, sep = "\t", col.names=TRUE,row.names=FALSE,quote=FALSE)
  3. Tilordne gjenværende peptidene til referanse genomet tillater uoverensstemmelser.
    1. Som i trinn 3.1, åpne ledeteksten og navigere til mappen kjørbare PoGo.
    2. Skriv inn kommandoen nedenfor slik at 1 aminosyre feil og erstatte det \PATH\TO\GTF, \PATH\TO\FASTA og \PATH\TO\IN.notmapped.pogo med baner til merknaden GTF, protein sekvens FASTA og peptid identifikasjonsfil opprettet i trinn 3.2. Også erstatte MYSPECIES med arter konsekvent med data (f.eksHuman).
      1. PoGo.exe - gtf \PATH\TO\GTF - fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES -mm 1
    3. Bekreft kommandoen kjøres ved å trykke "Enter"-tasten. Vent til kjøring er fullført før du utvikle noen ytterligere.
      Merk: Dette kan ta noen minutter. Filen lagres i samme mappe som peptid inndatafilen og anses som \PATH\TO\OUT.pogo_1MM.bed nedenfor.
  4. Visualisere peptidene tilordnet uten og med feil i IGV som beskrevet i trinn 2.2.

4. kartlegging ved hjelp av flere filer og generere spor huber for store datasett

  1. Kartlegging peptider fra flere filer med PoGoGUI
    1. Naviger til mappen kjørbare filer og starte programmet GUI av running PoGoGUI-vX.X.X.jar.
    2. Velg PoGo kjørbare filen for operativsystemet i bruk (her Linux), og input protein sekvenser FASTA referansefil GTF merknadsfilen som beskrevet i protokollen trinnene 2.1.2 - 2.1.4.
    3. Legge til peptid identifikasjon filene ved hjelp av Legg til -knappen ved siden av "Peptid filer"; flere valg er aktivert, og dra-og-slipp i det tomme feltet under "Peptid filer".
    4. Rotete avkrysningsrutene ved PTM SENG, GTF og GCT i seksjonen formater og bare la SENG sjekket.
    5. Velg slå sammen flere inndata filer i én utgang.
      Merk: Dette vil resultere i en enkelt utdatafil kombinere alle peptider for inndatafiler. Leaving dette valget umarkert vil resultere i en sammenhengende kjøring av programmet for hver inndatafilen separat.
    6. Velg den egnede arten for data fra det miste-ned utvalget konsekvent med FASTA og GTF filer.
    7. Start kartlegging ved å klikke START -knappen. Om nødvendig vil programmet konvertere inndatafiler til pogo format. Dette kan ta litt tid å kjøre. I mellomtiden, Last ned de nødvendige verktøy og skript for spor hub generasjon.
  2. Forbereder spor hub generasjon
    1. Åpne en nettleser, gå til https://github.com/cschlaffner/TrackHubGenerator og laste ned filen "TrackHubGenerator.pl". Lagre filen til mappen kjørbare filer.
    2. I webleseren, gå til www.hgdownload.soe.ucsc.edu/admin/exe/ og velge mappen for operativsystemet i bruk (her Linux). Last ned verktøyet bedToBigBed og skriptet fetchChromSizes til de kjørbare mappe27.
  3. Generere en spor hub fra tilordnede peptider
    Merk: Når PoGoGUI er ferdig kartlegging peptidene, en spor hub kan genereres automatisk for alle resulterende filene i SENG-format som er lagret i samme mappe.
    1. Åpen en terminal vindu og type det fulgte kommandere:
      Perl TrackHubGenerator.pl BANENAVN/til/montering FBED UCSC e-post
      1. Erstatning/til/BANENAVN med en filbane og navn for sporet hub (f.eks, ~/PoGo/Data/Mytrackhub) montering med genom forsamlingen som merknaden er basert (f.ekshg38 for menneske), FBED med banen til mappen som inneholder den BED filer på spor huben skal baseres (f.eks, ~/PoGo/Data/) UCSC med mappen der verktøyene lastet ned fra UCSC lagres (f.eks, ~/PoGo/Executables/) og e-post med en e-postadresse for ansvarlige for sporet hub.
    2. Bekreft kjøring ved å trykke "Enter"-tasten; kjøringen tar bare kort tid å fullføre.
    3. Overføre genererte spor huben (dvs., den opprettede mappen ~/PoGo/Data/Mytrackhub/) med alt innholdet til en web-tilgjengelige FTP-server.
      Merk: En FTP-server med en tilknyttet webserver gir tilgang til spor huben via protokoller ftp og http foretrekkes. Repositories github (github.com) og figshare (figshare.com) støtter denne typen tilgang og kan brukes i stedet for en FTP-server.
  4. Visualisere en spor hub i UCSC genomet leseren
    1. I en webleser, gå til https://genome.ucsc.edu/ og velge MineData | Spore huber. Klikk kategorien My huber.
    2. Kopier URL-adressen til spor hub i tekstfeltet.
      Merk: URL består av serveradressen, spor navet sted og navnet og filen hub.txt (f.eks, http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt).
    3. Laste spor huben ved å klikke Legg til Hub.
      Merk: Hub vil bli lastet inn, og en kort melding vises, om detaljene i sporet huben som navn, kontaktinformasjon til ansvarlige for spor huben, og samlingen genomet brukes. Nettstedet tilbake til hovedsiden.
    4. Velg GenomeBrowser angi webleservisningen.
      Merk: Tilpassede spor huben vises øverst i listen. Hvis flere BED-filer innebygd grunnlaget for spor hub, vil hver av filene vises i et eget spor navet.

Representative Results

En grafisk fremstilling utheving som stadium av en vanlig proteomic arbeidsflyt PoGo18 er brukt, og nedstrøms alternativer med visualisering, er vist i figur 5. Hagle Proteomikk (dvs., proteolytisk fordøyelsen av protein etterfulgt av flytende kromatografi kombinert med tandem massespektrometri) er en precursory trinn av proteogenomic kartlegging. De resulterende tandem masse spectra er ofte sammenlignet med teoretisk spectra avledet fra protein sekvens databaser. Proteogenomics studier introdusere oversettelse sekvenser av romanen utskrifter med koding potensielle og ikke-synonymt single nukleotid varianter (SNVs) i databasen, gjør det vanskelig å enkelt relatere disse tilbake til referanse genomet8. Det grafiske brukergrensesnittet i PoGo (PoGoGUI) støtter filformatene for standardisert rapportering av peptid-IDer fra massespektrometri eksperimenter og konverterer dem til forenklet 4 kolonner pogo format. PoGoGUI brytes kommandolinjeverktøyet PoGo og dermed muliggjør tilordningen av peptider på genomet koordinater utnytte referanse merknaden av protein-koding gener vanligvis gitt i GTF og den oversatte transkripsjon sekvenser i FASTA format. Forskjellige utdataformater genereres av PoGo aktivere visualisering av ulike aspekter av peptider identifisert gjennom massespektrometri, inkludert post-translasjonell modifikasjoner og peptid nivå kvantifisering. Utdatafiler i SENGEN kan videre konverteres og kombinert i online tilgjengelige mapper kalt spor huber. Enkelt utdatafiler, samt spor huber, kan deretter visualiseres i nettlesere som UCSC genomet nettleser25, Ensembl genomet nettleser20, IGV24og Biodalliance28 (se figur 5 nederst).

Vi brukt PoGo til reanalysis av utkastet menneskelige proteom kart filtrert på høy betydning som beskrevet i Wright et al. 7 og forhold til to andre verktøy for proteogenomic kartlegging, nemlig iPiG14 og PGx10. Datasettet består 233,055 unike peptider over 59 voksne og fosterets vev resulterer i totalt over 3 millioner sekvenser. PoGo oppnådd disse verktøyene både kjøring (6,9 x og 96.4 x raskere, henholdsvis) og minnebruk (20% og 60% mindre minne, henholdsvis) som vist i figur 618. Et eksempel på en vellykket tilordnede peptid vises i figur 7.

Mens PoGo betydelig bedre resultater enn de andre verktøyene i hastighet og minne, er det også i stand til kartlegging post-translasjonell modifikasjoner og kvantitativ informasjon assosiert med peptider på genomet. Figur 8A viser skjematisk visualisering av SENGEN formatet i en genome leser for peptider kartlegging til ett ekson og over skjøte veikryss. PoGo benytter coloring kan gi enkel visuelt hjelpemiddel når det gjelder unikt peptid tilordningen i genomet. Tilordninger i rødt indikerer unikhet til en enkelt transkripsjon, mens svart høydepunktene tilordning til ett gen. Men er peptid delt mellom forskjellige transkripsjoner. Grå tilordninger viser et peptid deles mellom flere gener. Dette er for eksempel mindre pålitelig for kvantifisering av et gen eller upålitelige ringe uttrykk for et gen. Alternativet PTM SENG PoGo omdefinerer fargekode for å imøtekomme ulike typer post-translasjonell modifikasjoner som vist i figur 8B. I tillegg angis PTMs av tykk blokker (se figur 8B). En enkelt PTM en type er markert med en tykk blokk ved endrede aminosyre rester, mens flere PTMs av samme type er dannet av en tykk blokk fra den første endrede aminosyren til siste.

Vi brukt PoGo og TrackHubGenerator til et datasett på 50 tykktarmskreft linjer inkludert hele proteom og phosphoproteome29. Mens spor hub i UCSC genomet leseren viser peptidene tilordnet genomet og fremhever unikt tilordningene og fosforylering steder (se figur 9), tilbys flere data i mappen utvidet. GCT filene deretter aktivere visualisering av peptid og phosphopeptide kvantifisering i genomisk sammenheng. GCT filer gir imidlertid ikke en enkel visualisering av peptider strekker seg over skjøte veikryss (se Figur 10 topp). Peptidene over skjøte veikryss deles inn i sine respektive deler tilordning til exons. Mens det er mulig å identifisere skjøte peptider gjennom samme kvantitative verdiene for ekson tilordninger, lasting sekvens-baserte kartlegging filer som SENG eller GTF som kobler exons ved en tynn intron spenner line støtte tolkningen (se Figur 10 nederst).

For å markere nytten av variant aktivert tilordning, brukt vi PoGo i to konfigurasjoner til et datasett av menneskelig testikkel proteom søkte mot neXtProt å jakte på manglende proteiner ved hjelp av en multi enzym strategi22. NeXtProt består foruten referanse protein sekvenser over 5 millioner enkelt aminosyre varianter30. Tilordne peptider identifisert med en enkelt aminosyre variant støttes ikke av andre kartleggingsverktøy. Totalt 177,012 unike peptider ble identifisert. Av disse er ble 99.8% (176,694) peptider først tilordnet uten at uoverensstemmelser. Fjerne dem fra listen identifiserte peptid resulterte i 0,2% (318) peptider som senere ble tilordnet tillater en aminosyre substitusjon. Dette resulterte i 3,446 tilordninger av 162 peptider som ikke ville har blitt tilordnet til referanse genomet med andre tilgjengelige verktøy. Gjennomsnittlig antall tilordninger inkludert en konflikt er høy, ble 62 peptider tilordnet bare et enkelt locus, indikerer sant variant sekvenser. Et eksempel på et peptid kartlegger med en enkelt aminosyren erstatning utheves med sekvensen og oversatte genomisk rekkefølgen i Figur 11.

Figure 1
Figur 1. Visuelle sammenligning av ulike peptid-til-genome kartleggingsverktøy. Sammenligningen vises når det gjelder ulike aspekter. Disse aspektene inkluderer en kartlegging referanse, graden av integrasjon i rammer og støtte av online og offline kikkere. I tillegg romanen aspekter av proteogenomics og deres ansiktstrekk oppbacking utheves separat. PoGo bare mangler muligheten til å direkte tilordne et genom sekvensen sammenlignet med andre verktøy. Det støtter imidlertid alle romanen funksjoner som de fleste av de andre verktøyene ikke støtter. Klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2. Eksempel inndatafil kartlegging peptider. PoGo godtar inndataene i et tabulatordelt format med 4 kolonner. Kolonneoverskrifter i første linje er 'Eksperimentere', 'Peptid', 'PSMs' og 'Quant', angir følgende linjer eksperimentet eller prøve identifikator, peptid sekvensen, antall peptid-spektrum kamper og en kvantitativ verdi for peptid, henholdsvis. Filtypene som støttes er *.txt, *.tsv og *.pogo. Klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3. PoGoGUI grensesnitt med uthevet trinnene for filvalg og Parameteralternativer. Figuren viser fremgangsmåten for å velge og laste opp alle nødvendige filer og valg av alternativer for kartlegging peptider post-translasjonell modifikasjoner på menneskelig referanse genomet. Klikk her for å se en større versjon av dette tallet.

Figure 4
Figur 4. Skjermbilde av integrerende Genomics seer (IGV) data laste opp prosedyren. Figuren viser trinnene for opplasting PoGo utdatafiler i IGV leseren. Videre, det viser muligheten til å utvide sporet av tilordnede peptider å markere kartlegging og sekvens. Klikk her for å se en større versjon av dette tallet.

Figure 5
Figur 5. Forenklet arbeidsflyten slik fra LC--MS-/ MS visualisering i genomet nettlesere. PoGo kartlegging følger identifikasjon av peptider fra tandem masse spectra. For å oppnå at tilordningen skal genomet, benytter PoGo referanse merknad som genomet merknader (GTF) og transkripsjon oversettelse sekvenser (FASTA). Forskjellige output formater genereres som kan lastes ned separat i genomet nettlesere. I tillegg kan filer i SENGEN format kombineres i spor huber støtte visualisering av store datasett. Klikk her for å se en større versjon av dette tallet.

Figure 6
Figur 6. Benchmarking PoGo mot PGx og iPiG. PoGo utkonkurrerer de andre verktøyene på referansemåling. Kartlegging 233,055 unike peptider over 59 voksne og fosterets vev resulterer i over 3 millioner sekvenser, var PoGo 6,9 x og 96.4 x raskere enn PGx og iPiG, henholdsvis. Videre krevde PoGo 20% og 60% mindre minne sammenlignet PGx og iPiG, henholdsvis. Mens PoGo og PGx fullført, resulterte iPiG i en minnefeil på 16 GB. Klikk her for å se en større versjon av dette tallet.

Figure 7
Figur 7. UCSC genomet nettleser eksempel visningen av tilordnede peptider. Figuren viser peptider tilordnet genet mTOR. Mens kombinert sporet viser peptidene strekker seg over skjøte veikryss og tilordne bare til ett ekson med tilknyttede sekvenser, markere vev-spesifikke sporene bare tilordningen i et komprimert format. Klikk her for å se en større versjon av dette tallet.

Figure 8
Figur 8. Skjematisk av kartlegging visualisering og fargekoding. (A) standard SENG utdatafilen, peptider tilordning til ett ekson er vist som enkle blokker (venstre), mens peptider kartlegging over flere exons høydepunkt ekson dekker deler som blokker (høyre). Introns vises så tynn lenke sammen linjer. PoGo fargekoder unikt kartlegging eller peptider gener og utskrifter ved hjelp av en 3-lags system. (B) i tillegg til blokk strukturen av SENGEN format, PTM SENG utgang høydepunkter plasseringen av post-translasjonell modifikasjoner som tykk blokker. Tilstedeværelsen av en enkelt PTM en type høydepunkter endret aminosyre resten med en tykk blokk, mens flere områder i de samme PTM kombineres i lange blokker som spenner fra første til siste endring området. Peptid tilordninger deles videre av PTM av typen og fargen kodek basert på endringen. Klikk her for å se en større versjon av dette tallet.

Figure 9
Figur 9. Spore hub visning i UCSC genomet leseren av tykktarmskreft proteom og phosphoproteome. Spor hub består av hele proteom data samt phosphoproteome. Mens den røde fargen i proteom og phosphoproteome sporene angi unikt tilordningen til enkelt transkripsjon av SFN, viser spor i _ptm webområdene fosforylering i peptider. Her, indikerer den røde fargen typen endring som fosforylering. Bare to peptider er identifisert med hver viser en enkelt fosforylering (tykk blokker). Klikk her for å se en større versjon av dette tallet.

Figure 10
Figur 10. Tykktarmskreft phosphopeptides og tilknyttede kvantifisering i IGV. Figuren viser et delsett av de 50 kreftcelle linjene. Videre viser fire kolonner med blokker i ulike nyanser av lys rød. Farge angir den relative overfloden fra lav (hvit) til høy (rød). Mens fire kolonnene kan først føre til å tro at det er 4 peptider, blir det klart med tilhørende sekvens-baserte GTF utdatafilen at disse er faktisk to peptider, hver omfatter et skjøte knutepunkt. Klikk her for å se en større versjon av dette tallet.

Figure 11
Figur 11. Visning av peptid aminosyre varianten i IGV. Figuren viser et peptid med en enkelt aminosyre variant tilordnet referanse genomet ved oversettelse genet GPSM1. Varianten er plassert aminosyre rester 8 og resultater i substitusjon av alanin til Valin (A→V). Oversettelse sekvenser av kommenterte transkripsjoner (blå) Merk variant i forhold til peptid sekvensen. Klikk her for å se en større versjon av dette tallet.

Discussion

Denne protokollen beskriver hvordan Programvareverktøyet PoGo og grafisk brukergrensesnitt PoGoGUI aktiverer rask tilordning av peptider på genomet koordinater. Verktøyet tilbyr unike funksjoner som kvantitative, post-translasjonell modifikasjon og variant-aktivert tilordning til genomer bruker referanse merknad. Denne artikkelen viser metoden på en storstilt proteogenomic studie og fremhever sin hurtighet og minnekapasitet effektivitet sammenlignet med andre tilgjengelige verktøy18. I kombinasjon med verktøyet TrackHubGenerator, som skaper online tilgjengelig huber genomisk og genom knyttet data, PoGo, med grafisk brukergrensesnitt, gjør store proteogenomics studier raskt visualisere data i genomisk sammenheng. Videre viser vi de unike funksjonene til PoGo med datasett søkte mot variant databaser og kvantitative phosphoproteomics22,29.

Enkeltfiler, som filen GCT gir verdifull visualisering og koblinger mellom peptid funksjoner og genomisk loci. Det er imidlertid viktig å merke seg at en tolkning basert på disse alene kan være vanskelig eller misvisende på grunn av deres begrensning enkelt aspekter av proteogenomics som unikhet, post-translasjonell modifikasjoner og kvantitative verdier. Derfor er det viktig å nøye velge hvilke utdatafiler, alternativer og kombinasjoner er passende for proteogenomic spørsmålet for hånden og endre kombinasjonene. For eksempel kan informasjon om unikhet av tilordningen til et bestemt genomisk locus være av stor verdi for merknaden av en genomisk funksjon7, mens kvantifiseringen over ulike prøver kan være mer passende for studier knyttet genomic funksjoner endringer i protein overflod29. Utdataene skal genereres av PoGo for hver innstilling. Ingen utgang genereres, eller tomme filer vises i output-mappen, anbefales det å sjekke inndatafiler for det ønskede innholdet og nødvendig-filformatet. I tilfeller der filformat eller innhold ikke følger forventningene til PoGo (f.eksFASTA filen angivelig inneholder transkripsjon oversettelse sekvensene inneholder nukleotid sekvenser av transkripsjoner), feilmeldinger vil be brukeren om å Sjekk inndatafiler.

Begrensninger av protokollen og verktøyet er hovedsakelig basert på gjenbruk av filformatene som er vanlig i genomics. Gjenbruk filformater brukes i genomics for proteogenomic programmer er ledsaget av bestemte begrensninger. Dette er på grunn av de ulike settene med krav til genomet sentrert visualisering av genomisk og proteogenomic data, for eksempel behovet for å visualisere post-translasjonell endringer fra Proteomikk data. Dette er begrenset i genomics filformater av enkelt bruk. Mange tilnærminger og verktøy har blitt utviklet for Proteomikk å trygt lokalisere post-translasjonell endringer innen peptid sekvenser31,32,33,34. Men hindret effekten av flere endringer i en unik og synlig måte på genomet av strukturen i genomisk filformater. Derfor enkelt blokk visualisering av flere PTMs av samme type utgjør ikke noen tvetydighet av webområdene endring men er konsekvensen av ulike kravet fra genomics samfunnet å visualisere bare enkelt funksjoner samtidig. Likevel, PoGo har fordelen av kartlegging post-translasjonell modifikasjoner på genomisk koordinater aktivere studier fokuserte på effekten av genomisk funksjoner som single nukleotid varianter på post-translasjonell modifikasjoner. PoGo øker, variant kartlegging antall totale tilordninger. Imidlertid høydepunkter unik fargekoding av tilordnede peptider pålitelig tilordninger fra upålitelige seg. Tilordningen av variant peptider identifisert fra kjente single nukleotid varianter kan akkompagneres av visualisere tilordnede peptidene sammen med variantene i VCF format. Denne måten fargekoden indikerer en upålitelig tilordning av en variant peptid er overstyres av tilstedeværelsen av den kjente nukleotid varianten.

Et kritisk punkt for bruker PoGo er bruk av riktige filene og formater. Bruk av oversatt transkripsjon sekvenser som protein sekvenser med merknaden i GTF format er de viktigste kriteriene. Et annet viktig element når med PoGo for å kartlegge peptider med aminosyre uoverensstemmelser er minne. Mens minne høyeffektiv for et standard program, fører betydelig og eksponentielt økende antall mulige tilordninger med ett eller to uoverensstemmelser til en tilsvarende eksponentielle økning i minnet behandling18. Vi foreslår en trinnvis tilordning som beskrevet i denne protokollen først tilordne peptidene uten uoverensstemmelser og fjern dem fra. Etterfølgende tidligere lokal peptidene deretter kan tilordnes ved hjelp av en konflikt og fremgangsmåten kan gjentas med to uoverensstemmelser for peptidene gjenværende ikke er tilordnet.

Siden gjennomstrømningen av massespektrometri betydelig økt og studier grensesnitt genomisk og proteomic data blir stadig hyppigere i de senere årene, er verktøy å lett aktivere grensesnitt disse typer data i samme koordinatsystem stadig uunnværlig. Verktøyet presenteres her vil hjelpe behovet å kombinere genomisk og proteomic data å forbedre en bedre forståelse av integrerende studier over små og store datasett ved å tilordne peptider på en referanse merknad. Oppmuntrende, er PoGo brukt for å tilordne peptider til genet kandidater i samme format som referanse merknaden å støtte merknad innsats av romanen gener som er uttrykt i menneskelig testikkel35. Tilnærmingen presenteres her er uavhengig av databaser brukes for peptid identifikasjon. Protokollen kan hjelpe identifisering og visualisering av romanen oversettelsen produkter ved hjelp av tilpasset inndatafiler fra oversettelse sekvenser og tilknyttede GTF filer fra RNA-seq eksperimenter.

Flere tilnærminger og verktøy med en rekke spesielle databaser peptider tilordnet genomisk koordinater, fra kartlegging peptider direkte til det Genova orden til RNA-sekvensering guidet kartlegging, har blitt introdusert10, 11 , 12 , 13 , 14 , 15 , 16 , 17. men dette kan føre til riktig kart peptider når post-translasjonell modifikasjoner finnes og feil i underliggende tilordningen av RNA-sekvensering kan overføres til peptid nivå. PoGo har blitt utviklet spesifikt overvinne disse hindringene og å takle den raske økningen av kvantitative høyoppløste proteomic datasett å integrere med ortogonale genomics plattformer. Verktøyet beskrevet her kan integreres med høy gjennomstrømming arbeidsflyter. Gjennom det grafiske grensesnittet PoGoGUI, verktøyet er enkelt å bruke og krever ingen spesialist bioinformatikk opplæring.

Disclosures

Forfatterne ikke avsløre.

Acknowledgments

Dette arbeidet ble finansiert av Wellcome Trust (WT098051) og NIH grant (U41HG007234) i GENCODE-prosjektet.

Materials

Name Company Catalog Number Comments
PoGo (software) NA NA https://github.com/cschlaffner/PoGo
PoGoGUI (software) NA NA https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software) NA NA https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software) NA NA http://software.broadinstitute.org/software/igv/
UCSC genome browser (website) NA NA https://genome.ucsc.edu/
GENCODE (website) NA NA http://gencodegenes.org
Ensembl (website) NA NA http://ensembl.org
bedToBigBed (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/

DOWNLOAD MATERIALS LIST

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
  2. Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
  3. Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
  4. Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
  5. Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
  6. Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
  7. Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
  8. Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
  9. Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
  10. Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
  11. Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
  12. Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
  13. Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
  14. Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
  15. Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
  16. Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
  17. Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
  18. Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
  19. Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
  20. Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
  21. Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
  22. Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
  23. Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
  24. Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. The R Development Core Team. R: A Language and Environment for Statistical Computing. , R Foundation for Statistical Computing. Vienna, Austria. (2008).
  27. Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
  28. Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
  29. Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
  30. Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
  31. Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
  32. Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
  33. Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
  34. Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
  35. Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Tags

Genetikk problemet 135 Proteomikk genomikk åpen kilde-programvare merknad proteogenomics kartlegging visualisering genomet nettleser store spor-huber
En rask og kvantitativ metode for post-translasjonell modifikasjon og Variant aktivert tilordning av peptider å genomer
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Schlaffner, C. N., Pirklbauer, G.More

Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Steen, J. A. J., Choudhary, J. S. A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes. J. Vis. Exp. (135), e57633, doi:10.3791/57633 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter