Genetics

En snabb och kvantitativ metod för posttranslationella modifieringen och Variant aktiverad mappning av peptider till genomen

Published: May 22, 2018 doi: 10.3791/57633

Christoph N. Schlaffner^1,2,3, Georg J. Pirklbauer², Andreas Bender³, Judith A.J. Steen¹, Jyoti S. Choudhary^2,4

¹Department of Neurobiology, F. M. Kirby Neurobiology Center, Boston Children's Hospital, Harvard Medical School, ²Proteomic Mass Spectrometry, Wellcome Trust Sanger Institute, Wellcome Genome Campus, ³Centre for Molecular Informatics, Department of Chemistry, University of Cambridge, ⁴Functional Proteomics Group, Chester Beatty Laboratories, Institute of Cancer Research

Summary

Här presenterar vi verktyget proteogenomic PoGo och protokoll för snabb, kvantitativa, posttranslationella modifieringen och variant aktiverad mappning av peptider som identifieras genom masspektrometri på referens genomen. Detta verktyg är att integrera och visualisera proteogenomic och personliga proteomiska studier samverkar med ortogonala genomik data.

Abstract

Överhörning mellan gener, avskrifter och proteiner är nyckeln till cellulära svar; analys av molekylära nivåer som skilda enheter utökas därför långsamt till integrativ studier för att förbättra förståelsen av molekylär dynamik inom celler. Aktuella verktyg för visualisering och integrering av proteomik med andra omics datauppsättningar är otillräckliga för storskaliga studier. Dessutom de bara fånga grundläggande sekvens identifiera, kasta post-translationella modifieringar och kvantifiering. För att lösa problemen, utvecklat vi PoGo mappa peptider med associerade post-translationella modifieringar och kvantifiering vill referera genomet anteckning. Dessutom utvecklades verktyget för att aktivera Mappning av peptider som identifierats från anpassad sekvens databaser införliva enda aminosyra varianter. PoGo är en befalla lina redskap, det grafiska gränssnittet PoGoGUI kan icke-bioinformatik forskare enkelt mappa peptider till 25 arter stöds av häckning genomet anteckning. Genererade utdata lånar format från fältet genomik och visualisering stöds därför i de flesta genomet webbläsare. För storskaliga studier stöds PoGo av TrackHubGenerator att skapa webb-tillgång förråd av data mappas till genomen som också möjliggör en enkel delning av proteogenomics data. Med lite ansträngning, kan detta verktyg karta miljontals peptider vill referera genomen inom bara några minuter, överträffar andra tillgängliga sekvens-identitet baserat verktyg. Detta protokoll visar de bästa metoderna för proteogenomics kartläggning genom PoGo med allmänt tillgängliga datauppsättningar av kvantitativa och phosphoproteomics, samt storskaliga studier.

Introduction

I celler påverkar genomet, transkriptom och proteomet varandra för att modulera ett svar till interna och externa stimuli och interagerar med varandra för att utföra specifika funktioner leder till hälsa och sjukdom. Därför, karakterisera och kvantifiera gener, avskrifter och proteiner är avgörande för att fullt förstå cellulära processer. Nästa generations sekvensering (NGS) är en av de vanligaste tillämpad strategierna att identifiera och kvantifiera genen och avskrift uttryck. Proteinuttryck bedöms dock vanligen av masspektrometri (MS). Betydande framsteg inom MS teknik under det senaste decenniet har möjliggjort mer en fullständig identifiering och kvantifiering av Proteom, göra uppgifterna som är jämförbara med transkriptomik¹. Proteogenomics och multi-omics som sätt att integrera NGS och MS data har blivit kraftfulla metoder för att bedöma cellulära processer över flera molekylära nivåer, att identifiera subtyper av cancer och leder till nya potentiella målmolekyler i cancer² ^, ³. det är viktigt att notera att proteogenomics användes ursprungligen proteomiska underlag för gen- och avskrift anteckningar⁴. Flera gener som tidigare trodde var icke-kodande har nyligen genomgått omvärdering överväger storskaliga mänsklig vävnad datamängder⁵^,⁶^,⁷. Dessutom används proteomiska data framgångsrikt för att stödja insatser för anteckning i icke-modellorganismer⁸^,⁹. Dock proteogenomic dataintegration kan utnyttjas utöver höjdpunkt proteinuttryck i förhållande till genomisk funktioner och belysa överhörning mellan avskrifter och proteiner genom att ge en kombinerad referenssystem och metoder för samtidig visualisering.

För att ge en gemensam referens för proteomik och transkriptomik genomik data har har många verktyg genomförts för mappning peptider identifieras genom MS på genomet koordinater¹⁰^,¹¹^,¹² ^,¹³^,¹⁴^,¹⁵^,¹⁶^,¹⁷. Metoder har olika aspekter såsom kartläggning referens, stöd av genomet webbläsare och graden av integration med andra proteomik verktyg som visas i figur 1. Medan vissa verktyg karta omvänd översatta peptider på en genomet¹⁶, använder andra en sökmotor annotated position inom ett protein och gen anteckning för att rekonstruera av nukleotidsekvensen av peptid¹⁵. Fortfarande använder andra en 3 - eller 6-bildruta översättning av genomet för att mappa peptider mot¹¹^,¹³. Slutligen, flera verktyg hoppa över nukleotidsekvenser och använda aminosyra sekvens översättningar från RNA-sekvensering mappas avskrifter som intermediär mappa peptider till den associera genomet koordinater¹⁰^,¹²^, ¹⁴^,¹⁷. Men översättningen av nukleotidsekvenser är en långsam process och anpassade databaser är benägna att fel som propagerar i peptid-mappningen. För snabb och hög genomströmning kartläggning är en liten och omfattande referens avgörande. En standardiserad protein referens med associerade genomet koordinater är därför nödvändig för korrekt peptid genomet-mappningen. Nya aspekter i proteogenomics, såsom införlivandet av varianter och post-translationella modifieringar (PTMs)²^,³, fart genom senaste studier. Dock stöds dessa generellt inte av nuvarande proteogenomic kartläggning verktyg som visas i figur 1. För att förbättra hastighet och kvalitet av kartläggning, utvecklades PoGo, ett verktyg som tillåter snabb och kvantitativa kartläggningen av peptider till genomen¹⁸. Dessutom möjliggör PoGo kartläggning av peptider med upp till två sekvens varianter och kommenterad post-translationella modifieringar.

PoGo har utvecklats för att klara den snabba ökningen av kvantitativa högupplösta datamängder fånga proteom och globala ändringar och erbjuder ett centralt verktyg för storskaliga analyser såsom personlig variation och precision medicin. Denna artikel beskriver tillämpningen av detta verktyg att visualisera förekomsten av posttranslationella modifieringen i förhållande till genomisk funktioner. Denna artikel belyser dessutom identifiering av alternativ splitsning händelser genom mappade peptider och kartläggning av peptider som identifieras genom anpassade variant databaser till en referens genomet. Detta protokoll sysselsätter offentligt tillgängliga datauppsättningar hämtas från PRIDE arkiv¹⁹ att demonstrera dessa funktioner av PoGo. Dessutom beskriver det här protokollet tillämpningen av TrackHubGenerator för att skapa online tillgänglig nav av peptider som mappas till genomen för storskalig proteogenomics studier.

Protocol

1. beredning, hämtning och installation

Obs: Fil och mapp sökväg exemplen visas i en Windows-format för att underlätta för vanliga användare. PoGo och PoGoGUI finns också för macOS och Linux operativsystem.

Hämta PoGo och PoGoGUI från GitHub
1. Öppna en webbläsare och navigera till PoGo på GitHub (http://github.com/cschlaffner/PoGo/). Välj pressmeddelanden och ladda ner den senaste release zip-komprimerad fil. Extrahera den komprimerade filen till mappen körbara filer (t.ex., C:\PoGo\executables\).
2. Navigera i webbläsaren till PoGoGUI på GitHub (http://github.com/cschlaffner/PoGoGUI/). Välj utgåvor och Hämta senaste release jar-filen (t.ex., ”PoGoGUI-v1.0.2.jar”). Lagra jar-filen i mappen körbara filer.
Ladda ner genomet annotering och översatta protein-kodande sekvenser
Obs: Hämta genomet annotering och översatta protein-kodande sekvenser för stöds arter från GENCODE⁷ (www.gencodegenes.org) eller häckning²⁰ (www.ensembl.org) i den allmänna överföra Format (GTF) och proteinsekvenser i FASTA format.
1. I webbläsaren, gå till www.gencodegenes.org och markera Data | Mänskliga | Aktuella versionen. Ladda ner omfattande gen anteckning via länken GTF och extrahera den gz-komprimerade filen i datamappen (t.ex., C:\PoGo\Data\) med ett unzipping-program (t.ex., 7-Zip).
2. Ladda ner Protein-kodning avskrift översättning sekvenser via länken FASTA och extrahera den gz-komprimerade filen i datamappen genereras i föregående steg.
  1. Alternativt gå i webbläsaren till www.ensembl.org och välj nedladdningar följt av Hämta data via FTP. Hitta en stöds arter (t.ex., mänskliga). Hämta senaste release-filen för avskrift anteckning via länken GTF i kolumnen gen inställd . Välj filen med namnet struktur ”species.release.gtf.gz” och extrahera den gz-komprimerade filen i datamappen.
3. Hämta den senaste versionen som protein-kodning avskrift översättning sekvenser med FASTA länk i kolumnen proteinsekvens (FASTA) . Välj filen med namnet strukturen ”species.release.pep.all.fa.gz” och extrahera den gz-komprimerade filen i datamappen.
Förbereda peptid identifiering filer
Obs: PoGo stöder endast en 4-kolonn-format som innehåller prov-ID, peptid sekvens, antal peptid-spectrum-matcher (PSMs) och kvantitativa värde. Dock PoGoGUI stöder standardiserad identifiering filformat mzIdentML, mzid och mzTab, och omvandlar dem till Pogo's 4 kolumner med hjälp av de allmänt tillgängliga RAM ms-data-core-api²¹. Filer i mzIdentML, mzid eller mzTab-format kan laddas ner från PRIDE arkiv¹⁹. Alternativt kan uppgifter lämnas i en tabbavgränsad filformat med filändelsen .tsv eller .pogo. Formatet innehåller 4 kolumner med följande kolumnrubrikerna: prov identifierare (prov), peptid sekvenser (peptid), antal peptid-spectrum-matcher (PSMs) och peptid kvantitering (Quant). Ett exempel visas i figur 2.
1. Hämta en exempelfil i mzTab-format från en proteomik studie på mänskliga testiklarna från PRIDE arkiv¹⁹ (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files²²).
2. Spara och extrahera den gz-komprimerade filen i datamappen som skapades i steg 1.2.1.
  Obs: Alternativt Hämta exempeldata för mänskliga phosphoproteomics sökte med MaxQuant från PRIDE arkivet (fil ”Traktman_2013_MaxQuantOutput-full.zip” från https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files²³).
3. Spara och extrahera zip-komprimerade filen i datamappen som skapades i steg 1.2.1.
4. Öppna ett tomt kalkylblad och importera filen peptides.txt från mappen C:/PoGo/Data/Traktman_2013_MaxQuantOutput-full/kombinerade/txt/med alternativet Data | Från Text/CSV. Klicka på Redigerai fönstret öppning.
5. Ta bort alla kolumner utom ”sekvens”, ”Experiment BR1”, ”Experiment BR2”, ”Experiment BR3”, ”baserat på H/L normaliserade BR1”, ”baserat på H/L normaliserade BR2” och ”baserat på H/L normaliserade BR3”.
6. Markera kolumnerna ”baserat på H/L normaliserade BR1”, ”baserat på H/L normaliserade BR2” och ”baserat på H/L normaliserade BR3” och klicka på Transform | Unpivot kolumner. Välj kolumnerna ”Experiment BR1”, ”Experiment BR2” och ”Experiment BR3” och upprepa åtgärden unpivot.
7. Välj den resulterande kolumnen ”attribut” och dela innehållet med hjälp av Transform | Dela kolumn | Av avgränsare. Välj blanksteg som avgränsare i den nedrullningsbara menyn. Upprepa för kolumn ”Attribute.1”.
8. Ta bort de resulterande kolumnerna ”Attribute.1.1”, ”Attribute.2”, ”Attribute.3” och ”Attribute.1.1.1”.
9. Lägga till en kolumn med hjälp av Lägg till kolumn | Anpassad kolumn alternativet. Anpassa formeln anpassad kolumn för att representera följande: ”= [Attribute.4]=[Attribute.1.2]”.
10. Tillämpa ett filter på kolumnen för genererade anpassade för att filtrera ut alla rader som innehåller ”falska”; endast rader som innehåller ”TRUE” kommer att förbli.
11. Ta bort kolumnerna ”Attribute.1.2” och ”anpassad” och ändra ordningen på återstående kolumner till följande: ”Attribute.4”, ”sekvens”, ”Value.1” och ”värde”.
12. Ändra kolumnnamnen till ”Experiment”, ”peptid”, ”PSMs” och ”Quant”, respektive. Läsa in filen med Home | Stäng & lasta.
13. Spara filen som en tabbavgränsad fil med fil | Spara som och Välj ”Text (tabbavgränsad) (*.txt)”. Ändra namnet till ”peptides_pogo.txt” och spara den i mappen C:/PoGo/Data.

2. kartläggning peptider med kommenterad post-translationella modifieringar och visualisering inklusive kvantifiering

Obs: Den resulterande utdatafilen kan laddas i alla genomet webbläsare stöder webbläsare Extensible Data (säng) format. Ett urval av webbläsare är integrativ genomet webbläsare (IGV)²⁴ (som används i följande), de UCSC genomet webbläsare²⁵och häckning genomet webbläsare²⁰. Det är viktigt att notera att de anteckning GTF och protein FASTA versioner används för PoGo mappning matcha versionen av genomet i genomet webbläsaren. För mänskliga häckning releaser 57-75 och GENCODE versioner 3d-19, använda GRCh37/hg19; för häckning versioner 76 eller högre och GENCODE 20 eller högre, använda GRCh38/hg38. För musen häckning versioner 74 eller högre och GENCODE M2 eller högre, använda GRCm38.

Karta peptider med PoGoGUI (se figur 3).
1. Navigera till mappen körbara filer. Starta programmet genom att dubbelklicka på ikonen PoGoGUI-vX.X.X.jar.
  Obs: Det grafiska användargränssnittet kommer att starta upp och tillåter enkel och visuell val av alternativ.
2. Använd knappen Välj bredvid den ”PoGo körbara”. Navigera sedan i mappen executables till undermappen relevant operativsystem (t.ex., C:\PoGo\Executables\Windows\). Välj körbara av PoGo (t.ex., PoGo.exe) och bekräfta sitt urval genom att klicka på knappen Öppna .
3. Välj referens indatafilen för proteinsekvenser genom att klicka på Välj. Navigera till datamappen och välj FASTA översättningsfilen. Bekräfta dess val genom att klicka på knappen Öppna .
4. Välj filen avskrift anteckning med hjälp av knappen Välj . Navigera till datamappen och välj anteckning GTF fil. Bekräfta valet genom att klicka på knappen Öppna .
5. Lägga till filen peptid identifiering — flera filval aktiveras — med hjälp av knappen Lägg till bredvid ”peptid filer”. Välj en fil i format som stöds mzTab, mzIdentML eller mzid, eller i den tabbavgränsade 4 kolumner hämtade och bereddes i steg 1.3.
6. Avmarkera kryssrutorna bredvid sängen och GTF i utdata format markeringen. Endast lämna PTM säng och GCT kontrolleras.
7. Välj den lämpliga arten för data från det nedrullningsbara urvalet. Det är viktigt att den FASTA fil, GTF filen och det nedrullningsbara urvalet för samma art.
8. Starta mappning genom att klicka på knappen Starta .
  Obs: Om det behövs, PoGoGUI kommer att konvertera indatafilen i pogo format, ge pogo filerna i samma mapp för framtida bekvämlighet och starta mappningsprocessen. Omvandlingen av en enda mzTab-fil som du hämtade i steg 1.3.1 kommer att pågå mellan 10-20 min innan kartläggning påbörjas.
Visualisera i visningsprogrammet Interactive genomics
Obs: Se figur 4.
1. Ladda PoGo utdatafilen slutar på ”_ptm.bed” i IGV genom fil | Belastning från filen och välj filen.
  Obs: På grund av storlek, vissa filer kan kräva generering av ett index för att tillåta en snabb omlastning av Regionkommittén genomisk. IGV uppmanas användaren automatiskt till generation. Följ instruktionerna som anges.
2. Upprepa steget lastning för den fil som slutar på ”_noptm.bed”. Denna fil innehåller alla peptider hittade utan några ändringar.
3. Observera att varje inläst fil kommer att visas som separata spår med namnet identifierar spåret. Ändra ordningen på spår genom att dra och släppa dem till önskad position i listan.
4. Observera att varje spår inledningsvis visas på ett komprimerat sätt. Att expandera dem, högerklicka på spårnamnet och välj antingen utökat för en Helbild av peptiderna inklusive sekvenser eller squished för en staplad vy.
5. Upprepa steget lastning för den fil som slutar på ”.gct”. Den här filen innehåller peptid kvantitering per kommenterad prov.
6. Till skillnad från för filer in ovan ska varje kommenterad prov läsas som ett separat spår. Omorganisera proverna genom dra och släpp-åtgärder.
7. Navigera inom genomet genom att välja en kromosom i drop-down menyn, Skriv i genomisk koordinater, söka en gen symbol, eller klicka och håll till välja en del av en kromosom att zooma in.

3. kartläggning peptider som identifieras genom en anpassad Variant-databas till en referens genomet

Obs: PoGo mappning kan bäras ut med det grafiska användargränssnittet (GUI) eller genom kommandoraden gränssnittet. De är utbytbara. I denna del av protokollet används kommandoraden gränssnittet för att belysa utbytbarhet. Den andra delen av denna protokollenheten kräver den programvara verktyg R²⁶. Kontrollera att paketet är installerat.

Mappa peptiderna som referens till referens genomet.
1. Öppna Kommandotolken (cmd) och navigera till mappen körbara filer av PoGo (t.ex., C:\PoGo\Executables\).
2. Skriv kommandot nedan:
  PoGo.exe - gtf \PATH\TO\GTF - fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES
  1. Ersätta den \PATH\TO\GTF, \PATH\TO\FASTA och \PATH\TO\IN med sökvägar till anteckning GTF, proteinsekvens FASTA och peptid identifieringsfilen (i formatet 4-kolumn med filen slutar ”.tsv” eller ”.pogo”) respektive. Också ersätta MYSPECIES med arterna som är konsekvent med data (t.ex. mänskliga).
3. Kontrollera utförandet genom att trycka på ”Enter”. Vänta tills utförandet är klar innan utvecklas något ytterligare.
  Obs: Detta kan ta några minuter. Den resulterande filen sparas i samma mapp som peptid indatafilen och kommer att betraktas som \PATH\TO\OUT.pogo.bed i följande.
Extrahera endast variant peptider från indatafilen.
1. Öppen R och Last input filen \PATH\TO\IN med följande kommando:
  inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t")
2. Ladda redan mappad peptiderna med kommandot:
  mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE)
3. Ta bort peptider som kartlades redan från inputdata:
  peptidesnotmapped <-inputdata [! () inputdata$ peptid % i % mappedpeptides$ V4)]
4. Skriva ut de omappade peptiderna till en ny input fil:
  Write.Table (peptidesnotmapped, ”PATH\TO\IN.notmapped.pogo”, huvudet = FALSE, sep = ”\t”, col.names=TRUE,row.names=FALSE,quote=FALSE)
Mappa de återstående peptiderna till referens genomet att tillåta avvikelser.
1. Liksom i steg 3.1, öppna Kommandotolken och navigera till mappen körbara filer av PoGo.
2. Skriv kommandot nedan tillåter 1 aminosyra obalans och ersätt den \PATH\TO\GTF, \PATH\TO\FASTA och \PATH\TO\IN.notmapped.pogo med sökvägar till anteckning GTF, proteinsekvens FASTA och peptid identifiering fil som skapas i steg 3,2. Också ersätta MYSPECIES med arterna som är konsekvent med data (t.ex., mänskliga).
  1. PoGo.exe - gtf \PATH\TO\GTF - fasta \PATH\TO\FASTA-i \PATH\TO\IN-format BED-arter MYSPECIES -mm 1
3. Bekräfta kommandot körning genom att trycka på ”Enter”. Vänta tills utförandet är klar innan utvecklas något ytterligare.
  Obs: Detta kan ta några minuter. Den resulterande filen sparas i samma mapp som peptid indatafilen och kommer att betraktas som \PATH\TO\OUT.pogo_1MM.bed i följande.
Visualisera de peptider som mappas utan och med obalans i IGV som beskrivs i steg 2.2.

4. kartläggning med hjälp av flera filer och generera Track nav för stora datamängder

Mappning av peptider från flera filer med PoGoGUI
1. Navigera till mappen körbara filer och starta programmet GUI genom att köra PoGoGUI-vX.X.X.jar.
2. Markera den PoGo körbara filen för operativsystemen som används (här Linux), samt ingående protein sekvenser FASTA referensfilen och annotering GTF filen enligt protokollstegen 2.1.2 - 2.1.4.
3. Lägg till filerna peptid identifiering med hjälp av knappen Lägg till bredvid ”peptid filer”; Flera filval aktiveras, samt dra-och-släpp in i det tomma fältet under ”peptid filer”.
4. Avmarkera kryssrutorna bredvid PTM säng, GTF och GCT i avsnittet utdata format och endast lämna sängen kontrolleras.
5. Välj alternativet sammanfoga flera indatafiler till enda utgång.
  Obs: Detta kommer att resultera i en enda utdatafil som kombinerar alla peptider av indatafilerna. Lämna detta alternativ omarkerat kommer att resultera i en sekventiell körningen av programmet för varje indatafil separat.
6. Välj den lämpliga arten för data från det nedrullningsbara urvalet konsekvent med FASTA och GTF filer.
7. Starta mappning genom att klicka på knappen Starta . Om det behövs konverterar programmet indatafilerna till pogo format. Detta kan ta lite tid att köra. Under tiden Hämta de nödvändiga verktyg och skript för track nav generation.
Förbereda för track nav generation
1. Öppna en webbläsare, navigera till https://github.com/cschlaffner/TrackHubGenerator och ladda ner filen ”TrackHubGenerator.pl”. Spara filen till mappen körbara filer.
2. I webbläsaren, navigera till www.hgdownload.soe.ucsc.edu/admin/exe/ och markera mappen för operativsystemet som används (här Linux). Hämta den verktyg bedToBigBed och den skriptet fetchChromSizes i de körbara filer mapp²⁷.
Generera ett track nav från mappade peptider
Obs: När PoGoGUI har slutförts mappning peptiderna track nav kan genereras automatiskt för alla de resulterande filerna i säng format lagras i samma mapp.
1. Öppna ett terminalfönster och skriv följande kommando:
  Perl TrackHubGenerator.pl sökväg/till/församling FBED UCSC e-post
  1. Ersätta sökväg/till/med en sökväg och namn för navet spår (t.ex., ~/PoGo/Data/Mytrackhub), montering med genomet församling som anteckningen är baserat (t.ex., hg38 för mänskliga), FBED med sökvägen till mappen som innehåller den BED filer på som spår navet bygger (t.ex., ~/PoGo/Data/), UCSC med mappen där de verktyg som hämtat från UCSC lagras (t.ex., ~/PoGo/Executables/), och e-postmeddelande med en e-postadress för personen som ansvarar för spåret Hub.
2. Bekräfta utförandet genom att trycka på ”Enter”; utförandet tar bara en kort tid till slut.
3. Överföra genererade spår navet (dvs, den skapade mappen ~/PoGo/Data/Mytrackhub/) med alla dess innehåll till en webb-tillgänglig FTP-server.
  Obs: En FTP-server med en associerad webbserver som möjliggör tillgång till navet spår via protokollen ftp och http är att föredra. En förråden github (github.com) och datasamlingarna (figshare.com) stöder denna typ av tillgång och kan användas istället för en FTP-server.
Visualisera ett track nav i UCSC genomet webbläsaren
1. I en webbläsare, navigera till https://genome.ucsc.edu/ och välj MyData | Spåra hubbar. Klicka på fliken Mina hubbar.
2. Kopiera webbadressen till hubben spår i textfältet.
  Obs: URL-adressen består av server-adress, track nav platsen och namn och hub.txt filen (t.ex., http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt).
3. Ladda navet spår genom att klicka på Lägg till navet.
  Obs: Navet kommer att laddas, och ett kort meddelande visas, anger Detaljer för navet spår till exempel dess namn, kontaktinformation för ansvarig för navet spår och församlingens genomet används. Webbplatsen kommer att återgå till huvudsidan.
4. Välj GenomeBrowser att ange webbläsarvyn.
  Obs: Anpassade spår navet visas överst i listan. Om flera BED filer byggt grunden för navet spår, kommer alla filer att representeras som ett separat spår inom navet.

Representative Results

En grafisk skildring belyser som en vanlig proteomiska Arbetsflödesstadium PoGo¹⁸ för tillämpas, samt nedströms alternativ av visualisering, visas i figur 5. Shotgun proteomik (dvs, proteolytisk nedbrytning av proteiner följt av vätskekromatografi tillsammans med tandem mass spectrometry) är ett förberedande steg av proteogenomic kartläggning. De resulterande tandem masspektrum är vanligen jämfört teoretiska spectra härrör från protein sequence databaser. Proteogenomics studier införa översättning sekvenser av romanen avskrifter med kodning potentiella och icke-synonymt enda nukleotid varianter (SNVs) i databasen, vilket gör det svårt att enkelt relatera dessa tillbaka till referens genomet⁸. Det grafiska användargränssnittet av PoGo (PoGoGUI) stöder filformat för standardiserad rapportering av peptid identifieringar från masspektrometri experiment och omvandlar dem till formatet förenklade 4-spalt pogo. PoGoGUI wraps kommandoradsverktyget PoGo och således möjliggör kartläggning av peptider till genomet koordinater utnyttja referens annotering av protein-kodande gener tillhandahålls allmänt i GTF och översatta avskrift sekvenser i FASTA format. Olika output format genereras av PoGo aktivera visualisering av olika aspekter av de peptider som identifieras genom masspektrometri, inklusive post-translationella modifieringar och peptid nivå kvantifiering. Utdatafiler i sängen kan ytterligare konverteras och kombineras till online tillgängliga kataloger kallas spår hubbar. Enda utdatafiler, samt track nav, kan sedan visualiseras i webbläsare såsom UCSC genomet webbläsare²⁵, häckning genomet webbläsare²⁰, IGV²⁴och Biodalliance²⁸ (se figur 5 botten).

Vi avsåg reanalysis av utkastet till mänskliga proteomet kartor filtreras vid hög betydelse enligt Wright et al. PoGo ⁷ och jämförde den med två andra verktyg för kartläggning av proteogenomic, nämligen iPiG¹⁴ och PGx¹⁰. Datamängden består 233,055 unika peptider över 59 vuxna och fostrets vävnader som resulterar i totalt över 3 miljoner sekvenser. PoGo överträffade dessa verktyg både i runtime (6,9 x och 96,4 x snabbare, respektive) och minnesanvändning (20% och 60% mindre minne, respektive) som visas i figur 6¹⁸. Ett exempel på ett framgångsrikt mappade peptid visas i figur 7.

Medan PoGo betydligt bättre resultat än andra verktyg i hastighet och minne, är det också kan kartläggning post-translationella modifieringar och kvantitativa information i samband med peptider till genomet. Figur 8A avbildar schematiskt visualisering av formatet säng i en genomet webbläsare för peptider mappning till en exon och över skarva korsningar. PoGo använder färg alternativ att ge lätt visuellt hjälpmedel med avseende på unikitet av peptid kartläggning inom genomet. Mappningar i rött indikerar unikhet till en enda utskrift, medan svart höjdpunkter mappning till en enda gen. Dock delas peptiden mellan olika avskrifter. Grå mappningar visar en peptid som delas mellan flera gener. Dessa är till exempel mindre tillförlitlig för kvantifiering av en gen eller opålitliga att kalla uttrycket av en gen. Alternativet PTM säng av PoGo omdefinierar färgkoden för att passa olika typer av post-translationella modifieringar som visas i figur 8B. Dessutom indikeras PTMs av tjocka block (se figur 8B). En enda PTM av en typ som markeras av ett tjockt block vid position av modifierad aminosyra restmängd, medan flera PTMs av samma typ är korsas av ett tjockt block från den första modifierad aminosyran till sista.

Vi tillämpat PoGo och därefter TrackHubGenerator till en datamängd av 50 kolorektal cancer cellinjer inklusive hela proteomet och phosphoproteome²⁹. Samtidigt spår navet lastas i UCSC genomet webbläsaren visar de peptider som mappas till genomet och lyfter fram unikitet i mappningarna och fosforylering webbplatser (se figur 9), finns ytterligare data i mappen kompletterande. GCT filer sedan aktivera visualisering av peptid och phosphopeptide kvantitering i genomisk sammanhang. GCT filer ger dock inte en enkel visualisering av peptider som spänner över skarv korsningar (se diagram 10 topp). Peptiderna över skarv korsningar är uppdelade i deras respektive delar mappa till exonerna. Det är möjligt att identifiera splice peptider genom samma kvantitativa värden av exon mappningar, lastning sekvens-baserad kartläggning filer såsom säng eller GTF som ansluter exonerna genom en tunn intron spanning linje stöd tolkningen (se figur 10 (längst ned).

För att belysa nyttan av variant aktiverad mappning, tillämpat vi PoGo i två konfigurationer till en datamängd av mänskliga testiklarna proteomet sökte mot neXtProt att jaga saknas proteiner med hjälp av en strategi för flera enzym²². NeXtProt består av förutom referens proteinsekvenser över 5 miljoner enda aminosyra varianter³⁰. Mappning av peptider som identifieras med en enda aminosyra variant stöds inte av andra kartläggning verktyg. Sammanlagt 177,012 unika peptider identifierades. Av dessa, var 99,8% (176,694) peptider först framgångsrikt kartlagt utan att oförenligheter. Ta bort dem från listan identifierad peptid resulterade i 0,2% (318) peptider som därefter var mappade möjliggör en aminosyra ersättning. Detta resulterade i 3.446 mappningar av 162 peptider som inte skulle har mappats till referens genomet med andra tillgängliga verktyg. Medan det genomsnittliga antalet mappningar inklusive en obalans är hög, karterades 62 peptider till bara en enda locus, som anger sant variant sekvenser. Ett exempel på en peptid som mappas med en enda aminosyra substitution markeras med dess sekvens och översatta genomiska sekvensen i figur 11.

Figur 1. Visuell jämförelse av olika peptid-till-genomet kartläggning verktyg. Jämförelsen är visat när det gäller olika aspekter. Dessa aspekter inkluderar mappning referens, graden av integration i ramar och stöd av online och offline webbläsare. Dessutom nya aspekter av proteogenomics och deras stöd markeras separat. PoGo saknar bara möjligheten att direkt mappa till en genomsekvens som jämfört med andra verktyg. Dock, det stöder alla nya funktioner som de flesta andra verktyg inte stöder. Klicka här för att se en större version av denna siffra.

Figur 2. Exempel indatafilen för mappning peptider. PoGo accepterar indata i tabbavgränsat format med 4 kolumner. Kolumnrubrikerna i den första raden är 'Experiment', 'Peptid', 'PSMs' och 'Quant', som anger i följande rader i experimentet eller prov-ID, peptid sekvensen, antalet peptid-spektrum matcher och ett kvantitativt värde för peptiden, respektive. Filnamnstillägg stöds som *.txt, *.tsv och *.pogo. Klicka här för att se en större version av denna siffra.

Figur 3. PoGoGUI gränssnitt med markerade steg för fil val och parameteralternativ. Figuren visar stegen för att välja och ladda upp alla nödvändiga filer och val av alternativ för mappning peptider med post-translationella modifieringar på mänsklig referens genomet. Klicka här för att se en större version av denna siffra.

Figur 4. Skärmdump av integrativ genomik Viewer (IGV) data överför förfarande. Figuren visar stegen för uppladdning PoGo utdatafiler i IGV webbläsaren. Det visar dessutom möjlighet att utöka spåret av mappade peptider för att markera mappningen och sekvens. Klicka här för att se en större version av denna siffra.

Figur 5. Förenklat arbetsflöde steg från LC-MS/MS till visualisering i genomet webbläsare. PoGo kartläggning följer identifiering av peptider från tandem masspektrum. För att uppnå kartläggningen av genomet, PoGo använder tredjeparts referens anteckning som genomet annotation (GTF) och avskrift översättning sekvenser (FASTA). Olika output format genereras som kan läsas separat i genomet webbläsare. Dessutom kan filer i säng format kombineras till track nav stödja visualisering av stora datamängder. Klicka här för att se en större version av denna siffra.

Figur 6. Benchmarking PoGo mot PGx och iPiG. PoGo utklassar de andra verktyg på benchmarking. Kartläggning 233,055 unika peptider över 59 vuxna och fostrets vävnader som resulterar i över 3 miljoner sekvenser, var PoGo 6,9 x 96,4 x snabbare än PGx och iPiG, respektive. Dessutom krävs PoGo 20% och 60% mindre minne jämfört PGx iPiG, respektive. Medan PoGo och PGx slutförts, resulterade iPiG i ett minnesfel vid 16 GB. Klicka här för att se en större version av denna siffra.

Figur 7. UCSC genomet Webbläsarvy exempel av mappade peptider. Figuren visar peptider som mappas till den genen mTOR. Medan den kombinera banan visar de peptider som spänner över skarv korsningar och mappa endast till en exon med associerade sekvenser, framhäva vävnadsspecifika spår endast mappningen i ett kondenserat format. Klicka här för att se en större version av denna siffra.

Figur 8. Schematisk av mappning visualisering och färgkodning. (A) i säng standard utdatafilen, peptider mappning till en exon visas som enda block (vänster), samtidigt som peptider kartläggning över flera exoner höjdpunkt i exon som omfattar delar som block (höger). Introner visas som tunna sammanfoga rader. PoGo färgkodar unikitet kartläggning eller peptider för att gener och avskrifter med hjälp av en 3-tier system. (B) förutom blocket strukturen av formatet säng, PTM BED utdata belyser post-translationella modifieringar position som tjocka block. Förekomsten av en enda PTM av en typ som belyser modifierad aminosyra återstoden med ett tjockt block, medan flera platser av den samma PTM kombineras till lång block som sträcker sig från först till den sista modifiering webbplats. Peptid mappningar är ytterligare indelade av PTM typ och färg codec baserad på ändringen. Klicka här för att se en större version av denna siffra.

Figur 9. Spåra hub view i UCSC genomet webbläsaren av kolorektal cancer proteomet och phosphoproteome. Spår navet består av hela proteomet data samt phosphoproteome. Medan den röda färgen i proteomet och phosphoproteome spåren indikerar unikitet med mappning till en enda utskrift av SFN, visas spåren slutar i _ptm de phosphorylation platserna inom peptider. Här, anger den röda färgen vilken typ av ändring som fosforylering. Endast två peptider har identifierats med varje visar en enda fosforylering (tjocka block). Klicka här för att se en större version av denna siffra.

Figur 10. Kolorektal cancer phosphopeptides och associerade kvantitering i IGV. Figuren visar en delmängd av 50 cancer cellinjer. Det visar dessutom fyra kolumner av block i olika nyanser av ljus röd. Färgen anger det relativa överflödet från låg (vit) till hög (röd). De fyra kolonnerna kan inledningsvis leda till anser att det finns 4 peptider, blir det tydligt med associerade sekvens-baserade GTF utdatafilen att dessa i själva verket är två peptider, varje som spänner över en skarv junction. Klicka här för att se en större version av denna siffra.

Figur 11. Visa av peptid med aminosyran variant i IGV. Figuren visar en peptid med en enda aminosyra variant mappas till referens genomet från början översättning av genen GPSM1. Varianten är placerad på aminosyran rester 8 och resultat i substitution av alanin till valin (A→V). Den översättning sekvenser av Kommenterad Avskrifter (blå) Markera varianten i jämförelse med sekvensen peptid. Klicka här för att se en större version av denna siffra.

Discussion

Det här protokollet beskriver hur programvaruverktyget PoGo och dess grafiska användargränssnitt PoGoGUI aktiverar en snabb kartläggning av peptider till genomet koordinater. Verktyget erbjuder unika funktioner som kvantitativa, posttranslationella modifieringen och variant-aktiverad mappning till genomen använda hänvisningen anteckningen. Denna artikel visar metoden på en storskalig proteogenomic studie och belyser dess hastighet och minne effektivitet jämfört med andra tillgängliga verktyg¹⁸. I kombination med verktyget TrackHubGenerator, vilket skapar online tillgänglig nav av genomisk och genomet länkade data, PoGo, med dess grafiska användargränssnitt, möjliggör storskalig proteogenomics studier att snabbt visualisera sina data i genomisk sammanhang. Vi visar dessutom de unika funktionerna för PoGo med datamängder som sökte mot variant databaser och kvantitativa phosphoproteomics²²^,²⁹.

Enstaka filer, såsom GCT filen, ge värdefulla visualisering och länkar mellan peptid funktioner och genomisk loci. Det är dock viktigt att notera att en tolkning utifrån dessa ensam kan vara svårt eller missvisande på grund av deras begränsning till enstaka aspekter av proteogenomics som unika, post-translationella modifieringar och kvantitativa värden. Det är därför viktigt att noga välja vilka utdatafiler, alternativ och kombinationer är lämpliga för proteogenomic fråga till hands och ändra kombinationerna. Exempelvis kan information om unikheten i mappningen till en specifik genomisk locus vara av stort värde för annotering av arvsmassans funktion⁷, medan kvantifiering över olika prover kan vara mer lämpliga för studier rörande genomisk funktioner till förändringar i protein överflöd²⁹. Utdata ska genereras av PoGo för varje inställning. Om inga utdata genereras, eller tomma filer visas i utdatamappen, rekommenderas det att kontrollera indatafilerna för önskat innehåll och formatet krävs. I fall där filformat eller innehåll inte följer förväntningarna som PoGo (t.ex., den FASTA fil som förmodligen innehåller avskrift översättning sekvenser innehåller nukleotidsekvenser av avskrifter), felmeddelanden kommer att be användaren att Kontrollera indatafilerna.

Begränsningar i protokollet och verktyget är mestadels baserade på återanvändning av format som vanligen används i genomik. Återanvända format som används i genomik för proteogenomic program åtföljs av särskilda begränsningar. Dessa beror på de olika uppsättningarna av kraven för genomet centrerad visualisering av genomisk och proteogenomic data, till exempel behovet av att visualisera post-translationella modifieringar från proteomik data. Detta begränsas i genomik filformat av enstaka geoobjekt användning. Många metoder och verktyg har utvecklats för proteomik för att tryggt lokalisera post-translationella modifieringar inom peptid sekvenser³¹^,³²^,³³^,³⁴. Dock hindras visualisering av flera ändringar i en unik och märkbara sätt på genomet av strukturera av genomisk format. Därför den enda block visualiseringen av flera PTMs av samma typ utgör inte någon tvetydighet modifiering platser men är en följd av olika kravet från gemenskapens genomik att visualisera endast enstaka funktioner i taget. PoGo har trots fördelen med mappning post-translationella modifieringar på genomisk koordinater för att möjliggöra studier fokuserar på effekten av genomisk funktioner såsom enda nukleotid varianter på post-translationella modifieringar. Variant mappning använder PoGo, och ökar antalet totala mappningar. Dock belyser unik färgkodning av mappade peptider tillförlitlig mappningar från de opålitliga. Kartläggning av variant peptider identifieras från kända enda nukleotid varianter kan åtföljas av visualisera de mappade peptiderna tillsammans med varianterna i VCF-format. Detta sätt färgkod som anger en opålitlig kartläggning av en variant peptid är överkörda av närvaron av den kända nukleotid-varianten.

Ett avgörande steg för att använda PoGo är användningen av de rätt filer och format. Användningen av översatta avskrift sekvenser som proteinsekvenser bifogas anteckningen i GTF format är de viktigaste kriterierna. En annan kritisk faktor när överväger att använda PoGo mappa peptider med aminosyran missmatchningar är minne. Medan minne högeffektiv för en standardapplikation, leder avsevärt och exponentiellt ökande antalet möjliga mappningar med en eller två avvikelser till en likaså exponentiell ökning av minne användning¹⁸. Vi föreslår en stegvis mappning som beskrivs i detta protokoll att först kartlägga peptiderna utan missmatchningar och ta bort dem från uppsättningen. De efterföljande tidigare omappade peptiderna sedan kan mappas med hjälp av en obalans och proceduren kan upprepas med två avvikelser för de peptider som återstående omappade.

Eftersom genomströmning av masspektrometri har ökat betydligt och studier gränssnitt genomisk och proteomiska data blir allt vanligare på senare år, är verktyg för att lätt aktivera gränssnitt dessa typer av data i samma koordinatsystemet allt mer oumbärligt. Verktyget presenteras här kommer stödet de behöver kombinera genomisk och proteomiska data att förbättra förståelsen av integrativ studier över små och stora datamängder genom att mappa peptider på en referens-anteckning. Uppmuntrande nog har PoGo tillämpats för att mappa peptider till genen kandidater i samma format som hänvisningen anteckningen att stödja annotering av romanen gener uttrycks i mänskliga testiklarna³⁵. Den strategi som presenteras här är oberoende av databaser som används för identifiering av peptid. Protokollet kan stöd i identifiering och visualisering av romanen översättning produkter med hjälp av anpassade indata-filer från översättning sekvenser och tillhörande GTF filer från RNA-seq experiment.

Flera metoder och verktyg med ett brett utbud av speciella programscenarier mappa peptider till genomisk koordinater, alltifrån mappning peptider direkt till genomsekvens RNA-sekvensering guidade kartläggning, har varit införda¹⁰^, ¹¹ ^, ¹² ^, ¹³ ^, ¹⁴ ^, ¹⁵ ^, ¹⁶ ^, ¹⁷. men dessa kan leda till underlåtenhet att korrekt karta peptider när post-translationella modifieringar är närvarande och fel i de underliggande kartläggningen av RNA-sekvensering läser kan spridas till peptid nivån. PoGo har utvecklats specifikt övervinna dessa hinder och att klara den snabba ökningen av kvantitativa högupplösta proteomiska datamängder att integrera med ortogonala genomik plattformar. De verktyg som beskrivs här kan integreras i hög genomströmning arbetsflöden. Genom det grafiska gränssnittet PoGoGUI verktyget är enkel att använda och kräver ingen specialist bioinformatik utbildning.

Disclosures

Författarna har något att avslöja.

Acknowledgments

Detta arbete finansierades av Wellcome Trust (WT098051) och NIH bidraget (U41HG007234) till projektet GENCODE.

Materials

Name	Company	Catalog Number	Comments
PoGo (software)	NA	NA	https://github.com/cschlaffner/PoGo
PoGoGUI (software)	NA	NA	https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software)	NA	NA	https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software)	NA	NA	http://software.broadinstitute.org/software/igv/
UCSC genome browser (website)	NA	NA	https://genome.ucsc.edu/
GENCODE (website)	NA	NA	http://gencodegenes.org
Ensembl (website)	NA	NA	http://ensembl.org
bedToBigBed (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software)	NA	NA	http://hgdownload.soe.ucsc.edu/admin/exe/

DOWNLOAD MATERIALS LIST

References

Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
The R Development Core Team. R: A Language and Environment for Statistical Computing. , R Foundation for Statistical Computing. Vienna, Austria. (2008).
Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Genetics

En snabb och kvantitativ metod för posttranslationella modifieringen och Variant aktiverad mappning av peptider till genomen

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.