$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Een grafische afbeelding markeren waarop fase van een regelmatige proteomic workflow PoGo18 wordt toegepast, evenals downstream opties van visualisatie, is afgebeeld in Figuur 5. Shotgun proteomics (dat wil zeggen, de Proteolytische vertering van eiwitten gevolgd door vloeibare chromatografie gekoppeld aan massaspectrometrie tandem) is een inleidend stap voor proteogenomic mapping. De resulterende tandem massaspectra worden vaak vergeleken met theoretische spectra afgeleid uit eiwit sequentie databases. Proteogenomics studies introduceren vertaling sequenties van roman chat-kopieën met de potentiële en niet-synoniem één nucleotide varianten (SNVs) in de database, waardoor het moeilijk om te gemakkelijk koppelen deze terug aan de verwijzing genoom8codering. De grafische gebruikersinterface van PoGo (PoGoGUI) ondersteunt bestandsformaten voor de gestandaardiseerde melding van peptide identificaties van massaspectrometrie experimenten en zet hen in de vereenvoudigde 4-kolom pogo-formaat. PoGoGUI wikkelt de command line tool PoGo en aldus kan de toewijzing van peptiden op genoom coördinaten met behulp van de referentie-aantekening van eiwit-codeert genen meestal waarin de GTF en de vertaalde transcript sequenties in FASTA formaat. Verschillende outputformaten worden gegenereerd door PoGo om de visualisatie van verschillende aspecten van de peptiden vastgesteld door middel van de Spectrometrie van de massa, met inbegrip van posttranslationele modificaties en peptide niveau kwantificering. Uitvoerbestanden in het BED kunnen verder worden geconverteerd en gecombineerd tot online toegankelijke folders genaamd track hubs. Enkele uitvoerbestanden, evenals de track hubs, kunnen vervolgens worden gevisualiseerd in browsers zoals de UCSC Genome Browser25, Ensembl Genome Browser20IGV24en Biodalliance28 (Zie onderste Figuur 5 ).
We PoGo toegepast op de reanalysis van de ontwerp-menselijk proteoom kaarten gefilterd op hoge betekenis, zoals beschreven in Wright et al. 7 en het vergeleken met twee andere hulpprogramma's voor het omzetten van de proteogenomic, namelijk iPiG14 en PGx10. De dataset bestaat 233,055 unieke peptiden over 59 volwassen en foetale weefsels, resulterend in een totaal van meer dan 3 miljoen reeksen. PoGo presteerde beter dan deze hulpprogramma's zowel in de runtime (6,9 x en 96.4 x sneller, respectievelijk) en geheugengebruik (20% en 60% minder geheugen, respectievelijk) zoals aangegeven in Figuur 6-18. Een voorbeeld van een succesvol toegewezen peptide is weergegeven in Figuur 7.
Terwijl PoGo is aanzienlijk beter dan de andere gereedschappen in snelheid en geheugen, is het ook geschikt voor toewijzing posttranslationele modificaties en kwantitatieve informatie in verband met peptiden op het genoom. Figuur 8A toont schematisch de visualisatie van de BED-indeling in de browser van een genoom voor peptides mapping naar één exon en over splice kruispunten. PoGo maakt gebruik van de kleuren-optie om te verstrekken gemakkelijk met het visuele hulpmiddel met betrekking tot de uniciteit van de toewijzing van de peptide binnen het genoom. Toewijzingen in het rood aangegeven uniciteit aan een enkele chat-kopie, terwijl zwarte hoogtepunten toewijzen aan een enkel gen. Echter wordt de peptide gedeeld tussen verschillende afschriften. Grijze toewijzingen weergeven een peptide gedeeld tussen meerdere genen. Dit zijn bijvoorbeeld minder betrouwbaar zijn voor de kwantificering van een gen of onbetrouwbare Bel de expressie van een gen. De PTM BED optie van PoGo herdefinieert de kleurcode aangepast aan verschillende soorten posttranslationele modificaties, zoals weergegeven in Figuur 8. Bovendien, worden PTMs aangeduid met dikke blokken (Zie Figuur 8). Een enkele PTM van een type wordt gemarkeerd door een dikke blok op de positie van het residu gedroogd gemodificeerde aminozuur, terwijl meerdere PTMs van hetzelfde type worden overbrugd door een dikke blok van het eerste gewijzigde aminozuur aan de laatste.
We PoGo en vervolgens TrackHubGenerator toegepast op een dataset van 50 colorectal kanker cellijnen, met inbegrip van hele Proteoom en phosphoproteome29. Terwijl de hub van de track geladen in de UCSC Genome Browser de peptiden toegewezen aan het genoom toont en hoogtepunten van de uniciteit van de toewijzingen en de sites van de fosforylatie (Zie Figuur 9), worden aanvullende gegevens verstrekt in de aanvullende map. De GCT bestanden schakelt de visualisatie van de kwantificatie van de peptide en phosphopeptide in een genomic context. GCT bestanden bieden echter niet een eenvoudige visualisatie van peptiden spanning over splice kruispunten (Zie Figuur 10 top). De peptiden in splice kruispunten worden opgesplitst in hun respectievelijke onderdelen toewijzen aan de exons. Hoewel het mogelijk is te identificeren splice peptiden via dezelfde kwantitatieve waarden van exon toewijzingen, laden sequentie gebaseerde toewijzing bestanden zoals BED of GTF die de exons verbinden door een dunne intron spanning lijnsondersteuning de interpretatie (Zie Figuur 10 onder).
Nadruk wordt gelegd op het nut van variant ingeschakeld mapping, we in twee configuraties bij een dataset van menselijke testis Proteoom searched tegen neXtProt om te jagen voor ontbrekende eiwitten met behulp van een Multi enzym strategie22PoGo toegepast. De neXtProt omvat naast verwijzing proteïne sequenties van meer dan 5 miljoen één aminozuur varianten30. Toewijzen van peptiden geïdentificeerd met een enkele aminozuur variant wordt niet ondersteund door andere mapping tools. Totaal 177,012 unieke peptiden werden geïdentificeerd. Hiervan waren 99,8% (176,694) peptiden eerst succesvol toegewezen zonder dat incongruenties. Verwijderen uit de lijst van geïdentificeerde peptide resulteerde in 0,2% (318) peptiden die vervolgens toegewezen waardoor één aminozuur vervanging werden. Dit resulteerde in 3,446 toewijzingen van 162 peptiden die niet zou zijn toegewezen aan het genoom van de verwijzing met een ander beschikbaar hulpmiddel. Terwijl het gemiddelde aantal toewijzingen met inbegrip van een mismatch hoog is, werden 62 peptiden toegewezen aan slechts een enkele locus, die aangeeft waar variant sequenties. Een voorbeeld van een peptide met een één aminozuur vervanging toegewezen is gemarkeerd met de volgorde en de volgorde van de vertaalde genomic in Figuur 11.

Figuur 1. Visuele vergelijking van verschillende peptide-naar-genoom-toewijzing hulpmiddelen. De vergelijking wordt weergegeven met betrekking tot verschillende aspecten. Deze aspecten omvatten een verwijzing van de toewijzing, het niveau van integratie in de kaders en de ondersteuning van online en offline browsers. Daarnaast is de nieuwe aspecten van proteogenomics en hun eigenschapsteun afzonderlijk gemarkeerd. PoGo mist alleen de mogelijkheid om rechtstreeks toewijzen aan een genoom in vergelijking met andere hulpprogramma's. Echter, het ondersteunt alle nieuwe functies die de meeste van de andere instrumenten niet ondersteunen. Klik hier voor een grotere versie van dit cijfer.

Figuur 2. Voorbeeld invoerbestand voor toewijzing peptides. PoGo accepteert invoergegevens in een door tabs gescheiden indeling met 4 kolommen. Kolomkoppen in de eerste regel zijn 'Experiment', 'Peptide', "PSMs" en "Quant", waarmee wordt aangegeven in de volgende lijnen het experiment of monster-id, de peptide-reeks het aantal peptide-spectrum wedstrijden en een kwantitatieve waarde voor de peptide, respectievelijk. Ondersteund met bepaalde bestandsextensies zijn *.txt, *.tsv en *.pogo. Klik hier voor een grotere versie van dit cijfer.

Figuur 3. PoGoGUI interface met gemarkeerde stappen voor bestandsselecties en Parameteropties. De figuur toont de stappen voor het selecteren en uploaden van alle benodigde bestanden en de selectie van opties voor toewijzing peptides met posttranslationele modificaties op het genoom van de mens referentie. Klik hier voor een grotere versie van dit cijfer.

Figuur 4. Screenshot van de integratieve Genomics Viewer (IGV) gegevens uploaden procedure. De figuur benadrukt de stappen voor het uploaden van PoGo output bestanden in de browser van de IGV. Bovendien, het toont de optie van uitbreiding van het spoor van toegewezen peptiden Markeer de toewijzing en de volgorde. Klik hier voor een grotere versie van dit cijfer.

Figuur 5. Vereenvoudigde workflow van stappen van LC-MS/MS naar visualisatie in genoom browsers. PoGo toewijzing volgt de identificatie van peptiden van tandem massaspectra. Om de toewijzing aan het genoom, PoGo maakt gebruik van referentie aantekening geleverd als genoom-annotatie (GTF) en afschrift vertaling sequenties (FASTA). Verschillende output formaten worden gegenereerd die afzonderlijk kan worden geladen in browsers van het genoom. Bovendien kunnen bestanden in BED-indeling worden gecombineerd tot track hubs ter ondersteuning van de visualisatie van grote datasets. Klik hier voor een grotere versie van dit cijfer.

Figuur 6. Benchmarking PoGo tegen PGx en iPiG. PoGo overtreft de andere tools op benchmarking. Mapping 233,055 unieke peptiden over 59 volwassen en foetale weefsels resulteert in meer dan 3 miljoen reeksen, was PoGo 6.9 x en 96.4 x sneller dan PGx en iPiG, respectievelijk. PoGo vereist bovendien 20% en 60% minder geheugen in vergelijking met PGx en iPiG, respectievelijk. Terwijl PoGo en PGx succesvol uitgevoerd is, resulteerde iPiG in een fout van het geheugen van 16 GB. Klik hier voor een grotere versie van dit cijfer.

Figuur 7. Voorbeeld UCSC genoom browserweergave van toegewezen peptiden. De afbeelding wordt toegewezen aan de gene mTOR peptiden. Terwijl de gecombineerde track de peptiden spanning over splice kruispunten en toewijzen van slechts aan één exon met de bijbehorende sequenties toont, Markeer de weefsel-specifieke tracks alleen de toewijzing in een verkorte notatie. Klik hier voor een grotere versie van dit cijfer.

Figuur 8. Schematische voor het toewijzen van visualisatie en kleurcodering. (A) In het uitvoerbestand standaard BED peptiden toewijzen aan een exon worden weergegeven als één blokken (links), terwijl peptiden mapping over meerdere exons hoogtepunt de exon die betrekking hebben op onderdelen als blokken (rechts). Introns worden zo dun aaneenschakelen lijnen weergegeven. PoGo gekleurd de uniciteit van de toewijzing of peptiden aan genen, en transcripties met behulp van een 3-tier systeem. (B) naast de blok-structuur van de indeling van het BED, PTM BED uitvoer belicht de positie van posttranslationele modificaties als dikke blokken. De aanwezigheid van een enkele PTM van een type benadrukt het residu van de gemodificeerde aminozuur met een dikke blok, terwijl meerdere sites van de dezelfde PTM worden gecombineerd tot lange blokken, variërend van de eerste tot de laatste wijziging website. Peptide toewijzingen zijn verder verdeeld door PTM type en kleur codec op basis van de wijziging. Klik hier voor een grotere versie van dit cijfer.

Figuur 9. Track hub weergeven in de browser genoom UCSC van colorectal kanker Proteoom- en phosphoproteome. De track hub bestaat uit hele Proteoom gegevens, alsmede phosphoproteome. Terwijl de rode kleur in de Proteoom en phosphoproteome tracks geven de uniciteit van de toewijzing aan de één afschrift van SFN, show tracks die eindigt op _ptm fosforylering websites van peptiden. Hier, geeft de rode kleur het type wijziging als fosforylering. Slechts twee peptiden zijn geïdentificeerd met elke het tonen van een enkele fosforylatie (dikke blokken). Klik hier voor een grotere versie van dit cijfer.

Figuur 10. Weergave van colorectal kanker phosphopeptides en bijbehorende kwantificatie in IGV. De figuur toont een subset van de cellijnen 50 kanker. Bovendien blijkt vier kolommen van blokken in verschillende tinten van licht rood. De kleur duidt de relatieve overvloed van laag (wit) te hoog (rood). Terwijl de vier kolommen in eerste instantie leiden kunnen om te geloven dat er 4 peptiden, blijkt met de bijbehorende reeks gebaseerde GTF uitvoerbestand dat dit zijn in feite twee peptides, elke spanning een splice junction. Klik hier voor een grotere versie van dit cijfer.

Figuur 11. Weergave van peptide met aminozuur variant in de IGV. De figuur toont een peptide met een variant van de één aminozuur toegewezen aan het genoom van de referentie aan het begin van de vertaling van het gen GPSM1. De variant is bij aminozuur residu 8 en resultaten in de vervanging van alanine tot valine (A→V) geplaatst. De sequenties van de vertaling van de geannoteerde transcripten (blauw) markeren de variant in vergelijking met de volgorde van de peptide. Klik hier voor een grotere versie van dit cijfer.