$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Una rappresentazione grafica di evidenziazione a cui viene applicata la fase di un flusso di lavoro regolare proteomica PoGo18 , così come a valle opzioni di visualizzazione, è illustrato nella Figura 5. Proteomica di fucile da caccia (cioè, la digestione proteolitica delle proteine seguita da cromatografia liquida accoppiata alla spettrometria di massa tandem) è un passo precursore del mapping proteogenomic. Gli spettri di massa tandem risultante sono comunemente rispetto al teorici spettri derivati da database di sequenza della proteina. Proteogenomics studi presentano sequenze di traduzione del romanzo trascrizioni con codifica varianti potenziali e non sinonimo di singolo nucleotide (SNVs) nel database, rendendo difficile a relazionarsi facilmente questi indietro con il genoma di riferimento8. L'interfaccia utente grafica di PoGo (PoGoGUI) supporta i formati di file per il reporting standardizzato di identificazioni di peptide da esperimenti di spettrometria di massa e li converte nel formato semplificato 4-colonna pogo. PoGoGUI avvolge lo strumento della riga di comando PoGo e quindi permette la mappatura dei peptidi sul genoma coordinate utilizzando l'annotazione di riferimento di geni di proteina-codificazione comunemente fornito nel GTF e le sequenze di trascrizione tradotta in formato FASTA. Diversi formati di output sono generati da PoGo per abilitare la visualizzazione dei diversi aspetti dei peptidi identificati mediante spettrometria di massa, tra cui modificazioni post-traduzionali e quantificazione livello del peptide. I file di output nel letto possono essere ulteriormente convertiti ed combinati in directory accessibile online chiamata mozzi pista. File di uscita singola, nonché mozzi pista, quindi possono essere visualizzati nel browser come l'UCSC Genome Browser25, Ensembl Genome Browser20, IGV24e Biodalliance28 (Vedi Figura 5 inferiore).
Abbiamo applicato PoGo per la rianalisi del progetto proteoma umano mappe filtrato a alto significato, come descritto in Wright et al. 7 e rispetto a due altri strumenti per la mappatura di proteogenomic, vale a dire iPiG14 e PGx10. Il dataset comprende 233.055 unici peptidi attraverso 59 tessuti adulti e fetali, risultante in un totale di oltre 3 milioni di sequenze. PoGo ha superato questi strumenti in fase di esecuzione (6.9 x e 96,4 x più veloce, rispettivamente) e l'utilizzo della memoria (20% e il 60% meno di memoria, rispettivamente) come mostrato nella Figura 618. Nella Figura 7è riportato un esempio di un peptide con successo mappato.
Mentre PoGo significativamente sovraperformato gli altri strumenti in velocità e memoria, è anche capace di modificazioni post-traduzionali di mappatura e informazioni quantitative connesso con peptidi sul genoma. Figura 8A raffigura schematicamente la visualizzazione del formato letto in un browser del genoma per peptidi mapping da un esone e da altra parte della giuntura giunzioni. PoGo utilizza l'opzione di colorazione per fornire facile aiuto visivo per quanto riguarda l'unicità della mappatura del peptide all'interno del genoma. Mapping in rosso indicano l'unicità di una trascrizione singola, mentre nero evidenzia il mapping a un singolo gene. Tuttavia, il peptide è condivisa tra diverse trascrizioni. Mapping di grigio mostrano un peptide condiviso tra geni multipli. Queste sono, per esempio, meno affidabile per la quantificazione di un gene o inaffidabile per chiamare l'espressione di un gene. L'opzione di PTM letto di PoGo ridefinisce il codice colore per ospitare diversi tipi di modificazioni post-traduzionali, come mostrato in Figura 8B. Inoltre, PTM sono indicati da blocchi di spessore (Vedi Figura 8B). Un singolo PTM di un tipo è evidenziato da un blocco di spesso nella posizione del residuo dell'amminoacido modificate, mentre PTMs multiple dello stesso tipo sono occupate da un blocco di spesso dal primo amminoacido modificato fino all'ultimo.
Abbiamo applicato PoGo e, successivamente, TrackHubGenerator a un dataset di 50 linee cellulari di cancro colorettale tra cui intero proteoma e phosphoproteome29. Mentre l'hub di traccia caricata nel Browser genoma UCSC Mostra i peptidi mappati il genoma e mette in evidenza l'unicità dei mapping e i siti di fosforilazione (Vedi Figura 9), nella cartella supplemento sono forniti ulteriori dati. I file GCT quindi attivare la visualizzazione del peptide e phosphopeptide quantificazione in un contesto genomico. Tuttavia, i file GCT non forniscono una visualizzazione semplice dei peptidi si estendono su giunzioni della giuntura (Vedi Figura 10 top). I peptidi sui nodi di giunzione sono divisi nelle loro rispettive parti mapping tra gli esoni. Mentre è possibile identificare peptidi della giuntura attraverso gli stessi valori quantitativi di mapping essone, mapping basato sulla sequenza di caricamento file come letto o GTF che collegano gli esoni di un introne sottile che attraversa la linea di supporto all'interpretazione (Vedi Figura 10 in basso).
Per evidenziare l'utilità della variante abilitata mappatura, abbiamo applicato il PoGo in due configurazioni a un dataset del proteoma umano testicolo cercato contro neXtProt a caccia di proteine mancante utilizzando una strategia multi-enzima22. Il neXtProt comprende oltre a sequenze della proteina di riferimento oltre 5 milioni di varianti di singolo amminoacido30. Mapping di peptidi identificati con una variante di singolo amminoacido non è supportato da altri strumenti di mappatura. Un totale di 177.012 unici peptidi sono stati identificati. Di questi, peptidi di 99,8% (176.694) in primo luogo sono stati mappati correttamente senza consentire disallineamenti. Rimuovendo quelli dall'elenco del peptide identificato ha provocato peptidi di 0,2% (318) che successivamente sono stati mappata permettendo una sostituzione dell'amminoacido. Ciò ha provocato 3.446 mapping di 162 peptidi che non sarebbero stati mappati il genoma di riferimento con qualsiasi altro strumento disponibile. Mentre il numero medio di mapping tra cui una mancata corrispondenza è alto, 62 peptidi sono stati associati a solo un singolo locus, che indica la vere variante sequenze. Un esempio di un peptide mappato con una singola sostituzione dell'amminoacido è evidenziato con la sequenza e la sequenza genomic tradotta nella Figura 11.

Figura 1. Confronto visivo di strumenti di mapping del peptide al genoma diverso. Il confronto è indicato per quanto riguarda vari aspetti. Questi aspetti comprendono un riferimento di mappatura, il livello di integrazione nella rete e il supporto dei browser online e offline. Inoltre, nuovi aspetti della proteogenomics e il loro sostegno di funzionalità viene evidenziato separatamente. PoGo manca solo la capacità di mappare direttamente a una sequenza di genoma rispetto ad altri strumenti. Tuttavia, supporta tutte le caratteristiche novelle che non supportano la maggior parte degli altri strumenti. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 2. File di input di esempio per i peptidi mappatura. PoGo accetta dati di input in un formato separato da tabulazioni con 4 colonne. Le intestazioni di colonna nella prima riga sono 'Esperimento', 'Peptide', 'PSMs' e 'Quant', che indica nelle righe che seguono l'esperimento o identificatore di esempio, la sequenza del peptide, il numero di corrispondenze di peptide-spettro e un valore quantitativo per il peptide, rispettivamente. Estensioni di file supportate sono *. txt, *.tsv e *.pogo. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 3. PoGoGUI interfaccia con passaggi evidenziati per parametro opzioni e selezioni file. La figura mostra i passaggi per la selezione e il caricamento di tutti i file necessari e la selezione delle opzioni per i peptidi di mappatura con modificazioni post-traduzionali sul genoma umano di riferimento. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 4. Screenshot dei dati Integrative Genomics Viewer (IGV) caricare procedura. La figura evidenzia la procedura per il caricamento di file di output di PoGo nel browser IGV. Inoltre, Mostra la possibilità di espandere la traccia dei peptidi mappate per evidenziare la mappatura e la sequenza. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 5. Semplificate il flusso di lavoro di passi da LC-MS/MS per la visualizzazione nei browser genoma. PoGo mappatura segue l'identificazione dei peptidi da spettri di massa tandem. Per ottenere la mappatura del genoma, PoGo utilizza annotazione di riferimento fornito come annotazione del genoma (GTF) e sequenze di trascrizione traduzione (FASTA). Output di diversi formati sono generati che possono essere caricati separatamente in browser del genoma. Inoltre, i file in formato letto possono essere combinati in pista Hub supporta la visualizzazione di DataSet su larga scala. Clicca qui per visualizzare una versione più grande di questa figura.

Nella figura 6. PoGo contro PGx e iPiG di benchmarking. PoGo sorpassa gli altri strumenti sul benchmarking. Mappatura 233.055 unici peptidi attraverso 59 tessuti adulti e fetali con conseguente oltre 3 milioni di sequenze, PoGo era 6,9 x e 96,4 x più veloce di PGx e iPiG, rispettivamente. Inoltre, PoGo necessaria 20% e il 60% meno memoria rispetto a PGx e iPiG, rispettivamente. Mentre PoGo e PGx terminato con successo, iPiG ha provocato un errore di memoria a 16 GB. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 7. Visualizzazione di esempio di browser UCSC genoma di peptidi mappate. La figura mostra peptidi mappati il gene mTOR. Mentre la pista combinata presenta i peptidi si estendono su giunzioni della giuntura ed eseguire il mapping solo di un esone con le sequenze associate, le tracce di tessuto-specifica solo evidenziano il mapping in un formato ridotto. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 8. Schema di mapping di visualizzazione e codifica a colori. (A) nel file di output letto standard, peptidi mapping a un esone sono indicati come singoli blocchi (a sinistra), mentre peptidi mappatura attraverso multipli esoni clou dell'esone che coprono parti come blocchi (a destra). Gli introni sono mostrati come sottili linee di concatenazione. PoGo color-codes l'unicità di mappatura o peptidi ai geni e trascrizioni utilizzando un sistema a 3 livelli. (B) oltre alla struttura di blocco del formato letto, letto PTM uscita sottolinea la posizione di modificazioni post-traduzionali come blocchi di spessore. La presenza di un singolo PTM di un tipo mette in evidenza il residuo modificata dell'aminoacido con un blocco di spesso, mentre i luoghi multipli della stessa PTM sono combinati in blocchi lunghi che vanno dal primo all'ultimo sito modification. Mapping del peptide sono ulteriormente divisi di codec di tipo e colore PTM basato sulla modifica. Clicca qui per visualizzare una versione più grande di questa figura.

Nella figura 9. Tenere traccia di visualizzazione hub nel browser UCSC genoma del cancro colorettale proteoma e phosphoproteome dati. L'hub di pista comprende intero proteoma dati così come phosphoproteome. Mentre il colore rosso nelle tracce proteoma e phosphoproteome indicare l'unicità del mapping per la singola trascrizione di SFN, tracce che termina in _ptm Visualizza i siti di fosforilazione in peptidi. Qui, il colore rosso indica il tipo di modifica come fosforilazione. Solo due peptidi sono stati identificati con ogni mostrando una singola fosforilazione (blocchi di spessore). Clicca qui per visualizzare una versione più grande di questa figura.

Figura 10. Vista del cancro colorettale fosfopeptidi e quantificazione associata a IGV. La figura mostra un sottoinsieme delle linee cellulari del 50 cancro. Esso inoltre presenta quattro colonne di blocchi in diverse tonalità di luce rosso. Il colore indica l'abbondanza relativa tra basso (bianco) e alta (rosso). Mentre le quattro colonne inizialmente potrebbero portare a credere che ci sono 4 peptidi, diventa chiaro con associato basato su sequenze GTF file di output che in realtà si tratta di due peptidi, ogni che abbracciano una giunzione della giuntura. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 11. Vista del peptide con variante dell'aminoacido in IGV. La figura mostra un peptide con una variante di singolo amminoacido mappata il genoma di riferimento all'inizio di traduzione del gene GPSM1. La variante è posizionata a residuo dell'amminoacido 8 e risultati nella sostituzione dell'alanina per valina (A→V). Le sequenze di traduzione delle trascrizioni con annotazioni (blue) evidenziano la variante rispetto la sequenza del peptide. Clicca qui per visualizzare una versione più grande di questa figura.