$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Eine grafische Darstellung Hervorhebung auf der Bühne eines regelmäßigen Proteomic Workflows PoGo18 , sowie nachgeschaltete Möglichkeiten der Visualisierung angewendet ist, ist in Abbildung 5dargestellt. Schrotflinte Proteomics (d.h. die proteolytische Verdauung von Proteinen, gefolgt von Flüssigkeitschromatographie gekoppelt mit Tandem-Massenspektrometrie) ist eine vorausgehende Schritt Proteogenomic Mapping. Die daraus resultierende Tandem Massenspektren werden häufig mit theoretischen Spektren abgeleitet von Protein Sequenzdatenbanken verglichen. Proteogenomics Studien vorstellen Übersetzung Sequenzen von neuartigen Protokolle mit Codierung Potenzial und nicht Synonym für Einzel-Nukleotid-Varianten (SNVs) in der Datenbank, so dass es schwer zu leicht diese wieder auf die Referenz-Genom-8beziehen. Die grafische Benutzeroberfläche von PoGo (PoGoGUI) unterstützt Datei-Formate für die standardisierte Meldung von Peptid Identifikationen von Massenspektrometrie Experimente und wandelt sie in das vereinfachte 4-Säulen-Pogo-Format. PoGoGUI umschließt das Kommandozeilen-Tool PoGo und ermöglicht so die Zuordnung von Peptiden auf Genom-Koordinaten mit Hilfe der Referenz-Annotation von Protein-kodierenden Gene, die häufig in den GTF und übersetzte Abschrift Sequenzen im FASTA-Format zur Verfügung gestellt. Verschiedene Ausgabeformate entstehen durch PoGo ermöglichen die Visualisierung der verschiedenen Aspekte der Peptide identifiziert durch Massenspektrometrie, einschließlich Post-translationalen Modifikationen und Peptid Ebene Quantifizierung. Ausgabedateien im Bett können weiter umgewandelt und in online-zugänglichen Verzeichnisse namens Track Naben kombiniert werden. Einzelne Ausgabedateien sowie Track Naben können dann im Browser wie z. B. der UCSC Genome Browser25, Ensembl Genome Browser20IGV24und Biodalliance28 (siehe Abbildung 5 unten) visualisiert werden.
Wir PoGo auf der Reanalyse des Entwurfs des menschlichen Proteoms Karten gefiltert bei hohen Stellenwert wie in Wright Et Al. beschrieben angewendet 7 und zwei weitere Tools für die Proteogenomic Zuordnung, nämlich iPiG14 und PGx10gegenüber. Das Dataset besteht 233.055 einzigartige Peptide über 59 adulten und embryonalen Gewebe, wodurch insgesamt mehr als 3 Millionen Sequenzen. PoGo übertraf diese Werkzeuge in der Runtime (6,9 x und 96.4 x schneller, beziehungsweise) und Speichernutzung (20 % und 60 % weniger Speicher, beziehungsweise) wie in Abbildung 618dargestellt. Ein Beispiel für ein erfolgreich zugeordneten Peptid ist in Abbildung 7dargestellt.
Während PoGo deutlich besser die anderen Tools in Geschwindigkeit und Speicher als, ist es auch in der Lage, Zuordnung Post-translationalen Modifikationen und quantitative Informationen im Zusammenhang mit Peptiden auf das Genom. Abbildung 8A zeigt schematisch die Visualisierung des Formates Bett in einem Genom-Browser für Peptide, die Zuordnung zu einem Exon und über Kreuzungen Spleißen. PoGo nutzt die Färbung Möglichkeit, einfache visuelle Hilfe in Bezug auf die Einzigartigkeit des Peptid Mapping innerhalb des Genoms. Zuordnungen in rot zeigen Einzigartigkeit ein einzelnes Protokoll beim schwarzen Highlights, die Zuordnung zu einem einzelnen gen. Dennoch ist das Peptid zwischen verschiedenen Transkripte geteilt. Graue Zuordnungen zeigen eine Peptid geteilt zwischen mehreren Genen. Dies sind zum Beispiel weniger zuverlässig für die Quantifizierung eines Gens oder unzuverlässig die Expression eines Gens zu nennen. Die Möglichkeit, PTM Bett PoGo definiert den Farbcode um verschiedene Arten von Post-translationalen Modifikationen zu berücksichtigen, wie in Abbildung 8dargestellt. Darüber hinaus sind PTMs durch dicken Blöcken angezeigt (siehe Abbildung 8). Ein einzelnes PTM eines Typs ist durch ein dicker Klotz an der Position des modifizierten Aminosäurerest hervorgehoben, während mehrere PTMs des gleichen Typs von ein dicker Klotz aus die erste modifizierte Aminosäure zum letzten überspannt werden.
Auf ein Dataset 50 colorectal Krebs-Zell-Linien einschließlich ganze Proteom und Phosphoproteome29angewendet wir PoGo und anschließend TrackHubGenerator. Während der Track Hub geladen im Genom UCSC Browser die Peptide, die auf das Genom abgebildet zeigt und die Einzigartigkeit der Zuordnungen und die Phosphorylierung Websites unterstreicht (siehe Abbildung 9), werden zusätzliche Daten im Ordner "ergänzende" bereitgestellt. Die GCT-Dateien können dann die Visualisierung von Peptid und Phosphopeptide Quantifizierung in einem genomischen Kontext. GCT-Dateien bieten eine einfache Visualisierung von Peptiden spanning über Spleiß-Knoten (siehe Abbildung 10 oben) jedoch nicht. Die Peptide in Spleiß Kreuzungen sind in Zuordnung zu den Exons Teilen aufgeteilt. Es ist, zwar möglich, Spleiß Peptide durch die gleichen quantitativen Werte der Exon-Zuordnungen zu identifizieren wie Bett oder GTF, die durch eine dünne Intron-Line-Support über die Exons verbinden Dateien laden Sequenz-basierte Zuordnung die Auslegung (siehe Abbildung 10 (unten).
Um das Dienstprogramm Variante aktiviert Zuordnung zu markieren, haben wir in zwei Konfigurationen zu einem Dataset menschliche Hoden Proteoms gesucht gegen NeXtProt für fehlende Proteine mit einem Multi-Enzym-Strategie22jagen PoGo angewandt. Die NeXtProt umfasst neben Referenz Proteinsequenzen über 5 Millionen einzelne Aminosäure Varianten30. Mapping-Peptide identifiziert mit einer einzigen Aminosäure-Variante wird nicht durch andere Mapping-Tools unterstützt. Insgesamt 177.012 einzigartige Peptide wurden identifiziert. Von diesen wurden 99,8 % (176.694) Peptide zuerst erfolgreich zugeordnet, ohne dass Diskrepanzen. Entfernen aus der Liste der identifizierten Peptid ergab 0,2 % (318) Peptide, die anschließend zugeordneten ermöglicht eine Aminosäure-Substitution waren. Dies führte zu 3.446 Zuordnungen von 162 Peptide, die nicht an die Referenz-Genom mit anderen vorhandenen Werkzeug zugeordnet haben würde. Während die durchschnittliche Anzahl der Zuordnungen, einschließlich ein Missverhältnis hoch ist, waren 62 Peptide nur einen einzigen Locus, zeigt wahre Variante Sequenzen zugeordnet. Ein Beispiel für ein Peptid abgebildet mit einer einzigen Aminosäure-Substitution ist mit seiner Sequenz und der übersetzten genomischen Sequenz in Abbildung 11hervorgehoben.

Abbildung 1: Visueller Vergleich der verschiedenen Peptid-Genom-Mapping-Tools. Der Vergleich ist im Hinblick auf verschiedene Aspekte dargestellt. Diese Aspekte sind eine Mapping-Referenz, das Niveau der Integration in die Rahmenbedingungen und die Unterstützung der Online- und offline-Browser. Darüber hinaus neuartige Aspekte von Proteogenomics und deren Funktion Betreuung wird gesondert hervorgehoben. PoGo fehlt nur die Fähigkeit, eine Genomsequenz im Vergleich zu anderen Tools direkt zuzuordnen. Es unterstützt jedoch alle Neuerungen, die meisten anderen Tools nicht unterstützen. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 2: Beispiel-Eingabedatei für Zuordnung Peptide. PoGo akzeptiert Eingabedaten in eine tabulatorgetrennte Format mit 4 Spalten. Spaltenüberschriften in der ersten Zeile sind "Experimentieren", "Peptid", "Pvsm" und "Quant", in den folgenden Zeilen angibt, das Experiment oder Probe-Bezeichner, der Peptidsequenz, die Anzahl der Übereinstimmungen Peptid-Spektrum und ein quantitativer Wert für das Peptid bzw.. Dateinamenerweiterungen unterstützt werden *.txt, TSV und *.pogo. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 3. PoGoGUI Schnittstelle mit markierten Schritte zur Dateiauswahl und Parameteroptionen. Die Abbildung zeigt die Schritte zum auswählen und laden alle erforderlichen Dateien und die Auswahl der Optionen für die Zuordnung Peptide mit Post-translationalen Modifikationen auf die menschlichen Bezug Genom. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 4. Screenshot der Integrative Genomics Viewer (IGV) Daten hochladen Verfahren. Die Abbildung zeigt die Schritte für das Hochladen von PoGo Ausgabedateien in den IGV-Browser. Darüber hinaus zeigt es die Möglichkeit der Erweiterung der Strecke von zugeordneten Peptiden, markieren Sie die Zuordnung und Reihenfolge. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 5. Vereinfachte Workflow Schritte von LC-MS/MS Visualisierung in Genom Browser. PoGo-Mapping folgt die Identifizierung von Peptiden von Massenspektren Tandem. Um die Zuordnung des Genoms zu erreichen, nutzt PoGo Verweis Anmerkung als Genom Anmerkung (GTF) und Transkript Übersetzung Sequenzen (FASTA) zur Verfügung gestellt. Verschiedene Formate sind generierte Ausgabe, die im Genom Browser separat geladen werden kann. Darüber hinaus können Dateien im Bett-Format in Track Naben unterstützt Visualisierung von großen Datasets kombiniert werden. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 6. Benchmarking-PoGo gegen PGx und iPiG. PoGo übertrifft die anderen Tools zum benchmarking. Zuordnen von 233.055 einzigartige Peptide über 59 adulten und embryonalen Gewebe, was zu mehr als 3 Millionen Sequenzen, betrug PoGo 6,9 x 96.4 x schneller als PGx und iPiG, bzw.. Darüber hinaus verpflichtet PoGo 20 % und 60 % weniger im Vergleich zu PGx und iPiG, bzw. Speicher. PoGo und PGx erfolgreich abgeschlossen, doch wegen iPiG ein Speicherfehler bei 16 GB. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 7. Genom der UCSC Browser Beispielansicht zugeordneten Peptide. Die Abbildung zeigt Peptide gen mTOR zugeordnet. Während der kombinierte Track die Peptide spanning über Spleiß-Knoten und ein Exon mit den zugehörigen Sequenzen nur zuordnen zeigt, markieren die gewebespezifischen Tracks nur die Zuordnung in eine komprimierte Format. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 8: Mapping-Visualisierung und Farbcodierung schematische. (A) In der standard Bett Ausgabedatei Peptide, die Zuordnung zu einer Exon werden als einzelne Blöcke (links), während Peptide Zuordnung über mehrere Exons Highlight das Exon die Teile als Blöcke (rechts) angezeigt. Introns sind so dünn verketten Linien dargestellt. PoGo Bereichssuche die Einzigartigkeit der Zuordnung oder Peptiden, Gene und Protokolle, die mit einer 3-Tier-System. (B) zusätzlich die Blockstruktur des Formates Bett PTM Bett Ausgabe zeigt die Position des Post-translationalen Modifikationen als dicken Blöcken. Das Vorhandensein von einem einzigen PTM eines Typs highlights der modifizierten Aminosäurerest mit ein dicker Klotz, während mehrere Standorte des gleichen PTM zu lange Blöcke überspannt von der ersten bis zur letzten Änderung Seite zusammengefasst sind. Peptid-Zuordnungen werden von PTM Art und Farbe Codec basierend auf der Änderung weiter unterteilt. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 9. Hub-Ansicht im Browser UCSC Genom des kolorektalen Karzinoms Proteom und Phosphoproteome Daten zu verfolgen. Der Track Hub umfasst ganze Proteom Daten sowie Phosphoproteome. Während die rote Farbe in das Proteom und Phosphoproteome Tracks zeigen die Einzigartigkeit der Zuordnung zu den einzigen Abschrift des SFN, zeigen Spuren in _ptm endet die Phosphorylierung Seiten innerhalb von Peptiden. Hier gibt die rote Farbe die Art der Änderung als Phosphorylierung. Nur zwei Peptide sind mit jeder zeigt ein einzelnes Phosphorylierung (dicken Blöcken) identifiziert worden. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 10. Blick auf Darmkrebs-Phosphopeptides und damit verbundenen Quantifizierung in IGV. Die Abbildung zeigt einen Teil der 50 Krebszelllinien. Es zeigt außerdem vier Spalten der Blöcke in unterschiedlichen Schattierungen von Licht rot. Die Farbe zeigt die relative Häufigkeit von Low (weiß), hoch (rot). Während die vier Spalten zunächst um zu glauben, dass es 4 Peptide gibt führen könnte, wird deutlich, mit der damit verbundenen Sequenz-basierte GTF Ausgabedatei, dass diese in der Tat zwei Peptide sind jeder überspannt ein Spleiß-Knoten. Bitte klicken Sie hier für eine größere Version dieser Figur.

Abbildung 11. Ansicht des Peptids mit Aminosäure-Variante im IGV. Die Abbildung zeigt eine Peptid mit einer einzigen Aminosäure-Variante auf das Referenz-Genom zu Beginn der Übersetzung des GPSM1-Gens abgebildet. Die Variante ist Aminosäurerest 8 und Ergebnisse in der Substitution von Alanin, Valin (A→V) positioniert. Die Übersetzung Sequenzen der annotierten Transkripte (blau) markieren Sie die Variante im Vergleich zu der Peptidsequenz. Bitte klicken Sie hier für eine größere Version dieser Figur.