$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Une représentation graphique mettant en évidence au cours de laquelle scène d’un workflow de protéomique régulière PoGo18 est appliqué, ainsi que les options en aval de la visualisation est illustré à la Figure 5. Shotgun proteomics (c.-à-d., la digestion protéolytique des protéines suivie par chromatographie liquide couplée à la spectrométrie de masse) est une étape préliminaire de mappage proteogenomic. Les spectres de masse en tandem qui en résulte sont communément comparés aux spectres théoriques provenant de bases de données de séquence protéique. Proteogenomics études introduisent des séquences de traduction des nouvelles transcriptions avec codage des variantes de nucléotides non-synonymes et potentiels (SNVs) dans la base de données, qui rend difficile de relier facilement ces dos pour le génome de référence8. L’interface utilisateur graphique de PoGo (PoGoGUI) prend en charge les formats de fichier pour l’établissement de rapports normalisés d’identifications de peptide des expériences de spectrométrie de masse et les convertit au format simplifié 4-colonne pogo. PoGoGUI encapsule l’outil de ligne de commande PoGo et permet ainsi la cartographie des peptides sur génome coordonnées utilisant l’annotation de référence des gènes codant pour des protéines, généralement fourni dans le GTF et les séquences de transcription traduite au format FASTA. Différents formats de sortie sont générés par PoGo pour permettre la visualisation des différents aspects des peptides identifiés par le biais de la spectrométrie de masse, y compris les modifications post-traductionnelles et quantification niveau peptidique. Les fichiers de sortie dans le lit peuvent encore être convertis et regroupées dans des répertoires accessibles en ligne appelés moyeux piste. Les fichiers de sortie unique, mais aussi des moyeux piste, puis peut être visualisées dans les navigateurs tels que l’UCSC Genome Browser25, Ensembl Genome Browser20, IGV24et Biodalliance28 (voir en bas de la Figure 5 ).
Nous avons appliqué le PoGo à la réanalyse du projet human proteome cartes filtrée avec grande importance tel que décrit dans Wright et al. 7 et l’a comparée aux deux autres outils pour la cartographie proteogenomic, nommément iPiG14 et PGx10. L’ensemble de données composé des peptides uniques 233 055 59 tissus foetus et adultes, ce qui donne un total de séquences plus 3 millions. PoGo a surpassé ces outils à la fois en mode exécution (6,9 x et 96,4 x plus rapide, respectivement) et utilisation de la mémoire (20 % et 60 % moins de mémoire, respectivement) comme illustré à la Figure 618. Un exemple d’un peptide correctement mappé est illustré à la Figure 7.
Alors que le PoGo a nettement surclassé les autres outils en vitesse et mémoire, il est également capable de modifications post-traductionnelles de cartographie et de données quantitatives associées à des peptides sur le génome. Figure 8 a représente schématiquement la visualisation du format lit dans un navigateur du génome pour la cartographie d’un exon et à travers des peptides d’épissure jonctions. PoGo utilise l’option de coloriage pour fournir facile aide visuelle à l’égard de l’unicité de la cartographie des peptides dans le génome. Mappages en rouge indiquent la singularité d’une transcription unique, tout en noir souligne mappage à un seul gène. Toutefois, le peptide est partagé entre différentes transcriptions. Mappages de gris montrent un peptide partagé entre plusieurs gènes. Voici, par exemple, moins fiable pour la quantification d’un gène ou peu fiable pour appeler l’expression d’un gène. L’option lit PTM de PoGo redéfinit le code de couleur pour s’adapter à différents types de modifications post-traductionnelles comme illustré en Figure 8 b. En outre, MEA est indiqués par des blocs épais (voir Figure 8 b). Un PTM unique d’un type est mis en surbrillance par un bloc épais à la position du résidu d’acide aminé modifié, tandis que SPTM multiples du même type est traversés par un bloc épais de mis à jour le premier acide aminé à la dernière.
Nous avons appliqué la PoGo, puis TrackHubGenerator à un dataset de 50 lignées cellulaires de cancer colorectal notamment tout protéome et phosphoproteome29. Bien que le moyeu piste chargé dans l’UCSC Genome Browser montre les peptides mappés au génome et met en lumière le caractère unique des mappages et les sites de phosphorylation (voir Figure 9), des données supplémentaires sont fournies dans le dossier supplémentaire. Les fichiers GCT puis activer la visualisation de la quantification de peptide et phosphopeptide dans un contexte génomique. Toutefois, les fichiers GCT ne fournissent pas une visualisation facile des peptides s’étendant à travers épissure jonctions (voir le haut de la Figure 10 ). Les peptides travers épissure jonctions sont divisées en leurs parties respectives de cartographie pour les exons. Bien qu’il soit possible d’identifier des peptides d’épissure par les mêmes valeurs quantitatives des mappages d’exon, mappage basé sur les séquences de chargement des fichiers comme lit ou FTE qui relient les exons par un intron mince s’étendant sur la ligne de support l’interprétation (voir la Figure 10 en bas).
Pour mettre en évidence l’utilité de la variante a permis à la cartographie, nous avons appliqué le PoGo en deux configurations à un dataset du testicule humain proteome recherché contre neXtProt de chasser pour protéines manquantes à l’aide d’une stratégie multi-enzymatique22. Le neXtProt comprend, en plus de séquences de protéines de référence, plus 5 millions seul acide aminé variantes30. Cartographie des peptides identifiés par une seul acide aminé variante n’est pas supporté par d’autres outils de cartographie. Un total de 177 012 peptides uniques ont été identifiés. Parmi ceux-ci, peptides de 99,8 % (176 694) ont été tout d’abord correctement mappés sans permettre des non-correspondances. Enlevant ceux de la liste de peptide identifiés ont entraîné des peptides de 0,2 % (318) qui par la suite ont été cartographiés permettant une substitution d’acide aminé. Il en est résulté 3 446 mappages de 162 peptides qui n’auraient pas ont été cartographiées dans le génome de référence avec n’importe quel autre outil disponible. Tandis que le nombre moyen de mappages, y compris une incompatibilité est élevé, 62 peptides ont été cartographiés pour seulement un seul locus, indiquant des séquences variantes vrais. Un exemple d’un peptide mappé à une seul acide aminé de substitution est mis en évidence avec sa séquence et la séquence génomique traduite à la Figure 11.

Figure 1. Comparaison visuelle des outils différents cartographie peptidique-à-génome. La comparaison est montrée en ce qui concerne les divers aspects. Ces aspects comprennent une référence de mappage, le niveau d’intégration dans les cadres et la prise en charge des navigateurs en ligne et hors ligne. En outre, les nouveaux aspects de proteogenomics et leur prise en charge de la fonctionnalité est surlignée séparément. PoGo manque seulement la capacité de mapper directement à une séquence du génome par rapport à d’autres outils. Toutefois, il prend en charge toutes les fonctionnalités nouvelles qui la plupart des autres outils ne supporte pas. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 2. Exemple de fichier d’entrée pour les peptides cartographie. PoGo accepte d’entrée de données dans un format séparé par des tabulations avec 4 colonnes. En-têtes de colonnes dans la première ligne sont « Expérience », « Peptide », « MPS » et « Quant », indiquant dans les lignes suivantes l’expérience ou identificateur de l’échantillon, la séquence peptidique, le nombre de correspondances de peptide-spectre et une valeur quantitative pour le peptide, respectivement. Les extensions de nom de fichier pris en charge sont *.txt, *.tsv et *.pogo. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 3. PoGoGUI interface avec des étapes en surbrillance pour la sélection de fichier et les options de paramètre. La figure montre les étapes de sélection et de télécharger tous les fichiers requis et la sélection des options pour les peptides de la cartographie avec des modifications post-traductionnelles sur le génome humain de référence. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 4. Capture d’écran des données Viewer de génomique intégrative (IGV) Télécharger procédure. La figure met en évidence les étapes pour le téléchargement des fichiers de sortie de PoGo dans l’Explorateur de l’IGV. En outre, il montre la possibilité d’élargir la voie ferrée de peptides mappés pour mettre en évidence de la cartographie et la séquence. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 5. Simplifié des flux de travail d’étapes de LC-MS/MS pour la visualisation dans les navigateurs de génome. Cartographie de PoGo fait suite à l’identification des peptides de spectres de masse en tandem. Pour réaliser la cartographie du génome, PoGo utilise annotation de référence fournie comme annotation du génome (GTF) et les séquences de traduction transcription (FASTA). Sortie différents formats sont générés qui peut être chargé séparément dans les navigateurs de génome. En outre, les fichiers au format lit peuvent être combinés dans moyeux piste soutenant la visualisation de données à grande échelle. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 6. Analyse comparative de PoGo contre PGx et iPiG. PoGo surpasse les autres outils sur l’analyse comparative. Cartographie des peptides uniques 233 055 travers 59 tissus adultes et foetaux, résultant en plus 3 millions de séquences, PoGo était x 6,9 et 96,4 x plus rapide que PGx et iPiG, respectivement. En outre, PoGo requis de 20 % et 60 % moins de mémoire par rapport à PGx et iPiG, respectivement. PoGo et PGx qui termine avec succès, iPiG a entraîné une erreur de mémoire de 16 Go. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 7. UCSC Genome browser exemple vue de peptides mappés. La figure montre les peptides mappées sur le gène mTOR. Alors que la piste combinée montre les peptides s’étendant à travers des jonctions d’épissure et de cartographie uniquement d’un exon avec les séquences associées, les morceaux de tissu-spécifique que mettre en évidence la cartographie sous une forme condensée. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 8. Schéma de mappage de visualisation et codage couleur. (A) dans le fichier de sortie de lit standard, les peptides, cartographie d’un exon sont affichés sous forme d’Uniblock (à gauche), tandis que des peptides cartographie à travers plusieurs exons point culminant l’exon couvrant une partie sous forme de blocs (à droite). Introns figurent aussi minces concaténation lignes. PoGo code l’unicité de cartographie ou de peptides à gènes et des transcriptions en utilisant un système à 3 couches. (B) en plus de la structure de bloc du format lit, lit de PTM sortie met en évidence la position des modifications post-traductionnelles comme blocs épais. La présence d’un PTM unique d’un type met en évidence le résidu d’acide aminé modifié avec une cale d’épaisseur, tandis que plusieurs sites de la PTM même sont regroupés en blocs de longs qui s’étend de la première du dernier site de modification. Mappages de peptide sont ensuite répartis selon leur codec basé sur la modification de la couleur et le type de PTM. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 9. Suivre moyeu afficher dans le navigateur de génome UCSC de données protéome et phosphoproteome de cancer colorectal. Le moyeu piste comprend proteome entières données comme phosphoproteome. Alors que la couleur rouge dans les voies du protéome et phosphoproteome indiquent l’unicité de la cartographie à la simple transcription de la SFN, les titres se terminant par _ptm montrent les sites de phosphorylation au sein de peptides. Ici, la couleur rouge indique le type de modification comme la phosphorylation. Seulement deux peptides ont été identifiés avec chaque montrant une phosphorylation unique (blocs épais). S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 10. Vue du cancer colorectal phosphopeptides et au dosage associé en IGV. La figure montre un sous-ensemble des lignées cellulaires du 50 cancer. Elle brille en outre en quatre colonnes de blocs dans différentes nuances de lumière rouge. La couleur indique l’abondance relative de basse (blanc) à élevé (rouge). Alors que les quatre colonnes pourraient conduire au départ de croire qu’il y a 4 peptides, il devient évident avec l’axée sur la séquence GTF sortie fichier associé que ce sont en fait deux peptides, chacun couvrant une jonction d’épissure. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 11. Vue du peptide avec variante d’acides aminés en IGV. La figure montre un peptide avec une seul acide aminé variante mappée sur le génome de référence au début du gène GPSM1traduction. La variante est positionnée au résidu d’acide aminé 8 et aboutit à la substitution d’alanine à valine (A→V). Les séquences de traduction de la transcription annotée (bleue) mettent en évidence la variante par rapport à la séquence peptidique. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.