Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Ressources bioinformatiques pour l’étude des interactions protéiques médiées par le glycane

Published: January 20, 2022 doi: 10.3791/63356

Summary

Ce protocole illustre comment explorer, comparer et interpréter les glycomes de protéines humaines avec des ressources en ligne.

Abstract

L’initiative Glyco@Expasy a été lancée en tant que collection de bases de données et d’outils interdépendants couvrant plusieurs aspects des connaissances en glycobiologie. En particulier, il vise à mettre en évidence les interactions entre les glycoprotéines (telles que les récepteurs de surface cellulaire) et les protéines de liaison aux glucides médiées par les glycanes. Ici, les principales ressources de la collection sont présentées à travers deux exemples illustratifs centrés sur le N-glycome de l’antigène spécifique de la prostate humaine (PSA) et l’O-glycome des protéines sériques humaines. À travers différentes requêtes de base de données et à l’aide d’outils de visualisation, cet article montre comment explorer et comparer le contenu dans un continuum pour recueillir et corréler des éléments d’information autrement dispersés. Les données collectées sont destinées à alimenter des scénarios plus élaborés de la fonction du glycane. La glycoinformatique introduite ici est donc proposée comme un moyen de renforcer, de façonner ou de réfuter les hypothèses sur la spécificité d’un glycome protéique dans un contexte donné.

Introduction

Les glycanes, protéines auxquelles ils sont attachés (glycoprotéines) et protéines auxquelles ils se lient (lectines ou protéines liant les glucides) sont les principaux acteurs moléculaires à la surface de la cellule1. Malgré ce rôle central dans la communication cellule-cellule, les études à grande échelle, y compris les données sur la glycomique, la glycoprotéomique ou l’interactomique des glycanes, sont encore rares par rapport à leur homologue en génomique et en protéomique.

Jusqu’à récemment, les méthodes permettant de caractériser les structures ramifiées des glucides complexes tout en étant conjuguées à la protéine porteuse n’avaient pas été développées. La biosynthèse des glycoprotéines est un processus non piloté par un modèle dans lequel les donneurs de monosaccharides, les substrats de glycoprotéines acceptants, les glycosyltransférases et les glycosidases jouent un rôle interactif. Les glycoprotéines résultantes peuvent porter des structures complexes avec de multiples points de ramification où chaque composant monosaccharidique peut être l’un des nombreux types présents dans la nature1. Le processus non piloté par modèle impose l’analyse biochimique comme seule option pour générer des données structurelles sur les oligosaccharides. Le processus analytique des structures glycanes attachées à une protéine native est souvent difficile car il nécessite des technologies sensibles, quantitatives et robustes pour déterminer la composition des monosaccharides, les liaisons et les séquences de ramification2.

Dans ce contexte, la spectrométrie de masse (SEP) est la technique la plus largement utilisée dans les expériences de glycomique et de glycoprotéomique. Au fil du temps, ceux-ci sont effectués dans des paramètres de débit plus élevé et les données s’accumulent maintenant dans les bases de données. Les structures de glycanes dans divers formats3, remplissent GlyTouCan4, le référentiel universel de données sur les glycanes où chaque structure est associée à un identificateur stable, quel que soit le niveau de précision avec lequel le glycane est défini (par exemple, le type de liaison manquant ou la composition ambiguë). Des structures très similaires sont collectées, mais leurs différences mineures sont clairement rapportées. Les glycoprotéines sont décrites et organisées dans GlyConnect5 et GlyGen6, deux bases de données qui se croisent. Les données sur la SEP à l’appui des éléments de preuve structurels sont de plus en plus stockées dans GlycoPOST7. Pour une couverture plus large des ressources en ligne, le chapitre 52 du manuel de référence, Essentials of Glycobiology, est consacré à la glycoinformatique8. Fait intéressant, les logiciels d’identification des glycopeptides ont proliféré ces dernières années9,10 mais pas au profit de la reproductibilité. Cette dernière préoccupation a incité les dirigeants de l’Initiative HUPO GlycoProteomics (HGI) à relever un défi logiciel en 2019. Les données sur la SEP obtenues à partir du traitement de mélanges complexes de protéines sériques humaines N- et O-glycosylées dans les modes de fragmentation CID, ETD et EThcD, ont été mises à la disposition des concurrents, qu’il s’agisse d’utilisateurs de logiciels ou de développeurs. Le rapport complet sur les résultats de ce défi11 n’est présenté qu’ici. Pour commencer, une propagation des identifications a été observée. Il a été principalement interprété comme étant causé par la diversité des méthodes mises en œuvre dans les moteurs de recherche, de leurs paramètres et de la façon dont les sorties étaient filtrées et les peptides « comptés ». La conception expérimentale peut également avoir mis certains logiciels et approches à un (dés)avantage. Il est important de noter que les participants utilisant le même logiciel ont signalé des résultats incohérents, mettant ainsi en évidence de graves problèmes de reproductibilité. Il a été conclu en comparant différentes soumissions que certaines solutions logicielles fonctionnent mieux que d’autres et que certaines stratégies de recherche donnent de meilleurs résultats. Cette rétroaction est susceptible de guider l’amélioration des méthodes automatisées d’analyse des données sur les glycopeptides et aura à son tour un impact sur le contenu de la base de données.

L’expansion de la glycoinformatique a conduit à la création de portails Web qui fournissent de l’information et un accès à de multiples ressources similaires ou complémentaires. Les plus récents et les plus à jour sont décrits dans un chapitre de la série de livres Comprehensive Glycoscience12 et, grâce à la coopération, une solution au partage de données et à l’échange d’informations est proposée en mode libre accès. L’un de ces portails a été développé, qui s’appelait à l’origine Glycomics@ExPASy 13 et a été rebaptisé Glyco@Expasy, à la suite de la refonte majeure de la plate-forme Expasy14 qui héberge une grande collection d’outils et de bases de données utilisés dans plusieurs -omiques pendant des décennies, l’élément le plus populaire étant UniProt15 - la base de connaissances universelle sur les protéines. Glyco@Expasy offre une découverte didactique de la finalité et de l’utilisation des bases de données et des outils, basée sur une catégorisation visuelle et un affichage de leurs interdépendances. Le protocole suivant illustre les procédures d’exploration des données glycomiques et glycoprotéomiques avec une sélection de ressources de ce portail qui rend le lien entre la glycoprotéomique et l’interactomique glycane explicite via la glycomique. En l’état, les expériences en glycomique produisent des structures où les monosaccharides sont entièrement définis et les liens partiellement ou entièrement déterminés, mais leur fixation au site protéique est mal, voire pas du tout, caractérisée. En revanche, les expériences de glycoprotéomique génèrent des informations précises sur la fixation du site, mais avec une mauvaise résolution des structures glycanes, souvent limitées aux compositions monosaccharidiques. Ces informations sont rassemblées dans la base de données GlyConnect. En outre, les outils de recherche de GlyConnect peuvent être utilisés pour détecter les ligands glycanes potentiels qui sont décrits avec les protéines les reconnaissant dans UniLectin16, liés à GlyConnect via des glycanes. Le protocole présenté ici est divisé en deux sections pour couvrir les questions spécifiques aux glycanes et glycoprotéines liés à l’azote et à l’O.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

REMARQUE: Un appareil avec une connexion Internet (écran plus grand de préférence) et un navigateur Web à jour tel que Chrome ou Firefox est requis. L’utilisation de Safari ou d’Edge peut ne pas être aussi fiable.

1. D’une protéine N-glycome dans GlyConnect à une lectine d’UniLectin

  1. Accès aux ressources à partir de Glyco@Expasy
    REMARQUE: La procédure décrite ici consiste à accéder à GlyConnect, mais peut être appliquée à l’accès à toute ressource enregistrée dans la plate-forme.
    1. Allez dans https://glycoproteome.expasy.org/glycomics-expasy et considérez le graphique à bulles à droite montrant différentes catégories telles que les glycoconjugués ou la liaison aux glycanes. Dans le menu le plus à gauche qui reflète les catégories dans les bulles, cochez la case Glycoprotéines afin que le graphique à bulles de droite zoome immédiatement sur la bulle correspondant à cette catégorie.
      REMARQUE: Les bulles vertes sont des outils et les bulles jaunes sont des bases de données. Cliquez sur l’un ou l’autre pour zoomer à nouveau pour fournir des détails sur la ressource. Avant de le faire, l’utilisateur peut vouloir comprendre les dépendances de cette ressource avec d’autres.
    2. Pour obtenir les informations sur les dépendances, passez de l’onglet Classification thématique des ressources à l’onglet Roue de dépendance des ressources . Placez la souris sur GlyConnect dans la molette pour vérifier son niveau d’intégration avec d’autres sources (Figure 1).
    3. Revenez à l’onglet Classification thématique des ressources pour accéder à la bulle GlyConnect comme à l’étape 1.1.1 et cliquez dessus (Figure supplémentaire 1) pour afficher la page d’accueil de GlyConnect dans un nouvel onglet qui affiche les statistiques du contenu de la dernière version de la base de données.
      Remarque : Un jeu de couleurs détaillé dans le tableau 1 correspond aux différents types d’informations stockées dans la base de données. Ce code couleur est valide dans toutes les pages d’entité de GlyConnect et est cohérent tout au long. La page d’accueil affiche également quatre sections dédiées à des ensembles de données ciblés tels que ceux décrivant la glycosylation de la protéine de pointe Sars-Cov-2 (COVID-19) ou détaillant en détail les oligosaccharides du lait maternel (HMO). Celles-ci ne seront pas explorées dans ce protocole.
  2. Explorer l’information contextuelle d’une protéine N-glycome
    REMARQUE: Toutes les structures de glycanes dans GlyConnect sont affichées dans trois formats alternatifs et couramment utilisés: (1) Nomenclature des symboles pour les glycanes (SNFG)17 (2) IUPAC condensé18, et (3) Oxford19. En revanche, il n’existe pas de notation standard pour exprimer la composition du glycane. Dans GlyConnect, le code suivant est utilisé : Hex pour l’hexose, HexNAc pour la N-acétylhexosamine, dHex pour le fucose et NeuAc pour les acides sialiques. Par souci de simplicité, les outils de visualisation s’appuient sur une notation condensée : H pour hexose, N pour N-acétylhexosamine, F pour fucose et S pour acides sialiques. De plus, de petites lettres désignent des modifications telles que « a » pour l’acétylation, « p » pour la phosphorylation et « s » pour la sulfatation, pour le plus fréquent de ces soi-disant substituants.
    1. Pour visualiser et explorer le N-glycome de l’antigène spécifique de la prostate (PSA) humain, à partir de la page d’accueil de GlyConnect, procédez comme suit.
      NOTE: La glycosylation du PSA humain a été étudiée au fil des ans, en particulier dans le contexte du cancer de la prostate. La base de données GlyConnect stocke trois références20,21,22, qui combinent des données glycomiques et glycoprotéomiques. Notez que les résultats fournis ici ont été obtenus avec la version de septembre 2021 de GlyConnect. L’utilisation ultérieure de la base de données peut donner des statistiques légèrement différentes en raison des mises à jour fréquentes des données.
    2. Sélectionnez le bouton PROTÉINE pour ouvrir la vue protéine de la base de données. Dans la page d’affichage des protéines, tapez prostate dans la fenêtre de recherche. Recherchez les deux entrées répertoriées dans la sortie distinguant deux isoformes de PSA avec des valeurs de pI distinctes. Cliquez sur 790 (colonne Id) correspondant à l’isoforme commune de PSA.
      REMARQUE: Recherchez la barre multicolore supérieure qui affiche des informations récapitulatives extraites du travail publié dans le schéma détaillé ci-dessus. Plusieurs options de navigation sont possibles comme décrit ci-dessous.
    3. Dans la barre multicolore supérieure, cliquez sur le bouton SOURCE en vert pour afficher les types d’échantillons à partir desquels les données publiées ont été traitées : Urine et liquide séminal. Pour approfondir ces informations, cliquez sur l’un de ces types d’exemples. Il en va de même pour tout élément qui apparaît en cliquant sur un bouton coloré.
    4. Pour vérifier le contenu de la base de données relatif à la santé, cliquez sur le bouton MALADIE , qui contient deux éléments, dont l’un est Cancer de la prostate qui renvoie à la page dédiée à la maladie correspondante dans GlyConnect. Le résumé de cette page montre que trois études à grande échelle ont rapporté 319 compositions sur 1 087 sites trouvés dans 308 protéines humaines.
    5. Cliquez sur le bouton STRUCTURE pour afficher la liste complète des 135 structures associées au PSA à partir des données glycomiques. Cliquez sur le bouton COMPOSITION pour les 78 compositions associées déterminées par des expériences de glycoprotéomique. Cliquez sur n’importe quelle structure ou composition pour obtenir plus de détails.
      REMARQUE: Des détails tels que la liste des protéines alternatives portant la structure particulière ou la liste des structures correspondant à la composition peuvent être obtenus. Le PSA est connu pour n’avoir qu’un seul site de N-glycosylation à Asn-69 (un seul élément compté pour le bouton site brun).
    6. Pour réduire l’ambiguïté des compositions, cliquez sur SUGGESTED STRUCT sous une composition sélectionnée (par exemple, Hex:6 HexNAc:3 NeuAc:1). Une suggestion est faite chaque fois que le nombre de monosaccharides coïncide avec celui d’une structure énumérée ci-dessus (figure 2).
      REMARQUE: La composition Hex:6 HexNAc:3 NeuAc:1 générée par une expérience de glycoprotéomique est appariée à quatre structures de résolution plus élevée à partir des données glycomiques. Dans le cas du PSA, il n’y a pas d’ambiguïté de site à résoudre puisque seul l’Asn-69 est glycosylé.
    7. Pour explorer complètement la page des protéines, affichez plus de détails sur le côté droit de la page (Figure 3).
      1. Affichez l’entrée PDB (Protein Data Bank23) 3QUM par défaut pour le PSA qui est montrée avec deux glycanes complexes attachés à chaque monomère (Figure 3) ou l’entrée alternative 2ZCK, qui est également disponible en raison d’un glucide attaché. La deuxième entrée montre une seule chaîne.
        REMARQUE: Les deux entrées sont visualisées avec le plugin 3D LiteMol24 qui affiche les glycanes en notation SNFG-3D adoptée dans le PDB-RCSB.
      2. Cliquez sur les liens correspondants d’autres références croisées pour explorer les informations fonctionnelles pertinentes provenant des principales bases de données protéomiques, telles que UniProt (Figure 3).
  3. Visualiser et corréler l’information contextuelle d’une protéine N-glycome
    REMARQUE: Comme on l’a vu dans la section précédente, de longues listes de structures ou de compositions peuvent être difficiles à appréhender dans leur ensemble et GlyConnect s’appuie sur deux outils différents pour visualiser les informations clés, à savoir GlyConnect Octopus et GlyConnect Compozitor (le premier développe les informations récapitulatives capturées dans des boutons colorés et le second fait ressortir les dépendances structurelles en termes de structure / composition contenue dans une autre). Comme illustré ci-dessous, GlyConnect Octopus explore les associations entre les différentes entités stockées dans la base de données en mettant en évidence des connexions multiples ou uniques comme un reflet du contenu de la base de données.
    1. Effectuez une recherche GlyConnect Octopus pour confirmer la présence de traits structurels communs tels que des structures de noyau hybrides et des structures contenant de l’acide sialique très fréquentes dans la diversité des glycanes attachés au PSA, comme décrit ci-dessous.
    2. Accédez à la page d’accueil d’Octopus https://glyconnect.expasy.org/octopus/. Conservez l’onglet N-lié sélectionné par défaut. Accédez au sous-onglet Cœurs et cliquez sur l’icône Hybride . Accédez au sous-onglet Propriétés et cliquez sur l’icône Sialylated . Cliquez sur le bouton vert Rechercher ci-dessous.
      Remarque : Les résultats de la recherche sont affichés graphiquement sous forme de relations entre trois catégories d’éléments. Par défaut, la liste centrale correspond à la requête pour les compositions, la collection de gauche couvre les protéines associées et la droite couvre les glycanes associés.
    3. Dans le graphique des relations affiché, survolez H6N4F1S1 pour mettre en évidence les liens vers six protéines et trois structures. Comparez cela en survolant H6N4F2S1 qui distingue les deux isoformes de PSA (toutes deux appelées UniProt ID: KLK3_HUMAN) et une structure (ID: 10996). Passez le curseur de la souris sur l’ID de la structure pour afficher sa représentation SNFG et cliquez dessus pour ouvrir la page correspondante (Figure supplémentaire 2).
    4. Remplacez les nœuds de la pieuvre par n’importe quel autre sujet décrivant le contexte de la glycosylation. Le code couleur reste le même que celui décrit précédemment (voir tableau 1).
      1. Remplacez les nœuds centraux par Tissus pour afficher 15 options au milieu du graphique, dont beaucoup sont des fluides corporels. Recherchez toutes les associations entre les protéines et les glycanes correspondant à la requête en fonction des informations tissulaires. Placez le curseur sur Urine ou Liquide séminal au milieu du graphique pour afficher différentes associations (Figure 4A,B).
      2. Remplacez les nœuds centraux par Maladie pour afficher 13 options, dont l’une est Cancer de la prostate. La seule protéine associée est le PSA (KLK3_HUMAN) (Figure supplémentaire 3).
        REMARQUE: Un examen plus approfondi du N-glycome PSA montré dans la page des protéines distingue la très haute fréquence d’un NeuAc(a?-?) terminal. Gal(b?-?) Sous-structure GlcNAc dans de nombreux cas sur des structures à deux ou trois antennes. Une autre pieuvre peut être générée sur cette base comme décrit ci-dessous.
    5. Cliquez sur le bouton Effacer pour actualiser la recherche. Accédez au sous-onglet Propriétés et cliquez sur l’icône Bi-antennes . Accédez au sous-onglet Déterminants et cliquez sur l’icône 3-Sialyl-LN (type 2 ). Cliquez sur le bouton vert Rechercher ci-dessous.
    6. Vérifiez les associations récupérées par Octopus avec des glycanes bi-antennes contenant un motif terminal 3-Sialyl-LN (type 2), c’est-à-dire NeuAc(a1-3)Gal(b1-4)GlcNAc. Remplacez les nœuds centraux par Tissus pour faciliter la lecture et survolez KLK3_HUMAN pour connecter directement le liquide séminal à l’isoforme commune PSA et à sept structures (figure supplémentaire 4).
      REMARQUE: Le deuxième outil de visualisation, GlyConnect Compozitor, effectue l’analyse des relations potentielles entre chaque composition dans une liste de celles-ci (voir ci-dessous). Une relation est définie comme différente d’un seul monosaccharide entre deux compositions. Ces relations identifiées tracées dans un graphique exposent la (dis)continuité d’un glycome.
    7. Utilisez GlyConnect Compozitor pour effectuer l’analyse des relations potentielles entre chaque composition d’une liste de celles-ci, comme illustré ci-dessous pour le cas de PSA.
      REMARQUE : GlyConnect Compozitor traite les compositions en association avec un contexte. Il offre des onglets distincts pour interroger GlyConnect, par exemple, protéines, sources, lignées cellulaires, maladies qui sont explicites pour qualifier un contexte. Ceci est illustré ici avec PSA comme suit.
    8. Revenez à la page des protéines de PSA: https://glyconnect.expasy.org/browser/proteins/790. Sur le côté droit de la page d’entrée PSA, cliquez sur le lien Compozitor. Assurez-vous que les champs de recherche Compozitor sont pré-remplis avec les détails de l’entrée Id 790 dans l’onglet Protéine (Protéine : Antigène prostatique spécifique, Espèce : Homo sapiens et Type de glycane : lié à l’azote).
    9. Cliquez sur le bouton Ajouter à la sélection pour récupérer les données de la base de données et afficher le graphique des compositions connectées. Désélectionnez l’option Inclure les nœuds virtuels . Cliquez sur le bouton Calculer le graphique pour afficher un graphique montrant un ensemble bien connecté de 78 compositions représentant le N-glycome PSA, et un graphique à barres montrant les principales caractéristiques des glycanes.
    10. Survolez la barre violette dans le diagramme à barres, qui localise toutes les structures sialylées dans le graphique pour révéler un biais observable vers les structures sialylées.
    11. Restez dans l’onglet principal Protéines et sélectionnez Antigène prostatique spécifique - isoforme Pi élevée (psah) dans le champ Protéine (nom).
      REMARQUE: Les champs Type de glycane et Site de glycane sont automatiquement remplis.
    12. Cliquez sur le bouton Ajouter à la sélection pour récupérer des données de la base de données qui s’élèvent à 57 compositions. Cliquez sur le bouton Calculer le graphique pour générer les graphiques superposés des deux isoformes et évaluer les différences de glycomes des deux isoformes PSA. Passez le curseur de la souris sur les étiquettes de nœud pour demander l’affichage du nombre de structures correspondant aux compositions/étiquettes (Figure 5).
  4. Informations de liaison aux glycanes dans UniLectin
    REMARQUE: Rappelez-vous le déterminant testé dans la pieuvre, décrit comme NeuAc(a2-3)Gal(b1-4). Par définition, il s’agit d’une partie de liaison établie d’une structure de glycane et, en tant que telle, peut être recherchée dans la base de données UniLectin3D25.
    1. Allez dans https://www.unilectin.eu/ et cliquez sur le bouton UniLectin3D . Alternativement, allez directement à la page: https://www.unilectin.eu/unilectin3D/.Click sur le bouton Recherche de glycane pour ouvrir cette page: https://www.unilectin.eu/unilectin3D/glycan_search (Figure supplémentaire 6).
    2. Cliquez sur le diamant violet représentant un acide sialique, ce qui invite à afficher tous les motifs de liaison au glycane se terminant par un acide sialique stocké dans la base de données. La partie supérieure de cette collection de motifs contient le motif NeuAc(a2-3)Gal(b1-4)GlcNAc étudié précédemment (figure supplémentaire 7).
    3. Cliquez sur le motif NeuAc(a2-3)Gal(b1-4)GlcNAc pour demander l’affichage de toutes les lectines pour lesquelles une structure 3D confirmant l’interaction avec NeuAc(a2-3)Gal(b1-4)GlcNAc est connue. Le résultat par défaut montre les lectines dans toutes les espèces. Utilisez l’option Rechercher par champ pour limiter la vue aux informations centrées sur l’humain.
    4. Cliquez sur l’option Rechercher par champ . Dans le domaine des espèces , tapez Homo sapiens. Cliquez sur le bouton Explorer les structures à rayons X pour filtrer la liste d’origine. Il ne reste qu’une seule entrée, c’est-à-dire la galectine-8 humaine. Cliquez sur le bouton Afficher la structure et les informations 3D dans le coin supérieur droit de l’élément répertorié pour afficher des informations détaillées sur la galectine-8 humaine interagissant avec NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Accédez aux informations structurelles sur la galectine-8 humaine affichées sur la page avec deux visionneuses différentes.
      1. Tenez la souris pour retourner la molécule et mettre le ligand au premier plan avec le logiciel Litemol26 intégré pour montrer la structure 3D de la lectine. Passez la souris sur l’une des interactions répertoriées à gauche pour mettre à jour la vue de droite et localiser où cette interaction particulière agit dans la structure avec le logiciel PLIP27 intégré pour détailler les interactions atomiques entre la lectine et le ligand (Figure 6).
    6. Cliquez sur n’importe quel bouton vert qui renvoie aux entrées correspondantes dans UniProt, PDB (sites européens ou américains) et GlyConnect pour explorer ces références croisées.

2. Exploration et comparaison des O-glycomes dans GlyConnect

  1. Parcourir l’ensemble de données HGI Challenge High Confidence
    REMARQUE : Le jeu de données HGI mentionné dans l’introduction est stocké dans la base de données GlyConnect. Il contient 163 N- et 23 O-glycopeptides présents dans 37 glycoprotéines considérées comme une liste de confiance élevée. GlyConnect Compozitor28 est essentiel pour évaluer la cohérence des données sur les glycomes. Il est important de noter que Compozitor autorise les nœuds virtuels (en gris) lorsqu’une seule étape intermédiaire est nécessaire pour connecter les nœuds isolés. De cette façon, les nœuds virtuels resserrent le graphique et peuvent être interprétés comme des structures potentiellement manquées dans les résultats expérimentaux.
    1. Parcourez le jeu de données HGI depuis la page d’accueil de GlyConnect en accédant directement à la page de référence de l’article : https://glyconnect.expasy.org/browser/references/2943.
      REMARQUE: Le résumé dans les boutons colorés reflète partiellement les chiffres fournis dans l’article. Pourtant, si seulement 69 peptides uniques sont répertoriés, cela reflète de multiples associations entre les peptides et les sites ou structures. Dans l’article, un glycopeptide est défini comme une combinaison unique d’un peptide et d’une composition. Dans GlyConnect, les glycosites sont d’abord considérées, et elles sont décrites comme une combinaison d’un peptide avec des structures. Cela explique l’écart de chiffres entre GlyConnect et la citation ci-dessus.
    2. Vérifiez la fréquence élevée d’apparition de compositions liées à l’azote, telles que Hex:5 HexNAc:4 NeuAc:2, identifiées sur 42 sites dans 43 peptides, par opposition à l’unicité fréquente de la plupart des compositions liées à l’O identifiées sur 1 site dans 1 peptide.
    3. Cliquez sur le lien Compozitor sur le côté droit de la page d’entrée de référence pour évaluer la cohérence de l’ensemble de données. Assurez-vous que l’outil Compozitor traite directement le DOI de la référence et remplit le champ de recherche avec reference=10.1101/2021.03.14.435332 dans l’onglet Avancé de l’outil. Tapez &glycan_type=O-linked après le numéro DOI pour affiner la recherche sur les glycanes liés o, de sorte que la requête devienne : référence=10.1101/2021.03.14.435332&glycan_
      type=O-lié
    4. Cliquez sur le bouton Ajouter à la sélection pour récupérer les données de la base de données (il y a 20 compositions liées à O). Gardez l’option Inclure les nœuds virtuels sélectionnée. Cliquez sur le bouton Calculer le graphique pour afficher le graphique des compositions connectées. Ce résultat met en évidence plusieurs lacunes dans la continuité attendue de la biosynthèse des glycanes avec neuf nœuds virtuels requis pour compléter le graphique (Figure 7).
  2. Comparaison avec l’O-glycome d’une protéine sérique sélectionnée dans GlyConnect
    REMARQUE: Pour évaluer si les lacunes peuvent être comblées par les données stockées dans GlyConnect, une protéine O-glycosylée sur les 37 répertoriées avec la référence a été sélectionnée. Dans l’ensemble de données, la chaîne lourde H4 (Q14624), inhibiteur de l’inter-alpha-trypsine, serait un O-glycosylé sur Thr-725.
    1. Accédez à l’onglet Protéines de GlyConnect Compozitor (voir étape 2.1.3). Dans la liste Des protéines , sélectionnez L’inhibiteur de l’inter-alpha-trypsine chaîne lourde H4. Assurez-vous que la sélection des espèces est Homo sapiens par défaut. Désélectionnez N-linked dans le Type de glycane. Sélectionnez uniquement Thr-725 dans la liste Site en cliquant d’abord sur le signe moins à gauche de Site pour désélectionner tous les sites, puis en sélectionnant uniquement Thr-725 dans la liste.
    2. Cliquez sur le bouton Ajouter à la sélection (notez que six compositions sont associées à Thr-725). Cliquez sur le bouton Calculer le graphique pour afficher le graphique des compositions connectées (Figure supplémentaire 8).
    3. Observez le graphique affiché, qui montre les 17 compositions uniques sur les 20 compositions liées à l’O de l’ensemble de données d’articles en bleu et les trois compositions uniques sur six dans la base de données en rouge. En d’autres termes, le chevauchement entre les deux sources est présent dans trois compositions qui sont représentées en magenta. Notez qu’une rotation de 45° du graphique est générée automatiquement.
      REMARQUE : Le nombre de nœuds virtuels est réduit d’un. Il s’avère que H2N2S1 manquant dans les 20 compositions liées à l’O de l’ensemble de données de l’article et représenté comme un nœud virtuel est maintenant rempli d’une composition supplémentaire associée à Thr-725 de la chaîne lourde H4 de l’inhibiteur de l’inter-alpha-trypsine dans la base de données. Cela simplifie la topologie du graphique car deux autres nœuds virtuels sont rendus inutiles car il s’agissait d’options alternatives pour combler l’écart entre H1N2S1 et H2N2S2. Pourtant, une deuxième composition importée de la base de données serait isolée sans la création de deux nouveaux nœuds virtuels alternatifs H2N2F1S1 et H1N2F2S1.
    4. Pour donner un sens aux nœuds virtuels, vérifiez si les compositions correspondantes sont présentes dans GlyConnect. Pour ce faire, cliquez sur le bouton Exporter sous le graphique. Sélectionnez Virtuel uniquement en désélectionnant toutes les autres options. Cliquez sur l’icône du presse-papiers pour copier la sélection de 8 compositions.
    5. Collez la sélection dans la fenêtre de requête de l’onglet Personnalisé de Compozitor. Sélectionnez O-linked dans le champ Type de glycane . Définissez l’étiquette de sélection dans le champ Compositions sur, par exemple, VN pour nommer la liste des 8 compositions. Cliquez sur le bouton Ajouter à la sélection , puis sur le bouton Calculer le graphique . Tous les nœuds virtuels sont désormais affichés sous forme de nœuds verts (Figure 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La première partie du protocole (section 1) a montré comment étudier la spécificité ou la similitude des N-glycanes attachés à l’Asn-69 de l’antigène spécifique de la prostate (PSA) humain à l’aide de la plate-forme GlyConnect. Les variations tissulaires (urine et liquide séminal), ainsi que les variations isoformes (pI normale et élevée) dans l’expression du glycane, ont été soulignées à l’aide de deux outils de visualisation (figure 4 et figure 5).

Tout d’abord, GlyConnect Octopus, qui affiche les associations entre les entités stockées dans la base de données, a fourni la possibilité d’explorer des informations contextuelles via (1) la sélection de différentes entités à afficher dans l’Octopus et (2) le clic sur des liens pour examiner les entrées connexes. Le résultat était des associations distinctives en fonction du tissu.

Deuxièmement, GlyConnect Compozitor, conçu à l’origine pour définir/affiner un fichier de composition pour l’identification des glycopeptides, a été utilisé pour évaluer l’expression du glycane dans deux isoformes connues du PSA (pI normal et pI élevé). La comparaison de chaque glycome isoforme a produit un graphique bien connecté distinguant quatre nœuds (compositions), dont deux sont caractéristiques de l’isoforme à pI élevé. Même si le chevauchement des glycomes est significatif, le graphique à barres des propriétés des glycanes a montré une baisse de la sialylation de l’isoforme commune à l’isoforme pI élevée (figure supplémentaire 5).

De plus, l’exploration d’UniLectin3D distingue la galectine-8 comme lecteur possible du glycome PSA puisque ce dernier contient de nombreuses structures avec un épitope terminal NeuAc(a2-3)Gal(b1-4)GlcNAc. Cela fournit une piste à suivre et ne peut pas être considéré comme une preuve finale. Néanmoins, le PSA et les galectines sont connus pour jouer un rôle essentiel dans le cancer de la prostate29 et le rôle spécifique de la galectine-8 a récemment été mis en évidence30. La première partie du protocole met en corrélation les données structurelles (glycoprotéomiques) et fonctionnelles (liaison) afin d’établir un scénario probable pour les interactions protéine-protéine médiées par les glycanes.

Dans la deuxième partie du protocole (section 2), un ensemble de compositions d’O-glycane de haute qualité associées à un tissu particulier (sérum humain) a été examiné et comparé au contenu de la base de données GlyConnect, offrant ainsi la possibilité de personnaliser un fichier de composition de glycane pour l’identification raffinée des glycopeptides (Figure 7 et Figure 8 ). Il pourrait s’appuyer sur l’ensemble minimal de 20 compositions disponibles à partir d’un ensemble de données (résultats du défi HGI) ou être amélioré avec 23 à 26 éléments collectés rationnellement dans GlyConnect pour renforcer la cohérence de l’ensemble.

rouge orange clair vert bleu clair pourpre rose bleu foncé Marron orange foncé
espèce protéine source de tissu structure composition maladie référence glycosite peptide

Tableau 1 : Jeu de couleurs associé à chaque entité de la base de données GlyConnect et valide partout.

Figure 1
Figure 1 : roue de dépendance de Glyco@Expasy instanciée pour GlyConnect. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 2
Figure 2 : Structure de glycane suggérée pour une composition de glycane sélectionnée. Structure de glycane suggérée à partir d’une expérience de glycomique pour une composition de glycane d’une expérience glycoprotéomique ciblant la même glycoprotéine, ici l’antigène spécifique de la prostate (PSA) humain, comme proposé dans la page GlyConnect pour le PSA (ID: 790). Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 3
Figure 3 : menu latéral droit de la page GlyConnect pour PSA. Références croisées cliquables à d’autres bases de données majeures et affichage avec le plugin LiteMol glycane de la structure 3D existante dans le PDB. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 4
Figure 4 : Sortie de GlyConnect Octopus montrant des associations tissulaires dépendantes entre les protéines et les glycanes. La requête Hybrid AND Sialylated a renvoyé toutes les compositions correspondant à ces critères et chaque composition relie les informations associées sur les protéines et les glycanes telles qu’enregistrées dans la base de données. Notez que par défaut Species est défini sur Homo sapiens mais cette option est modifiable. Ici, GlyConnect Octopus affiche toutes les protéines humaines (nœuds gauches) portant des structures glycanes hybrides et sialylées (nœuds droits) avec les tissus dans lesquels elles sont exprimées (nœuds centraux). (A) Les associations avec l’urine sont mises en évidence montrant deux protéines: la choriogonadotrophine (GLHA_HUMAN) et l’isoforme commune PSA (KLK3_HUMAN) connectée à des structures glycanes dispersées (hétérogènes). (B) Les associations avec le liquide séminal sont mises en évidence montrant deux isoformes protéiques de PSA (KLK3_HUMAN) liées à des structures de glycanes groupées (similaires). Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 5
Figure 5 : Sortie de GlyConnect Compozitor montrant les N-glycomes superposés des deux isoformes de PSA. Les compositions en notation condensée étiquettent chaque nœud. Les glycanes associés à l’isoforme commune sont représentés sous forme de nœuds bleus et ceux de l’isoforme à pI élevé sous forme de nœuds rouges. Le chevauchement entre les glycomes est représenté par des nœuds magenta. Les nombres à l’intérieur des nœuds représentent le nombre de structures de glycanes correspondant à la composition étiquetée en fonction du contenu de la base de données GlyConnect concernant le PSA. Le graphique Compozitor montré a été légèrement modifié à partir de la sortie brute pour démêler le réseau généré par la bibliothèque D3.js. Ceci est facile à faire car n’importe quel nœud peut être glissé dans l’espace de la fenêtre du navigateur où un utilisateur le souhaite, et les chemins peuvent ainsi être raccourcis ou étirés. L’utilisateur peut taper une composition spécifique dans le champ Zoom sur dans le coin supérieur droit pour zoomer et centrer le graphique sur le nœud correspondant. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 6
Figure 6 : Entrée sommaire de la galectine-8 humaine avec les détails de liaison NeuAc(a2-3)Gal(b1-4)GlcNAc. Cliquez sur le bouton vert Afficher la structure et les informations 3D (indiqué par une ellipse rouge) ouvre une nouvelle page dans laquelle un gros plan sur les interactions de résidus est affiché avec l’application PLIP (indiqué par une flèche rouge). Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 7
Figure 7 : La sortie de GlyConnect Compozitor montrant l’O-glycome de l’ensemble de données de confiance élevée du sérum humain du défi HGI. Sans nœuds virtuels (voir texte), la connectivité de ce graphique est faible. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 8
Figure 8 : La sortie de GlyConnect Compozitor montrant la possibilité de compléter l’O-glycome de l’ensemble de données à haute confiance du sérum humain du défi HGI, en utilisant le contenu de la base de données GlyConnect. L’accès au contenu de l’ensemble de la base de données GlyConnect à l’aide de l’onglet Personnalisé de Compozitor révèle que les compositions correspondant aux nœuds virtuels sont mappées avec les structures définies existantes, comme indiqué dans les étiquettes de nœud. La taille du nœud représente le nombre de références stockées dans la base de données et indique la composition correspondante. L’étiquette numérique des nœuds indique le nombre de structures correspondantes stockées dans GlyConnect. Les compositions sélectionnées semblent avoir de zéro à dix-huit correspondances possibles dans la base de données. En fait, ces nœuds ne sont virtuels que comme un reflet du contenu des ensembles de données expérimentales. Il est recommandé d’affiner les informations du graphique pour tester le réalisme de ces nœuds supplémentaires. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure supplémentaire 1 : Graphique à bulles de la page d’accueil de la Glyco@Expasy. Zoomer dans le graphique à bulles de la page d’accueil de Glyco@Expasy pour se concentrer sur la catégorie des glycoprotéines . Logiciels affichés dans des bulles vertes et bases de données dans des bulles jaunes. Cliquer sur n’importe quelle bulle résume l’objectif de la ressource. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 2 : Associations récupérées par Octopus correspondant à la requête en fonction de la composition. Affichage GlyConnect Octopus par défaut des protéines humaines (nœuds gauches) portant des structures glycanes hybrides et sialylées (nœuds droits) avec des compositions correspondantes (nœuds centraux). La composition H6N4F12S1 semble unique aux deux isoformes de PSA (KLK3_HUMAN). En cliquant sur l’ID de structure unique (10996), la page correspondante s’ouvre avec des détails montrant que les deux isoformes sont en effet les seules protéines porteuses de ce glycane particulier. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 3 : Associations récupérées par Octopus correspondant à la requête en fonction de la maladie. GlyConnect Octopus affiche toutes les protéines humaines (nœuds gauches) portant des structures glycanes hybrides et sialylées (nœuds droits) avec les maladies dans lesquelles elles sont exprimées (nœuds centraux). Les associations avec le cancer de la prostate sont mises en évidence montrant l’isoforme commune du PSA (KLK3_HUMAN). Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 4 : Associations récupérées par Octopus correspondant à la requête en fonction des informations tissulaires. GlyConnect Octopus affiche toutes les protéines humaines (nœuds gauches) portant des structures glycanes bi-antennes, y compris le motif NeuAc(a1-3)Gal(b1-4)GlcNAc (nœuds droits) avec les tissus dans lesquels ils sont exprimés (nœuds centraux). Les associations avec le liquide séminal sont mises en évidence montrant seulement l’isoforme commune du PSA (KLK3_HUMAN) et sept structures. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 5 : Sortie de GlyConnect Compozitor montrant les N-glycomes superposés des deux isoformes de PSA. Les compositions en notation condensée étiquettent chaque nœud. Les glycanes associés à l’isoforme commune sont représentés sous forme de nœuds bleus et ceux de l’isoforme à pI élevé sous forme de nœuds rouges. Le chevauchement entre les glycomes est représenté par des nœuds magenta. Les nombres à l’intérieur des nœuds représentent le nombre de structures de glycanes correspondant à la composition étiquetée en fonction du contenu de la base de données GlyConnect concernant le PSA. La souris sur le graphique à barres des propriétés du glycane montre la correspondance entre la fréquence et les nœuds sous forme de bulles orange. Presque tous les nœuds isoformes communs PSA sont couverts. Cette fréquence baisse dans l’isoforme à pI élevé. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 6 : Interface de recherche de glycanes dans UniLectin3D. Cliquez sur le symbole SNFG de l’acide sialique (encerclé en rouge) pour lancer la recherche de tous les ligands contenant NeuAc, stockés dans UniLectin3D. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 7 : Extrait de la sortie de la recherche de tous les ligands contenant NeuAc. Le motif d’intérêt NeuAc(a2-3)Gal(b1-4)GlcNAc est encerclé en rouge. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 8 : Sortie de GlyConnect Compozitor montrant l’O-glycome de l’ensemble de données HGI superposé à celui de GlyConnect. La sortie de GlyConnect Compozitor montrant l’O-glycome du sérum humain à haut niveau de confiance ensemble de données du défi HGI en bleu superposé à l’O-glycome d’une protéine O-glycosylée sur les 37 répertoriées avec la référence, c’est-à-dire la chaîne lourde inhibitrice inter-alpha-trypsine H4 avec des informations supplémentaires contenues dans GlyConnect. Cela améliore la connectivité du graphique. Veuillez cliquer ici pour télécharger ce fichier.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus comme outil pour révéler des corrélations inattendues
GlyConnect Octopus a été conçu à l’origine pour interroger la base de données avec une définition lâche des glycanes. En effet, la littérature rapporte souvent les principales caractéristiques des glycanes dans un glycome comme être fucosylé ou sialylé, être constitué de deux antennes ou plus, etc. En outre, les glycanes, qu’ils soient liés à N ou à O, sont classés en noyaux, comme détaillé dans le manuel de référence Essentials of Glycobiology1, qui sont également souvent cités dans des articles publiés. Enfin, les épitopes de glycane tels que les antigènes de groupe sanguin sont encore une autre propriété recherchée dans les structures et potentiellement distinguée pour taper un glycane. En fin de compte, il peut être pertinent de rechercher des caractéristiques communes ou distinctes d’un glycome exprimées dans un tissu spécifique ou une espèce sélectionnée. En ce sens, les renseignements recueillis devraient être utilisés comme source de nouvelles hypothèses plutôt que comme des faits uniques.

GlyConnect Compozitor comme outil pour façonner un ensemble de composition de glycane
La navigation dans les informations structurelles décrites dans une page de protéines présente des limites, car les listes ont tendance à masquer les relations entre les structures détaillées ainsi que celles entre les compositions. GlyConnect Octopus s’occupe du premier et GlyConnect Compozitor du second. Un examen attentif des structures répertoriées dans la plupart des entrées GlyConnect révèle l’existence de sous-structures communes. Pourtant, cette information n’est pas facile à saisir visuellement sans l’aide d’un spectateur dédié.

Le contenu du fichier de composition de glycane soutenant l’identification de la fraction glycane en tant que paramètre clé du logiciel d’identification des glycopeptides a été établi en analysant les résultats du défi HGI. La plupart des moteurs de recherche protéomique classiques prennent en charge la sélection de modifications à base de glycos à partir d’une collection qui dérive de données collectées dans des bases de données / référentiels ou de la littérature. D’autres outils dédiés à la glycoprotéomique utilisent les connaissances de la biosynthèse des glycanes. De cette façon, le fichier de composition est théoriquement défini comme le résultat de l’activité enzymatique attendue. En fin de compte, il y a autant de fichiers de composition qu’il y a de moteurs de recherche et le chevauchement entre eux est très variable. Néanmoins, apprendre de l’expérience passée en protéomique, en particulier lorsque les modifications post-traductionnelles sont prises en compte, révèle que les performances des moteurs de recherche sont corrélées à la limitation de l’espace de recherche31. Des observations similaires sont faites en glycoprotéomique et GlyConnect Compozitor a été conçu pour soutenir la sélection de données de composition éclairées, dont l’importance a été discutée précédemment32.

L’utilisation de cet outil a été incomplètement illustrée dans le protocole en particulier en ce qui concerne l’onglet Avancé dans lequel les requêtes qui lancent directement l’accès programmatique à GlyConnect via son API (Application Programming Interface) peuvent être exprimées. Par exemple, taper taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer dans la fenêtre de requête de l’onglet Avancé équivaut à remplir les champs correspondants dans l’onglet Source (sélection de Homo sapiens dans Species, Urine in Tissue et N-linked dans Glycan Type) et l’onglet Disease (sélection de Homo sapiens dans Species, Cancer de la prostate dans la maladie et lié à l’azote dans le type de glycane). En d’autres termes, il fournit en une seule étape un résultat qui nécessiterait plusieurs sélections.

Enfin, bien que la création de nœuds virtuels soit expliquée dans le protocole, leur redondance potentielle nécessite un commentaire supplémentaire. Deux options simultanées peuvent être impossibles à distinguer car l’action simulée des enzymes dans le graphique ne tient pas compte de la chronologie des activités enzymatiques. C’est pourquoi Compozitor suggère deux chemins à travers deux nœuds virtuels pour relier deux nœuds non connectés correspondant à des nombres de monosaccharides avec jusqu’à deux différences. L’inclusion de nouvelles données fournit souvent des chaînons manquants. L’utilisateur est toujours libre d’envisager ou de rejeter des nœuds virtuels, en (décochant la case Inclure les nœuds virtuels .

Bases de données connues et limitations logicielles
Dans l’ensemble, comme pour toute navigation sur le Web, les protocoles décrits ci-dessus conduisent parfois à une page inexistante, souvent en raison d’une mise à jour d’un site ou d’un conflit de mises à jour entre deux sites. Dans ce cas et, en fait, dans tous les cas où la navigation n’est pas fluide, le plus simple est d’envoyer une note au service d’assistance Expasy dont l’efficacité a contribué de manière significative au succès du portail au cours des 28 dernières années.

Le contenu de GlyConnect est biaisé comme un reflet des déséquilibres actuels dans la littérature. La majorité des publications rapportent la N-glycosylation chez les mammifères et la base de données est plus riche en N-glycoprotéines humaines. Néanmoins, on nous a demandé dans le passé d’inclure des ensembles de données moins courants et de rester complètement ouverts à recevoir des conseils et des suggestions.

En outre, Compozitor se limite actuellement à la comparaison de trois ensembles de données de composition. Une révision majeure du sous-onglet Déterminant de la pieuvre est prévue. Les ressources de Glyco@Expasy ont besoin de mises à jour régulières et certaines peuvent ne pas être effectuées en temps voulu; néanmoins, des avertissements et/ou des annonces sont publiés lorsque cela se produit.

Les portails partenaires, connus sous le nom de GlyGen (https://www.glygen.org) et GlyCosmos (https://www.glycosmos.org), offrent différentes options et outils. En fin de compte, la navigation et la recherche d’informations sur l’une ou l’autre des options impliquent un niveau élevé de subjectivité et dépendent en grande partie des habitudes et des préoccupations des utilisateurs. Nous ne pouvons qu’espérer que notre solution convienne à une partie de la communauté.

L’apport de la glycoscience augmente dans les projets de sciences de la vie et des études établissant le rôle des glycanes dans les problèmes de santé sont continuellement produites. L’accent mis récemment sur le Sars-Cov-2 a révélé une fois de plus l’importance des protéines glycosylées, en particulier dans les approches structurelles33. La glycoinformatique soutient les glycoscientifiques dans les tâches quotidiennes d’analyse et d’interprétation des données.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs ne déclarent aucun conflit d’intérêts.

Acknowledgments

L’auteur reconnaît chaleureusement les membres passés et présents du Proteome Informatics Group impliqués dans le développement des ressources utilisées dans ce tutoriel, en particulier Julien Mariethoz et Catherine Hayes pour GlyConnect, François Bonnardel pour UniLectin, Davide Alocci et Frederic Nikitin pour octopus, et Thibault Robin pour Compozitor et final touch on Octopus.

Le développement du projet glyco@Expasy est soutenu par la Confédération suisse par l’intermédiaire du Secrétariat d’Etat à la formation, à la recherche et à l’innovation (SEFRI) et est actuellement complété par le Fonds national suisse (FNS: 31003A_179249). ExPASy est géré par l’Institut suisse de bioinformatique et hébergé au Vital-IT Competency Center. L’auteur remercie également Anne Imberty pour sa coopération exceptionnelle sur la plateforme UniLectin soutenue conjointement par ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologie numéro 179
Ressources bioinformatiques pour l’étude des interactions protéiques médiées par le glycane
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter