Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Bioinformatica Bronnen voor de Studie van Glycan-Gemedieerde Eiwit Interacties

Published: January 20, 2022 doi: 10.3791/63356

Summary

Dit protocol illustreert hoe menselijke eiwitglyomen kunnen worden verkend, vergeleken en geïnterpreteerd met online bronnen.

Abstract

Het Glyco@Expasy initiatief werd gelanceerd als een verzameling van onderling afhankelijke databases en hulpmiddelen die verschillende aspecten van kennis in glycobiologie omvatten. In het bijzonder is het gericht op het benadrukken van interacties tussen glycoproteïnen (zoals celoppervlakreceptoren) en koolhydraatbindende eiwitten gemedieerd door glycanen. Hier worden belangrijke bronnen van de collectie geïntroduceerd door middel van twee illustratieve voorbeelden gericht op het N-glycoom van het menselijke prostaatspecifiek antigeen (PSA) en het O-glycoom van menselijke serumeiwitten. Door middel van verschillende databasequery's en met behulp van visualisatietools laat dit artikel zien hoe u inhoud in een continuüm kunt verkennen en vergelijken om anders verspreide stukjes informatie te verzamelen en te correleren. Verzamelde gegevens zijn bestemd om meer uitgebreide scenario's van de glycaanfunctie te voeden. Glycoinformatica die hier wordt geïntroduceerd, wordt daarom voorgesteld als een middel om aannames over de specificiteit van een eiwitglycol in een bepaalde context te versterken, vorm te geven of te weerleggen.

Introduction

Glycanen, eiwitten waaraan ze zijn gehecht (glycoproteïnen) en eiwitten waaraan ze binden (lectines of koolhydraatbindende eiwitten) zijn de belangrijkste moleculaire actoren aan het celoppervlak1. Ondanks deze centrale rol in cel-celcommunicatie zijn grootschalige studies, waaronder glycomics, glycoproteomics of glycan-interactomics-gegevens nog steeds schaars in vergelijking met hun tegenhanger in genomics en proteomics.

Tot voor kort waren er geen methoden ontwikkeld voor het karakteriseren van de vertakkende structuren van complexe koolhydraten terwijl ze nog steeds worden geconjugeerd aan het dragereiwit. De biosynthese van glycoproteïnen is een niet-sjabloongestuurd proces waarin de monosaccharidedonoren, de accepterende glycoproteïnesubstraten en de glycosyltransferasen en glycosidasen een interactieve rol spelen. De resulterende glycoproteïnen kunnen complexe structuren dragen met meerdere vertakkingspunten waar elke monosaccharidecomponent een van de verschillende soorten kan zijn die in de natuur aanwezig zijn1. Het niet-sjabloongestuurde proces legt biochemische analyse op als de enige optie voor het genereren van oligosaccharide structurele gegevens. Het analytische proces van glycaanstructuren die aan een inheems eiwit zijn bevestigd, is vaak een uitdaging omdat het gevoelige, kwantitatieve en robuuste technologieën vereist om de samenstelling van monosacchariden, koppelingen en vertakkingssequenties2 te bepalen.

In deze context is massaspectrometrie (MS) de meest gebruikte techniek in glycomics en glycoproteomics experimenten. Naarmate de tijd verstrijkt, worden deze uitgevoerd in instellingen met een hogere doorvoer en verzamelen gegevens zich nu in databases. Glycan-structuren in verschillende formaten3, vullen GlyTouCan4, de universele glycaan-gegevensopslagplaats waar elke structuur is gekoppeld aan een stabiele identificatie, ongeacht het niveau van precisie waarmee de glycaan is gedefinieerd (bijvoorbeeld mogelijk ontbrekend koppelingstype of dubbelzinnige samenstelling). Zeer vergelijkbare structuren worden verzameld, maar hun kleine verschillen worden duidelijk gemeld. Glycoproteïnen worden beschreven en samengesteld in GlyConnect5 en GlyGen6, twee databases die naar elkaar verwijzen. MS-gegevens die structurele bewijsstukken ondersteunen, worden steeds vaker opgeslagen in GlycoPOST7. Voor een bredere dekking van online bronnen is hoofdstuk 52 van de referentiehandleiding, Essentials of Glycobiology, gewijd aan glycoinformatica8. Interessant is dat glycopeptide-identificatiesoftware zich de afgelopen jaren heeft verspreid9,10, maar niet ten behoeve van de reproduceerbaarheid. Deze laatste bezorgdheid bracht de leiders van het HUPO GlycoProteomics Initiative (HGI) ertoe om in 2019 een software-uitdaging aan te gaan. De MS-gegevens verkregen uit de verwerking van complexe mengsels van N- en O-geglycosyleerde humane serumeiwitten in CID-, ETD- en EThcD-fragmentatiemodi, werden beschikbaar gesteld aan concurrenten, of het nu softwaregebruikers of ontwikkelaars waren. Het volledige rapport over de resultaten van deze challenge11 wordt alleen hier geschetst. Om te beginnen werd een spreiding van identificaties waargenomen. Het werd voornamelijk geïnterpreteerd als veroorzaakt door de diversiteit van methoden geïmplementeerd in zoekmachines, van hun instellingen, en hoe outputs werden gefilterd, en peptide "geteld". Het experimentele ontwerp kan ook sommige software en benaderingen in een (de)voordeel hebben geplaatst. Belangrijk is dat deelnemers die dezelfde software gebruikten inconsistente resultaten rapporteerden, waardoor ernstige reproduceerbaarheidsproblemen werden benadrukt. Door verschillende inzendingen te vergelijken, werd geconcludeerd dat sommige softwareoplossingen beter presteren dan andere en dat sommige zoekstrategieën betere resultaten opleveren. Deze feedback zal waarschijnlijk de verbetering van geautomatiseerde glycopeptidegegevensanalysemethoden begeleiden en zal op zijn beurt van invloed zijn op de database-inhoud.

De uitbreiding van glycoinformatica leidde tot het creëren van webportalen die informatie en toegang bieden tot meerdere vergelijkbare of aanvullende bronnen. De meest recente en actuele worden beschreven in een hoofdstuk van de Comprehensive Glycoscience boekenreeks12 en door samenwerking wordt een oplossing voor het delen van gegevens en informatie-uitwisseling aangeboden in een open access modus. Een dergelijk portaal werd ontwikkeld dat oorspronkelijk Glycomics@ExPASy 13 heette en werd omgedoopt tot Glyco@Expasy, na de grote revisie van het Expasy-platform14 dat al tientallen jaren een grote verzameling tools en databases host die in verschillende omics worden gebruikt, het meest populaire item is UniProt15 - de universele eiwitkennisbank. Glyco@Expasy biedt een didactische ontdekking van het doel en het gebruik van databases en tools, gebaseerd op een visuele categorisatie en een weergave van hun onderlinge afhankelijkheden. Het volgende protocol illustreert procedures om glycomics en glycoproteomics-gegevens te verkennen met een selectie van bronnen uit dit portaal die de verbinding tussen glycoproteomics en glycan-interactomics expliciet maakt via glycomics. Zoals het is, produceren glycomics-experimenten structuren waarbij monosacchariden volledig zijn gedefinieerd en koppelingen gedeeltelijk of volledig worden bepaald, maar hun aanhechting van de eiwitplaats wordt slecht of helemaal niet gekarakteriseerd. Glycoproteomics-experimenten genereren daarentegen nauwkeurige informatie over de hechting van de plaats, maar met een slechte resolutie van glycaanstructuren, vaak beperkt tot monosaccharidesamenstellingen. Deze informatie is verzameld in de GlyConnect-database. Bovendien kunnen zoekhulpmiddelen in GlyConnect worden gebruikt om potentiële glycaanliganden te detecteren die worden beschreven samen met de eiwitten die ze herkennen in UniLectin16, gekoppeld aan GlyConnect via glycanen. Het protocol dat hier wordt gepresenteerd, is verdeeld in twee secties om vragen te behandelen die specifiek zijn voor N-gebonden en O-gebonden glycanen en glycoproteïnen.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

OPMERKING: Een apparaat met een internetverbinding (bij voorkeur een groter scherm) en een up-to-date webbrowser zoals Chrome of Firefox is vereist. Het gebruik van Safari of Edge is mogelijk niet zo betrouwbaar.

1. Van een eiwit N-glycoom in GlyConnect naar een lectine van UniLectin

  1. Toegang tot bronnen vanuit Glyco@Expasy
    OPMERKING: De hier beschreven procedure is om toegang te krijgen tot GlyConnect, maar kan worden toegepast op toegang tot elke bron die op het platform is vastgelegd.
    1. Ga naar https://glycoproteome.expasy.org/glycomics-expasy en bekijk het bellendiagram aan de rechterkant met verschillende categorieën zoals Glycoconjugaten of Glycan Binding. Schakel in het meest linkse menu dat de categorieën in de bellen weergeeft het selectievakje Glycoproteïnen in, zodat het bellendiagram aan de rechterkant onmiddellijk inzoomt op de bel die overeenkomt met die categorie.
      OPMERKING: Groene bubbels zijn gereedschappen en gele bubbels zijn databases. Als u op een van beide klikt, zoomt u opnieuw in om details over de bron te geven. Voordat u dit doet, wil de gebruiker misschien de afhankelijkheden van die bron voor anderen begrijpen.
    2. Als u de informatie over afhankelijkheden wilt ophalen, gaat u van het tabblad Resource Thematic Classification naar het tabblad Resource Dependency Wheel . Plaats de muis op GlyConnect in het wiel om de mate van integratie met andere bronnen te controleren (afbeelding 1).
    3. Ga terug naar het tabblad Resource Thematic Classification om de GlyConnect-bubbel te bereiken zoals in stap 1.1.1 en klik erop (aanvullende afbeelding 1) om de GlyConnect-startpagina weer te geven in een nieuw tabblad dat de statistieken van de inhoud in de nieuwste versie van de database weergeeft.
      OPMERKING: Een kleurenschema in tabel 1 komt overeen met de verschillende soorten informatie die in de database zijn opgeslagen. Deze kleurcode is geldig op alle entiteitspagina's in GlyConnect en is overal consistent. De homepage toont ook vier secties gewijd aan gerichte datasets, zoals die waarin de glycosylatie van het Sars-Cov-2 spike-eiwit (COVID-19) wordt beschreven of uitgebreid wordt beschreven in oligosacchariden voor moedermelk (HMO). Deze zullen in dit protocol niet worden onderzocht.
  2. Het verkennen van de contextuele informatie van een eiwit N-glycoom
    OPMERKING: Alle glycaanstructuren in GlyConnect worden weergegeven in drie alternatieve en veelgebruikte formaten: (1) Symboolnomenclatuur voor glycanen (SNFG)17 (2) IUPAC gecondenseerd18, en (3) Oxford19. Daarentegen is er geen standaardnotatie om de glycaansamenstelling uit te drukken. In GlyConnect wordt de volgende code gebruikt: Hex voor hexose, HexNAc voor N-Acetylhexosamine, dHex voor fucose en NeuAc voor siaalzuren. Voor de eenvoud vertrouwen visualisatietools op een gecondenseerde notatie: H voor hexose, N voor N-Acetylhexosamine, F voor fucose en S voor siaalzuren. Bovendien duiden kleine letters op wijzigingen zoals "a" voor acetylering, "p" voor fosforylering en "s" voor sulfatie, voor de meest voorkomende van deze zogenaamde substituenten.
    1. Ga als volgt te werk om het N-glycoom van humaan prostaatspecifiek antigeen (PSA) te bekijken en te verkennen vanaf de GlyConnect-startpagina.
      OPMERKING: De glycosylatie van menselijke PSA is in de loop der jaren bestudeerd, vooral in de context van prostaatkanker. De GlyConnect-database slaat drie referenties20,21,22 op, die glycomics en glycoproteomics-gegevens combineren. Merk op dat de hier verstrekte resultaten zijn verkregen met de september 2021 release van GlyConnect. Bijbedoeling van de database kan enigszins andere statistieken opleveren als gevolg van frequente gegevensupdates.
    2. Selecteer de knop PROTEIN om de eiwitweergave van de database te openen. Typ op de pagina eiwitweergave prostaat in het zoekvenster. Zoek naar de twee vermeldingen in de uitvoer die twee isovormen van PSA onderscheiden met verschillende pI-waarden. Klik op 790 (Id-kolom) die overeenkomt met de gemeenschappelijke isovorm van PSA.
      OPMERKING: Zoek naar de bovenste veelkleurige balk met samenvattingsinformatie die is geëxtraheerd uit het gepubliceerde werk in het bovenstaande schema. Verschillende opties voor navigatie zijn mogelijk zoals hieronder beschreven.
    3. Klik op de bovenste veelkleurige balk op de knop SOURCE in het groen om de voorbeeldtypen weer te geven waaruit de gepubliceerde gegevens zijn verwerkt: urine en zaadvloeistof. Als u verder door deze informatie wilt bladeren, klikt u op een van deze voorbeeldtypen. Hetzelfde geldt voor elk item dat verschijnt wanneer u op een gekleurde knop klikt.
    4. Om de gezondheidsgerelateerde inhoud van de database te controleren, klikt u op de knop ZIEKTE , die twee items bevat, waaronder prostaatkanker die linkt naar de bijbehorende speciale ziektepagina in GlyConnect. De samenvatting voor die pagina laat zien dat drie grootschalige studies 319 samenstellingen hebben gerapporteerd op 1.087 locaties gevonden in 308 menselijke eiwitten.
    5. Klik op de knop STRUCTUUR om de volledige lijst van 135 structuren geassocieerd met PSA te bekijken op basis van glycomics-gegevens. Klik op de knop SAMENSTELLING voor de bijbehorende 78 samenstellingen bepaald door glycoproteomics experimenten. Klik op een structuur of samenstelling voor meer informatie.
      OPMERKING: Details zoals de lijst van alternatieve eiwitten die de specifieke structuur dragen of de lijst van structuren die overeenkomen met de samenstelling kunnen worden verkregen. Van PSA is bekend dat het slechts één N-glycosylatieplaats heeft op Asn-69 (slechts één item geteld voor de bruine SITE-knop ).
    6. Om de ambiguïteit van composities te verminderen, klikt u op SUGGESTED STRUCT onder een geselecteerde compositie (bijvoorbeeld Hex:6 HexNAc:3 NeuAc:1). Er wordt een suggestie gedaan telkens wanneer het aantal monosachariden samenvalt met dat van een hierboven genoemde structuur (figuur 2).
      OPMERKING: De Hex:6 HexNAc:3 NeuAc:1 samenstelling gegenereerd door een glycoproteomics experiment is gekoppeld aan vier hogere resolutie structuren uit de glycomics gegevens. In het geval van PSA is er geen onduidelijkheid over de plaats van de plaats op te lossen, omdat alleen Asn-69 geglycosyleerd is.
    7. Om de eiwitpagina volledig te verkennen, bekijkt u verdere details aan de rechterkant van de pagina (figuur 3).
      1. Bekijk de standaard 3QUM PDB (Protein Data Bank23) vermelding voor PSA die wordt weergegeven met twee complexe glycanen bevestigd aan elk monomeer (Figuur 3) of de alternatieve 2ZCK-vermelding , die ook beschikbaar is vanwege een bijgevoegd koolhydraat. Het tweede item toont een enkele keten.
        OPMERKING: Beide vermeldingen worden gevisualiseerd met de 3D LiteMol-plug-in24 die glycanen weergeeft in SNFG-3D-notatie die is aangenomen in de PDB-RCSB.
      2. Klik op de overeenkomstige links van andere kruisverwijzingen om relevante functionele informatie uit belangrijke proteomics-databases, zoals UniProt, te verkennen (figuur 3).
  3. Visualiseren en correleren van de contextuele informatie van een eiwit N-glycoom
    OPMERKING: Zoals te zien is in de vorige sectie, kunnen lange lijsten met structuren of composities moeilijk te begrijpen zijn als geheel en GlyConnect vertrouwt op twee verschillende hulpmiddelen om belangrijke informatie te visualiseren, namelijk GlyConnect Octopus en GlyConnect Compozitor (de eerste breidt de samenvattingsinformatie uit die is vastgelegd in gekleurde knoppen en de tweede brengt structurele afhankelijkheden naar voren in termen van een structuur / samenstelling die in een andere is opgenomen). Zoals hieronder geïllustreerd, onderzoekt GlyConnect Octopus associaties tussen de verschillende entiteiten die in de database zijn opgeslagen door meerdere of enkele verbindingen te markeren als een weerspiegeling van de database-inhoud.
    1. Voer een GlyConnect Octopus-zoekopdracht uit om de aanwezigheid van gemeenschappelijke structurele kenmerken te bevestigen, zoals hybride kernstructuren en zeer frequente siaalzuurbevattende structuren in de diversiteit van glycanen die aan PSA zijn bevestigd, zoals hieronder beschreven.
    2. Ga naar de Octopus homepage https://glyconnect.expasy.org/octopus/. Houd het tabblad N-gekoppeld standaard geselecteerd. Ga naar het subtabblad Cores en klik op het pictogram Hybride . Ga naar het subtabblad Eigenschappen en klik op het pictogram Sialylated . Klik op de groene knop Zoeken hieronder.
      OPMERKING: De zoekresultaten worden grafisch weergegeven als relaties tussen drie categorieën items. Standaard komt de middelste lijst overeen met de query voor composities, de linkerverzameling omvat gerelateerde eiwitten en de rechter verzamelt gerelateerde glycanen.
    3. Plaats in de weergegeven grafiek met relaties de muisaanwijzer op H6N4F1S1 om links naar zes eiwitten en drie structuren te markeren. Vergelijk dit door met de muis over H6N4F2S1 te zweven die de twee isovormen van PSA (beide aangeduid als UniProt ID: KLK3_HUMAN) en één structuur (ID: 10996) onderscheidt. Plaats de muisaanwijzer op de structuur-ID om de SNFG-weergave weer te geven en klik erop om de bijbehorende pagina te openen (aanvullende figuur 2).
    4. Verander de knooppunten van de Octopus in een ander onderwerp dat de context van glycosylatie beschrijft. De kleurcode blijft dezelfde als de eerder beschreven kleurcode (zie tabel 1).
      1. Verander de middelste knooppunten in Tissues om 15 opties in het midden van de grafiek weer te geven, waarvan er vele lichaamsvloeistoffen zijn. Zoek naar alle associaties tussen eiwitten en glycanen die overeenkomen met de zoekopdracht, afhankelijk van weefselinformatie. Plaats de cursor op Urine of Zaadvloeistof in het midden van de grafiek om verschillende associaties te bekijken (Figuur 4A,B).
      2. Verander de center nodes naar Disease om 13 opties weer te geven, waaronder prostaatkanker. Het enige eiwit dat geassocieerd is, is PSA (KLK3_HUMAN) (aanvullende figuur 3).
        OPMERKING: Een nadere blik op het PSA N-glycoom dat op de eiwitpagina wordt getoond, onderscheidt de zeer hoge frequentie van een terminale NeuAc (a?-?) Gal(b?-?) GlcNAc-onderbouw in veel gevallen op structuren met twee of drie antennes. Op basis daarvan kan een andere Octopus worden gegenereerd zoals hieronder beschreven.
    5. Klik op de knop Wissen om de zoekopdracht te vernieuwen. Ga naar het subtabblad Eigenschappen en klik op het pictogram Bi-antennes . Ga naar het subtabblad Determinanten en klik op het pictogram 3-Sialyl-LN (type 2 ). Klik op de groene knop Zoeken hieronder.
    6. Controleer de octopus-opgehaalde associaties met bi-antenneglycanen die een terminaal 3-Sialyl-LN (type 2) motief bevatten, d.w.z. NeuAc (a1-3) Gal (b1-4) GlcNAc. Verander de middelste knooppunten in Weefsels voor gemakkelijker lezen en beweeg de muisaanwijzer over KLK3_HUMAN om zaadvloeistof rechtstreeks te verbinden met psa-gemeenschappelijke isovorm en zeven structuren (aanvullende figuur 4).
      OPMERKING: De tweede visualisatietool, GlyConnect Compozitor, voert de scan uit van potentiële relaties tussen elke compositie in een lijst daarvan (zie hieronder). Een relatie wordt gedefinieerd als verschillend van slechts één monosaccharide tussen twee samenstellingen. Deze geïdentificeerde relaties uitgezet in een grafiek leggen de (dis)continuïteit van een glycoom bloot.
    7. Gebruik GlyConnect Compozitor om de scan uit te voeren van potentiële relaties tussen elke compositie in een lijst daarvan, zoals hieronder geïllustreerd voor het geval van PSA.
      OPMERKING: GlyConnect Compozitor verwerkt composities in combinatie met een context. Het biedt verschillende tabbladen voor het opvragen van GlyConnect, bijvoorbeeld eiwitten, bronnen, cellijnen, ziekten die voor zichzelf spreken om een context te kwalificeren. Dit wordt hier met PSA als volgt geïllustreerd.
    8. Ga terug naar de eiwitpagina van PSA: https://glyconnect.expasy.org/browser/proteins/790. Klik aan de rechterkant van de PSA-invoerpagina op de link Compozitor. Zorg ervoor dat de zoekvelden van Compozitor vooraf zijn ingevuld met de details van de id 790-vermelding op het tabblad Eiwit (Eiwit: prostaatspecifiek antigeen, Soort: Homo sapiens en Glycan-type: N-gekoppeld).
    9. Klik op de knop Toevoegen aan selectie om gegevens uit de database op te halen en de grafiek van verbonden composities weer te geven. Schakel de optie Virtuele knooppunten opnemen uit . Klik op de knop Compute Graph om een grafiek weer te geven met een goed verbonden set van 78 composities die het PSA N-glycoom vertegenwoordigen, en een staafplot met de belangrijkste kenmerken van de glycanen.
    10. Plaats de muisaanwijzer op de paarse balk in de staafplot, die alle gesialyleerde structuren in de grafiek lokaliseert om een waarneembare voorkeur voor gesialyleerde structuren te onthullen.
    11. Blijf op het tabblad Eiwit en selecteer Prostaatspecifiek antigeen - hoog Pi isoform (psah) in het veld Eiwit (naam).
      OPMERKING: De velden Glycan Type en Glycan Site worden automatisch ingevuld.
    12. Klik op de knop Toevoegen aan selectie om gegevens op te halen uit de database die 57 composities bedragen. Klik op de knop Compute Graph om de boven elkaar geplaatste grafieken van beide isovormen te genereren en de verschillen in glycomen van de twee PSA-isovormen te beoordelen. Plaats de muisaanwijzer op knooppuntlabels om de weergave van het aantal structuren dat overeenkomt met de composities/labels weer te geven (afbeelding 5).
  4. Glycan-bindende informatie in UniLectin
    OPMERKING: Denk aan de determinant getest in de Octopus, beschreven als NeuAc (a2-3) Gal (b1-4). Het is per definitie een vaststaand bindmiddel van een glycaanstructuur en kan als zodanig worden doorzocht in de UniLectin3D-database25.
    1. Ga naar https://www.unilectin.eu/ en klik op de Knop UniLectin3D . U kunt ook direct naar de pagina gaan: https://www.unilectin.eu/unilectin3D/.Click op de knop Glycan Search om deze pagina te openen: https://www.unilectin.eu/unilectin3D/glycan_search (aanvullende figuur 6).
    2. Klik op de paarse diamant die een siaalzuur voorstelt, wat de weergave van alle glycaanbindende motieven veroorzaakt die eindigen met een siaalzuur dat in de database is opgeslagen. Het bovenste deel van die verzameling motieven bevat het eerder onderzochte NeuAc(a2-3)Gal(b1-4)GlcNAc-motief (aanvullende figuur 7).
    3. Klik op het NeuAc(a2-3)Gal(b1-4)GlcNAc motief om de weergave van alle lectines te vragen waarvoor een 3D-structuur bekend is die de interactie met NeuAc(a2-3)Gal(b1-4)GlcNAc bevestigt. Het resultaat toont standaard lectines in alle soorten. Gebruik de optie Zoeken op veld om de weergave te beperken tot mensgerichte informatie.
    4. Klik op de optie Zoeken op veld . In het soortveld , type Homo sapiens. Klik op de knop Röntgenstructuren verkennen om de oorspronkelijke lijst eruit te filteren. Er blijft slechts één vermelding over, namelijk het menselijke galectine-8. Klik op de knop Bekijk de 3D-structuur en -informatie in de rechterbovenhoek van het vermelde item om gedetailleerde informatie weer te geven over menselijke galectine-8 interactie met NeuAc (a2-3) Gal (b1-4) GlcNAc.
    5. Toegang tot de structurele informatie over menselijk galectine-8 die op de pagina wordt weergegeven met twee verschillende kijkers.
      1. Houd de muis vast om het molecuul om te draaien en breng het ligand naar voren met de Litemol-software26 geïntegreerd om de lectine 3D-structuur te laten zien. Plaats de muisaanwijzer op een van de vermelde interacties aan de linkerkant om de weergave aan de rechterkant bij te werken en te lokaliseren waar die specifieke interactie in de structuur werkt met de PLIP-software27 geïntegreerd om atomaire interacties tussen het lectine en het ligand te detailleren (figuur 6).
    6. Klik op een groene knop die linkt naar de overeenkomstige vermeldingen in UniProt, PDB (Europese of Amerikaanse sites) en GlyConnect om deze kruisverwijzingen te verkennen.

2. O-glycomen verkennen en vergelijken in GlyConnect

  1. Bladeren door de HGI-uitdaging met een hoog vertrouwen dataset
    OPMERKING: De HGI-dataset die in de inleiding wordt genoemd, wordt opgeslagen in de GlyConnect-database. Het bevat 163 N- en 23 O-glycopeptiden gevonden in 37 glycoproteïnen beschouwd als een hoge betrouwbaarheidslijst. GlyConnect Compozitor28 is de sleutel tot het beoordelen van de consistentie van glycomegegevens. Belangrijk is dat Compozitor virtuele knooppunten (grijs weergegeven) mogelijk maakt wanneer slechts één tussenstap nodig is om de geïsoleerde knooppunten te verbinden. Op die manier spannen virtuele knooppunten de grafiek aan en kunnen ze worden geïnterpreteerd als structuren die mogelijk worden gemist in de experimentele resultaten.
    1. Blader door de HGI-dataset vanaf de GlyConnect-startpagina door rechtstreeks naar de referentiepagina van het artikel te gaan: https://glyconnect.expasy.org/browser/references/2943.
      OPMERKING: De samenvatting in de gekleurde knoppen weerspiegelt gedeeltelijk de cijfers in het artikel. Maar als slechts 69 unieke peptiden worden vermeld, weerspiegelt dit meerdere associaties tussen peptiden en sites of structuren. In het artikel wordt een glycopeptide gedefinieerd als een unieke combinatie van een peptide en een samenstelling. In GlyConnect worden glycosieten eerst overwogen en ze worden beschreven als een combinatie van een peptide met structuren. Dit verklaart de discrepantie in cijfers tussen GlyConnect en het bovenstaande citaat.
    2. Controleer de hoge frequentie van voorkomen van N-gebonden samenstellingen, zoals Hex:5 HexNAc:4 NeuAc:2, geïdentificeerd op 42 plaatsen in 43 peptiden in tegenstelling tot de frequente uniciteit van de meeste O-gebonden samenstellingen geïdentificeerd op 1 site in 1 peptide.
    3. Klik op de Link Compozitor aan de rechterkant van de pagina met referentie-invoer om de consistentie van de dataset te beoordelen. Zorg ervoor dat het hulpprogramma Compozitor de DOI van de referentie rechtstreeks verwerkt en het zoekveld vult met reference=10.1101/2021.03.14.435332 op het tabblad Geavanceerd van het hulpprogramma. Typ &glycan_type=O-linked achter het DOI-nummer om de zoekopdracht te beperken tot O-gekoppelde glycanen, zodat de query: referentie=10.1101/2021.03.14.435332&glycan_
      type=O-gekoppeld
    4. Klik op de knop Toevoegen aan selectie om gegevens uit de database op te halen (er zijn 20 O-gekoppelde composities). Houd de optie Virtuele knooppunten opnemen geselecteerd. Klik op de knop Compute Graph om de grafiek van verbonden composities weer te geven. Dit resultaat benadrukt verschillende hiaten in de verwachte continuïteit van de glycaanbiosynthese met negen virtuele knooppunten die nodig zijn om de grafiek te voltooien (figuur 7).
  2. Vergelijking met het O-glycoom van een geselecteerd serumeiwit in GlyConnect
    OPMERKING: Om te beoordelen of de hiaten kunnen worden opgevuld door gegevens die zijn opgeslagen in GlyConnect, werd één O-geglycosyleerd eiwit uit de 37 met de referentie vermeld, geselecteerd. In de dataset wordt gemeld dat Inter-alfa-trypsineremmer zware keten H4 (Q14624) een O-glycosylated op Thr-725 is.
    1. Ga naar het tabblad Eiwit van GlyConnect Compozitor (zie stap 2.1.3). Selecteer in de eiwitlijst Inter-alfa-trypsineremmer zware keten H4. Zorg ervoor dat de soortselectie standaard Homo sapiens is. Hef de selectie van N-gekoppeld in het Glycan-type op. Selecteer alleen Thr-725 in de sitelijst door eerst op het minteken links van de site te klikken om alle sites te deselecteren en vervolgens alleen Thr-725 in de lijst te selecteren.
    2. Klik op de knop Toevoegen aan selectie (merk op dat zes composities zijn gekoppeld aan Thr-725). Klik op de knop Rekengrafiek om de grafiek van verbonden composities weer te geven (aanvullende figuur 8).
    3. Bekijk de weergegeven grafiek, die de 17 unieke composities van de 20 O-gekoppelde composities van de artikeldataset in blauw toont en de drie unieke van de zes in de database in rood. Met andere woorden, de overlap tussen de twee bronnen is aanwezig in drie composities die in magenta worden weergegeven. Merk op dat een rotatie van 45° van de grafiek automatisch wordt gegenereerd.
      OPMERKING: Het aantal virtuele knooppunten wordt met één verminderd. Het blijkt dat H2N2S1 ontbreekt in de 20 O-gebonden samenstellingen van de artikeldataset en wordt weergegeven als een virtueel knooppunt nu gevuld met een extra samenstelling geassocieerd met Thr-725 van Inter-alfa-trypsineremmer zware keten H4 in de database. Dit vereenvoudigt de topologie van de grafiek omdat twee andere virtuele knooppunten onbruikbaar worden gemaakt omdat ze alternatieve opties waren om de kloof tussen H1N2S1 en H2N2S2 te vullen. Toch zou een tweede compositie die uit de database wordt geïmporteerd, worden geïsoleerd als er geen nieuwe alternatieve virtuele knooppunten H2N2F1S1 en H1N2F2S1 worden gemaakt.
    4. Om de virtuele knooppunten te begrijpen, controleert u of de bijbehorende composities aanwezig zijn in GlyConnect. Klik hiervoor op de knop Exporteren onder de grafiek. Selecteer Alleen virtueel door alle andere opties uit te schakelen. Klik op het klembordpictogram om de selectie van 8 composities te kopiëren.
    5. Plak de selectie in het queryvenster van het tabblad Aangepast van Compozitor. Selecteer O-gekoppeld in het veld Glycan-type . Stel het selectielabel in het veld Composities in op bijvoorbeeld VN om de lijst met 8 composities een naam te geven. Klik op de knop Toevoegen aan selectie en vervolgens op de knop Rekengrafiek . Alle virtuele knooppunten worden nu weergegeven als groene knooppunten (figuur 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Het eerste deel van het protocol (sectie 1) liet zien hoe de specificiteit of de gemeenschappelijkheid van N-glycanen bevestigd op Asn-69 van het menselijke prostaatspecifiek antigeen (PSA) kan worden onderzocht met behulp van het GlyConnect-platform. Weefselafhankelijke (urine en zaadvloeistof), evenals isovormafhankelijke (normale en hoge pI) variaties in glycaanexpressie, werden benadrukt met behulp van twee visualisatietools (figuur 4 en figuur 5).

Ten eerste bood GlyConnect Octopus, dat associaties weergeeft tussen entiteiten die in de database zijn opgeslagen, de mogelijkheid om contextuele informatie te verkennen via (1) het selecteren van verschillende entiteiten die in de Octopus moeten worden weergegeven en (2) het klikken op links om gerelateerde vermeldingen te onderzoeken. Het resultaat was onderscheidende associaties afhankelijk van het weefsel.

Ten tweede werd GlyConnect Compozitor, oorspronkelijk ontworpen om een samenstellingsbestand voor glycopeptide-identificatie te definiëren / verfijnen, gebruikt om glycaanexpressie te beoordelen in twee bekende PSA-isovormen (normale en hoge pI). De vergelijking van elke isovormglycolen leverde een goed verbonden grafiek op die vier knooppunten (samenstellingen) uitsprak, waarvan er twee kenmerkend zijn voor de hoge pI-isovorm. Hoewel de glycome-overlap significant is, toonde het staafdiagram van de glycaaneigenschap een daling van de solilylatatie van de gemeenschappelijke naar de hoge pI-isovorm (aanvullende figuur 5).

Bovendien wijst de verkenning van UniLectin3D galectine-8 aan als een mogelijke lezer van het PSA-glycoom, omdat het laatste veel structuren bevat met een NeuAc (a2-3) Gal (b1-4) GlcNAc-terminale epitoop. Dit levert een aanknopingspunt op en kan niet als definitief bewijs worden beschouwd. Niettemin is bekend dat PSA en galectines een essentiële rol spelen bij prostaatkanker29 en de specifieke rol van Galectin-8 werd onlangs benadrukt30. Het eerste deel van het protocol correleert structurele (glycoproteomics) en functionele (bindende) gegevens om een waarschijnlijk scenario vast te stellen voor eiwit-eiwitinteracties gemedieerd door glycanen.

In het tweede deel van het protocol (sectie 2) werd een hoogwaardige set O-glycaansamenstellingen geassocieerd met een bepaald weefsel (menselijk serum) onderzocht en vergeleken met de inhoud van de GlyConnect-database, waardoor de mogelijkheid werd geboden om een glycaansamenstellingsbestand aan te passen voor de verfijnde identificatie van glycopeptiden (figuur 7 en figuur 8 ). Het kan vertrouwen op de minimale set van 20 composities die beschikbaar zijn uit één dataset (HGI-uitdagingsresultaten) of worden uitgebreid met 23 tot 26 items die rationeel zijn verzameld in GlyConnect om de consistentie van de set te versterken.

rood lichtoranje groen lichtblauw paars roze donkerblauw bruin donkeroranje
soort eiwit weefselbron structuur compositie ziekte referentie glycosiet Peptide

Tabel 1: Kleurenschema dat is gekoppeld aan elke entiteit van de GlyConnect-database en overal geldig is.

Figure 1
Figuur 1: Afhankelijkheidswiel van Glyco@Expasy geïnstantieerd voor GlyConnect. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 2
Figuur 2: Voorgestelde glycaanstructuur voor een geselecteerde glycaansamenstelling. Voorgestelde glycaanstructuur van een glycomics-experiment voor een glycaansamenstelling van een glycoproteomisch experiment gericht op hetzelfde glycoproteïne, hier humaan prostaatspecifiek antigeen (PSA), zoals voorgesteld op de GlyConnect-pagina voor PSA (ID: 790). Klik hier om een grotere versie van deze figuur te bekijken.

Figure 3
Figuur 3: Rechtszijmenu van de GlyConnect-pagina voor PSA. Klikbare kruisverwijzingen naar andere belangrijke databases en weergave met LiteMol glycan plugin van bestaande 3D-structuur in de VOB. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 4
Figuur 4: De output vanGlyConnect Octopus toont weefselafhankelijke associaties tussen eiwitten en glycanen. De query Hybrid AND Sialylated heeft alle composities geretourneerd die aan deze criteria voldoen en elke samenstelling koppelt de bijbehorende informatie over eiwitten en glycanen zoals vastgelegd in de database aan elkaar. Merk op dat Species standaard is ingesteld op Homo sapiens , maar deze optie kan worden gewijzigd. Hier toont GlyConnect Octopus alle menselijke eiwitten (linkerknopen) die hybride en gesialyleerde glycaanstructuren (rechterknooppunten) dragen met de weefsels waarin ze tot expressie worden gebracht (middelste knooppunten). (A) De associaties met urine worden benadrukt met twee eiwitten: choriogonadotrofine (GLHA_HUMAN) en PSA common isoform (KLK3_HUMAN) verbonden met verspreide (heterogene) glycaanstructuren. (B) De associaties met zaadvloeistof worden benadrukt en tonen twee eiwitisovormen van PSA (KLK3_HUMAN) verbonden met gegroepeerde (vergelijkbare) glycaanstructuren. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 5
Figuur 5: De output van GlyConnect Compozitor met de gesuperponeerde N-glycomen van de twee isovormen van PSA. Composities in gecondenseerde notatie labelen elk knooppunt. De glycanen geassocieerd met de gemeenschappelijke isovorm worden weergegeven als blauwe knooppunten en die van de hoge pI-isovorm als rode knooppunten. De overlap tussen glycomen wordt weergegeven als magenta-knooppunten. Getallen in de knooppunten vertegenwoordigen het aantal glycaanstructuren dat overeenkomt met de gelabelde samenstelling volgens de inhoud van de GlyConnect-database met betrekking tot PSA. De getoonde Compozitor-grafiek is enigszins gewijzigd van de onbewerkte uitvoer om het netwerk te ontwarren dat wordt gegenereerd door de D3.js-bibliotheek. Dit is eenvoudig te doen omdat elk knooppunt in de browservensterruimte kan worden gesleept waar een gebruiker maar wil, en de paden kunnen dus worden ingekort of uitgerekt. De gebruiker kan een specifieke compositie typen in het veld Inzoomen in de rechterbovenhoek om in te zoomen en de grafiek op het bijbehorende knooppunt te centreren. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 6
Figuur 6: Samenvattende vermelding van de humane galectine-8 met NeuAc(a2-3)Gal(b1-4)GlcNAc bindende details. Als u op het groene knop De 3D-structuur en -informatie weergeven klikt (aangegeven met een rode ellips) wordt een nieuwe pagina geopend waarin een close-up van residu-interacties wordt weergegeven met de PLIP-toepassing (aangegeven door een rode pijl). Klik hier om een grotere versie van deze figuur te bekijken.

Figure 7
Figuur 7: De output van GlyConnect Compozitor met het O-glycoom van de human serum high confidence dataset van de HGI challenge. Zonder virtuele knooppunten (zie tekst) is de connectiviteit van die grafiek laag. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 8
Figuur 8: De output van GlyConnect Compozitor die de mogelijkheid toont om het O-glycoom van de human serum high confidence dataset van de HGI challenge te voltooien, met behulp van de GlyConnect database content. Toegang tot de inhoud van de volledige GlyConnect-database met behulp van het tabblad Aangepast van Compozitor onthult dat composities die overeenkomen met de virtuele knooppunten worden toegewezen met bestaande gedefinieerde structuren zoals gemarkeerd in de knooppuntlabels. De knooppuntgrootte vertegenwoordigt het aantal verwijzingen dat in de database is opgeslagen en de bijbehorende samenstelling rapporteert. Het numerieke label van knooppunten geeft het aantal overeenkomstige structuren aan dat is opgeslagen in GlyConnect. Geselecteerde composities lijken nul tot achttien mogelijke overeenkomsten in de database te hebben. In feite zijn deze knooppunten alleen virtueel als een weerspiegeling van de inhoud van experimentele datasets. Het wordt aanbevolen om de informatie in de grafiek te verfijnen om het realisme van deze extra knooppunten te testen. Klik hier om een grotere versie van deze figuur te bekijken.

Aanvullende figuur 1: Bellendiagram van de Glyco@Expasy homepage. Door in te zoomen op het bellendiagram van de Glyco@Expasy startpagina om u te concentreren op de glycoproteïnecategorie . Software weergegeven in groene bubbels en databases in gele bubbels. Als u op een willekeurige bubbel klikt, wordt het doel van de bron samengevat. Klik hier om dit bestand te downloaden.

Aanvullende figuur 2: Octopus-opgehaalde associaties die overeenkomen met de query, afhankelijk van de samenstelling. Standaard GlyConnect Octopus-weergave van menselijke eiwitten (linkerknooppunten) met hybride en gesialyleerde glycaanstructuren (rechterknooppunten) met overeenkomende samenstellingen (middelste knooppunten). Samenstelling H6N4F12S1 lijkt uniek voor beide PSA-isovormen (KLK3_HUMAN). Als u op de unieke structuur-ID (10996) klikt, wordt de bijbehorende pagina geopend met details waaruit blijkt dat de twee isovormen inderdaad de enige eiwitten zijn die deze specifieke glycaan dragen. Klik hier om dit bestand te downloaden.

Aanvullende figuur 3: Octopus-opgehaalde associaties die overeenkomen met de zoekopdracht, afhankelijk van de ziekte. GlyConnect Octopus toont alle menselijke eiwitten (linker knooppunten) die hybride en gesialyleerde glycaanstructuren (rechterknopen) dragen met de ziekten waarin ze tot expressie komen (middelste knooppunten). De associaties met prostaatkanker worden benadrukt en tonen de gemeenschappelijke isovorm van PSA (KLK3_HUMAN). Klik hier om dit bestand te downloaden.

Aanvullende figuur 4: Octopus-opgehaalde associaties die overeenkomen met de zoekopdracht, afhankelijk van weefselinformatie. GlyConnect Octopus toont alle menselijke eiwitten (linker knooppunten) met bi-antennes glycaanstructuren, inclusief het NeuAc(a1-3)Gal(b1-4)GlcNAc-motief (rechterknopen) met de weefsels waarin ze tot expressie worden gebracht (middelste knooppunten). De associaties met zaadvloeistof zijn gemarkeerd en tonen alleen de gemeenschappelijke isovorm van PSA (KLK3_HUMAN) en zeven structuren. Klik hier om dit bestand te downloaden.

Aanvullende figuur 5: De uitgang van GlyConnect Compozitor met de gesuperponeerde N-glycomen van de twee isovormen van PSA. Composities in gecondenseerde notatie labelen elk knooppunt. De glycanen geassocieerd met de gemeenschappelijke isovorm worden weergegeven als blauwe knooppunten en die van de hoge pI-isovorm als rode knooppunten. De overlap tussen glycomen wordt weergegeven als magenta-knooppunten. Getallen in de knooppunten vertegenwoordigen het aantal glycaanstructuren dat overeenkomt met de gelabelde samenstelling volgens de inhoud van de GlyConnect-database met betrekking tot PSA. Mousing over het staafdiagram van glycaaneigenschappen toont de correspondentie tussen de frequentie en de knooppunten als oranje bubbels. Bijna alle psa-gemeenschappelijke isovormknooppunten zijn gedekt. Deze frequentie daalt in de hoge pI-isovorm. Klik hier om dit bestand te downloaden.

Aanvullende figuur 6: Glycan zoekinterface in UniLectin3D. Door op het siaalzuur SNFG-symbool (rood omcirkeld) te klikken, wordt de zoekopdracht gestart naar alle liganden die NeuAc bevatten, opgeslagen in UniLectin3D. Klik hier om dit bestand te downloaden.

Aanvullende figuur 7: Uittreksel van de output van de zoekopdracht naar alle liganden die NeuAc bevatten. Het NeuAc(a2-3)Gal(b1- 4)GlcNAc motief van belang is rood omcirkeld. Klik hier om dit bestand te downloaden.

Aanvullende figuur 8: De output van GlyConnect Compozitor met het O-glycoom van de HGI-dataset bovenop die in GlyConnect. De output van GlyConnect Compozitor toont het O-glycoom van de human serum high confidence dataset van de HGI challenge in blauw gesuperponeerd met het O-glycoom van één O-geglycosyleerd eiwit uit de 37 vermeld met de referentie, d.w.z. inter-alfa-trypsineremmer zware keten H4 met aanvullende informatie in GlyConnect. Dit verbetert de connectiviteit van de grafiek. Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus als hulpmiddel voor het onthullen van onverwachte correlaties
GlyConnect Octopus is oorspronkelijk ontworpen om de database te doorzoeken met een losse definitie van glycanen. Inderdaad, de literatuur vermeldt vaak de belangrijkste kenmerken van glycanen in een glycoom, zoals gefucosyleerd of gesialyleerd zijn, gemaakt zijn van twee of meer antennes, enz. Bovendien worden glycanen, of ze nu N- of O-gebonden zijn, geclassificeerd in kernen, zoals beschreven in de referentiehandleiding Essentials of Glycobiology1, die ook vaak worden geciteerd in gepubliceerde artikelen. Ten slotte zijn glycaan-epitopen zoals bloedgroepantigenen nog een andere eigenschap die in structuren wordt gezocht en mogelijk wordt uitgekozen voor het typen van een glycaan. Uiteindelijk kan het relevant zijn om te zoeken naar gemeenschappelijke of onderscheidende kenmerken van een glycoom dat tot expressie komt in een specifiek weefsel of geselecteerde soort. In die zin moet de verzamelde informatie worden gebruikt als een bron van nieuwe aannames in plaats van unieke feiten.

GlyConnect Compozitor als hulpmiddel voor het vormgeven van een glycan compositieset
Bladeren door structurele informatie zoals beschreven in een eiwitpagina heeft beperkingen omdat lijsten de neiging hebben om de relaties tussen gespecificeerde structuren en die tussen composities te verdoezelen. GlyConnect Octopus verzorgt de eerste en GlyConnect Compozitor de laatste. Een zorgvuldige blik op structuren die in de meeste GlyConnect-vermeldingen worden vermeld, onthult het bestaan van gemeenschappelijke substructuren. Toch is deze informatie niet gemakkelijk visueel te begrijpen zonder de hulp van een toegewijde kijker.

De inhoud van het glycaansamenstellingsbestand ter ondersteuning van de identificatie van het glycaangedeelte als een belangrijke parameter van glycopeptide-identificatiesoftware werd vastgesteld door de resultaten van de HGI-uitdaging te analyseren. De meeste klassieke proteomics-zoekmachines bieden plaats aan de selectie van glyco-gebaseerde modificaties uit een verzameling die is afgeleid van gegevens die zijn verzameld in databases / repositories of de literatuur. Andere glycoproteomics speciale tools gebruiken de kennis van glycaan biosynthese. Op deze manier wordt het samenstellingsbestand theoretisch gedefinieerd als het resultaat van verwachte enzymatische activiteit. Uiteindelijk zijn er evenveel compositiebestanden als er zoekmachines zijn en de overlap tussen hen is zeer variabel. Niettemin blijkt uit het leren van eerdere ervaringen in proteomics, vooral wanneer rekening wordt gehouden met posttranslationele wijzigingen, dat de prestaties van zoekmachines gecorreleerd zijn met het beperken van de zoekruimte31. Soortgelijke observaties worden gedaan in glycoproteomics en GlyConnect Compozitor is ontworpen om de selectie van getrainde samenstellingsgegevens te ondersteunen, waarvan het belang eerder werd besproken32.

Het gebruik van deze tool werd onvolledig geïllustreerd in het protocol, met name met betrekking tot het tabblad Geavanceerd waarin query's kunnen worden uitgedrukt die rechtstreeks programmatische toegang tot GlyConnect starten via de API (Application Programming Interface). Het typen van taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer in het queryvenster van het tabblad Geavanceerd is bijvoorbeeld gelijk aan het invullen van de overeenkomstige velden op het tabblad Bron ( homo sapiens selecteren in Soort, Urine in Weefsel en N-gekoppeld in Glycaantype) en het tabblad Ziekte ( Homo sapiens selecteren in Soort, Prostaatkanker bij ziekte en N-gebonden bij Glycan Type). Met andere woorden, het biedt in één stap een resultaat dat meerdere selecties zou vereisen.

Ten slotte, terwijl het maken van virtuele knooppunten wordt uitgelegd in het protocol, heeft hun potentiële redundantie een extra opmerking nodig. Twee gelijktijdige opties kunnen niet van elkaar te onderscheiden zijn omdat de gesimuleerde werking van enzymen in de grafiek geen rekening houdt met de chronologie van enzymactiviteiten. Daarom suggereert Compozitor twee paden door twee virtuele knooppunten om twee niet-verbonden knooppunten te overbruggen die overeenkomen met monosaccharidetellingen met maximaal twee verschillen. Het opnemen van nieuwe data zorgt vaak voor ontbrekende schakels. De gebruiker is altijd vrij om virtuele knooppunten te overwegen of te verwijderen, door het vakje Virtuele knooppunten opnemen aan te (de)vinken.

Bekende databases en softwarebeperkingen
Over het algemeen leiden de hierboven beschreven protocollen, zoals bij elke navigatie op het web, af en toe tot een niet-bestaande pagina, vaak als gevolg van een update van een site of een conflict van updates tussen twee sites. In dit geval en in feite alle gevallen waarin de navigatie niet stroomt, is het het gemakkelijkst om een bericht te sturen naar de Expasy-helpdesk waarvan de efficiëntie aanzienlijk heeft bijgedragen aan het succes van het portaal in de afgelopen 28 jaar.

De inhoud van GlyConnect is bevooroordeeld als een weerspiegeling van de huidige onevenwichtigheid in de literatuur. De meeste publicaties melden N-glycosylatie bij zoogdieren en de database is rijker aan menselijke N-glycoproteïnen. Toch is ons in het verleden gevraagd om minder gangbare datasets op te nemen en volledig open te blijven staan voor het ontvangen van advies en suggesties.

Bovendien is Compozitor momenteel beperkt tot het vergelijken van drie samenstellingsdatasets. Een grote herziening van de Determinant subtab in de Octopus is gepland. Bronnen van Glyco@Expasy regelmatig moeten worden bijgewerkt en sommige kunnen te zijner tijd niet worden uitgevoerd; niettemin worden waarschuwingen en/of aankondigingen gepubliceerd wanneer dit gebeurt.

Partnerportals, bekend als GlyGen (https://www.glygen.org) en GlyCosmos (https://www.glycosmos.org), bieden verschillende opties en tools. Uiteindelijk brengt het bladeren en zoeken naar informatie over een van de opties een hoge mate van subjectiviteit met zich mee en hangt het grotendeels af van de gewoonten en zorgen van gebruikers. We kunnen alleen maar hopen dat onze oplossing past bij een deel van de gemeenschap.

De input van glycoscience groeit in life science-projecten en studies die de rol van glycanen bij gezondheidsproblemen vaststellen, worden voortdurend geproduceerd. De recente focus op Sars-Cov-2 onthulde opnieuw het belang van geglycosyleerde eiwitten, vooral in structurele benaderingen33. Glycoinformatica ondersteunt glycowetenschappers bij dagelijkse taken van data-analyse en interpretatie.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs verklaren geen belangenconflicten te hebben.

Acknowledgments

De auteur erkent van harte vroegere en huidige leden van de Proteome Informatics Group die betrokken zijn bij het ontwikkelen van de middelen die in deze tutorial worden gebruikt, met name Julien Mariethoz en Catherine Hayes voor GlyConnect, François Bonnardel voor UniLectin, Davide Alocci en Frederic Nikitin voor de Octopus, en Thibault Robin voor Compozitor en de laatste hand aan Octopus.

De ontwikkeling van het glyco@Expasy project wordt ondersteund door de Zwitserse federale overheid via het staatssecretariaat voor onderwijs, onderzoek en innovatie (SERI) en wordt momenteel aangevuld door de Zwitserse National Science Foundation (SNSF: 31003A_179249). ExPASy wordt onderhouden door het Zwitserse Instituut voor Bioinformatica en gehost in het Vital-IT Competency Center. De auteur erkent ook Anne Imberty voor de uitstekende samenwerking op het UniLectin-platform, gezamenlijk ondersteund door ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologie Nummer 179
Bioinformatica Bronnen voor de Studie van Glycan-Gemedieerde Eiwit Interacties
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter