Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Bioinformatikk ressurser for studiet av Glycan-mediert protein interaksjoner

Published: January 20, 2022 doi: 10.3791/63356

Summary

Denne protokollen illustrerer hvordan man utforsker, sammenligner og tolker humant protein glykom med online ressurser.

Abstract

Det Glyco@Expasy initiativet ble lansert som en samling av gjensidig avhengige databaser og verktøy som spenner over flere aspekter av kunnskap innen glykobiologi. Spesielt tar den sikte på å markere interaksjoner mellom glykoproteiner (som celleoverflatereseptorer) og karbohydratbindende proteiner mediert av glykaner. Her introduseres store ressurser av samlingen gjennom to illustrerende eksempler sentrert på N-glycome av human Prostata Specific Antigen (PSA) og O-glycome av humane serumproteiner. Gjennom ulike databasespørringer og ved hjelp av visualiseringsverktøy viser denne artikkelen hvordan du utforsker og sammenligner innhold i et kontinuum for å samle og korrelere ellers spredte informasjonsdeler. Innsamlede data er bestemt til å mate mer forseggjorte scenarier av glykanfunksjon. Glykoinformatikk introdusert her foreslås derfor som et middel til enten å styrke, forme eller motbevise antagelser om spesifisiteten til et protein glykom i en gitt sammenheng.

Introduction

Glykaner, proteiner som de er festet til (glykoproteiner) og proteiner som de binder (lectins eller karbohydratbindende proteiner) er de viktigste molekylære aktørene på celleoverflaten1. Til tross for denne sentrale rollen i cellecellekommunikasjon, er det fortsatt lite studier i stor skala, inkludert glykom, glykoproteomikk eller glykan-interaktivitetsdata sammenlignet med motparten i genomikk og proteomikk.

Inntil nylig hadde metoder for å karakterisere forgreningsstrukturene til komplekse karbohydrater mens de fortsatt ble konjugert til bærerproteinet ikke blitt utviklet. Biosyntesen av glykoproteiner er en ikke-maldrevet prosess der monosakkariddonorene, de aksepterende glykoproteinunderlagene og glykosyltransferaser og glykosidaser spiller en interaktiv rolle. De resulterende glykoproteinene kan bære komplekse strukturer med flere forgreningspunkter der hver monosakkaridkomponent kan være en av flere typer som er tilstede i naturen1. Den ikke-maldrevne prosessen pålegger biokjemisk analyse som det eneste alternativet for å generere oligosakkaridstrukturelle data. Den analytiske prosessen med glykanstrukturer knyttet til et innfødt protein er ofte utfordrende, da det krever sensitiv, kvantitativ og robust teknologi for å bestemme monosakkaridsammensetning, koblinger og forgreningssekvenser2.

I denne sammenhengen er massespektrometri (MS) den mest brukte teknikken i glykomikk- og glykoproteomikkeksperimenter. Etter hvert som tiden går, utføres disse i høyere gjennomstrømningsinnstillinger, og data akkumuleres nå i databaser. Glykanstrukturer i ulike formater3 fyller GlyTouCan4, det universelle glykandatalageret der hver struktur er knyttet til en stabil identifikator uavhengig av presisjonsnivået som glykanen er definert med (f.eks. muligens manglende koblingstype eller tvetydig sammensetning). Svært like strukturer samles inn, men deres mindre forskjeller rapporteres tydelig. Glykoproteiner er beskrevet og kuratert i GlyConnect5 og GlyGen6, to databaser kryssrefererer hverandre. MS-data som støtter strukturelle bevis, lagres i økende grad i GlycoPOST7. For en bredere dekning av nettressurser er kapittel 52 i referansehåndboken, Essentials of Glycobiology, dedikert til glykoinformatikk8. Interessant nok har glykopeptididentifikasjonsprogramvare spredt seg de siste årene9,10, men ikke til fordel for reproduserbarhet. Sistnevnte bekymring fikk lederne for HUPO GlycoProteomics Initiative (HGI) til å sette en programvareutfordring i 2019. MS-dataene hentet fra behandling av komplekse blandinger av N- og O-glykosylerte humane serumproteiner i CID-, ETD- og EThcD-fragmenteringsmodus, ble gjort tilgjengelig for konkurrenter enten det var programvarebrukere eller utviklere. Den fullstendige rapporten om resultatene av denne utfordringen11 er bare skissert her. Til å begynne med ble det observert en spredning av identifikasjoner. Det ble hovedsakelig tolket som forårsaket av mangfoldet av metoder implementert i søkemotorer, av deres innstillinger, og hvordan utganger ble filtrert, og peptid "telt". Den eksperimentelle designen kan også ha satt litt programvare og tilnærminger til en (dis)fordel. Det er viktig at deltakere som bruker samme programvare rapporterte inkonsekvente resultater, og fremhevet dermed alvorlige reproduserbarhetsproblemer. Det ble konkludert med å sammenligne forskjellige innleveringer som noen programvareløsninger presterer bedre enn andre, og noen søkestrategier gir bedre resultater. Denne tilbakemeldingen vil sannsynligvis lede forbedringen av automatiserte glykopeptiddataanalysemetoder og vil igjen påvirke databaseinnholdet.

Utvidelsen av glykoinformatikk førte til at det ble opprettet nettportaler som gir informasjon og tilgang til flere lignende eller komplementerende ressurser. Den nyeste og oppdaterte er beskrevet i et kapittel i Den omfattende Glykoscience-bokserien12, og gjennom samarbeid tilbys en løsning på datadeling og informasjonsutveksling i åpen tilgangsmodus. En slik portal ble utviklet som opprinnelig ble kalt Glycomics@ExPASy 13 og omdøpt Glyco@Expasy, etter den store overhalingen av Expasy-plattformen14 som har vært vert for en stor samling verktøy og databaser som brukes på tvers av flere -omics i flere tiår, det mest populære elementet er UniProt15-den universelle proteinkunnskapsbasen. Glyco@Expasy tilbyr en didaktisk oppdagelse av formålet med og bruken av databaser og verktøy, basert på en visuell kategorisering og en visning av deres gjensidige avhengigheter. Følgende protokoll illustrerer prosedyrer for å utforske glykomikk- og glykoproteomikkdata med et utvalg ressurser fra denne portalen som gjør forbindelsen mellom glykoproteomikk og glykan-interaktivitet eksplisitt via glycomics. Som det er, produserer glycomics eksperimenter strukturer der monosakkarider er fullt definert og koblinger delvis eller helt bestemt, men deres proteinstedsfeste er dårlig, om i det hele tatt, karakterisert. I motsetning genererer glykoproteomics eksperimenter nøyaktig festeinformasjon for nettstedet, men med en dårlig oppløsning av glykanstrukturer, ofte begrenset til monosakkaridsammensetninger. Denne informasjonen er delt inn i GlyConnect-databasen. Videre kan søkeverktøy i GlyConnect brukes til å oppdage potensielle glykanliginer som er beskrevet sammen med proteinene som gjenkjenner dem i UniLectin16, knyttet til GlyConnect via glykaner. Protokollen som presenteres her er delt inn i to seksjoner for å dekke spørsmål som er spesifikke for N-koblede og O-koblede glykaner og glykoproteiner.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

MERK: En enhet med en Internett-tilkobling (større skjerm foretrukket) og en oppdatert nettleser som Chrome eller Firefox er nødvendig. Å bruke Safari eller Edge er kanskje ikke like pålitelig.

1. Fra et protein N-glycome i GlyConnect til en lectin av UniLectin

  1. Få tilgang til ressurser fra Glyco@Expasy
    MERK: Prosedyren som er beskrevet her, er å få tilgang til GlyConnect, men kan brukes til å få tilgang til alle ressurser som er registrert på plattformen.
    1. Gå til https://glycoproteome.expasy.org/glycomics-expasy og vurder boblediagrammet til høyre som viser forskjellige kategorier som Glykokonjugates eller Glycan Binding. I menyen lengst til venstre som gjenspeiler kategoriene i boblene, merker du av for Glykoproteiner slik at boblediagrammet til høyre umiddelbart zoomer inn boblen som samsvarer med den kategorien.
      MERK: Grønne bobler er verktøy og gule bobler er databaser. Ved å klikke på en av dem zoomer du inn igjen for å gi detaljer om ressursen. Før du gjør dette, vil brukeren kanskje forstå avhengighetene til ressursen til andre.
    2. Hvis du vil ha informasjon om avhengigheter, går du fra kategorien Ressurstematisk klassifisering til kategorien Ressursavhengighetshjul . Plasser musen på GlyConnect i hjulet for å kontrollere integrasjonsnivået med andre kilder (figur 1).
    3. Gå tilbake til kategorien Ressurstematisk klassifisering for å nå GlyConnect-boblen som i trinn 1.1.1 og klikk på den (Tilleggsfigur 1) for å vise GlyConnect-hjemmesiden i en ny fane som viser statistikken over innholdet i den nyeste versjonen av databasen.
      MERK: Et fargevalg som er beskrevet i tabell 1 , samsvarer med de ulike typene informasjon som er lagret i databasen. Denne fargekoden er gyldig på alle enhetssider i GlyConnect og er konsekvent overalt. Hjemmesiden viser også fire seksjoner dedikert til fokuserte datasett som de som beskriver glykosylering av Sars-Cov-2 piggprotein (COVID-19) eller omfattende detaljering av morsmelk oligosakkarider (HMO). Disse vil ikke bli utforsket i denne protokollen.
  2. Utforske kontekstuell informasjon om et protein N-glycome
    MERK: Alle glykanstrukturer i GlyConnect vises i tre alternative og ofte brukte formater: (1) Symbol Nomenklatur For Glykaner (SNFG)17 (2) IUPAC-kondensert18, og (3) Oxford19. I motsetning er det ingen standard notasjon for å uttrykke glykansk sammensetning. I GlyConnect brukes følgende kode: Hex for heksose, HexNAc for N-Acetylhexosamin, dHex for fucose og NeuAc for sialsyrer. For enkelhets skyld er visualiseringsverktøy avhengig av en kondensert notasjon: H for heksose, N for N-Acetylhexosamin, F for fucose og S for sialsyrer. I tillegg betegner små bokstaver modifikasjoner som "a" for acetylering, "p" for fosforylering og "s" for sulfatasjon, for de hyppigste av disse såkalte substituentene.
    1. For å se og utforske N-glycome av human Prostate Specific Antigen (PSA), fra GlyConnect-hjemmesiden, fortsett som følger.
      MERK: Glykosylering av human PSA har blitt studert gjennom årene, spesielt i sammenheng med prostatakreft. GlyConnect-databasen lagrer tre referanser20,21,22, som kombinerer glykomikk- og glykoproteomikkdata. Vær oppmerksom på at resultatene som ble gitt her, ble oppnådd med september 2021-versjonen av GlyConnect. Ulterior bruk av databasen kan gi litt annen statistikk på grunn av hyppige dataoppdateringer.
    2. Velg PROTEIN-knappen for å åpne proteinvisningen av databasen. På proteinvisningssiden skriver du inn prostata i søkevinduet. Se etter de to oppføringene som er oppført i utdataene som skiller to isoformer av PSA med distinkte pI-verdier. Klikk på 790 (Id-kolonne) som tilsvarer den vanlige isoformen til PSA.
      MERK: Se etter den øverste flerfargede linjen som viser sammendragsinformasjon hentet fra det publiserte arbeidet i skjemaet som er beskrevet ovenfor. Flere alternativer for navigasjon er mulig som beskrevet nedenfor.
    3. På den øverste flerfargede linjen klikker du på SOURCE-knappen i grønt for å vise prøvetypene som de publiserte dataene ble behandlet fra: Urin og sædvæske. Hvis du vil bla gjennom denne informasjonen ytterligere, klikker du en av disse eksempeltypene. Det samme gjelder for alle elementer som vises når du klikker på en farget knapp.
    4. For å sjekke det helserelaterte innholdet i databasen, klikk på SYKDOM-knappen , som inneholder to elementer, hvorav den ene er Prostatakreft som lenker til den tilsvarende dedikerte sykdomssiden i GlyConnect. Oppsummeringen for den siden viser at tre store studier har rapportert 319 komposisjoner på 1087 steder som finnes i 308 humane proteiner.
    5. Klikk på STRUCTURE-knappen for å se hele listen over 135 strukturer knyttet til PSA fra glycomics-data. Klikk på KOMPOSISJON-knappen for de tilknyttede 78 komposisjonene bestemt av glykoproteomics eksperimenter. Klikk på en hvilken som helst struktur eller sammensetning for å få flere detaljer.
      MERK: Detaljer som listen over alternative proteiner som bærer den spesielle strukturen eller listen over strukturer som samsvarer med sammensetningen, kan oppnås. PSA er kjent for å ha bare ett N-glykosyleringssted på Asn-69 (bare ett element telt for den brune SITE-knappen ).
    6. For å redusere tvetydigheten i komposisjoner, klikk på FORESLÅTT STRUCT under en valgt sammensetning (for eksempel Hex:6 HexNAc:3 NeuAc:1). Et forslag gjøres hver gang monosakkaridtallet sammenfaller med et struktur som er oppført ovenfor (figur 2).
      MERK: Hex:6 HexNAc:3 NeuAc:1-sammensetningen som genereres av et glykoproteomics-eksperiment, samsvarer med fire strukturer med høyere oppløsning fra glycomics-dataene. Når det gjelder PSA, er det ingen tvetydighet å løse siden bare Asn-69 er glykosylert.
    7. Hvis du vil utforske proteinsiden fullt ut, kan du se flere detaljer på høyre side av siden (figur 3).
      1. Vis standard 3QUM PDB-oppføring (Protein Data Bank23) for PSA som vises med to komplekse glykaner festet til hver monomer (figur 3) eller den alternative 2ZCK-oppføringen , som også er tilgjengelig på grunn av et vedlagt karbohydrat. Den andre oppføringen viser en enkelt kjede.
        MERK: Begge oppføringene visualiseres med 3D LiteMol plugin24 som viser glykaner i SNFG-3D-notasjon vedtatt i PDB-RCSB.
      2. Klikk på de tilsvarende koblingene til andre kryssreferanser for å utforske relevant funksjonell informasjon fra store proteomikkdatabaser, for eksempel UniProt (figur 3).
  3. Visualisere og korrelere kontekstuell informasjon om et protein N-glycome
    MERK: Som vist i forrige avsnitt, kan lange lister med strukturer eller komposisjoner være vanskelig å forstå som helhet, og GlyConnect er avhengig av to forskjellige verktøy for å visualisere nøkkelinformasjon, nemlig GlyConnect Octopus og GlyConnect Compozitor (den første utvider sammendragsinformasjonen som er fanget i fargede knapper, og den andre får frem strukturelle avhengigheter når det gjelder en struktur / sammensetning som finnes i en annen). Som illustrert nedenfor utforsker GlyConnect Octopus assosiasjoner mellom de ulike enhetene som er lagret i databasen, ved å fremheve flere eller enkle tilkoblinger som en refleksjon av databaseinnholdet.
    1. Utfør et GlyConnect Octopus-søk for å bekrefte tilstedeværelsen av vanlige strukturelle egenskaper som hybridkjernestrukturer og svært hyppige sialsyreholdige strukturer i mangfoldet av glykaner festet til PSA, som beskrevet nedenfor.
    2. Gå til Octopus hjemmeside https://glyconnect.expasy.org/octopus/. La den N-koblede kategorien være valgt som standard. Gå til Cores-underfanen og klikk på Hybrid-ikonet . Gå til underfanen Egenskaper , og klikk Sialylated-ikonet . Klikk på den grønne Søke-knappen nedenfor.
      MERK: Søkeresultatene vises grafisk som relasjoner mellom tre elementkategorier. Som standard samsvarer den midterste listen med spørringen for komposisjoner, den venstre samlingen spenner over relaterte proteiner, og den høyre strekker seg over relaterte glykaner.
    3. I den viste grafen over relasjoner, hold markøren over H6N4F1S1 for å markere koblinger til seks proteiner og tre strukturer. I motsetning til dette ved å sveve over H6N4F2S1 som skiller ut de to isoformene til PSA (begge referert til som UniProt ID: KLK3_HUMAN) og en struktur (ID: 10996). Hold markøren over struktur-ID-en for å vise SNFG-representasjonen og klikk på den for å åpne den tilsvarende siden (Tilleggsfigur 2).
    4. Endre nodene i Blekksprut til et hvilket som helst annet emne som beskriver konteksten for glykosylering. Fargekoden forblir den samme som den som er beskrevet tidligere (se tabell 1).
      1. Endre senternodene til Vev for å vise 15 alternativer midt i diagrammet, hvorav mange er kroppsvæsker. Se etter alle assosiasjonene mellom proteiner og glykaner som samsvarer med spørringen, avhengig av vevsinformasjon. Plasser markøren på urin eller sædvæske midt i diagrammet for å vise forskjellige assosiasjoner (figur 4A,B).
      2. Endre senternodene til sykdom for å vise 13 alternativer, hvorav den ene er prostatakreft. Det eneste proteinet som er forbundet er PSA (KLK3_HUMAN) (Supplerende figur 3).
        MERK: En nærmere titt på PSA N-glycome vist på proteinsiden skiller ut den svært høye frekvensen til en terminal NeuAc(a?-?) Gal(b?-?) GlcNAc understruktur i mange tilfeller på strukturer med to eller tre antenner. En annen blekksprut kan genereres på det grunnlaget som beskrevet nedenfor.
    5. Klikk på Fjern-knappen for å oppdatere søket. Gå til underfanen Egenskaper og klikk på Bi-antenner-ikonet . Gå til underfanen Determinants og klikk på ikonet 3-Sialyl-LN (type 2). Klikk på den grønne Søke-knappen nedenfor.
    6. Kontroller octopus-hentet assosiasjoner med bi-antenner glykaner som inneholder en terminal 3-Sialyl-LN (type 2) motiv, dvs. Endre senternodene til vev for enklere lesing og hold markøren over KLK3_HUMAN for å koble sædvæske direkte til Ptils vanlige isoform og syv strukturer (tilleggs figur 4).
      MERK: Det andre visualiseringsverktøyet, GlyConnect Compozitor, utfører skanningen av potensielle relasjoner mellom hver eneste komposisjon i en liste derav (se nedenfor). En relasjon er definert som forskjellig fra bare ett monosakkarid mellom to komposisjoner. Disse identifiserte relasjonene som er tegnet inn i en graf, viser (dis)kontinuiteten til en glycome.
    7. Bruk GlyConnect Compozitor til å utføre skanningen av potensielle relasjoner mellom hver eneste komposisjon i en liste derav, som vist nedenfor for PSA-tilfellet.
      MERK: GlyConnect Compozitor behandler komposisjoner i forbindelse med en kontekst. Den tilbyr distinkte kategorier for spørring av GlyConnect, for eksempel proteiner, kilder, cellelinjer, sykdommer som er selvforklarende for å kvalifisere en kontekst. Dette er illustrert her med Ptil som følger.
    8. Gå tilbake til proteinsiden til PSA: https://glyconnect.expasy.org/browser/proteins/790. På høyre side av PSA-oppføringssiden klikker du på Compozitor-lenken. Forsikre deg om at Compozitor-søkefeltene er forhåndsutfylt med detaljene for Id 790-oppføringen i Protein-fanen (Protein: Prostata-spesifikt Antigen, Arter: Homo sapiens og Glycan Type: N-koblet).
    9. Klikk knappen Legg til i merket område for å hente data fra databasen og vise diagrammet over tilkoblede komposisjoner. Fjern merket for Inkluder virtuelle noder . Klikk på Beregn graf-knappen for å vise en graf som viser et godt tilkoblet sett med 78 komposisjoner som representerer PSA N-glycome, og en stolpeplott som viser hovedegenskapene til glykanene.
    10. Hold pekeren over den lilla linjen i stolpeplottet, som finner alle sialylerte strukturer i grafen for å avdekke en observerbar skjevhet mot sialylerte strukturer.
    11. Forbli i hovedproteinfanen og velg Prostata-spesifikt antigen - høy Pi isoform (psah) i Protein (navn) -feltet.
      MERK: Feltene Glykantype og Glykansk område fylles ut automatisk.
    12. Klikk knappen Legg til i merket område for å hente data fra databasen som utgjør 57 komposisjoner. Klikk på Beregn graf-knappen for å generere de overliggende grafene til begge isoformene og vurdere forskjellene i glykom av de to PSA-isoformene. Hold pekeren over nodeetiketter for å be om visning av antall strukturer som tilsvarer komposisjonene/etikettene (figur 5).
  4. Glycan-bindende informasjon i UniLectin
    MERK: Husk determinanten som ble testet i Blekksprut, beskrevet som NeuAc(a2-3)Gal(b1-4). Per definisjon er det en etablert bindende del av en glykanstruktur, og som sådan kan det søkes i UniLectin3D-databasen25.
    1. Gå til https://www.unilectin.eu/ og klikk på UniLectin3D-knappen . Alternativt kan du gå direkte til siden: https://www.unilectin.eu/unilectin3D/.Click på Glycan Search-knappen for å åpne denne siden: https://www.unilectin.eu/unilectin3D/glycan_search (Tilleggsfigur 6).
    2. Klikk på den lilla diamanten som representerer en sialsyre, som ber om visning av alle glykanbindende motiver som slutter med en sialsyre lagret i databasen. Den øverste delen av denne samlingen av motiver inneholder NeuAc(a2-3)Gal(b1-4)GlcNAc motiv undersøkt tidligere (Tilleggs figur 7).
    3. Klikk på NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet for å be om visning av alle lectins som en 3D-struktur bekrefter samspillet med NeuAc (a2-3)Gal(b1-4)GlcNAc er kjent for. Resultatet viser som standard lectins i alle arter. Bruk alternativet Søk etter felt til å begrense visningen til menneskesentrisk informasjon.
    4. Klikk på alternativet Søk etter felt . I artsfeltet skriver du inn Homo sapiens. Klikk på Utforsk røntgenstrukturer-knappen for å filtrere ut den opprinnelige listen. Bare én oppføring gjenstår, det vil si den menneskelige galectin-8. Klikk på Vis 3D-struktur og informasjon-knappen øverst til høyre i det oppførte elementet for å vise detaljert informasjon om menneskelig galectin-8 som samhandler med NeuAc (a2-3)Gal(b1-4)GlcNAc.
    5. Få tilgang til den strukturelle informasjonen om menneskelig galectin-8 som vises på siden med to forskjellige seere.
      1. Hold musen for å snu molekylet rundt og bringe liganden i forgrunnen med Litemol software26 integrert for å vise lectin 3D-strukturen. Hold musepekeren over en av de oppførte interaksjonene til venstre for å oppdatere visningen til høyre og finne ut hvor den aktuelle interaksjonen virker i strukturen med PLIP-programvaren27 integrert for å detaljere atominteraksjoner mellom lectin og liganden (figur 6).
    6. Klikk på en grønn knapp som lenker til de tilsvarende oppføringene i UniProt, PDB (europeiske eller amerikanske nettsteder), og GlyConnect for å utforske disse kryssreferansene.

2. Utforske og sammenligne O-glycomes i GlyConnect

  1. Bla gjennom HGI-utfordringen datasett med høy tillit
    MERK: HGI-datasettet som er nevnt i introduksjonen, lagres i GlyConnect-databasen. Den inneholder 163 N- og 23 O-glykopeptider funnet i 37 glykoproteiner betraktet som en høy tillitsliste. GlyConnect Compozitor28 er nøkkelen til å vurdere glycome datakonsistens. Det er viktig at Compozitor tillater virtuelle noder (vist i grått) når bare ett mellomliggende trinn er nødvendig for å koble sammen de isolerte nodene. På den måten strammer virtuelle noder grafen og kan tolkes som strukturer som potensielt kan gå glipp av i de eksperimentelle resultatene.
    1. Bla gjennom HGI-datasettet fra GlyConnect-hjemmesiden ved å gå direkte til referansesiden i artikkelen: https://glyconnect.expasy.org/browser/references/2943.
      MERK: Sammendraget i de fargede knappene gjenspeiler delvis tallene i artikkelen. Likevel, hvis bare 69 unike peptider er oppført, gjenspeiler dette flere assosiasjoner mellom peptider og steder eller strukturer. I artikkelen er et glykopeptid definert som en unik kombinasjon av et peptid og en sammensetning. I GlyConnect vurderes glykositter først, og de beskrives som en kombinasjon av et peptid med strukturer. Dette forklarer avviket i tall mellom GlyConnect og sitatet ovenfor.
    2. Kontroller den høye frekvensen av forekomst av N-koblede komposisjoner, for eksempel Hex:5 HexNAc:4 NeuAc:2, identifisert på 42 steder i 43 peptider i motsetning til den hyppige unikheten til de fleste O-koblede komposisjoner identifisert på 1 sted i 1 peptid.
    3. Klikk på Compozitor-koblingen til høyre på referanseoppføringssiden for å vurdere konsekvensen i datasettet. Kontroller at Compozitor-verktøyet behandler DOI-en til referansen direkte og fyller søkefeltet med referanse=10.1101/2021.03.14.435332 i kategorien Avansert på verktøyet. Skriv inn &glycan_type=O-koblet etter DOI-nummeret for å begrense søket til O-koblede glykaner, slik at spørringen blir: reference=10.1101/2021.03.14.435332&glycan_
      type=O-koblet
    4. Klikk knappen Legg til i merket område for å hente data fra databasen (det er 20 O-koblede komposisjoner). La alternativet Inkluder virtuelle noder være valgt. Klikk på Beregn graf-knappen for å vise grafen over tilkoblede komposisjoner. Dette resultatet fremhever flere hull i forventet kontinuitet i glykan biosyntesen med ni virtuelle noder som kreves for å fullføre grafen (figur 7).
  2. Sammenligning med O-glycome av et utvalgt serumprotein i GlyConnect
    MERK: For å vurdere om hullene kan fylles av data som er lagret i GlyConnect, ble ett O-glykosylert protein ut av de 37 som er oppført med referansen valgt. I datasettet rapporteres Inter-alpha-trypsinhemmer tungt kjede H4 (Q14624) å være en O-glykosylert på Thr-725.
    1. Gå til Protein-fanen i GlyConnect Compozitor (se trinn 2.1.3). Velg Inter-alfa-trypsinhemmer tungt kjede H4 fra Protein-listen. Kontroller at artsvalget er Homo sapiens som standard. Fjern merket for N-koblet i Glykan-typen. Velg bare Thr-725 i Område-listen ved først å klikke minustegnet til venstre for Nettstedet for å fjerne merkingen av alle områdene, og velg deretter bare Thr-725 fra listen.
    2. Klikk på Legg til i utvalg-knappen (vær oppmerksom på at seks komposisjoner er knyttet til Thr-725). Klikk på Beregn graf-knappen for å vise grafen over tilkoblede komposisjoner (tilleggs figur 8).
    3. Vær oppmerksom på grafen som vises, som viser de 17 unike komposisjonene av de 20 O-koblede komposisjonene i artikkeldatasettet i blått og de tre unike av seks i databasen i rødt. Overlappingen mellom de to kildene finnes med andre ord i tre komposisjoner som er representert i magenta. Vær oppmerksom på at en 45° rotasjon av grafen genereres automatisk.
      MERK: Antall virtuelle noder reduseres med én. Som det viser seg, mangler H2N2S1 i de 20 O-koblede sammensetningene av artikkeldatasettet og representert som en virtuell node er nå fylt med en ekstra sammensetning forbundet med Thr-725 av Inter-alpha-trypsinhemmer tung kjede H4 i databasen. Dette forenkler topologien i grafen fordi to andre virtuelle noder gjøres ubrukelige siden de var alternative alternativer for å fylle gapet mellom H1N2S1 og H2N2S2. Likevel vil en annen sammensetning importert fra databasen isoleres hvis ikke for opprettelsen av to nye alternative virtuelle noder H2N2F1S1 og H1N2F2S1.
    4. For å forstå de virtuelle nodene må du kontrollere om de tilsvarende komposisjonene finnes i GlyConnect. For å gjøre dette, klikk på Eksporter-knappen under grafen. Velg Bare virtuell ved å oppheve merkingen av alle andre alternativer. Klikk på utklippstavleikonet for å kopiere utvalget av 8 komposisjoner.
    5. Lim inn det merkede området i spørringsvinduet i kategorien Egendefinert i Compozitor. Velg O-koblet i feltet Glykansk type . Sett utvalgsetiketten i Komposisjoner-feltet til for eksempel VN for å gi navn til listen over 8 komposisjoner. Klikk knappen Legg til i merket område , og klikk deretter Beregn diagram . Alle virtuelle noder vises nå som grønne noder (figur 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Den første delen av protokollen (avsnitt 1) viste hvordan man undersøker spesifisiteten eller fellesiteten til N-glykaner festet på Asn-69 av det humane Prostata-spesifikke antigenet (PSA) ved hjelp av GlyConnect-plattformen. Vevsavhengige (urin- og sædvæske), samt isoformavhengige (normale og høye pI) variasjoner i glykanuttrykk, ble vektlagt ved hjelp av to visualiseringsverktøy (figur 4 og figur 5).

For det første ga GlyConnect Octopus, som viser assosiasjoner mellom enheter som er lagret i databasen, muligheten til å utforske kontekstuell informasjon via (1) velge forskjellige enheter som skal vises i Blekksprut og (2) klikke på lenker for å undersøke relaterte oppføringer. Utfallet var særegne assosiasjoner avhengig av vevet.

For det andre ble GlyConnect Compozitor, opprinnelig designet for å definere / finjustere en komposisjonsfil for glykopeptididentifikasjon, brukt til å vurdere glykanuttrykk i to kjente PSA-isoformer (normal og høy pI). Sammenligningen av hver isoform glycomes produserte en godt forbundet graf som synger ut fire noder (komposisjoner), hvorav to er karakteristiske for den høye pI-isoformen. Selv om glycome-overlappingen er betydelig, viste det glykanske egenskapsstolpediagrammet en dråpe sialylering fra felles til høy pI-isoform (supplerende figur 5).

Videre skiller utforskningen av UniLectin3D ut galectin-8 som en mulig leser av PSA glycome siden sistnevnte inneholder mange strukturer med en NeuAc (a2-3)Gal(b1-4)GlcNAc terminal epitop. Dette gir et spor å følge og kan ikke betraktes som endelige bevis. Ikke desto mindre er PSA og galectins kjent for å spille en viktig rolle i prostatakreft29 , og galectin-8s spesifikke rolle ble nylig fremhevet30. Den første delen av protokollen korrelerer strukturelle (glykoproteomika) og funksjonelle (bindende) data for å etablere et sannsynlig scenario for proteinproteininteraksjoner mediert av glykaner.

I den andre delen av protokollen (avsnitt 2) ble et høykvalitets sett med O-glykansammensetninger assosiert med et bestemt vev (humant serum) undersøkt og sammenlignet med GlyConnect-databaseinnholdet, og tilbyr dermed muligheten til å tilpasse en glykansk komposisjonsfil for raffinert identifisering av glykopeptider (figur 7 og figur 8 ). Det kan stole på det minimale settet med 20 komposisjoner som er tilgjengelige fra ett datasett (HGI-utfordringsresultater) eller forbedres med 23 til 26 elementer som er rasjonelt samlet inn i GlyConnect for å styrke konsistensen i settet.

rød lys oransje grønn lyseblå lilla rosa mørkeblå brun mørk oransje
art protein vevskilde struktur komposisjon sykdom referanse glykositt Peptid

Tabell 1: Fargevalg tilknyttet hver enhet i GlyConnect-databasen og gyldig hele veien.

Figure 1
Figur 1: Avhengighetshjulet til Glyco@Expasy instansiert for GlyConnect. Klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Foreslått glykanstruktur for en valgt glykansk sammensetning. Foreslått glykanstruktur fra et glykomisk eksperiment for en glykansk sammensetning av et glykoproteomisk eksperiment rettet mot det samme glykoproteinet, her humant Prostata-spesifikt antigen (PSA), som foreslått på GlyConnect-siden for PSA (ID: 790). Klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: Side høyre meny på GlyConnect-siden for PSA. Klikkbare kryssreferanser til andre store databaser og vis med LiteMol glykan plugin av eksisterende 3D-struktur i PDB. Klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Utgangen avGlyConnect Blekksprut som viser vevsavhengige assosiasjoner mellom proteiner og glykaner. Spørringen Hybrid AND Sialylated har returnert alle komposisjoner som samsvarer med disse kriteriene, og hver sammensetning kobler sammen tilknyttet informasjon om proteiner og glykaner som registrert i databasen. Legg merke til at som standard er Arter satt til Homo sapiens, men dette alternativet kan endres. Her viser GlyConnect Octopus alle menneskelige proteiner (venstre noder) som bærer hybride og sialylerte glykanstrukturer (høyre noder) med vevene de uttrykkes i (midtnoder). (A) Assosiasjonene til urin er fremhevet som viser to proteiner: choriogonadotropin (GLHA_HUMAN) og PSA vanlig isoform (KLK3_HUMAN) koblet til spredte (heterogene) glykanstrukturer. (B) Assosiasjonene til sædvæske fremheves som viser to proteinisoformer av PSA (KLK3_HUMAN) koblet til grupperte (lignende) glykanstrukturer. Klikk her for å se en større versjon av denne figuren.

Figure 5
Figur 5: Utgangen av GlyConnect Compozitor som viser de overliggende N-glykomene til de to isoformene til PSA. Sammensetninger i kondensert notasjonsetikett hver node. Glykanene knyttet til den vanlige isoformen er representert som blå noder og de av den høye pI-isoformen som røde noder. Overlappingen mellom glycomes vises som magenta noder. Tall i nodene representerer antall glykanstrukturer som samsvarer med den merkede sammensetningen i henhold til innholdet i GlyConnect-databasen angående PSA. Compozitor-grafen som vises, er litt modifisert fra råutgangen for å disentangle nettverket som genereres av D3.js-biblioteket. Dette er enkelt å gjøre ettersom en hvilken som helst node kan dras i nettleservinduet hvor enn en bruker ønsker, og banene kan dermed forkortes eller strekkes. Brukeren kan skrive inn en bestemt komposisjon i Zoom på-feltet øverst til høyre for å zoome inn og midtstille diagrammet på den tilsvarende noden. Klikk her for å se en større versjon av denne figuren.

Figure 6
Figur 6: Oppsummering av den menneskelige galectin-8 med NeuAc(a2-3)Gal(b1-4)GlcNAc bindingsdetaljer. Ved å klikke på den grønne Knappen Vis 3D-struktur og informasjon (angitt med en rød ellipse) åpnes en ny side der et nærbilde av restinteraksjoner vises med PLIP-applikasjonen (indikert med en rød pil). Klikk her for å se en større versjon av denne figuren.

Figure 7
Figur 7: Utgangen av GlyConnect Compozitor som viser O-glycome av det menneskelige serumets datasett med høy tillit til HGI-utfordringen. Uten virtuelle noder (se tekst) er tilkoblingen til diagrammet lav. Klikk her for å se en større versjon av denne figuren.

Figure 8
Figur 8: Utgangen av GlyConnect Compozitor som viser muligheten for å fullføre O-glycome av det menneskelige serumets datasett med høy tillit til HGI-utfordringen, ved hjelp av GlyConnect-databaseinnholdet. Tilgang til innholdet i hele GlyConnect-databasen ved hjelp av kategorien Egendefinert i Compozitor viser at komposisjoner som tilsvarer de virtuelle nodene, er tilordnet eksisterende definerte strukturer som uthevet i nodeetikettene. Nodestørrelsen representerer antall referanser som er lagret i databasen, og rapporterer den tilsvarende sammensetningen. Den numeriske etiketten for noder angir antall tilsvarende strukturer som er lagret i GlyConnect. Valgte komposisjoner ser ut til å ha null til atten mulige treff i databasen. Faktisk er disse nodene bare virtuelle som en refleksjon av innholdet i eksperimentelle datasett. Det anbefales å avgrense informasjonen i grafen for å teste realismen til disse ekstra nodene. Klikk her for å se en større versjon av denne figuren.

Supplerende figur 1: Boblediagram over Glyco@Expasy hjemmeside. Zooming i boblediagrammet til Glyco@Expasy hjemmeside for å fokusere på glykoproteinkategorien . Programvare vist i grønne bobler og databaser i gule bobler. Ved å klikke på en boble oppsummerer formålet med ressursen. Klikk her for å laste ned denne filen.

Supplerende figur 2: Blekksprut-hentede tilknytninger som samsvarer med spørringen, avhengig av sammensetningen. Standard GlyConnect Octopus-visning av humane proteiner (venstre noder) som bærer hybride og sialylerte glykanstrukturer (høyre noder) med samsvarende komposisjoner (midtnoder). Sammensetning H6N4F12S1 fremstår som unik for både PSA-isoformer (KLK3_HUMAN). Ved å klikke på den unike struktur-ID-en (10996) åpnes den tilsvarende siden med detaljer som viser at de to isoformene faktisk er de eneste proteinene som bærer akkurat denne glykanen. Klikk her for å laste ned denne filen.

Supplerende figur 3: Blekksprut-hentede assosiasjoner som samsvarer med spørringen, avhengig av sykdommen. GlyConnect Blekksprut visning av alle menneskelige proteiner (venstre noder) bærer hybrid og sialylerte glykanstrukturer (høyre noder) med sykdommene der de uttrykkes (senternoder). Assosiasjonene til prostatakreft fremheves som viser den vanlige isoformen til PSA (KLK3_HUMAN). Klikk her for å laste ned denne filen.

Supplerende figur 4: Blekksprut-hentede assosiasjoner som samsvarer med spørringen, avhengig av vevsinformasjon. GlyConnect Octopus visning av alle menneskelige proteiner (venstre noder) som bærer bi-antenner glykan strukturer, inkludert NeuAc (a1-3)Gal(b1-4)GlcNAc motiv (høyre noder) med vev der de uttrykkes (midt noder). Assosiasjonene til sædvæske fremheves og viser bare den vanlige isoformen til PSA (KLK3_HUMAN) og syv strukturer. Klikk her for å laste ned denne filen.

Supplerende figur 5: Utgangen av GlyConnect Compozitor som viser de overliggende N-glykomene til de to isoformene til PSA. Komposisjoner i kondensert notasjon merker hver node. Glykanene knyttet til den vanlige isoformen er representert som blå noder og de av den høye pI-isoformen som røde noder. Overlappingen mellom glycomes vises som magenta noder. Tall i nodene representerer antall glykanstrukturer som samsvarer med den merkede sammensetningen i henhold til innholdet i GlyConnect-databasen angående PSA. Mousing over stolpediagrammet av glykanske egenskaper viser korrespondansen mellom frekvensen og nodene som oransje bobler. Nesten alle Ptils vanlige isoformnoder er dekket. Denne frekvensen faller i den høye pI-isoformen. Klikk her for å laste ned denne filen.

Supplerende figur 6: Glykansk søkegrensesnitt i UniLectin3D. Ved å klikke på sialsyreNFG-symbolet (sirklet i rødt) starter søket etter alle ligander som inneholder NeuAc, lagret i UniLectin3D. Klikk her for å laste ned denne filen.

Supplerende figur 7: Utdrag av utdataene for søket etter alle ligander som inneholder NeuAc. NeuAc(a2-3)Gal(b1-4)GlcNAc motiv av interesse er sirklet i rødt. Klikk her for å laste ned denne filen.

Supplerende figur 8: Utgangen av GlyConnect Compozitor som viser O-glycome for HGI-datasettet som er lagt over det i GlyConnect. Utgangen av GlyConnect Compozitor som viser O-glycome av det menneskelige serumets høykonfidensdatasett av HGI-utfordringen i blått, lagt over O-glycome av ett O-glykosylert protein ut av 37 som er oppført med referansen, det vil si inter-alfa-trypsinhemmer tungt kjede H4 med tilleggsinformasjon i GlyConnect. Dette forbedrer tilkoblingen til grafen. Klikk her for å laste ned denne filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus som et verktøy for å avdekke uventede korrelasjoner
GlyConnect Octopus ble opprinnelig designet for å spørre databasen med en løs definisjon av glykaner. Faktisk rapporterer litteraturen ofte de viktigste egenskapene til glykaner i en glycome som å være fucosylated eller sialylated, laget av to eller flere antenner, etc. Videre kan glykaner om N- eller O-tilknyttede er klassifisert i kjerner, som beskrevet i referansemanualen Essentials of Glycobiology1, som også ofte siteres i publiserte artikler. Til slutt er glykan epitoper som blodgruppeantigener enda en egenskap søkt i strukturer og potensielt utpekt for å skrive en glykan. Til slutt kan det være relevant å søke etter vanlige eller distinkte egenskaper til en glykom uttrykt i et bestemt vev eller utvalgte arter. I den forstand bør den innsamlede informasjonen brukes som en kilde til nye forutsetninger i motsetning til unike fakta.

GlyConnect Compozitor som et verktøy for å forme et glykan komposisjonssett
Å bla gjennom strukturell informasjon som beskrevet på en proteinside har begrensninger fordi lister har en tendens til å skjule forholdet mellom spesifiserte strukturer så vel som de mellom komposisjoner. GlyConnect Octopus deltar på den tidligere og GlyConnect Compozitor til sistnevnte. En nøye titt på strukturer som er oppført i de fleste GlyConnect-oppføringer, avslører eksistensen av vanlige understrukturer. Likevel er denne informasjonen ikke lett å forstå visuelt uten hjelp av en dedikert seer.

Innholdet i glykan komposisjonsfilen som støtter identifisering av glykan moiety som en nøkkelparameter for glykopeptididentifikasjonsprogramvare ble etablert ved å analysere resultatene av HGI-utfordringen. De fleste klassiske proteomikksøkemotorer imøtekommer valg av glykobaserte modifikasjoner fra en samling som kommer fra data samlet inn i databaser / depoter eller litteraturen. Andre glykoproteomikk dedikerte verktøy bruker kunnskapen om glykan biosyntese. På denne måten er komposisjonsfilen teoretisk definert som et resultat av forventet enzymatisk aktivitet. Til slutt er det så mange komposisjonsfiler som det er søkemotorer, og overlappingen mellom dem er svært variabel. Likevel avslører læring fra tidligere erfaring innen proteomikk, spesielt når posttranslasjonelle modifikasjoner er gjort rede for, at ytelsen til søkemotorer er korrelert med å begrense søkeområdet31. Lignende observasjoner er gjort i glykoproteomikk og GlyConnect Compozitor ble designet for å støtte utdannet komposisjonsdatavalg, hvorav viktigheten tidligere ble diskutert32.

Bruken av dette verktøyet ble ufullstendig illustrert i protokollen, spesielt når det gjelder kategorien Avansert , der spørringer som direkte starter programmatisk tilgang til GlyConnect via API-en (Application Programming Interface), kan uttrykkes. Hvis du for eksempel skriver inn taxonomy=homo sapiens&glycanType=N-linked&tissue=urin&disease=prostate cancer i spørringsvinduet i kategorien Avansert , tilsvarer det å fylle ut de tilsvarende feltene i kategorien Kilde (velge Homo sapiens i arter, urin i vev og N-koblet i Glykansk type) og kategorien Sykdom (velge Homo sapiens i arter, Prostatakreft ved sykdom og N-koblet i Glykansk type). Det gir med andre ord i ett trinn et resultat som krever flere valg.

Til slutt, mens opprettelsen av virtuelle noder forklares i protokollen, trenger deres potensielle redundans en ekstra kommentar. To samtidige alternativer kan være uutslettelige fordi den simulerte virkningen av enzymer i grafen ikke tar hensyn til kronologien til enzymaktiviteter. Derfor foreslår Compozitor to baner gjennom to virtuelle noder for å bygge bro mellom to ikke-tilkoblede noder som tilsvarer monosakkaridantall med opptil to forskjeller. Inkluderingen av nye data inneholder ofte manglende koblinger. Brukeren står alltid fritt til å vurdere eller avvise virtuelle noder ved å (un)merke av for Inkluder virtuelle noder .

Kjente databaser og programvarebegrensninger
Totalt sett, som med alle navigasjoner på weben, fører protokollene beskrevet ovenfor av og til en ikke-eksisterende side, ofte på grunn av en oppdatering av et område eller en oppdateringskonflikt mellom to områder. I dette tilfellet og faktisk alle tilfeller der navigasjonen ikke flyter, er det enkleste å sende et notat til Expasy-brukerstøtten hvis effektivitet har bidratt betydelig til portalens suksess de siste 28 årene.

Innholdet i GlyConnect er partisk som en refleksjon av de nåværende ubalansene i litteraturen. De fleste publikasjoner rapporterer N-glykosylering hos pattedyr og databasen er rikere på humane N-glykoproteiner. Likevel har vi tidligere blitt bedt om å inkludere mindre vanlige datasett og å forbli helt åpne for å motta råd og forslag.

Dessuten er Compozitor for tiden begrenset til sammenligningen av tre komposisjonsdatasett. Det planlegges en større revisjon av underfanen Determinant i Blekksprut. Ressurser av Glyco@Expasy trenger regelmessige oppdateringer, og noen kan ikke utføres med tiden; Advarsler og/eller kunngjøringer publiseres likevel når det skjer.

Partnerportaler, kjent som GlyGen (https://www.glygen.org) og GlyCosmos (https://www.glycosmos.org), gir forskjellige alternativer og verktøy. Til syvende og sist innebærer surfing og søking av informasjon om et av alternativene et høyt nivå av subjektivitet og avhenger i stor grad av brukernes vaner og bekymringer. Vi kan bare håpe at løsningen vår passer til en del av samfunnet.

Innspillene til glykovitenskap vokser i livsvitenskapsprosjekter, og studier som etablerer glykanernes rolle i helseproblemer, produseres kontinuerlig. Det nylige fokuset på Sars-Cov-2 avslørte nok en gang viktigheten av glykosylerte proteiner, spesielt i strukturelle tilnærminger33. Glykoinformatikk støtter glykoscientister i daglige oppgaver med dataanalyse og tolkning.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne erklærer ingen interessekonflikter.

Acknowledgments

Forfatteren anerkjenner varmt tidligere og nåværende medlemmer av Proteome Informatics Group som er involvert i å utvikle ressursene som brukes i denne opplæringen, spesielt Julien Mariethoz og Catherine Hayes for GlyConnect, François Bonnardel for UniLectin, Davide Alocci og Frederic Nikitin for Blekksprut, og Thibault Robin for Compozitor og siste berøring på Octopus.

Utviklingen av glyco@Expasy-prosjektet støttes av den sveitsiske føderale regjeringen gjennom det statlige sekretariatet for utdanning, forskning og innovasjon (SERI) og suppleres for tiden av Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy vedlikeholdes av Swiss Institute of Bioinformatics og arrangeres på Vital-IT Competency Center. Forfatteren anerkjenner også Anne Imberty for fremragende samarbeid på UniLectin-plattformen i fellesskap støttet av ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologi utgave 179
Bioinformatikk ressurser for studiet av Glycan-mediert protein interaksjoner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter