Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Bioinformatikressourcer til undersøgelse af glykanmedierede proteininteraktioner

Published: January 20, 2022 doi: 10.3791/63356

Summary

Denne protokol illustrerer, hvordan man udforsker, sammenligner og fortolker humane proteinglycomer med online ressourcer.

Abstract

Det Glyco@Expasy initiativ blev lanceret som en samling af indbyrdes afhængige databaser og værktøjer, der spænder over flere aspekter af viden inden for glykobiologi. Det sigter især mod at fremhæve interaktioner mellem glycoproteiner (såsom celleoverfladereceptorer) og kulhydratbindende proteiner medieret af glycaner. Her introduceres store ressourcer i samlingen gennem to illustrative eksempler centreret om N-glycom af det humane prostataspecifikke antigen (PSA) og O-glycom af humane serumproteiner. Gennem forskellige databaseforespørgsler og ved hjælp af visualiseringsværktøjer viser denne artikel, hvordan man udforsker og sammenligner indhold i et kontinuum for at indsamle og korrelere ellers spredte informationsstykker. Indsamlede data er bestemt til at fodre mere detaljerede scenarier af glycanfunktion. Glycoinformatik, der introduceres her, foreslås derfor som et middel til enten at styrke, forme eller afvise antagelser om specificiteten af et proteinglykom i en given sammenhæng.

Introduction

Glycaner, proteiner, som de er bundet til (glycoproteiner), og proteiner, som de binder til (lektiner eller kulhydratbindende proteiner), er de vigtigste molekylære aktører på celleoverfladen1. På trods af denne centrale rolle i celle-cellekommunikation er store undersøgelser, herunder glycomics, glycoproteomics eller glycan-interactomics data, stadig knappe sammenlignet med deres modstykke i genomik og proteomik.

Indtil for nylig var der ikke udviklet metoder til at karakterisere forgreningsstrukturerne af komplekse kulhydrater, mens de stadig blev konjugeret til bærerproteinet. Biosyntesen af glycoproteiner er en ikke-skabelondrevet proces, hvor monosacchariddonorerne, de accepterende glycoproteinsubstrater og glycosyltransferaserne og glycosidaserne spiller en interaktiv rolle. De resulterende glycoproteiner kan bære komplekse strukturer med flere forgreningspunkter, hvor hver monosaccharidkomponent kan være en af de flere typer, der er til stede i naturen1. Den ikke-skabelondrevne proces pålægger biokemisk analyse som den eneste mulighed for at generere oligosaccharidstrukturelle data. Den analytiske proces med glycanstrukturer, der er knyttet til et indfødt protein, er ofte udfordrende, da det kræver følsomme, kvantitative og robuste teknologier til bestemmelse af monosaccharidsammensætning, bindinger og forgreningssekvenser2.

I denne sammenhæng er massespektrometri (MS) den mest anvendte teknik i glycomics og glycoproteomics eksperimenter. Efterhånden som tiden går, udføres disse i højere gennemløbsindstillinger, og data akkumuleres nu i databaser. Glycanstrukturer i forskellige formater3, udfylde GlyTouCan4, det universelle glycandatalager, hvor hver struktur er forbundet med en stabil identifikator, uanset hvilket præcisionsniveau glycanen er defineret med (f.eks. muligvis manglende koblingstype eller tvetydig sammensætning). Meget lignende strukturer indsamles, men deres mindre forskelle rapporteres tydeligt. Glycoproteiner er beskrevet og kurateret i GlyConnect5 og GlyGen6, to databaser, der krydsrefererer hinanden. MS-data, der understøtter strukturelle beviser, lagres i stigende grad i GlycoPOST7. For en bredere dækning af onlineressourcer er kapitel 52 i referencemanualen, Essentials of Glycobiology, dedikeret til glycoinformatik8. Interessant nok har glycopeptididentifikationssoftware spredt sig i de senere år9,10, men ikke til gavn for reproducerbarheden. Sidstnævnte bekymring fik lederne af HUPO GlycoProteomics Initiative (HGI) til at sætte en softwareudfordring i 2019. De MS-data, der er opnået ved behandling af komplekse blandinger af N- og O-glycosylerede humane serumproteiner i CID-, ETD- og EThcD-fragmenteringstilstande, blev stillet til rådighed for konkurrenter, hvad enten det var softwarebrugere eller udviklere. Den fuldstændige rapport om resultaterne af denne udfordring11 er kun skitseret her. Til at begynde med blev der observeret en spredning af identifikationer. Det blev hovedsageligt fortolket som forårsaget af mangfoldigheden af metoder implementeret i søgemaskiner, af deres indstillinger, og hvordan output blev filtreret, og peptid "tælles". Det eksperimentelle design kan også have sat noget software og tilgange til en (dis)fordel. Det er vigtigt, at deltagere, der brugte den samme software, rapporterede inkonsekvente resultater og derved fremhævede alvorlige reproducerbarhedsproblemer. Det blev konkluderet ved at sammenligne forskellige indlæg, at nogle softwareløsninger fungerer bedre end andre, og nogle søgestrategier giver bedre resultater. Denne feedback vil sandsynligvis være retningsgivende for forbedringen af automatiserede metoder til analyse af glycopeptiddata og vil igen påvirke databaseindholdet.

Udvidelsen af glycoinformatik førte til oprettelse af webportaler, der giver information og adgang til flere lignende eller supplerende ressourcer. De nyeste og ajourførte er beskrevet i et kapitel i bogen Comprehensive Glycoscience12, og gennem samarbejde tilbydes en løsning på datadeling og informationsudveksling i en open access-tilstand. En sådan portal blev udviklet, som oprindeligt blev kaldt Glycomics@ExPASy 13 og omdøbt Glyco@Expasy, efter den store revision af Expasy-platformen14, der har været vært for en stor samling af værktøjer og databaser, der blev brugt på tværs af flere -omics i årtier, hvor det mest populære element var UniProt15-den universelle proteinvidensbase. Glyco@Expasy tilbyder en didaktisk opdagelse af formålet med og brugen af databaser og værktøjer baseret på en visuel kategorisering og en visning af deres indbyrdes afhængigheder. Følgende protokol illustrerer procedurer til at udforske glycomics og glycoproteomics data med et udvalg af ressourcer fra denne portal, der gør forbindelsen mellem glycoproteomics og glycan-interactomics eksplicit via glycomics. Som det er, producerer glycomics eksperimenter strukturer, hvor monosaccharider er fuldt definerede og forbinder helt eller delvist bestemt, men deres proteinstedsfastgørelse er dårligt, hvis overhovedet, karakteriseret. I modsætning hertil genererer glycoproteomics eksperimenter præcise oplysninger om fastgørelse af stedet, men med en dårlig opløsning af glycanstrukturer, ofte begrænset til monosaccharidsammensætninger. Disse oplysninger er stykket sammen i GlyConnect-databasen. Desuden kan søgeværktøjer i GlyConnect bruges til at detektere potentielle glykanligander, som er beskrevet sammen med de proteiner, der genkender dem i UniLectin16, der er knyttet til GlyConnect via glycaner. Protokollen, der præsenteres her, er opdelt i to sektioner for at dække spørgsmål, der er specifikke for N-bundne og O-bundne glycaner og glycoproteiner.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

BEMÆRK: En enhed med en internetforbindelse (større skærm foretrækkes) og en opdateret webbrowser som Chrome eller Firefox er påkrævet. Brug af Safari eller Edge er muligvis ikke så pålidelig.

1. Fra et protein N-glycom i GlyConnect til et lektin af UniLectin

  1. Adgang til ressourcer fra Glyco@Expasy
    BEMÆRK: Proceduren beskrevet her er at få adgang til GlyConnect, men kan anvendes til at få adgang til enhver ressource, der er registreret på platformen.
    1. Gå til https://glycoproteome.expasy.org/glycomics-expasy og overvej boblediagrammet til højre, der viser forskellige kategorier såsom glycokonjugater eller glykanbinding. I menuen længst til venstre, der afspejler kategorierne i boblerne, skal du markere afkrydsningsfeltet Glycoproteiner , så boblediagrammet til højre straks zoomer ind i boblen, der matcher den pågældende kategori.
      BEMÆRK: Grønne bobler er værktøjer, og gule bobler er databaser. Ved at klikke på en af dem zoomes ind igen for at give detaljer om ressourcen. Før du gør det, vil brugeren måske gerne forstå afhængigheden af den pågældende ressource til andre.
    2. Hvis du vil have oplysninger om afhængigheder, skal du gå fra fanen Tematisk klassifikation af ressource til fanen Ressourceafhængighedshjul . Placer musen på GlyConnect i hjulet for at kontrollere dens integrationsniveau med andre kilder (figur 1).
    3. Gå tilbage til fanen Ressourcetematisk klassificering for at nå GlyConnect-boblen som i trin 1.1.1, og klik på den (supplerende figur 1) for at få vist GlyConnect-hjemmesiden i en ny fane, der viser statistikken over indholdet i den seneste version af databasen.
      BEMÆRK: Et farveskema, der er beskrevet i tabel 1 , matcher de forskellige typer oplysninger, der er gemt i databasen. Denne farvekode er gyldig på alle objektsider i GlyConnect og er konsistent hele vejen igennem. Hjemmesiden viser også fire sektioner dedikeret til fokuserede datasæt såsom dem, der beskriver glykosylering af Sars-Cov-2 spike-proteinet (COVID-19) eller omfattende detaljer om humane mælkeoligosaccharider (HMO). Disse vil ikke blive undersøgt i denne protokol.
  2. Udforskning af de kontekstuelle oplysninger om et protein N-glycom
    BEMÆRK: Alle glykanstrukturer i GlyConnect vises i tre alternative og almindeligt anvendte formater: (1) Symbolnomenklatur for glykaner (SNFG)17 (2) IUPAC kondenseret18, og (3) Oxford19. I modsætning hertil er der ingen standard notation til at udtrykke glycansammensætning. I GlyConnect anvendes følgende kode: Hex for hexose, HexNAc for N-acetylhexosamin, dHex for fucose og NeuAc for sialinsyrer. Af hensyn til enkelheden er visualiseringsværktøjer afhængige af en kondenseret notation: H for hexose, N for N-acetylhexosamin, F for fucose og S for sialinsyrer. Derudover betegner små bogstaver modifikationer som "a" for acetylering, "p" for fosforylering og "s" for sulfatering for de hyppigste af disse såkaldte substituenter.
    1. For at se og udforske N-glycomet af humant prostataspecifikt antigen (PSA) fra GlyConnect-hjemmesiden skal du gøre som følger.
      BEMÆRK: Glykosylering af human PSA er blevet undersøgt gennem årene, især i forbindelse med prostatakræft. GlyConnect-databasen gemmer tre referencer20,21,22, som kombinerer glycomics og glycoproteomics data. Bemærk, at resultaterne her blev opnået med september 2021-udgivelsen af GlyConnect. Skjult brug af databasen kan give lidt forskellige statistikker på grund af hyppige dataopdateringer.
    2. Vælg knappen PROTEIN for at åbne proteinvisningen af databasen. Skriv prostata i søgevinduet på siden med proteinvisning. Se efter de to poster, der er anført i outputtet, der skelner mellem to isoformer af PSA med forskellige pI-værdier. Klik på 790 (Id-kolonnen) svarende til den almindelige isoform for PSA.
      BEMÆRK: Se efter den øverste flerfarvede bjælke, der viser sammenfattende oplysninger, der er udtrukket fra det offentliggjorte arbejde i skemaet, der er beskrevet ovenfor. Flere muligheder for navigation er mulige som beskrevet nedenfor.
    3. På den øverste flerfarvede bjælke skal du klikke på SOURCE-knappen i grønt for at få vist de prøvetyper, hvorfra de offentliggjorte data blev behandlet: Urin og sædvæske. Hvis du vil gennemse disse oplysninger yderligere, skal du klikke på en af disse eksempeltyper. Det samme gælder for ethvert element, der vises, når du klikker på en farvet knap.
    4. For at kontrollere databasens sundhedsrelaterede indhold skal du klikke på knappen DISEASE , som indeholder to elementer, hvoraf den ene er prostatakræft , der linker til den tilsvarende dedikerede sygdomsside i GlyConnect. Resuméet for denne side viser, at tre store undersøgelser har rapporteret 319 sammensætninger på 1.087 steder fundet i 308 humane proteiner.
    5. Klik på knappen STRUKTUR for at se den fulde liste over 135 strukturer forbundet med PSA fra glycomics data. Klik på knappen SAMMENSÆTNING for de tilhørende 78 sammensætninger bestemt af glycoproteomics eksperimenter. Klik på en hvilken som helst struktur eller sammensætning for at få yderligere detaljer.
      BEMÆRK: Detaljer såsom listen over alternative proteiner, der bærer den pågældende struktur eller listen over strukturer, der matcher sammensætningen, kan opnås. PSA er kendt for kun at have et N-glykosyleringssted ved Asn-69 (kun et element tælles for den brune SITE-knap ).
    6. For at reducere kompositionernes tvetydighed skal du klikke på FORESLÅET STRUCT under en valgt sammensætning (for eksempel Hex:6 HexNAc:3 NeuAc:1). Der fremsættes et forslag, hver gang monosaccharidtællingen falder sammen med en struktur, der er anført ovenfor (figur 2).
      BEMÆRK: Hex:6 HexNAc:3 NeuAc:1-sammensætningen genereret af et glycoproteomics-eksperiment matches med fire strukturer med højere opløsning fra glycomics-dataene. I tilfælde af PSA er der ingen tvetydighed på stedet at løse, da kun Asn-69 er glykosyleret.
    7. For fuldt ud at udforske proteinsiden skal du se yderligere detaljer i højre side af siden (figur 3).
      1. Se standardposten 3QUM PDB (Protein Data Bank23) for PSA, der vises med to komplekse glycaner fastgjort til hver monomer (figur 3) eller den alternative 2ZCK-post , som også er tilgængelig på grund af et vedhæftet kulhydrat. Den anden post viser en enkelt kæde.
        BEMÆRK: Begge poster visualiseres med 3D LiteMol-plugin24, der viser glycaner i SNFG-3D-notation, der er vedtaget i PDB-RCSB.
      2. Klik på de tilsvarende links til andre krydshenvisninger for at udforske relevant funktionel information fra større proteomics-databaser, såsom UniProt (figur 3).
  3. Visualisering og korrelering af kontekstuelle oplysninger om et protein N-glycom
    BEMÆRK: Som det ses i det foregående afsnit, kan lange lister over strukturer eller kompositioner være svære at forstå som helhed, og GlyConnect er afhængig af to forskellige værktøjer til at visualisere nøgleoplysninger, nemlig GlyConnect Octopus og GlyConnect Compozitor (den første udvider de sammenfattende oplysninger, der er fanget i farvede knapper, og den anden bringer strukturelle afhængigheder frem med hensyn til en struktur / sammensætning, der er indeholdt i en anden). Som illustreret nedenfor udforsker GlyConnect Octopus sammenhænge mellem de forskellige enheder, der er gemt i databasen, ved at fremhæve flere eller enkelte forbindelser som en afspejling af databaseindholdet.
    1. Udfør en GlyConnect Octopus-søgning for at bekræfte tilstedeværelsen af fælles strukturelle træk såsom hybridkernestrukturer og meget hyppige sialinsyreholdige strukturer i mangfoldigheden af glycaner, der er knyttet til PSA, som beskrevet nedenfor.
    2. Gå til Octopus hjemmeside https://glyconnect.expasy.org/octopus/. Hold fanen N-linket valgt som standard. Flyt til underfanen Kerner , og klik på hybridikonet . Gå til underfanen Egenskaber , og klik på ikonet Sialylated . Klik på den grønne søgeknap nedenfor.
      BEMÆRK: Søgeresultaterne vises grafisk som relationer mellem tre kategorier af elementer. Som standard matcher midterlisten forespørgslen om sammensætninger, den venstre samling spænder over relaterede proteiner, og den højre spænder over relaterede glycaner.
    3. I den viste graf over relationer skal du holde markøren over H6N4F1S1 for at fremhæve links til seks proteiner og tre strukturer. Kontrast dette ved at svæve over H6N4F2S1 , der udpeger de to isoformer af PSA (begge kaldet UniProt ID: KLK3_HUMAN) og en struktur (ID: 10996). Hold markøren over struktur-id'et for at få vist dets SNFG-repræsentation, og klik på det for at åbne den tilsvarende side (supplerende figur 2).
    4. Skift blækspruttens knuder til ethvert andet emne, der beskriver sammenhængen med glykosylering. Farvekoden forbliver den samme som den, der er beskrevet tidligere (se tabel 1).
      1. Skift centerknudepunkterne til væv for at få vist 15 muligheder midt i grafen, hvoraf mange er kropsvæsker. Se efter alle sammenhænge mellem proteiner og glycaner, der matcher forespørgslen afhængigt af vævsinformation. Placer markøren på urin eller sædvæske midt i grafen for at se forskellige foreninger (figur 4A,B).
      2. Skift centerknudepunkterne til sygdom for at vise 13 muligheder, hvoraf den ene er prostatakræft. Det eneste protein, der er forbundet, er PSA (KLK3_HUMAN) (supplerende figur 3).
        BEMÆRK: Et nærmere kig på PSA N-glycom vist på proteinsiden udpeger den meget høje frekvens af en terminal NeuAc(a?-?) Gal(b?-?) GlcNAc understruktur i mange tilfælde på strukturer med to eller tre antenner. En anden blæksprutte kan genereres på dette grundlag som beskrevet nedenfor.
    5. Klik på knappen Ryd for at opdatere søgningen. Flyt til underfanen Egenskaber , og klik på ikonet Bi-antenner . Flyt til underfanen Determinanter , og klik på ikonet 3-Sialyl-LN (type 2 ). Klik på den grønne søgeknap nedenfor.
    6. Kontroller de blæksprutte-hentede associationer med bi-antenne glycaner, der indeholder et terminalt 3-Sialyl-LN (type 2) motiv, dvs. NeuAc(a1-3)Gal(b1-4)GlcNAc. Skift centerknuderne til væv for lettere læsning og hold markøren over KLK3_HUMAN for direkte at forbinde sædvæske med PSA-almindelig isoform og syv strukturer (supplerende figur 4).
      BEMÆRK: Det andet visualiseringsværktøj, GlyConnect Compozitor, udfører scanningen af potentielle relationer mellem hver eneste komposition på en liste over dem (se nedenfor). Et forhold defineres som forskelligt fra kun et monosaccharid mellem to sammensætninger. Disse identificerede relationer afbildet i en graf afslører (dis)kontinuiteten af et glycom.
    7. Brug GlyConnect Compozitor til at udføre scanningen af potentielle relationer mellem hver eneste sammensætning på en liste deraf, som illustreret nedenfor i tilfælde af PSA.
      BEMÆRK: GlyConnect Compozitor behandler kompositioner i forbindelse med en kontekst. Det tilbyder forskellige faner til forespørgsel GlyConnect, f.eks. Proteiner, Kilder, Cellelinjer, Sygdomme, der er selvforklarende for at kvalificere en kontekst. Dette illustreres her med PSA som følger.
    8. Gå tilbage til proteinsiden for PSA: https://glyconnect.expasy.org/browser/proteins/790. Klik på linket Compozitor i højre side af PSA-indtastningssiden. Sørg for, at Compozitor-søgefelterne er udfyldt med detaljerne i Id 790-posten under fanen Protein (Protein: Prostataspecifikt antigen, Arter: Homo sapiens og Glycan Type: N-linket).
    9. Klik på knappen Føj til markering for at hente data fra databasen og få vist grafen over tilsluttede kompositioner. Fravælg indstillingen Medtag virtuelle noder . Klik på knappen Compute Graph for at få vist en graf, der viser et godt forbundet sæt af 78 sammensætninger, der repræsenterer PSA N-glycomet, og et stregplot, der viser glycanernes vigtigste egenskaber.
    10. Hold markøren over den lilla bjælke i barplottet, som lokaliserer alle sialylerede strukturer i grafen for at afsløre en observerbar bias mod sialylerede strukturer.
    11. Forbliv på fanen Protein , og vælg Prostataspecifikt antigen - høj Pi-isoform (psah) i feltet Protein (navn).
      BEMÆRK: Felterne Glycan Type og Glycan Site udfyldes automatisk.
    12. Klik på knappen Føj til markering for at hente data fra databasen, der udgør 57 kompositioner. Klik på knappen Compute Graph for at generere de overlejrede grafer for begge isoformer og vurdere forskellene i glycomer af de to PSA-isoformer. Hold markøren over nodeetiketter for at få vist det antal strukturer, der svarer til kompositionerne/etiketterne (figur 5).
  4. Glycanbindende oplysninger i UniLectin
    BEMÆRK: Husk den determinant, der er testet i blæksprutten, beskrevet som NeuAc(a2-3)Gal(b1-4). Per definition er det en etableret bindende del af en glykanstruktur og kan som sådan søges i UniLectin3D-databasen25.
    1. Gå til https://www.unilectin.eu/, og klik på UniLectin3D-knappen . Alternativt kan du gå direkte til siden: https://www.unilectin.eu/unilectin3D/.Click på knappen Glycan Search for at åbne denne side: https://www.unilectin.eu/unilectin3D/glycan_search (supplerende figur 6).
    2. Klik på den lilla diamant, der repræsenterer en sialinsyre, som beder om visning af alle glycanbindende motiver, der slutter med en sialinsyre, der er gemt i databasen. Den øverste del af denne motivsamling indeholder NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet, der er undersøgt tidligere (supplerende figur 7).
    3. Klik på NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet for at bede om visning af alle lektiner, for hvilke en 3D-struktur, der bekræfter interaktionen med NeuAc(a2-3)Gal(b1-4)GlcNAc, er kendt. Resultatet viser som standard lektiner i alle arter. Brug indstillingen Søg efter felt til at begrænse visningen til menneskecentrerede oplysninger.
    4. Klik på indstillingen Søg efter felt. Skriv Homo sapiens i artsfeltet. Klik på knappen Udforsk røntgenstrukturer for at filtrere den originale liste ud. Der er kun én indgang tilbage, dvs. den menneskelige galectin-8. Klik på knappen Vis 3D-struktur og information i øverste højre hjørne af det anførte element for at få vist detaljerede oplysninger om human galectin-8, der interagerer med NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Få adgang til de strukturelle oplysninger om human galectin-8, der vises på siden med to forskellige seere.
      1. Hold musen for at dreje molekylet rundt og bringe liganden frem i forgrunden med Litemol-softwaren26 integreret for at vise lektin 3D-strukturen. Hold musen over en af de anførte interaktioner til venstre for at opdatere visningen til højre og lokalisere, hvor den pågældende interaktion virker i strukturen med PLIP-softwaren27 integreret for at detaljere atominteraktioner mellem lektin og ligande (figur 6).
    6. Klik på en hvilken som helst grøn knap, der linker til de tilsvarende poster i UniProt, PDB (europæiske eller amerikanske websteder) og GlyConnect for at udforske disse krydshenvisninger.

2. Udforskning og sammenligning af O-glycomer i GlyConnect

  1. Gennemse HGI-udfordringen med høj tillid til datasættet
    BEMÆRK: HGI-datasættet, der er nævnt i indledningen, gemmes i GlyConnect-databasen. Den indeholder 163 N- og 23 O-glycopeptider, der findes i 37 glycoproteiner, der betragtes som en høj tillidsliste. GlyConnect Compozitor28 er nøglen til at vurdere glycomdatakonsistens. Det er vigtigt, at Compozitor giver mulighed for virtuelle noder (vist i gråt), når der kun er behov for et mellemliggende trin for at forbinde de isolerede noder. På den måde strammer virtuelle noder grafen og kan tolkes som strukturer, der potentielt savnes i forsøgsresultaterne.
    1. Gennemse HGI-datasættet fra GlyConnect-hjemmesiden ved at gå direkte til artiklens referenceside: https://glyconnect.expasy.org/browser/references/2943.
      BEMÆRK: Resuméet i de farvede knapper afspejler delvist tallene i artiklen. Men hvis kun 69 unikke peptider er opført, afspejler dette flere foreninger mellem peptider og steder eller strukturer. I artiklen defineres et glycopeptid som en unik kombination af et peptid og en sammensætning. I GlyConnect overvejes glycositter først, og de beskrives som en kombination af et peptid med strukturer. Dette forklarer uoverensstemmelsen i tal mellem GlyConnect og ovenstående citat.
    2. Kontroller den høje hyppighed af forekomst af N-bundne sammensætninger, såsom Hex:5 HexNAc:4 NeuAc:2, identificeret på 42 steder i 43 peptider i modsætning til den hyppige unikhed af de fleste O-bundne sammensætninger identificeret på 1 sted i 1 peptid.
    3. Klik på linket Compozitor i højre side af referenceindtastningssiden for at vurdere datasættets konsistens. Sørg for, at Compozitor-værktøjet behandler referencens DOI direkte og udfylder søgefeltet med reference=10.1101/2021.03.14.435332 under fanen Avanceret i værktøjet. Skriv &glycan_type=O-linket efter DOI-nummeret for at indsnævre søgningen til O-linkede glycaner, så forespørgslen bliver: reference=10.1101/2021.03.14.435332&glycan_
      type=O-linket
    4. Klik på knappen Føj til markering for at hente data fra databasen (der er 20 O-linkede kompositioner). Hold indstillingen Inkluder virtuelle noder valgt. Klik på knappen Compute Graph for at få vist grafen over tilsluttede kompositioner. Dette resultat fremhæver flere huller i den forventede kontinuitet i glycanbiosyntesen med ni virtuelle noder, der kræves for at fuldføre grafen (figur 7).
  2. Sammenligning med O-glycomet af et udvalgt serumprotein i GlyConnect
    BEMÆRK: For at vurdere, om hullerne kan udfyldes af data, der er lagret i GlyConnect, blev der valgt et O-glycosyleret protein ud af de 37, der er anført med referencen. I datasættet rapporteres Inter-alpha-trypsinhæmmer tung kæde H4 (Q14624) at være en O-glycosyleret på Thr-725.
    1. Gå til fanen Protein i GlyConnect Compozitor (se trin 2.1.3). På listen Protein skal du vælge Inter-alfa-trypsinhæmmer tung kæde H4. Sørg for, at artsvalget som standard er Homo sapiens . Fravælg N-linket i Glycan-typen. Vælg kun Thr-725 på listen Websted ved først at klikke på minustegnet til venstre for Webstedet for at fravælge alle webstederne og derefter kun vælge Thr-725 fra listen.
    2. Klik på knappen Føj til markering (bemærk, at seks kompositioner er forbundet med Thr-725). Klik på knappen Beregningsgraf for at få vist grafen over tilsluttede kompositioner (supplerende figur 8).
    3. Overhold den viste graf, som viser de 17 unikke sammensætninger ud af de 20 O-linkede sammensætninger af artikeldatasættet i blåt og de tre unikke ud af seks i databasen i rødt. Med andre ord er overlapningen mellem de to kilder til stede i tre kompositioner, der er repræsenteret i magenta. Bemærk, at en 45° rotation af grafen genereres automatisk.
      BEMÆRK: Antallet af virtuelle noder reduceres med en. Som det viser sig, er H2N2S1, der mangler i de 20 O-linkede sammensætninger af artikeldatasættet og repræsenteret som en virtuel knude, nu fyldt med en yderligere sammensætning forbundet med Thr-725 af Inter-alpha-trypsinhæmmer tung kæde H4 i databasen. Dette forenkler grafens topologi, fordi to andre virtuelle noder gøres ubrugelige, da de var alternative muligheder for at udfylde kløften mellem H1N2S1 og H2N2S2. En anden sammensætning, der importeres fra databasen, ville dog blive isoleret, hvis ikke det var for oprettelsen af to nye alternative virtuelle noder H2N2F1S1 og H1N2F2S1.
    4. For at give mening om de virtuelle noder skal du kontrollere, om de tilsvarende kompositioner er til stede i GlyConnect. For at gøre dette skal du klikke på knappen Eksporter under grafen. Vælg kun virtuel ved at fravælge alle andre indstillinger. Klik på udklipsholderikonet for at kopiere valget af 8 kompositioner.
    5. Indsæt markeringen i forespørgselsvinduet på Compozitor's Brugerdefinerede fane. Vælg O-linket i feltet Glycantype . Angiv markeringsetiketten i feltet Kompositioner til f.eks. VN for at navngive listen med 8 kompositioner. Klik på knappen Føj til markering og derefter på knappen Beregningsgraf . Alle virtuelle noder vises nu som grønne noder (figur 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Den første del af protokollen (afsnit 1) viste, hvordan man undersøger specificiteten eller fællesheden af N-glycaner fastgjort på Asn-69 af det humane prostataspecifikke antigen (PSA) ved hjælp af GlyConnect-platformen. Vævsafhængige (urin og sædvæske) samt isoformafhængige (normale og høje pI) variationer i glycanekspression blev understreget ved hjælp af to visualiseringsværktøjer (figur 4 og figur 5).

For det første gav GlyConnect Octopus, som viser sammenhænge mellem enheder, der er lagret i databasen, mulighed for at udforske kontekstuelle oplysninger ved (1) at vælge forskellige enheder, der skal vises i Octopus, og (2) at klikke på links for at undersøge relaterede poster. Resultatet var karakteristiske foreninger afhængigt af vævet.

For det andet blev GlyConnect Compozitor, oprindeligt designet til at definere/forfine en sammensætningsfil til glycopeptididentifikation, brugt til at vurdere glycanekspression i to kendte PSA-isoformer (normal og høj pI). Sammenligningen af hver isoformglycomer producerede en velforbundet graf, der udpegede fire noder (sammensætninger), hvoraf to er karakteristiske for den høje pI-isoform. Selvom glykomeoverlapningen er signifikant, viste glycanegenskabsdiagrammet en dråbe sialylering fra den fælles til den høje pI-isoform (supplerende figur 5).

Desuden udpeger udforskningen af UniLectin3D galectin-8 som en mulig læser af PSA-glycomet, da sidstnævnte indeholder mange strukturer med en NeuAc(a2-3)Gal(b1-4)GlcNAc terminal epitop. Dette giver et spor at følge og kan ikke betragtes som endeligt bevis. Ikke desto mindre er PSA og galectiner kendt for at spille en væsentlig rolle i prostatakræft29 , og galectin-8's specifikke rolle blev for nylig fremhævet30. Den første del af protokollen korrelerer strukturelle (glycoproteomics) og funktionelle (bindende) data for at etablere et sandsynligt scenario for protein-protein-interaktioner medieret af glycaner.

I anden del af protokollen (afsnit 2) blev et sæt O-glycansammensætninger af høj kvalitet forbundet med et bestemt væv (humant serum) undersøgt og sammenlignet med GlyConnect-databaseindholdet, hvorved der blev mulighed for at tilpasse en glykansammensætningsfil til raffineret identifikation af glycopeptider (figur 7 og figur 8 ). Det kan stole på det minimale sæt af 20 kompositioner, der er tilgængelige fra et datasæt (HGI-udfordringsresultater) eller forbedres med 23 til 26 elementer, der rationelt indsamles i GlyConnect for at styrke sættets konsistens.

rød lys orange grøn lyseblå lilla lyserød mørkeblå brun mørk orange
art protein vævskilde struktur sammensætning sygdom henvisning glycosit peptid

Tabel 1: Farveskema, der er knyttet til hver enhed i GlyConnect-databasen og gyldigt overalt.

Figure 1
Figur 1: Afhængighedshjulet i Glyco@Expasy instantieret for GlyConnect. Klik her for at se en større version af denne figur.

Figure 2
Figur 2: Foreslået glykanstruktur for en udvalgt glycansammensætning. Foreslået glykanstruktur fra et glycomisk eksperiment for en glykansammensætning af et glycoproteomisk eksperiment rettet mod det samme glycoprotein, her humant prostataspecifikt antigen (PSA), som foreslået på GlyConnect-siden for PSA (ID: 790). Klik her for at se en større version af denne figur.

Figure 3
Figur 3: Menuen Til højre på GlyConnect-siden til PSA. Klikbare krydshenvisninger til andre større databaser og visning med LiteMol glycan plugin af eksisterende 3D-struktur i PDB. Klik her for at se en større version af denne figur.

Figure 4
Figur 4: Outputtet afGlyConnect Octopus, der viser vævsafhængige foreninger mellem proteiner og glycaner. Forespørgslen Hybrid OG Sialylated har returneret alle sammensætninger, der matcher disse kriterier, og hver sammensætning forbinder de tilknyttede oplysninger om proteiner og glycaner som registreret i databasen. Bemærk, at Species som standard er indstillet til Homo sapiens, men denne indstilling kan ændres. Her viser GlyConnect Octopus alle humane proteiner (venstre knuder), der bærer hybrid- og sialylerede glycanstrukturer (højre knuder) med de væv, hvori de udtrykkes (midterstoder). (A) Foreningerne med urin fremhæves og viser to proteiner: choriogonadotropin (GLHA_HUMAN) og PSA fælles isoform (KLK3_HUMAN) forbundet med spredte (heterogene) glycanstrukturer. (B) Sammenhængen med sædvæske fremhæves, der viser to proteinisoformer af PSA (KLK3_HUMAN) forbundet med grupperede (lignende) glycanstrukturer. Klik her for at se en større version af denne figur.

Figure 5
Figur 5: Outputtet fra GlyConnect Compozitor, der viser de overlejrede N-glycomer af de to isoformer af PSA. Sammensætninger i kondenseret notation mærker hver knude. De glycaner, der er forbundet med den fælles isoform, er repræsenteret som blå knuder og dem af den høje pI-isoform som røde knuder. Overlapningen mellem glycomer er vist som magentaknuder. Tal inde i noderne repræsenterer antallet af glykanstrukturer, der matcher den mærkede sammensætning i henhold til indholdet af GlyConnect-databasen vedrørende PSA. Den viste Compozitor-graf er blevet ændret lidt fra det rå output for at adskille netværket, der genereres af D3.js biblioteket. Dette er let at gøre, da enhver node kan trækkes i browservinduets rum, hvor en bruger ønsker det, og stierne kan således forkortes eller strækkes. Brugeren kan skrive en bestemt komposition i feltet Zoom til i øverste højre hjørne for at zoome ind og centrere grafen på den tilsvarende node. Klik her for at se en større version af denne figur.

Figure 6
Figur 6: Sammenfattende angivelse af humant galectin-8 med NeuAc(a2-3)Gal(b1-4)GlcNAc-bindingsdetaljer. Ved at klikke på den grønne Vis knappen 3D-struktur og information (angivet med en rød ellipse) åbnes en ny side, hvor der vises et nærbillede af restinteraktioner med PLIP-applikationen (angivet med en rød pil). Klik her for at se en større version af denne figur.

Figure 7
Figur 7: Outputtet fra GlyConnect Compozitor, der viser O-glycomet fra det humane serums datasæt med høj tillid til HGI-udfordringen. Uden virtuelle noder (se tekst) er forbindelsen til den pågældende graf lav. Klik her for at se en større version af denne figur.

Figure 8
Figur 8: Outputtet fra GlyConnect Compozitor, der viser muligheden for færdiggørelse af O-glycomet fra HGI-udfordringens datasæt med høj tillid til humant serum ved hjælp af GlyConnect-databaseindholdet. Adgang til indholdet af hele GlyConnect-databasen ved hjælp af Compozitor's Brugerdefinerede fane afslører, at kompositioner, der svarer til de virtuelle noder, er knyttet med eksisterende definerede strukturer som fremhævet i nodeetiketterne. Nodestørrelsen repræsenterer antallet af referencer, der er gemt i databasen, og rapporterer den tilsvarende sammensætning. Den numeriske etiket af noder angiver antallet af tilsvarende strukturer, der er gemt i GlyConnect. Udvalgte kompositioner ser ud til at have nul til atten mulige matches i databasen. Faktisk er disse noder kun virtuelle som en afspejling af indholdet af eksperimentelle datasæt. Det anbefales at forfine oplysningerne i grafen for at teste realismen af disse yderligere noder. Klik her for at se en større version af denne figur.

Supplerende figur 1: Boblediagram over Glyco@Expasy hjemmeside. Zoom ind på boblediagrammet på Glyco@Expasy hjemmeside for at fokusere på glycoproteinkategorien . Software vist i grønne bobler og databaser i gule bobler. Ved at klikke på en hvilken som helst boble opsummeres formålet med ressourcen. Klik her for at downloade denne fil.

Supplerende figur 2: Blæksprutte-hentede associationer, der matcher forespørgslen afhængigt af sammensætning. Standard GlyConnect Octopus-visning af humane proteiner (venstre knuder), der bærer hybrid- og sialylerede glycanstrukturer (højre noder) med matchende sammensætninger (midterstoder). Sammensætning H6N4F12S1 synes unik for begge PSA-isoformer (KLK3_HUMAN). Ved at klikke på det unikke struktur-id (10996) åbnes den tilsvarende side med detaljer, der viser, at de to isoformer faktisk er de eneste proteiner, der bærer denne særlige glycan. Klik her for at downloade denne fil.

Supplerende figur 3: Blæksprutte-hentede foreninger, der matcher forespørgslen afhængigt af sygdommen. GlyConnect Octopus visning af alle humane proteiner (venstre knuder), der bærer hybrid- og sialylerede glycanstrukturer (højre knuder) med de sygdomme, hvori de udtrykkes (midterstoder). Foreningerne med prostatakræft fremhæves, hvilket viser den fælles isoform af PSA (KLK3_HUMAN). Klik her for at downloade denne fil.

Supplerende figur 4: Blæksprutte-hentede foreninger, der matcher forespørgslen afhængigt af vævsoplysninger. GlyConnect Octopus viser alle humane proteiner (venstre knuder), der bærer bi-antenne glycanstrukturer, herunder NeuAc(a1-3)Gal(b1-4)GlcNAc-motivet (højre knuder) med det væv, hvori de udtrykkes (midterstoder). Foreningerne med sædvæske fremhæves, hvilket kun viser den fælles isoform af PSA (KLK3_HUMAN) og syv strukturer. Klik her for at downloade denne fil.

Supplerende figur 5: Outputtet fra GlyConnect Compozitor, der viser de overlejrede N-glycomer af de to isoformer af PSA. Sammensætninger i kondenseret notation mærker hver knude. De glycaner, der er forbundet med den fælles isoform, er repræsenteret som blå knuder og dem af den høje pI-isoform som røde knuder. Overlapningen mellem glycomer er vist som magentaknuder. Tal inde i noderne repræsenterer antallet af glykanstrukturer, der matcher den mærkede sammensætning i henhold til indholdet af GlyConnect-databasen vedrørende PSA. Mousing over søjlediagrammet over glycanegenskaber viser korrespondancen mellem frekvensen og knuderne som orange bobler. Næsten alle PSA's almindelige isoformnoder er dækket. Denne frekvens falder i den høje pI-isoform. Klik her for at downloade denne fil.

Supplerende figur 6: Glycan-søgegrænseflade i UniLectin3D. Ved at klikke på sialinsyre SNFG-symbolet (cirklet i rødt) startes søgningen efter alle ligander, der indeholder NeuAc, gemt i UniLectin3D. Klik her for at downloade denne fil.

Supplerende figur 7: Uddrag af outputtet af søgningen efter alle ligander, der indeholder NeuAc. NeuAc(a2-3)Gal(b1- 4)GlcNAc-motivet af interesse er cirklet i rødt. Klik her for at downloade denne fil.

Supplerende figur 8: Outputtet fra GlyConnect Compozitor, der viser O-glycomet for HGI-datasættet overlejret med det i GlyConnect. Outputtet fra GlyConnect Compozitor, der viser O-glycomet fra det humane serums datasæt med høj konfidens for HGI-udfordringen i blåt overlejret med O-glycomet af et O-glycosyleret protein ud af de 37, der er anført med referencen, dvs. inter-alfa-trypsinhæmmer tung kæde H4 med yderligere oplysninger indeholdt i GlyConnect. Dette forbedrer grafens forbindelse. Klik her for at downloade denne fil.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus som et værktøj til at afsløre uventede sammenhænge
GlyConnect Octopus blev oprindeligt designet til at forespørge databasen med en løs definition af glycaner. Faktisk rapporterer litteraturen ofte de vigtigste egenskaber ved glycaner i et glycom, såsom at blive fucosyleret eller sialyleret, være lavet af to eller flere antenner osv. Desuden klassificeres glycaner, uanset om de er N- eller O-linkede, i kerner, som beskrevet i referencemanualen Essentials of Glycobiology1, der også ofte citeres i offentliggjorte artikler. Endelig er glycanepitoper såsom blodgruppeantigener endnu en egenskab, der søges i strukturer og potentielt udpeges til at skrive en glycan. I sidste ende kan det være relevant at søge efter fælles eller særskilte egenskaber ved et glycom udtrykt i et bestemt væv eller en bestemt udvalgt art. I den forstand bør de indsamlede oplysninger anvendes som en kilde til nye antagelser i modsætning til unikke fakta.

GlyConnect Compozitor som et værktøj til formning af et glycankompositionssæt
Browsing strukturelle oplysninger som beskrevet på en proteinside har begrænsninger, fordi lister har tendens til at skjule forholdet mellem specificerede strukturer såvel som dem mellem kompositioner. GlyConnect Octopus tager sig af førstnævnte og GlyConnect Compozitor til sidstnævnte. Et omhyggeligt kig på strukturer, der er anført i de fleste GlyConnect-poster, afslører eksistensen af fælles understrukturer. Alligevel er disse oplysninger ikke lette at forstå visuelt uden hjælp fra en dedikeret seer.

Indholdet af glycansammensætningsfilen, der understøtter identifikationen af glycan-moiety som en nøgleparameter for glycopeptididentifikationssoftware, blev etableret ved at analysere resultaterne af HGI-udfordringen. De fleste klassiske proteomics-søgemaskiner rummer udvælgelsen af glykobaserede modifikationer fra en samling, der stammer fra data indsamlet i databaser / arkiver eller litteraturen. Andre glycoproteomics dedikerede værktøjer bruger viden om glycan biosyntese. På denne måde defineres kompositionsfilen teoretisk som resultatet af forventet enzymatisk aktivitet. I sidste ende er der lige så mange kompositionsfiler, som der er søgemaskiner, og overlapningen mellem dem er meget variabel. Ikke desto mindre afslører læring fra tidligere erfaringer inden for proteomik, især når der tages højde for posttranslationelle modifikationer, at søgemaskinernes ydeevne er korreleret med at begrænse søgerummet31. Lignende observationer foretages i glycoproteomics, og GlyConnect Compozitor blev designet til at understøtte udvælgelse af uddannede sammensætningsdata, hvis betydning tidligere blev diskuteret32.

Brugen af dette værktøj blev ufuldstændigt illustreret i protokollen, især med hensyn til fanen Avanceret , hvor forespørgsler, der direkte starter programmatisk adgang til GlyConnect via dens API (Application Programming Interface), kan udtrykkes. For eksempel svarer typning af taksonomi = homo sapiens & glycanType = N-linket & væv = urin & sygdom = prostatakræft i forespørgselsvinduet under fanen Avanceret til at udfylde de tilsvarende felter under fanen Kilde (vælge Homo sapiens i arter, urin i væv og N-bundet i glykantype) og fanen Sygdom (vælge Homo sapiens i arter, Prostatakræft i sygdom og N-bundet i glycan type). Med andre ord giver det i et trin et resultat, der ville kræve flere valg.

Endelig, mens oprettelsen af virtuelle noder forklares i protokollen, har deres potentielle redundans brug for en yderligere kommentar. To samtidige muligheder kan ikke skelnes, fordi den simulerede virkning af enzymer i grafen ikke tager højde for kronologien af enzymaktiviteter. Derfor foreslår Compozitor to stier gennem to virtuelle noder for at bygge bro over to ikke-tilsluttede noder svarende til monosaccharidtællinger med op til to forskelle. Inkluderingen af nye data giver ofte manglende links. Brugeren er altid fri til at overveje eller afvise virtuelle noder ved at (fjerne) markeringen i afkrydsningsfeltet Inkluder virtuelle noder .

Kendte databaser og softwarebegrænsninger
Samlet set, som med enhver navigation på internettet, fører de ovenfor beskrevne protokoller lejlighedsvis til en ikke-eksisterende side, ofte på grund af en opdatering af et websted eller en konflikt med opdateringer mellem to websteder. I dette tilfælde og faktisk alle tilfælde, hvor navigationen ikke flyder, er det nemmeste at sende en note til Expasy helpdesk, hvis effektivitet har bidraget væsentligt til portalens succes i de sidste 28 år.

Indholdet af GlyConnect er forudindtaget som en afspejling af de nuværende ubalancer i litteraturen. De fleste publikationer rapporterer N-glykosylering hos pattedyr, og databasen er rigere på humane N-glycoproteiner. Ikke desto mindre er vi tidligere blevet bedt om at medtage mindre fælles datasæt og forblive helt åbne for at modtage råd og forslag.

Desuden er Compozitor i øjeblikket begrænset til sammenligningen af tre sammensætningsdatasæt. En større revision af underfanen Determinant i Octopus er planlagt. Ressourcer af Glyco@Expasy har brug for regelmæssige opdateringer, og nogle vil muligvis ikke blive udført med tiden; Ikke desto mindre offentliggøres advarsler og/eller meddelelser, når det sker.

Partnerportaler, kendt som GlyGen (https://www.glygen.org) og GlyCosmos (https://www.glycosmos.org), giver forskellige muligheder og værktøjer. I sidste ende indebærer browsing og søgning efter oplysninger om en af mulighederne et højt niveau af subjektivitet og afhænger i vid udstrækning af brugernes vaner og bekymringer. Vi kan kun håbe, at vores løsning passer til en del af samfundet.

Input fra glykovidenskab vokser i life science-projekter, og undersøgelser, der fastslår glycanernes rolle i sundhedsspørgsmål, produceres løbende. Det nylige fokus på Sars-Cov-2 afslørede endnu en gang betydningen af glykosylerede proteiner, især i strukturelle tilgange33. Glycoinformatik understøtter glycoforskere i daglige opgaver med dataanalyse og fortolkning.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne erklærer ingen interessekonflikter.

Acknowledgments

Forfatteren anerkender varmt tidligere og nuværende medlemmer af Proteome Informatics Group, der er involveret i at udvikle de ressourcer, der anvendes i denne vejledning, specifikt Julien Mariethoz og Catherine Hayes for GlyConnect, François Bonnardel for UniLectin, Davide Alocci og Frederic Nikitin for Octopus og Thibault Robin for Compozitor og sidste touch på Octopus.

Udviklingen af glyco@Expasy-projektet støttes af den schweiziske forbundsregering gennem Statssekretariatet for Uddannelse, Forskning og Innovation (SERI) og suppleres i øjeblikket af Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy vedligeholdes af det schweiziske institut for bioinformatik og hostes på Vital-IT Competence Center. Forfatteren anerkender også Anne Imberty for fremragende samarbejde om UniLectin-platformen, der støttes i fællesskab af ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologi udgave 179
Bioinformatikressourcer til undersøgelse af glykanmedierede proteininteraktioner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter