Summary

Bioinformatica Bronnen voor de Studie van Glycan-Gemedieerde Eiwit Interacties

Published: January 20, 2022
doi:

Summary

Dit protocol illustreert hoe menselijke eiwitglyomen kunnen worden verkend, vergeleken en geïnterpreteerd met online bronnen.

Abstract

Het Glyco@Expasy initiatief werd gelanceerd als een verzameling van onderling afhankelijke databases en hulpmiddelen die verschillende aspecten van kennis in glycobiologie omvatten. In het bijzonder is het gericht op het benadrukken van interacties tussen glycoproteïnen (zoals celoppervlakreceptoren) en koolhydraatbindende eiwitten gemedieerd door glycanen. Hier worden belangrijke bronnen van de collectie geïntroduceerd door middel van twee illustratieve voorbeelden gericht op het N-glycoom van het menselijke prostaatspecifiek antigeen (PSA) en het O-glycoom van menselijke serumeiwitten. Door middel van verschillende databasequery’s en met behulp van visualisatietools laat dit artikel zien hoe u inhoud in een continuüm kunt verkennen en vergelijken om anders verspreide stukjes informatie te verzamelen en te correleren. Verzamelde gegevens zijn bestemd om meer uitgebreide scenario’s van de glycaanfunctie te voeden. Glycoinformatica die hier wordt geïntroduceerd, wordt daarom voorgesteld als een middel om aannames over de specificiteit van een eiwitglycol in een bepaalde context te versterken, vorm te geven of te weerleggen.

Introduction

Glycanen, eiwitten waaraan ze zijn gehecht (glycoproteïnen) en eiwitten waaraan ze binden (lectines of koolhydraatbindende eiwitten) zijn de belangrijkste moleculaire actoren aan het celoppervlak1. Ondanks deze centrale rol in cel-celcommunicatie zijn grootschalige studies, waaronder glycomics, glycoproteomics of glycan-interactomics-gegevens nog steeds schaars in vergelijking met hun tegenhanger in genomics en proteomics.

Tot voor kort waren er geen methoden ontwikkeld voor het karakteriseren van de vertakkende structuren van complexe koolhydraten terwijl ze nog steeds worden geconjugeerd aan het dragereiwit. De biosynthese van glycoproteïnen is een niet-sjabloongestuurd proces waarin de monosaccharidedonoren, de accepterende glycoproteïnesubstraten en de glycosyltransferasen en glycosidasen een interactieve rol spelen. De resulterende glycoproteïnen kunnen complexe structuren dragen met meerdere vertakkingspunten waar elke monosaccharidecomponent een van de verschillende soorten kan zijn die in de natuur aanwezig zijn1. Het niet-sjabloongestuurde proces legt biochemische analyse op als de enige optie voor het genereren van oligosaccharide structurele gegevens. Het analytische proces van glycaanstructuren die aan een inheems eiwit zijn bevestigd, is vaak een uitdaging omdat het gevoelige, kwantitatieve en robuuste technologieën vereist om de samenstelling van monosacchariden, koppelingen en vertakkingssequenties2 te bepalen.

In deze context is massaspectrometrie (MS) de meest gebruikte techniek in glycomics en glycoproteomics experimenten. Naarmate de tijd verstrijkt, worden deze uitgevoerd in instellingen met een hogere doorvoer en verzamelen gegevens zich nu in databases. Glycan-structuren in verschillende formaten3, vullen GlyTouCan4, de universele glycaan-gegevensopslagplaats waar elke structuur is gekoppeld aan een stabiele identificatie, ongeacht het niveau van precisie waarmee de glycaan is gedefinieerd (bijvoorbeeld mogelijk ontbrekend koppelingstype of dubbelzinnige samenstelling). Zeer vergelijkbare structuren worden verzameld, maar hun kleine verschillen worden duidelijk gemeld. Glycoproteïnen worden beschreven en samengesteld in GlyConnect5 en GlyGen6, twee databases die naar elkaar verwijzen. MS-gegevens die structurele bewijsstukken ondersteunen, worden steeds vaker opgeslagen in GlycoPOST7. Voor een bredere dekking van online bronnen is hoofdstuk 52 van de referentiehandleiding, Essentials of Glycobiology, gewijd aan glycoinformatica8. Interessant is dat glycopeptide-identificatiesoftware zich de afgelopen jaren heeft verspreid9,10, maar niet ten behoeve van de reproduceerbaarheid. Deze laatste bezorgdheid bracht de leiders van het HUPO GlycoProteomics Initiative (HGI) ertoe om in 2019 een software-uitdaging aan te gaan. De MS-gegevens verkregen uit de verwerking van complexe mengsels van N- en O-geglycosyleerde humane serumeiwitten in CID-, ETD- en EThcD-fragmentatiemodi, werden beschikbaar gesteld aan concurrenten, of het nu softwaregebruikers of ontwikkelaars waren. Het volledige rapport over de resultaten van deze challenge11 wordt alleen hier geschetst. Om te beginnen werd een spreiding van identificaties waargenomen. Het werd voornamelijk geïnterpreteerd als veroorzaakt door de diversiteit van methoden geïmplementeerd in zoekmachines, van hun instellingen, en hoe outputs werden gefilterd, en peptide “geteld”. Het experimentele ontwerp kan ook sommige software en benaderingen in een (de)voordeel hebben geplaatst. Belangrijk is dat deelnemers die dezelfde software gebruikten inconsistente resultaten rapporteerden, waardoor ernstige reproduceerbaarheidsproblemen werden benadrukt. Door verschillende inzendingen te vergelijken, werd geconcludeerd dat sommige softwareoplossingen beter presteren dan andere en dat sommige zoekstrategieën betere resultaten opleveren. Deze feedback zal waarschijnlijk de verbetering van geautomatiseerde glycopeptidegegevensanalysemethoden begeleiden en zal op zijn beurt van invloed zijn op de database-inhoud.

De uitbreiding van glycoinformatica leidde tot het creëren van webportalen die informatie en toegang bieden tot meerdere vergelijkbare of aanvullende bronnen. De meest recente en actuele worden beschreven in een hoofdstuk van de Comprehensive Glycoscience boekenreeks12 en door samenwerking wordt een oplossing voor het delen van gegevens en informatie-uitwisseling aangeboden in een open access modus. Een dergelijk portaal werd ontwikkeld dat oorspronkelijk Glycomics@ExPASy 13 heette en werd omgedoopt tot Glyco@Expasy, na de grote revisie van het Expasy-platform14 dat al tientallen jaren een grote verzameling tools en databases host die in verschillende omics worden gebruikt, het meest populaire item is UniProt15 – de universele eiwitkennisbank. Glyco@Expasy biedt een didactische ontdekking van het doel en het gebruik van databases en tools, gebaseerd op een visuele categorisatie en een weergave van hun onderlinge afhankelijkheden. Het volgende protocol illustreert procedures om glycomics en glycoproteomics-gegevens te verkennen met een selectie van bronnen uit dit portaal die de verbinding tussen glycoproteomics en glycan-interactomics expliciet maakt via glycomics. Zoals het is, produceren glycomics-experimenten structuren waarbij monosacchariden volledig zijn gedefinieerd en koppelingen gedeeltelijk of volledig worden bepaald, maar hun aanhechting van de eiwitplaats wordt slecht of helemaal niet gekarakteriseerd. Glycoproteomics-experimenten genereren daarentegen nauwkeurige informatie over de hechting van de plaats, maar met een slechte resolutie van glycaanstructuren, vaak beperkt tot monosaccharidesamenstellingen. Deze informatie is verzameld in de GlyConnect-database. Bovendien kunnen zoekhulpmiddelen in GlyConnect worden gebruikt om potentiële glycaanliganden te detecteren die worden beschreven samen met de eiwitten die ze herkennen in UniLectin16, gekoppeld aan GlyConnect via glycanen. Het protocol dat hier wordt gepresenteerd, is verdeeld in twee secties om vragen te behandelen die specifiek zijn voor N-gebonden en O-gebonden glycanen en glycoproteïnen.

Protocol

OPMERKING: Een apparaat met een internetverbinding (bij voorkeur een groter scherm) en een up-to-date webbrowser zoals Chrome of Firefox is vereist. Het gebruik van Safari of Edge is mogelijk niet zo betrouwbaar. 1. Van een eiwit N-glycoom in GlyConnect naar een lectine van UniLectin Toegang tot bronnen vanuit Glyco@ExpasyOPMERKING: De hier beschreven procedure is om toegang te krijgen tot GlyConnect, maar kan worden toegepast op toegang tot elke…

Representative Results

Het eerste deel van het protocol (sectie 1) liet zien hoe de specificiteit of de gemeenschappelijkheid van N-glycanen bevestigd op Asn-69 van het menselijke prostaatspecifiek antigeen (PSA) kan worden onderzocht met behulp van het GlyConnect-platform. Weefselafhankelijke (urine en zaadvloeistof), evenals isovormafhankelijke (normale en hoge pI) variaties in glycaanexpressie, werden benadrukt met behulp van twee visualisatietools (figuur 4 en figuur 5</st…

Discussion

GlyConnect Octopus als hulpmiddel voor het onthullen van onverwachte correlaties
GlyConnect Octopus is oorspronkelijk ontworpen om de database te doorzoeken met een losse definitie van glycanen. Inderdaad, de literatuur vermeldt vaak de belangrijkste kenmerken van glycanen in een glycoom, zoals gefucosyleerd of gesialyleerd zijn, gemaakt zijn van twee of meer antennes, enz. Bovendien worden glycanen, of ze nu N- of O-gebonden zijn, geclassificeerd in kernen, zoals beschreven in de referentiehandleidin…

Disclosures

The authors have nothing to disclose.

Acknowledgements

De auteur erkent van harte vroegere en huidige leden van de Proteome Informatics Group die betrokken zijn bij het ontwikkelen van de middelen die in deze tutorial worden gebruikt, met name Julien Mariethoz en Catherine Hayes voor GlyConnect, François Bonnardel voor UniLectin, Davide Alocci en Frederic Nikitin voor de Octopus, en Thibault Robin voor Compozitor en de laatste hand aan Octopus.

De ontwikkeling van het glyco@Expasy project wordt ondersteund door de Zwitserse federale overheid via het staatssecretariaat voor onderwijs, onderzoek en innovatie (SERI) en wordt momenteel aangevuld door de Zwitserse National Science Foundation (SNSF: 31003A_179249). ExPASy wordt onderhouden door het Zwitserse Instituut voor Bioinformatica en gehost in het Vital-IT Competency Center. De auteur erkent ook Anne Imberty voor de uitstekende samenwerking op het UniLectin-platform, gezamenlijk ondersteund door ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video