Dit protocol illustreert hoe menselijke eiwitglyomen kunnen worden verkend, vergeleken en geïnterpreteerd met online bronnen.
Het Glyco@Expasy initiatief werd gelanceerd als een verzameling van onderling afhankelijke databases en hulpmiddelen die verschillende aspecten van kennis in glycobiologie omvatten. In het bijzonder is het gericht op het benadrukken van interacties tussen glycoproteïnen (zoals celoppervlakreceptoren) en koolhydraatbindende eiwitten gemedieerd door glycanen. Hier worden belangrijke bronnen van de collectie geïntroduceerd door middel van twee illustratieve voorbeelden gericht op het N-glycoom van het menselijke prostaatspecifiek antigeen (PSA) en het O-glycoom van menselijke serumeiwitten. Door middel van verschillende databasequery’s en met behulp van visualisatietools laat dit artikel zien hoe u inhoud in een continuüm kunt verkennen en vergelijken om anders verspreide stukjes informatie te verzamelen en te correleren. Verzamelde gegevens zijn bestemd om meer uitgebreide scenario’s van de glycaanfunctie te voeden. Glycoinformatica die hier wordt geïntroduceerd, wordt daarom voorgesteld als een middel om aannames over de specificiteit van een eiwitglycol in een bepaalde context te versterken, vorm te geven of te weerleggen.
Glycanen, eiwitten waaraan ze zijn gehecht (glycoproteïnen) en eiwitten waaraan ze binden (lectines of koolhydraatbindende eiwitten) zijn de belangrijkste moleculaire actoren aan het celoppervlak1. Ondanks deze centrale rol in cel-celcommunicatie zijn grootschalige studies, waaronder glycomics, glycoproteomics of glycan-interactomics-gegevens nog steeds schaars in vergelijking met hun tegenhanger in genomics en proteomics.
Tot voor kort waren er geen methoden ontwikkeld voor het karakteriseren van de vertakkende structuren van complexe koolhydraten terwijl ze nog steeds worden geconjugeerd aan het dragereiwit. De biosynthese van glycoproteïnen is een niet-sjabloongestuurd proces waarin de monosaccharidedonoren, de accepterende glycoproteïnesubstraten en de glycosyltransferasen en glycosidasen een interactieve rol spelen. De resulterende glycoproteïnen kunnen complexe structuren dragen met meerdere vertakkingspunten waar elke monosaccharidecomponent een van de verschillende soorten kan zijn die in de natuur aanwezig zijn1. Het niet-sjabloongestuurde proces legt biochemische analyse op als de enige optie voor het genereren van oligosaccharide structurele gegevens. Het analytische proces van glycaanstructuren die aan een inheems eiwit zijn bevestigd, is vaak een uitdaging omdat het gevoelige, kwantitatieve en robuuste technologieën vereist om de samenstelling van monosacchariden, koppelingen en vertakkingssequenties2 te bepalen.
In deze context is massaspectrometrie (MS) de meest gebruikte techniek in glycomics en glycoproteomics experimenten. Naarmate de tijd verstrijkt, worden deze uitgevoerd in instellingen met een hogere doorvoer en verzamelen gegevens zich nu in databases. Glycan-structuren in verschillende formaten3, vullen GlyTouCan4, de universele glycaan-gegevensopslagplaats waar elke structuur is gekoppeld aan een stabiele identificatie, ongeacht het niveau van precisie waarmee de glycaan is gedefinieerd (bijvoorbeeld mogelijk ontbrekend koppelingstype of dubbelzinnige samenstelling). Zeer vergelijkbare structuren worden verzameld, maar hun kleine verschillen worden duidelijk gemeld. Glycoproteïnen worden beschreven en samengesteld in GlyConnect5 en GlyGen6, twee databases die naar elkaar verwijzen. MS-gegevens die structurele bewijsstukken ondersteunen, worden steeds vaker opgeslagen in GlycoPOST7. Voor een bredere dekking van online bronnen is hoofdstuk 52 van de referentiehandleiding, Essentials of Glycobiology, gewijd aan glycoinformatica8. Interessant is dat glycopeptide-identificatiesoftware zich de afgelopen jaren heeft verspreid9,10, maar niet ten behoeve van de reproduceerbaarheid. Deze laatste bezorgdheid bracht de leiders van het HUPO GlycoProteomics Initiative (HGI) ertoe om in 2019 een software-uitdaging aan te gaan. De MS-gegevens verkregen uit de verwerking van complexe mengsels van N- en O-geglycosyleerde humane serumeiwitten in CID-, ETD- en EThcD-fragmentatiemodi, werden beschikbaar gesteld aan concurrenten, of het nu softwaregebruikers of ontwikkelaars waren. Het volledige rapport over de resultaten van deze challenge11 wordt alleen hier geschetst. Om te beginnen werd een spreiding van identificaties waargenomen. Het werd voornamelijk geïnterpreteerd als veroorzaakt door de diversiteit van methoden geïmplementeerd in zoekmachines, van hun instellingen, en hoe outputs werden gefilterd, en peptide “geteld”. Het experimentele ontwerp kan ook sommige software en benaderingen in een (de)voordeel hebben geplaatst. Belangrijk is dat deelnemers die dezelfde software gebruikten inconsistente resultaten rapporteerden, waardoor ernstige reproduceerbaarheidsproblemen werden benadrukt. Door verschillende inzendingen te vergelijken, werd geconcludeerd dat sommige softwareoplossingen beter presteren dan andere en dat sommige zoekstrategieën betere resultaten opleveren. Deze feedback zal waarschijnlijk de verbetering van geautomatiseerde glycopeptidegegevensanalysemethoden begeleiden en zal op zijn beurt van invloed zijn op de database-inhoud.
De uitbreiding van glycoinformatica leidde tot het creëren van webportalen die informatie en toegang bieden tot meerdere vergelijkbare of aanvullende bronnen. De meest recente en actuele worden beschreven in een hoofdstuk van de Comprehensive Glycoscience boekenreeks12 en door samenwerking wordt een oplossing voor het delen van gegevens en informatie-uitwisseling aangeboden in een open access modus. Een dergelijk portaal werd ontwikkeld dat oorspronkelijk Glycomics@ExPASy 13 heette en werd omgedoopt tot Glyco@Expasy, na de grote revisie van het Expasy-platform14 dat al tientallen jaren een grote verzameling tools en databases host die in verschillende omics worden gebruikt, het meest populaire item is UniProt15 – de universele eiwitkennisbank. Glyco@Expasy biedt een didactische ontdekking van het doel en het gebruik van databases en tools, gebaseerd op een visuele categorisatie en een weergave van hun onderlinge afhankelijkheden. Het volgende protocol illustreert procedures om glycomics en glycoproteomics-gegevens te verkennen met een selectie van bronnen uit dit portaal die de verbinding tussen glycoproteomics en glycan-interactomics expliciet maakt via glycomics. Zoals het is, produceren glycomics-experimenten structuren waarbij monosacchariden volledig zijn gedefinieerd en koppelingen gedeeltelijk of volledig worden bepaald, maar hun aanhechting van de eiwitplaats wordt slecht of helemaal niet gekarakteriseerd. Glycoproteomics-experimenten genereren daarentegen nauwkeurige informatie over de hechting van de plaats, maar met een slechte resolutie van glycaanstructuren, vaak beperkt tot monosaccharidesamenstellingen. Deze informatie is verzameld in de GlyConnect-database. Bovendien kunnen zoekhulpmiddelen in GlyConnect worden gebruikt om potentiële glycaanliganden te detecteren die worden beschreven samen met de eiwitten die ze herkennen in UniLectin16, gekoppeld aan GlyConnect via glycanen. Het protocol dat hier wordt gepresenteerd, is verdeeld in twee secties om vragen te behandelen die specifiek zijn voor N-gebonden en O-gebonden glycanen en glycoproteïnen.
GlyConnect Octopus als hulpmiddel voor het onthullen van onverwachte correlaties
GlyConnect Octopus is oorspronkelijk ontworpen om de database te doorzoeken met een losse definitie van glycanen. Inderdaad, de literatuur vermeldt vaak de belangrijkste kenmerken van glycanen in een glycoom, zoals gefucosyleerd of gesialyleerd zijn, gemaakt zijn van twee of meer antennes, enz. Bovendien worden glycanen, of ze nu N- of O-gebonden zijn, geclassificeerd in kernen, zoals beschreven in de referentiehandleidin…
The authors have nothing to disclose.
De auteur erkent van harte vroegere en huidige leden van de Proteome Informatics Group die betrokken zijn bij het ontwikkelen van de middelen die in deze tutorial worden gebruikt, met name Julien Mariethoz en Catherine Hayes voor GlyConnect, François Bonnardel voor UniLectin, Davide Alocci en Frederic Nikitin voor de Octopus, en Thibault Robin voor Compozitor en de laatste hand aan Octopus.
De ontwikkeling van het glyco@Expasy project wordt ondersteund door de Zwitserse federale overheid via het staatssecretariaat voor onderwijs, onderzoek en innovatie (SERI) en wordt momenteel aangevuld door de Zwitserse National Science Foundation (SNSF: 31003A_179249). ExPASy wordt onderhouden door het Zwitserse Instituut voor Bioinformatica en gehost in het Vital-IT Competency Center. De auteur erkent ook Anne Imberty voor de uitstekende samenwerking op het UniLectin-platform, gezamenlijk ondersteund door ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).
internet connection | user's choice | ||
recent version of web browser | user's choice |