Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Bioinformatik-Ressourcen zur Untersuchung von Glykan-vermittelten Proteininteraktionen

Published: January 20, 2022 doi: 10.3791/63356

Summary

Dieses Protokoll veranschaulicht, wie man menschliche Proteinglycomes mit Online-Ressourcen erforscht, vergleicht und interpretiert.

Abstract

Die Glyco@Expasy Initiative wurde als eine Sammlung von voneinander abhängigen Datenbanken und Werkzeugen ins Leben gerufen, die verschiedene Aspekte des Wissens in der Glykobiologie abdecken. Insbesondere zielt es darauf ab, Wechselwirkungen zwischen Glykoproteinen (wie Zelloberflächenrezeptoren) und kohlenhydratbindenden Proteinen, die durch Glykane vermittelt werden, hervorzuheben. Hier werden die wichtigsten Ressourcen der Sammlung anhand von zwei illustrativen Beispielen vorgestellt, die sich auf das N-Glycome des menschlichen Prostata-spezifischen Antigens (PSA) und das O-Glycome menschlicher Serumproteine konzentrieren. Durch verschiedene Datenbankabfragen und mit Hilfe von Visualisierungswerkzeugen zeigt dieser Artikel, wie man Inhalte in einem Kontinuum erforscht und vergleicht, um ansonsten verstreute Informationen zu sammeln und zu korrelieren. Die gesammelten Daten sind dazu bestimmt, ausgefeiltere Szenarien der Glykanfunktion zu füttern. Die hier eingeführte Glycoinformatics wird daher als Mittel vorgeschlagen, um Annahmen über die Spezifität eines Proteinglykoms in einem bestimmten Kontext entweder zu stärken, zu formen oder zu widerlegen.

Introduction

Glykane, Proteine, an die sie gebunden sind (Glykoproteine) und Proteine, an die sie binden (Lektine oder kohlenhydratbindende Proteine), sind die wichtigsten molekularen Akteure an der Zelloberfläche1. Trotz dieser zentralen Rolle in der Zell-Zell-Kommunikation sind groß angelegte Studien, einschließlich Glykomik, Glykoproteomik oder Glykan-Interactomie-Daten, im Vergleich zu ihrem Gegenstück in der Genomik und Proteomik immer noch knapp.

Bis vor kurzem wurden keine Methoden entwickelt, um die Verzweigungsstrukturen komplexer Kohlenhydrate zu charakterisieren, während sie noch mit dem Trägerprotein konjugiert sind. Die Biosynthese von Glykoproteinen ist ein nicht vorlagengetriebener Prozess, bei dem die Monosaccharidspender, die akzeptierenden Glykoproteinsubstrate sowie die Glykosyltransferasen und Glykosidasen eine interaktive Rolle spielen. Die resultierenden Glykoproteine können komplexe Strukturen mit mehreren Verzweigungspunkten tragen, wobei jede Monosaccharidkomponente eine der verschiedenen in der Natur vorkommenden Typen sein kann1. Der nicht vorlagengesteuerte Prozess erzwingt die biochemische Analyse als einzige Möglichkeit zur Generierung von Oligosaccharid-Strukturdaten. Der analytische Prozess von Glykanstrukturen, die an ein natives Protein gebunden sind, ist oft eine Herausforderung, da er empfindliche, quantitative und robuste Technologien zur Bestimmung der Monosaccharidzusammensetzung, -verknüpfungen und -verzweigungssequenzen erfordert2.

In diesem Zusammenhang ist die Massenspektrometrie (MS) die am weitesten verbreitete Technik in Glykomik- und Glykoproteomik-Experimenten. Im Laufe der Zeit werden diese in höheren Durchsatzeinstellungen durchgeführt und Daten sammeln sich nun in Datenbanken an. Glykanstrukturen in verschiedenen Formaten3, füllen GlyTouCan4, das universelle Glykan-Datenrepository, in dem jede Struktur mit einem stabilen Identifikator verknüpft ist, unabhängig von der Genauigkeit, mit der das Glykan definiert ist (z. B. möglicherweise fehlender Verknüpfungstyp oder mehrdeutige Zusammensetzung). Sehr ähnliche Strukturen werden gesammelt, aber ihre geringfügigen Unterschiede werden deutlich berichtet. Glykoproteine werden in GlyConnect5 und GlyGen6 beschrieben und kuratiert, zwei Datenbanken, die sich gegenseitig referenzieren. MS-Daten, die strukturelle Beweismittel unterstützen, werden zunehmend in GlycoPOST7 gespeichert. Für eine breitere Abdeckung von Online-Ressourcen ist Kapitel 52 des Referenzhandbuchs Essentials of Glycobiology der Glykoinformatik8 gewidmet. Interessanterweise hat sich die Glykopeptid-Identifizierungssoftware in den letzten Jahren stark ausgebreitet9,10, wenn auch nicht zum Vorteil der Reproduzierbarkeit. Die letztgenannte Sorge veranlasste die Leiter der HUPO GlycoProteomics Initiative (HGI), 2019 eine Software-Herausforderung zu stellen. Die MS-Daten, die aus der Verarbeitung komplexer Mischungen von N- und O-glykosylierten humanen Serumproteinen in CID-, ETD- und EThcD-Fragmentierungsmodi gewonnen wurden, wurden Wettbewerbern, ob Softwareanwendern oder Entwicklern, zur Verfügung gestellt. Der vollständige Bericht über die Ergebnisse dieser Herausforderung11 wird hier nur skizziert. Zunächst wurde eine Ausbreitung von Identifikationen beobachtet. Es wurde hauptsächlich so interpretiert, dass es durch die Vielfalt der in Suchmaschinen implementierten Methoden, ihrer Einstellungen und der Art und Weise, wie Ausgaben gefiltert und Peptide "gezählt" wurden, verursacht wurde. Das experimentelle Design könnte auch einige Software und Ansätze in einen (Nachteil) gebracht haben. Wichtig ist, dass Teilnehmer, die dieselbe Software verwendeten, inkonsistente Ergebnisse meldeten und dadurch schwerwiegende Reproduzierbarkeitsprobleme hervorhoben. Durch den Vergleich verschiedener Einreichungen wurde festgestellt, dass einige Softwarelösungen besser abschneiden als andere und einige Suchstrategien bessere Ergebnisse liefern. Dieses Feedback wird wahrscheinlich zur Verbesserung automatisierter Glykopeptid-Datenanalysemethoden führen und sich wiederum auf den Datenbankinhalt auswirken.

Die Expansion der Glykoinformatik führte zur Schaffung von Webportalen, die Informationen und Zugang zu mehreren ähnlichen oder sich ergänzenden Ressourcen bieten. Die neuesten und aktuellsten werden in einem Kapitel der Comprehensive Glycoscience Buchreihe12 beschrieben und durch die Zusammenarbeit wird eine Lösung für den Datenaustausch und Informationsaustausch im Open-Access-Modus angeboten. Ein solches Portal wurde entwickelt, das ursprünglich Glycomics@ExPASy 13 hieß und in Glyco@Expasy umbenannt wurde, nach der Generalüberholung der Expasy-Plattform14, die seit Jahrzehnten eine große Sammlung von Tools und Datenbanken beherbergt, die in mehreren -omics verwendet werden, wobei das beliebteste Element UniProt15 ist - die universelle Protein-Wissensdatenbank. Glyco@Expasy bietet eine didaktische Entdeckung des Zwecks und der Nutzung von Datenbanken und Werkzeugen, basierend auf einer visuellen Kategorisierung und einer Darstellung ihrer Interdependenzen. Das folgende Protokoll veranschaulicht Verfahren zum Untersuchen von Glykomik- und Glykoproteomik-Daten mit einer Auswahl von Ressourcen aus diesem Portal, die die Verbindung zwischen Glykoproteomik und Glykan-Interactomics über Glykomik explizit machen. So wie es ist, erzeugen Glykomik-Experimente Strukturen, in denen Monosaccharide vollständig definiert und Verknüpfungen teilweise oder vollständig bestimmt sind, aber ihre Protein-Site-Bindung ist schlecht, wenn überhaupt, charakterisiert. Im Gegensatz dazu erzeugen Glykoproteomik-Experimente präzise Standortbindungsinformationen, jedoch mit einer schlechten Auflösung von Glykanstrukturen, die oft auf Monosaccharidzusammensetzungen beschränkt sind. Diese Informationen werden in der GlyConnect-Datenbank zusammengefasst. Darüber hinaus können Suchwerkzeuge in GlyConnect verwendet werden, um potenzielle Glykanliganden aufzuspüren, die zusammen mit den Proteinen, die sie in UniLectin16 erkennen, beschrieben werden, die über Glykane mit GlyConnect verbunden sind. Das hier vorgestellte Protokoll ist in zwei Abschnitte unterteilt, um spezifische Fragen zu N-verknüpften und O-verknüpften Glykanen und Glykoproteinen zu behandeln.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

HINWEIS: Ein Gerät mit einer Internetverbindung (größerer Bildschirm bevorzugt) und einem aktuellen Webbrowser wie Chrome oder Firefox ist erforderlich. Die Verwendung von Safari oder Edge ist möglicherweise nicht so zuverlässig.

1. Von einem Protein-N-Glycome in GlyConnect zu einem Lektin von UniLectin

  1. Zugreifen auf Ressourcen von Glyco@Expasy aus
    HINWEIS: Das hier beschriebene Verfahren ist der Zugriff auf GlyConnect, kann jedoch auf den Zugriff auf jede auf der Plattform aufgezeichnete Ressource angewendet werden.
    1. Gehen Sie zu https://glycoproteome.expasy.org/glycomics-expasy und betrachten Sie das Blasendiagramm auf der rechten Seite, das verschiedene Kategorien wie Glykokonjugate oder Glykanbindung zeigt. Aktivieren Sie im Menü ganz links, das die Kategorien in den Blasen widerspiegelt, das Kontrollkästchen Glykoproteine, damit das Blasendiagramm auf der rechten Seite sofort die Blase vergrößert, die dieser Kategorie entspricht.
      HINWEIS: Grüne Blasen sind Werkzeuge und gelbe Blasen sind Datenbanken. Wenn Sie auf einen der beiden klicken, wird erneut vergrößert, um Details zur Ressource anzugeben. Bevor Sie dies tun, möchte der Benutzer möglicherweise die Abhängigkeiten dieser Ressource zu anderen verstehen.
    2. Um die Informationen zu Abhängigkeiten abzurufen, wechseln Sie von der Registerkarte Thematische Ressourcenklassifizierung zur Registerkarte Ressourcenabhängigkeitsrad . Platzieren Sie die Maus auf GlyConnect im Rad, um den Grad der Integration mit anderen Quellen zu überprüfen (Abbildung 1).
    3. Gehen Sie zurück zur Registerkarte Resource Thematic Classification, um die GlyConnect-Blase wie in Schritt 1.1.1 zu erreichen, und klicken Sie darauf (Ergänzende Abbildung 1), um die GlyConnect-Startseite in einer neuen Registerkarte anzuzeigen, die die Statistiken des Inhalts in der neuesten Version der Datenbank anzeigt.
      HINWEIS: Ein in Tabelle 1 beschriebenes Farbschema stimmt mit den verschiedenen Arten von Informationen überein, die in der Datenbank gespeichert sind. Dieser Farbcode ist auf allen Entitätsseiten in GlyConnect gültig und durchgängig konsistent. Die Homepage zeigt auch vier Abschnitte, die fokussierten Datensätzen gewidmet sind, z. B. solchen, die die Glykosylierung des Sars-Cov-2-Spike-Proteins (COVID-19) beschreiben oder die menschlichen Milcholigosaccharide (HMO) ausführlich beschreiben. Diese werden in diesem Protokoll nicht untersucht.
  2. Erforschung der Kontextinformationen eines Protein-N-Glykoms
    HINWEIS: Alle Glykanstrukturen in GlyConnect werden in drei alternativen und häufig verwendeten Formaten angezeigt: (1) Symbolnomenklatur für Glykane (SNFG)17 (2) IUPAC kondensiert18und (3) Oxford19. Im Gegensatz dazu gibt es keine Standardnotation, um die Glykanzusammensetzung auszudrücken. In GlyConnect wird der folgende Code verwendet: Hex für Hexose, HexNAc für N-Acetylhexosamin, dHex für Fukose und NeuAc für Sialinsäuren. Der Einfachheit halber stützen sich Visualisierungswerkzeuge auf eine komprimierte Notation: H für Hexose, N für N-Acetylhexosamin, F für Fukose und S für Sialinsäuren. Darüber hinaus bezeichnen kleine Buchstaben Modifikationen wie "a" für Acetylierung, "p" für Phosphorylierung und "s" für Sulfatierung für den häufigsten dieser sogenannten Substituenten.
    1. Um das N-Glycome des menschlichen Prostata-spezifischen Antigens (PSA) auf der GlyConnect-Homepage anzuzeigen und zu erkunden, gehen Sie wie folgt vor.
      HINWEIS: Die Glykosylierung von menschlichem PSA wurde im Laufe der Jahre untersucht, insbesondere im Zusammenhang mit Prostatakrebs. Die GlyConnect-Datenbank speichert drei Referenzen20,21,22, die Glykomik- und Glykoproteomik-Daten kombinieren. Beachten Sie, dass die hier bereitgestellten Ergebnisse mit der Version von GlyConnect im September 2021 erzielt wurden. Die spätere Nutzung der Datenbank kann aufgrund häufiger Datenaktualisierungen zu leicht unterschiedlichen Statistiken führen.
    2. Wählen Sie die Schaltfläche PROTEIN , um die Proteinansicht der Datenbank zu öffnen. Geben Sie auf der Proteinansichtsseite Prostata in das Suchfenster ein. Suchen Sie nach den beiden Einträgen, die in der Ausgabe aufgeführt sind und zwei Isoformen von PSA mit unterschiedlichen pI-Werten unterscheiden. Klicken Sie auf 790 (Spalte ID), die der gemeinsamen Isoform von PSA entspricht.
      HINWEIS: Suchen Sie nach dem oberen mehrfarbigen Balken, der zusammenfassende Informationen aus der veröffentlichten Arbeit im oben beschriebenen Schema anzeigt. Mehrere Optionen für die Navigation sind möglich, wie unten beschrieben.
    3. Klicken Sie in der oberen mehrfarbigen Leiste auf die grüne Schaltfläche QUELLE , um die Probentypen anzuzeigen, aus denen die veröffentlichten Daten verarbeitet wurden: Urin und Samenflüssigkeit. Um diese Informationen weiter zu durchsuchen, klicken Sie auf einen dieser Beispieltypen. Gleiches gilt für jeden Artikel, der erscheint, wenn man auf einen farbigen Button klickt.
    4. Um den gesundheitsbezogenen Inhalt der Datenbank zu überprüfen, klicken Sie auf die Schaltfläche KRANKHEIT , die zwei Elemente enthält, von denen einer Prostatakrebs ist, der auf die entsprechende spezielle Krankheitsseite in GlyConnect verweist. Die Zusammenfassung für diese Seite zeigt, dass drei groß angelegte Studien 319 Zusammensetzungen an 1.087 Stellen in 308 menschlichen Proteinen berichtet haben.
    5. Klicken Sie auf die Schaltfläche STRUKTUR , um die vollständige Liste der 135 Strukturen anzuzeigen, die mit PSA aus Glycomics-Daten verknüpft sind. Klicken Sie auf die Schaltfläche COMPOSITION für die zugehörigen 78 Zusammensetzungen, die durch Glykoproteomik-Experimente bestimmt wurden. Klicken Sie auf eine beliebige Struktur oder Komposition, um weitere Details zu erhalten.
      HINWEIS: Details wie die Liste der alternativen Proteine, die die jeweilige Struktur tragen, oder die Liste der Strukturen, die der Zusammensetzung entsprechen, können erhalten werden. Es ist bekannt, dass PSA nur eine N-Glykosylierungsstelle bei Asn-69 hat (nur ein Element zählte für die braune SITE-Taste ).
    6. Um die Mehrdeutigkeit von Kompositionen zu reduzieren, klicken Sie auf VORGESCHLAGENE STRUKTUR unter einer ausgewählten Komposition (z. B. Hex:6 HexNAc:3 NeuAc:1). Ein Vorschlag wird jedes Mal gemacht, wenn die Monosaccharidzahl mit der einer oben aufgeführten Struktur übereinstimmt (Abbildung 2).
      HINWEIS: Die Hex:6 HexNAc:3 NeuAc:1-Zusammensetzung, die durch ein Glykoproteomik-Experiment erzeugt wurde, ist auf vier höher aufgelöste Strukturen aus den Glykomikdaten abgestimmt. Im Falle von PSA gibt es keine Mehrdeutigkeit an der Stelle, da nur Asn-69 glykosyliert ist.
    7. Um die Proteinseite vollständig zu erkunden, sehen Sie sich weitere Details auf der rechten Seite der Seite an (Abbildung 3).
      1. Sehen Sie sich den Standardeintrag 3QUM PDB (Protein Data Bank23) für PSA an, der mit zwei komplexen Glykanen gezeigt wird, die an jedes Monomer gebunden sind (Abbildung 3) oder den alternativen 2ZCK-Eintrag , der auch aufgrund eines angehängten Kohlenhydrats verfügbar ist. Der zweite Eintrag zeigt eine einzelne Kette.
        HINWEIS: Beide Einträge werden mit dem 3D LiteMol plugin24 visualisiert, das Glykane in SNFG-3D-Notation anzeigt, die in der PDB-RCSB übernommen wurden.
      2. Klicken Sie auf die entsprechenden Links anderer Querverweise, um relevante Funktionsinformationen aus wichtigen Proteomik-Datenbanken wie UniProt zu untersuchen (Abbildung 3).
  3. Visualisierung und Korrelation der Kontextinformationen eines Protein-N-Glykoms
    HINWEIS: Wie im vorherigen Abschnitt zu sehen ist, können lange Listen von Strukturen oder Kompositionen als Ganzes schwer zu verstehen sein, und GlyConnect stützt sich auf zwei verschiedene Tools, um Schlüsselinformationen zu visualisieren, nämlich GlyConnect Octopus und GlyConnect Compozitor (das erste erweitert die Zusammenfassungsinformationen, die in farbigen Schaltflächen erfasst werden, und das zweite zeigt strukturelle Abhängigkeiten in Bezug auf eine Struktur / Zusammensetzung auf, die in einer anderen enthalten ist). Wie unten dargestellt, untersucht GlyConnect Octopus Assoziationen zwischen den verschiedenen in der Datenbank gespeicherten Entitäten, indem mehrere oder einzelne Verbindungen als Reflektion des Datenbankinhalts hervorgehoben werden.
    1. Führen Sie eine GlyConnect Octopus-Suche durch, um das Vorhandensein gemeinsamer struktureller Merkmale wie hybride Kernstrukturen und hochfrequente Sialinsäure-haltige Strukturen in der Vielfalt der an PSA gebundenen Glykane zu bestätigen, wie unten beschrieben.
    2. Gehen Sie auf die Octopus-Homepage https://glyconnect.expasy.org/octopus/. Lassen Sie die Registerkarte N-Verknüpfung standardmäßig ausgewählt. Wechseln Sie zur Unterregisterkarte Kerne und klicken Sie auf das Symbol Hybrid . Wechseln Sie zur Unterregisterkarte Eigenschaften und klicken Sie auf das Symbol Sialyliert . Klicken Sie unten auf die grüne Schaltfläche Suchen .
      HINWEIS: Die Suchergebnisse werden grafisch als Beziehungen zwischen drei Kategorien von Elementen angezeigt. Standardmäßig stimmt die mittlere Liste mit der Abfrage nach Zusammensetzungen überein, die linke Sammlung umfasst verwandte Proteine und die rechte mit verwandten Glykanen.
    3. Bewegen Sie im angezeigten Diagramm der Beziehungen den Mauszeiger über H6N4F1S1, um Verbindungen zu sechs Proteinen und drei Strukturen hervorzuheben. Vergleichen Sie dies, indem Sie mit der Maus über H6N4F2S1 fahren, das die beiden Isoformen von PSA (beide als UniProt ID: KLK3_HUMAN bezeichnet) und eine Struktur (ID: 10996) herausgreift. Bewegen Sie den Mauszeiger über die Struktur-ID, um ihre SNFG-Darstellung anzuzeigen, und klicken Sie darauf, um die entsprechende Seite zu öffnen (Ergänzende Abbildung 2).
    4. Ändern Sie die Knoten des Oktopus zu einem anderen Thema, das den Kontext der Glykosylierung beschreibt. Der Farbcode bleibt derselbe wie der zuvor beschriebene (siehe Tabelle 1).
      1. Ändern Sie die mittleren Knoten in Gewebe , um 15 Optionen in der Mitte des Diagramms anzuzeigen, von denen viele Körperflüssigkeiten sind. Suchen Sie nach allen Assoziationen zwischen Proteinen und Glykanen, die der Abfrage entsprechen, abhängig von Gewebeinformationen. Platzieren Sie den Cursor auf Urin oder Samenflüssigkeit in der Mitte des Diagramms, um verschiedene Assoziationen anzuzeigen (Abbildung 4A, B).
      2. Ändern Sie die Center-Knoten in Krankheit , um 13 Optionen anzuzeigen, von denen eine Prostatakrebs ist. Das einzige assoziierte Protein ist PSA (KLK3_HUMAN) (Ergänzende Abbildung 3).
        HINWEIS: Ein genauerer Blick auf das auf der Proteinseite gezeigte PSA-N-Glycome zeigt die sehr hohe Frequenz eines terminalen NeuAc(a?-?) Gal(b?-?) GlcNAc-Unterkonstruktion in vielen Fällen auf Strukturen mit zwei oder drei Antennen. Ein weiterer Oktopus kann auf dieser Grundlage erzeugt werden, wie unten beschrieben.
    5. Klicken Sie auf die Schaltfläche Löschen , um die Suche zu aktualisieren. Wechseln Sie zur Unterregisterkarte Eigenschaften und klicken Sie auf das Symbol Bi-antennary. Wechseln Sie zur Unterregisterkarte Determinanten und klicken Sie auf das Symbol 3-Sialyl-LN (Typ 2). Klicken Sie unten auf die grüne Schaltfläche Suchen .
    6. Überprüfen Sie die vom Oktopus gewonnenen Assoziationen mit Bi-Antennen-Glykanen, die ein terminales 3-Sialyl-LN (Typ 2) -Motiv enthalten, d.h. NeuAc(a1-3)Gal(b1-4)GlcNAc. Ändern Sie die mittleren Knoten in Gewebe , um das Lesen zu erleichtern, und bewegen Sie den Mauszeiger über KLK3_HUMAN, um die Samenflüssigkeit direkt mit der gemeinsamen PSA-Isoform und sieben Strukturen zu verbinden (Ergänzende Abbildung 4).
      HINWEIS: Das zweite Visualisierungstool, GlyConnect Compozitor, führt den Scan potenzieller Beziehungen zwischen jeder einzelnen Komposition in einer Liste davon durch (siehe unten). Eine Beziehung unterscheidet sich von nur einem Monosaccharid zwischen zwei Zusammensetzungen. Diese identifizierten Beziehungen, die in einem Diagramm dargestellt sind, zeigen die (Dis-)Kontinuität eines Glykoms auf.
    7. Verwenden Sie GlyConnect Compozitor, um den Scan potenzieller Beziehungen zwischen jeder einzelnen Komposition in einer Liste davon durchzuführen, wie unten für den Fall von PSA dargestellt.
      HINWEIS: GlyConnect Compozitor verarbeitet Kompositionen in Verbindung mit einem Kontext. Es bietet verschiedene Registerkarten für die Abfrage von GlyConnect, z. B. Proteine, Quellen, Zelllinien, Krankheiten, die selbsterklärend sind, um einen Kontext zu qualifizieren. Dies wird hier mit PSA wie folgt veranschaulicht.
    8. Gehen Sie zurück zur Proteinseite von PSA: https://glyconnect.expasy.org/browser/proteins/790. Klicken Sie auf der rechten Seite der PSA-Einstiegsseite auf den Compozitor-Link. Stellen Sie sicher, dass die Compozitor-Suchfelder mit den Details des Id 790-Eintrags auf der Registerkarte Protein vorausgefüllt sind (Protein : Prostataspezifisches Antigen, Spezies: Homo sapiens und Glykantyp: N-verknüpft).
    9. Klicken Sie auf die Schaltfläche Zur Auswahl hinzufügen , um Daten aus der Datenbank abzurufen und das Diagramm der verbundenen Kompositionen anzuzeigen. Deaktivieren Sie die Option Virtuelle Knoten einschließen . Klicken Sie auf die Schaltfläche Diagramm berechnen, um ein Diagramm anzuzeigen, das einen gut verbundenen Satz von 78 Kompositionen zeigt, die das PSA-N-Glykom darstellen, und ein Balkendiagramm , das die Hauptmerkmale der Glykane zeigt.
    10. Bewegen Sie den Mauszeiger über den violetten Balken im Balkendiagramm, der alle sialylierten Strukturen im Diagramm lokalisiert, um eine beobachtbare Verzerrung gegenüber sialylierten Strukturen zu erkennen.
    11. Bleiben Sie auf der Hauptregisterkarte Protein und wählen Sie Prostataspezifisches Antigen - hohe Pi-Isoform (psah) im Feld Protein (Name) aus.
      HINWEIS: Die Felder Glykantyp und Glykanstelle werden automatisch ausgefüllt.
    12. Klicken Sie auf die Schaltfläche Zur Auswahl hinzufügen , um Daten aus der Datenbank abzurufen, die sich auf 57 Kompositionen belaufen. Klicken Sie auf die Schaltfläche Diagramm berechnen, um die überlagerten Graphen beider Isoformen zu generieren und die Unterschiede in den Glycome der beiden PSA-Isoformen zu bewerten. Bewegen Sie den Mauszeiger über Knotenbeschriftungen, um die Anzeige der Anzahl der Strukturen aufzufordern, die den Kompositionen/Beschriftungen entsprechen (Abbildung 5).
  4. Glykan-bindende Information in UniLectin
    HINWEIS: Erinnern Sie sich an die im Oktopus getestete Determinante, die als NeuAc(a2-3)Gal(b1-4) beschrieben wird. Per Definition ist es ein etablierter Bindungsteil einer Glykanstruktur und kann als solches in der UniLectin3D-Datenbank durchsucht werden25.
    1. Gehen Sie zu https://www.unilectin.eu/ und klicken Sie auf die Schaltfläche UniLectin3D. Alternativ können Sie direkt auf die Seite gehen: https://www.unilectin.eu/unilectin3D/.Click auf der Schaltfläche Glykansuche , um diese Seite zu öffnen: https://www.unilectin.eu/unilectin3D/glycan_search (Ergänzende Abbildung 6).
    2. Klicken Sie auf den violetten Diamanten, der eine Sialinsäure darstellt, wodurch alle Glykanbindungsmotive angezeigt werden, die mit einer in der Datenbank gespeicherten Sialinsäure enden. Der obere Teil dieser Motivsammlung enthält das zuvor untersuchte NeuAc(a2-3)Gal(b1-4)GlcNAc-Motiv (Ergänzende Abbildung 7).
    3. Klicken Sie auf das NeuAc(a2-3)Gal(b1-4)GlcNAc-Motiv, um die Anzeige aller Lektine aufzufordern, für die eine 3D-Struktur bekannt ist, die die Interaktion mit NeuAc(a2-3)Gal(b1-4)GlcNAc bestätigt. Das Ergebnis zeigt standardmäßig Lektine bei allen Arten an. Verwenden Sie die Option Nach Feld suchen , um die Ansicht auf menschenzentrierte Informationen zu beschränken.
    4. Klicken Sie auf die Option Nach Feld suchen . Im Artenbereich Typ Homo sapiens. Klicken Sie auf die Schaltfläche Röntgenstrukturen erkunden , um die ursprüngliche Liste herauszufiltern. Es bleibt nur ein Eintrag übrig, nämlich das menschliche Galectin-8. Klicken Sie auf die Schaltfläche 3D-Struktur und -Informationen anzeigen in der oberen rechten Ecke des aufgelisteten Artikels, um detaillierte Informationen über menschliches Galectin-8 anzuzeigen, das mit NeuAc(a2-3)Gal(b1-4)GlcNAc interagiert.
    5. Greifen Sie mit zwei verschiedenen Zuschauern auf die Strukturinformationen zu menschlichem Galectin-8 zu, die auf der Seite angezeigt werden.
      1. Halten Sie die Maus, um das Molekül umzudrehen und den Liganden mit der integrierten Litemol-Software26 in den Vordergrund zu stellen, um die 3D-Struktur des Lektins zu zeigen. Bewegen Sie den Mauszeiger über eine der aufgelisteten Interaktionen auf der linken Seite, um die Ansicht auf der rechten Seite zu aktualisieren und zu lokalisieren, wo diese bestimmte Interaktion in der Struktur mit der PLIP-Software27 zusammenwirkt, um atomare Wechselwirkungen zwischen dem Lektin und dem Liganden zu beschreiben (Abbildung 6).
    6. Klicken Sie auf eine beliebige grüne Schaltfläche, die auf die entsprechenden Einträge in UniProt, PDB (europäische oder amerikanische Websites) und GlyConnect verweist, um diese Querverweise zu untersuchen.

2. Erforschen und Vergleichen von O-glycomes in GlyConnect

  1. Durchsuchen des HGI-Challenge-Datensatzes mit hoher Zuverlässigkeit
    HINWEIS: Der in der Einleitung erwähnte HGI-Datensatz wird in der GlyConnect-Datenbank gespeichert. Es enthält 163 N- und 23 O-Glykopeptide, die in 37 Glykoproteinen enthalten sind, die als Liste mit hohem Konfidenzniveau gelten. GlyConnect Compozitor28 ist der Schlüssel zur Bewertung der Konsistenz der Glycome-Daten. Wichtig ist, dass Compozitor virtuelle Knoten (grau dargestellt) zulässt, wenn nur ein Zwischenschritt erforderlich ist, um die isolierten Knoten zu verbinden. Auf diese Weise straffen virtuelle Knoten den Graphen und können als Strukturen interpretiert werden, die in den experimentellen Ergebnissen möglicherweise übersehen werden.
    1. Durchsuchen Sie den HGI-Datensatz von der GlyConnect-Homepage, indem Sie direkt zur Referenzseite des Artikels gehen: https://glyconnect.expasy.org/browser/references/2943.
      HINWEIS: Die Zusammenfassung in den farbigen Schaltflächen spiegelt teilweise die im Artikel angegebenen Zahlen wider. Wenn jedoch nur 69 einzigartige Peptide aufgeführt sind, spiegelt dies mehrere Assoziationen zwischen Peptiden und Stellen oder Strukturen wider. In dem Artikel wird ein Glykopeptid als eine einzigartige Kombination eines Peptids und einer Zusammensetzung definiert. In GlyConnect werden zunächst Glykosite betrachtet, und sie werden als Kombination eines Peptids mit Strukturen beschrieben. Dies erklärt die Diskrepanz in den Zahlen zwischen GlyConnect und dem obigen Zitat.
    2. Überprüfen Sie die hohe Häufigkeit des Auftretens von N-verknüpften Zusammensetzungen, wie Hex: 5 HexNAc: 4 NeuAc: 2, die an 42 Stellen in 43 Peptiden identifiziert wurden, im Gegensatz zu der häufigen Einzigartigkeit der meisten O-verknüpften Zusammensetzungen, die an 1 Stelle in 1 Peptid identifiziert wurden.
    3. Klicken Sie auf den Compozitor-Link auf der rechten Seite der Referenzeintragsseite, um die Konsistenz des Datensatzes zu bewerten. Stellen Sie sicher, dass das Compozitor-Tool den DOI der Referenz direkt verarbeitet und das Suchfeld mit reference=10.1101/2021.03.14.435332 auf der Registerkarte Advanced des Tools füllt. Geben Sie nach der DOI-Nummer &glycan_type=O-linked ein, um die Suche auf O-verknüpfte Glykane einzugrenzen, so dass die Abfrage wie folgt lautet: Referenz=10.1101/2021.03.14.435332&glycan_
      Typ=O-verknüpft
    4. Klicken Sie auf die Schaltfläche Zur Auswahl hinzufügen , um Daten aus der Datenbank abzurufen (es gibt 20 O-verknüpfte Kompositionen). Lassen Sie die Option Virtuelle Knoten einschließen ausgewählt. Klicken Sie auf die Schaltfläche Diagramm berechnen, um das Diagramm der verbundenen Kompositionen anzuzeigen. Dieses Ergebnis zeigt mehrere Lücken in der erwarteten Kontinuität der Glykanbiosynthese mit neun virtuellen Knoten, die zum Ausfüllen des Diagramms erforderlich sind (Abbildung 7).
  2. Vergleich mit dem O-Glycome eines ausgewählten Serumproteins in GlyConnect
    HINWEIS: Um zu beurteilen, ob die Lücken durch in GlyConnect gespeicherte Daten gefüllt werden können, wurde ein O-glykosyliertes Protein aus den 37 mit der Referenz aufgeführten Proteinen ausgewählt. Im Datensatz wird berichtet, dass Inter-alpha-Trypsin-Inhibitor Schwerkette H4 (Q14624) ein O-Glykosyl auf Thr-725 ist.
    1. Gehen Sie zur Registerkarte Protein von GlyConnect Compozitor (siehe Schritt 2.1.3). Wählen Sie in der Liste Protein die Option Inter-alpha-trypsin inhibitor heavy chain H4 aus. Stellen Sie sicher, dass die Artenauswahl standardmäßig Homo sapiens ist. Deaktivieren Sie N-verknüpft im Glykantyp. Wählen Sie in der Site-Liste nur Thr-725 aus, indem Sie zuerst auf das Minuszeichen links neben Site klicken, um die Auswahl aller Sites aufzuheben, und dann nur Thr-725 aus der Liste auswählen.
    2. Klicken Sie auf die Schaltfläche Zur Auswahl hinzufügen (beachten Sie, dass sechs Kompositionen mit Thr-725 verknüpft sind). Klicken Sie auf die Schaltfläche Diagramm berechnen, um das Diagramm der verbundenen Kompositionen anzuzeigen (Ergänzende Abbildung 8).
    3. Beachten Sie das angezeigte Diagramm, das die 17 eindeutigen Kompositionen aus den 20 O-verknüpften Kompositionen des Artikeldatensatzes in Blau und die drei eindeutigen von sechs in der Datenbank in Rot zeigt. Mit anderen Worten, die Überschneidung zwischen den beiden Quellen ist in drei Kompositionen vorhanden, die in Magenta dargestellt werden. Beachten Sie, dass eine 45°-Drehung des Diagramms automatisch generiert wird.
      HINWEIS: Die Anzahl der virtuellen Knoten wird um eins reduziert. Wie sich herausstellt, ist H2N2S1, das in den 20 O-verknüpften Kompositionen des Artikeldatensatzes fehlt und als virtueller Knoten dargestellt wird, nun mit einer zusätzlichen Zusammensetzung gefüllt, die mit Thr-725 des Inter-alpha-Trypsin-Inhibitor-Schwerketten-H4 in der Datenbank verbunden ist. Dies vereinfacht die Topologie des Graphen, da zwei andere virtuelle Knoten unbrauchbar gemacht werden, da sie alternative Optionen zum Füllen der Lücke zwischen H1N2S1 und H2N2S2 waren. Eine zweite aus der Datenbank importierte Komposition wäre jedoch isoliert, wenn nicht zwei neue alternative virtuelle Knoten H2N2F1S1 und H1N2F2S1 erstellt würden.
    4. Um die virtuellen Knoten zu verstehen, überprüfen Sie, ob die entsprechenden Kompositionen in GlyConnect vorhanden sind. Klicken Sie dazu auf die Schaltfläche Exportieren unter dem Diagramm. Wählen Sie Nur Virtuell aus, indem Sie alle anderen Optionen deaktivieren. Klicken Sie auf das Zwischenablagesymbol, um die Auswahl von 8 Kompositionen zu kopieren.
    5. Fügen Sie die Auswahl in das Abfragefenster der Registerkarte Benutzerdefiniert von Compozitor ein. Wählen Sie im Feld Glykantyp die Option O-verknüpft aus. Legen Sie die Auswahlbezeichnung im Feld Kompositionen auf z. B. VN fest, um die Liste der 8 Kompositionen zu benennen. Klicken Sie auf die Schaltfläche Zur Auswahl hinzufügen und dann auf die Schaltfläche Diagramm berechnen. Alle virtuellen Knoten werden nun als grüne Knoten angezeigt (Abbildung 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Der erste Teil des Protokolls (Abschnitt 1) zeigte, wie die Spezifität oder die Gemeinsamkeit von N-Glykanen, die an Asn-69 des humanen Prostata-spezifischen Antigens (PSA) gebunden sind, mithilfe der GlyConnect-Plattform untersucht werden kann. Gewebeabhängige (Urin und Samenflüssigkeit) sowie isoformabhängige (normale und hohe pI) Variationen in der Glykanexpression wurden mit zwei Visualisierungswerkzeugen hervorgehoben (Abbildung 4 und Abbildung 5).

Erstens bot GlyConnect Octopus, das Assoziationen zwischen in der Datenbank gespeicherten Entitäten anzeigt, die Möglichkeit, Kontextinformationen zu untersuchen, indem (1) verschiedene Entitäten ausgewählt wurden, die im Octopus angezeigt werden sollen, und (2) auf Links geklickt wurde, um verwandte Einträge zu untersuchen. Das Ergebnis waren je nach Gewebe unterschiedliche Assoziationen.

Zweitens wurde GlyConnect Compozitor, ursprünglich entwickelt, um eine Zusammensetzungsdatei für die Glykopeptididentifizierung zu definieren / zu verfeinern, verwendet, um die Glykanexpression in zwei bekannten PSA-Isoformen (normaler und hoher pI) zu bewerten. Der Vergleich jedes Isoform-Glycomes ergab einen gut verbundenen Graphen, der vier Knoten (Zusammensetzungen) hervorhebt, von denen zwei für die hohe pI-Isoform charakteristisch sind. Obwohl die Glykomüberlappung signifikant ist, zeigte das Balkendiagramm der Glykaneigenschaften einen Abfall der Sialylierung von der gemeinsamen zur hohen pI-Isoform (ergänzende Abbildung 5).

Darüber hinaus hebt die Erforschung von UniLectin3D Galectin-8 als möglichen Leser des PSA-Glycome hervor, da letzteres viele Strukturen mit einem NeuAc(a2-3)Gal(b1-4)GlcNAc-Terminalepitop enthält. Dies bietet einen Hinweis, dem man folgen kann, und kann nicht als endgültiger Beweis angesehen werden. Nichtsdestotrotz ist bekannt, dass PSA und Galektine eine wesentliche Rolle bei Prostatakrebs spielen29, und die spezifische Rolle von Galectin-8 wurde kürzlich hervorgehoben30. Der erste Teil des Protokolls korreliert strukturelle (Glykoproteomik) und funktionelle (Bindung) Daten, um ein wahrscheinliches Szenario für Protein-Protein-Interaktionen zu erstellen, die durch Glykane vermittelt werden.

Im zweiten Teil des Protokolls (Abschnitt 2) wurde ein hochwertiger Satz von O-Glykan-Zusammensetzungen, die mit einem bestimmten Gewebe (humanes Serum) assoziiert sind, untersucht und mit dem GlyConnect-Datenbankinhalt verglichen, wodurch die Möglichkeit geboten wurde, eine Glykanzusammensetzungsdatei für die verfeinerte Identifizierung von Glykopeptiden anzupassen (Abbildung 7 und Abbildung 8 ). Es könnte sich auf den minimalen Satz von 20 Kompositionen stützen, die aus einem Datensatz (HGI-Challenge-Ergebnisse) verfügbar sind, oder mit 23 bis 26 Elementen erweitert werden, die rational in GlyConnect gesammelt wurden, um die Konsistenz des Satzes zu stärken.

rot hellorange grün hellblau lila rosa dunkelblau braun dunkelorange
Spezies Protein Gewebequelle Struktur Zusammensetzung Krankheit Referenz Glykosit Peptid

Tabelle 1: Farbschema, das jeder Entität der GlyConnect-Datenbank zugeordnet und durchgehend gültig ist.

Figure 1
Abbildung 1: Abhängigkeitsrad von Glyco@Expasy, das für GlyConnect instanziiert wurde. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 2
Abbildung 2: Vorgeschlagene Glykanstruktur für eine ausgewählte Glykanzusammensetzung. Vorgeschlagene Glykanstruktur aus einem Glykomikexperiment für eine Glykanzusammensetzung eines glykoproteomischen Experiments, das auf dasselbe Glykoprotein abzielt, hier humanes Prostata-spezifisches Antigen (PSA), wie auf der GlyConnect-Seite für PSA vorgeschlagen (ID: 790). Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 3
Abbildung 3: Seitliches rechtes Menü der GlyConnect-Seite für PSA. Anklickbare Querverweise auf andere wichtige Datenbanken und Anzeige mit LiteMol Glykan-Plugin der bestehenden 3D-Struktur in der PDB. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 4
Abbildung 4: Die Ausgabe von GlyConnect Octopus zeigt gewebeabhängige Assoziationen zwischen Proteinen und Glykanen. Die Abfrage Hybrid AND Sialylated hat alle Zusammensetzungen zurückgegeben, die diesen Kriterien entsprechen, und jede Zusammensetzung verknüpft die zugehörigen Informationen über Proteine und Glykane, wie sie in der Datenbank aufgezeichnet sind. Beachten Sie, dass Species standardmäßig auf Homo sapiens gesetzt ist, diese Option jedoch änderbar ist. Hier zeigt GlyConnect Octopus alle menschlichen Proteine (linke Knoten), die hybride und sialylierte Glykanstrukturen (rechte Knoten) mit den Geweben tragen, in denen sie exprimiert werden (mittlere Knoten). (A) Die Assoziationen mit Urin werden hervorgehoben und zeigen zwei Proteine: Choriogonadotropin (GLHA_HUMAN) und PSA gemeinsame Isoform (KLK3_HUMAN), die mit gestreuten (heterogenen) Glykanstrukturen verbunden sind. (B) Die Assoziationen mit Samenflüssigkeit werden hervorgehoben und zeigen zwei Proteinisoformen von PSA (KLK3_HUMAN), die mit gruppierten (ähnlichen) Glykanstrukturen verbunden sind. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 5
Abbildung 5: Die Ausgabe von GlyConnect Compozitor mit den überlagerten N-Glycomes der beiden Isoformen von PSA. Kompositionen in komprimierter Notation beschriften jeden Knoten. Die mit der gemeinsamen Isoform assoziierten Glykane werden als blaue Knoten und die der hohen pI-Isoform als rote Knoten dargestellt. Die Überlappung zwischen Glycomes wird als Magenta-Knoten dargestellt. Zahlen innerhalb der Knoten stellen die Anzahl der Glykanstrukturen dar, die der markierten Zusammensetzung gemäß dem Inhalt der GlyConnect-Datenbank in Bezug auf PSA entsprechen. Das gezeigte Compozitor-Diagramm wurde gegenüber der Rohausgabe leicht modifiziert, um das Netzwerk zu entwirren, das von der D3.js Bibliothek generiert wird. Dies ist einfach zu bewerkstelligen, da jeder Knoten in den Browserfensterbereich gezogen werden kann, wo immer ein Benutzer dies wünscht, und die Pfade somit gekürzt oder gestreckt werden können. Der Benutzer kann eine bestimmte Komposition in das Feld "Zoom On " in der oberen rechten Ecke eingeben, um das Diagramm auf den entsprechenden Knoten zu vergrößern und zu zentrieren. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 6
Abbildung 6: Zusammenfassender Eintrag des humanen Galectin-8 mit NeuAc(a2-3)Gal(b1-4)GlcNAc-Bindungsdetails. Ein Klick auf die grüne Schaltfläche 3D-Struktur und Informationen anzeigen (gekennzeichnet durch eine rote Ellipse) öffnet eine neue Seite, auf der eine Nahaufnahme der Rückstandswechselwirkungen mit der PLIP-Anwendung angezeigt wird (gekennzeichnet durch einen roten Pfeil). Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 7
Abbildung 7: Die Ausgabe von GlyConnect Compozitor zeigt das O-Glycome des Humanserum-High-Confidence-Datensatzes der HGI-Herausforderung. Ohne virtuelle Knoten (siehe Text) ist die Konnektivität dieses Diagramms gering. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Figure 8
Abbildung 8: Die Ausgabe von GlyConnect Compozitor, die die Möglichkeit der Vervollständigung des O-Glycome des Humanserum-High-Confidence-Datensatzes der HGI-Herausforderung unter Verwendung des GlyConnect-Datenbankinhalts zeigt. Wenn Sie über die Registerkarte Benutzerdefiniert des Compozitors auf den Inhalt der gesamten GlyConnect-Datenbank zugreifen, wird deutlich, dass Kompositionen, die den virtuellen Knoten entsprechen, vorhandenen definierten Strukturen zugeordnet werden, wie in den Knotenbeschriftungen hervorgehoben. Die Knotengröße stellt die Anzahl der in der Datenbank gespeicherten Verweise dar und meldet die entsprechende Zusammensetzung. Die numerische Beschriftung der Knoten gibt die Anzahl der entsprechenden Strukturen an, die in GlyConnect gespeichert sind. Ausgewählte Kompositionen scheinen null bis achtzehn mögliche Übereinstimmungen in der Datenbank zu haben. Tatsächlich sind diese Knoten nur virtuell, um den Inhalt experimenteller Datensätze widerzuspiegeln. Es wird empfohlen, die Informationen im Diagramm zu verfeinern, um den Realismus dieser zusätzlichen Knoten zu testen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Ergänzende Abbildung 1: Blasendiagramm der Glyco@Expasy Homepage. Zoomen Sie in das Blasendiagramm der Glyco@Expasy Homepage, um sich auf die Glykoproteinkategorie zu konzentrieren. Software, die in grünen Blasen und Datenbanken in gelben Blasen angezeigt wird. Wenn Sie auf eine beliebige Blase klicken, wird der Zweck der Ressource zusammengefasst. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 2: Von Octopus abgerufene Assoziationen, die je nach Zusammensetzung mit der Abfrage übereinstimmen. Standardmäßige GlyConnect Octopus-Anzeige menschlicher Proteine (linke Knoten), die hybride und sialylierte Glykanstrukturen (rechte Knoten) mit übereinstimmenden Zusammensetzungen (mittlere Knoten) tragen. Die Zusammensetzung H6N4F12S1 scheint für beide PSA-Isoformen (KLK3_HUMAN) einzigartig zu sein. Ein Klick auf die eindeutige Struktur-ID (10996) öffnet die entsprechende Seite mit Details, die zeigen, dass die beiden Isoformen tatsächlich die einzigen Proteine sind, die dieses spezielle Glykan tragen. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 3: Vom Oktopus abgerufene Assoziationen, die der Abfrage in Abhängigkeit von der Krankheit entsprechen. GlyConnect Octopus-Anzeige aller menschlichen Proteine (linke Knoten), die hybride und sialylierte Glykanstrukturen (rechte Knoten) mit den Krankheiten tragen, in denen sie exprimiert werden (mittlere Knoten). Die Assoziationen mit Prostatakrebs werden hervorgehoben und zeigen die häufige Isoform von PSA (KLK3_HUMAN). Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 4: Vom Oktopus abgerufene Assoziationen, die der Abfrage in Abhängigkeit von Gewebeinformationen entsprechen. GlyConnect Octopus-Anzeige aller menschlichen Proteine (linke Knoten), die bi-antennenförmige Glykanstrukturen tragen, einschließlich des NeuAc(a1-3)Gal(b1-4)GlcNAc-Motivs (rechte Knoten) mit den Geweben, in denen sie exprimiert werden (mittlere Knoten). Die Assoziationen mit Samenflüssigkeit werden hervorgehoben und zeigen nur die gemeinsame Isoform von PSA (KLK3_HUMAN) und sieben Strukturen. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 5: Die Ausgabe von GlyConnect Compozitor zeigt die überlagerten N-Glycomes der beiden Isoformen von PSA. Kompositionen in komprimierter Notation beschriften jeden Knoten. Die mit der gemeinsamen Isoform assoziierten Glykane werden als blaue Knoten und die der hohen pI-Isoform als rote Knoten dargestellt. Die Überlappung zwischen Glycomes wird als Magenta-Knoten dargestellt. Zahlen innerhalb der Knoten stellen die Anzahl der Glykanstrukturen dar, die der markierten Zusammensetzung gemäß dem Inhalt der GlyConnect-Datenbank in Bezug auf PSA entsprechen. Wenn Sie mit der Maus über das Balkendiagramm der Glykaneigenschaften fahren, wird die Korrespondenz zwischen der Frequenz und den Knoten als orangefarbene Blasen angezeigt. Fast alle üblichen PSA-Isoformknoten werden abgedeckt. Diese Frequenz sinkt in der hohen pI-Isoform. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 6: Glykan-Suchschnittstelle in UniLectin3D. Ein Klick auf das Sialinsäure-SNFG-Symbol (rot eingekreist) startet die Suche nach allen Liganden, die NeuAc enthalten, gespeichert in UniLectin3D. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 7: Auszug aus der Ausgabe der Suche nach allen Liganden, die NeuAc enthalten. Das NeuAc(a2-3)Gal(b1- 4)GlcNAc Motiv von Interesse ist rot eingekreist. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung 8: Die Ausgabe von GlyConnect Compozitor, die das O-glycome des HGI-Datensatzes überlagert, der mit dem in GlyConnect überlagert ist. Die Ausgabe von GlyConnect Compozitor zeigt das O-Glycome des humanen Serum-High-Confidence-Datensatzes der HGI-Herausforderung in Blau, überlagert mit dem O-Glycome eines O-glykosylierten Proteins aus den 37 mit der Referenz aufgeführten, d. H. Inter-Alpha-Trypsin-Inhibitor-Schwerkette H4 mit zusätzlichen Informationen in GlyConnect. Dies verbessert die Konnektivität des Graphen. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus als Werkzeug zur Aufdeckung unerwarteter Korrelationen
GlyConnect Octopus wurde ursprünglich entwickelt, um die Datenbank mit einer losen Definition von Glykanen abzufragen. In der Tat berichtet die Literatur oft über die Hauptmerkmale von Glykanen in einem Glykom, wie z.B. fucosyliert oder sialyliert, aus zwei oder mehr Antennen bestehend usw. Darüber hinaus werden Glykane, ob N- oder O-verknüpft, in Kerne eingeteilt, wie im Referenzhandbuch Essentials of Glycobiology1 beschrieben, die auch häufig in veröffentlichten Artikeln zitiert werden. Schließlich sind Glykanepitope wie Blutgruppenantigene eine weitere Eigenschaft, die in Strukturen gesucht und möglicherweise für die Typisierung eines Glykans ausgewählt wird. Am Ende kann es relevant sein, nach gemeinsamen oder unterschiedlichen Merkmalen eines Glycome zu suchen, die in einem bestimmten Gewebe oder einer ausgewählten Art exprimiert werden. In diesem Sinne sollten die gesammelten Informationen als Quelle für neue Annahmen im Gegensatz zu einzigartigen Fakten verwendet werden.

GlyConnect Compozitor als Werkzeug zur Formgebung eines Glykanzusammensetzungssatzes
Das Durchsuchen von Strukturinformationen, wie auf einer Proteinseite beschrieben, hat Einschränkungen, da Listen dazu neigen, die Beziehungen zwischen aufgeschlüsselten Strukturen sowie zwischen Zusammensetzungen zu verschleiern. GlyConnect Octopus kümmert sich um Ersteres und GlyConnect Compozitor um Letzteres. Ein sorgfältiger Blick auf die Strukturen, die in den meisten GlyConnect-Einträgen aufgeführt sind, zeigt die Existenz gemeinsamer Unterstrukturen. Diese Informationen sind jedoch ohne die Hilfe eines engagierten Betrachters visuell nicht leicht zu erfassen.

Der Inhalt der Glykanzusammensetzungsdatei, die die Identifizierung der Glykaneinheit als Schlüsselparameter der Glykopeptid-Identifizierungssoftware unterstützt, wurde durch die Analyse der Ergebnisse der HGI-Herausforderung ermittelt. Die meisten klassischen Proteomik-Suchmaschinen berücksichtigen die Auswahl von glykobasierten Modifikationen aus einer Sammlung, die aus Daten stammt, die in Datenbanken/Repositorien oder der Literatur gesammelt wurden. Andere Glykoproteomik-Spezialwerkzeuge nutzen das Wissen der Glykanbiosynthese. Auf diese Weise wird die Zusammensetzungsdatei theoretisch als Ergebnis der erwarteten enzymatischen Aktivität definiert. Am Ende gibt es so viele Kompositionsdateien wie Suchmaschinen und die Überschneidung zwischen ihnen ist sehr variabel. Nichtsdestotrotz zeigt das Lernen aus früheren Erfahrungen in der Proteomik, insbesondere wenn posttranslationale Modifikationen berücksichtigt werden, dass die Leistung von Suchmaschinen mit der Begrenzung des Suchraums korreliert31. Ähnliche Beobachtungen werden in der Glykoproteomik gemacht, und GlyConnect Compozitor wurde entwickelt, um eine fundierte Auswahl von Zusammensetzungsdaten zu unterstützen, deren Bedeutung zuvor diskutiert wurde32.

Die Verwendung dieses Tools wurde im Protokoll unvollständig veranschaulicht, insbesondere in Bezug auf die Registerkarte Advanced, in der Abfragen, die den programmatischen Zugriff auf GlyConnect über seine API (Application Programming Interface) direkt starten, ausgedrückt werden können. Beispielsweise entspricht die Eingabe von Taxonomie=homo sapiens&glycanType=N-linked&tissue=Urin&disease=Prostatakrebs im Abfragefenster der Registerkarte Erweitert dem Ausfüllen der entsprechenden Felder auf der Registerkarte Quelle (Auswahl von Homo sapiens in Spezies, Urin in Gewebe und N-verknüpft in Glykantyp) und der Registerkarte Krankheit (Auswahl von Homo sapiens in Spezies, Prostatakrebs bei Krankheit und N-verknüpft im Glykantyp). Mit anderen Worten, es liefert in einem Schritt ein Ergebnis, das mehrere Auswahlen erfordern würde.

Schließlich, während die Erstellung virtueller Knoten im Protokoll erklärt wird, benötigt ihre potenzielle Redundanz einen zusätzlichen Kommentar. Zwei gleichzeitige Optionen sind möglicherweise nicht zu unterscheiden, da die simulierte Wirkung von Enzymen im Diagramm die Chronologie der Enzymaktivitäten nicht berücksichtigt. Aus diesem Grund schlägt Compozitor zwei Pfade durch zwei virtuelle Knoten vor, um zwei nicht verbundene Knoten zu überbrücken, die der Monosaccharidzahl mit bis zu zwei Unterschieden entsprechen. Die Einbeziehung neuer Daten führt oft zu fehlenden Verknüpfungen. Dem Benutzer steht es jederzeit frei, virtuelle Knoten in Betracht zu ziehen oder zu schließen, indem er das Kontrollkästchen Virtuelle Knoten einschließen (deaktiviert).

Bekannte Datenbanken und Softwareeinschränkungen
Insgesamt, wie bei jeder Navigation im Web, führen die oben beschriebenen Protokolle gelegentlich zu einer nicht vorhandenen Seite, oft aufgrund einer Aktualisierung einer Website oder eines Konflikts von Updates zwischen zwei Websites. In diesem Fall und in allen Fällen, in denen die Navigation nicht fließt, ist es am einfachsten, eine Nachricht an den Expasy-Helpdesk zu senden, dessen Effizienz in den letzten 28 Jahren wesentlich zum Erfolg des Portals beigetragen hat.

Der Inhalt von GlyConnect ist voreingenommen als Spiegelbild der aktuellen Unausgewogenheit in der Literatur. Die meisten Publikationen berichten über die N-Glykosylierung bei Säugetieren und die Datenbank ist reicher an menschlichen N-Glykoproteinen. Nichtsdestotrotz wurden wir in der Vergangenheit gebeten, weniger verbreitete Datensätze einzubeziehen und völlig offen für Ratschläge und Vorschläge zu bleiben.

Außerdem beschränkt sich Compozitor derzeit auf den Vergleich von drei Kompositionsdatensätzen. Eine größere Überarbeitung der Unterregisterkarte Determinante im Oktopus ist geplant. Ressourcen von Glyco@Expasy müssen regelmäßig aktualisiert werden, und einige werden möglicherweise nicht zu gegebener Zeit durchgeführt; Nichtsdestotrotz werden Warnungen und/oder Ankündigungen veröffentlicht, wenn dies geschieht.

Partnerportale, bekannt als GlyGen (https://www.glygen.org) und GlyCosmos (https://www.glycosmos.org), bieten verschiedene Optionen und Tools. Letztendlich beinhaltet das Browsen und Durchsuchen von Informationen zu einer der Optionen ein hohes Maß an Subjektivität und hängt weitgehend von den Gewohnheiten und Bedenken der Benutzer ab. Wir können nur hoffen, dass unsere Lösung zu einem Teil der Community passt.

Der Input der Glykowissenschaft wächst in Life-Science-Projekten und Studien, die die Rolle von Glykanen in Gesundheitsfragen belegen, werden kontinuierlich erstellt. Der jüngste Fokus auf Sars-Cov-2 zeigte einmal mehr die Bedeutung von glykosylierten Proteinen, insbesondere in strukturellen Ansätzen33. Glycoinformatics unterstützt Glykowissenschaftler bei den täglichen Aufgaben der Datenanalyse und -interpretation.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren erklären keine Interessenkonflikte.

Acknowledgments

Der Autor dankt den ehemaligen und gegenwärtigen Mitgliedern der Proteome Informatics Group, die an der Entwicklung der in diesem Tutorial verwendeten Ressourcen beteiligt waren, insbesondere Julien Mariethoz und Catherine Hayes für GlyConnect, François Bonnardel für UniLectin, Davide Alocci und Frederic Nikitin für den Octopus und Thibault Robin für Compozitor und den letzten Schliff an Octopus.

Die Entwicklung des Projekts glyco@Expasy wird vom Bund über das Staatssekretariat für Bildung, Forschung und Innovation (SBFI) unterstützt und wird derzeit durch den Schweizerischen Nationalfonds (SNF: 31003A_179249) ergänzt. ExPASy wird vom Schweizerischen Institut für Bioinformatik betreut und im Kompetenzzentrum Vital-IT gehostet. Die Autorin würdigt Anne Imberty auch für die hervorragende Zusammenarbeit auf der UniLectin-Plattform, die gemeinsam von ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003) unterstützt wird.

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologie Heft 179
Bioinformatik-Ressourcen zur Untersuchung von Glykan-vermittelten Proteininteraktionen
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter