Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Recursos bioinformáticos para el estudio de las interacciones de proteínas mediadas por glicanos

Published: January 20, 2022 doi: 10.3791/63356

Summary

Este protocolo ilustra cómo explorar, comparar e interpretar los glicomas de proteínas humanas con recursos en línea.

Abstract

La iniciativa Glyco@Expasy se lanzó como una colección de bases de datos y herramientas interdependientes que abarcan varios aspectos del conocimiento en glicobiología. En particular, tiene como objetivo resaltar las interacciones entre las glicoproteínas (como los receptores de la superficie celular) y las proteínas de unión a carbohidratos mediadas por glicanos. Aquí, los principales recursos de la colección se presentan a través de dos ejemplos ilustrativos centrados en el N-glicoma del antígeno prostático específico (PSA) humano y el O-glicoma de las proteínas séricas humanas. A través de diferentes consultas de bases de datos y con la ayuda de herramientas de visualización, este artículo muestra cómo explorar y comparar contenido en un continuo para recopilar y correlacionar piezas de información dispersas. Los datos recopilados están destinados a alimentar escenarios más elaborados de la función del glicano. La glicoinformática introducida aquí se propone, por lo tanto, como un medio para fortalecer, dar forma o refutar las suposiciones sobre la especificidad de un glicoma proteico en un contexto dado.

Introduction

Los glicanos, proteínas a las que están unidos (glicoproteínas) y proteínas a las que se unen (lectinas o proteínas de unión a carbohidratos) son los principales actores moleculares en la superficie celular1. A pesar de este papel central en la comunicación célula-célula, los estudios a gran escala, incluidos los datos de glicómica, glicoproteómica o glicano-interactómica, siguen siendo escasos en comparación con su contraparte en genómica y proteómica.

Hasta hace poco, no se habían desarrollado métodos para caracterizar las estructuras ramificadas de los carbohidratos complejos sin dejar de conjugarse con la proteína portadora. La biosíntesis de glicoproteínas es un proceso no basado en plantillas en el que los donantes de monosacáridos, los sustratos de glicoproteínas que aceptan y las glicosiltransferasas y glucosidasas desempeñan un papel interactivo. Las glicoproteínas resultantes pueden soportar estructuras complejas con múltiples puntos de ramificación donde cada componente monosacárido puede ser uno de los varios tipos presentes en la naturaleza1. El proceso no basado en plantillas impone el análisis bioquímico como la única opción para generar datos estructurales de oligosacáridos. El proceso analítico de las estructuras de glicanos unidas a una proteína nativa a menudo es un desafío, ya que requiere tecnologías sensibles, cuantitativas y robustas para determinar la composición de monosacáridos, enlaces y secuencias de ramificación2.

En este contexto, la espectrometría de masas (EM) es la técnica más utilizada en experimentos de glucómica y glicoproteómica. A medida que pasa el tiempo, estos se llevan a cabo en configuraciones de mayor rendimiento y los datos ahora se acumulan en las bases de datos. Estructuras de glicanos en varios formatos3, rellenen GlyTouCan4, el repositorio universal de datos de glicanos donde cada estructura está asociada con un identificador estable independientemente del nivel de precisión con el que se defina el glicano (por ejemplo, posiblemente falta el tipo de enlace o la composición ambigua). Se recogen estructuras muy similares, pero sus pequeñas diferencias se informan claramente. Las glicoproteínas se describen y curan en GlyConnect5 y GlyGen6, dos bases de datos que se cruzan entre sí. Los datos de EM que respaldan las piezas estructurales de evidencia se almacenan cada vez más en GlycoPOST7. Para una cobertura más amplia de los recursos en línea, el capítulo 52 del manual de referencia, Essentials of Glycobiology, está dedicado a la glicoinformática8. Curiosamente, el software de identificación de glicopéptidos ha proliferado en los últimos años9,10 aunque no en beneficio de la reproducibilidad. Esta última preocupación llevó a los líderes de la Iniciativa de Glicoproteómica (HGI) de HUPO a establecer un desafío de software en 2019. Los datos de EM obtenidos del procesamiento de mezclas complejas de proteínas séricas humanas N- y O-glicosiladas en los modos de fragmentación CID, ETD y EThcD, se pusieron a disposición de los competidores, ya sean usuarios de software o desarrolladores. El informe completo sobre los resultados de este desafío11 solo se describe aquí. Para empezar, se observó una propagación de identificaciones. Se interpretó principalmente como causado por la diversidad de métodos implementados en los motores de búsqueda, de sus configuraciones y cómo se filtraron las salidas y se "contaron" los péptidos. El diseño experimental también puede haber puesto algunos software y enfoques en una (des)ventaja. Es importante destacar que los participantes que usaron el mismo software informaron resultados inconsistentes, destacando así graves problemas de reproducibilidad. Se concluyó comparando diferentes presentaciones que algunas soluciones de software funcionan mejor que otras y algunas estrategias de búsqueda producen mejores resultados. Es probable que esta retroalimentación guíe la mejora de los métodos automatizados de análisis de datos de glicopéptidos y, a su vez, afecte el contenido de la base de datos.

La expansión de la glicoinformática llevó a la creación de portales web que proporcionan información y acceso a múltiples recursos similares o complementarios. Los más recientes y actualizados se describen en un capítulo de la serie de libros Comprehensive Glycoscience12 y, a través de la cooperación, se ofrece una solución para el intercambio de datos y la información en un modo de acceso abierto. Se desarrolló uno de estos portales, que originalmente se llamó Glycomics@ExPASy 13 y pasó a llamarse Glyco@Expasy, tras la importante revisión de la plataforma Expasy14 que ha alojado una gran colección de herramientas y bases de datos utilizadas en varias ómicas durante décadas, siendo el elemento más popular UniProt15, la base de conocimiento universal de proteínas. Glyco@Expasy ofrece un descubrimiento didáctico del propósito y uso de bases de datos y herramientas, basado en una categorización visual y una visualización de sus interdependencias. El siguiente protocolo ilustra los procedimientos para explorar datos de glicómica y glicoproteómica con una selección de recursos de este portal que hace explícita la conexión entre la glicoproteómica y la glicano-interactómica a través de la glucómica. Tal como están las cosas, los experimentos glucómicos producen estructuras donde los monosacáridos están completamente definidos y los enlaces parcial o totalmente determinados, pero su unión al sitio de la proteína está mal caracterizada, si es que lo está. Por el contrario, los experimentos de glicoproteómica generan información precisa de unión al sitio, pero con una resolución deficiente de las estructuras de glicanos, a menudo limitadas a composiciones de monosacáridos. Esta información se reúne en la base de datos GlyConnect. Además, las herramientas de búsqueda en GlyConnect se pueden utilizar para detectar posibles ligandos de glicanos que se describen junto con las proteínas que los reconocen en UniLectin16, vinculados a GlyConnect a través de glicanos. El protocolo presentado aquí se divide en dos secciones para cubrir preguntas específicas de los glicanos y glicoproteínas ligados a N y O.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: Se requiere un dispositivo con conexión a Internet (se prefiere una pantalla más grande) y un navegador web actualizado como Chrome o Firefox. El uso de Safari o Edge puede no ser tan confiable.

1. De una proteína N-glicoma en GlyConnect a una lectina de UniLectin

  1. Acceso a recursos desde Glyco@Expasy
    NOTA: El procedimiento descrito aquí es acceder a GlyConnect, pero se puede aplicar para acceder a cualquier recurso registrado en la plataforma.
    1. Vaya a https://glycoproteome.expasy.org/glycomics-expasy y considere el gráfico de burbujas a la derecha que muestra diferentes categorías, como glicoconjugados o unión de glicanos. En el menú de la izquierda que refleja las categorías de las burbujas, marque la casilla Glicoproteínas para que el gráfico de burbujas de la derecha se acerque inmediatamente a la burbuja que coincida con esa categoría.
      NOTA: Las burbujas verdes son herramientas y las burbujas amarillas son bases de datos. Al hacer clic en cualquiera de los dos, se vuelve a acercar para proporcionar detalles sobre el recurso. Antes de hacerlo, es posible que el usuario desee comprender las dependencias de ese recurso para otros.
    2. Para obtener la información sobre las dependencias, vaya de la ficha Clasificación temática de recursos a la ficha Rueda de dependencias de recursos . Coloque el ratón en GlyConnect en la rueda para comprobar su nivel de integración con otras fuentes (Figura 1).
    3. Vuelva a la pestaña Clasificación temática de recursos para llegar a la burbuja GlyConnect como en el paso 1.1.1 y haga clic en ella (Figura suplementaria 1) para mostrar la página de inicio de GlyConnect en una nueva pestaña que muestra las estadísticas del contenido en la última versión de la base de datos.
      Nota : un esquema de color detallado en la Tabla 1 coincide con los diferentes tipos de información almacenada en la base de datos. Este código de color es válido en todas las páginas de entidad en GlyConnect y es consistente en todo momento. La página de inicio también muestra cuatro secciones dedicadas a conjuntos de datos enfocados, como los que describen la glicosilación de la proteína espiga sars-Cov-2 (COVID-19) o detallan ampliamente los oligosacáridos de la leche humana (HMO). Estos no serán explorados en este protocolo.
  2. Explorando la información contextual de una proteína N-glicoma
    NOTA: Todas las estructuras de glicanos en GlyConnect se muestran en tres formatos alternativos y de uso común: (1) Nomenclatura de símbolos para glicanos (SNFG)17 (2) IUPAC condensado18, y (3) Oxford19. En contraste, no existe una notación estándar para expresar la composición de glicanos. En GlyConnect, se utiliza el siguiente código: Hex para la hexosa, HexNAc para la N-acetilhexosamina, dHex para la fucosa y NeuAc para los ácidos siálicos. En aras de la simplicidad, las herramientas de visualización se basan en una notación condensada: H para la hexosa, N para la N-acetilhexosamina, F para la fucosa y S para los ácidos siálicos. Además, las letras pequeñas designan modificaciones como "a" para la acetilación, "p" para la fosforilación y "s" para la sulfatación, para el más frecuente de estos llamados sustituyentes.
    1. Para ver y explorar el N-glicoma del antígeno prostático específico (PSA) humano, desde la página de inicio de GlyConnect, proceda de la siguiente manera.
      NOTA: La glicosilación del PSA humano se ha estudiado a lo largo de los años, especialmente en el contexto del cáncer de próstata. La base de datos GlyConnect almacena tres referencias20,21,22, que combinan datos glucómicos y glicoproteómicos. Tenga en cuenta que los resultados proporcionados aquí se obtuvieron con la versión de septiembre de 2021 de GlyConnect. El uso ulterior de la base de datos puede producir estadísticas ligeramente diferentes debido a las frecuentes actualizaciones de datos.
    2. Seleccione el botón PROTEIN para abrir la vista de proteínas de la base de datos. En la página de vista de proteínas, escriba próstata en la ventana de búsqueda. Busque las dos entradas enumeradas en la salida que distinguen dos isoformas de PSA con valores de pI distintos. Haga clic en 790 (columna Id) correspondiente a la isoforma común de PSA.
      NOTA: Busque la barra multicolor superior que muestra la información resumida extraída del trabajo publicado en el esquema detallado anteriormente. Varias opciones de navegación son posibles como se describe a continuación.
    3. En la barra multicolor superior, haga clic en el botón FUENTE en verde para mostrar los tipos de muestra a partir de los cuales se procesaron los datos publicados: Orina y Líquido seminal. Para seguir examinando esta información, haga clic en cualquiera de estos tipos de ejemplo. Lo mismo se aplica a cualquier elemento que aparezca al hacer clic en un botón de color.
    4. Para verificar el contenido relacionado con la salud de la base de datos, haga clic en el botón ENFERMEDAD , que contiene dos elementos, uno de los cuales es Cáncer de próstata que se vincula a la página dedicada a la enfermedad correspondiente en GlyConnect. El resumen de esa página muestra que tres estudios a gran escala han reportado 319 composiciones en 1,087 sitios encontrados en 308 proteínas humanas.
    5. Haga clic en el botón ESTRUCTURA para ver la lista completa de 135 estructuras asociadas con PSA a partir de datos glucómicos. Haga clic en el botón COMPOSICIÓN para ver las 78 composiciones asociadas determinadas por experimentos de glicoproteómica. Haga clic en cualquier estructura o composición para obtener más detalles.
      NOTA: Se pueden obtener detalles como la lista de proteínas alternativas que llevan la estructura particular o la lista de estructuras que coinciden con la composición. Se sabe que el PSA tiene solo un sitio de glicosilación N en Asn-69 (solo un elemento contado para el botón MARRÓN SITE ).
    6. Para reducir la ambigüedad de las composiciones, haga clic en STRUCT SUGERIDO debajo de una composición seleccionada (por ejemplo, Hex:6 HexNAc:3 NeuAc:1). Se hace una sugerencia cada vez que el recuento de monosacáridos coincide con el de una estructura enumerada anteriormente (Figura 2).
      NOTA: La composición Hex:6 HexNAc:3 NeuAc:1 generada por un experimento de glicoproteómica se corresponde con cuatro estructuras de mayor resolución a partir de los datos glucómicos. En el caso del PSA, no hay ambigüedad del sitio para resolver, ya que solo Asn-69 es glicosilado.
    7. Para explorar completamente la página de proteínas, vea más detalles en el lado derecho de la página (Figura 3).
      1. Vea la entrada predeterminada 3QUM PDB (Protein Data Bank23) para PSA que se muestra con dos glicanos complejos unidos a cada monómero (Figura 3) o la entrada alternativa 2ZCK , que también está disponible debido a un carbohidrato adjunto. La segunda entrada muestra una sola cadena.
        NOTA: Ambas entradas se visualizan con el plugin 3D LiteMol24 que muestra glicanos en notación SNFG-3D adoptada en el PDB-RCSB.
      2. Haga clic en los enlaces correspondientes de otras referencias cruzadas para explorar información funcional relevante de las principales bases de datos de proteómica, como UniProt (Figura 3).
  3. Visualización y correlación de la información contextual de una proteína N-glicoma
    NOTA: Como se vio en la sección anterior, las largas listas de estructuras o composiciones pueden ser difíciles de aprehender en su conjunto y GlyConnect se basa en dos herramientas diferentes para visualizar información clave, a saber, GlyConnect Octopus y GlyConnect Compozitor (el primero expande la información de resumen capturada en botones de colores y el segundo resalta las dependencias estructurales en términos de una estructura / composición contenida en otro). Como se ilustra a continuación, GlyConnect Octopus explora las asociaciones entre las diversas entidades almacenadas en la base de datos al resaltar conexiones múltiples o individuales como un reflejo del contenido de la base de datos.
    1. Realice una búsqueda de GlyConnect Octopus para confirmar la presencia de rasgos estructurales comunes, como estructuras de núcleo híbrido y estructuras que contienen ácido siálico altamente frecuentes en la diversidad de glicanos unidos al PSA, como se describe a continuación.
    2. Vaya a la página de inicio de Octopus https://glyconnect.expasy.org/octopus/. Mantenga la pestaña vinculada a N seleccionada de forma predeterminada. Vaya a la subpestaña Núcleos y haga clic en el icono Híbrido . Vaya a la subpestaña Propiedades y haga clic en el icono Sialylated . Haga clic en el botón verde Buscar a continuación.
      NOTA: Los resultados de la búsqueda se muestran gráficamente como relaciones entre tres categorías de elementos. De forma predeterminada, la lista central coincide con la consulta de composiciones, la colección izquierda abarca proteínas relacionadas y la derecha abarca glicanos relacionados.
    3. En el gráfico de relaciones mostrado, coloque el cursor sobre H6N4F1S1 para resaltar los enlaces a seis proteínas y tres estructuras. Contrasta esto flotando sobre H6N4F2S1 que destaca las dos isoformas de PSA (ambas conocidas como UniProt ID: KLK3_HUMAN) y una estructura (ID: 10996). Coloque el cursor sobre el ID de estructura para mostrar su representación SNFG y haga clic en él para abrir la página correspondiente (Figura suplementaria 2).
    4. Cambie los nodos del pulpo a cualquier otro tema que describa el contexto de la glicosilación. El código de color sigue siendo el mismo que el descrito anteriormente (ver Tabla 1).
      1. Cambie los nodos centrales a tejidos para mostrar 15 opciones en el centro del gráfico, muchas de las cuales son fluidos corporales. Busque todas las asociaciones entre proteínas y glicanos que coincidan con la consulta dependiendo de la información del tejido. Coloque el cursor en Orina o Líquido seminal en el centro del gráfico para ver diferentes asociaciones (Figura 4A, B).
      2. Cambie los ganglios del centro a Enfermedad para mostrar 13 opciones, una de las cuales es el cáncer de próstata. La única proteína asociada es el PSA (KLK3_HUMAN) (Figura suplementaria 3).
        NOTA: Una mirada más cercana al N-glicoma PSA que se muestra en la página de proteínas destaca la frecuencia muy alta de un NeuAc terminal (a?-?) Gal(b?-?) Subestructura GlcNAc en muchos casos en estructuras con dos o tres antenas. Otro pulpo se puede generar sobre esa base como se describe a continuación.
    5. Haga clic en el botón Borrar para actualizar la búsqueda. Vaya a la subpestaña Propiedades y haga clic en el icono Bi-antennary . Vaya a la subpestaña Determinantes y haga clic en el icono 3-Sialyl-LN (tipo 2 ). Haga clic en el botón verde Buscar a continuación.
    6. Compruebe las asociaciones recuperadas por Octopus con glicanos biantelares que contienen un motivo terminal 3-Sialyl-LN (tipo 2), es decir, NeuAc(a1-3)Gal(b1-4)GlcNAc. Cambie los nodos centrales a tejidos para facilitar la lectura y pase el cursor sobre KLK3_HUMAN para conectar directamente el líquido seminal con la isoforma común de PSA y siete estructuras (Figura suplementaria 4).
      NOTA: La segunda herramienta de visualización, GlyConnect Compozitor, realiza el escaneo de las relaciones potenciales entre todas y cada una de las composiciones en una lista de las mismas (ver más abajo). Una relación se define como diferente de un solo monosacárido entre dos composiciones. Estas relaciones identificadas trazadas en un gráfico exponen la (des)continuidad de un glicoma.
    7. Utilice GlyConnect Compozitor para realizar el escaneo de las relaciones potenciales entre todas y cada una de las composiciones en una lista de las mismas, como se ilustra a continuación para el caso de PSA.
      NOTA: GlyConnect Compozitor procesa composiciones en asociación con un contexto. Ofrece distintas pestañas para consultar GlyConnect, por ejemplo, Proteínas, Fuentes, Líneas celulares, Enfermedades que se explican por sí mismas para calificar un contexto. Esto se ilustra aquí con PSA de la siguiente manera.
    8. Vuelva a la página de proteínas de PSA: https://glyconnect.expasy.org/browser/proteins/790. En el lado derecho de la página de entrada de PSA, haga clic en el enlace Compozitor. Asegúrese de que los campos de búsqueda de Compozitor estén rellenados previamente con los detalles de la entrada Id 790 en la pestaña Proteína (Proteína: Antígeno prostático específico, Especie: Homo sapiens y Tipo de glicano: N-vinculado).
    9. Haga clic en el botón Agregar a la selección para recuperar datos de la base de datos y mostrar el gráfico de composiciones conectadas. Anule la selección de la opción Incluir nodos virtuales . Haga clic en el botón Compute Graph para mostrar un gráfico que muestra un conjunto bien conectado de 78 composiciones que representan el PSA N-glicoma, y un gráfico de barras que muestra las principales características de los glicanos.
    10. Pase el cursor sobre la barra púrpura en el gráfico de barras, que localiza todas las estructuras sialilladas en el gráfico para revelar un sesgo observable hacia las estructuras sialiladas.
    11. Permanezca en la pestaña principal Proteína y seleccione Antígeno prostático específico - isoforma pi alta (psah) en el campo Proteína (nombre).
      NOTA: Los campos Tipo de glicano y Sitio de glicano se rellenan automáticamente.
    12. Haga clic en el botón Agregar a selección para recuperar datos de la base de datos que ascienden a 57 composiciones. Haga clic en el botón Compute Graph para generar los gráficos superpuestos de ambas isoformas y evaluar las diferencias en los glicomas de las dos isoformas de PSA. Coloque el cursor sobre las etiquetas de nodo para solicitar la visualización del número de estructuras correspondientes a las composiciones/etiquetas (Figura 5).
  4. Información de enlace a glicanos en UniLectin
    NOTA: Recordemos el determinante probado en el pulpo, descrito como NeuAc(a2-3)Gal(b1-4). Por definición, es una parte vinculante establecida de una estructura de glicanos y, como tal, se puede buscar en la base de datos UniLectin3D25.
    1. Vaya a https://www.unilectin.eu/ y haga clic en el botón UniLectin3D . Alternativamente, vaya directamente a la página: https://www.unilectin.eu/unilectin3D/.Click en el botón de búsqueda de glicanos para abrir esta página: https://www.unilectin.eu/unilectin3D/glycan_search (Figura suplementaria 6).
    2. Haga clic en el diamante púrpura que representa un ácido siálico, lo que provoca la visualización de todos los motivos de unión a glicanos que terminan con un ácido siálico almacenado en la base de datos. La parte superior de esa colección de motivos contiene el motivo NeuAc(a2-3)Gal(b1-4)GlcNAc investigado anteriormente (Figura suplementaria 7).
    3. Haga clic en el motivo NeuAc(a2-3)Gal(b1-4)GlcNAc para solicitar la visualización de todas las lectinas para las que se conoce una estructura 3D que confirma la interacción con NeuAc(a2-3)Gal(b1-4)GlcNAc. El resultado por defecto muestra lectinas en todas las especies. Utilice la opción Buscar por campo para limitar la vista a la información centrada en el ser humano.
    4. Haga clic en la opción Buscar por campo . En el campo de las especies , tipo Homo sapiens. Haga clic en el botón Explorar estructuras de rayos X para filtrar la lista original. Solo queda una entrada, es decir, la galectina-8 humana. Haga clic en el botón Ver la estructura e información 3D en la esquina superior derecha del elemento enumerado para mostrar información detallada de la galectina-8 humana que interactúa con NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Acceda a la información estructural sobre la galectina-8 humana que se muestra en la página con dos visores diferentes.
      1. Sostenga el ratón para darle la vuelta a la molécula y ponga el ligando en primer plano con el software Litemol26 integrado para mostrar la estructura 3D de la lectina. Pase el ratón sobre una de las interacciones enumeradas a la izquierda para actualizar la vista de la derecha y localizar dónde actúa esa interacción en particular en la estructura con el software PLIP27 integrado para detallar las interacciones atómicas entre la lectina y el ligando (Figura 6).
    6. Haga clic en cualquier botón verde que enlace a las entradas correspondientes en UniProt, PDB (sitios europeos o americanos) y GlyConnect para explorar estas referencias cruzadas.

2. Exploración y comparación de O-glicomas en GlyConnect

  1. Exploración del conjunto de datos de alta confianza del desafío HGI
    NOTA: El conjunto de datos HGI mencionado en la introducción se almacena en la base de datos GlyConnect. Contiene 163 N- y 23 O-glicopéptidos que se encuentran en 37 glicoproteínas consideradas como una lista de alta confianza. GlyConnect Compozitor28 es clave para evaluar la consistencia de los datos de glicoma. Es importante destacar que Compozitor permite nodos virtuales (que se muestran en gris) cuando solo se necesita un paso intermedio para conectar los nodos aislados. De esa manera, los nodos virtuales aprietan el gráfico y pueden interpretarse como estructuras potencialmente perdidas en los resultados experimentales.
    1. Explore el conjunto de datos de HGI desde la página de inicio de GlyConnect yendo directamente a la página de referencia del artículo: https://glyconnect.expasy.org/browser/references/2943.
      NOTA: El resumen en los botones de colores refleja parcialmente las cifras proporcionadas en el artículo. Sin embargo, si solo se enumeran 69 péptidos únicos, esto refleja múltiples asociaciones entre péptidos y sitios o estructuras. En el artículo, un glicopéptido se define como una combinación única de un péptido y una composición. En GlyConnect, los glicositios se consideran primero, y se describen como una combinación de un péptido con estructuras. Esto explica la discrepancia en las cifras entre GlyConnect y la cita anterior.
    2. Compruebe la alta frecuencia de aparición de composiciones ligadas a N, como Hex:5 HexNAc:4 NeuAc:2, identificadas en 42 sitios en 43 péptidos en comparación con la singularidad frecuente de la mayoría de las composiciones ligadas a O identificadas en 1 sitio en 1 péptido.
    3. Haga clic en el enlace Compozitor en el lado derecho de la página de entrada de referencia para evaluar la consistencia del conjunto de datos. Asegúrese de que la herramienta Compozitor procesa directamente el DOI de la referencia y rellena el campo de búsqueda con reference=10.1101/2021.03.14.435332 en la pestaña Avanzado de la herramienta. Escriba &glycan_type=O-linked después del número DOI para reducir la búsqueda a los glicanos enlazados a O, de modo que la consulta se convierta: referencia=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Haga clic en el botón Agregar a la selección para recuperar datos de la base de datos (hay 20 composiciones vinculadas a O). Mantenga seleccionada la opción Incluir nodos virtuales . Haga clic en el botón Compute Graph para mostrar el gráfico de composiciones conectadas. Este resultado pone de relieve varias brechas en la continuidad esperada de la biosíntesis de glicanos con nueve nodos virtuales necesarios para completar el gráfico (Figura 7).
  2. Comparación con el O-glicoma de una proteína sérica seleccionada en GlyConnect
    NOTA: Para evaluar si los vacíos pueden ser llenados por los datos almacenados en GlyConnect, se seleccionó una proteína O-glicosilada de las 37 enumeradas con la referencia. En el conjunto de datos, se informa que la cadena pesada H4 (Q14624) del inhibidor de la interal alfa-tripsina es un O-glicosilado en Thr-725.
    1. Vaya a la pestaña Proteína de GlyConnect Compozitor (consulte el paso 2.1.3). En la lista Proteína , seleccione Inter-alfa-trypsin inhibitor heavy chain H4. Asegúrese de que la selección de especies sea Homo sapiens de forma predeterminada. Anule la selección de N-linked en el tipo de glicano. Seleccione solo Thr-725 en la lista Sitio haciendo clic primero en el signo menos a la izquierda del Sitio para anular la selección de todos los sitios y, a continuación, seleccionando solo Thr-725 de la lista.
    2. Haga clic en el botón Agregar a la selección (tenga en cuenta que seis composiciones están asociadas con Thr-725). Haga clic en el botón Compute Graph para mostrar el gráfico de composiciones conectadas (Figura suplementaria 8).
    3. Observe el gráfico mostrado, que muestra las 17 composiciones únicas de las 20 composiciones vinculadas a O del conjunto de datos del artículo en azul y las tres únicas de seis en la base de datos en rojo. En otras palabras, la superposición entre las dos fuentes está presente en tres composiciones que se representan en magenta. Tenga en cuenta que una rotación de 45 ° del gráfico se genera automáticamente.
      NOTA: El número de nodos virtuales se reduce en uno. Como resultado, H2N2S1 que falta en las 20 composiciones vinculadas a O del conjunto de datos del artículo y se representa como un nodo virtual ahora se llena con una composición adicional asociada con Thr-725 de la cadena pesada H4 del inhibidor de la inter-alfa-tripsina en la base de datos. Esto simplifica la topología del gráfico porque otros dos nodos virtuales se vuelven inútiles, ya que eran opciones alternativas para llenar el espacio entre H1N2S1 y H2N2S2. Sin embargo, una segunda composición importada de la base de datos se aislaría si no fuera por la creación de dos nuevos nodos virtuales alternativos H2N2F1S1 y H1N2F2S1.
    4. Para dar sentido a los nodos virtuales, compruebe si las composiciones correspondientes están presentes en GlyConnect. Para hacer esto, haga clic en el botón Exportar debajo del gráfico. Seleccione Solo virtual anulando la selección de todas las demás opciones. Haga clic en el icono del portapapeles para copiar la selección de 8 composiciones.
    5. Pegue la selección en la ventana de consulta de la pestaña Personalizado de Compozitor. Seleccione O-linked en el campo Glycan Type . Establezca la etiqueta de selección en el campo Composiciones en, por ejemplo, VN para nombrar la lista de 8 composiciones. Haga clic en el botón Agregar a la selección y, a continuación, en el botón Compute Graph . Todos los nodos virtuales ahora se muestran como nodos verdes (Figura 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La primera parte del protocolo (sección 1) mostró cómo investigar la especificidad o la similitud de los N-glicanos unidos en Asn-69 del antígeno prostático específico (PSA) humano utilizando la plataforma GlyConnect. Las variaciones dependientes de tejidos (orina y líquido seminal), así como las variaciones dependientes de isoformas (pI normal y alta) en la expresión de glicanos, se enfatizaron utilizando dos herramientas de visualización (Figura 4 y Figura 5).

En primer lugar, GlyConnect Octopus, que muestra las asociaciones entre las entidades almacenadas en la base de datos, brindó la oportunidad de explorar la información contextual a través de (1) la selección de diferentes entidades que se mostrarán en el Octopus y (2) hacer clic en los enlaces para examinar las entradas relacionadas. El resultado fueron asociaciones distintivas dependiendo del tejido.

En segundo lugar, GlyConnect Compozitor, originalmente diseñado para definir /refinar un archivo de composición para la identificación de glicopéptidos, se utilizó para evaluar la expresión de glicanos en dos isoformas conocidas de PSA (pI normal y alta). La comparación de cada glioma de isoforma produjo un gráfico bien conectado que distingue cuatro nodos (composiciones), dos de los cuales son característicos de la isoforma de pI alto. A pesar de que la superposición de glicoma es significativa, el gráfico de barras de propiedades de glicanos mostró una caída de la sialilación de la isoforma común a la alta pI (Figura suplementaria 5).

Además, la exploración de UniLectin3D destaca la galectina-8 como un posible lector del glicoma PSA, ya que este último contiene muchas estructuras con un epítopo terminal NeuAc(a2-3)Gal(b1-4)GlcNAc. Esto proporciona una pista a seguir y no puede considerarse como evidencia final. No obstante, se sabe que el PSA y las galectinas desempeñan un papel esencial en el cáncer de próstata29 y recientemente se destacó el papel específico de la galectina-830. La primera parte del protocolo correlaciona datos estructurales (glicoproteómica) y funcionales (unión) para establecer un escenario probable para las interacciones proteína-proteína mediadas por glicanos.

En la segunda parte del protocolo (sección 2), se examinó un conjunto de alta calidad de composiciones de O-glicanos asociadas con un tejido particular (suero humano) y se comparó con el contenido de la base de datos GlyConnect, ofreciendo así la opción de personalizar un archivo de composición de glicanos para la identificación refinada de glicopéptidos (Figura 7 y Figura 8 ). Podría basarse en el conjunto mínimo de 20 composiciones disponibles de un conjunto de datos (resultados del desafío HGI) o mejorarse con 23 a 26 elementos recopilados racionalmente en GlyConnect para fortalecer la consistencia del conjunto.

rojo naranja claro verde azul claro morado rosado azul oscuro marrón naranja oscuro
especie proteína fuente de tejido estructura composición enfermedad referencia glicosita péptido

Tabla 1: Esquema de color asociado a cada entidad de la base de datos GlyConnect y válido en todo momento.

Figure 1
Figura 1: Rueda de dependencia de Glyco@Expasy instancia para GlyConnect. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2: Estructura de glicano sugerida para una composición de glicano seleccionada. Estructura de glicano sugerida de un experimento glucómico para una composición de glicanos de un experimento glicoproteómico dirigido a la misma glicoproteína, aquí antígeno prostático específico (PSA) humano, como se propone en la página de GlyConnect para PSA (ID: 790). Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: Menú lateral derecho de la página GlyConnect para PSA. Referencias cruzadas en las que se puede hacer clic a otras bases de datos importantes y mostrar con el complemento LiteMol glycan de la estructura 3D existente en el PDB. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: La salida de GlyConnect Octopus que muestra asociaciones dependientes de tejidos entre proteínas y glicanos. La consulta Hybrid AND Sialylated ha devuelto todas las composiciones que coinciden con estos criterios y cada composición vincula la información asociada sobre proteínas y glicanos registrada en la base de datos. Tenga en cuenta que, de forma predeterminada , Species se establece en Homo sapiens , pero esta opción es modificable. Aquí, GlyConnect Octopus muestra todas las proteínas humanas (nodos izquierdos) que transportan estructuras de glicanos híbridos y sialilados (ganglios derechos) con los tejidos en los que se expresan (nodos centrales). (A) Se destacan las asociaciones con la orina mostrando dos proteínas: coriogonadotropina (GLHA_HUMAN) e isoforma común de PSA (KLK3_HUMAN) conectadas a estructuras de glicanos dispersas (heterogéneas). (B) Se destacan las asociaciones con el líquido seminal mostrando dos isoformas proteicas de PSA (KLK3_HUMAN) conectadas a estructuras de glicanos agrupados (similares). Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5: La salida de GlyConnect Compozitor que muestra los N-glicomas superpuestos de las dos isoformas de PSA. Las composiciones en notación condensada etiquetan cada nodo. Los glicanos asociados a la isoforma común se representan como nodos azules y los de la isoforma pI alta como nodos rojos. La superposición entre glicomas se muestra como ganglios magenta. Los números dentro de los nodos representan el número de estructuras de glicanos que coinciden con la composición etiquetada de acuerdo con el contenido de la base de datos GlyConnect con respecto a PSA. El gráfico de Compozitor que se muestra ha sido ligeramente modificado de la salida en bruto para desenredar la red que es generada por la biblioteca D3.js. Esto es fácil de hacer ya que cualquier nodo se puede arrastrar en el espacio de la ventana del navegador donde un usuario lo desee, y las rutas se pueden acortar o estirar. El usuario puede escribir una composición específica en el campo Zoom en la esquina superior derecha para acercar y centrar el gráfico en el nodo correspondiente. Haga clic aquí para ver una versión más grande de esta figura.

Figure 6
Figura 6: Entrada resumida de la galectina-8 humana con detalles de unión a NeuAc(a2-3)Gal(b1-4)GlcNAc. Al hacer clic en el botón verde Ver la estructura e información 3D (indicado con una elipse roja) se abre una nueva página en la que se muestra un primer plano de las interacciones de residuos con la aplicación PLIP (indicado por una flecha roja). Haga clic aquí para ver una versión más grande de esta figura.

Figure 7
Figura 7: La salida de GlyConnect Compozitor que muestra el O-glicoma del conjunto de datos de alta confianza del suero humano del desafío HGI. Sin nodos virtuales (ver texto), la conectividad de ese gráfico es baja. Haga clic aquí para ver una versión más grande de esta figura.

Figure 8
Figura 8: La salida de GlyConnect Compozitor que muestra la posibilidad de completar el O-glicoma del conjunto de datos de alta confianza de suero humano del desafío HGI, utilizando el contenido de la base de datos GlyConnect. El acceso al contenido de toda la base de datos GlyConnect mediante la ficha Personalizado de Compozitor revela que las composiciones correspondientes a los nodos virtuales se asignan con las estructuras definidas existentes como se resalta en las etiquetas de los nodos. El tamaño del nodo representa el número de referencias almacenadas en la base de datos e informa de la composición correspondiente. La etiqueta numérica de nodos denota el número de estructuras correspondientes almacenadas en GlyConnect. Las composiciones seleccionadas parecen tener de cero a dieciocho coincidencias posibles en la base de datos. De hecho, estos nodos son solo virtuales como reflejo del contenido de los conjuntos de datos experimentales. Se recomienda refinar la información en el gráfico para probar el realismo de estos nodos adicionales. Haga clic aquí para ver una versión más grande de esta figura.

Figura complementaria 1: Gráfico de burbujas de la página de inicio de Glyco@Expasy. Hacer zoom en el gráfico de burbujas de la página de inicio de Glyco@Expasy para centrarse en la categoría de glicoproteínas . Software mostrado en burbujas verdes y bases de datos en burbujas amarillas. Al hacer clic en cualquier burbuja se resume el propósito del recurso. Haga clic aquí para descargar este archivo.

Figura complementaria 2: Asociaciones recuperadas por pulpo que coinciden con la consulta según la composición. Visualización predeterminada de GlyConnect Octopus de proteínas humanas (nodos izquierdos) que transportan estructuras de glicanos híbridos y sialilados (nodos derechos) con composiciones coincidentes (nodos centrales). La composición H6N4F12S1 parece exclusiva de ambas isoformas de PSA (KLK3_HUMAN). Al hacer clic en el ID de estructura única (10996) se abre la página correspondiente con detalles que muestran que las dos isoformas son de hecho las únicas proteínas que llevan este glicano en particular. Haga clic aquí para descargar este archivo.

Figura complementaria 3: Asociaciones recuperadas por pulpo que coinciden con la consulta en función de la enfermedad. Visualización de GlyConnect Octopus de todas las proteínas humanas (ganglios izquierdos) que transportan estructuras de glicanos híbridos y sialilados (ganglios derechos) con las enfermedades en las que se expresan (ganglios centrales). Se destacan las asociaciones con el cáncer de próstata mostrando la isoforma común del PSA (KLK3_HUMAN). Haga clic aquí para descargar este archivo.

Figura complementaria 4: Asociaciones recuperadas por pulpo que coinciden con la consulta en función de la información del tejido. Visualización de GlyConnect Octopus de todas las proteínas humanas (nodos izquierdos) que transportan estructuras de glicanos biantenares, incluido el motivo NeuAc(a1-3)Gal(b1-4)GlcNAc (nodos derechos) con los tejidos en los que se expresan (nodos centrales). Se destacan las asociaciones con el líquido seminal mostrando solo la isoforma común del PSA (KLK3_HUMAN) y siete estructuras. Haga clic aquí para descargar este archivo.

Figura complementaria 5: La salida de GlyConnect Compozitor que muestra los N-glicomas superpuestos de las dos isoformas de PSA. Las composiciones en notación condensada están etiquetando cada nodo. Los glicanos asociados a la isoforma común se representan como nodos azules y los de la isoforma pI alta como nodos rojos. La superposición entre glicomas se muestra como ganglios magenta. Los números dentro de los nodos representan el número de estructuras de glicanos que coinciden con la composición etiquetada de acuerdo con el contenido de la base de datos GlyConnect con respecto a PSA. Al pasar el movimiento sobre el gráfico de barras de las propiedades de los glicanos, se muestra la correspondencia entre la frecuencia y los nodos como burbujas naranjas. Casi todos los nodos de isoforma común psa están cubiertos. Esta frecuencia disminuye en la isoforma pI alta. Haga clic aquí para descargar este archivo.

Figura complementaria 6: Interfaz de búsqueda de glicanos en UniLectin3D. Al hacer clic en el símbolo SNFG de ácido siálico (con un círculo en rojo) se inicia la búsqueda de todos los ligandos que contienen NeuAc, almacenados en UniLectin3D. Haga clic aquí para descargar este archivo.

Figura complementaria 7: Extracto de la salida de la búsqueda de todos los ligandos que contienen NeuAc. El motivo de interés NeuAc(a2-3)Gal(b1-4)GlcNAc está rodeado en rojo. Haga clic aquí para descargar este archivo.

Figura complementaria 8: La salida de GlyConnect Compozitor que muestra el O-glicoma del conjunto de datos HGI superpuesto con el de GlyConnect. La salida de GlyConnect Compozitor que muestra el O-glicoma del conjunto de datos de alta confianza del suero humano del desafío HGI en azul superpuesto con el O-glicoma de una proteína O-glicosilada de las 37 enumeradas con la referencia, es decir, el inhibidor de la cadena pesada H4 del inhibidor de la inter-alfa-tripsina con información adicional contenida en GlyConnect. Esto mejora la conectividad del gráfico. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus como herramienta para revelar correlaciones inesperadas
GlyConnect Octopus fue diseñado originalmente para consultar la base de datos con una definición suelta de glicanos. De hecho, la literatura a menudo informa de las principales características de los glicanos en un glicoma, como ser fucosilado o sialilado, estar hecho de dos o más antenas, etc. Además, los glicanos, ya sean N u O, enlazados se clasifican en núcleos, como se detalla en el manual de referencia Essentials of Glycobiology1, que también se citan a menudo en los artículos publicados. Finalmente, los epítopos de glicanos, como los antígenos del grupo sanguíneo, son otra propiedad buscada en las estructuras y potencialmente seleccionada para tipificar un glicano. Al final, puede ser relevante buscar características comunes o distintas de un glicoma expresado en un tejido específico o en una especie seleccionada. En ese sentido, la información recopilada debe utilizarse como fuente de nuevas suposiciones en lugar de hechos únicos.

GlyConnect Compozitor como herramienta para dar forma a un conjunto de composiciones de glicanos
La exploración de la información estructural como se describe en una página de proteínas tiene limitaciones porque las listas tienden a oscurecer las relaciones entre las estructuras detalladas, así como las que existen entre las composiciones. GlyConnect Octopus atiende a la primera y GlyConnect Compozitor a la segunda. Una mirada cuidadosa a las estructuras enumeradas en la mayoría de las entradas de GlyConnect revela la existencia de subestructuras comunes. Sin embargo, esta información no es fácil de comprender visualmente sin la ayuda de un espectador dedicado.

El contenido del archivo de composición de glicanos que apoya la identificación de la fracción de glicanos como un parámetro clave del software de identificación de glicopéptidos se estableció mediante el análisis de los resultados del desafío HGI. La mayoría de los motores de búsqueda de proteómica clásica se adaptan a la selección de modificaciones basadas en glico de una colección que se deriva de los datos recopilados en bases de datos / repositorios o en la literatura. Otras herramientas dedicadas a la glicoproteómica utilizan el conocimiento de la biosíntesis de glicanos. De esta manera, el archivo de composición se define teóricamente como el resultado de la actividad enzimática esperada. Al final, hay tantos archivos de composición como motores de búsqueda y la superposición entre ellos es muy variable. Sin embargo, aprender de la experiencia pasada en proteómica, especialmente cuando se tienen en cuenta las modificaciones posttraduccionales, revela que el rendimiento de los motores de búsqueda está correlacionado con la limitación del espacio de búsqueda31. Observaciones similares se realizan en glicoproteómica y GlyConnect Compozitor fue diseñado para apoyar la selección de datos de composición educada, cuya importancia se discutió anteriormente32.

El uso de esta herramienta se ilustró incompletamente en el protocolo, especialmente en lo que respecta a la pestaña Avanzado en la que se pueden expresar las consultas que inician directamente el acceso programático a GlyConnect a través de su API (Application Programming Interface). Por ejemplo, escribir taxonomía=homo sapiens&glycanType=N-linked&tissue=orina&disease=prostate cancer en la ventana de consulta de la pestaña Avanzado equivale a rellenar los campos correspondientes en la pestaña Fuente (seleccionando Homo sapiens en Especie, Orina en Tejido y N-vinculado en Tipo de glicano) y la pestaña Enfermedad (seleccionando Homo sapiens en Especie, Cáncer de próstata en la enfermedad y ligado a N en el tipo de glicano). En otras palabras, proporciona en un solo paso un resultado que requeriría varias selecciones.

Finalmente, si bien la creación de nodos virtuales se explica en el protocolo, su redundancia potencial necesita un comentario adicional. Dos opciones concurrentes pueden ser indistinguibles porque la acción simulada de las enzimas en el gráfico no tiene en cuenta la cronología de las actividades enzimáticas. Es por eso que Compozitor sugiere dos rutas a través de dos nodos virtuales para unir dos nodos no conectados correspondientes a recuentos de monosacáridos con hasta dos diferencias. La inclusión de nuevos datos a menudo proporciona enlaces faltantes. El usuario siempre es libre de considerar o descartar nodos virtuales, marcando (des)la casilla Incluir nodos virtuales .

Bases de datos conocidas y limitaciones de software
En general, como con cualquier navegación en la Web, los protocolos descritos anteriormente ocasionalmente conducen a una página inexistente, a menudo debido a una actualización de un sitio o un conflicto de actualizaciones entre dos sitios. En este caso y, de hecho, en todos los casos en los que la navegación no fluye, lo más fácil es enviar una nota al servicio de asistencia de Expasy cuya eficiencia ha contribuido significativamente al éxito del portal en los últimos 28 años.

El contenido de GlyConnect está sesgado como reflejo de los desequilibrios actuales en la literatura. La mayoría de las publicaciones informan de N-glicosilación en mamíferos y la base de datos es más rica en N-glicoproteínas humanas. No obstante, en el pasado se nos ha pedido que incluyamos conjuntos de datos menos comunes y que permanezcamos completamente abiertos a recibir consejos y sugerencias.

Además, Compozitor se limita actualmente a la comparación de tres conjuntos de datos de composición. Se planea una revisión importante de la subpestaña Determinante en el Pulpo. Los recursos de Glyco@Expasy necesitan actualizaciones periódicas y algunos pueden no llevarse a cabo a su debido tiempo; no obstante, las advertencias y/o anuncios se publican cuando así sucede.

Los portales de socios, conocidos como GlyGen (https://www.glygen.org) y GlyCosmos (https://www.glycosmos.org), proporcionan diferentes opciones y herramientas. En última instancia, navegar y buscar información sobre cualquiera de las opciones implica un alto nivel de subjetividad y depende en gran medida de los hábitos y preocupaciones de los usuarios. Solo podemos esperar que nuestra solución se adapte a una parte de la comunidad.

El aporte de la glicociencia está creciendo en los proyectos de ciencias de la vida y los estudios que establecen el papel de los glicanos en los problemas de salud se producen continuamente. El reciente enfoque en el Sars-Cov-2 reveló una vez más la importancia de las proteínas glicosiladas, especialmente en los enfoques estructurales33. Glycoinformatics apoya a los glicocientíficos en las tareas diarias de análisis e interpretación de datos.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores declaran que no hay conflictos de intereses.

Acknowledgments

El autor reconoce calurosamente a los miembros pasados y presentes del Grupo de Informática Proteome involucrados en el desarrollo de los recursos utilizados en este tutorial, específicamente, Julien Mariethoz y Catherine Hayes para GlyConnect, François Bonnardel para UniLectin, Davide Alocci y Frederic Nikitin para Octopus, y Thibault Robin para Compozitor y el toque final sobre Octopus.

El desarrollo del proyecto glyco@Expasy cuenta con el apoyo del Gobierno Federal Suizo a través de la Secretaría de Estado de Educación, Investigación e Innovación (SERI) y actualmente se complementa con la Fundación Nacional Suiza para la Ciencia (SNSF: 31003A_179249). ExPASy es mantenido por el Instituto Suizo de Bioinformática y alojado en el Centro de Competencias Vital-IT. El autor también reconoce a Anne Imberty por su destacada cooperación en la plataforma UniLectin apoyada conjuntamente por ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biología Número 179
Recursos bioinformáticos para el estudio de las interacciones de proteínas mediadas por glicanos
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter