Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Ресурсы биоинформатики для изучения гликано-опосредованных белковых взаимодействий

Published: January 20, 2022 doi: 10.3791/63356

Summary

Этот протокол иллюстрирует, как исследовать, сравнивать и интерпретировать гликомы белка человека с помощью онлайн-ресурсов.

Abstract

Инициатива Glyco@Expasy была выдвинута в виде набора взаимозависимых баз данных и инструментов, охватывающих несколько аспектов знаний в области гликобиологии. В частности, он направлен на выявление взаимодействий между гликопротеинами (такими как рецепторы клеточной поверхности) и углеводсвязывающими белками, опосредованными гликанами. Здесь основные ресурсы коллекции представлены на двух иллюстративных примерах, сосредоточенных на N-гликоме человеческого простат-специфического антигена (ПСА) и O-гликоме сывороточных белков человека. С помощью различных запросов к базе данных и с помощью инструментов визуализации в этой статье показано, как исследовать и сравнивать контент в континууме для сбора и корреляции разрозненных фрагментов информации. Собранные данные предназначены для подачи более сложных сценариев функции гликана. Таким образом, введенная здесь гликоинформатика предлагается в качестве средства для усиления, формирования или опровержения предположений о специфичности белкового гликома в данном контексте.

Introduction

Гликаны, белки, к которым они присоединены (гликопротеины) и белки, с которыми они связываются (лектины или углеводсвязывающие белки), являются основными молекулярными субъектами на поверхности клетки1. Несмотря на эту центральную роль в клеточно-клеточной коммуникации, крупномасштабные исследования, включая гликомику, гликопротеомику или гликан-интерактомику, по-прежнему скудны по сравнению с их аналогами в геномике и протеомике.

До недавнего времени не были разработаны методы характеристики ветвящихся структур сложных углеводов, еще конъюгированных с белком-носителем. Биосинтез гликопротеинов представляет собой процесс, не управляемый шаблонами, в котором доноры моносахаридов, принимающие гликопротеиновые субстраты, а также гликозилтрансферазы и гликозидазы играют интерактивную роль. Полученные гликопротеины могут иметь сложные структуры с несколькими точками ветвления, где каждый моносахаридный компонент может быть одним из нескольких типов, присутствующих в природе1. Процесс, не управляемый шаблонами, навязывает биохимический анализ в качестве единственного варианта для получения структурных данных олигосахаридов. Аналитический процесс гликовых структур, прикрепленных к нативному белку, часто является сложным, поскольку он требует чувствительных, количественных и надежных технологий для определения моносахаридного состава, связей и ветвящихся последовательностей2.

В этом контексте масс-спектрометрия (МС) является наиболее широко используемым методом в экспериментах по гликомике и гликопротеомике. Со временем они выполняются в более высоких настройках пропускной способности, и данные теперь накапливаются в базах данных. Гликанские структуры в различных форматах3 заполняют GlyTouCan4, универсальное хранилище данных гликана, где каждая структура связана со стабильным идентификатором независимо от уровня точности, с которой определен гликан (например, возможно, отсутствующий тип связи или неоднозначный состав). Собраны очень похожие структуры, но четко указаны их незначительные различия. Гликопротеины описаны и курируются в GlyConnect5 и GlyGen6, двух базах данных, перекрестно ссылающихся друг на друга. Данные о РС, подтверждающие структурные доказательства, все чаще хранятся в GlycoPOST7. Для более широкого охвата онлайн-ресурсов глава 52 справочного пособия «Основы гликобиологии» посвящена гликоинформатике8. Интересно, что программное обеспечение для идентификации гликопептидов распространилось в последние годы9,10, хотя и не в пользу воспроизводимости. Последняя проблема побудила лидеров HUPO GlycoProteomics Initiative (HGI) поставить перед собой задачу программного обеспечения в 2019 году. Данные MS, полученные при обработке сложных смесей N- и O-гликозилированных белков сыворотки крови человека в режимах фрагментации CID, ETD и EThcD, были доступны конкурентам, будь то пользователи программного обеспечения или разработчики. Полный отчет о результатах этой задачи11 изложен только здесь. Начнем с того, что наблюдалось распространение идентификаций. Это в основном интерпретировалось как вызванное разнообразием методов, реализованных в поисковых системах, их настроек и того, как выводы были отфильтрованы, а пептиды «подсчитаны». Экспериментальный дизайн, возможно, также поставил некоторое программное обеспечение и подходы в (не)преимущество. Важно отметить, что участники, использующие одно и то же программное обеспечение, сообщили о противоречивых результатах, тем самым подчеркнув серьезные проблемы с воспроизводимостью. Путем сравнения различных представлений был сделан вывод о том, что некоторые программные решения работают лучше, чем другие, а некоторые стратегии поиска дают лучшие результаты. Эта обратная связь, вероятно, будет способствовать совершенствованию автоматизированных методов анализа данных о гликопептидах и, в свою очередь, повлияет на содержание базы данных.

Расширение гликоинформатики привело к созданию веб-порталов, которые предоставляют информацию и доступ к множеству аналогичных или дополняющих ресурсов. Самые последние и актуальные из них описаны в главе серии книг Comprehensive Glycoscience12, и благодаря сотрудничеству предлагается решение для обмена данными и информацией в режиме открытого доступа. Был разработан один из таких порталов, который первоначально назывался Glycomics@ExPASy 13 и переименован Glyco@Expasy, после капитального ремонта платформы Expasy14, в которой в течение десятилетий размещалась большая коллекция инструментов и баз данных, используемых в нескольких -omics, самым популярным элементом является UniProt15 - универсальная база знаний о белках. Glyco@Expasy предлагает дидактическое обнаружение назначения и использования баз данных и инструментов на основе визуальной категоризации и отображения их взаимозависимостей. Следующий протокол иллюстрирует процедуры для изучения данных гликомики и гликопротеомики с выбором ресурсов из этого портала, который делает связь между гликопротеомикой и гликкан-интерактомикой явной через гликомику. Эксперименты с гликомикой создают структуры, в которых моносахариды полностью определены и связи частично или полностью определены, но их прикрепление к белковому участку плохо, если вообще характеризуется. Напротив, эксперименты по гликопротеомике генерируют точную информацию о прикреплении сайта, но с плохим разрешением гликановых структур, часто ограниченных моносахаридными композициями. Эта информация собрана в базу данных GlyConnect. Кроме того, инструменты поиска в GlyConnect могут быть использованы для обнаружения потенциальных гликановых лигандов, которые описаны вместе с белками, распознающими их в UniLectin16, связанными с GlyConnect через гликаны. Протокол, представленный здесь, разделен на два раздела, чтобы охватить вопросы, специфичные для N-связанных и O-связанных гликанов и гликопротеинов.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

ПРИМЕЧАНИЕ: Требуется устройство с подключением к Интернету (предпочтительно большой экран) и современным веб-браузером, таким как Chrome или Firefox. Использование Safari или Edge может быть не таким надежным.

1. От белка N-гликома в GlyConnect до лектина UniLectin

  1. Доступ к ресурсам из Glyco@Expasy
    ПРИМЕЧАНИЕ: Процедура, описанная здесь, предназначена для доступа к GlyConnect, но может быть применена к доступу к любому ресурсу, записанному на платформе.
    1. Перейдите в https://glycoproteome.expasy.org/glycomics-expasy и рассмотрите пузырьковую диаграмму справа, показывающую различные категории, такие как гликоконъюгаты или связывание гликанов. В крайнем левом меню, отражающем категории в пузырьках, установите флажок Гликопротеины , чтобы пузырьковая диаграмма справа сразу же увеличила пузырь, соответствующий этой категории.
      ПРИМЕЧАНИЕ: Зеленые пузырьки - это инструменты, а желтые пузыри - это базы данных. Нажатие на любой из них снова увеличивает масштаб, чтобы предоставить подробную информацию о ресурсе. Прежде чем сделать это, пользователь может захотеть понять зависимости этого ресурса от других.
    2. Чтобы получить сведения о зависимостях, перейдите с вкладки Тематическая классификация ресурсов на вкладку Колесо зависимостей ресурсов . Поместите мышь на GlyConnect в колесо, чтобы проверить уровень его интеграции с другими источниками (рисунок 1).
    3. Вернитесь на вкладку Тематическая классификация ресурсов , чтобы открыть пузырь GlyConnect , как на шаге 1.1.1, и нажмите на него (дополнительный рисунок 1), чтобы отобразить домашнюю страницу GlyConnect в новой вкладке, которая показывает статистику содержимого в последнем выпуске базы данных.
      ПРИМЕЧАНИЕ: Цветовая схема, описанная в таблице 1 , соответствует различным типам информации, хранящейся в базе данных. Этот цветовой код действителен на всех страницах сущностей в GlyConnect и согласован во всем. На домашней странице также отображаются четыре раздела, посвященные сфокусированным наборам данных, таким как те, которые описывают гликозилирование спайкового белка Sars-Cov-2 (COVID-19) или подробно описывают олигосахариды грудного молока (HMO). Они не будут изучаться в настоящем протоколе.
  2. Изучение контекстуальной информации белка N-гликома
    ПРИМЕЧАНИЕ: Все структуры гликана в GlyConnect отображаются в трех альтернативных и часто используемых форматах: (1) Номенклатура символов для гликанов (SNFG)17 (2) ИЮПАК конденсированный18и (3) Оксфорд19. Напротив, не существует стандартной нотации для выражения гликанового состава. В GlyConnect используется следующий код: Hex для гексозы, HexNAc для N-ацетилгексозамина, dHex для фукозы и NeuAc для сиаловых кислот. Для простоты инструменты визуализации полагаются на конденсированную нотацию: H для гексозы, N для N-ацетилгексозамина, F для фукозы и S для сиаловых кислот. Кроме того, маленькие буквы обозначают модификации, такие как «a» для ацетилирования, «p» для фосфорилирования и «s» для сульфатации, для наиболее частых из этих так называемых заместителей.
    1. Чтобы просмотреть и исследовать N-гликом человеческого простат-специфического антигена (ПСА) с домашней страницы GlyConnect, выполните следующие действия.
      ПРИМЕЧАНИЕ: Гликозилирование ПСА человека изучалось на протяжении многих лет, особенно в контексте рака предстательной железы. База данных GlyConnect хранит три ссылки20,21,22, которые объединяют данные о гликомике и гликопротеомике. Обратите внимание, что результаты, представленные здесь, были получены с выпуском GlyConnect за сентябрь 2021 года. Скрытое использование базы данных может привести к несколько иной статистике из-за частого обновления данных.
    2. Нажмите кнопку PROTEIN , чтобы открыть представление белка базы данных. На странице просмотра белка введите простату в окне поиска. Найдите две записи, перечисленные в выходных данных, различающие две изоформы PSA с различными значениями pI. Нажмите на 790 (столбец Id), соответствующий общей изоформе PSA.
      ПРИМЕЧАНИЕ: Найдите верхнюю разноцветную панель, которая показывает сводную информацию, извлеченную из опубликованной работы, в схеме, подробно описанной выше. Возможны несколько вариантов навигации, как описано ниже.
    3. На верхней разноцветной панели нажмите на кнопку SOURCE зеленым цветом , чтобы отобразить типы образцов, из которых были обработаны опубликованные данные: Моча и Семенная жидкость. Чтобы просмотреть эту информацию, щелкните любой из этих типов образцов. То же самое относится к любому элементу, который появляется при нажатии на цветную кнопку.
    4. Чтобы проверить связанное со здоровьем содержимое базы данных, нажмите кнопку DISEASE , которая содержит два элемента, один из которых рак предстательной железы , который ссылается на соответствующую специальную страницу болезней в GlyConnect. Резюме для этой страницы показывает, что три крупномасштабных исследования сообщили о 319 композициях на 1087 участках, обнаруженных в 308 белках человека.
    5. Нажмите на кнопку СТРУКТУРА , чтобы просмотреть полный список из 135 структур, связанных с ПСА, из данных о гликомике. Нажмите на кнопку СОСТАВ для соответствующих 78 композиций, определенных экспериментами по гликопротеомике. Нажмите на любую структуру или композицию, чтобы получить дополнительную информацию.
      ПРИМЕЧАНИЕ: Можно получить такие детали, как список альтернативных белков, несущих конкретную структуру, или список структур, соответствующих композиции. Известно, что ПСА имеет только один участок N-гликозилирования в Asn-69 (только один элемент учитывается для коричневой кнопки SITE ).
    6. Чтобы уменьшить неоднозначность композиций, нажмите на ПРЕДЛОЖЕННЫЙ STRUCT под выбранной композицией (например, Hex:6 HexNAc:3 NeuAc:1). Предложение делается каждый раз, когда количество моносахаридов совпадает с количеством структуры, перечисленной выше (рисунок 2).
      ПРИМЕЧАНИЕ: Композиция Hex:6 HexNAc:3 NeuAc:1, полученная в результате эксперимента по гликопротеомике, соответствует четырем структурам с более высоким разрешением из данных гликомики. В случае ПСА нет никакой неопределенности сайта, которую необходимо устранить, поскольку только Asn-69 является гликозилированным.
    7. Чтобы полностью изучить страницу белка, просмотрите более подробную информацию в правой части страницы (рисунок 3).
      1. Просмотрите запись 3QUM PDB (Protein Data Bank23) по умолчанию для PSA, которая показана с двумя сложными гликанами, прикрепленными к каждому мономеру (рисунок 3), или альтернативную запись 2ZCK , которая также доступна из-за присоединенного углевода. Вторая запись показывает одну цепочку.
        ПРИМЕЧАНИЕ: Обе записи визуализируются с помощью плагина 3D LiteMol24 , который отображает гликаны в нотации SNFG-3D, принятой в PDB-RCSB.
      2. Нажмите на соответствующие ссылки других перекрестных ссылок, чтобы изучить соответствующую функциональную информацию из основных баз данных протеомики, таких как UniProt (рисунок 3).
  3. Визуализация и корреляция контекстуальной информации белка N-гликомы
    ПРИМЕЧАНИЕ: Как видно из предыдущего раздела, длинные списки структур или композиций может быть трудно воспринимать в целом, и GlyConnect полагается на два разных инструмента для визуализации ключевой информации, а именно, GlyConnect Octopus и GlyConnect Compozitor (первый расширяет сводную информацию, собранную в цветных кнопках, а второй выявляет структурные зависимости с точки зрения структуры / композиции, содержащейся в другом). Как показано ниже, GlyConnect Octopus исследует связи между различными сущностями, хранящимися в базе данных, выделяя несколько или одиночные соединения в качестве отражения содержимого базы данных.
    1. Выполните поиск GlyConnect Octopus, чтобы подтвердить наличие общих структурных признаков, таких как гибридные структуры ядра и очень частые структуры, содержащие сиаловую кислоту, в разнообразии гликанов, прикрепленных к ПСА, как описано ниже.
    2. Перейдите на домашнюю страницу Octopus https://glyconnect.expasy.org/octopus/. Оставьте вкладку N-linked выбранной по умолчанию. Перейдите на вложенную вкладку Ядра и щелкните значок Гибрид . Перейдите на подвкладку Свойства и щелкните значок Sialylated . Нажмите на зеленую кнопку Поиск ниже.
      ПРИМЕЧАНИЕ: Результаты поиска графически отображаются в виде связей между тремя категориями элементов. По умолчанию центральный список соответствует запросу композиций, левая коллекция охватывает связанные белки, а правая — связанные гликаны.
    3. На отображаемом графике отношений наведите курсор на H6N4F1S1 , чтобы выделить связи с шестью белками и тремя структурами. Сравните это, наведя курсор на H6N4F2S1 , который выделяет две изоформы PSA (обе называются UniProt ID: KLK3_HUMAN) и одну структуру (ID: 10996). Наведите указатель мыши на идентификатор структуры, чтобы отобразить ее представление SNFG, и нажмите на нее, чтобы открыть соответствующую страницу (дополнительный рисунок 2).
    4. Измените узлы Octopus на любую другую тему, описывающую контекст гликозилирования. Цветовой код остается таким же, как и описанный ранее (см. таблицу 1).
      1. Измените Центральные узлы на Ткани, чтобы отобразить 15 вариантов в середине графика, многие из которых являются жидкостями организма. Ищите все ассоциации между белками и гликанами, соответствующие запросу в зависимости от информации о тканях. Поместите курсор на Моча или Семенная жидкость в середине графика, чтобы просмотреть различные ассоциации (рисунок 4A,B).
      2. Измените Центральные узлы на Болезнь , чтобы отобразить 13 вариантов, одним из которых является Рак предстательной железы. Единственным ассоциированным белком является ПСА (KLK3_HUMAN) (дополнительный рисунок 3).
        ПРИМЕЧАНИЕ: Более пристальный взгляд на N-гликом ПСА, показанный на странице белка, выделяет очень высокую частоту терминального NeuAc(a?-?) Гал(б?-?) Подструктура GlcNAc во многих случаях на структурах с двумя или тремя антеннами. Другой осьминог может быть сгенерирован на этой основе, как описано ниже.
    5. Нажмите кнопку Очистить , чтобы обновить поиск. Перейдите на подвкладку Свойства и щелкните значок Би-антенны . Перейдите на подвкладку Определители и щелкните значок 3-Sialyl-LN (тип 2 ). Нажмите на зеленую кнопку Поиск ниже.
    6. Проверьте ассоциации, полученные осьминогом, с биантенными гликанами, содержащими терминальный мотив 3-Sialyl-LN (тип 2), т.е. NeuAc(a1-3)Gal(b1-4)GlcNAc. Измените центральные узлы на ткани для облегчения чтения и наведите курсор на KLK3_HUMAN , чтобы напрямую соединить семенную жидкость с общей изоформой ПСА и семью структурами (дополнительный рисунок 4).
      ПРИМЕЧАНИЕ: Второй инструмент визуализации, GlyConnect Compozitor, выполняет сканирование потенциальных отношений между каждой композицией в их списке (см. Ниже). Связь определяется как отличающаяся только от одного моносахарида между двумя композициями. Эти идентифицированные отношения, построенные на графике, обнажают (дис)непрерывность гликома.
    7. Используйте GlyConnect Compozitor для сканирования потенциальных связей между каждой композицией в их списке, как показано ниже для случая PSA.
      ПРИМЕЧАНИЕ: GlyConnect Compozitor обрабатывает композиции в сочетании с контекстом. Он предлагает отдельные вкладки для запроса GlyConnect, например, Белки, Источники, Клеточные линии, Заболевания, которые говорят сами за себя, чтобы квалифицировать контекст. Это проиллюстрировано здесь с помощью PSA следующим образом.
    8. Вернитесь на страницу белка ПСА: https://glyconnect.expasy.org/browser/proteins/790. В правой части страницы ввода PSA нажмите на ссылку Compozitor. Убедитесь, что поля поиска Compozitor предварительно заполнены сведениями о записи Id 790 на вкладке «Белок» (Белок: простат-специфический антиген, Вид: Homo sapiens и Glycan Type: N-linked).
    9. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных и отобразить график связанных композиций. Снимите флажок Включить виртуальные узлы . Нажмите кнопку Compute Graph , чтобы отобразить график, показывающий хорошо связанный набор из 78 композиций, представляющих N-гликом PSA, и гистограмму, показывающую основные характеристики гликанов.
    10. Наведите курсор на фиолетовую полосу на штриховом графике, которая находит все сиалилированные структуры на графике, чтобы выявить наблюдаемое смещение в сторону сиалилированных структур.
    11. Оставайтесь в главной вкладке «Белок» и выберите простат-специфический антиген - высокую изоформу Pi (psah) в поле «Белок » (имя).
      ПРИМЕЧАНИЕ: Поля Glycan Type и Glycan Site заполняются автоматически.
    12. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных, которая составляет 57 композиций. Нажмите кнопку Compute Graph , чтобы сгенерировать наложенные графики обеих изоформ и оценить различия в гликомах двух изоформ PSA. Наведите указатель мыши на метки узлов, чтобы отобразить количество структур, соответствующих композициям/меткам (рисунок 5).
  4. Информация о привязке гликана в UniLectin
    ПРИМЕЧАНИЕ: Вспомним определитель, протестированный в Octopus, описанный как NeuAc(a2-3)Gal(b1-4). По определению, он является установленной связующей частью структуры гликана и, как таковой, может быть найден в базе данных UniLectin3D25.
    1. Перейдите в https://www.unilectin.eu/ и нажмите кнопку UniLectin3D . Кроме того, непосредственно перейдите на страницу: https://www.unilectin.eu/unilectin3D/.Click на кнопку Glycan Search , чтобы открыть эту страницу: https://www.unilectin.eu/unilectin3D/glycan_search (дополнительный рисунок 6).
    2. Нажмите на фиолетовый бриллиант, представляющий сиаловую кислоту, который побуждает отображать все мотивы связывания гликана, заканчивающиеся сиаловой кислотой, хранящейся в базе данных. Верхняя часть этой коллекции мотивов содержит мотив NeuAc(a2-3)Gal(b1-4)GlcNAc, исследованный ранее (дополнительный рисунок 7).
    3. Нажмите на мотив NeuAc(a2-3)Gal(b1-4)GlcNAc , чтобы вызвать отображение всех лектинов, для которых известна 3D-структура, подтверждающая взаимодействие с NeuAc(a2-3)Gal(b1-4)GlcNAc. Результат по умолчанию показывает лектины у всех видов. Используйте параметр Поиск по полю , чтобы ограничить представление информацией, ориентированной на человека.
    4. Нажмите на опцию Поиск по полю . В видовом поле тип Homo sapiens. Нажмите кнопку «Исследовать рентгеновские структуры», чтобы отфильтровать исходный список. Остается только одна запись, т.е. человеческий галектин-8. Нажмите кнопку «Просмотреть 3D-структуру и информацию» в правом верхнем углу перечисленного элемента, чтобы отобразить подробную информацию о человеческом галектине-8, взаимодействующем с NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Получите доступ к структурной информации о человеческом галектине-8, отображаемой на странице с двумя разными зрителями.
      1. Удерживайте мышь, чтобы развернуть молекулу и вывести лиганд на передний план с помощью встроенного программного обеспечения Litemol26, чтобы показать структуру лектина 3D. Наведите указатель мыши на одно из перечисленных взаимодействий слева, чтобы обновить представление справа и определить, где это конкретное взаимодействие действует в структуре с программным обеспечением PLIP27, интегрированным для детализации атомных взаимодействий между лектином и лигандом (рисунок 6).
    6. Нажмите на любую зеленую кнопку, которая ссылается на соответствующие записи в UniProt, PDB (европейские или американские сайты) и GlyConnect, чтобы изучить эти перекрестные ссылки.

2. Изучение и сравнение O-гликом в GlyConnect

  1. Просмотр набора данных HGI Challenge с высокой степенью достоверности
    ПРИМЕЧАНИЕ: Набор данных HGI, упомянутый во введении, хранится в базе данных GlyConnect. Он содержит 163 N- и 23 O-гликопептидов, обнаруженных в 37 гликопротеинах, рассматриваемых как список с высокой степенью достоверности. GlyConnect Compozitor28 является ключом к оценке согласованности данных о гликоме. Важно отметить, что Compozitor допускает виртуальные узлы (показаны серым цветом), когда для подключения изолированных узлов требуется только один промежуточный шаг. Таким образом, виртуальные узлы затягивают граф и могут быть интерпретированы как структуры, потенциально пропущенные в экспериментальных результатах.
    1. Просмотрите набор данных HGI с домашней страницы GlyConnect, перейдя непосредственно на справочную страницу статьи: https://glyconnect.expasy.org/browser/references/2943.
      ПРИМЕЧАНИЕ: Резюме в цветных кнопках частично отражает цифры, приведенные в статье. Тем не менее, если перечислены только 69 уникальных пептидов, это отражает множественные связи между пептидами и сайтами или структурами. В статье гликопептид определяется как уникальное сочетание пептида и композиции. В GlyConnect сначала рассматриваются гликозиты, и они описываются как комбинация пептида со структурами. Это объясняет расхождение в цифрах между GlyConnect и приведенной выше цитатой.
    2. Проверить высокую частоту встречаемости N-связанных композиций, таких как Hex:5 HexNAc:4 NeuAc:2, идентифицированных на 42 участках в 43 пептидах, в отличие от частой уникальности большинства O-связанных композиций, идентифицированных на 1 участке в 1 пептиде.
    3. Щелкните ссылку Compozitor в правой части страницы справочной записи, чтобы оценить согласованность набора данных. Убедитесь, что инструмент Compozitor напрямую обрабатывает DOI ссылки и заполняет поле поиска ссылкой =10.1101/2021.03.14.435332 на вкладке Дополнительно инструмента. Тип &glycan_type=O-linked после номера DOI, чтобы сузить поиск до O-связанных гликанов, чтобы запрос стал следующим: ссылка=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных (есть 20 O-связанных композиций). Оставьте выбранным параметр Включить виртуальные узлы . Нажмите кнопку Compute Graph , чтобы отобразить график связанных композиций. Этот результат подчеркивает несколько пробелов в ожидаемой непрерывности биосинтеза гликана с девятью виртуальными узлами, необходимыми для завершения графика (рисунок 7).
  2. Сравнение с О-гликомом выбранного сывороточного белка в GlyConnect
    ПРИМЕЧАНИЕ: Чтобы оценить, могут ли пробелы быть заполнены данными, хранящимися в GlyConnect, был выбран один O-гликозилированный белок из 37 перечисленных со ссылкой. В наборе данных ингибитор интер-альфа-трипсина тяжелой цепи H4 (Q14624), как сообщается, является O-гликозилированным на Thr-725.
    1. Перейдите на вкладку Белок в GlyConnect Compozitor (см. шаг 2.1.3). Из списка белков выберите ингибитор интер-альфа-трипсина с тяжелой цепью H4. Убедитесь, что по умолчанию выбрано значение Homo sapiens. Снимите флажок N-linked в типе Glycan. Выберите только Thr-725 в списке Сайт, сначала щелкнув знак минус слева от Сайта, чтобы отменить выбор всех сайтов, а затем выбрав только Thr-725 из списка.
    2. Нажмите кнопку «Добавить в выбор» (обратите внимание, что шесть композиций связаны с Thr-725). Нажмите кнопку Compute Graph , чтобы отобразить график связанных композиций (дополнительный рисунок 8).
    3. Обратите внимание на отображаемый график, который показывает 17 уникальных композиций из 20 O-связанных композиций набора данных статьи синим цветом и три уникальные из шести в базе данных красным цветом. Другими словами, перекрытие между двумя источниками присутствует в трех композициях, которые представлены в пурпурном цвете. Обратите внимание, что поворот графика на 45° генерируется автоматически.
      ПРИМЕЧАНИЕ: Количество виртуальных узлов уменьшается на один. Как выясняется, H2N2S1, отсутствующий в 20 O-связанных композициях набора данных статьи и представленный в виде виртуального узла, теперь заполнен дополнительной композицией, связанной с Thr-725 ингибитора интер-альфа-трипсина тяжелой цепи H4 в базе данных. Это упрощает топологию графа, поскольку два других виртуальных узла становятся бесполезными, поскольку они были альтернативными вариантами заполнения разрыва между H1N2S1 и H2N2S2. Тем не менее, вторая композиция, импортированная из базы данных, была бы изолирована, если бы не создание двух новых альтернативных виртуальных узлов H2N2F1S1 и H1N2F2S1.
    4. Чтобы разобраться в виртуальных узлах, проверьте, присутствуют ли соответствующие композиции в GlyConnect. Для этого нажмите на кнопку Экспорт под графиком. Выберите Только виртуальный , отменив выбор всех остальных параметров. Нажмите на значок буфера обмена, чтобы скопировать подборку из 8 композиций.
    5. Вставьте выделенную область в окно запроса вкладки Compozitor Пользовательский . Выберите O-linked в поле Тип Гликана . Задайте для параметра «Метка выделения» в поле «Композиции » значение, например, VN, чтобы присвоить списку из 8 композиций. Нажмите кнопку Добавить в выбор , а затем кнопку Compute Graph . Все виртуальные узлы теперь отображаются в виде зеленых узлов (рисунок 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Первая часть протокола (раздел 1) показала, как исследовать специфичность или общность N-гликанов, прикрепленных к Asn-69 человеческого простат-специфического антигена (ПСА) с помощью платформы GlyConnect. Тканезависимые (моча и семенная жидкость), а также изоформ-зависимые (нормальные и высокие pI) вариации экспрессии гликана были подчеркнуты с использованием двух инструментов визуализации (рисунок 4 и рисунок 5).

Во-первых, GlyConnect Octopus, который отображает связи между сущностями, хранящимися в базе данных, предоставил возможность исследовать контекстную информацию посредством (1) выбора различных сущностей, которые будут показаны в Octopus, и (2) нажатия на ссылки для изучения связанных записей. Результатом стали отличительные ассоциации в зависимости от ткани.

Во-вторых, GlyConnect Compozitor, первоначально разработанный для определения/уточнения файла композиции для идентификации гликопептидов, использовался для оценки экспрессии гликана в двух известных изоформах ПСА (нормальной и высокой pI). Сравнение каждого изоформного гликома дало хорошо связанный граф, выделяющий четыре узла (композиции), два из которых характерны для изоформы с высоким pI. Несмотря на то, что перекрытие гликома является значительным, гликанная диаграмма свойств показала падение сиалилирования от общей до высокой изоформы pI (дополнительный рисунок 5).

Кроме того, исследование UniLectin3D выделяет галектин-8 как возможный считыватель гликомы PSA, поскольку последний содержит много структур с концевым эпитопом NeuAc(a2-3)Gal(b1-4)GlcNAc. Это дает повод для подражания и не может рассматриваться в качестве окончательного доказательства. Тем не менее, ПСА и галектины, как известно, играют важную роль в раке предстательной железы29, и недавно была подчеркнута конкретная роль галектина-830. Первая часть протокола коррелирует структурные (гликопротеомика) и функциональные (связывание) данные для установления вероятного сценария белково-белковых взаимодействий, опосредованных гликанами.

Во второй части протокола (раздел 2) был исследован высококачественный набор композиций O-гликана, связанных с конкретной тканью (сывороткой человека), и сопоставлен с содержимым базы данных GlyConnect, тем самым предлагая возможность настройки файла композиции гликана для уточненной идентификации гликопептидов (фиг.7 и фиг.8). ). Он может опираться на минимальный набор из 20 композиций, доступных из одного набора данных (результаты задач HGI), или быть дополнен 23-26 элементами, рационально собранными в GlyConnect для повышения согласованности набора.

красный светло-оранжевый зеленый голубой пурпурный розовый синий коричневый темно-оранжевый
вид белок источник ткани структура состав болезнь ссылка гликозит пептид

Таблица 1: Цветовая схема, связанная с каждой сущностью базы данных GlyConnect и действительная во всем.

Figure 1
Рисунок 1: Колесо зависимостей Glyco@Expasy создано для GlyConnect. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Предлагаемая структура гликана для выбранной гликановой композиции. Предложена структура гликана из эксперимента по гликомике для гликканового состава гликопротеомного эксперимента, нацеленного на тот же гликопротеин, здесь человеческий простат-специфический антиген (ПСА), как предложено на странице GlyConnect для ПСА (ID: 790). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 3
Рисунок 3: Боковое правое меню страницы GlyConnect для PSA. Кликабельные перекрестные ссылки на другие основные базы данных и отображение с помощью плагина LiteMol glycan существующей 3D-структуры в PDB. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 4
Рисунок 4: Вывод GlyConnect Octopus, показывающий тканезависимые связи между белками и гликанами. Запрос Hybrid AND Sialylated вернул все композиции, соответствующие этим критериям, и каждая композиция связывает воедино связанную информацию о белках и гликанах, записанную в базе данных. Обратите внимание, что по умолчанию для параметра Вид установлено значение Homo sapiens , но этот параметр можно изменять. Здесь GlyConnect Octopus отображает все человеческие белки (левые узлы), несущие гибридные и сиалилированные гликановые структуры (правые узлы) с тканями, в которых они экспрессируются (центральные узлы). (A) Ассоциации с мочой выделены с указанием двух белков: хориогонадотропина (GLHA_HUMAN) и общей изоформы ПСА (KLK3_HUMAN), связанных с рассеянными (гетерогенными) гликанными структурами. (B) Выделены связи с семенной жидкостью, показывающие две белковые изоформы ПСА (KLK3_HUMAN), соединенные с сгруппированными (аналогичными) гликанными структурами. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 5
Рисунок 5: Выходные данные GlyConnect Compozitor, показывающие наложенные N-гликомы двух изоформ ПСА. Композиции в конденсированной нотации метят каждый узел. Гликаны, связанные с общей изоформой, представлены в виде синих узлов, а гликаны изоформы с высоким pI — в виде красных узлов. Перекрытие между гликомами показано в виде пурпурных узлов. Числа внутри узлов представляют собой количество гликанских структур, соответствующих маркированной композиции в соответствии с содержимым базы данных GlyConnect относительно PSA. Показанный график Compozitor был немного изменен из необработанных выходных данных, чтобы распутать сеть, которая генерируется библиотекой D3.js. Это легко сделать, так как любой узел может быть перетащен в пространство окна браузера, где пожелает пользователь, и пути, таким образом, могут быть сокращены или растянуты. Пользователь может ввести определенную композицию в поле Zoom On в правом верхнем углу, чтобы увеличить масштаб и центрировать график на соответствующем узле. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 6
Рисунок 6: Сводная запись человеческого галектина-8 с NeuAc(a2-3)Gal(b1-4)GlcNAc связывающие детали. При нажатии на зеленую кнопку «Просмотреть 3D-структуру и информацию» (обозначенную красным эллипсом) открывается новая страница, на которой крупным планом отображаются взаимодействия остатков с приложением PLIP (обозначена красной стрелкой). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 7
Рисунок 7: Выходные данные GlyConnect Compozitor, показывающие O-гликом набора данных высокой достоверности сыворотки крови человека для задачи HGI. Без виртуальных узлов (см. текст) связность этого графа низкая. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 8
Рисунок 8: Выходные данные GlyConnect Compozitor, показывающие возможность завершения O-гликома набора данных высокой достоверности сыворотки крови человека вызова HGI с использованием содержимого базы данных GlyConnect. Доступ к содержимому всей базы данных GlyConnect с помощью вкладки Compozitor Custom показывает, что композиции, соответствующие виртуальным узлам, сопоставляются с существующими определенными структурами, выделенными в метках узлов. Размер узла представляет собой количество ссылок, хранящихся в базе данных и сообщающих о соответствующем составе. Числовая метка узлов обозначает количество соответствующих структур, хранящихся в GlyConnect. Выбранные композиции, по-видимому, имеют от нуля до восемнадцати возможных совпадений в базе данных. Фактически, эти узлы являются виртуальными только как отражение содержания экспериментальных наборов данных. Рекомендуется уточнить информацию в графе, чтобы проверить реалистичность этих дополнительных узлов. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Дополнительный рисунок 1: Пузырьковая диаграмма домашней страницы Glyco@Expasy. Масштабирование пузырьковой диаграммы домашней страницы Glyco@Expasy, чтобы сосредоточиться на категории гликопротеинов . Программное обеспечение отображается в зеленых пузырьках, а базы данных в желтых пузырьках. Нажатие на любой пузырь суммирует назначение ресурса. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 2: Ассоциации, извлеченные осьминогом, соответствующие запросу в зависимости от состава. По умолчанию GlyConnect Octopus отображает человеческие белки (левые узлы), несущие гибридные и сиалилированные гликовые структуры (правые узлы) с соответствующими композициями (центральные узлы). Композиция H6N4F12S1 представляется уникальной для обеих изоформ ПСА (KLK3_HUMAN). Нажатие на уникальный идентификатор структуры (10996) открывает соответствующую страницу с подробными сведениями, показывающими, что две изоформы действительно являются единственными белками, несущими этот конкретный гликан. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 3: Ассоциации, полученные осьминогом, соответствующие запросу в зависимости от заболевания. GlyConnect Octopus выводит все человеческие белки (левые узлы), несущие гибридные и сиалилированные гликовые структуры (правые узлы) с заболеваниями, при которых они выражены (центровые узлы). Выделены связи с раком предстательной железы, показывающие общую изоформу ПСА (KLK3_HUMAN). Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 4: Ассоциации, извлеченные осьминогами, соответствующие запросу в зависимости от информации о ткани. GlyConnect Octopus отображает все человеческие белки (левые узлы), несущие биантенарные гликовые структуры, включая NeuAc(a1-3)Gal(b1-4)GlcNAc мотив (правые узлы) с тканями, в которых они экспрессируются (центральные узлы). Выделены связи с семенной жидкостью, показывающие только общую изоформу ПСА (KLK3_HUMAN) и семь структур. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 5: Выходные данные GlyConnect Compozitor, показывающие наложенные N-гликомы двух изоформ ПСА. Композиции в конденсированной нотации маркируют каждый узел. Гликаны, связанные с общей изоформой, представлены в виде синих узлов, а гликаны изоформы с высоким pI — в виде красных узлов. Перекрытие между гликомами показано в виде пурпурных узлов. Числа внутри узлов представляют собой количество гликанских структур, соответствующих маркированной композиции в соответствии с содержимым базы данных GlyConnect относительно PSA. Наведение курсора мыши на линейчатую диаграмму свойств гликана показывает соответствие между частотой и узлами в виде оранжевых пузырьков. Почти все общие изоформные узлы ПСА покрыты. Эта частота падает в высокой изоформе pI. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 6: Интерфейс поиска Glycan в UniLectin3D. Нажатие на символ SNFG сиаловой кислоты (обведенный красным цветом) запускает поиск всех лигандов, содержащих NeuAc, хранящихся в UniLectin3D. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 7: Выдержка из результатов поиска для всех лигандов, содержащих NeuAc. Интересующий мотив NeuAc(a2-3)Gal(b1- 4)GlcNAc обведен красным цветом. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 8: Выходные данные GlyConnect Compozitor, показывающие O-гликом набора данных HGI, наложенный на тот, который находится в GlyConnect. Вывод GlyConnect Compozitor, показывающий O-гликом сыворотки крови человека с высокой достоверностью набора данных HGI challenge в синем цвете, наложенный на O-гликом одного O-гликозилированного белка из 37 перечисленных со ссылкой, т.е. ингибитор интер-альфа-трипсина тяжелой цепи H4 с дополнительной информацией, содержащейся в GlyConnect. Это улучшает связность графа. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus как инструмент для выявления неожиданных корреляций
GlyConnect Octopus изначально был разработан для запроса базы данных со свободным определением гликанов. Действительно, в литературе часто сообщается об основных характеристиках гликанов в гликоме, таких как фукозилирование или сиалилирование, изготовление двух или более усиков и т. Д. Кроме того, гликаны, независимо от того, связаны ли они с N или O, классифицируются в ядрах, как подробно описано в справочном руководстве Essentials of Glycobiology1, которые также часто цитируются в опубликованных статьях. Наконец, эпитопы гликана, такие как антигены группы крови, являются еще одним свойством, которое ищут в структурах и потенциально выделяют для типирования гликана. В конце концов, может быть уместно искать общие или различные характеристики гликома, экспрессируемого в конкретной ткани или выбранном виде. В этом смысле собранная информация должна использоваться в качестве источника новых предположений, а не уникальных фактов.

GlyConnect Compozitor как инструмент для формирования набора гликановых композиций
Просмотр структурной информации, описанной на странице белка, имеет ограничения, поскольку списки, как правило, скрывают отношения между детализированными структурами, а также между композициями. GlyConnect Octopus заботится о первом, а GlyConnect Compozitor о втором. Внимательный взгляд на структуры, перечисленные в большинстве записей GlyConnect, показывает существование общих подструктур. Тем не менее, эту информацию нелегко понять визуально без помощи преданного зрителя.

Содержание файла гликановой композиции, поддерживающего идентификацию фрагмента гликана в качестве ключевого параметра программного обеспечения для идентификации гликопептидов, было установлено путем анализа результатов задачи HGI. Большинство классических поисковых систем протеомики учитывают выбор модификаций на основе глико из коллекции, которая происходит из данных, собранных в базах данных / репозиториях или литературе. Другие специализированные инструменты гликопротеомики используют знания о биосинтезе гликанов. Таким образом, композиционный файл теоретически определяется как результат ожидаемой ферментативной активности. В конце концов, файлов композиции столько же, сколько и поисковых систем, и перекрытие между ними сильно варьируется. Тем не менее, изучение прошлого опыта в протеомике, особенно когда учитываются посттрансляционные модификации, показывает, что производительность поисковых систем коррелирует с ограничением поискового пространства31. Подобные наблюдения сделаны в гликопротеомике и GlyConnect Compozitor был разработан для поддержки обоснованного выбора композиционных данных, важность которых обсуждалась ранее32.

Использование этого инструмента было не полностью проиллюстрировано в протоколе, особенно в отношении вкладки Advanced , в которой могут быть выражены запросы, которые непосредственно запускают программный доступ к GlyConnect через его API (Интерфейс прикладного программирования). Например, ввод taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=cancer в окне запроса вкладки «Дополнительно » эквивалентен заполнению соответствующих полей на вкладке «Источник » (выбор Homo sapiens в Species, «Моча в ткани» и N-linked в Glycan Type) и вкладки «Болезнь » (выбор Homo sapiens в Species, Рак предстательной железы при заболевании и N-сцепленный при гликановом типе). Другими словами, он обеспечивает за один шаг результат, который потребует нескольких вариантов выбора.

Наконец, хотя создание виртуальных узлов объясняется в протоколе, их потенциальная избыточность нуждается в дополнительном комментарии. Два параллельных варианта могут быть неразличимы, поскольку моделируемое действие ферментов в графе не учитывает хронологию активности ферментов. Вот почему Compozitor предлагает два пути через два виртуальных узла для соединения двух несвязанных узлов, соответствующих количеству моносахаридов с двумя различиями. Включение новых данных часто обеспечивает недостающие звенья. Пользователь всегда может рассмотреть или закрыть виртуальные узлы, сняв флажок Включить виртуальные узлы .

Известные базы данных и программные ограничения
В целом, как и при любой навигации в Интернете, описанные выше протоколы иногда приводят к несуществующей странице, часто из-за обновления сайта или конфликта обновлений между двумя сайтами. В этом случае и, по сути, во всех случаях, когда навигация не протекает, проще всего отправить записку в службу поддержки Expasy, эффективность которой значительно способствовала успеху портала за последние 28 лет.

Содержание GlyConnect предвзято как отражение текущих дисбалансов в литературе. Большинство публикаций сообщают о N-гликозилировании у млекопитающих, а база данных богаче N-гликопротеинами человека. Тем не менее, в прошлом нас просили включить менее распространенные наборы данных и оставаться полностью открытыми для получения советов и предложений.

Кроме того, Compozitor в настоящее время ограничен сравнением трех наборов данных состава. Планируется серьезная ревизия подвкладки Определитель в Осьминоге. Ресурсы Glyco@Expasy нуждаются в регулярном обновлении, а некоторые из них могут не быть использованы в надлежащее время; тем не менее, предупреждения и/или объявления публикуются, когда это происходит.

Партнерские порталы, известные как GlyGen (https://www.glygen.org) и GlyCosmos (https://www.glycosmos.org), предоставляют различные параметры и инструменты. В конечном счете, просмотр и поиск информации по любому из вариантов влечет за собой высокий уровень субъективности и во многом зависит от привычек и проблем пользователей. Мы можем только надеяться, что наше решение подойдет части сообщества.

Вклад гликонауки растет в проекты в области наук о жизни, и исследования, устанавливающие роль гликанов в вопросах здравоохранения, постоянно производятся. Недавний акцент на Sars-Cov-2 еще раз показал важность гликозилированных белков, особенно в структурных подходах33. Гликоинформатика поддерживает гликонистов в повседневных задачах анализа и интерпретации данных.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторы заявляют об отсутствии конфликта интересов.

Acknowledgments

Автор тепло приветствует прошлых и нынешних членов Proteome Informatics Group, участвующих в разработке ресурсов, используемых в этом учебнике, в частности, Жюльена Мариетоза и Кэтрин Хейс для GlyConnect, Франсуа Боннарделя для UniLectin, Давиде Алокчи и Фредерика Никитина для Octopus и Тибо Робина для Compozitor и последнего штриха к Octopus.

Разработка проекта glyco@Expasy поддерживается федеральным правительством Швейцарии через Государственный секретариат по вопросам образования, исследований и инноваций (SERI) и в настоящее время дополняется Швейцарским национальным научным фондом (SNSF: 31003A_179249). ExPASy поддерживается Швейцарским институтом биоинформатики и размещается в Центре компетенций Vital-IT. Автор также выражает признательность Энн Имберти за выдающееся сотрудничество на платформе UniLectin, совместно поддерживаемой ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Биология выпуск 179
Ресурсы биоинформатики для изучения гликано-опосредованных белковых взаимодействий
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter