Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

글리칸 매개 단백질 상호작용 연구를 위한 생물정보학 자료

Published: January 20, 2022 doi: 10.3791/63356

Summary

이 프로토콜은 온라인 리소스로 인간 단백질 글리오를 탐색, 비교 및 해석하는 방법을 보여줍니다.

Abstract

Glyco@Expasy 이니셔티브는 당생물학 지식의 여러 측면에 걸친 상호 의존적 데이터베이스 및 도구 모음으로 시작되었습니다. 특히, 당단백질 (예 : 세포 표면 수용체)과 글리칸에 의해 매개되는 탄수화물 결합 단백질 간의 상호 작용을 강조하는 것을 목표로합니다. 여기서, 수집의 주요 자원은 인간 전립선 특이적 항원 (PSA)의 N 글리코메와 인간 혈청 단백질의 O-글리코메에 중심을 둔 두 가지 예시적인 예를 통해 소개된다. 다양한 데이터베이스 쿼리를 통해 시각화 도구를 통해 이 문서에서는 연속체의 콘텐츠를 탐색하고 비교하여 흩어져 있는 정보를 수집하고 상호 연관시키는 방법을 보여 줍니다. 수집 된 데이터는 글리 칸 기능의보다 정교한 시나리오를 제공 할 운명입니다. 따라서 여기에 소개된 글리코인포매틱스는 주어진 맥락에서 단백질 글리코메의 특이성에 대한 가정을 강화, 형성 또는 반박하는 수단으로서 제안된다.

Introduction

글리칸, 그들이 붙어있는 단백질 (당단백질) 및 그들이 결합하는 단백질 (렉틴 또는 탄수화물 결합 단백질)은 세포 표면의 주요 분자 작용자입니다1. 세포 - 세포 통신에서 이러한 중심 역할에도 불구하고, 글리 코믹스, 글리 프로테오믹스 또는 글리칸 - 상호 작용 데이터를 포함한 대규모 연구는 유전체학 및 단백체학에서 그들의 대응물에 비해 여전히 부족합니다.

최근까지, 운반체 단백질에 여전히 접합되는 동안 복합 탄수화물의 분지화 구조를 특성화하는 방법은 개발되지 않았다. 당단백질의 생합성은 단당류 공여체, 수용된 당단백질 기질, 글리코실트랜스퍼라제와 글리코시다제가 상호작용적인 역할을 하는 비주형 주도 과정이다. 생성 된 당단백질은 각 단당류 성분이 자연에 존재하는 여러 유형 중 하나 일 수있는 여러 분지점을 가진 복잡한 구조를 가질 수 있습니다1. 비주형 주도 공정은 올리고당 구조 데이터를 생성하기 위한 유일한 옵션으로 생화학적 분석을 부과한다. 천연 단백질에 부착된 글리칸 구조의 분석 과정은 단당류 조성, 결합 및 분지화 서열을 결정하기 위해 민감하고 정량적이며 강력한 기술이 필요하기 때문에 종종 도전적입니다2.

이러한 맥락에서, 질량 분광법 (MS)은 글리코믹스 및 글리코프로테오믹스 실험에서 가장 널리 사용되는 기술이다. 시간이 지남에 따라 이러한 작업은 더 높은 처리량 설정에서 수행되며 데이터는 이제 데이터베이스에 누적되고 있습니다. 다양한 포맷3의 글리칸 구조는, 글리칸이 정의되는 정밀도의 레벨에 관계없이 각각의 구조가 안정한 식별자와 연관되는 범용 글리칸 데이터 저장소인 GlyTouCan4를 채운다(예를 들어, 아마도 결합 유형 또는 모호한 조성이 누락될 수 있음). 매우 유사한 구조가 수집되지만 사소한 차이점이 명확하게보고됩니다. 당단백질은 GlyConnect5 및 GlyGen6에서 기술되고 큐레이팅되며, 두 개의 데이터베이스는 서로 상호 참조한다. 구조적 증거 조각을 뒷받침하는 MS 데이터는 GlycoPOST7에 점점 더 많이 저장됩니다. 온라인 자원의 더 넓은 범위를 위해, 참조 매뉴얼의 52 장, 당생물학의 본질, 글리코 정보학에 전념합니다8. 흥미롭게도, 글리코펩티드 동정 소프트웨어는 재현성의 이점이 없긴 하지만 최근 몇 년 동안9,10 동안 증식하였다. 후자의 우려로 인해 HUPO GlycoProteomics Initiative (HGI)의 지도자들은 2019 년에 소프트웨어 과제를 설정하게되었습니다. CID, ETD 및 EThcD 단편화 모드에서 N- 및 O-글리코실화된 인간 혈청 단백질의 복합 혼합물을 처리함으로써 수득된 MS 데이터는 소프트웨어 사용자 또는 개발자이든 경쟁사에 이용가능하게 되었다. 이 챌린지의 결과에 대한 전체 보고서11은 여기에만 설명되어 있습니다. 우선, 신원 확인의 확산이 관찰되었습니다. 주로 검색 엔진에서 구현 된 방법의 다양성, 설정 및 출력이 필터링되는 방법 및 펩티드가 "계산"된 것으로 해석되었습니다. 실험 설계는 또한 일부 소프트웨어 및 접근법을 (dis) 이점으로 두었을 수 있습니다. 중요한 것은 동일한 소프트웨어를 사용하는 참가자가 일관성없는 결과를보고하여 심각한 재현성 문제를 강조한다는 것입니다. 일부 소프트웨어 솔루션이 다른 솔루션보다 더 잘 수행되고 일부 검색 전략이 더 나은 결과를 산출한다는 다른 제출물을 비교하여 결론지었습니다. 이러한 피드백은 자동화된 글리코펩타이드 데이터 분석 방법의 개선을 안내할 가능성이 높으며 차례로 데이터베이스 콘텐츠에 영향을 미칠 것이다.

글리코 정보학의 확장은 정보를 제공하고 여러 유사하거나 보완하는 리소스에 대한 액세스를 제공하는 웹 포털을 만들었습니다. 가장 최신의 최신 정보는 Comprehensive Glycoscience book series12의 한 장에 설명되어 있으며 협력을 통해 데이터 공유 및 정보 교환에 대한 솔루션이 오픈 액세스 모드로 제공됩니다. 이러한 포털 중 하나는 원래 Glycomics@ExPASy 13이라고 불리며 Glyco@Expasy로 이름이 바뀌 었으며, 수십 년 동안 여러 -omics에서 사용되는 많은 도구와 데이터베이스를 호스팅해온 Expasy platform14의 주요 정밀 검사에 따라 가장 인기있는 품목은 UniProt15 - 보편적 인 단백질 지식 기반입니다. Glyco@Expasy는 시각적 범주화 및 상호 종속성 표시를 기반으로 데이터베이스 및 도구의 목적과 사용에 대한 교훈적 발견을 제공합니다. 다음 프로토콜은 글리코믹스를 통해 글리코프로테오믹스와 글리칸-상호작용 사이의 연결을 명백하게 하는 이 포털로부터의 자원의 선택과 함께 글리코믹스 및 글리코프로테오믹스 데이터를 탐색하는 절차를 예시한다. 그대로, 글리코믹스 실험은 단당류가 완전히 정의되고 부분적으로 또는 완전히 결합되는 구조를 생성하지만, 그들의 단백질 부위 부착은 전혀 특징이 없다면 열악하다. 대조적으로, 글리코프로테오믹스 실험은 정확한 부위 부착 정보를 생성하지만, 글리칸 구조의 분해능이 좋지 않으며, 종종 단당류 조성물로 제한된다. 이 정보는 GlyConnect 데이터베이스에 함께 저장됩니다. 또한, GlyConnect의 검색 도구는 글리칸을 통해 GlyConnect에 연결된 UniLectin16에서 이들을 인식하는 단백질과 함께 설명되는 잠재적 글리칸 리간드를 검출하는 데 사용될 수 있습니다. 여기에 제시된 프로토콜은 N 연결 글리 칸 및 O 결합 글리 칸 및 당단백질에 관한 질문을 다루기 위해 두 섹션으로 나뉩니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

참고: 인터넷에 연결된 기기(더 큰 화면 선호)와 Chrome 또는 Firefox와 같은 최신 웹 브라우저가 필요합니다. Safari 또는 Edge를 사용하는 것이 그다지 신뢰할 수 없을 수 있습니다.

1. GlyConnect의 단백질 N-글리코메에서 UniLectin의 렉틴까지

  1. Glyco@Expasy에서 리소스 액세스
    참고: 여기에 설명된 절차는 GlyConnect에 액세스하는 것이지만 플랫폼에 기록된 모든 리소스에 액세스하는 데 적용할 수 있습니다.
    1. https://glycoproteome.expasy.org/glycomics-expasy 로 이동하여 Glycoconjugates 또는 Glycan Binding 과 같은 다양한 범주를 보여주는 오른쪽의 버블 차트 고려하십시오. 거품의 범주를 반영하는 가장 왼쪽 메뉴에서 당단백질 상자를 선택하여 오른쪽의 거품 차트가 해당 범주와 일치하는 거품을 즉시 확대하도록 합니다.
      참고 : 녹색 거품은 도구이고 노란색 거품은 데이터베이스입니다. 둘 중 하나를 클릭하면 다시 확대되어 리소스에 대한 세부 정보가 제공됩니다. 이렇게 하기 전에, 사용자는 그 자원이 다른 자원에 대한 의존성을 이해하기를 원할 수 있다.
    2. 종속성에 대한 정보를 가져오려면 리소스 주제별 분류 탭에서 리소스 종속성 휠 탭으로 이동합니다. 휠의 GlyConnect 에 마우스를 올려 놓고 다른 소스와의 통합 수준을 확인합니다(그림 1).
    3. 리소스 주제별 분류 탭으로 돌아가서 1.1.1 단계에서와 같이 GlyConnect 버블에 도달하고 이를 클릭하여(보충 그림 1) 데이터베이스의 최신 릴리스에 있는 콘텐츠의 통계를 보여주는 새 탭에 GlyConnect 홈페이지를 표시합니다.
      참고: 표 1에 자세히 설명된 색 구성 표는 데이터베이스에 저장된 다양한 유형의 정보와 일치합니다. 이 색상 코드는 GlyConnect의 모든 엔티티 페이지에서 유효하며 전체적으로 일관됩니다. 홈페이지에는 또한 Sars-Cov-2 스파이크 단백질 (COVID-19)의 글리코실화를 설명하거나 인간 우유 올리고당 (HMO)을 광범위하게 자세히 설명하는 것과 같은 집중적 인 데이터 세트에 전념하는 네 개의 섹션이 표시됩니다. 이것들은 이 프로토콜에서 탐구되지 않을 것이다.
  2. 단백질 N-글리코메의 문맥 정보 탐구
    참고: GlyConnect의 모든 글리칸 구조는 세 가지 대체 및 일반적으로 사용되는 형식으로 표시됩니다: (1) 글리칸에 대한 기호 명명법(SNFG)17 (2) IUPAC 응축18, (3) 옥스포드19. 대조적으로, 글리칸 조성을 표현하기 위한 표준 표기는 없다. GlyConnect에서는 헥소오스의 경우 Hex, N-아세틸헥소사민의 경우 HexNAc, 푸코스의 경우 dHex, 시알산의 경우 NeuAc 등의 코드가 사용됩니다. 단순화를 위해 시각화 도구는 헥소오스의 경우 H, N-아세틸헥소사민의 경우 N, 푸코스의 경우 F, 시알산의 경우 S와 같은 응축된 표기법에 의존합니다. 추가적으로, 작은 글자는 아세틸화에 대한 "a", 인산화를 위한 "p", 그리고 이들 소위 치환기 중 가장 빈번한 것에 대해 황산화에 대한 "s"와 같은 변형을 지정한다.
    1. GlyConnect 홈페이지에서 인간 전립선특이항원(PSA)의 N-글리코메를 보고 탐색하기 위하여, 다음과 같이 진행한다.
      참고 : 인간 PSA의 글리코실화는 수년에 걸쳐, 특히 전립선 암의 맥락에서 연구되었습니다. GlyConnect 데이터베이스는 글리코믹스와 글리코프로테오믹스 데이터를 결합하는 세 개의 참조20,21,22를 저장합니다. 여기에 제공된 결과는 GlyConnect의 2021 년 9 월 릴리스에서 얻은 것입니다. 데이터베이스를 ulterior로 사용하면 빈번한 데이터 업데이트로 인해 약간 다른 통계가 생성 될 수 있습니다.
    2. PROTEIN 버튼을 선택하여 데이터베이스의 단백질 보기를 엽니다. 단백질 보기 페이지에서 검색 창에 전립선을 입력합니다. 출력에 나열된 두 개의 항목을 찾아 PSA의 두 이소형을 뚜렷한 pI 값으로 구별합니다. PSA의 공통 이소형에 해당하는 790(Id 열)을 클릭합니다.
      참고: 위에서 설명한 체계에서 게시된 작업에서 추출한 요약 정보를 보여 주는 위쪽 여러 색상 막대를 찾습니다. 아래에 설명된 대로 탐색을 위한 몇 가지 옵션이 가능합니다.
    3. 위쪽 여러 색상 막대에서 녹색으로 SOURCE 버튼을 클릭하여 게시된 데이터가 처리되는 샘플 유형( 소변 정액)을 표시합니다. 이 정보를 더 자세히 살펴보려면 다음 샘플 유형 중 하나를 클릭합니다. 색상 단추를 클릭할 때 나타나는 모든 항목에도 동일하게 적용됩니다.
    4. 데이터베이스의 건강 관련 콘텐츠를 확인하려면 두 개의 항목이 포함 된 DISEASE 버튼을 클릭하십시오.이 중 하나는 GlyConnect의 해당 전용 질병 페이지로 연결되는 전립선 암 입니다. 이 페이지에 대한 요약은 세 가지 대규모 연구가 308 개의 인간 단백질에서 발견 된 1,087 개 부위에서 319 개의 조성물을보고했음을 보여줍니다.
    5. STRUCTURE 버튼을 클릭하면 글리코믹스 데이터에서 PSA와 관련된 135개 구조의 전체 목록을 볼 수 있습니다. 글리코프로테오믹스 실험에 의해 결정된 연관된 78개의 조성물에 대한 COMPOSITION 버튼을 클릭하십시오. 구조 또는 컴포지션을 클릭하여 자세한 내용을 확인하십시오.
      참고: 특정 구조를 운반하는 대체 단백질의 목록 또는 조성물과 일치하는 구조의 목록과 같은 세부사항을 얻을 수 있다. PSA는 Asn-69에서 단 하나의 N-글리코실화 부위를 갖는 것으로 알려져 있다(갈색 SITE 버튼에 대해 계산되는 단 하나의 아이템만).
    6. 컴포지션의 모호성을 줄이려면 선택한 컴포지션 아래의 제안된 구조체 (예: Hex:6 HexNAc:3 NeuAc:1)를 클릭합니다. 단당류 수가 위에 나열된 구조의 수와 일치 할 때마다 제안이 이루어집니다 (그림 2).
      참고: Hex:6 HexNAc:3 NeuAc:1 글리코프로테오믹스 실험에 의해 생성된 조성은 글리코믹스 데이터로부터 4개의 더 높은 분해능 구조와 일치한다. PSA의 경우, Asn-69만이 글리코실화되기 때문에 해결할 부위 모호성이 없다.
    7. 단백질 페이지를 완전히 탐색하려면 페이지 오른쪽에서 자세한 내용을 봅니다(그림 3).
      1. PSA에 대한 디폴트 3QUM PDB(Protein Data Bank23) 엔트리를 보면 각 단량체에 부착된 2개의 복합 글리칸(도 3) 또는 대안적인 2ZCK 엔트리가 부착된 탄수화물로 인해 또한 이용가능하다. 두 번째 항목은 단일 체인을 표시합니다.
        참고: 두 항목 모두 PDB-RCSB에 채택된 SNFG-3D 표기법으로 글리칸을 표시하는 3D LiteMol plugin24 로 시각화됩니다.
      2. 다른 상호 참조의 해당 링크를 클릭하여 UniProt와 같은 주요 프로테오믹스 데이터베이스에서 관련 기능 정보를 탐색합니다(그림 3).
  3. 단백질 N-글리코메의 문맥 정보를 시각화하고 상호 연관시킨다.
    참고 : 이전 섹션에서 볼 수 있듯이 구조 또는 컴포지션의 긴 목록은 전체적으로 이해하기 어려울 수 있으며 GlyConnect는 두 가지 도구를 사용하여 주요 정보, 즉 GlyConnect Octopus 및 GlyConnect Compozitor를 시각화합니다 (첫 번째 도구는 컬러 버튼으로 캡처 된 요약 정보를 확장하고 두 번째는 구조 / 컴포지션이 다른 구조에 포함되어 있다는 측면에서 구조적 종속성을 가져옵니다). 아래 그림과 같이 GlyConnect Octopus는 데이터베이스 콘텐츠의 반영으로 여러 연결 또는 단일 연결을 강조 표시하여 데이터베이스에 저장된 다양한 엔터티 간의 연관성을 탐색합니다.
    1. GlyConnect 옥토퍼스 검색을 수행하여 아래에 설명된 바와 같이 PSA에 부착된 글리칸의 다양성에서 하이브리드 코어 구조 및 매우 빈번한 시알산 함유 구조와 같은 일반적인 구조적 특성의 존재를 확인합니다.
    2. https://glyconnect.expasy.org/octopus/ Octopus 홈페이지로 이동하십시오. N 연결 탭을 기본적으로 선택한 상태로 유지합니다. Cores 하위 탭으로 이동하여 하이브리드 아이콘을 클릭하십시오. 속성 하위 탭으로 이동하여 시알릴화된 아이콘을 클릭합니다. 아래의 녹색 검색 버튼을 클릭하십시오.
      참고: 검색 결과는 세 가지 범주의 항목 간의 관계로 그래픽으로 표시됩니다. 기본적으로 가운데 목록은 컴포지션에 대한 쿼리와 일치하고, 왼쪽 컬렉션은 관련 단백질에 걸쳐 있으며, 오른쪽 컬렉션은 관련 글리칸에 걸쳐 있습니다.
    3. 표시된 관계 그래프에서 H6N4F1S1 위로 마우스를 가져가면 6개의 단백질과 세 개의 구조에 대한 링크가 강조 표시됩니다. H6N4F2S1 위에 마우스를 올려 놓으면 PSA의 두 가지 이소폼(둘 다 UniProt ID: KLK3_HUMAN이라고 함)과 하나의 구조(ID: 10996)를 골라냅니다. 구조 ID 위로 마우스를 가져가 SNFG 표현을 표시하고 이를 클릭하여 해당 페이지를 엽니다(보충 그림 2).
    4. 낙지의 노드를 글리코실화의 맥락을 설명하는 다른 주제로 변경하십시오. 색상 코드는 앞에서 설명한 것과 동일하게 유지됩니다( 표 1 참조).
      1. 중앙 노드Tissues로 변경하여 그래프 중간에 15 가지 옵션을 표시하며, 그 중 많은 옵션이 체액입니다. 조직 정보에 따라 질의와 일치하는 단백질과 글리 칸 사이의 모든 연관성을 찾으십시오. 그래프 중간에 있는 소변 또는 정액 위에 커서를 놓으면 서로 다른 연관성을 볼 수 있습니다(그림 4A,B).
      2. 센터 노드질병으로 변경하여 13 가지 옵션을 표시하십시오.이 중 하나는 전립선 암입니다. 관련된 유일한 단백질은 PSA (KLK3_HUMAN)입니다 (보충 그림 3).
        참고 : 단백질 페이지에 표시된 PSA N- 글리코메를 자세히 살펴보면 말단 NeuAc의 매우 높은 빈도를 골라냅니다 (a?-?) 갈(b?-?) GlcNAc 하부 구조는 많은 경우에 두 개 또는 세 개의 안테나가있는 구조물에 있습니다. 또 다른 문어는 아래에 설명된 바와 같이 그 기초 위에서 생성될 수 있다.
    5. 지우기 버튼을 클릭하여 검색을 새로 고칩니다. 속성 하위 탭으로 이동하여 이중 안테나 아이콘을 클릭합니다. 결정자 하위 탭으로 이동하여 3-Sialyl-LN(유형 2) 아이콘을 클릭합니다. 아래의 녹색 검색 버튼을 클릭하십시오.
    6. 말단 3-시알릴-LN(타입 2) 모티프, 즉 NeuAc(a1-3)Gal(b1-4)GlcNAc를 함유하는 바이안테나리 글리칸과의 옥토퍼스-검색된 연관성을 확인한다. 더 쉽게 읽을 수 있도록 중앙 노드 Tissues 로 변경하고 KLK3_HUMAN 위로 마우스를 가져가면 Seminal Fluid를 PSA 공통 이소폼 및 일곱 개의 구조와 직접 연결합니다(보충 그림 4).
      참고: 두 번째 시각화 도구인 GlyConnect Compozitor는 각 컴포지션과 그 목록에 있는 모든 컴포지션 간의 잠재적 관계를 스캔합니다(아래 참조). 관계는 두 조성물 사이의 단 하나의 단당류와 다른 것으로 정의됩니다. 그래프에 플롯팅된 이러한 확인된 관계는 글리코메의 (dis)연속성을 노출시킨다.
    7. GlyConnect Compozitor를 사용하여 PSA의 경우 아래 그림과 같이 각 컴포지션과 그 목록의 모든 컴포지션 간의 잠재적 인 관계 스캔을 수행하십시오.
      참고: GlyConnect Compozitor는 컨텍스트와 관련하여 컴포지션을 처리합니다. GlyConnect를 쿼리하기위한 뚜렷한 탭을 제공합니다 (예 : 단백질, 소스, 세포주, 컨텍스트를 자격을 부여하기 위해 자명한 질병). 이것은 다음과 같이 PSA를 사용하여 여기에 설명되어 있습니다.
    8. PSA의 단백질 페이지로 돌아가십시오 : https://glyconnect.expasy.org/browser/proteins/790. PSA 항목 페이지의 오른쪽에서 Compozitor 링크를 클릭하십시오. Compozitor 검색 필드가 단백질 탭의 Id 790 항목의 세부 정보로 미리 채워져 있는지 확인합니다(단백질 : 전립선 특이적 항원, 종: 호모 사피엔스글리칸 유형: N 연결됨).
    9. 선택에 추가 단추를 클릭하여 데이터베이스에서 데이터를 검색하고 연결된 컴포지션의 그래프를 표시합니다. 가상 노드 포함 옵션을 선택 해제합니다. Compute Graph 버튼을 클릭하면 PSA N-글리코메를 나타내는 78개의 조성으로 구성된 잘 연결된 세트를 보여주는 그래프와 글리칸의 주요 특성을 보여주는 막대 플롯이 표시됩니다.
    10. 막대 플롯의 보라색 막대 위에 마우스를 올려 놓으면 그래프에서 모든 시알릴화된 구조를 찾아 시알릴화된 구조에 대한 관찰 가능한 편향이 나타납니다.
    11. 주요 단백질 탭에 남아 전립선 특이 항원 - 단백질 (이름) 필드에서 높은 파이 이소 폼 (psah)을 선택하십시오.
      참고: 글리칸 유형 및 글리칸 사이트 필드는 자동으로 채워집니다.
    12. 선택 항목에 추가 단추를 클릭하여 데이터베이스에서 57개의 컴포지션에 해당하는 데이터를 검색합니다. 계산 그래프 버튼을 클릭하여 두 이소형의 중첩된 그래프를 생성하고 두 PSA 이소형의 글리오밍 차이를 평가합니다. 노드 레이블 위로 마우스를 가져가면 컴포지션/레이블에 해당하는 구조 수가 표시되는지 메시지를 표시합니다(그림 5).
  4. 유니렉틴의 글리칸 결합 정보
    참고: NeuAc(a2-3)Gal(b1-4)로 설명된 문어에서 테스트된 결정인자를 회수하십시오. 정의에 의해, 그것은 글리칸 구조의 확립 된 결합 부분이며, 따라서 UniLectin3D 데이터베이스25에서 검색 할 수 있습니다.
    1. https://www.unilectin.eu/ 로 이동하여 UniLectin3D 버튼을 클릭하십시오. 또는 Glycan Search 버튼을 https://www.unilectin.eu/unilectin3D/.Click 하여 이 페이지를 엽니다: https://www.unilectin.eu/unilectin3D/glycan_search(보충 그림 6).
    2. 시알산을 나타내는 보라색 다이아몬드를 클릭하면 데이터베이스에 저장된 시알산으로 끝나는 모든 글리칸 결합 모티프가 표시됩니다. 모티프 컬렉션의 상단 부분에는 이전에 조사한 NeuAc(a2-3)Gal(b1-4)GlcNAc 모티프가 포함되어 있습니다(보충 그림 7).
    3. NeuAc(a2-3)Gal(b1-4)GlcNAc 모티프를 클릭하여 NeuAc(a2-3)Gal(b1-4)GlcNAc와의 상호작용을 확인하는 3D 구조가 알려진 모든 렉틴의 표시를 프롬프트한다. 결과는 기본적으로 모든 종의 렉틴을 보여줍니다. 필드로 검색 옵션을 사용하여 보기를 사람 중심 정보로 제한할 수 있습니다.
    4. 필드로 검색 옵션을 클릭합니다. 필드에 호모 사피엔스를 입력하십시오. X선 구조 탐색 버튼을 클릭하여 원래 목록을 필터링합니다. 오직 하나의 항목, 즉 인간 갈렉틴-8만이 남는다. 나열된 항목의 오른쪽 위 모서리에 있는 3D 구조 및 정보 보기 단추를 클릭하여 NeuAc(a2-3)Gal(b1-4)GlcNAc와 상호 작용하는 인간 갈렉틴-8에 대한 자세한 정보를 표시합니다.
    5. 두 명의 다른 뷰어와 함께 페이지에 표시된 인간 갈렉틴-8의 구조 정보에 액세스하십시오.
      1. 마우스를 잡고 분자를 돌리고 리간드를 Litemol 소프트웨어26이 통합된 상태로 앞쪽으로 가져와 렉틴 3D 구조를 보여줍니다. 왼쪽에 나열된 상호작용 중 하나를 마우스로 올려 우측의 뷰를 업데이트하고, 렉틴과 리간드 사이의 원자 상호작용을 상세히 설명하기 위해 통합된 PLIP 소프트웨어(27)를 사용하여 구조에서 특정 상호작용이 작용하는 위치를 찾는다(도 6).
    6. UniProt, PDB (유럽 또는 미국 사이트) 및 GlyConnect의 해당 항목에 연결되는 녹색 버튼을 클릭하여 이러한 상호 참조를 탐색하십시오.

2. GlyConnect에서 O-glycomes 탐구 및 비교

  1. HGI 챌린지 고신뢰도 데이터 세트 탐색
    참고: 소개에서 언급한 HGI 데이터 세트는 GlyConnect 데이터베이스에 저장됩니다. 그것은 높은 신뢰 목록으로 간주되는 37 개의 당단백질에서 발견되는 163 개의 N- 및 23 개의 O- 글리코 펩티드를 포함합니다. GlyConnect Compozitor28은 글리코메 데이터 일관성을 평가하는 열쇠입니다. 중요한 것은 Compozitor는 격리된 노드를 연결하는 데 하나의 중간 단계만 필요할 때 가상 노드(회색으로 표시됨)를 허용합니다. 이러한 방식으로 가상 노드는 그래프를 조이고 실험 결과에서 잠재적으로 놓친 구조로 해석 될 수 있습니다.
    1. GlyConnect 홈페이지에서 기사의 참조 페이지인 https://glyconnect.expasy.org/browser/references/2943 로 직접 이동하여 HGI 데이터 세트를 찾아보십시오.
      참고: 컬러 버튼의 요약은 부분적으로 문서에 제공된 수치를 반영합니다. 그러나, 단지 69개의 독특한 펩티드가 열거된다면, 이것은 펩티드와 부위 또는 구조 사이의 다중 연관성을 반영한다. 이 기사에서 글리코 펩티드는 펩티드와 조성물의 독특한 조합으로 정의됩니다. GlyConnect에서, 글리코사이트는 먼저 고려되고, 이들은 펩티드와 구조의 조합으로서 기술된다. 이것은 GlyConnect와 위의 인용문 사이의 수치의 불일치를 설명합니다.
    2. Hex:5 HexNAc:4 NeuAc:2와 같은 N-결합 조성물의 높은 발생 빈도를 확인하여, 1개의 펩티드 중 1개 부위에서 확인된 대부분의 O-결합 조성물의 빈번한 유일성과는 대조적으로 43개 펩티드의 42개 부위에서 확인되었다.
    3. 참조 항목 페이지의 오른쪽에 있는 Compozitor 링크를 클릭하여 데이터 세트의 일관성을 평가합니다. Compozitor 도구가 참조의 DOI를 직접 처리하고 도구의 고급 탭에서 검색 필드를 reference=10.1101/2021.03.14.435332로 채우는지 확인합니다. DOI 번호 뒤에 &glycan_type=O-link를 입력하여 검색을 O-linked 글리칸으로 좁혀서 쿼리가 되도록 합니다.참조=10.1101/2021.03.14.435332&glycan_
      유형 = O 연결
    4. 선택 영역에 추가 단추를 클릭하여 데이터베이스에서 데이터를 검색합니다(20개의 O 연결 컴포지션이 있음). 가상 노드 포함 옵션을 선택한 상태로 유지합니다. [그래프 계산] 단추를 클릭하여 연결된 컴포지션의 그래프를 표시합니다. 이 결과는 그래프를 완성하는 데 필요한 9개의 가상 노드와 함께 글리칸 생합성의 예상되는 연속성에서 몇 가지 차이를 강조합니다(그림 7).
  2. GlyConnect에서 선택된 혈청 단백질의 O-글리코메와 비교
    참고: 갭이 GlyConnect에 저장된 데이터에 의해 채워질 수 있는지 여부를 평가하기 위해, 참조와 함께 나열된 37개 중 하나의 O-글리코실화 단백질이 선택되었다. 데이터셋에서, 인터알파-트립신 억제제 중쇄 H4(Q14624)는 Thr-725 상에서 O-글리코실화된 것으로 보고된다.
    1. GlyConnect Compozitor의 단백질 탭으로 이동하십시오(2.1.3단계 참조). 단백질 목록에서 인터알파 트립신 억제제 중쇄 H4를 선택합니다. 선택이 기본적으로 호모 사피엔스인지 확인하십시오. 글리칸 유형에서 N-링크의 선택을 취소합니다. 먼저 사이트 왼쪽의 빼기 기호를 클릭하여 모든 사이트의 선택을 취소한 다음 목록에서 Thr-725만 선택하여 사이트 목록에서 Thr-725만 선택합니다.
    2. 선택 영역에 추가 단추를 클릭합니다(여섯 개의 컴포지션이 Thr-725와 연결되어 있음). 계산 그래프 단추를 클릭하여 연결된 컴포지션의 그래프를 표시합니다(보충 그림 8).
    3. 표시된 그래프를 관찰하면 문서 데이터 세트의 O-linked 컴포지션 20개 중 17개의 고유한 컴포지션이 파란색으로 표시되고 데이터베이스의 여섯 개 중 세 개의 고유한 컴포지션이 빨간색으로 표시됩니다. 즉, 두 공급원 사이의 중첩은 마젠타로 표현되는 세 가지 조성물로 존재한다. 그래프의 45° 회전이 자동으로 생성됩니다.
      참고: 가상 노드 수가 하나씩 줄어듭니다. 밝혀진 바와 같이, 물품 데이터 세트의 20O 연결 조성물에서 누락되고 가상 노드로서 표현된 H2N2S1은 이제 데이터베이스 내의 인터알파-트립신 억제제 중쇄 H4의 Thr-725와 관련된 추가 조성물로 채워진다. 이것은 H1N2S1과 H2N2S2 사이의 간격을 채우기위한 대체 옵션이기 때문에 두 개의 다른 가상 노드가 쓸모 없게 렌더링되기 때문에 그래프의 토폴로지를 단순화합니다. 그러나 데이터베이스에서 가져온 두 번째 컴포지션은 두 개의 새로운 대체 가상 노드 H2N2F1S1 및 H1N2F2S1을 만들지 않는 경우 격리됩니다.
    4. 가상 노드를 이해하려면 해당 컴포지션이 GlyConnect에 있는지 확인하십시오. 이렇게하려면 그래프 아래의 내보내기 버튼을 클릭하십시오. 다른 모든 옵션을 선택 취소해야만 가 상을 선택합니다. 클립보드 아이콘을 클릭하여 8개의 컴포지션 선택을 복사합니다.
    5. Compozitor의 사용자 지정 탭의 쿼리 창에 선택 항목을 붙여 넣습니다. 글리칸 유형 필드에서 O 연결을 선택합니다. 컴포지션 필드의 선택 레이블을 예를 들어 VN으로 설정하여 8개의 컴포지션 목록의 이름을 지정합니다. 선택 영역에 추가 단추를 클릭한 다음 계산 그래프 단추를 클릭합니다. 이제 모든 가상 노드가 녹색 노드로 표시됩니다(그림 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

프로토콜의 첫 번째 부분 (섹션 1)은 GlyConnect 플랫폼을 사용하여 인간 전립선 특이 항원 (PSA)의 Asn-69에 부착 된 N- 글리칸의 특이성 또는 공통성을 조사하는 방법을 보여주었습니다. 조직-의존성(소변 및 정액액)뿐만 아니라 글리칸 발현의 이소형-의존적(정상 및 높은 pI) 변형은, 두 가지 시각화 도구를 사용하여 강조되었다(도 4 도 5).

첫째, 데이터베이스에 저장된 엔티티 간의 연관성을 표시하는 GlyConnect Octopus는 (1) 옥토퍼스에 표시 할 다른 엔티티 선택하고 (2) 관련 항목을 조사하기 위해 링크를 클릭하여 컨텍스트 정보를 탐색 할 수있는 기회를 제공했습니다. 결과는 조직에 따라 독특한 연관성이었습니다.

둘째, 원래 글리코펩티드 식별을 위한 조성물 파일을 정의/정제하기 위해 설계된 GlyConnect Compozitor는 두 개의 알려진 PSA 이소형(정상 및 고 pI)에서 글리칸 발현을 평가하는 데 사용되었습니다. 각 이소폼 글리컴의 비교는 네 개의 노드(조성)를 골라내는 잘 연결된 그래프를 생성했으며, 그 중 두 개는 높은 pI 이소형의 특징이다. 비록 글리코메 중첩이 유의하지만, 글리칸 특성 막대 차트는 공통에서 높은 pI 이소형으로의 시알릴화의 하락을 나타냈다 (보충 도 5).

더욱이, UniLectin3D의 탐사는 PSA 글리코메의 가능한 리더로서 갈렉틴-8을 단독화하는데, 그 이유는 후자가 NeuAc(a2-3)Gal(b1-4)GlcNAc 말단 에피토프를 갖는 많은 구조를 포함하기 때문이다. 이것은 따라야 할 리드를 제공하며 최종 증거로 간주 될 수 없습니다. 그럼에도 불구하고, PSA와 갈렉틴은 전립선암29 에서 필수적인 역할을 하는 것으로 알려져 있으며, 갈렉틴-8의 특정 역할은 최근에 강조되었다30. 프로토콜의 첫 번째 부분은 글리칸에 의해 매개되는 단백질-단백질 상호작용에 대한 가능성 있는 시나리오를 확립하기 위해 구조적(glycoproteomics) 및 기능적(결합) 데이터를 상관시킨다.

프로토콜의 두 번째 부분(섹션 2)에서는 특정 조직(인간 혈청)과 관련된 고품질 O-글리칸 조성물 세트를 검사하고 GlyConnect 데이터베이스 콘텐츠와 비교함으로써 글리코펩티드의 정제된 확인을 위해 글리칸 조성물 파일을 사용자 지정하는 옵션을 제공합니다(그림 7그림 8). ). 하나의 데이터 세트에서 사용할 수있는 최소 20 개의 컴포지션 세트 (HGI 챌린지 결과)에 의존하거나 GlyConnect에서 합리적으로 수집 된 23 ~ 26 개의 항목으로 향상되어 세트의 일관성을 강화할 수 있습니다.

빨강 라이트 오렌지 녹색 라이트 블루 보라색 분홍색 감색 갈색 다크 오렌지
단백질 조직 공급원 구조 구성 질병 참조 글리코사이트 펩타이드

표 1: GlyConnect 데이터베이스의 각 엔티티와 연관된 색 구성표이며 전체적으로 유효합니다.

Figure 1
그림 1: GlyConnect에 대해 인스턴스화된 Glyco@Expasy의 종속성 휠. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 선택된 글리칸 조성물에 대해 제안된 글리칸 구조. PSA에 대한 GlyConnect 페이지에서 제안된 바와 같이, 여기에서 인간 전립선 특이 항원(PSA)과 동일한 당단백질을 표적화하는 글리칸 조성물의 글리칸 조성물에 대한 글리칸 실험으로부터 글리칸 구조를 제안하였다(ID: 790). 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
그림 3: PSA용 GlyConnect 페이지의 오른쪽 측면 메뉴 다른 주요 데이터베이스에 대한 클릭 가능한 상호 참조 및 PDB의 기존 3D 구조의 LiteMol 글리 칸 플러그인으로 표시합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 4
그림 4: 단백질과 글리칸 사이의 조직 의존성 연관성을 보여주는 GlyConnect Octopus의 출력. 질의 하이브리드시알릴화 는 이러한 기준과 일치하는 모든 조성물을 반환했으며 각 조성물은 데이터베이스에 기록 된 바와 같이 단백질 및 글리칸에 대한 관련 정보를 함께 연결합니다. 기본적으로 호모 사피엔스 로 설정되지만이 옵션은 수정할 수 있습니다. 여기서 GlyConnect Octopus는 하이브리드 및 시알릴화 글리칸 구조 (오른쪽 노드)를 운반하는 모든 인간 단백질 (왼쪽 노드)을 발현되는 조직 (중앙 노드)과 함께 표시합니다. (A) 소변과의 연관성은 두 가지 단백질을 보여줍니다 : choriogonadotropin (GLHA_HUMAN) 및 PSA 일반적인 이소 폼 (KLK3_HUMAN)은 흩어져있는 (이질적인) 글리 칸 구조에 연결되어 있습니다. (B) 정액과의 연관성은 그룹화 된 (유사한) 글리칸 구조에 연결된 PSA (KLK3_HUMAN)의 두 단백질 이소형을 보여주는 것으로 강조됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 5
그림 5: PSA의 두 이소형의 중첩된 N-글리오를 보여주는 GlyConnect Compozitor의 출력. 응축된 표기법의 컴포지션은 각 노드에 레이블을 지정합니다. 공통 이소형과 연관된 글리칸은 청색 노드로서 표현되고 높은 pI 이소형의 글리칸은 적색 노드로서 표현된다. 글리올 사이의 겹침은 마젠타 노드로 표시됩니다. 노드 내부의 숫자는 PSA에 관한 GlyConnect 데이터베이스의 내용에 따라 표지된 조성물과 일치하는 글리칸 구조의 수를 나타냅니다. 표시된 Compozitor 그래프는 D3.js 라이브러리에 의해 생성되는 네트워크를 분리하기 위해 원시 출력에서 약간 수정되었습니다. 이것은 사용자가 원하는 곳마다 브라우저 창 공간에서 노드를 드래그 할 수 있으므로 쉽게 수행 할 수 있으므로 경로를 단축하거나 늘릴 수 있습니다. 사용자는 오른쪽 위 모서리에 있는 확대 /축소 필드에 특정 컴포지션을 입력하여 해당 노드의 그래프를 확대하고 가운데에 맞출 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 6
도 6: NeuAc(a2-3)Gal(b1-4)GlcNAc 결합 세부사항을 사용한 인간 갈렉틴-8의 요약 항목. 녹색을 클릭하면 3D 구조 및 정보 보기 단추(빨간색 타원으로 표시됨)가 열리고 PLIP 응용 프로그램과 함께 잔류물 상호 작용에 대한 클로즈업이 표시되는 새 페이지가 열립니다(빨간색 화살표로 표시됨). 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 7
그림 7: HGI 챌린지의 인간 혈청 고신뢰도 데이터세트의 O-글리코메를 보여주는 GlyConnect Compozitor의 출력. 가상 노드(텍스트 참조)가 없으면 해당 그래프의 연결이 낮습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 8
그림 8: GlyConnect 데이터베이스 콘텐츠를 사용하여 HGI 챌린지의 인간 혈청 고신뢰도 데이터 세트의 O-글리코메의 완료 가능성을 보여주는 GlyConnect Compozitor의 출력. Compozitor의 사용자 지정 탭을 사용하여 전체 GlyConnect 데이터베이스의 콘텐츠에 액세스하면 가상 노드에 해당하는 컴포지션이 노드 레이블에서 강조 표시된 기존 정의된 구조로 매핑됩니다. 노드 크기는 데이터베이스에 저장되고 해당 컴포지션을 보고하는 참조 수를 나타냅니다. 노드의 숫자 레이블은 GlyConnect에 저장된 해당 구조의 수를 나타냅니다. 선택된 컴포지션은 데이터베이스에서 0 내지 열여덟 개의 가능한 매치를 갖는 것으로 보인다. 실제로 이러한 노드는 실험 데이터 세트의 내용을 반영하여 가상으로 만 사용됩니다. 이러한 추가 노드의 사실성을 테스트하기 위해 그래프의 정보를 구체화하는 것이 좋습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 그림 1 : Glyco@Expasy 홈페이지의 버블 차트. Glyco@Expasy 홈페이지의 버블 차트를 확대하여 당단백질 카테고리에 초점을 맞춥니다. 녹색 거품과 노란색 거품으로 된 데이터베이스에 표시된 소프트웨어. 거품을 클릭하면 리소스의 목적이 요약됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 2: 컴포지션에 따라 쿼리와 일치하는 문어 검색된 연관. 하이브리드 및 시알릴화 글리칸 구조 (오른쪽 노드)를 매칭 조성물 (중앙 노드)과 운반하는 인간 단백질 (왼쪽 노드)의 기본 GlyConnect 옥토퍼스 디스플레이. 조성 H6N4F12S1은 PSA 이소형(KLK3_HUMAN) 모두에 고유하게 나타난다. 고유 구조 ID(10996)를 클릭하면 두 개의 이소형이 실제로 이 특정 글리칸을 운반하는 유일한 단백질임을 보여주는 세부 정보가 있는 해당 페이지가 열립니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 3 : 질병에 따라 질의와 일치하는 낙지 검색된 연관성. GlyConnect Octopus는 하이브리드 및 시알릴화 글리칸 구조 (오른쪽 노드)를 운반하는 모든 인간 단백질 (왼쪽 노드)과 그들이 발현되는 질병 (중앙 노드)을 표시합니다. 전립선 암과의 연관성은 PSA (KLK3_HUMAN)의 일반적인 이소형을 보여주는 것으로 강조됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 4: 조직 정보에 따라 질의와 일치하는 문어-검색된 연관. GlyConnect Octopus는 NeuAc(a1-3)Gal(b1-4)GlcNAc 모티프(오른쪽 노드)와 이들이 발현되는 조직(중앙 노드)을 포함하는 이중 안테나리 글리칸 구조를 운반하는 모든 인간 단백질(왼쪽 노드)을 표시합니다. 정액과의 연관성은 PSA (KLK3_HUMAN)와 일곱 가지 구조의 일반적인 이소 형만을 보여주는 것으로 강조됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 5: PSA의 두 이소형의 중첩된 N-글리오를 보여주는 GlyConnect Compozitor의 출력. 응축된 표기법의 컴포지션은 각 노드에 라벨링됩니다. 공통 이소형과 연관된 글리칸은 청색 노드로서 표현되고 높은 pI 이소형의 글리칸은 적색 노드로서 표현된다. 글리올 사이의 겹침은 마젠타 노드로 표시됩니다. 노드 내부의 숫자는 PSA에 관한 GlyConnect 데이터베이스의 내용에 따라 표지된 조성물과 일치하는 글리칸 구조의 수를 나타냅니다. 글리칸 특성의 막대 차트 위에 Mousing은 주파수와 노드 사이의 대응을 주황색 거품으로 보여줍니다. 거의 모든 PSA 공통 이소폼 노드가 적용됩니다. 이 주파수는 높은 pI 이소형에서 떨어집니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 6: UniLectin3D의 글리칸 검색 인터페이스. 시알산 SNFG 기호(빨간색 원)를 클릭하면 UniLectin3D에 저장된 NeuAc를 포함하는 모든 리간드에 대한 검색이 시작됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 도 7: NeuAc를 함유하는 모든 리간드에 대한 검색의 결과물의 발췌. 관심있는 NeuAc(a2-3)Gal(b1-4)GlcNAc 모티프는 빨간색으로 동그라미를 그립니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 8: GlyConnect에 있는 것과 겹쳐진 HGI 데이터 세트의 O-글리코메를 보여주는 GlyConnect Compozitor의 출력. HGI 챌린지의 인간 혈청의 O-글리코메를 보여주는 GlyConnect Compozitor의 출력은 참조와 함께 열거된 37개 중 하나의 O-글리코실화 단백질의 O-글리코메와 중첩된 파란색으로 HGI 챌린지의 높은 신뢰도 데이터세트, 즉 GlyConnect에 포함된 추가 정보와 함께 인터알파-트립신 억제제 중쇄 H4의 O-글리코메를 나타낸다. 이렇게 하면 그래프의 연결성이 향상됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect 문어는 예기치 않은 상관 관계를 드러내는 도구로 사용됩니다.
GlyConnect Octopus는 원래 글리 칸의 느슨한 정의로 데이터베이스를 쿼리하도록 설계되었습니다. 실제로, 문헌은 종종 글리칸의 주요 특성을 fucosylated 또는 sialylated, 둘 이상의 안테나로 만들어지는 것과 같은 글리코메에서보고합니다. 또한, N- 또는 O 연결 여부의 글리칸은 참조 설명서 Essentials of Glycobiology1에 자세히 설명 된대로 코어로 분류되며, 이는 종종 출판 된 기사에서 인용됩니다. 마지막으로, 혈액 그룹 항원과 같은 글리칸 에피토프는 구조에서 추구되고 잠재적으로 글리칸을 타이핑하기 위해 단일화되는 또 다른 특성이다. 결국, 특정 조직 또는 선택된 종에서 발현되는 글리코메의 공통적이거나 뚜렷한 특성을 탐색하는 것이 적절할 수 있다. 그런 의미에서 수집된 정보는 고유한 사실과는 반대로 새로운 가정의 원천으로 사용되어야 한다.

글리 칸 조성 세트를 형성하기위한 도구로서의 GlyConnect Compozitor
단백질 페이지에 설명된 바와 같이 구조 정보를 탐색하는 것은 목록이 항목화된 구조 사이의 관계뿐만 아니라 조성물 사이의 관계를 모호하게 하는 경향이 있기 때문에 한계가 있다. GlyConnect Octopus는 전자에, GlyConnect Compozitor는 후자에 참석합니다. 대부분의 GlyConnect 항목에 나열된 구조를 주의 깊게 살펴보면 공통 하위 구조의 존재를 알 수 있습니다. 그러나이 정보는 헌신적 인 시청자의 도움 없이는 시각적으로 파악하기가 쉽지 않습니다.

글리코펩티드 동정 소프트웨어의 핵심 파라미터로서 글리칸 모이어티의 동정을 지지하는 글리칸 조성물 파일의 내용은 HGI 챌린지의 결과를 분석함으로써 확립되었다. 대부분의 고전적 프로테오믹스 검색 엔진은 데이터베이스/저장소 또는 문헌에서 수집된 데이터로부터 파생된 컬렉션으로부터 글리코-기반 변형의 선택을 수용한다. 다른 글리코 프로테오믹스 전용 도구는 글리칸 생합성의 지식을 사용합니다. 이러한 방식으로, 조성물 파일은 이론적으로 예상되는 효소 활성의 결과로서 정의된다. 결국, 검색 엔진만큼 많은 컴포지션 파일이 있으며 이들 사이의 겹침은 매우 가변적입니다. 그럼에도 불구하고, 프로테오믹스에서의 과거 경험으로부터, 특히 번역 후 수정이 설명될 때, 학습 엔진의 성능이 검색 공간을 제한하는 것과 상관관계가 있음을 보여준다31. 글리코프로테오믹스에서도 유사한 관찰이 이루어지고 GlyConnect Compozitor는 교육받은 조성물 데이터 선택을 지원하도록 설계되었으며, 그 중요성은 이전에 논의되었습니다32.

이 도구의 사용법은 특히 API (응용 프로그래밍 인터페이스)를 통해 GlyConnect에 대한 프로그래밍 방식의 액세스를 직접 시작하는 쿼리를 표현할 수있는 고급 탭과 관련하여 프로토콜에 불완전하게 설명되었습니다. 예를 들어, 고급 탭의 쿼리 창에 분류학=호모 사피엔스&글리칸유형=N-linked&tissue=소변&disease=전립선암을 입력하는 것은 소스 탭(종에서 호모 사피엔스 선택, 조직의 소변, 글리칸 유형에서 N 연결 선택) 및 질병 탭(에서 호모 사피엔스 선택, 전립선 질병글리 칸 유형에서 N 연결). 즉, 한 단계에서 여러 가지 선택이 필요한 결과를 제공합니다.

마지막으로, 가상 노드의 생성은 프로토콜에서 설명되지만, 잠재적인 중복성은 추가적인 주석이 필요합니다. 두 개의 동시 옵션은 그래프에서 효소의 시뮬레이션 된 작용이 효소 활동의 연대기를 설명하지 않기 때문에 구별 할 수 없을 수 있습니다. 그래서 Compozitor는 단당류 카운트에 해당하는 두 개의 연결되지 않은 노드를 최대 두 개의 차이로 연결하기 위해 두 개의 가상 노드를 통해 두 개의 경로를 제안합니다. 새 데이터를 포함하면 종종 누락 된 링크가 제공됩니다. 사용자는 가상 노드 포함 상자를 선택 취소하여 가상 노드를 항상 자유롭게 고려하거나 해제할 수 있습니다.

알려진 데이터베이스 및 소프트웨어 제한 사항
전반적으로 웹상의 탐색과 마찬가지로 위에서 설명한 프로토콜은 때때로 사이트의 업데이트 또는 두 사이트 간의 업데이트 충돌로 인해 존재하지 않는 페이지로 이어집니다. 이 경우와 실제로 탐색이 흐르지 않는 모든 경우 가장 쉬운 방법은 지난 28 년 동안 포털의 성공에 크게 기여한 효율성을 가진 Expasy 헬프 데스크에 메모를 보내는 것입니다.

GlyConnect의 내용은 문헌의 현재 불균형을 반영하여 편향되어 있습니다. 대부분의 간행물은 포유류에서 N-글리코실화를 보고하고 데이터베이스는 인간 N-당단백질이 더 풍부하다. 그럼에도 불구하고, 우리는 과거에 덜 일반적인 데이터 세트를 포함하고 조언과 제안을받는 데 완전히 개방적이라는 요청을 받았습니다.

게다가, Compozitor는 현재 세 가지 구성 데이터 세트의 비교로 제한됩니다. 문어의 결정자 서브탭의 주요 개정이 계획되어 있습니다. Glyco@Expasy 자원은 정기적 인 업데이트가 필요하며 일부는 적절한 과정에서 수행되지 않을 수 있습니다. 그럼에도 불구하고 경고 및 / 또는 발표는 그렇게 발생할 때 게시됩니다.

GlyGen(https://www.glygen.org) 및 GlyCosmos(https://www.glycosmos.org)로 알려진 파트너 포털은 다양한 옵션과 도구를 제공합니다. 궁극적으로 두 옵션 중 하나에서 정보를 탐색하고 검색하는 것은 높은 수준의 주관성을 수반하며 주로 사용자의 습관과 관심사에 달려 있습니다. 우리는 우리의 솔루션이 지역 사회의 일부에 적합하기를 희망 할 수 있습니다.

생명 과학 프로젝트에서 글리코 과학의 투입이 증가하고 있으며 건강 문제에서 글리 칸의 역할을 확립하는 연구가 지속적으로 생산되고 있습니다. Sars-Cov-2에 대한 최근의 초점은 특히 구조적 접근법에서 당화 단백질의 중요성을 다시 한번 밝혀 냈습니다.33. Glycoinformatics는 데이터 분석 및 해석의 일상 업무에서 글리코 과학자를 지원합니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 이해 상충을 선언하지 않습니다.

Acknowledgments

저자는 이 튜토리얼에 사용된 리소스를 개발하는 데 관여하는 Proteome Informatics Group의 과거와 현재 구성원, 특히 GlyConnect의 Julien Mariethoz와 Catherine Hayes, UniLectin의 François Bonnardel, Davide Alocci, Octopus의 Frederic Nikitin, Compozitor의 Thibault Robin 및 Octopus에 대한 최종 터치를 따뜻하게 인정합니다.

glyco@Expasy 프로젝트의 개발은 교육, 연구 및 혁신을위한 주 사무국 (SERI)을 통해 스위스 연방 정부에 의해 지원되며 현재 스위스 국립 과학 재단 (SNSF : 31003A_179249)에 의해 보완됩니다. ExPASy는 스위스 생물 정보학 연구소에서 유지 관리하고 Vital-IT 역량 센터에서 호스팅됩니다. 저자는 또한 ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003)가 공동으로 지원하는 UniLectin 플랫폼에 대한 탁월한 협력을 인정합니다.

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

생물학 문제 179
글리칸 매개 단백질 상호작용 연구를 위한 생물정보학 자료
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter