Summary
このプロトコルは、オンラインリソースでヒトタンパク質グリカムを探索、比較、および解釈する方法を示しています。
Abstract
Glyco@Expasyイニシアチブは、糖鎖生物学における知識のいくつかの側面にまたがる相互依存的なデータベースとツールのコレクションとして開始されました。特に、糖タンパク質(細胞表面受容体など)と糖鎖によって媒介される炭水化物結合タンパク質との間の相互作用を強調することを目的としている。ここでは、ヒト前立腺特異抗原(PSA)のNグリコームとヒト血清タンパク質のOグリコームを中心とした2つの例示的な例を通じて、コレクションの主要なリソースを紹介します。この記事では、さまざまなデータベース クエリと視覚化ツールを使用して、連続体内のコンテンツを探索および比較して、散在する情報を収集して関連付ける方法を示します。収集されたデータは、グリカン機能のより精巧なシナリオを養う運命にあります。したがって、ここで紹介するグリコインフォマティクスは、所与の文脈におけるタンパク質グリコームの特異性に関する仮定を強化、形成、または反論する手段として提案される。
Introduction
グリカン、それらが結合するタンパク質(糖タンパク質)およびそれらが結合するタンパク質(レクチンまたは炭水化物結合タンパク質)は、細胞表面における主要な分子アクターである1。細胞間通信におけるこの中心的な役割にもかかわらず、グリコミック、グリコプロテオミクス、またはグリカン相互作用データを含む大規模な研究は、ゲノミクスおよびプロテオミクスにおける対応するものと比較して依然として乏しい。
最近まで、キャリアタンパク質にコンジュゲートされたまま複雑な炭水化物の分岐構造を特徴付ける方法は開発されていなかった。糖タンパク質の生合成は、単糖ドナー、受容性糖タンパク質基質、および糖転移酵素およびグリコシダーゼが相互作用的な役割を果たす非テンプレート駆動型プロセスである。得られた糖タンパク質は、複数の分岐点を持つ複雑な構造を持つことができ、各単糖成分は自然界に存在するいくつかのタイプの1つであり得る1。非テンプレート駆動型プロセスは、オリゴ糖構造データを生成するための唯一の選択肢として生化学的分析を課します。天然タンパク質に結合しているグリカン構造の分析プロセスは、単糖組成、結合、および分岐配列を決定するために高感度、定量的、堅牢な技術を必要とするため、しばしば困難です2。
この文脈において、質量分析(MS)は、グリコミクスおよびグリコプロテオミクス実験において最も広く使用されている技術である。時間が経つにつれて、これらはより高いスループット設定で実行され、データは現在データベースに蓄積されています。様々なフォーマットのグリカン構造3は、グリカンが定義される精度のレベル(例えば、おそらく欠損連鎖タイプまたは曖昧な組成)に関係なく、各構造が安定した識別子と関連付けられている普遍的なグリカンデータリポジトリであるGlyTouCan4に移入する。非常によく似た構造が収集されていますが、それらのわずかな違いが明確に報告されています。糖タンパク質は、互いに相互参照する2つのデータベースであるGlyConnect5およびGlyGen6に記載およびキュレーションされています。構造的証拠を裏付けるMSデータは、GlycoPOST7にますます保存されています。オンラインリソースのより広い範囲をカバーするために、リファレンスマニュアルの第52章「糖鎖生物学の要点」は、グリコインフォマティクスに捧げられています8。興味深いことに、糖ペプチド同定ソフトウェアは近年増殖している9,10が再現性の恩恵を受けていない。後者の懸念により、HUPO GlycoProteomics Initiative(HGI)のリーダーは、2019年にソフトウェアの課題を設定しました。CID、ETD、およびEThcDフラグメンテーションモードでNおよびOグリコシル化ヒト血清タンパク質の複雑な混合物を処理することから得られたMSデータは、ソフトウェアユーザーまたは開発者のいずれであっても競合他社に利用可能であった。この課題11の結果に関する完全なレポートは、ここでのみ概説されています。まず、識別の広がりが観察された。これは主に、検索エンジンに実装された方法の多様性、その設定、出力のフィルタリング方法、およびペプチドの「カウント」によって引き起こされたと解釈されました。実験計画はまた、いくつかのソフトウェアとアプローチを(不)利点に置いたかもしれない。重要なことに、同じソフトウェアを使用している参加者が一貫性のない結果を報告し、それによって深刻な再現性の問題が浮き彫りになりました。異なる提出物を比較することで、一部のソフトウェアソリューションは他のソリューションよりも優れたパフォーマンスを発揮し、一部の検索戦略はより良い結果をもたらすと結論付けられました。このフィードバックは、自動糖ペプチドデータ解析方法の改善を導く可能性が高く、ひいてはデータベースの内容に影響を与えるでしょう。
グリコインフォマティクスの拡大により、情報を提供し、複数の類似または補完するリソースにアクセスするWebポータルが作成されました。最新かつ最新のものは、包括的糖科学の本シリーズ12の章で説明されており、協力を通じて、データ共有と情報交換のソリューションがオープンアクセスモードで提供されています。そのようなポータルの1つは、もともとGlycomics@ExPASy 13と呼ばれ、何十年もの間、いくつかのオミクスで使用されているツールとデータベースの大規模なコレクションをホストしてきたExpasyプラットフォーム14の大規模なオーバーホールに続いて、Glyco@Expasyに改名されました最も人気のあるアイテムはUniProt15 - 普遍的なタンパク質知識ベースです。Glyco@Expasyは、データベースとツールの目的と使用法を、視覚的な分類と相互依存関係の表示に基づいて教訓的に発見します。以下のプロトコルは、グリコプロテオミクスとグリカン相互作用ミクスの間の接続をglycomicsを介して明示するこのポータルからのリソースの選択を使用して、グリコミクスおよびグリコプロテオミクスデータを探索する手順を示しています。グリコミクス実験は、単糖が完全に定義され、結合が部分的または完全に決定される構造を生成するが、それらのタンパク質部位の結合は、たとえそうであっても、特徴付けが不十分である。対照的に、グリコプロテオミクス実験は正確な部位結合情報を生成するが、グリカン構造の分解能は悪く、しばしば単糖組成物に限定される。この情報は、GlyConnect データベースでつなぎ合わされています。さらに、GlyConnectの検索ツールを使用して、UniLectin16でそれらを認識するタンパク質とともに記載されている潜在的なグリカンリガンドを検出し、グリカンを介してGlyConnectにリンクすることができます。ここで提示されたプロトコルは、N結合型およびO結合型グリカンおよび糖タンパク質に特有の質問をカバーするために、2つのセクションに分かれています。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
注: インターネットに接続されたデバイス(大画面を推奨)と、Chrome や Firefox などの最新のウェブブラウザが必要です。SafariやEdgeを使用することはそれほど信頼できないかもしれません。
1. GlyConnectのタンパク質Nグリコームからユニレクチンのレクチンへ
- Glyco@Expasyからのリソースへのアクセス
メモ: ここで説明する手順は GlyConnect にアクセスすることですが、プラットフォームに記録されているリソースへのアクセスにも適用できます。- https://glycoproteome.expasy.org/glycomics-expasy に移動し、複合糖質 や グリカン結合などのさまざまなカテゴリを示す右側のバブルチャートを検討してください。バブル内のカテゴリを反映する左端のメニューで、[ 糖タンパク質] ボックスをオンにして、右側のバブル チャートがそのカテゴリに一致するバブルをすぐに拡大できるようにします。
メモ: 緑色のバブルはツールで、黄色のバブルはデータベースです。どちらかをクリックすると、再びズームインしてリソースの詳細が表示されます。これを行う前に、ユーザーはそのリソースの他のユーザーへの依存関係を理解したい場合があります。 - 依存関係に関する情報を取得するには、[ リソース主題別分類 ] タブから [ リソース依存関係ホイール] タブに移動します。ホイールの GlyConnect にマウスを置き、他のソースとの統合レベルを確認します(図1)。
- 「 リソース主題別分類」 タブに戻り、ステップ 1.1.1 のように GlyConnect バブルに到達し、それをクリックして (補足図 1)、データベースの最新リリースのコンテンツの統計情報を表示する新しいタブに GlyConnect ホームページを表示します。
メモ: 表 1 に示す配色は、データベースに格納されているさまざまな種類の情報と一致します。このカラーコードは、GlyConnect のすべてのエンティティページで有効であり、全体を通して一貫しています。ホームページには、Sars-Cov-2スパイクタンパク質(COVID-19)のグリコシル化を説明するものや、ヒトミルクオリゴ糖(HMO)を広範囲に詳述したものなど、焦点を絞ったデータセット専用の4つのセクションも表示されます。これらは、このプロトコルでは説明しません。
- https://glycoproteome.expasy.org/glycomics-expasy に移動し、複合糖質 や グリカン結合などのさまざまなカテゴリを示す右側のバブルチャートを検討してください。バブル内のカテゴリを反映する左端のメニューで、[ 糖タンパク質] ボックスをオンにして、右側のバブル チャートがそのカテゴリに一致するバブルをすぐに拡大できるようにします。
- タンパク質Nグリコームの文脈情報を探る
注: GlyConnect のすべてのグリカン構造は、3 つの代替および一般的に使用される形式で表示されます: (1) グリカンのシンボル命名法 (SNFG)17 (2)IUPAC凝縮18、および (3) オックスフォード19.これに対し、糖鎖組成を発現する標準的な表記はない。GlyConnect では、ヘキソースには Hex、N-アセチルヘキソサミンには HexNAc、フコースには dHex、シアル酸には NeuAc というコードが使用されます。簡単にするために、視覚化ツールは、ヘキソースのH、N-アセチルヘキソサミンのN、フコースのF、シアル酸のSの凝縮表記に依存しています。さらに、小さな文字は、アセチル化のための「a」、リン酸化のための「p」、硫酸化のための「s」などの修飾を、これらのいわゆる置換基の中で最も頻繁に示す。- ヒト前立腺特異抗原(PSA)のNグリコームを表示および探索するには、GlyConnectホームページから、以下の手順を実行します。
注:ヒトPSAのグリコシル化は、特に前立腺癌の文脈で、長年にわたって研究されてきた。GlyConnect データベースには、グリコミクスとグリコプロテオミクスのデータを組み合わせた 3 つの参考文献 20、21、22 が格納されています。ここで提供される結果は、GlyConnect の 2021 年 9 月のリリースで得られたものであることに注意してください。データベースを使用すると、頻繁なデータ更新のためにわずかに異なる統計が生成されることがあります。 - 「タンパク質」ボタンを選択して、データベースの タンパク質 ビューを開きます。タンパク質ビューページで、検索ウィンドウに 前立腺 と入力します。出力にリストされている 2 つのエントリで、pI 値が異なる PSA の 2 つのアイソフォームを区別するエントリを探します。PSAの共通アイソフォームに対応する 790 (Id列)をクリックします。
注:上記のスキームで公開された作品から抽出された要約情報を示す上部の多色バーを探します。ナビゲーションには、以下で説明するようにいくつかのオプションがあります。 - 上部の多色バーで、緑色の [SOURCE ] ボタンをクリックすると、公開されたデータが処理されたサンプルの種類 (尿 と 精液) が表示されます。この情報をさらに参照するには、これらのサンプルの種類のいずれかをクリックします。同じことが、色付きのボタンをクリックしたときに表示されるすべての項目にも当てはまります。
- データベースの健康関連コンテンツを確認するには、GlyConnectの対応する専用疾患ページにリンクする前立腺癌の2つの項目を含むDISEASEボタンをクリックします。そのページの要約は、3つの大規模研究が308のヒトタンパク質に見られる1,087の部位について319の組成を報告したことを示しています。
- STRUCTUREボタンをクリックすると、グリコミクスデータからPSAに関連する135の構造の完全なリストが表示されます。COMPOSITIONボタンをクリックすると、グリコプロテオミクス実験によって決定された関連する78の組成物が表示されます。任意の構造または構成をクリックすると、詳細が表示されます。
注:特定の構造を保持する代替タンパク質のリストまたは組成物に一致する構造のリストなどの詳細を得ることができる。PSAは、Asn-69に1つのN-グリコシル化部位しか持たないことが知られている(茶色の SITE ボタンには1つの項目のみがカウントされる)。 - コンポジションのあいまいさを減らすには、選択したコンポジションの下にある 「推奨構造 」をクリックします(たとえば、Hex:6 HexNAc:3 NeuAc:1)。単糖数が上記の構造と一致するたびに提案がなされる(図2)。
注:グリコプロテオミクス実験によって生成されたHex:6 HexNAc:3 NeuAc:1組成は、グリコミクスデータから4つの高分解能構造と一致します。PSAの場合、Asn-69のみがグリコシル化されているため、解決する部位の曖昧さはない。 - タンパク質ページを完全に探索するには、ページの右側に詳細を表示します(図3)。
- 各モノマーに結合された2つの複合グリカンで示されているPSAのデフォルトの 3QUM PDB(タンパク質データBank23)エントリ(図3)または代替の 2ZCK エントリ(結合された炭水化物のためにも利用可能)を参照してください。2 番目のエントリは、1 つのチェーンを示します。
注:両方のエントリは、PDB-RCSBで採用されているSNFG-3D表記でグリカンを表示する3D LiteMolプラグイン24 で視覚化されます。 - 他の相互参照の対応するリンクをクリックして、UniProtなどの主要なプロテオミクスデータベースから関連する機能情報を調べます(図3)。
- 各モノマーに結合された2つの複合グリカンで示されているPSAのデフォルトの 3QUM PDB(タンパク質データBank23)エントリ(図3)または代替の 2ZCK エントリ(結合された炭水化物のためにも利用可能)を参照してください。2 番目のエントリは、1 つのチェーンを示します。
- ヒト前立腺特異抗原(PSA)のNグリコームを表示および探索するには、GlyConnectホームページから、以下の手順を実行します。
- タンパク質N-グリコームのコンテキスト情報の視覚化と相関
注: 前のセクションで見たように、構造やコンポジションの長いリストは全体として把握するのが難しく、GlyConnect は重要な情報を視覚化するために 2 つの異なるツール、つまり GlyConnect Octopus と GlyConnect Compozitor に依存しています (最初のツールは色付きのボタンでキャプチャされた要約情報を展開し、2 つ目は構造/構成が別のツールに含まれているという点で構造的な依存関係を引き出します)。以下に示すように、GlyConnect Octopus は、データベースの内容を反映して複数または単一の接続を強調表示することによって、データベースに格納されているさまざまなエンティティ間の関連付けを調べます。- GlyConnect Octopus検索を行い、PSAに結合している糖鎖の多様性にハイブリッドコア構造や高頻度シアル酸含有構造などの共通の構造特性が存在することを確認します。
- タコのホームページ https://glyconnect.expasy.org/octopus/ に移動します。「N リンク」タブは デフォルトで選択されたままにします。 [コア ]サブタブに移動し、[ ハイブリッド] アイコンをクリックします。 [プロパティ ]サブタブに移動し、[ シアリル処理 ]アイコンをクリックします。下の緑色の 検索 ボタンをクリックします。
メモ: 検索結果は、3 つのカテゴリのアイテム間の関係としてグラフィカルに表示されます。デフォルトでは、中央のリストは組成のクエリと一致し、左側のコレクションは関連するタンパク質にまたがり、右側のコレクションは関連するグリカンにまたがります。 - 表示された関係のグラフで、 H6N4F1S1 にカーソルを合わせると、6つのタンパク質と3つの構造へのリンクが強調表示されます。これとは対照的に、 H6N4F2S1 にカーソルを合わせると、PSAの2つのアイソフォーム(どちらもUniProt ID:KLK3_HUMANと呼ばれる)と1つの構造(ID:10996と呼ばれる)が選ばれます。構造 ID にカーソルを合わせると、その SNFG 表現が表示され、それをクリックして対応するページが開きます (補足図 2)。
- タコのノードを、グリコシル化のコンテキストを説明する他のトピックに変更します。カラーコードは、前述のものと同じです ( 表 1 を参照)。
- [ 中心節点 ]を [組織 ]に変更して、グラフの中央に15のオプションを表示しますが、その多くは体液です。組織情報に応じて、クエリに一致するタンパク質とグリカンの間のすべての関連を探します。グラフの中央にある 尿 または 精液 にカーソルを置いて、さまざまな関連性を表示します(図4A、B)。
- [中心ノード] を [疾患] に変更して、13 個のオプションを表示し、そのうちの 1 つは前立腺がんです。関連する唯一のタンパク質はPSA(KLK3_HUMAN)である(補足図3)。
注:タンパク質ページに示されているPSA N-グリコームを詳しく見ると、末端NeuAc(a?-?)の非常に高い周波数が特定されます。ギャル(b?-?)GlcNAc下部構造は、多くの場合、2つまたは3つのアンテナを有する構造上に存在する。別のタコは、以下に説明するように、それに基づいて生成することができます。
- [ クリア] ボタンをクリックして検索を更新します。 [プロパティ ]サブタブに移動し、[ バイアンテナ ]アイコンをクリックします。 「決定要因」 サブタブに移動し、 3-シアリル-LN (タイプ 2) アイコンをクリックします。下の緑色の 検索 ボタンをクリックします。
- 末端3-シアリル-LN(タイプ2)モチーフ、すなわちNeuAc(a1-3)Gal(b1-4)GlcNAcを含むバイアンテナグリカンとのタコ検索された関連を確認してください。読みやすくするために センターノード を 組織 に変更し 、KLK3_HUMAN の上にカーソルを合わせると、Seminal FluidをPSA共通のアイソフォームと7つの構造に直接接続できます(補足図4)。
注: 2 番目の視覚化ツールである GlyConnect Compozitor は、そのリスト内のすべてのコンポジション間の潜在的な関係のスキャンを実行します (下記参照)。関係は、2つの組成物間で1つの単糖のみと異なるものとして定義される。グラフにプロットされたこれらの同定された関係は、グリコームの(不)連続性を明らかにする。 - GlyConnect Compozitor を使用して、PSA の場合に以下に示すように、そのリスト内の各コンポジション間の潜在的な関係のスキャンを実行します。
メモ: GlyConnect コンポジターは、コンテキストに関連してコンポジションを処理します。GlyConnectを照会するための個別のタブ、例えば 、タンパク質、ソース、細胞株、 コンテキストを修飾するために自明である疾患を提供します。これをPSAで次のように説明します。 - PSAのタンパク質ページに戻る:https://glyconnect.expasy.org/browser/proteins/790。PSAエントリーページの右側にあるコンポジターリンクをクリックします。Compozitor 検索フィールドには、[タンパク質] タブの Id 790 エントリの詳細があらかじめ入力されていることを確認します (タンパク質 : 前立腺特異的抗原、種: ホモ サピエンス、および グリカンタイプ: N リンク)。
- 「 選択範囲に追加」 ボタンをクリックして、データベースからデータを取得し、接続されているコンポジションのグラフを表示します。 「仮想ノードを含める」 オプションの選択を解除します。 [グラフの計算] ボタンをクリックすると、PSA N-グリコームを表す78の組成物の十分に接続されたセットを示すグラフと、グリカンの主な特性を示す棒グラフが表示されます。
- 棒グラフの紫色のバーにカーソルを合わせると、グラフ内のすべてのシアリル構造が特定され、シアリル構造に対する観察可能な偏りが明らかになります。
- メインの [タンパク質] タブにとどまり、[タンパク質 (名前)] フィールドで [前立腺特異抗原 - 高 Pi アイソフォーム (psah)] を選択します。
注: [グリカン の種類] フィールドと [グリカン サイト] フィールドは自動的に入力されます。 - [ 選択範囲に追加] ボタンをクリックして、データベースから57個のコンポジションのデータを取得します。[グラフの 計算] ボタンをクリックして、両方のアイソフォームの重畳グラフを生成し、2 つの PSA アイソフォームのグリカミングの違いを評価します。ノードラベルにカーソルを合わせると、コンポジション/ラベルに対応する構造体の数が表示されます(図5)。
- ユニレクチンにおける糖鎖結合情報
注: タコでテストされた行列式は、NeuAc(a2-3)Gal(b1-4) と記載されていることを思い出してください。定義上、それはグリカン構造の確立された結合部分であり、そのように、UniLectin3Dデータベース25で検索することができる。- https://www.unilectin.eu/ に移動し、 UniLectin3D ボタンをクリックします。または、グリカン検索 ボタンの https://www.unilectin.eu/unilectin3D/.Click ページに直接移動して、このページを開きます:https://www.unilectin.eu/unilectin3D/glycan_search(補足図6)。
- シアル酸を表す紫色のひし形をクリックすると、データベースに保存されているシアル酸で終わるすべてのグリカン結合モチーフの表示が促されます。そのモチーフコレクションの上部には、先に調査したNeuAc(a2-3)Gal(b1-4)GlcNAcモチーフが含まれています(補足図7)。
- NeuAc(a2-3)Gal(b1-4)GlcNAc モチーフをクリックすると、NeuAc(a2-3)Gal(b1-4)GlcNAcとの相互作用を確認する3D構造が既知であるすべてのレクチンの表示が促されます。結果はデフォルトですべての種のレクチンを示しています。[ フィールドで検索 ] オプションを使用して、ビューを人間中心の情報に制限します。
- [ フィールドで検索 ]オプションをクリックします。 種の フィールドでは、 ホモ・サピエンスと入力します。[ X線構造の探索] ボタンをクリックして、元のリストを除外します。1つのエントリ、すなわちヒトガレクチン-8だけが残っている。リストされた項目の右上隅にある 3D構造と情報の表示ボタンをクリックすると 、NeuAc(a2-3)Gal(b1-4)GlcNAcと相互作用するヒトガレクチン-8の詳細情報が表示されます。
- ページに表示されているヒトガレクチン-8の構造情報に、2つの異なるビューアでアクセスします。
- マウスを長押しして分子を回転させ、リテモールソフトウェア26を内蔵してリガンドを前面に出し、レクチンの3D構造を表示します。左側にリストされた相互作用の1つにマウスを合わせて右側のビューを更新し、レクチンとリガンドの間の原子間相互作用を詳述するために統合されたPLIPソフトウェア27を使用して、その特定の相互作用が構造内のどこに作用するかを見つけます(図6)。
- UniProt、PDB(ヨーロッパまたはアメリカのサイト)、およびGlyConnectの対応するエントリにリンクしている緑色のボタンをクリックして、これらの相互参照を調べます。
2. グラコネクトでの O-glycomes の調査と比較
- HGI チャレンジの高信頼度データセットの参照
注: 概要で説明した HGI データセットは、GlyConnect データベースに格納されます。これは、高い信頼度リストと見なされる37の糖タンパク質に見られる163のN-および23のO-糖ペプチドを含む。GlyConnect Compozitor28 は、グリコームデータの一貫性を評価するための鍵です。重要なことに、Compozitorは、分離されたノードを接続するために1つの中間ステップのみが必要な場合に、仮想ノード(灰色で表示)を可能にします。このようにして、仮想ノードはグラフを締め付け、実験結果で見逃されている可能性のある構造として解釈することができます。- GlyConnect のホームページから HGI データセットを参照するには、記事のリファレンス ページである https://glyconnect.expasy.org/browser/references/2943 に直接アクセスします。
メモ: 色付きのボタンの要約は、この記事の図を部分的に反映しています。しかし、69個のユニークなペプチドのみがリストされている場合、これはペプチドと部位または構造との間の複数の関連を反映している。本稿では、糖ペプチドは、ペプチドと組成物のユニークな組み合わせとして定義される。GlyConnectでは、グリコサイトが最初に考慮され、ペプチドと構造の組み合わせとして記述されています。これは、GlyConnectと上記の引用との間の図の不一致を説明しています。 - Hex:5 HexNAc:4 NeuAc:2 など、43 ペプチドの 42 部位で同定された N 結合型組成物の出現頻度が高いのに対し、1 ペプチド中 1 部位で同定されたほとんどの O 結合型組成物の頻繁な一意性を確認します。
- 参照エントリ ページの右側にある [Compozitor] リンクをクリックして、データセットの一貫性を評価します。Compozitor ツールが参照の DOI を直接処理し、ツールの [詳細設定] タブで検索フィールドに reference=10.1101/2021.03.14.435332 を入力していることを確認します。DOI 番号の後に &glycan_type=O リンク型と入力して、検索を O 結合型グリカンに絞り込み、クエリは次のようになります。参照=10.1101/2021.03.14.435332&glycan_
タイプ=Oリンク - 「 選択範囲に追加」 ボタンをクリックして、データベースからデータを取得します(Oリンクされたコンポジションは20個あります)。「 仮想ノードを含める」 オプションを選択したままにします。「グラフを 計算」 ボタンをクリックして、接続されたコンポジションのグラフを表示します。この結果は、グラフを完成させるために必要な9つの仮想ノードとのグリカン生合成の予想される連続性におけるいくつかのギャップを強調している(図7)。
- GlyConnect のホームページから HGI データセットを参照するには、記事のリファレンス ページである https://glyconnect.expasy.org/browser/references/2943 に直接アクセスします。
- GlyConnectで選択した血清タンパク質のO-グリコームとの比較
注:GlyConnectに保存されたデータによってギャップを埋められるかどうかを評価するために、参照とともにリストされた37のOグリコシル化タンパク質のうち1つが選択されました。データセットでは、インターアルファ-トリプシン阻害剤重鎖H4(Q14624)は、Thr-725上でO-グリコシル化されていることが報告されている。- GlyConnect Compozitor の [タンパク質] タブに移動します (手順 2.1.3 を参照)。タンパク質リストから、インターアルファ-トリプシン阻害剤重鎖H4を選択します。種の選択がデフォルトでホモ・サピエンスであることを確認します。グリカンタイプのNリンクの選択を解除します。最初にサイトの左側にあるマイナス記号をクリックしてすべてのサイトの選択を解除し、次にリストからThr-725のみを選択してから、サイトリストでThr-725のみを選択します。
- [選択範囲に追加]ボタンをクリックします(6つのコンポジションがThr-725に関連付けられていることに注意してください)。[グラフの計算] ボタンをクリックして、接続されたコンポジションのグラフを表示します (補足図 8)。
- 表示されたグラフを見ると、記事データセットの 20 個の O リンクされたコンポジションのうち 17 個のユニークなコンポジションが青色で表示され、データベース内の 6 個のコンポジションのうち 3 個の一意のコンポジションが赤色で表示されます。換言すれば、2つのソース間の重複は、マゼンタで表される3つの組成物中に存在する。グラフの45°回転が自動的に生成されることに注意してください。
メモ: 仮想ノードの数は 1 つ減ります。結局のところ、論文データセットの20のO結合組成物に欠損し、仮想ノードとして表されたH2N2S1は、データベース内のInter-α-トリプシン阻害剤重鎖H4のThr-725に関連する追加の組成物で満たされている。これにより、他の2つの仮想ノードはH1N2S1とH2N2S2の間のギャップを埋めるための代替オプションであったため、役に立たなくなるため、グラフのトポロジが簡素化されます。しかし、データベースからインポートされた2番目のコンポジションは、2つの新しい代替仮想ノードH2N2F1S1とH1N2F2S1の作成がなければ分離されます。 - 仮想ノードを理解するには、対応するコンポジションが GlyConnect に存在するかどうかを確認します。これを行うには、グラフの下にある [エクスポート] ボタンをクリックします。「 仮想 」を選択するには、他のすべてのオプションの選択を解除します。クリップボードアイコンをクリックして、8つのコンポジションの選択をコピーします。
- 選択範囲を Compozitor の [カスタム] タブのクエリウィンドウに貼り付けます。「グリカンタイプ」フィールドで「Oリンク」を選択します。「コンポジション」フィールドの「選択ラベル」を「VN」などに設定して、8 つのコンポジションのリストに名前を付けます。[選択範囲に追加] ボタンをクリックし、[コンピュート グラフ] ボタンをクリックします。すべての仮想ノードが緑色のノードとして表示されるようになりました(図8)。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
プロトコルの最初の部分(セクション1)は、GlyConnectプラットフォームを使用して、ヒト前立腺特異抗原(PSA)のAsn-69に結合したN-グリカンの特異性または共通性を調査する方法を示した。グリカン発現における組織依存性(尿および精液)、ならびにアイソフォーム依存性(正常および高pI)の変動を、2つの視覚化ツールを使用して強調した(図4および図5)。
まず、データベースに格納されているエンティティ間の関連付けを表示するGlyConnect Octopusは、(1)Octopusに表示される異なるエンティティを選択し 、(2 )リンクをクリックして関連するエントリを調べることによって、コンテキスト情報を探索する機会を提供しました。結果は、組織に依存した独特の関連であった。
第二に、もともと糖ペプチド同定のための組成物ファイルを定義/精製するために設計されたGlyConnect Compozitorは、2つの既知のPSAアイソフォーム(正常および高pI)におけるグリカン発現を評価するために使用された。各アイソフォームグリカムの比較により、4つのノード(組成物)を選別したよく接続されたグラフが生成され、そのうちの2つは高pIアイソフォームの特徴です。グリコームの重複は有意であるにもかかわらず、グリカン特性棒グラフは、共通から高pIアイソフォームへのシアリル化の低下を示した(補足図5)。
さらに、UniLectin3Dの探索では、ガレクチン-8がNeuAc(a2-3)Gal(b1-4)GlcNAc末端エピトープを有する多くの構造を含むため、PSAグリコームの可能性のあるリーダーとしてガレクチン-8が選ばれました。これは従うべきリードを提供し、最終的な証拠と見なすことはできません。それにもかかわらず、PSAとガレクチンは前立腺癌において不可欠な役割を果たすことが知られており29 、ガレクチン-8の特定の役割が最近強調されました30。プロトコールの最初の部分は、構造(グリコプロテオミクス)と機能(結合)データを相関させて、グリカンによって媒介されるタンパク質間相互作用の可能性のあるシナリオを確立する。
プロトコルの第2部(セクション2)では、特定の組織(ヒト血清)に関連する高品質のO-グリカン組成物のセットが検査され、GlyConnectデータベースの内容と比較され、それによって糖ペプチドの精製された同定のためにグリカン組成物ファイルをカスタマイズするオプションが提供された(図7 および 図8).1つのデータセットから入手できる20のコンポジションの最小セット(HGIチャレンジ結果)に依存することも、GlyConnectで合理的に収集された23〜26個のアイテムで強化してセットの一貫性を強化することもできます。
赤い | ライトオレンジ | 緑 | 水色 | 紫 | ピンク | 濃紺 | 褐色 | 濃いオレンジ |
種 | 蛋白質 | 組織ソース | 構造 | 組成 | 病気 | 参考 | グリコサイト | ペプチド |
表 1: GlyConnect データベースの各エンティティに関連付けられ、全体を通して有効な配色。
図 1: GlyConnect 用にインスタンス化されたGlyco@Expasyの依存関係ホイール。 この図の拡大版を表示するには、ここをクリックしてください。
図2:選択されたグリカン組成物の推奨グリカン構造。 同じ糖タンパク質を標的とするグリコプロテオーム実験のグリカン組成物についてのグリコミクス実験から示唆されたグリカン構造は、ここではヒト前立腺特異的抗原(PSA)、PSAについてのGlyConnectページで提案されている(ID:790)。 この図の拡大版を表示するには、ここをクリックしてください。
図3:PSAのGlyConnectページの右側のメニュー 他の主要なデータベースへのクリック可能な相互参照とPDB内の既存の3D構造のLiteMolグリカンプラグインで表示します。 この図の拡大版を表示するには、ここをクリックしてください。
図4:タンパク質とグリカンの間の組織依存的な関連を示すGlyConnect Octopusの出力。 クエリ Hybrid AND Sialylated は、これらの基準に一致するすべての組成物を返し、各組成物は、データベースに記録されたタンパク質およびグリカンに関する関連情報を互いにリンクします。デフォルトでは Species は ホモ・サピエンス に設定されていますが、このオプションは変更可能です。ここで、GlyConnect Octopusは、ハイブリッドおよびシアリル化グリカン構造(右ノード)を有するすべてのヒトタンパク質(左ノード)と、それらが発現している組織(センターノード)を表示する。(A)尿との関連は、2つのタンパク質を示す強調表示されている:チョリオゴナドトロピン(GLHA_HUMAN)およびPSA共通アイソフォーム(KLK3_HUMAN)は、散乱(不均一な)グリカン構造に接続される。(B)精液との関連が強調表示され、グループ化された(類似の)グリカン構造に接続されたPSA(KLK3_HUMAN)の2つのタンパク質アイソフォームを示す。 この図の拡大版を表示するには、ここをクリックしてください。
図5:PSAの2つのアイソフォームの重畳されたNグリカムを示すGlyConnect Compozitorの出力。 凝縮表記のコンポジションは各ノードにラベルを付けます。共通アイソフォームに関連するグリカンは青色のノードとして表され、高pIアイソフォームのグリカンは赤色のノードとして表される。グリカム間のオーバーラップは、マゼンタノードとして表示されます。ノード内の数字は、PSAに関するGlyConnectデータベースの内容に応じて標識された組成と一致するグリカン構造の数を表す。示されているCompozitorグラフは、D3.jsライブラリによって生成されるネットワークを解きほぐすために、生の出力からわずかに変更されています。これは、ユーザーが望む場所であればどこでもブラウザウィンドウスペースに任意のノードをドラッグすることができ、パスを短縮または拡張できるため、簡単に実行できます。ユーザーは、右上隅の [ズームオン] フィールドに特定のコンポジションを入力して、グラフをズームインし、対応するノードの中央に配置できます。 この図の拡大版を表示するには、ここをクリックしてください。
図6:NeuAc(a2-3)Gal(b1-4)GlcNAc結合の詳細を有するヒトガレクチン-8の要約エントリ。 緑色の [3D 構造と情報の表示] ボタン (赤い楕円で表示) をクリックすると、新しいページが開き、残留物の相互作用に関するクローズアップが PLIP アプリケーションに表示されます (赤い矢印で示されます)。 この図の拡大版を表示するには、ここをクリックしてください。
図7:HGIチャレンジのヒト血清高信頼度データセットのOグリコームを示すGlyConnect Compozitorの出力。 仮想ノード(テキストを参照)がなければ、そのグラフの接続性は低くなります。 この図の拡大版を表示するには、ここをクリックしてください。
図8:GlyConnectデータベースコンテンツを使用した、HGIチャレンジのヒト血清高信頼度データセットのOグリコームの完了の可能性を示すGlyConnect Compozitorの出力。 Compozitor の [ カスタム ] タブを使用して GlyConnect データベース全体のコンテンツにアクセスすると、仮想ノードに対応するコンポジションが、ノードラベルで強調表示されている既存の定義済み構造にマップされていることがわかります。ノードサイズは、データベースに格納され、対応する構成を報告する参照の数を表します。ノードの数値ラベルは、GlyConnect に格納されている対応する構造体の数を示します。選択したコンポジションは、データベース内で 0 ~ 18 個の一致候補があるように見えます。実際、これらのノードは、実験データセットの内容を反映するものとしてのみ仮想です。グラフ内の情報を絞り込んで、これらの追加ノードのリアリズムをテストすることをお勧めします。 この図の拡大版を表示するには、ここをクリックしてください。
補足図1:Glyco@Expasyホームページのバブルチャート Glyco@Expasyのホームページのバブルチャートを拡大して、 糖タンパク質 のカテゴリに焦点を合わせます。ソフトウェアは緑色のバブルで表示され、データベースは黄色のバブルで表示されます。バブルをクリックすると、リソースの目的が要約されます。 このファイルをダウンロードするには、ここをクリックしてください。
補足図 2: 構成に応じてクエリに一致するタコが取得した関連付け。 ハイブリッドおよびシアリル化グリカン構造(右ノード)を運ぶヒトタンパク質(左ノード)のデフォルトのGlyConnect Octopusディスプレイと、一致する組成物(中央ノード)。組成H6N4F12S1は、両方のPSAアイソフォーム(KLK3_HUMAN)に特異的に見える。一意の構造ID(10996)をクリックすると、対応するページが開き、2つのアイソフォームが実際にこの特定のグリカンを保持する唯一のタンパク質であることを示す詳細が表示されます。 このファイルをダウンロードするには、ここをクリックしてください。
補足図 3: 病気に応じてクエリに一致するタコの検索された関連付け。 GlyConnect Octopusは、ハイブリッドおよびシアリル化グリカン構造(右ノード)とそれらが発現している疾患(センターノード)を有するすべてのヒトタンパク質(左ノード)の表示。前立腺癌との関連は、PSAの共通のアイソフォームを示す強調表示されている(KLK3_HUMAN)。 このファイルをダウンロードするには、ここをクリックしてください。
補足図4:組織情報に応じてクエリに一致するタコが取得した関連付け。 NeuAc(a1-3)Gal(b1-4)GlcNAcモチーフ(右節)を含むバイアンテナグリカン構造を持つすべてのヒトタンパク質(左節)とそれらが発現している組織(中心節)のGlyConnectタコ表示。精液との関連が強調表示され、PSA(KLK3_HUMAN)の共通のアイソフォームと7つの構造のみを示しています。 このファイルをダウンロードするには、ここをクリックしてください。
補足図5:PSAの2つのアイソフォームの重畳されたNグリカムを示すGlyConnect Compozitorの出力。 凝縮表記のコンポジションは、各ノードにラベルを付けます。共通アイソフォームに関連するグリカンは青色のノードとして表され、高pIアイソフォームのグリカンは赤色のノードとして表される。グリカム間のオーバーラップは、マゼンタノードとして表示されます。ノード内の数字は、PSAに関するGlyConnectデータベースの内容に応じて標識された組成と一致するグリカン構造の数を表す。グリカン特性の棒グラフの上にマウスを置くと、周波数とノードとの対応関係がオレンジ色の泡として表示されます。ほぼすべてのPSA共通アイソフォームノードがカバーされています。この周波数は、高pIアイソフォームでは低下する。 このファイルをダウンロードするには、ここをクリックしてください。
補足図6:UniLectin3Dにおけるグリカン検索インターフェース。 シアル酸SNFG記号(赤色で丸で囲まれた部分)をクリックすると、UniLectin3Dに保存されているNeuAcを含むすべてのリガンドの検索が開始されます。 このファイルをダウンロードするには、ここをクリックしてください。
補足図7:NeuAcを含む全てのリガンドについての検索の出力の抜粋。 関心のあるNeuAc(a2-3)Gal(b1-4)GlcNAcモチーフは赤で囲まれています。 このファイルをダウンロードするには、ここをクリックしてください。
補足図 8: GLYConnect データセットの O グリコームを GlyConnect のデータセットと重ね合わせた GlyConnect Compozitor の出力。 参照と共に列挙された37のうち1つのOグリコシル化タンパク質のOグリコームと重ね合わせた青色のHGIチャレンジのヒト血清高信頼度データセットのOグリコームを示すGlyConnect Compozitorの出力、すなわち、GlyConnectに含まれる付加情報を有するα−トリプシン阻害剤重鎖H4間。これにより、グラフの接続性が向上します。 このファイルをダウンロードするには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
予期せぬ相関関係を明らかにするためのツールとしてのGlyConnectタコ
GlyConnect Octopusはもともと、グリカンの緩やかな定義でデータベースを照会するように設計されています。実際、文献はしばしば、フコシル化またはシアリル化されている、2つ以上のアンテナで作られているなど、グリコーム中のグリカンの主な特徴を報告している。さらに、N結合型かO結合型かのグリカンはコアに分類され、参照マニュアルEssentials of Glycobiology1に詳述されているように、これもしばしば公開された論文で引用されている。最後に、血液型抗原などのグリカンエピトープは、構造において求められるさらに別の特性であり、グリカンをタイピングするために潜在的に選択される。最終的には、特定の組織または選択された種で発現されるグリコームの共通または別個の特性を探索することが適切であり得る。その意味で、収集した情報は、固有の事実ではなく、新たな前提の源泉として活用すべきである。
グリカン組成物セットを成形するためのツールとしてのGlyConnect Compozitor
タンパク質ページに記載されている構造情報の閲覧には、リストが項目化された構造間の関係や組成物間の関係を不明瞭にする傾向があるため、制限があります。GlyConnect Octopusは前者に、GlyConnect Compozitorは後者に出席します。ほとんどの GlyConnect エントリにリストされている構造を注意深く見ると、共通の下部構造の存在が明らかになります。しかし、この情報は、熱心な視聴者の助けを借りずに視覚的に把握することは容易ではありません。
糖ペプチド同定ソフトウェアの重要なパラメータとしてグリカン部分の同定を支持する糖鎖組成ファイルの内容は、HGIチャレンジの結果を分析することによって確立された。ほとんどの古典的なプロテオミクス検索エンジンは、データベース/リポジトリまたは文献に収集されたデータから派生したコレクションからのグリコベースの修飾の選択を収容する。他のグリコプロテオミクス専用ツールは、グリカン生合成の知識を使用しています。このようにして、組成物ファイルは、理論的には、期待される酵素活性の結果として定義される。結局のところ、検索エンジンの数だけの合成ファイルがあり、それらの間の重複は非常に可変です。それにもかかわらず、プロテオミクスにおける過去の経験から学ぶと、特に翻訳後修飾が考慮される場合、検索エンジンの性能は検索空間の制限と相関していることが明らかになる31。同様の観察がグリコプロテオミクスでも行われており、GlyConnect Compozitorは教育された組成データ選択をサポートするように設計されており、その重要性は以前に議論されました32。
このツールの使い方は、プロトコルでは、特にAPI(アプリケーションプログラミングインターフェイス)を介してGlyConnectへのプログラムによるアクセスを直接起動するクエリを表現できる[詳細設定]タブに関して、不完全に説明されていました。たとえば、[詳細設定] タブのクエリ ウィンドウに taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer と入力すると、[ソース] タブ ([種] で [ホモ サピエンス]、[組織内の尿]、[グリカン タイプ] で N リンクを選択) と [疾患] タブ ([種] で [ホモ サピエンス] を選択) で対応するフィールドに入力することと同じです。 前立腺癌は疾患で、N連鎖型ではグリカン型)。つまり、複数の選択を必要とする結果を 1 つのステップで提供します。
最後に、仮想ノードの作成についてはプロトコルで説明されていますが、潜在的な冗長性には追加のコメントが必要です。グラフ内の酵素のシミュレートされた作用は酵素活性の年表を考慮していないため、2つの同時選択は区別できない場合があります。そのため、Compozitor は 2 つの仮想ノードを通る 2 つのパスを提案し、最大 2 つの違いを持つ単糖カウントに対応する 2 つの未接続ノードをブリッジします。新しいデータを含めると、多くの場合、欠落しているリンクが発生します。ユーザーは、[仮想ノードを含める] ボックスにチェックマークを付けずに、仮想 ノード をいつでも自由に検討または却下できます。
既知のデータベースとソフトウェアの制限事項
全体として、Web上の他のナビゲーションと同様に、上記のプロトコルは、多くの場合、サイトの更新または2つのサイト間の更新の競合のために、存在しないページにつながることがあります。この場合、そして実際には、ナビゲーションが流れていないすべてのケースでは、最も簡単なのは、過去28年間のポータルの成功に大きく貢献した効率のExpasyヘルプデスクにメモを送信することです。
GlyConnectの内容は、文献における電流の不均衡の反映として偏っている。出版物の大部分は哺乳類におけるN-グリコシル化を報告しており、データベースはヒトN-糖タンパク質でより豊富である。それにもかかわらず、私たちは過去に、あまり一般的ではないデータセットを含め、アドバイスや提案を受けることに完全にオープンであり続けるよう求められてきました。
また、Compozitor は現在、3 つの合成データセットの比較に限定されています。Octopusの 「決定要因」 サブタブの大幅な改訂が計画されています。Glyco@Expasyのリソースは定期的な更新を必要とし、一部はやがて実行されない可能性があります。それにもかかわらず、警告および/またはアナウンスは、それが起こると公開されます。
GlyGen (https://www.glygen.org) および GlyCosmos (https://www.glycosmos.org) として知られるパートナーポータルは、さまざまなオプションとツールを提供します。最終的に、どちらのオプションでも情報の閲覧と検索には高いレベルの主観性が必要であり、ユーザーの習慣や懸念に大きく依存します。私たちのソリューションがコミュニティの一部に適していることを願うだけです。
グリコサイエンスのインプットはライフサイエンスプロジェクトで増加しており、健康問題におけるグリカンの役割を確立する研究は継続的に生産されています。Sars-Cov-2への最近の焦点は、特に構造的アプローチにおけるグリコシル化タンパク質の重要性を再び明らかにした33。グリコインフォマティクスは、データ分析と解釈の日々のタスクで糖鎖科学者をサポートしています。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者らは利益相反がないと宣言しています。
Acknowledgments
著者は、このチュートリアルで使用されるリソースの開発に関与したProteome Informatics Groupの過去と現在のメンバー、特にGlyConnectのJulien MariethozとCatherine Hayes、UniLectinのFrançois Bonnardel、OctopusのDavide Alocci、Frederic Nikitin、CompozitorのThibault Robin、そしてOctopusのファイナルタッチを暖かく認めています。
glyco@Expasyプロジェクトの開発は、教育、研究、イノベーションのための国家事務局(SERI)を通じてスイス連邦政府によって支援され、現在はスイス国立科学財団(SNSF:31003A_179249)によって補完されています。ExPASyはスイスのバイオインフォマティクス研究所によって管理され、Vital-IT Competency Centerでホストされています。著者はまた、ANR PIA Glyco@Alps(ANR-15-IDEX-02)、Alliance Campus Rhodanien Co-fund (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003)が共同で支援するUniLectinプラットフォームにおける優れた協力について、Anne Imbertyに謝意を表します。
Materials
Name | Company | Catalog Number | Comments |
internet connection | user's choice | ||
recent version of web browser | user's choice |
References
- Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
- Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
- Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
- Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
- Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
- York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
- Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
- Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
- Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
- Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
- Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
- Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
- Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
- Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
- The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
- Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
- Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
- Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
- Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
- Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
- Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
- Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
- wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
- Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
- Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
- Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
- Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
- Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
- Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
- Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
- Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
- Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
- Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).