Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

משאבי ביואינפורמטיקה לחקר אינטראקציות חלבון בתיווך גליקן

Published: January 20, 2022 doi: 10.3791/63356

Summary

פרוטוקול זה ממחיש כיצד לחקור, להשוות ולפרש גלייקום חלבון אנושי באמצעות משאבים מקוונים.

Abstract

היוזמה Glyco@Expasy הושקה כאוסף של מסדי נתונים וכלים תלויים זה בזה המשתרעים על פני מספר היבטים של ידע בגליקוביולוגיה. בפרט, הוא שואף להדגיש אינטראקציות בין גליקופרוטאין (כגון קולטני פני התא) וחלבונים מחייבי פחמימות בתיווך הגליקנים. כאן, משאבים עיקריים של האוסף מוצגים באמצעות שתי דוגמאות להמחשה שבמרכזן N-גליקום של האנטיגן הספציפי לערמונית האנושית (PSA) וה- O-גליקום של חלבוני סרום אנושיים. באמצעות שאילתות מסד נתונים שונות ובעזרת כלי תצוגה חזותית, מאמר זה מראה כיצד לחקור ולהשוות תוכן ברצף כדי לאסוף ולתאם פיסות מידע מפוזרות אחרת. נתונים שנאספו נועדו להאכיל תרחישים משוכללים יותר של פונקציית הגליקאן. גליקוינפורמטיקה שהוצגה כאן מוצעת, אם כן, כאמצעי לחזק, לעצב או להפריך הנחות על הספציפיות של גליקום חלבון בהקשר נתון.

Introduction

גליקנים, חלבונים שאליהם הם מחוברים (גליקופרוטאין) וחלבונים שאליהם הם נקשרים (לקטינים או חלבונים מחייבי פחמימות) הם השחקנים המולקולריים העיקריים במשטח התא1. למרות תפקיד מרכזי זה בתקשורת תאית, מחקרים בקנה מידה גדול, כולל גליקומיקה, גליקופרוטומיקה או נתוני גליקן-אינטראקציה עדיין נדירים בהשוואה למקבילם בגנומיקה ובפרוטאומיקה.

עד לאחרונה, לא פותחו שיטות לאפיון המבנים המסתעפים של פחמימות מורכבות ועדיין להיות מצומדים לחלבון המוביל. הביוסינתזה של הגליקופרוטאינים היא תהליך שאינו מונחה תבנית שבו התורמים המונו-סכרידים, מצע הגליקופרוטאין המקבל, והגליקוסילשילטרפרנספראזים והגליקוזידסים ממלאים תפקיד אינטראקטיבי. הגליקופרוטאינים המתקבלים יכולים לשאת מבנים מורכבים עם נקודות הסתעפות מרובות שבהן כל רכיב מונו-מכריד יכול להיות אחד הסוגים השונים הקיימים בטבע1. התהליך שאינו מונחה תבנית מטיל ניתוח ביוכימי כאפשרות היחידה ליצירת נתונים מבניים אוליגוסכרידים. התהליך האנליטי של מבני הגליקנים המחוברים לחלבון מקומי הוא לעתים קרובות מאתגר מכיוון שהוא דורש טכנולוגיות רגישות, כמותיות וחזקות כדי לקבוע הרכב מונוסכריד, הצמדות ורצפי הסתעפות2.

בהקשר זה, ספקטרומטריית מסה (MS) היא הטכניקה הנפוצה ביותר בניסויים בגליקומיקה ובגליקופרוטומיקה. ככל שהזמן עובר, אלה מתבצעים בהגדרות תפוקה גבוהות יותר ונתונים מצטברים כעת במסדי נתונים. מבני גליקן בפורמטים שונים3, מאכלסים את GlyTouCan4, מאגר נתוני הגליקאן האוניברסלי שבו כל מבנה משויך למזהה יציב ללא קשר לרמת הדיוק שבה מוגדר הגליקן (למשל, אולי סוג הצמדה חסר או הרכב מעורפל). מבנים דומים מאוד נאספים אך ההבדלים הקטנים ביניהם מדווחים בבירור. גליקופרוטאינים מתוארים ואוצרים ב- GlyConnect5 וב- GlyGen6, שני מסדי נתונים המצליבים זה את זה. נתוני טרשת נפוצה התומכים בפיסות מבניות של ראיות מאוחסנים יותר ויותר ב- GlycoPOST7. לכיסוי רחב יותר של משאבים מקוונים, פרק 52 של מדריך העיון, יסודות הגליקוביולוגיה, מוקדש לגליקוינפורמטיקה8. מעניין, תוכנת זיהוי גליקופפטיד התרבה בשנים האחרונות9,10 אם כי לא לטובת רבייה. הדאגה האחרונה גרמה למנהיגי יוזמת HUPO GlycoProteomics (HGI) להציב אתגר תוכנה בשנת 2019. נתוני הטרשת הנפוצה שהתקבלו מעיבוד תערובות מורכבות של חלבוני סרום אנושיים N-ו-O-גליקוסיליים במצבי פיצול CID, ETD ו- EThcD, היו זמינים למתחרים בין אם משתמשי תוכנה או מפתחים. הדו"ח המלא על תוצאות האתגר הזה11 מפורט רק כאן. ראשית, נצפתה התפשטות של זיהויים. זה התפרש בעיקר כנגרם על ידי מגוון השיטות המיושמות במנועי חיפוש, של ההגדרות שלהם, וכיצד תפוקות סוננו, ופפטיד "נספר". העיצוב הניסיוני עשוי גם לשים כמה תוכנות וגישות ביתרון (dis).. חשוב לציין, המשתתפים שהשתמשו באותה תוכנה דיווחו על תוצאות לא עקביות, ובכך הדגישו בעיות רבייה חמורות. זה היה סיכם על ידי השוואת הגשות שונות כי פתרונות תוכנה מסוימים לבצע טוב יותר מאחרים וכמה אסטרטגיות חיפוש להניב תוצאות טובות יותר. משוב זה עשוי להנחות את השיפור של שיטות ניתוח נתונים אוטומטיות של גליקופפטיד וישפיע בתורו על תוכן מסד הנתונים.

התרחבות הגליקוינפורמטיקה הובילה ליצירת פורטלי אינטרנט המספקים מידע וגישה למספר משאבים דומים או משלימים. האחרונים והעדכניים ביותר מתוארים בפרק של סדרת הספרים המקיף Glycoscience12 ובאמצעות שיתוף פעולה, פתרון לשיתוף נתונים והחלפת מידע מוצע במצב גישה פתוחה. פורטל אחד כזה פותח אשר נקרא במקור Glycomics@ExPASy 13 ושמו שונה Glyco@Expasy, בעקבות השיפוץ הגדול של פלטפורמת Expasy14 שאירחה אוסף גדול של כלים ומאגרי מידע המשמשים על פני מספר - omics במשך עשרות שנים, הפריט הפופולרי ביותר הוא UniProt15 - מאגר הידע חלבון אוניברסלי. Glyco@Expasy מציעה גילוי דידקטי של המטרה והשימוש במסדי נתונים וכלים, המבוססים על סיווג חזותי ותצוגה של התלות ההדדית שלהם. הפרוטוקול הבא ממחיש נהלים לחקור נתוני גליקומיקה וגליקופרוטאומיקס עם מבחר משאבים מפורטל זה שהופך את החיבור בין גליקופרוטומיקה לאינטראקטיביות גליקנית מפורשת באמצעות גליקומוניקה. כפי שהוא, ניסויים גליקומוניקה לייצר מבנים שבהם monosaccharides מוגדרים באופן מלא וקישורים באופן חלקי או מלא נקבע, אבל הקובץ המצורף לאתר החלבון שלהם הוא מאופיין בצורה גרועה, אם בכלל, מאופיין. לעומת זאת, ניסויים בגליקופרוטאומיקה מייצרים מידע מדויק על קובץ מצורף לאתר, אך עם רזולוציה ירודה של מבני גליקאן, המוגבלים לעתים קרובות להרכבי מונוסכרידים. מידע זה מחובר יחד במסד הנתונים של GlyConnect. יתר על כן, כלי חיפוש ב- GlyConnect יכולים לשמש כדי לזהות ליגנדים גליקנים פוטנציאליים המתוארים יחד עם החלבונים המזהים אותם ב- UniLectin16, המקושרים ל- GlyConnect באמצעות גליקנים. הפרוטוקול המוצג כאן מחולק לשני חלקים כדי לכסות שאלות ספציפיות לגליקנים וגליקופרוטינים הקשורים ל- N ו- O הקשורים ל- O.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

הערה: נדרש התקן עם חיבור לאינטרנט (מסך גדול יותר מועדף) ודפדפן אינטרנט עדכני כגון Chrome או Firefox. ייתכן שהשימוש ב-Safari או ב-Edge אינו אמין באותה מידה.

1. מחלבון N-גליקום בגלי-קונקט ועד לציטין של UniLectin

  1. גישה למשאבים Glyco@Expasy
    הערה: ההליך המתואר כאן הוא לגשת ל- GlyConnect אך ניתן להחיל אותו על גישה לכל משאב שנרשם בפלטפורמה.
    1. עבור אל https://glycoproteome.expasy.org/glycomics-expasy ושקול את תרשים הבועות מימין המציג קטגוריות שונות כגון Glycoconjugates או Glycan Binding. בתפריט השמאלי ביותר המשקף את הקטגוריות בבועות, סמן את התיבה גליקופרוטאינס כך שתרשים הבועות מימין יתקרב מיד לבועה התואמת לקטגוריה זו.
      הערה: בועות ירוקות הן כלים ובועות צהובות הן מסדי נתונים. לחיצה על כל אחד מהם מגדילה שוב כדי לספק פרטים על המשאב. לפני שתעשה זאת, ייתכן שהמשתמש ירצה להבין את יחסי התלות של משאב זה לאחרים.
    2. כדי לקבל את המידע אודות יחסי תלות, עבור מהכרטיסיה סיווג נושאי משאבים לכרטיסיה גלגל תלות במשאבים . הנח את העכבר על GlyConnect בגלגל כדי לבדוק את רמת האינטגרציה שלו עם מקורות אחרים (איור 1).
    3. חזור לכרטיסיה סיווג נושאי משאבים כדי להגיע לבועת GlyConnect כמו בשלב 1.1.1 ולחץ עליה (איור משלים 1) כדי להציג את דף הבית של GlyConnect בכרטיסיה חדשה המציגה את הסטטיסטיקה של התוכן במהדורה האחרונה של מסד הנתונים.
      הערה: ערכת צבעים המפורטת בטבלה 1 תואמת לסוגי המידע השונים המאוחסנים במסד הנתונים. קוד צבע זה חוקי בכל דפי הישות ב- GlyConnect והוא עקבי לאורך כל הדרך. דף הבית מציג גם ארבעה חלקים המוקדשים לערכות נתונים ממוקדות כגון אלה המתארים את הגליקוזילציה של חלבון ספייק Sars-Cov-2 (COVID-19) או פירוט נרחב של אוליגוסכרידים של חלב אנושי (קופת חולים). אלה לא ייחקרו בפרוטוקול זה.
  2. חקר המידע ההקשרי של חלבון N-גליקום
    הערה: כל מבני הגליקאן ב- GlyConnect מוצגים בשלוש תבניות חלופיות ונפוצות: (1) מינוח סמלים לגליקנים (SNFG)17 (2) IUPAC מרוכז18ו-(3) אוקספורד,19. לעומת זאת, אין סימון סטנדרטי לבטא הרכב גליקן. ב- GlyConnect, הקוד הבא משמש: כישוף עבור כישוף, HexNAc עבור N-אצטילהקסוזאמין, dHex עבור fucose, ו NeuAc עבור חומצות סיאליות. למען הפשטות, כלים חזותיים מסתמכים על סימון מרוכז: H עבור כישוף, N עבור N-אצטילהקסוזאמין, F עבור fucose, ו- S עבור חומצות סיאליות. בנוסף, אותיות קטנות לייעד שינויים כגון "א" עבור אצטילציה, "p" עבור זרחן, ו "s" עבור גופרית, עבור הנפוצים ביותר של אלה מה שנקרא מרכיבים.
    1. כדי להציג ולחקור את N-glycome של אנטיגן ספציפי לערמונית אנושית (PSA), מדף הבית של GlyConnect, המשך כדלקמן.
      הערה: הגליקוזילציה של PSA אנושי נחקרה לאורך השנים, במיוחד בהקשר של סרטן הערמונית. מסד הנתונים של GlyConnect מאחסן שלוש הפניות20,21,22, המשלבות נתוני גליקומוניקה וגליקופרוטומיקה. שים לב כי התוצאות שסופקו כאן הושגו עם שחרור ספטמבר 2021 של GlyConnect. שימוש Ulterior במסד הנתונים עשוי להניב סטטיסטיקות שונות במקצת עקב עדכוני נתונים תכופים.
    2. בחר את לחצן חלבון כדי לפתוח את תצוגת החלבון של מסד הנתונים. בדף תצוגת החלבון, הקלד ערמונית בחלון החיפוש. חפש את שני הערכים המפורטים בפלט המבדילים בין שני איזופורמים של PSA עם ערכי pI נפרדים. לחץ על 790 (עמודת מזהה) המתאים לאיזופורם המשותף של PSA.
      הערה: חפש את הסרגל הצבעוני העליון המציג מידע סיכום שחולץ מהעבודה שפורסמה בערכה המפורטת לעיל. מספר אפשרויות לניווט אפשריות כמתואר להלן.
    3. בסרגל הצבעוני העליון, לחץ על לחצן SOURCE בירוק כדי להציג את סוגי המדגם שמהם עובדו הנתונים שפורסמו: שתן ונוזל הזרע. כדי לעיין במידע זה עוד יותר, לחץ על אחד מסוגי דוגמאות אלה. כנ"ל לגבי כל פריט שמופיע בעת לחיצה על לחצן צבעוני.
    4. כדי לבדוק את התוכן הקשור לבריאות של מסד הנתונים, לחץ על כפתור המחלה , המכיל שני פריטים, שאחד מהם הוא סרטן הערמונית המקשר לדף המחלה הייעודי המתאים ב- GlyConnect. הסיכום של אותו דף מראה כי שלושה מחקרים בקנה מידה גדול דיווחו על 319 קומפוזיציות ב -1,087 אתרים שנמצאו ב -308 חלבונים אנושיים.
    5. לחץ על כפתור מבנה כדי להציג את הרשימה המלאה של 135 מבנים הקשורים PSA מנתוני גליקומוניקס. לחץ על כפתור COMPOSITION עבור 78 הקומפוזיציות המשויכות שנקבעו על ידי ניסויים בגליקופרוטאומיקה. לחץ על כל מבנה או קומפוזיציה כדי לקבל פרטים נוספים.
      הערה: ניתן לקבל פרטים כגון רשימת החלבונים האלטרנטיביים הנושאים את המבנה המסוים או רשימת המבנים התואמים להרכב. PSA ידוע שיש רק אתר N-glycosylation אחד ב Asn-69 (רק פריט אחד נספר עבור כפתור האתר החום).
    6. כדי להפחית את העמימות של קומפוזיציות, לחץ על STRUCT מוצע מתחת לקומפוזיציה שנבחרה (לדוגמה, Hex:6 HexNAc:3 NeuAc:1). בכל פעם שספירת המונו-סוכרים עולה בקנה אחד עם זו של מבנה המפורט לעיל (איור 2).
      הערה: הקומפוזיציה Hex:6 HexNAc:3 NeuAc:1 שנוצרה על ידי ניסוי גליקופרוטומיקה מותאמת לארבעה מבנים ברזולוציה גבוהה יותר מנתוני הגליקום. במקרה של PSA, אין אי בהירות האתר לפתור מאז רק Asn-69 הוא גליקוסילציה.
    7. כדי לחקור באופן מלא את דף החלבון, עיינו בפרטים נוספים בצד השמאלי של הדף (איור 3).
      1. הצג את ערך ברירת המחדל של 3QUM PDB (מאגר נתוני חלבון23) עבור PSA המוצג עם שני גליקנים מורכבים המחוברים לכל מונומר (איור 3) או את ערך 2ZCK החלופי, הזמין גם בגלל פחמימה מצורפת. הרישום השני מראה שרשרת אחת.
        הערה: שני הערכים מוצגים באופן חזותי עם תוסף 3D LiteMol24 המציג גליקנים בסימון SNFG-3D שאומצו ב- PDB-RCSB.
      2. לחץ על הקישורים המתאימים של הפניות מקושרות אחרות כדי לחקור מידע פונקציונלי רלוונטי ממסדי נתונים מרכזיים של פרוטאומיקה, כגון UniProt (איור 3).
  3. הדמיה והתאמה של המידע ההקשרי של חלבון N-גליקום
    הערה: כפי שניתן לראות בסעיף הקודם, רשימות ארוכות של מבנים או קומפוזיציות יכולות להיות קשות לתפיסה בכללותה ו- GlyConnect מסתמך על שני כלים שונים כדי להמחיש מידע מרכזי, כלומר, תמנון GlyConnect ו- GlyConnect Compozitor (הראשון מרחיב את מידע הסיכום שנלכד בלחצנים צבעוניים והשני מוציא יחסי תלות מבניים במונחים של מבנה / קומפוזיציה הכלולים באחר). כפי שמודגם להלן, GlyConnect Octopus בוחן קשרים בין הישויות השונות המאוחסנות במסד הנתונים באמצעות הדגשת חיבורים מרובים או בודדים כהשתקפות של תוכן מסד הנתונים.
    1. בצע חיפוש תמנון GlyConnect כדי לאשר את נוכחותם של תכונות מבניות נפוצות כגון מבני ליבה היברידית ומבנים המכילים חומצה סיאלית תכופים מאוד במגוון הגליקנים המחוברים ל- PSA, כמתואר להלן.
    2. עבור אל דף הבית של התמנון https://glyconnect.expasy.org/octopus/. השאר את הכרטיסיה מקושרת N מסומנת כברירת מחדל. עבור אל תת-הפעילות Cores ולחץ על הסמל היברידי . עבור אל תת-הפעיל מאפיינים ולחץ על הסמל Sialylated . לחץ על לחצן החיפוש הירוק להלן.
      הערה: תוצאות החיפוש מוצגות באופן גרפי כקשרי גומלין בין שלוש קטגוריות של פריטים. כברירת מחדל, הרשימה המרכזית תואמת לשאילתה עבור קומפוזיציות, האוסף השמאלי משתרע על פני חלבונים קשורים, והרשימה הימנית משתרעת על פני גליקנים קשורים.
    3. בגרף המוצג של מערכות יחסים, רחף מעל H6N4F1S1 כדי להדגיש קישורים לשישה חלבונים ושלושה מבנים. ניגוד זה על ידי ריחוף מעל H6N4F2S1 המבודד את שני האיזופורמים של PSA (שניהם מכונים מזהה UniProt: KLK3_HUMAN) ומבנה אחד (מזהה: 10996). רחף מעל מזהה המבנה כדי להציג את ייצוג ה-SNFG שלו ולחץ עליו כדי לפתוח את הדף המתאים (איור משלים 2).
    4. שנה את הצמתים של התמנון לכל נושא אחר המתאר את ההקשר של הגליקוזילציה. קוד הצבע נשאר זהה לזה שתואר קודם לכן (ראה טבלה 1).
      1. שנה את צמתי המרכז לרקמות כדי להציג 15 אפשרויות באמצע הגרף, שרבות מהן הן נוזלי גוף. חפש את כל האסוציאציות בין חלבונים וגליקנים התואמים את השאילתה בהתאם למידע על רקמות. מקם את הסמן על שתן או נוזל הזרע באמצע הגרף כדי להציג אסוציאציות שונות (איור 4A, B).
      2. שנה את צמתים מרכזיים למחלה כדי להציג 13 אפשרויות, שאחת מהן היא סרטן הערמונית. החלבון היחיד המשויך הוא PSA (KLK3_HUMAN) (איור משלים 3).
        הערה: מבט מקרוב על PSA N-glycome המוצג בדף החלבון מציין את התדירות הגבוהה מאוד של NeuAc מסוף (a?-?) גל(ב?-?) מבנה משנה GlcNAc במקרים רבים על מבנים עם שתיים או שלוש אנטנות. תמנון אחר יכול להיווצר על בסיס זה כמתואר להלן.
    5. לחץ על לחצן נקה כדי לרענן את החיפוש. עבור אל תת-הכותרת מאפיינים ולחץ על סמל Bi-antennary . עבור אל תת-הפעולה דטרמיננטים ולחץ על סמל 3-Sialyl-LN (סוג 2). לחץ על לחצן החיפוש הירוק להלן.
    6. בדוק את האסוציאציות שאוחזרו על ידי תמנון עם גליקנים דו-אנטנטיים המכילים מוטיב מסוף 3-Sialyl-LN (סוג 2), כלומר, NeuAc(a1-3)Gal(b1-4)GlcNAc. שנה את צמתי המרכז לרקמות לקריאה קלה יותר וריחוף מעל KLK3_HUMAN כדי לחבר ישירות נוזל הזרע עם איזופורם משותף של PSA ושבעה מבנים (איור משלים 4).
      הערה: כלי ההדמיה השני, GlyConnect Compozitor, מבצע סריקה של קשרים פוטנציאליים בין כל קומפוזיציה ברשימה שלהם (ראה להלן). קשר גומלין מוגדר כשונה ממונוסכריד אחד בלבד בין שתי קומפוזיציות. קשרים מזוהים אלה המותווים בגרף חושפים את ההמשכיות (dis) של גליקום.
    7. השתמש ב- GlyConnect Compozitor כדי לבצע סריקה של קשרי גומלין פוטנציאליים בין כל קומפוזיציה ברשימתם, כפי שמודגם להלן במקרה של PSA.
      הערה: GlyConnect Compozitor מעבד קומפוזיציות בשיתוף עם הקשר. הוא מציע כרטיסיות נפרדות עבור שאילתה GlyConnect, למשל, חלבונים, מקורות, קווי תאים, מחלות כי הם מובנים עצמית כדי להכשיר הקשר. זה מאויר כאן עם PSA כדלקמן.
    8. חזור לדף החלבון של PSA: https://glyconnect.expasy.org/browser/proteins/790. בצד ימין של דף הערך של PSA, לחץ על הקישור Compozitor. ודא ששדות החיפוש של Compozitor מלאים מראש בפרטי ערך ID 790 בכרטיסיית החלבון (חלבון: אנטיגן ספציפי לערמונית, מינים: הומו סאפיינס וסוג גליקן: N-מקושר).
    9. לחץ על לחצן הוסף לבחירה כדי לאחזר נתונים ממסד הנתונים ולהציג את הגרף של קומפוזיציות מחוברות. בטלו את הבחירה באפשרות 'כלול צמתים וירטואליים '. לחץ על לחצן מחשוב גרף כדי להציג גרף המציג קבוצה מחוברת היטב של 78 קומפוזיציות המייצגות את PSA N-glycome, ועלילת עמודות המציגה את המאפיינים העיקריים של הגליקנים.
    10. רחף מעל הפס הסגול בחלקת הסרגל, המאתרת את כל המבנים הסיילציה בגרף כדי לחשוף הטיה נצפית כלפי מבנים סיילציה.
    11. הישארו בכרטיסייה הראשית של החלבון ובחרו אנטיגן ספציפי לערמונית - איזופורם פאי גבוה (פסה) בשדה חלבון (שם).
      הערה: השדות 'סוג הגליקאן' ו'אתר הגליקאן' מתמלאים באופן אוטומטי.
    12. לחץ על לחצן הוסף לבחירה כדי לאחזר נתונים ממסד הנתונים שמסתכמים ב- 57 קומפוזיציות. לחץ על כפתור חישוב גרף כדי ליצור את הגרפים על גבי שני isoforms ולהעריך את ההבדלים גליקומים של שני איזופורמים PSA. רחף מעל תוויות צמתים כדי להציג את מספר המבנים המתאימים לקומפוזיציות/תוויות (איור 5).
  4. מידע מחייב גליקן ב- UniLectin
    הערה: זכור את הדטרמיננט שנבדק בתמנון, המתואר כ- NeuAc (a2-3)Gal(b1-4). בהגדרה, זהו חלק איגוד מבוסס של מבנה גליקן, וככזה, ניתן לחפש במסד הנתונים UniLectin3D25.
    1. עבור אל https://www.unilectin.eu/ ולחץ על לחצן UniLectin3D . לחלופין, עבור ישירות לדף: https://www.unilectin.eu/unilectin3D/.Click בלחצן 'חיפוש Glycan ' כדי לפתוח דף זה: https://www.unilectin.eu/unilectin3D/glycan_search (איור משלים 6).
    2. לחץ על היהלום הסגול המייצג חומצה סיאלית, אשר מנחה את התצוגה של כל המוטיבים מחייבי הגליקנים המסתיימים בחומצה סיאלית המאוחסנת במסד הנתונים. החלק העליון של אוסף המוטיבים מכיל את מוטיב NeuAc(a2-3)Gal(b1-4)GlcNAc שנחקר קודם לכן (איור משלים 7).
    3. לחץ על NeuAc(a2-3)Gal(b1-4)מוטיב GlcNAc כדי להנחות את התצוגה של כל lectins שעבורם מבנה 3D המאשר את האינטראקציה עם NeuAc(a2-3)Gal(b1-4)GlcNAc ידוע. התוצאה כברירת מחדל מראה לקטינים בכל המינים. השתמש באפשרות חיפוש לפי שדה כדי להגביל את התצוגה למידע שמתמקד בבני אדם.
    4. לחץ על האפשרות חפש לפי שדה . בשדה המינים , סוג הומו ספיינס. לחץ על לחצן סייר במבני רנטגן כדי לסנן את הרשימה המקורית. רק רשומה אחת נותרה, כלומר, הגלקטין-8 האנושי. לחץ על לחצן הצג את מבנה 3D ומידע בפינה השמאלית העליונה של הפריט המפורט כדי להציג מידע מפורט של גלקטין אנושי-8 אינטראקציה עם NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. גש למידע המבני על גלקטין-8 אנושי המוצג בדף עם שני צופים שונים.
      1. החזק את העכבר כדי להפוך את המולקולה סביב ולהביא את ligand לקדמת הבמה עם תוכנת Litemol26 משולבת כדי להראות את המבנה התלת-ממדי לציטין. עכבר מעל אחת האינטראקציות המפורטות משמאל כדי לעדכן את התצוגה מימין ולאתר היכן פועלת אינטראקציה מסוימת זו במבנה עם תוכנת PLIP27 המשולבת כדי לפרט את האינטראקציות האטומיות בין הלקטין לליגנד (איור 6).
    6. לחץ על כל כפתור ירוק המקשר לערכים המתאימים ב- UniProt, PDB (אתרים אירופיים או אמריקאים) ו- GlyConnect כדי לחקור הפניות מקושרות אלה.

2. לחקור ולהשוות O-glycomes ב- GlyConnect

  1. גלישה בערכת הנתונים של אתגר HGI בביטחון גבוה
    הערה: ערכת הנתונים של HGI המוזכרת במבוא מאוחסנת במסד הנתונים של GlyConnect. הוא מכיל 163 N- ו 23 O-glycopeptides נמצא 37 גליקופרוטאין נחשב כרשימת אמון גבוהה. GlyConnect Compozitor28 הוא המפתח להערכת עקביות נתונים גליקום. חשוב לציין, Compozitor מאפשר צמתים וירטואליים (המוצגים באפור) כאשר נדרש רק שלב מתווך אחד כדי לחבר את הצמתים המבודדים. בדרך זו, צמתים וירטואליים מהדקים את הגרף וניתן לפרש אותם כמבנים שעלולים להחמיץ בתוצאות הניסוי.
    1. עיין בערכת הנתונים של HGI מדף הבית של GlyConnect על-ידי מעבר ישירות לדף ההתייחסות של המאמר: https://glyconnect.expasy.org/browser/references/2943.
      הערה: הסיכום בלחצנים הצבעוניים משקף חלקית את הנתונים המופיעים במאמר. עם זאת, אם רק 69 פפטידים ייחודיים מפורטים, זה משקף אסוציאציות מרובות בין פפטידים ואתרים או מבנים. במאמר, גליקופפטיד מוגדר כשילוב ייחודי של פפטיד וקומפוזיציה. ב- GlyConnect, גליקוזיטים נחשבים תחילה, והם מתוארים כשילוב של פפטיד עם מבנים. זה מסביר את הפער במספרים בין GlyConnect לבין הציטוט לעיל.
    2. בדוק את התדירות הגבוהה של התרחשות של קומפוזיציות מקושרות N, כגון Hex:5 HexNAc:4 NeuAc:2, שזוהו ב -42 אתרים ב -43 פפטידים בניגוד לייחודיות התכופה של רוב הקומפוזיציות המקושרות ל- O שזוהו באתר אחד בפפטיד אחד.
    3. לחץ על הקישור Compozitor בצד ימין של דף הזנת ההפניה כדי להעריך את העקביות של ערכת הנתונים. ודא שהכלי Compozitor מעבד ישירות את DOI של ההפניה וממלא את שדה החיפוש בהפניה =10.1101/2021.03.14.435332 בכרטיסיה מתקדם של הכלי. הקלד &glycan_type=O-מקושר לאחר מספר DOI כדי לצמצם את החיפוש לגליקנים המקושרים ל- O, כך שהשאילתה הופכת ל: אסמכתא=10.1101/2021.03.14.435332&glycan_
      type=O-מקושר
    4. לחץ על לחצן הוסף לבחירה כדי לאחזר נתונים ממסד הנתונים (ישנם 20 קומפוזיציות המקושרות ל- O). השאר את האפשרות כלול צמתים וירטואליים מסומנת. לחץ על לחצן חשב גרף כדי להציג את הגרף של קומפוזיציות מחוברות. תוצאה זו מדגישה מספר פערים בהמשכיות הצפויה של הביוסינתזה הגליקנית עם תשעה צמתים וירטואליים הנדרשים להשלמת הגרף (איור 7).
  2. השוואה עם O-גליקום של חלבון סרום שנבחר ב- GlyConnect
    הערה: כדי להעריך אם ניתן למלא את הפערים על-ידי נתונים המאוחסנים ב- GlyConnect, נבחר חלבון O-גליקוסילאט אחד מתוך 37 המופיעים עם ההפניה. בערכת הנתונים, מעכבי אלפא-טריפסין אינטר-אלפא-טריפסין שרשרת כבדה H4 (Q14624) הוא דיווח להיות O-גליקוסילated על Thr-725.
    1. עבור לכרטיסיה חלבון של GlyConnect Compozitor (ראה שלב 2.1.3). מתוך רשימת החלבון , בחר בין-אלפא-טריפסין מעכב שרשרת כבדה H4. ודא כי בחירת המינים היא הומו ספיינס כברירת מחדל. בטלו את הבחירה באפשרות N המקושרת בסוג הגליקאן. בחר רק Thr-725 ברשימת האתרים על-ידי לחיצה תחילה על סימן החיסור משמאל לאתר כדי לבטל את הבחירה בכל האתרים ולאחר מכן בחירה רק ב- Thr-725 מהרשימה.
    2. לחץ על לחצן הוסף לבחירה (שים לב שש קומפוזיציות משויכות ל- Thr-725). לחצו על הלחצן 'חשב גרף ' כדי להציג את הגרף של הקומפוזיציות המחוברות (איור משלים 8).
    3. שים לב לגרף המוצג, המציג את 17 הקומפוזיציות הייחודיות מתוך 20 הקומפוזיציות המקושרות ל- O של ערכת הנתונים של המאמר בכחול ושלושת הייחודיים מתוך שישה במסד הנתונים באדום. במילים אחרות, החפיפה בין שני המקורות קיימת בשלושה קומפוזיציות המיוצגות במגנטה. שים לב שסיבוב של 45° של הגרף נוצר באופן אוטומטי.
      הערה: מספר הצמתים הווירטואליים מופחת באחד. כפי שמתברר, H2N2S1 חסר 20 חיבורים מקושרים O של ערכת הנתונים של המאמר ומיוצג כצומת וירטואלי עכשיו מלא קומפוזיציה נוספת הקשורים Thr-725 של שרשרת כבדה מעכבי אלפא-טריפסין הבין-אלפא-טריפסין H4 במסד הנתונים. פעולה זו מפשטת את הטופולוגיה של הגרף מכיוון ששני צמתים וירטואליים אחרים הופכים לחסרי תועלת מכיוון שהם היו אפשרויות חלופיות למילוי הפער בין H1N2S1 ל- H2N2S2. עם זאת, הרכב שני המיובא ממסד הנתונים יהיה מבודד אלמלא יצירת שני צמתים וירטואליים חלופיים חדשים H2N2F1S1 ו- H1N2F2S1.
    4. כדי להבין את הצמתים הווירטואליים, בדוק אם הקומפוזיציות המתאימות נמצאות ב- GlyConnect. לשם כך, לחץ על לחצן ייצוא מתחת לגרף. בחר וירטואלי רק על-ידי ביטול הבחירה בכל האפשרויות האחרות. לחץ על סמל הלוח כדי להעתיק את הבחירה של 8 קומפוזיציות.
    5. הדבק את הבחירה בחלון השאילתה של הכרטיסיה התאמה אישית של Compozitor. בחר באפשרות O מקושרת בשדה סוג הגליקאן . הגדר את תווית הבחירה בשדה קומפוזיציות כ- VN, לדוגמה, כדי לתת שם לרשימה של 8 קומפוזיציות. לחץ על לחצן הוסף לבחירה ולאחר מכן על לחצן חשב גרף . כל הצמתים הווירטואליים מוצגים כעת כצמתים ירוקים (איור 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

החלק הראשון של הפרוטוקול (סעיף 1) הראה כיצד לחקור את הספציפיות או את המשותף של N-glycans המצורפים על Asn-69 של האנטיגן הספציפי לערמונית האנושית (PSA) באמצעות פלטפורמת GlyConnect. שינויים תלויי רקמות (שתן ונוזל הזרע), כמו גם וריאציות תלויות איזופורם (נורמליות וגבוהות בביטוי גליקן), הודגשו באמצעות שני כלים חזותיים (איור 4 ואיור 5).

ראשית, תמנון GlyConnect, המציג שיוכים בין ישויות המאוחסנות במסד הנתונים, סיפק את ההזדמנות לחקור מידע הקשרי באמצעות (1) בחירת ישויות שונות שיוצגו בתמנון ו- (2) לחיצה על קישורים כדי לבחון ערכים קשורים. התוצאה הייתה אסוציאציות ייחודיות בהתאם לרקמה.

שנית, GlyConnect Compozitor, שנועד במקור להגדיר / לחדד קובץ קומפוזיציה לזיהוי גליקופפטיד, שימש להערכת ביטוי גליקאני בשני איזופורמים ידועים של PSA (pI רגיל וגבוה). ההשוואה של כל גליקומים איזופורם הפיקה גרף מחובר היטב המפרט ארבעה צמתים (קומפוזיציות), שניים מהם אופייניים לאיזופורם pI הגבוה. למרות שחפיפת הגליקום משמעותית, תרשים מייצגי המאפיינים של הגליקן הראה טיפה של סיילציה מהאיזופורם המשותף ל- pI הגבוה (איור משלים 5).

יתר על כן, המחקר של UniLectin3D סינגלים את גלקטין-8 כקורא אפשרי של גליקום PSA מאז האחרון מכיל מבנים רבים עם NeuAc(a2-3)Gal(b1-4)אפיטופ מסוף GlcNAc. זה מספק הפניה לעקוב ולא יכול להיחשב כראיה סופית. עם זאת, PSA ו galectins ידועים לשחק תפקיד חיוני בסרטן הערמונית29 ואת התפקיד הספציפי של Galectin-8 הודגש לאחרונה30. החלק הראשון של הפרוטוקול מתאם נתונים מבניים (גליקופרוטאומיקה) ופונקציונליים (מחייבים) כדי ליצור תרחיש סביר לאינטראקציות חלבון-חלבון בתיווך הגליקנים.

בחלק השני של הפרוטוקול (סעיף 2), נבדקה קבוצה באיכות גבוהה של קומפוזיציות O-glycan המשויכות לרקמה מסוימת (סרום אנושי) והושוותה לתוכן מסד הנתונים של GlyConnect, ובכך הציעה את האפשרות להתאים אישית קובץ הרכב גליקן לזיהוי מעודן של גליקופפטידים (איור 7 ואיור 8 ). זה יכול להסתמך על קבוצה מינימלית של 20 קומפוזיציות זמינות מתוך ערכת נתונים אחת (תוצאות אתגר HGI) או להיות משופר עם 23 עד 26 פריטים שנאספו באופן רציונלי ב- GlyConnect כדי לחזק את העקביות של הסט.

אדום כתום בהיר ירוק כחול בהיר סגול ורוד כחול כהה חום כתום כהה
מינים חלבון מקור רקמות מבנה הרכב מחלה הפניה גליקוזיט פפטיד

טבלה 1: ערכת צבעים המשויכת לכל ישות של מסד הנתונים GlyConnect ותקפה לכל אורכה.

Figure 1
איור 1: גלגל התלות של Glyco@Expasy שנוצר עבור GlyConnect. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 2
איור 2: מבנה גליקן מוצע להרכב גליקן נבחר. מבנה גליקן מוצע מניסוי גליקומוניקה להרכב גליקאני של ניסוי גליקופרוטומי המתמקד באותו גליקופרוטאין, כאן אנטיגן ספציפי לערמונית אנושית (PSA), כפי שהוצע בדף GlyConnect עבור PSA (מזהה: 790). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 3
איור 3: התפריט הימני הצדדי של הדף 'חיבור גלי' עבור PSA. ניתן ללחוץ על הפניות מקושרות למסדי נתונים מרכזיים אחרים ולהציג עם תוסף LiteMol glycan של מבנה תלת-ממדי קיים ב- PDB. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 4
איור 4: התפוקה של תמנוןGlyConnect המציגה קשרים תלויי רקמות בין חלבונים לגליקנים. השאילתה היברידית ו- Sialylated החזירה את כל הקומפוזיציות התואמות לקריטריונים אלה וכל קומפוזיציה מקשרת יחד את המידע המשויך על חלבונים וגליקנים כפי שנרשם במסד הנתונים. שים לב כי כברירת מחדל מינים מוגדר הומו סאפיינס אבל אפשרות זו ניתנת לשינוי. כאן, תמנון GlyConnect מציג את כל החלבונים האנושיים (צמתים שמאליים) הנושאים מבנים גליקניים היברידיים וסיילציה (צמתים ימניים) עם הרקמות שבהן הם באים לידי ביטוי (צמתים מרכזיים). (A) האסוציאציות עם שתן מודגשות המציגות שני חלבונים: choriogonadotropin (GLHA_HUMAN) ואיזופורם משותף PSA (KLK3_HUMAN) המחוברים למבנים גליקניים מפוזרים (הטרוגניים). (B) האסוציאציות עם נוזל הזרע מודגשות המציגות שני איזופורמים של חלבון של PSA (KLK3_HUMAN) המחוברים למבנים גליקנים מקובצים (דומים). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 5
איור 5: הפלט של GlyConnect Compozitor המציג את הגליקום N-הגליקומים של שני האיזופורמים של PSA. קומפוזיציות בתווית סימון מרוכזת כל צומת. הגליקנים המשויכים לאיזופורם המשותף מיוצגים כצמתים כחולים ואלה של איזופורם ה- pI הגבוה כצמתים אדומים. החפיפה בין גליקומים מוצגת כצמתי מגנטה. מספרים בתוך הצמתים מייצגים את מספר המבנים הגליקנים התואמים את הקומפוזיציה המסומנת בתווית בהתאם לתוכן מסד הנתונים של GlyConnect לגבי PSA. גרף Compozitor המוצג השתנה מעט מהפלט הגולמי כדי להתיר את הרשת שנוצרת על-ידי ספריית .js D3. זה קל לעשות כמו כל צומת ניתן לגרור במרחב החלון של הדפדפן בכל מקום שהמשתמש רוצה, ולכן ניתן לקצר או למתוח את הנתיבים. המשתמש יכול להקליד קומפוזיציה ספציפית בשדה Zoom On בפינה השמאלית העליונה כדי להגדיל ולמרכז את הגרף בצומת המתאים. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 6
איור 6: ערך מסכם של הגלקטין-8 האנושי עם NeuAc(a2-3)Gal(b1-4)GlcNAc פרטים מחייבים. לחיצה על הכפתור הירוק הצג את המבנה והמידע התלת-ממדי (המצוין באליפסה אדומה) פותחת דף חדש שבו מוצג תקריב על אינטראקציות שאריות עם יישום PLIP (המצוין על ידי חץ אדום). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 7
איור 7: הפלט של GlyConnect Compozitor המציג את ה- O-גליקום של ערכת נתוני הביטחון הגבוה בסרום האנושי של אתגר HGI. ללא צמתים וירטואליים (ראה טקסט), הקישוריות של גרף זה נמוכה. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 8
איור 8: הפלט של GlyConnect Compozitor מראה את האפשרות להשלים את O-glycome של ערכת הנתונים של הסרום האנושי בביטחון גבוה של אתגר HGI, באמצעות תוכן מסד הנתונים של GlyConnect. גישה לתוכן של מסד הנתונים כולו של GlyConnect באמצעות הכרטיסיה התאמה אישית של Compozitor מגלה כי קומפוזיציות המתאימות לצמתים הווירטואליים ממופות עם מבנים מוגדרים קיימים כפי שמודגשים בתוויות הצמתים. גודל הצומת מייצג את מספר ההפניות המאוחסנות במסד הנתונים ודיווח על הקומפוזיציה המתאימה. התווית המספרית של צמתים מציינת את מספר המבנים המתאימים המאוחסנים ב- GlyConnect. נראה כי ליצירות שנבחרו יש אפס עד שמונה עשרה התאמות אפשריות במסד הנתונים. למעשה, צמתים אלה הם וירטואליים רק כהשתקפות של התוכן של ערכות נתונים ניסיוניות. מומלץ ללטש את המידע בגרף כדי לבדוק את הריאליזם של צמתים נוספים אלה. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

איור משלים 1: תרשים בועות של דף הבית Glyco@Expasy. התקרבות בטבלת הבועות של דף הבית Glyco@Expasy כדי להתמקד בקטגוריית הגליקופרוטאין . תוכנה המוצגת בבועות ירוקות ובמסדי נתונים בבועות צהובות. לחיצה על כל בועה מסכמת את מטרת המשאב. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 2: שיוכים שאוחזרו על-ידי תמנון התואמים לשאילתה בהתאם לקומפוזיציה. תצוגת תמנון GlyConnect המוגדרת כברירת מחדל של חלבונים אנושיים (צמתים שמאליים) הנושאים מבנים גליקניים היברידיים וסיילציה (צמתים ימניים) עם קומפוזיציות תואמות (צמתים מרכזיים). קומפוזיציה H6N4F12S1 נראית ייחודית לשני האיזופורמים של PSA (KLK3_HUMAN). לחיצה על מזהה המבנה הייחודי (10996) פותחת את הדף המתאים עם פרטים המראים כי שני האיזופורמים הם אכן החלבונים היחידים הנושאים את הגליקן המסוים הזה. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 3: אסוציאציות שאוחזרו על ידי תמנון התואמות את השאילתה בהתאם למחלה. תצוגת תמנון GlyConnect של כל החלבונים האנושיים (צמתים שמאליים) הנושאים מבנים גליקניים היברידיים וסיילציה (צמתים ימניים) עם המחלות שבהן הם באים לידי ביטוי (צמתים מרכזיים). האסוציאציות עם סרטן הערמונית מודגשים המציגים את האיזופורם הנפוץ של PSA (KLK3_HUMAN). נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 4: אסוציאציות שאוחזרו על-ידי תמנון התואמות לשאילתה בהתאם לפרטי הרקמה. תצוגת תמנון GlyConnect של כל החלבונים האנושיים (צמתים שמאליים) הנושאים מבנים גליקניים דו-אנטנטיים, כולל ה- NeuAc(a1-3)Gal(b1-4)מוטיב GlcNAc (צמתים ימניים) עם הרקמות שבהן הם באים לידי ביטוי (צמתים מרכזיים). האסוציאציות עם נוזל הזרע מודגשות ומציגות רק את האיזופורם הנפוץ של PSA (KLK3_HUMAN) ושבעה מבנים. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 5: הפלט של GlyConnect Compozitor המציג את הגליקומים N-הגליקומים של שני האיזופורמים של PSA. קומפוזיציות בסימון מרוכז מתייגות כל צומת. הגליקנים המשויכים לאיזופורם המשותף מיוצגים כצמתים כחולים ואלה של איזופורם ה- pI הגבוה כצמתים אדומים. החפיפה בין גליקומים מוצגת כצמתי מגנטה. מספרים בתוך הצמתים מייצגים את מספר המבנים הגליקנים התואמים את הקומפוזיציה המסומנת בתווית בהתאם לתוכן מסד הנתונים של GlyConnect לגבי PSA. חלוקה מעל תרשים העמודות של מאפייני הגליקנים מציגה את ההתכתבות בין התדירות לצמתים כבועות כתומות. כמעט כל צמתי האיזופורם הנפוצים של PSA מכוסים. התדר הזה יורד באיזופורם רמת ה-PI הגבוהה. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 6: ממשק חיפוש גליקן ב-UniLectin3D. לחיצה על סמל החומצה הסיאלית SNFG (מוקף באדום) משיקה את החיפוש אחר כל הליגנדים המכילים NeuAc, המאוחסנים ב- UniLectin3D. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 7: קטע מהפלט של החיפוש אחר כל הליגנדים המכילים NeuAc. נויאק (a2-3)Gal(b1- 4)מוטיב העניין GlcNAc מוקף באדום. נא לחץ כאן כדי להוריד קובץ זה.

איור משלים 8: הפלט של GlyConnect Compozitor המציג את ה- O-גליקום של ערכת הנתונים HGI עם זו שב- GlyConnect. הפלט של GlyConnect Compozitor המציג את O-glycome של ערכת הנתונים של סרום אנושי ביטחון גבוה של אתגר HGI בכחול על גבי O-גליקום של חלבון O-גליקוסילציה אחד מתוך 37 המפורטים עם ההתייחסות, כלומר, בין אלפא-טריפסין מעכב שרשרת כבדה H4 עם מידע נוסף הכלול GlyConnect. פעולה זו משפרת את הקישוריות של הגרף. נא לחץ כאן כדי להוריד קובץ זה.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

תמנון GlyConnect ככלי לחשיפת קורלציות בלתי צפויות
GlyConnect Octopus תוכנן במקור כדי לבצע שאילתה על מסד הנתונים עם הגדרה רופפת של גליקנים. ואכן, הספרות מדווחת לעתים קרובות על המאפיינים העיקריים של הגליקנים בגליקום כגון להיות fucosylated או sialylated, להיות עשוי שתי אנטנות או יותר, וכו '. יתר על כן, גליקנים בין אם N- או O-linked מסווגים בליבות, כמפורט במדריך ההתייחסות יסודות של גליקוביולוגיה1, כי הם גם מצוטטים לעתים קרובות במאמרים שפורסמו. לבסוף, אפיטופים גליקאנים כגון אנטיגנים קבוצת דם הם עוד מאפיין המבוקש במבנים ופוטנציאל מסומן להקלדת גליקן. בסופו של דבר, זה עשוי להיות רלוונטי לחפש מאפיינים נפוצים או ברורים של גליקום לידי ביטוי ברקמה ספציפית או מינים נבחרים. במובן זה, המידע שנאסף צריך לשמש כמקור להנחות חדשות בניגוד לעובדות ייחודיות.

GlyConnect Compozitor ככלי לעיצוב ערכת קומפוזיציה של גליקן
לגלישה במידע מבני כמתואר בדף חלבון יש מגבלות מכיוון שרשימות נוטות לטשטש את היחסים בין מבנים מפורטים, כמו גם את אלה שבין קומפוזיציות. תמנון GlyConnect מטפל לשעבר ו GlyConnect Compozitor לאחרון. מבט מדוקדק על מבנים המפורטים ברוב ערכי GlyConnect חושף את קיומם של מבנים נפוצים. עם זאת, מידע זה אינו קל לתפיסה חזותית ללא עזרתו של צופה ייעודי.

התוכן של קובץ הרכב הגליקן התומך בזיהוי moiety הגליקן כפרמטר מפתח של תוכנת זיהוי גליקופפטיד הוקם על ידי ניתוח התוצאות של אתגר HGI. רוב מנועי החיפוש הקלאסיים של פרוטאומיקה מתאימים לבחירה של שינויים מבוססי גליקו מאוסף הנובע מנתונים שנאספו במאגרי מידע /מאגרים או בספרות. כלים ייעודיים אחרים של גליקופרוטומיקה משתמשים בידע של הביוסינתזה הגליקנית. בדרך זו, קובץ הקומפוזיציה מוגדר תיאורטית כתוצאה מפעילות אנזימטית צפויה. בסופו של דבר, ישנם קבצי קומפוזיציה רבים כמו שיש מנועי חיפוש והחפיפה ביניהם משתנה מאוד. עם זאת, למידה מניסיון העבר בפרוטאומיקה, במיוחד כאשר שינויים פוסט-טרנסליים נלקחים בחשבון, מגלה כי הביצועים של מנועי חיפוש מתואמים עם הגבלת מרחב החיפוש31. תצפיות דומות נעשות בגליקופרוטאומיקה ו- GlyConnect Compozitor נועד לתמוך בבחירת נתוני קומפוזיציה משכילה, שחשיבותה נדונה בעבר32.

השימוש בכלי זה הומחש באופן חלקי בפרוטוקול במיוחד לגבי הכרטיסיה מתקדם שבה ניתן לבטא שאילתות המפעילות ישירות גישה תוכניתית ל- GlyConnect באמצעות ה- API שלה (ממשק תכנות יישומים). לדוגמה, הקלדת טקסונומיה =הומו סאפיינס&glycanType=N-linked&רקמה=שתן ומחלות=סרטן הערמונית בחלון השאילתה של הכרטיסיה מתקדם שקולה למילוי השדות המתאימים בכרטיסייה מקור (בחירת הומו סאפיינס במינים, שתן ברקמה ו - N-linked בסוג גליקן) והכרטיסיה מחלה (בחירת הומו סאפיינס במינים, סרטן הערמונית במחלות ו - N מקושר בסוג הגליקן). במילים אחרות, הוא מספק בשלב אחד תוצאה שתדרוש מספר בחירות.

לבסוף, בעוד יצירת צמתים וירטואליים מוסברת בפרוטוקול, היתירות הפוטנציאלית שלהם זקוקה להערה נוספת. שתי אפשרויות בו-זמניות עשויות להיות בלתי ניתנות להבחנה מכיוון שהפעולה המדומה של אנזימים בגרף אינה מסבירה את הכרונולוגיה של פעילויות האנזים. לכן Compozitor מציע שני נתיבים דרך שני צמתים וירטואליים כדי לגשר על שני צמתים לא מחוברים המתאימים לספירות מונוסכרידים עם עד שני הבדלים. הכללת נתונים חדשים מספקת לעתים קרובות קישורים חסרים. המשתמש חופשי תמיד לשקול או לבטל צמתים וירטואליים, על-ידי (ביטול) סימון התיבה כלול צמתים וירטואליים .

מסדי נתונים ומגבלות תוכנה ידועים
בסך הכל, כמו בכל ניווט באינטרנט, הפרוטוקולים המתוארים לעיל מובילים מדי פעם לדף שאינו קיים, לעתים קרובות עקב עדכון של אתר או התנגשות עדכונים בין שני אתרים. במקרה זה, ולמעשה, בכל המקרים שבהם הניווט אינו זורם, הקל ביותר הוא לשלוח פתק לעוזר Expasy שהיעילות שלו תרמה באופן משמעותי להצלחת הפורטל ב -28 השנים האחרונות.

התוכן של GlyConnect מוטה כהשתקפות של חוסר האיזון הנוכחי בספרות. רוב הפרסומים מדווחים על N-גליקוסילציה ביונקים, ומסד הנתונים עשיר יותר ב-N-גליקופרוטאין אנושיים. עם זאת, התבקשנו בעבר לכלול ערכות נתונים פחות נפוצות ולהישאר פתוחים לחלוטין לקבלת ייעוץ והצעות.

חוץ מזה, Compozitor מוגבלת כרגע להשוואה של שלוש ערכות נתונים קומפוזיציה. מתוכנן תיקון משמעותי של תת-הפעולה הדטרמיננטית בתמנון. משאבי Glyco@Expasy זקוקים לעדכונים שוטפים וחלקם עשויים שלא להתבצע בבוא העת; עם זאת, אזהרות ו /או הודעות מתפרסמות כאשר זה קורה.

פורטלי שותפים, המכונים GlyGen (https://www.glygen.org) ו- GlyCosmos (https://www.glycosmos.org), מספקים אפשרויות וכלים שונים. בסופו של דבר, גלישה וחיפוש מידע על אחת מהאפשרויות כרוכה ברמה גבוהה של סובייקטיביות ותלויה במידה רבה בהרגלי המשתמשים ובדאגות. אנחנו יכולים רק לקוות שהפתרון שלנו מתאים לחלק מהקהילה.

קלט הגליקו-מדע גדל בפרויקטים במדעי החיים ומחקרים המבססים את תפקידם של הגליקנים בבעיות בריאות מיוצרים ברציפות. ההתמקדות האחרונה ב- Sars-Cov-2 חשפה שוב את החשיבות של חלבונים גליקוסיליים, במיוחד בגישות מבניות33. גליקויאנפורמטיקה תומכת בגליקו-מדענים במשימות יומיומיות של ניתוח נתונים ופרשנות.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

המחברים מצהירים שאין ניגודי עניינים.

Acknowledgments

המחבר מכיר בחום בחברים בעבר ובהווה בקבוצת האינפורמטיקה של פרוטאום המעורבים בפיתוח המשאבים המשמשים במדריך זה, במיוחד, ז'וליאן מריתוז וקתרין הייז עבור GlyConnect, פרנסואה בונארדל עבור UniLectin, דוידה אלוצ'י, ופרדריק ניקיטין עבור התמנון, וטיבאולט רובין עבור קומפוזיטור ומגע אחרון על תמנון.

פיתוח פרויקט glyco@Expasy נתמך על ידי הממשלה הפדרלית השוויצרית באמצעות מזכירות המדינה לחינוך, מחקר וחדשנות (SERI) והוא משלים כיום על ידי הקרן הלאומית השוויצרית למדע (SNSF: 31003A_179249). ExPASy מתוחזקת על ידי המכון השוויצרי לביואינפורמטיקה ומתארחת במרכז כשירות Vital-IT. המחבר גם מכיר אן Imberty עבור שיתוף פעולה יוצא מן הכלל על פלטפורמת UniLectin נתמך במשותף על ידי ANR PIA Glyco@Alps (ANR-15-IDEX-02), אליאנס קמפוס רודניאן Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

ביולוגיה גיליון 179
משאבי ביואינפורמטיקה לחקר אינטראקציות חלבון בתיווך גליקן
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter