$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
זרימת העבודה המתוארת לעיל הוחל על dataset MS זמינים ב38,מאגר גאווה39. המחקר המקורית שפותחה שיטה (iMixPro), באמצעות איזוטופ יציב תיוג של חומצות אמינו בתרבות תא (SILAC), כדי למנוע תוצאות חיוביות שגויות של זיקה לטיהור MS (AP-MS) ניסויים38. בקצרה, ניסוי AP-MS מורכב באמצעות נוגדנים חרוזים-מחויב להביא חלבון של עניין (פיתיון) interactors שלו (הטרף). החלבונים שנאספו לאחר מכן מתעכל, שהוכנו עבור MS. שיטת הכנה מדגם ואת הגדרות מכשיר, מתוארים במחקר המקורי ועל המאגר גאווה (PXD004246). אתגר בניסויים כאלה היא השפע של תוצאות חיוביות שגויות, בעיקר של חלבונים מחייב את החרוזים. אבל לא את הפיתיון. כאן השתמשנו SILAC כדי ליצור יחסי איזוטופ לבין הטרף נכון תוצאות חיוביות שגויות: 3 שליטה (אין פיתיון) תרבותי אור בינוני, 1 מדגם לבטא את הפיתיון תרבותי אור בינוני ו 1 מדגם לבטא את הפיתיון תרבותי בינוני כבד הדגימות עיבוד עם חרוזים, ספקטרומטר מסה ניתוח נוסף. עם עיצוב כזה, חלבונים שאינם ספציפיים מחייב את החרוזים תהיה של כבדות לאור יחס של 1:4; כאשר הטרף נכון יהיה יחס של 1:138.
מחדש ניתחנו את הנתונים שלהם-AP-MS משימוש במסד הנתונים OpenProt; הדיג בסירות האלה כללו שלושה חלבונים אנדוגני (PTPN14, JIP3 ו- IQGAP1), שניים יתר באה לידי ביטוי חלבונים (RAF1 ו- RNF41). מאז הניסויים להשתמש SILAC, היה להשתמש בזרימת העבודה של גלקסיה על כימות חלבון (S3 חומר משלים, איור 2). זרימת העבודה היה להפעיל אותו באמצעות מסד הנתונים OpenProt שלמה (OpenProt_all) או מסד נתונים OpenProt מוגבלת (OpenProt_2pep, כולל רק חלבונים מזוהה בעבר עם מינימום של שני פפטידים ייחודי).
חלבון וכימות היו טובים, לשחזור מעבר בשימוש מסדי הנתונים שונים. כפי שמוצג באיור3, רוב החלבונים מזוהה בעיתון המקורי אותרו גם באמצעות מסד הנתונים ' OpenProt_2pep ' או ' OpenProt_all (רשימה מפורטת זמינה ב- S5 חומר משלים). תוצאה זו מראה כי הצינור המתוארים כאן את OpenProt מסדי נתונים מסוגלים לייצר חלבון וכימות לזו של נהלים הנוכחי מבוסס על מסדי נתונים UniProtKB40. עם זאת, השימוש של מסדי נתונים OpenProt יש יתרון ייחודי המאפשר זיהוי של הרומן וחלבונים לגילוי בעבר, כפי שמתואר במקרה זה ללמוד.
11 הנתמכים היטב חלבונים (1 Isoform ו- 10 AltProts), אך כיום לא מוערת של מסדי נתונים, זוהו על-פני כל נתונים (datasets), עם פפטידים בטוח בעצמו, באמצעות מסד הנתונים OpenProt_2pep (כל חלבון accessions, לצד מספר התומכים פפטידים, זמינות S5 חומר משלים). מסד נתונים זה מאפשר השימוש של 1% מסורתיים רוזוולט כמו הגדלת מרחב החיפוש נשאר מתונה. אלו חלבונים 11 לא זוהו במחקר המקורי כפי שהם נעדרו ממסד הנתונים.
חלבונים הרומן 29 (איזופורמים 16 ו- 13 AltProts) התגלו לאורך כל נתונים (datasets), עם פפטידים בטוח בעצמו, באמצעות מסד הנתונים OpenProt_all (כל חלבון accessions, יחד עם המספר של תמיכה פפטידים, הן S6 חומר משלים הזמינות ב- ). כפי שמוצג באיור3, פד מחמירים מומלץ לא השפיעה ההזדהויות הכי בטוחה של חלבון, למרות שזה להקטין את המספר הכולל של חלבונים מזוהה. יחסית למסד הנתונים OpenProt_2pep ', מספר גבוה יותר של חלבונים רומן יכול להיות בביטחון מזוהה. כל החלבונים האלה הרומן נעדרים ממסד הנתונים של OpenProt_2pep. זה מדגיש את תפקיד מכריע של מסד הנתונים שבחרת עבור פרוטאומיקס מבוססי MS.
חלבון רומן אחד התגלה interactor של החלבון RAF1 (IP_637643). באמצעות אתר האינטרנט OpenProt, ניתן לראות חלבון זה לא זוהו על ידי MS ולא ריבוזום פרופיל עד עכשיו (גירסה 1.3 OpenProt). החלבון חומצות אמינו 46 ארוך, יכול לתת רק שני פפטידים ייחודי על עיכול tryptic. פפטיד שזוהו ב RAF1 AP-MS dataset (שבר 18) היה קשת באיכות טובה, כפי שמוצג באיור4, ומוצגים כבדות לאור יחס של 1,09. החלבון מקודד בגן NANOGNBP1 , אשר הוא פסאודוגן של NANOGNB. התמליל (ENST00000448444), כיום מבואר כמו ללא קידוד, זוהה על-פני מספר רקמות לפי פורטל GTEx40. החלבון מכיל תחום פונקציונלי חזויים הקשורים עם דנ א איגוד (ג'ין אונטולוגיה קדימה: 0003677)41.

איור 1 : מסד נתונים לבחירה עבור תרשים ניתוחים פרוטאומיקס. ניתוח של נתונים MS, ובייחוד את הבחירה של מסד הנתונים, תלויים מטרות המחקר. שלוש מטרות משותפות יוקפו בקו כחול (צינור קלאסי פרוטיאומיה מבנית), ירוק (חיפוש ממצה פרוטיאומיה מבנית) וכתום (גילוי פרוטיאומיה מבנית). כל המטרה תלויה מאגר מידע מתאים צינור. כלי זיהוי יחיד עשוי לשמש פרוטאומיקס ממצה המסיביות צינורות. עבור צינור גילוי פרוטיאומיה מבנית, אנו ממליצים באמצעות מספר זיהוי מנועי. FDRs מומלצים מסומנים באדום, חלבון מסד נתונים גדלים מסומנים בתיבות אפורות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

איור 2 : ייצוג גרפי של זרימת העבודה גלקסי להשתמש. ייצוג שזרימת ניתוח פרוטיאומיה מבנית המשמש re-אנליזה של נתונים Eyckerman et al.38שלב אחר שלב. קבצי קלט, פפטיד search וחלבון כימות מסומנים באמצעות תיבות תפוזים. הקופסאות הכחולות מתאימות הכלים בעזרתם, תיבות אפורים שיתאימו קבצי הפלט הנוצר. מנועי חיפוש שונים (MS-GF + ו- X! Tandem) מסומנים באמצעות צבעים שונים (בהתאמה אדום וסגול), כמו גם של חיצים המציינים הכרחי התשומות והתפוקות שלהם. הקופסא הירוקה מדגיש את הכלי יצירת רשימה של חלבון ופיזיקליים. כאשר יציאות מרובות נוצרות, זו ששימשה צעדים במורד הזרם מסומן בתור הקרוב ביותר על החץ. זרימת עבודה זו זמינה בחופשיות S2 חומר משלים. ה-X! קובץ התצורה של פרמטרים ברירת המחדל טנדם זמין S4 חומר משלים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

איור 3 : השוואה של זיהוי אינטראקטור לכל פיתיון באמצעות מסדי נתונים שונים- דיאגרמות חיתוך קבוצות של חלבון ההזדהויות באמצעות את OpenProt הכי בטוחה מסד (בכתום, תומכים עדות מינימום 2 פפטידים ייחודי, OpenProt_2pep) עם ה 1% פד, או את OpenProt כל מסד הנתונים (בכחול, OpenProt_all) עם 0.001%, רוזוולט, או כפי שדווח המקורי נייר (באפור)38. כל דיאגרמה מקביל interactors מזוהה בשביל הפיתיון שהוזכרו: RAF1, RNF41, PTPN14, JIP3 ו- IQGAP1. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

איור 4 : MS/MS הספקטרום של מזוהה MDNLWAK(13C 6) פפטיד מחלבון הרומן IP_637643. העוצמה היא יחסית (0 ל- 100%). פסגות שנבחרו מסומנות באדום, y יונים הביאורים מופיעים בכהה אדום ו- b יונים ביאורים בירוק. מופק התוכנה TOPPview34. קודמן שגיאה = 2.70 ppm, עידוד ציון = 0.12. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
| המונח | הגדרה | הפניה |
| ORF חלופי (AltORF) | ORF קאנונית שכרגע אין מוערת של הגנום ביאורים, אך מבואר ב- OpenProt. | 15 |
| הפניה ORF (RefORF) | ORF הקנוני מבואר הגנום ביאורים ו OpenProt. | 15 |
| חלבון חלופי (AltProt) | חלבון הרומן בקוד על-ידי AltORF, עם אין דמיון משמעותי עם RefProt. ההצטרפות קידומת: IP_. | 15 |
| הפניה חלבון (RefProt) | חלבון כעת מבואר חלבון רצף במסדי נתונים כגון UniProtKB, Ensembl או NCBI RefSeq, וגם ב- OpenProt. | 15 |
| Isoform רומן | חלבון הרומן בקוד על-ידי AltORF, עם דמיון משמעותי עם RefProt. ההצטרפות קידומת: II_. | 15 |
| מסד OpenProt_2pep | מכיל את הרצף של כל RefProts וחלבונים הרומן שמנבאת OpenProt, כבר זיהתה עם מינימום של 2 פפטידים ייחודי. | 15 |
| מסד OpenProt_1pep | מכיל את הרצף של כל RefProts וחלבונים הרומן שמנבאת OpenProt, כבר זיהתה עם מינימום של 1 פפטיד ייחודי. | 15 |
| מסד OpenProt_all | מכיל את הרצף של כל RefProts וחלבונים הרומן חזה על-ידי OpenProt. | 15 |
טבלה 1: הגדרת המונחים OpenProt וברחבי פרוטוקול
S1 חומר משלים: גלקסי זרימת עבודה עבור מסד הנתונים טיפול. זה יצרף את רצפי CRAPome ואת דמה (הפוכה) קלט במסד הנתונים. הפלט הוא קובץ Fasta. אנא לחץ כאן כדי להוריד.
S2 חומר משלים: גלקסי זרימת עבודה עבור זיהוי חלבונים. זה יהיה לזהות חלבונים מקובץ נתונים ספקטרומטר מסה בעזרת שני מנועי החיפוש (MS-GF + ו- X! טנדם). לכל פרמטר ניתן לכוונן לפי הצורך לפני הפעלת זרימת העבודה. אנא לחץ כאן כדי להוריד.
S3 חומר משלים: גלקסי זרימת עבודה עבור כימות חלבון באמצעות איזוטופ יציב תיוג (סיל). זה לזהות ולכמת חלבונים מקובץ נתונים ספקטרומטר מסה בעזרת שני מנועי החיפוש (MS-GF + ו- X! טנדם). לכל פרמטר ניתן לכוונן לפי הצורך לפני הפעלת זרימת העבודה. אנא לחץ כאן כדי להוריד.
S4 גשמי משלים: X! קובץ התצורה של פרמטרים ברירת מחדל טנדם. קובץ XML זה הכרחי להפעלת ה-X! כלי TandemAdapter על פלטפורמת גלקסי. אנא לחץ כאן כדי להוריד.
S5 חומר משלים: לכמת מהחלבונים iMixPro datasets. קבצי נתונים מ- Eyckerman et al. 201638 עובדו באמצעות מאגרי מידע OpenProt, חלבונים כימות מפורטים עבור כל תנאי. פיתיונות הם PTPN14, JIP3, IQGAP1, RAF1 ו- RNF41. ג'ין המצוין ירוק תואמים חלבונים זיהה גם הנייר המקורי38. שמות ג'ין המצוין כתום מקבילים הידועים interactors על פי BioGrid זה לא דווח בעיתון המקורי. שמות ג'ין המצוין כחול בהיר יתאימו חלבונים הרומן המזוהה כ- interactors (המספר המתאים של ההצטרפות חלבון מותווה בסוגריים). ג'ין שמות המצוין אפור בהיר, נטוי שיתאימו סביר מזהמים (קרטין חלבונים). אנא לחץ כאן כדי להוריד.
S6 חומר משלים: זיהה מהחלבונים הרומן iMixPro datasets. קבצי נתונים מ- Eyckerman et al. 201638 עובדו באמצעות מאגרי מידע OpenProt, חלבונים מזוהה הרומן מפורטים עבור כל תנאי. פיתיונות הם PTPN14, JIP3, IQGAP1, RAF1 ו- RNF41. חלבון ההצטרפות מספרים מפורטים, מתחיל עם II_ עבור הרומן איזופורמים של חלבון ידוע, ועם IP_ עבור מהחלבונים הרומן ORF חלופי (AltProt). המספר של תמיכה פפטידים מסומנים בסוגריים מרובעים. אנא לחץ כאן כדי להוריד.