$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
تم تطبيق سير العمل المذكورة أعلاه إلى dataset MS متاح في38،مستودع فخر39. الدراسة الأصلية وضعت طريقة (إيميكسبرو)، باستخدام النظائر المستقرة وسم من الأحماض الأمينية في الخلية والثقافة (سيلك)، للقضاء على إيجابيات كاذبة من MS تنقية تقارب تجارب (AP-MS)38. وباختصار، تجربة AP-MS يتكون من استخدام الأجسام المضادة الخرز زمنياً لجلب بروتين الفائدة (الطعم) وفي التمثيلات (يفترس). ثم يهضم البروتينات التي تم جمعها وإعدادها لمرض التصلب العصبي المتعدد. طريقة إعداد العينة وإعدادات الأداة موصوفة في الدراسة الأصلية وعلى المستودع فخر (PXD004246). تحديا في هذه التجارب هو وفرة إيجابيات كاذبة، لا سيما من البروتينات ملزمة الخرز ولكن ليس الطعم. وهنا استخدمنا سيلاك لتوليد نسب النظائر المختلفة بين يفترس الحقيقية والمغلوطة: 3 مراقبة العينات (لا الطعم) المزروع في المتوسطة الخفيفة و 1 العينة معربا عن الطعم المزروع في المتوسطة الخفيفة 1 العينة معربا عن الطعم المزروع في متوسطة ثقيلة معالجة مع الخرز وكذلك تحليل الطيف الكتلي. مع هذا التصميم، والبروتينات غير محددة ملزمة الخرز سيكون نسبة 1:4؛ الثقيلة إلى النور عندما يفترس الحقيقي سيكون بنسبة 1:138.
قمنا بإعادة تحليل بياناتها AP-مرض التصلب العصبي المتعدد باستخدام قاعدة بيانات أوبينبروت؛ الطعوم وشملت ثلاثة بروتينات الذاتية (PTPN14 و JIP3 و IQGAP1)، واثنين من البروتينات (RAF1 و RNF41) أعرب عن الإفراط. نظراً للتجارب التي تستخدم سيلك، تم استخدام سير العمل غالاكسي لتقدير البروتين (S3 المواد التكميلية، الشكل 2). وكان تشغيل سير العمل باستخدام قاعدة أوبينبروت كله (OpenProt_all) أو قاعدة بيانات أوبينبروت محدودة (OpenProt_2pep، بما في ذلك فقط البروتينات التي سبق الكشف عنها مع الحد ني الببتيدات فريدة من نوعها اثنين).
والبروتين التحديد الكمي كانت جيدة واستنساخه عبر مختلف قواعد البيانات المستخدمة. كما هو موضح في الشكل 3، حددت معظم البروتينات المحددة في الورقة الأصلية أيضا في استخدام قاعدة البيانات OpenProt_2pep أو OpenProt_all (قائمة مفصلة متاحة في S5 المواد التكميلية). هذه النتيجة تبين أن خط الأنابيب الموصوفة هنا وأوبينبروت قواعد البيانات قادرة على إنتاج بروتين تحديد وتقدير حجم مماثل للإجراءات الحالية التي تستند إلى قواعد بيانات أونيبروتكب40. ومع ذلك، باستخدام قواعد البيانات أوبينبروت ميزة فريدة من نوعها تتيح الكشف عن الرواية والبروتينات يمكن الكشف عنها مسبقاً، كما هو موضح في هذه الحالة دراسة.
وتم تحديد 11 مدعمة على نحو جيد من البروتينات (1 Isoform و 10 التبروتس)، ولكن حاليا لا المشروح في قواعد البيانات، عبر جميع مجموعات البيانات، مع ثقة من الببتيدات، استخدام قاعدة OpenProt_2pep (جميع البروتينات الانضمام، جنبا إلى جنب مع العدد من دعم الببتيدات، تتوفر في S5 المواد التكميلية). وتتيح قاعدة البيانات هذه الاستخدام % 1 التقليدية ما زالت فرانكلين روزفلت كزيادة مساحة البحث معتدلة. لم يتم تحديد هذه البروتينات 11 في الدراسة الأصلية كما كانت غائبة من قاعدة البيانات.
تم اكتشاف البروتينات رواية 29 (16 isoforms و 13 التبروتس) عبر جميع مجموعات البيانات، مع ثقة من الببتيدات، استخدام قاعدة البيانات OpenProt_all (جميع الدول المنضمة في البروتين، جنبا إلى جنب مع العدد من دعم الببتيدات، هي S6 المواد التكميلية المتاحة في ). كما هو موضح في الشكل 3، فرانكلين صارمة الموصى به لا يؤثر في تعريفات البروتين الأكثر ثقة، على الرغم من أنه إنقاص العدد الإجمالي للبروتينات التي تم تحديدها. نسبيا لقاعدة البيانات OpenProt_2pep، عدد أكبر من البروتينات رواية يمكن ثقة تحديد. كل من هذه البروتينات رواية غائبة من قاعدة البيانات OpenProt_2pep. وهذا يسلط الضوء على الدور الحاسم لقاعدة البيانات الذي اخترته البروتيوميات المستندة إلى MS.
تم اكتشاف البروتين رواية واحدة إينتيراكتور من البروتين RAF1 (IP_637643). استخدام هذا الموقع أوبينبروت، واحدة يمكن أن نرى أنه لم يتم اكتشاف هذا البروتين لا بمرض التصلب العصبي المتعدد ولا الريبوسوم التنميط حتى الآن (أوبينبروت v1.3). البروتين الأحماض الأمينية 46 طويلة ويمكن أن تعطي فقط هما الببتيدات فريدة عند الهضم تريبتيك. الببتيد اكتشفت في RAF1 AP-MS dataset (جزء 18) كان طائفة ذات نوعية جيدة، كما هو مبين في الشكل 4، وعرض نسبة الثقيلة إلى النور 1,09. يتم ترميز البروتين في الجينات NANOGNBP1 ، وبسيودوجيني من نانوجنب. تم الكشف عن النسخة (ENST00000448444)، المشروح حاليا كغير الترميز، عبر الأنسجة عدة وفقا للمدخل جت40. البروتين: يحتوي على مجال وظيفي المتوقعة المرتبطة بالحمض النووي ملزم (انتقال الجينات علم الوجود: 0003677)41.

الشكل 1 : قاعدة بيانات الاختيار بالنسبة للمخطط تحليلات البروتيوميات. تحليلات البيانات مرض التصلب العصبي المتعدد، ولا سيما اختيار قاعدة البيانات، يعتمد على أهداف البحث. وترد ثلاثة أهداف مشتركة في الزرقاء (خط أنابيب البروتين الكلاسيكية) والأخضر (البروتين حصرية البحث) والبرتقالي (اكتشاف البروتين). كل هدف من الأهداف يعتمد على قاعدة بيانات مناسبة وخطوط الأنابيب. يمكن أن تستخدم أداة تعريف واحد البروتيوميات حصرية وكلاسيكية خطوط الأنابيب. لخط الأنابيب اكتشاف البروتين، نوصي بشدة باستخدام محركات متعددة في تحديد الهوية. يتم الإشارة إلى FDRs الموصى بها باللون الأحمر، وأحجام قاعدة بيانات البروتين في مربعات رمادية. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

الشكل 2 : تمثيل رسومي لسير العمل غالاكسي المستخدمة. التمثيل خطوة بخطوة لسير العمل تحليل البروتين المستخدمة لتحليل جديد ل بيانات ايكرمان et al.38. يتم الإشارة إلى ملفات الإدخال والبحث الببتيد والبروتين القياس الكمي بمربعات البرتقال. مربعات زرقاء تتوافق مع الأدوات المستخدمة ومربعات رمادية تتوافق مع ملفات الإخراج التي تم إنشاؤها. محركات بحث مختلفة (MS-GF + و X! Tandem) ترد بألوان مختلفة (الأحمر والأرجواني على التوالي)، فضلا عن الأسهم التي تشير إلى تلك المدخلات اللازمة والنواتج. المربع الأخضر يسلط الضوء على أداة توليد قائمة تعريفات البروتين. عندما يتم إنشاء نواتج متعددة، تتم الإشارة إلى المستخدم للخطوات النهائية كأقرب إلى السهم. يتوفر سير العمل هذا بحرية في S2 المواد التكميلية. X! يتوفر ملف تكوين المعلمات الافتراضية جنبا إلى جنب في S4 المواد التكميلية. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

الشكل 3 : مقارنة لتحديد إينتيراكتور كل الطعم باستخدام قواعد بيانات مختلفة- مخططات متداخل من تعريفات البروتين باستخدام أوبينبروت الأكثر ثقة قاعدة البيانات (في أورانج، دعم أدلة الببتيدات فريدة 2 الحد الأدنى، OpenProt_2pep) بنسبة % 1 فرانكلين روزفلت، أو أوبينبروت كله قاعدة البيانات (باللون الأزرق، OpenProt_all) بنسبة 0.001% فرانكلين روزفلت، أو كما ورد في ورقة (باللون الرمادي) الأصلي38. يتوافق مع كل رسم تخطيطي للتمثيلات التي تم تحديدها للطعم المذكورة: RAF1، RNF41، PTPN14، JIP3، و IQGAP1. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

الشكل 4 : تحديد الطيف MS/MS من مدنلواك(6 13) الببتيد من البروتين رواية IP_637643- الكثافة النسبية (0 إلى 100%). يتم الإشارة إلى قمم المحددة باللون الأحمر، y أيونات التعليقات التوضيحية في الظلام شروح أيونات الأحمر وب باللون الأخضر. المستخرجة من برمجيات توبفيو34. خطأ السلائف = 2.70 جزء في المليون، نقاط بيب = 0.12. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
| مصطلح | تعريف | مرجع |
| ORF البديلة (الترف) | ORF غير المتعارف عليه حاليا لا المشروح في شروح الجينوم، ولكن المشروح في أوبينبروت. | 15 |
| مرجع ORF (ريفورف) | ORF الكنسي المشروح في الشروح الجينوم وأوبينبروت. | 15 |
| بديل البروتين (التبروت) | رواية البروتين ترميز الترف، مع لا تشابه كبير مع ريفبروت. بادئة الانضمام: IP_. | 15 |
| مرجع البروتين (ريفبروت) | البروتين المشروح حاليا في قواعد تسلسل البروتين مثل أونيبروتكب أو انسيمبل ريفسيق نكبي، وأيضا في أوبينبروت. | 15 |
| رواية إيسوفورم | رواية البروتين مشفرة التورف، مع تشابه كبير مع ريفبروت. بادئة الانضمام: II_. | 15 |
| قاعدة بيانات OpenProt_2pep | يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت، الكشف عن الفعل مع حد أدنى من 2 الببتيدات فريدة من نوعها. | 15 |
| قاعدة بيانات OpenProt_1pep | يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت، الكشف عن الفعل مع حد أدنى من 1 الببتيد فريدة من نوعها. | 15 |
| قاعدة بيانات OpenProt_all | يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت. | 15 |
الجدول 1: تعريف المصطلحات المستخدمة في أوبينبروت وفي البروتوكول
S1 المواد التكميلية: سير عمل نظام غالاكسي للتعامل مع قاعدة البيانات- هذا سيتم إلحاق تسلسل كرابومي وشرك (عكس) إلى قاعدة بيانات الإدخال. الإخراج ملف Fasta. اضغط هنا لتحميل-
S2 المواد التكميلية: غالاكسي سير العمل لتحديد البروتين. وسيحدد هذا البروتين من ملف بيانات الطيف الكتلي باستخدام اثنين من محركات البحث (MS-GF + و X! جنبا إلى جنب). يمكن ضبطها كل معلمة حسب المطلوب قبل تشغيل سير العمل. اضغط هنا لتحميل-
S3 المواد التكميلية: سير العمل غالاكسي للقياس الكمي البروتين باستخدام النظائر المستقرة وسم (SIL). هذا سوف تحديد وقياس البروتينات من ملف بيانات الطيف الكتلي باستخدام اثنين من محركات البحث (MS-GF + و X! جنبا إلى جنب). يمكن ضبطها كل معلمة حسب المطلوب قبل تشغيل سير العمل. اضغط هنا لتحميل-
S4 المواد التكميلية: X! ملف تكوين المعلمات الافتراضية جنبا إلى جنب. XML هذا الملف ضروري لتشغيل X! أداة تانديمادابتير على منصة المجرة. اضغط هنا لتحميل-
S5 المواد التكميلية: كمية البروتينات من مجموعات البيانات إيميكسبرو- ملفات البيانات من ايكرمان et al. عام 201638 تم معالجتها باستخدام قواعد البيانات أوبينبروت والبروتينات الكمية المذكورة لكل حالة. الطعوم هي PTPN14، JIP3، IQGAP1، RAF1، و RNF41. تتطابق أسماء الجينات هو مبين باللون الأخضر مع البروتينات كما حددت في الورقة الأصلية38. أسماء الجينات المبينة في أورانج تناظر التمثيلات المعروفة وفقا بيوجريد التي لم يتم الإبلاغ عنها في هذه الورقة الأصلية. أسماء الجينات المبينة في الضوء الأزرق تتوافق مع رواية البروتينات المحددة التمثيلات (عدد الانضمام البروتين المقابل هو بين قوسين). وأشارت إلى أسماء الجينات في رمادي فاتح ومائل تتوافق مع الملوثات المحتمل (بروتينات الكيراتين). اضغط هنا لتحميل-
S6 المواد التكميلية: تحديد البروتينات رواية من مجموعات البيانات إيميكسبرو- ملفات البيانات من ايكرمان et al. عام 201638 تم معالجتها باستخدام قواعد البيانات أوبينبروت ويتم سرد رواية البروتينات التي تم تحديدها لكل حالة. الطعوم هي PTPN14، JIP3، IQGAP1، RAF1، و RNF41. يتم سرد أرقام الانضمام البروتين، بدءاً II_ لرواية isoforms البروتين المعروفة، ومع IP_ للبروتينات رواية من ORF بديلة (التبروت). العدد من دعم الببتيدات ترد بين قوسين معقوفين. اضغط هنا لتحميل-