Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

JUMPn: تطبيق مبسط لتجميع التعبير المشترك للبروتين وتحليل الشبكة في البروتينات

Published: October 19, 2021 doi: 10.3791/62796

Summary

نحن نقدم أداة بيولوجيا النظم JUMPn لإجراء وتصور تحليل الشبكة لبيانات البروتينات الكمية ، مع بروتوكول مفصل بما في ذلك المعالجة المسبقة للبيانات ، وتجميع التعبير المشترك ، وإثراء المسار ، وتحليل شبكة التفاعل بين البروتين والبروتين.

Abstract

مع التطورات الحديثة في تقنيات البروتينات القائمة على قياس الطيف الكتلي ، أصبح التنميط العميق لمئات البروتيوميات ممكنا بشكل متزايد. ومع ذلك ، فإن استخلاص رؤى بيولوجية من مجموعات البيانات القيمة هذه يمثل تحديا. نقدم هنا برنامجا قائما على بيولوجيا الأنظمة JUMPn ، والبروتوكول المرتبط به لتنظيم البروتيوم في مجموعات التعبير المشترك للبروتين عبر العينات وشبكات التفاعل بين البروتين والبروتين (PPI) المتصلة بوحدات (على سبيل المثال ، مجمعات البروتين). باستخدام منصة R / Shiny ، يبسط برنامج JUMPn تحليل تجميع التعبير المشترك ، وإثراء المسار ، واكتشاف وحدة PPI ، مع تصور متكامل للبيانات وواجهة سهلة الاستخدام. وتشمل الخطوات الرئيسية للبروتوكول تثبيت برنامج JUMPn ، وتعريف البروتينات المعبر عنها بشكل تفاضلي أو البروتينات المنظمة (dys) ، وتحديد مجموعات التعبير المشترك ذات المغزى ووحدات PPI ، وتصور النتائج. في حين يتم إثبات البروتوكول باستخدام ملف تعريف بروتيني قائم على وضع العلامات متساوي الضغط ، فإن JUMPn ينطبق بشكل عام على مجموعة واسعة من مجموعات البيانات الكمية (على سبيل المثال ، البروتينات الخالية من التسميات). وبالتالي ، يوفر برنامج وبروتوكول JUMPn أداة قوية لتسهيل التفسير البيولوجي في البروتينات الكمية.

Introduction

أصبحت بروتينات البندقية القائمة على قياس الطيف الكتلي النهج الرئيسي لتحليل تنوع البروتيوم للعينات المعقدة1. مع التطورات الحديثة في أجهزة قياس الطيف الكتلي2,3 ، والكروماتوغرافيا4,5 ، والكشف عن حركة الأيونات6 ، وطرق الاكتساب (7 المستقلة عن البيانات والاقتناء المعتمد على البيانات8) ، ونهج القياس الكمي (طريقة وسم الببتيد متساوي الضغط متعدد الإرسال ، على سبيل المثال ، TMT9,10 ، والقياس الكمي الخالي من الملصقات11,12) واستراتيجيات تحليل البيانات / تطوير البرمجيات13،14،15،16،17،18 ، وتحديد كمية البروتيوم بأكمله (على سبيل المثال ، أكثر من 10،000 بروتين) هو الآن روتيني 19،20،21. ومع ذلك ، فإن كيفية الحصول على رؤى ميكانيكية من مجموعات البيانات الكمية العميقة هذه لا تزال تمثل تحديا22. اعتمدت المحاولات الأولية للتحقيق في مجموعات البيانات هذه في الغالب على التعليق التوضيحي للعناصر الفردية للبيانات ، ومعالجة كل مكون (بروتين) بشكل مستقل. ومع ذلك ، لا يمكن تفسير الأنظمة البيولوجية وسلوكها فقط من خلال فحص المكونات الفردية23. لذلك ، فإن نهج الأنظمة الذي يضع الجزيئات الحيوية المحددة كميا في سياق شبكات التفاعل أمر ضروري لفهم الأنظمة المعقدة والعمليات المرتبطة بها مثل التكوين الجنيني ، والاستجابة المناعية ، والتسبب في الأمراض البشرية24.

برزت بيولوجيا النظم القائمة على الشبكات كنموذج قوي لتحليل بيانات البروتينات الكمية واسعة النطاق 25،26،27،28،29،30،31،32،33. من الناحية المفاهيمية ، يمكن نمذجة الأنظمة المعقدة مثل خلايا الثدييات كشبكة هرمية34,35 ، حيث يتم تمثيل النظام بأكمله في طبقات: أولا بعدد من المكونات الكبيرة ، كل منها ثم يتم نمذجته بشكل متكرر بواسطة أنظمة فرعية أصغر. من الناحية الفنية ، يمكن تقديم بنية ديناميكيات البروتيوم من خلال شبكات مترابطة من مجموعات البروتين المعبر عنها بشكل مشترك (لأن الجينات / البروتينات المعبر عنها بشكل مشترك غالبا ما تشترك في وظائف بيولوجية مماثلة أو آليات التنظيم36) ووحدات PPI المتفاعلة جسديا37. كمثال حديث25 ، أنشأنا ملفات تعريف زمنية للبروتينات الكاملة والفوسفوبروتيوم أثناء تنشيط الخلايا التائية واستخدمنا شبكات التعبير المشترك التكاملية مع PPIs لتحديد الوحدات الوظيفية التي تتوسط خروج هدوء الخلايا التائية. وتم تسليط الضوء على وحدات متعددة ذات صلة بالطاقة الحيوية والتحقق من صحتها تجريبيا (على سبيل المثال، الوحدات النمطية الرابعة الميثوريبوسومية والمعقدة25، والوحدة الوحيدة الكربون38). في مثال آخر26 ، قمنا بتوسيع نهجنا لدراسة التسبب في مرض الزهايمر ، ونجحنا في إعطاء الأولوية لوحدات البروتين والجزيئات المرتبطة بتطور المرض. الأهم من ذلك ، تم التحقق من صحة العديد من اكتشافاتنا غير المتحيزة من قبل مجموعات المرضى المستقلة 26,29 و / أو نماذج فئران المرض26. توضح هذه الأمثلة قوة نهج بيولوجيا الأنظمة لتشريح الآليات الجزيئية باستخدام البروتيوميات الكمية وغيرها من عمليات تكامل omics.

نقدم هنا JUMPn ، وهو برنامج مبسط يستكشف بيانات البروتينات الكمية باستخدام مناهج بيولوجيا الأنظمة القائمة على الشبكة. يعمل JUMPn كمكون نهائي لمجموعة برامج JUMP proteomics المنشأة13،14،39 ، ويهدف إلى سد الفجوة من القياسات الكمية الفردية للبروتين إلى المسارات ذات المغزى البيولوجي ووحدات البروتين باستخدام نهج بيولوجيا الأنظمة. من خلال أخذ مصفوفة القياس الكمي للبروتينات المعبر عنها بشكل تفاضلي (أو الأكثر تغيرا) كمدخلات ، يهدف JUMPn إلى تنظيم البروتيوم في تسلسل هرمي متدرج من مجموعات البروتين التي يتم التعبير عنها بشكل مشترك عبر العينات ووحدات PPI المتصلة بكثافة (على سبيل المثال ، مجمعات البروتين) ، والتي يتم شرحها بشكل أكبر مع قواعد بيانات المسار العام عن طريق تحليل التمثيل المفرط (أو الإثراء) (الشكل 1). تم تطوير JUMPn باستخدام منصة R / Shiny40 للحصول على واجهة سهلة الاستخدام وتدمج ثلاث وحدات وظيفية رئيسية: تحليل تجميع التعبير المشترك ، وتحليل إثراء المسار ، وتحليل شبكة PPI (الشكل 1). بعد كل تحليل ، يتم تصور النتائج تلقائيا وتكون قابلة للتعديل عبر وظائف القطعة R / لامعة ويمكن تنزيلها بسهولة كجداول نشر بتنسيق Microsoft Excel. في البروتوكول التالي ، نستخدم بيانات البروتيوم الكاملة الكمية كمثال ونصف الخطوات الرئيسية لاستخدام JUMPn ، بما في ذلك تثبيت برنامج JUMPn ، وتعريف البروتينات المعبر عنها بشكل تفاضلي أو البروتينات المنظمة (dys) ، وتحليل شبكة التعبير المشترك ، وتحليل وحدة PPI ، وتصور النتائج وتفسيرها ، واستكشاف الأخطاء وإصلاحها. يتوفر برنامج JUMPn مجانا على GitHub41.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

ملاحظة: في هذا البروتوكول ، يتم توضيح استخدام JUMPn من خلال استخدام مجموعة بيانات منشورة من التنميط البروتيني الكامل أثناء تمايز الخلايا البائية الذي تم تحديده كميا بواسطة كاشف التسمية متساوي الضغط TMT27.

1. إعداد برنامج JUMPn

ملاحظة: يتم توفير خيارين لإعداد برنامج JUMPn: (أ) التثبيت على كمبيوتر محلي للاستخدام الشخصي. و (ii) نشر JUMPn على خادم لامع بعيد لعدة مستخدمين. للتثبيت المحلي ، يكفي جهاز كمبيوتر شخصي متصل بالإنترنت وذاكرة وصول عشوائي ≥4 غيغابايت لتشغيل تحليل JUMPn لمجموعة بيانات بحجم عينة صغير (n < 30) ؛ هناك حاجة إلى ذاكرة وصول عشوائي أكبر (على سبيل المثال ، 16 جيجابايت) لتحليل الأتراب الكبيرة (على سبيل المثال ، n = 200 عينة).

  1. قم بتثبيت البرنامج على كمبيوتر محلي. بعد التثبيت ، اسمح لمتصفح الويب بتشغيل JUMPn واسمح بتشغيل التحليل على الكمبيوتر المحلي.
    1. تثبيت أناكوندا42 أو miniconda43 باتباع التعليمات عبر الإنترنت.
    2. قم بتنزيل شفرة مصدر JUMPn41. انقر نقرا مزدوجا لفك ضغط الملف الذي تم تنزيله JUMPn_v_1.0.0.zip ؛ سيتم إنشاء مجلد جديد باسم JUMPn_v_1.0.0.
    3. افتح محطة سطر الأوامر. على ويندوز، استخدم موجه أناكوندا. على MacOS، استخدم تطبيق المحطة الطرفية المدمج.
    4. إنشاء بيئة JUMPn Conda: احصل على المسار المطلق للمجلد JUMPn_v_1.0.0 (على سبيل المثال، /path/to/JUMPn_v_1.0.0). لإنشاء بيئة Conda فارغة وتنشيطها، اكتب الأوامر التالية على المحطة الطرفية
      كوندا إنشاء -p / مسار / إلى / JUMPn_v_1.0.0 / JUMPn -y
      كوندا تنشيط / مسار / إلى / JUMPn_v_1.0.0 / JUMPn
    5. تثبيت تبعيات JUMPn: تثبيت R (على المحطة الطرفية، اكتب conda install -c conda-forge r=4.0.0 -y)، وقم بتغيير الدليل الحالي إلى المجلد JUMPn_v_1.0.0 (على المحطة الطرفية، اكتب مسار القرص المضغوط/إلى/JUMPn_v_1.0.0)، وقم بتثبيت حزم التبعية (على المحطة الطرفية، اكتب Rscript bootstrap. R)
    6. قم بتشغيل JUMPn على متصفح الويب: قم بتغيير الدليل الحالي إلى مجلد التنفيذ (على المحطة الطرفية ، اكتب تنفيذ القرص المضغوط) وقم بتشغيل JUMPn (على المحطة الطرفية ، اكتب R -e "shiny::runApp()")
    7. بمجرد تنفيذ ما سبق ، ستظهر شاشة المحطة الطرفية الاستماع على http://127.0.0.1:XXXX (هنا XXXX يشير إلى 4 أرقام عشوائية). انسخ والصق http://127.0.0.1:XXXX على متصفح الويب ، حيث ستظهر صفحة الترحيب JUMPn (الشكل 2).
  2. النشر على خادم لامع. تتضمن أمثلة Shiny Server خادم shinyapps.io التجاري أو أي خوادم لامعة مدعومة مؤسسيا.
    1. قم بتنزيل RStudio وتثبيته باتباع التعليمات44.
    2. احصل على إذن النشر للخادم اللامع. بالنسبة لخادم shinyapps.io، قم بإعداد حساب المستخدم باتباع التعليمات45. بالنسبة للخادم المؤسسي اللامع، اتصل بمسؤول الخادم لطلب الأذونات.
    3. قم بتنزيل شفرة مصدر JUMPn41 إلى الجهاز المحلي ؛ التثبيت ليس ضروريا. افتح إما الخادم. R أو واجهة المستخدم. R الملفات في RStudio وانقر فوق القائمة المنسدلة نشر إلى الخادم في الجزء العلوي الأيسر من RStudio IDE.
    4. في اللوحة نشر إلى حساب ، اكتب عنوان الخادم. اضغط على الزر نشر . يتم التحقق من صحة النشر الناجح عند إعادة التوجيه التلقائي من RStudio إلى خادم RShiny حيث تم نشر التطبيق.

2. تشغيل تجريبي باستخدام مجموعة بيانات مثال

ملاحظة: يقدم JUMPn تشغيلا تجريبيا باستخدام مجموعة بيانات بروتينات الخلايا البائية المنشورة. يوضح تشغيل العرض التوضيحي سير عمل مبسط يأخذ مصفوفة القياس الكمي للبروتينات المعبر عنها بشكل تفاضلي كمدخلات ويقوم بإجراء تجميع التعبير المشترك وإثراء المسار وتحليل شبكة PPI بالتتابع.

  1. في الصفحة الرئيسية ل JUMPn (الشكل 2) ، انقر فوق الزر " بدء التحليل" لبدء تحليل JUMPn.
  2. في الزاوية السفلية اليسرى من صفحة "بدء التحليل " (الشكل 3) ، انقر فوق الزر " تحميل بيانات بروتينية للخلية البائية" التجريبية ؛ سيظهر مربع حوار لإعلام بنجاح تحميل البيانات.
  3. في الزاوية السفلية اليمنى من الصفحة ، انقر فوق الزر " إرسال تحليل JUMPn" لبدء تشغيل العرض التوضيحي باستخدام المعلمات الافتراضية ؛ سيظهر شريط تقدم يشير إلى مسار التحليل. انتظر حتى يتم استيفاء شريط التقدم (3 دقائق متوقعة).
  4. بمجرد الانتهاء من تشغيل العرض التوضيحي ، سيظهر مربع حوار مع رسالة تشغيل النجاح والمسار المطلق إلى مجلد النتائج. انقر فوق متابعة إلى النتائج للمتابعة.
  5. ستقوم صفحة الويب أولا بتوجيه المستخدم إلى نتائج مجموعة التعبير المشترك بواسطة WGCNA. انقر فوق عرض النتائج في نافذة الحوار للمتابعة.
  6. ابحث عن أنماط التعبير المشترك للبروتين على يسار صفحة النتائج 1: صفحة إخراج WGCNA . انقر فوق المربع المنسدل تحديد تنسيق التعبير للتنقل بين تنسيقين شكليين:
    1. حدد الاتجاهات لعرض مخطط الاتجاهات، حيث يمثل كل سطر وفرة البروتين الفردية عبر العينات. يمثل لون كل سطر مدى قرب نمط التعبير من إجماع مجموعة التعبير المشترك (أي "الجين الذاتي" كما هو محدد بواسطة خوارزمية WGCNA).
    2. حدد Boxplot لعرض أنماط التعبير المشترك بتنسيق boxplot لكل عينة.
  7. عرض خريطة حرارة إثراء المسار/الأنطولوجيا على يسار صفحة مخرجات WGCNA. يتم عرض المسارات الأكثر ثراء لكل مجموعة معا في خريطة حرارية ، مع كثافة اللون التي تعكس قيمة P المعدلة Benjamini-Hochberg.
  8. مرر لأسفل صفحة الويب لعرض نمط التعبير للبروتينات الفردية.
    1. استخدم المربع المنسدل حدد مجموعة التعبير المشترك لعرض البروتينات من كل مجموعة (الافتراضي هو الكتلة 1). حدد بروتينا معينا في الجدول ، حيث سيتم تحديث مخطط الشريط أسفل الجدول تلقائيا ليعكس وفرة البروتين الخاصة به.
    2. ابحث عن أسماء بروتينات محددة باستخدام مربع البحث الموجود على الجانب الأيسر من الجدول بحثا عن بروتين معين.
  9. لعرض نتائج PPI ، انقر فوق صفحة النتائج 2: إخراج PPI في الأعلى.
  10. انقر فوق تحديد مجموعة التعبير المشترك لعرض النتائج لمجموعة تعبير مشترك معينة (الافتراضي هو الكتلة 1). سيتم تحديث شاشات عرض جميع لوحات الأشكال في هذه الصفحة للمجموعة المحددة حديثا.
  11. عرض شبكات PPI لكتلة التعبير المشترك المحددة على لوحة الشكل الأيسر:
    1. انقر فوق المربع المنسدل تحديد حسب المجموعة لتمييز وحدات PPI الفردية داخل الشبكة. انقر فوق المربع المنسدل تحديد تنسيق تخطيط الشبكة لتغيير تخطيط الشبكة (الافتراضي هو بواسطة Fruchterman Reingold).
    2. استخدم الماوس ولوحة التعقب لتنفيذ الخطوات 2.11.3-2.11.5.
    3. قم بتكبير أو تصغير شبكة PPI حسب الحاجة. سيتم عرض أسماء الجينات لكل عقدة في الشبكة عند التكبير بشكل كاف.
    4. عند التكبير، حدد بروتينا معينا وانقر فوقه لتسليط الضوء على هذا البروتين وجيرانه من الشبكة.
    5. اسحب عقدة معينة (بروتين) في الشبكة لتغيير موضعها في التخطيط ؛ وبالتالي يمكن إعادة تنظيم تخطيط الشبكة من قبل المستخدم.
  12. في اللوحة اليسرى من صفحة نتائج PPI، قم بعرض معلومات مستوى الكتلة للتعبير المشترك التي تساعد في تفسير نتائج PPI:
    1. عرض نمط التعبير المشترك للكتلة المحددة كمخطط مربع بشكل افتراضي.
    2. انقر فوق المربع المنسدل تحديد تنسيق التعبير لمزيد من المعلومات أو يعرض كما هو مذكور في الخطوات 2.12.3-2.12.5.
    3. حدد الاتجاهات لإظهار مخطط الاتجاهات لنمط التعبير المشترك.
    4. حدد Pathway Barplot لإظهار مسارات غنية بشكل كبير لكتلة التعبير المشترك.
    5. حدد مخطط دائرة المسار لإظهار مسارات غنية بشكل كبير لكتلة التعبير المشترك في تنسيق مخطط الدائرة.
  13. قم بالتمرير لأسفل صفحة النتائج 2: صفحة ويب إخراج PPI لعرض النتائج على مستوى وحدة PPI الفردية. انقر فوق المربع المنسدل تحديد الوحدة النمطية لتحديد وحدة PPI محددة للعرض (يتم عرض Cluster1: Module 1 افتراضيا).
  14. عرض وحدة PPI على اللوحة اليسرى. لمعالجة عرض الشبكة، اتبع الخطوات 2.11.2-2.11.5.
  15. عرض نتائج إثراء المسار/الأنطولوجيا على اللوحة اليمنى. انقر فوق المربع المنسدل تحديد نمط التعليق التوضيحي للمسار لمزيد من المعلومات والعرض:
    1. حدد Barplot لإظهار مسارات غنية بشكل كبير لوحدة PPI المحددة.
    2. حدد مخطط الدائرة لإظهار مسارات غنية بشكل كبير لوحدة PPI المحددة بتنسيق مخطط دائرة.
    3. حدد خريطة الحرارة لإظهار المسارات الغنية بشكل كبير وأسماء الجينات المرتبطة بها من وحدة PPI المحددة.
    4. حدد جدول لإظهار نتائج إثراء المسار التفصيلية، بما في ذلك اسم المسارات/مصطلحات الأنطولوجيا وأسماء الجينات وقيمة P بواسطة اختبار فيشر الدقيق.
  16. عرض جدول المنشورات بتنسيق جدول بيانات: اتبع المسار المطلق (المطبوع أعلى صفحتي النتائج) وابحث عن جدول جدول بيانات المنشور المسمى UniversalSummaryTables.xlsx.

3. إعداد ملف الإدخال وتحميله إلى JUMPn

ملاحظة: يأخذ JUMPn كمدخل مصفوفة القياس الكمي إما للبروتينات المعبر عنها بشكل تفاضلي (الطريقة الخاضعة للإشراف) أو البروتينات الأكثر تنوعا (الطريقة غير الخاضعة للإشراف). إذا كان الهدف من المشروع هو فهم البروتينات المتغيرة عبر ظروف متعددة (على سبيل المثال ، مجموعات الأمراض المختلفة ، أو تحليل السلاسل الزمنية للعملية البيولوجية) ، يفضل الطريقة الخاضعة للإشراف لإجراء تحليل DE ؛ خلاف ذلك ، يمكن استخدام نهج غير خاضع للإشراف لاختيار البروتينات الأكثر تنوعا لغرض استكشافي.

  1. قم بإنشاء جدول تحديد كمية البروتين ، مع كل بروتين كصفوف وكل عينة كأعمدة. حقق ذلك من خلال مجموعة برامج البروتيوميات الحديثة القائمة على قياس الطيف الكتلي (على سبيل المثال ، مجموعة JUMP 13،14،39 ، Proteome Discoverer ، Maxquant15،46).
  2. حدد البروتيوم المتغير.
    1. استخدم نتائج التحليل الإحصائي التي توفرها مجموعة برامج البروتينات لتحديد البروتينات المعبر عنها بشكل تفاضلي (DE) (على سبيل المثال ، مع تعديل قيمة p < 0.05).
    2. بدلا من ذلك ، يمكن للمستخدمين اتباع مثال R code47 لتحديد DE أو معظم البروتينات المتغيرة.
  3. قم بتنسيق ملف الإدخال باستخدام البروتيوم المتغير المحدد.
    ملاحظة: يتضمن تنسيق ملف الإدخال المطلوب (الشكل 4) صف رأس; وتشمل الأعمدة انضمام البروتين (أو أي معرفات فريدة)، GN (رموز الجينات الرسمية)، وصف البروتين (أو أي معلومات يقدمها المستخدم)، متبوعا بتحديد كمية البروتين للعينات الفردية.
    1. اتبع ترتيب الأعمدة المحددة في الخطوة 3.1، ولكن أسماء أعمدة الرأس مرنة للمستخدم.
    2. بالنسبة للبروتين الكمي TMT (أو ما شابه) ، استخدم كثافة مراسل TMT الملخصة كقيم كمية للإدخال. بالنسبة للبيانات الخالية من الملصقات ، استخدم إما الأعداد الطيفية العادية (على سبيل المثال ، NSAF48) أو الطريقة القائمة على الكثافة (على سبيل المثال ، كثافة LFQ أو كثافة بروتين iBAQ التي أبلغ عنها Maxquant46).
    3. يسمح بالقيم المفقودة لتحليل JUMPn. تأكد من تسمية هذه على أنها NA في مصفوفة القياس الكمي. ومع ذلك ، فمن المستحسن استخدام البروتينات فقط مع القياس الكمي في أكثر من 50 ٪ من العينات.
    4. احفظ ملف الإدخال الناتج بتنسيق .txt أو .xlsx أو .csv (يتم دعم الثلاثة بواسطة JUMPn).
  4. تحميل ملف الإدخال:
    1. انقر فوق زر المتصفح وحدد ملف الإدخال (الشكل 3 ، اللوحة اليسرى) ؛ سيتم اكتشاف تنسيق الملف (يتم دعم xlsx و csv و txt) تلقائيا.
    2. إذا كان ملف الإدخال يحتوي على قيم قياس كمي تشبه الكثافة (على سبيل المثال، تلك التي تم إنشاؤها بواسطة مجموعة JUMP39) أو تشبه النسبة (على سبيل المثال، من Proteome Discoverer)، فحدد نعم لخيار تنفيذ Log2-Transformation of Data Option؛ وإلا، فقد تكون البيانات قد تم تحويلها بالفعل إلى سجل، لذا حدد لا لهذا الخيار.

4. تحليل تجميع التعبير المشترك

ملاحظة: أثبتت مجموعتنا 25,26,27 وغيرها من 28,29,31 WGCNA 49 طريقة فعالة لتحليل تجميع التعبير المشترك للبروتينات الكمية. يتبع JUMPn إجراء من 3 خطوات لتحليل WGCNA25,50: (i) التعريف الأولي لمجموعات الجينات / البروتين المشتركة التعبير عن طريق قطع الأشجار الديناميكي51 استنادا إلى مصفوفة التداخل الطوبولوجي (TOM ؛ يتم تحديدها من خلال أوجه التشابه الكمي بين الجينات / البروتينات) ؛ '2' دمج مجموعات مماثلة للحد من التكرار (استنادا إلى مخطط غضروفي أوجه التشابه بين الجينات الذاتية)؛ و (iii) التعيين النهائي للجينات / البروتينات لكل مجموعة تتجاوز الحد الأدنى من قطع ارتباط بيرسون.

  1. تكوين معلمات WGCNA (الشكل 3 ، اللوحة الوسطى). تتحكم المعلمات الثلاث التالية في الخطوات الثلاث ، على التوالي:
    1. تعيين الحد الأدنى لحجم الكتلة ك 30. تحدد هذه المعلمة الحد الأدنى لعدد البروتينات المطلوبة لكل مجموعة تعبير مشترك في الخطوة الأولية (i) من قطع الأشجار الديناميكية الهجينة المستندة إلى TOM. كلما كانت القيمة أكبر ، كلما قل عدد المجموعات التي تم إرجاعها بواسطة الخوارزمية.
    2. تعيين الحد الأدنى لمسافة الكتلة على 0.2. قد تؤدي زيادة هذه القيمة (على سبيل المثال ، من 0.2-0.3) إلى المزيد من دمج المجموعات أثناء الخطوة (ii) ، مما يؤدي إلى عدد أقل من المجموعات.
    3. تعيين الحد الأدنى kME ك 0.7. سيتم تعيين البروتينات إلى المجموعة الأكثر ارتباطا المحددة في الخطوة (ii) ، ولكن سيتم الاحتفاظ فقط بالبروتينات ذات الارتباط بيرسون التي تتجاوز هذه العتبة. لن يتم تعيين البروتينات التي تفشل في هذه الخطوة إلى أي مجموعة (مجموعة "NA" للبروتينات الفاشلة في التقرير النهائي).
  2. ابدأ التحليل. هناك طريقتان لتقديم تحليل تجميع التعبير المشترك:
    1. انقر فوق الزر " إرسال تحليل JUMPn" في الزاوية اليمنى السفلى لبدء التحليل الشامل ل WGCNA تلقائيا متبوعا بتحليل شبكة PPI.
    2. بدلا من ذلك، حدد تنفيذ خطوة WGCNA فقط (خاصة لغرض ضبط المعلمات؛ راجع الخطوات 4.2.3-4.2.4):
    3. انقر فوق الزر " معلمات متقدمة " في أسفل صفحة " بدء التحليل" ؛ ستظهر نافذة معلمة جديدة. في الأداة السفلية ، حدد وضع التحليل ، وحدد WGCNA فقط ، ثم انقر فوق تجاهل للمتابعة.
    4. في صفحة بدء التحليل ، انقر فوق الزر إرسال تحليل JUMPn .
    5. في كلتا الحالتين أعلاه ، سيظهر شريط التقدم عند تقديم التحليل.
      ملاحظة: بمجرد الانتهاء من التحليل (عادة < 1 دقيقة لتحليل WGCNA فقط و <3 دقيقة للتحليل الشامل) ، سيظهر مربع حوار مع رسالة تشغيل نجاح والمسار المطلق إلى مجلد النتائج.
  3. فحص نتائج WGCNA كما هو موضح في الخطوات 2.4-2.8 (الشكل 5). لاحظ أنه يتم تمييز المسار المطلق إلى الملف co_exp_clusters_3colums.txt أعلى صفحة النتائج: WGCNA Output لتسجيل عضوية المجموعة لكل بروتين واستخدامه كمدخلات لتحليل PPI فقط .
  4. استكشاف الاخطاء. وتناقش الحالات الثلاث الشائعة التالية. بمجرد تحديث المعلمات كما هو موضح أدناه، اتبع الخطوات 4.2.2-4.2.4 لإنشاء نتائج WGCNA جديدة.
    1. إذا كان من المتوقع وجود نمط تعبير مشترك مهم من البيانات ولكن لم تكن الخوارزمية متوقعة منه، فاتبع الخطوات 4.4.2-4.4.4
    2. من المحتمل بشكل خاص وجود مجموعة مفقودة لمجموعات التعبير المشترك الصغيرة ، أي عدد محدود فقط (على سبيل المثال ، <30) من البروتينات التي تظهر هذا النمط. قبل إعادة التحليل ، أعد فحص ملف الإدخال الخاص بمصفوفة تحديد كمية البروتين وحدد موقع العديد من بروتينات التحكم الإيجابية التي تلتزم بنمط التعبير المشترك المهم هذا.
    3. لإنقاذ المجموعات الصغيرة ، قم بتقليل الحد الأدنى لحجم الكتلة (على سبيل المثال ، 10 ؛ قد لا يكون حجم الكتلة أقل من 10 قويا وبالتالي لا يوصى به) ، وتقليل الحد الأدنى لمسافة المجموعة (على سبيل المثال ، 0.1 ؛ هنا الإعداد كما يسمح ب 0 أيضا ، مما يعني أنه سيتم تخطي الدمج التلقائي للمجموعة).
    4. بعد تنفيذ خطوة تجميع التعبير المشترك مع المعلمات المحدثة، تحقق أولا مما إذا كان قد تم إنقاذ الكتلة من مخططات نمط التعبير المشترك، ثم تحقق من عناصر التحكم الإيجابية عن طريق البحث عن مدخلات البروتين الخاصة بهم من القياس الكمي التفصيلي للبروتين (تأكد من تحديد مجموعة التعبير المشترك المناسبة من الأداة المنسدلة على الجانب الأيسر قبل البحث).
      ملاحظة: قد تكون هناك حاجة إلى تكرارات متعددة من ضبط المعلمات وإعادة تشغيلها للإنقاذ.
    5. إذا كان هناك الكثير من البروتينات التي لا يمكن تعيينها إلى أي مجموعة، اتبع الخطوات 4.4.6-4.4.7.
      ملاحظة: عادة ، قد لا يتم تعيين نسبة مئوية صغيرة (عادة <10٪) من البروتينات إلى أي مجموعة لأن تلك قد تكون بروتينات شاذة لم تتبع أيا من أنماط التعبير الشائعة لمجموعة البيانات. ومع ذلك ، إذا كانت هذه النسبة كبيرة (على سبيل المثال ، >30٪) ، فإنها تشير إلى وجود أنماط تعبير مشترك إضافية لا يمكن تجاهلها.
    6. قم بتقليل كل من معلمات الحد الأدنى لحجم الكتلة والحد الأدنى لمسافة الكتلة للتخفيف من هذا الموقف عن طريق اكتشاف مجموعات التعبير المشترك "الجديدة".
    7. بالإضافة إلى ذلك ، قلل من معلمة الحد الأدنى من ارتباط بيرسون (kME) لتقليص بروتينات "مجموعة NA" هذه.
      ملاحظة: لن يؤدي ضبط هذه المعلمة إلى توليد مجموعات جديدة ولكن بدلا من ذلك سيزيد من حجم المجموعات "الموجودة" من خلال قبول المزيد من البروتينات الفاشلة سابقا ذات العتبة الأدنى؛ ومع ذلك ، فإن هذا سيزيد أيضا من عدم تجانس كل مجموعة ، حيث يسمح الآن بمزيد من البروتينات الصاخبة.
    8. مجموعتان لهما اختلاف طفيف جدا في الأنماط. قم بدمجها في مجموعة واحدة باتباع الخطوات 4.4.9-4.4.11.
    9. قم بزيادة معلمة الحد الأدنى لمسافة الكتلة لحل المشكلة.
    10. ومع ذلك ، في بعض الحالات ، قد لا تعيد الخوارزمية أبدا النمط المطلوب ؛ في مثل هذه اللحظة، قم بضبط عضوية الكتلة أو تحريرها يدويا في الملف co_exp_clusters_3colums.txt (ملف من الخطوة 4.3) للدمج.
    11. خذ الملف الذي تم تحريره بعد تحريره كإدخال لتحليل شبكة PPI في المراحل النهائية. في حالة التحرير اليدوي، قم بتبرير معايير تعيين المجموعة، وسجل إجراء التحرير اليدوي.

5. تحليل شبكة التفاعل بين البروتين والبروتين

ملاحظة: من خلال تركيب مجموعات التعبير المشترك على شبكة PPI ، يتم تقسيم كل مجموعة تعبير مشترك إلى وحدات PPI أصغر. يتم إجراء التحليل لكل مجموعة تعبير مشترك ويتضمن مرحلتين: في المرحلة الأولى ، يقوم JUMPn بفرض البروتينات من مجموعة التعبير المشترك على شبكة PPI والعثور على جميع المكونات المتصلة (أي مجموعات متعددة من العقد / البروتينات المتصلة ؛ على سبيل المثال ، انظر الشكل 6A) ؛ بعد ذلك ، سيتم اكتشاف المجتمعات أو الوحدات النمطية (من العقد المتصلة بكثافة) لكل مكون متصل بشكل متكرر باستخدام طريقة مصفوفة التداخل الطوبولوجي (TOM)52.

  1. تكوين المعلمات لتحليل شبكة PPI (الشكل 3 ، اللوحة اليمنى).
    1. تعيين الحد الأدنى لحجم وحدة PPI على أنه 2. تحدد هذه المعلمة الحد الأدنى لحجم المكونات المنفصلة من تحليل المرحلة الأولى. ستتم إزالة أي مكون أصغر من المعلمة المحددة من النتائج النهائية.
    2. تعيين الحد الأقصى لحجم وحدة PPI على أنه 40. ستخضع المكونات الكبيرة غير المتصلة التي تجتاز هذه العتبة للمرحلة الثانية من التحليل القائم على TOM. سيؤدي تحليل المرحلة الثانية إلى تقسيم كل مكون كبير إلى وحدات أصغر: من المفترض أن تحتوي كل وحدة على بروتينات متصلة بشكل أكثر كثافة من المكون الأصلي ككل.
  2. ابدأ التحليل. هناك طريقتان لتقديم تحليل شبكة PPI:
    1. اضغط على زر إرسال تحليل JUMPn لإجراء تحليل PPI تلقائيا بعد تحليل WGCNA افتراضيا.
    2. بدلا من ذلك، قم بتحميل نتائج مجموعة التعبير المشترك المخصصة وقم بإجراء تحليل PPI فقط باتباع الخطوات 5.2.3-5.2.5.
    3. قم بإعداد ملف الإدخال باتباع تنسيق co_exp_clusters_3colums.txt الملف (انظر القسم الفرعي 4.4).
    4. انقر فوق الزر " معلمات متقدمة " في أسفل صفحة " بدء التحليل" ؛ ستظهر نافذة معلمة جديدة. في الجلسة العليا تحميل نتيجة مجموعة التعبير المشترك لتحليل "PPI فقط" ، انقر فوق المتصفح لتحميل ملف الإدخال الذي تم إعداده بواسطة الخطوة 5.2.3.
    5. في الأداة السفلية ، حدد وضع التحليل ، وحدد PPI فقط ، ثم انقر فوق تجاهل للمتابعة. في صفحة بدء التحليل ، انقر فوق الزر إرسال تحليل JUMPn .
  3. بمجرد الانتهاء من التحليل (عادة <3 دقائق) ، افحص نتائج مؤشر أسعار المنتجين كما هو موضح في الخطوات 2.10-2.15 (الشكل 6).
  4. خطوة متقدمة اختيارية) ضبط وحدات PPI عن طريق ضبط المعلمات:
    1. قم بزيادة معلمة الحد الأقصى لحجم الوحدة للسماح بمزيد من البروتينات المضمنة في نتائج PPI. قم بتحميل شبكة PPI مخصصة لتغطية التفاعلات غير الموثقة ، باتباع الخطوات 5.4.2-5.4.3.
    2. انقر فوق الزر " معلمات متقدمة " في أسفل صفحة " بدء التحليل" ؛ ستظهر نافذة معلمة جديدة. إعداد ملف PPI المخصص ، والذي يحتوي على ثلاثة أعمدة بتنسيق و C onnection و ؛ هنا يتم تقديم من خلال الأسماء الجينية الرسمية لكل بروتين.
    3. في تحميل قاعدة بيانات PPI ، انقر فوق الزر استعراض لتحميل ملف PPI المخصص.

6. تحليل إثراء المسار

ملاحظة: يتم تلقائيا شرح الهياكل الهرمية المشتقة من JUMPn لكل من مجموعات التعبير المشترك ووحدات PPI داخل مع مسارات ممثلة تمثيلا زائدا باستخدام اختبار فيشر الدقيق. تشمل قواعد بيانات المسار / الطبولوجيا المستخدمة أنطولوجيا الجينات (GO) و KEGG و Hallmark و Reactome. يمكن للمستخدمين استخدام خيارات متقدمة لتحميل قواعد بيانات مخصصة للتحليل (على سبيل المثال ، في حالة تحليل البيانات من الأنواع غير البشرية).

  1. بشكل افتراضي، يتم بدء تحليل إثراء المسار تلقائيا باستخدام تجميع التعبير المشترك وتحليل شبكة PPI.
  2. عرض نتائج إثراء المسار:
    1. اتبع الخطوات 2.7 و2.12 و2.15 لتصور تنسيقات مختلفة على صفحات النتائج. عرض النتائج التفصيلية في جدول نشر جدول البيانات في الملف UniversalSummaryTables.xlsx (الخطوة 2.16).
  3. (خطوة متقدمة اختيارية) تحميل قاعدة بيانات مخصصة لتحليل إثراء المسار:
    1. قم بإعداد ملف الخلفية الجينية ، والذي يحتوي عادة على أسماء الجينات الرسمية لجميع جينات الأنواع.
    2. قم بإعداد ملف مكتبة الأنطولوجيا باتباع الخطوات 6.3.3-6.3.4.
    3. قم بتنزيل ملفات مكتبة الأنطولوجيا من مواقع ويب عامة بما في ذلك EnrichR53 و MSigDB54. على سبيل المثال ، قم بتنزيل الأنطولوجيا من ذبابة الفاكهة من موقع EnrichR55.
    4. قم بتحرير الملف الذي تم تنزيله للتنسيق المطلوب باستخدام عمودين: اسم المسار كعمود أول، ثم رموز الجينات الرسمية (مفصولة ب "/") كعمود ثان. يتم وصف تنسيق الملف التفصيلي في صفحة التعليمات الخاصة ببرنامج JUMPn R اللامع.
      ملاحظة: ابحث عن أمثلة لملفات الخلفية الجينية ومكتبة الأنطولوجيا (باستخدام ذبابة الفاكهة كمثال) في موقع JUMPn GitHub56.
    5. انقر فوق الزر " معلمات متقدمة " في أسفل صفحة "بدء التحليل" ؛ ستظهر نافذة معلمة جديدة.
    6. ابحث عن تحميل ملف خلفية لعنصر تحليل إثراء المسار وانقر فوق المستعرض لتحميل ملف الخلفية الذي تم إعداده في الخطوة 6.3.1. ثم في الجلسة ، حدد الخلفية المراد استخدامها لتحليل إثراء المسار ، وانقر فوق الخلفية التي يوفرها المستخدم.
    7. ابحث عن تحميل ملف مكتبة أنطولوجيا لعنصر تحليل إثراء المسار وانقر على المتصفح لتحميل ملف مكتبة الأنطولوجيا الذي تم إعداده في الخطوات 6.3.2-6.3.4. ثم في الجلسة ، حدد قواعد البيانات لتحليل إثراء المسار ، انقر فوق قاعدة البيانات التي يوفرها المستخدم بتنسيق .xlsx.
  4. انقر فوق الزر " إرسال تحليل JUMPn" في الزاوية اليمنى السفلى لبدء التحليل باستخدام قاعدة البيانات المخصصة.

7. تحليل مجموعة البيانات مع حجم عينة كبير

ملاحظة: يدعم JUMPn تحليل مجموعة البيانات ذات حجم العينة الكبير (تم اختبار ما يصل إلى 200 عينة). لتسهيل تصور حجم عينة كبير، هناك حاجة إلى ملف إضافي (يسمى "ملف التعريف") يحدد مجموعة العينة لتسهيل عرض نتائج تجميع التعبير المشترك.

  1. إعداد ملف التعريف وتحميله.
    1. قم بإعداد ملف التعريف الذي يحدد معلومات المجموعة (على سبيل المثال، مجموعات التحكم والمرض) لكل عينة باتباع الخطوات 7.1.2-7.1.3.
    2. تأكد من أن الملف التعريفي يحتوي على عمودين على الأقل: يجب أن يحتوي العمود 1 على أسماء العينات المطابقة لأسماء الأعمدة والترتيب من ملف مصفوفة القياس الكمي للبروتين (كما هو معد في الخطوة 3.3)؛ سيتم استخدام العمود 2 فصاعدا لتعيين المجموعة لأي عدد من الميزات التي يحددها المستخدم. عدد الأعمدة مرن.
    3. تأكد من أن الصف الأول من ملف التعريف يحتوي على أسماء الأعمدة لكل عمود؛ من الصف الثاني فصاعدا ، يجب سرد معلومات العينة الفردية للمجموعات أو الميزات الأخرى (مثل الجنس والعمر والعلاج وما إلى ذلك).
    4. قم بتحميل الملف التعريفي بالنقر فوق الزر " معلمات متقدمة " في أسفل صفحة "بدء التحليل " ؛ ستظهر نافذة معلمة جديدة. انتقل إلى الخطوة 7.1.5
    5. ابحث عن تحميل عنصر ملف تعريف وانقر على المتصفح لتحميل ملف الخلفية. إذا تم الكشف عن التنسيق غير المتوقع أو أسماء العينات غير المتطابقة بواسطة JUMPn، فستظهر رسالة خطأ لمزيد من التنسيق لملف التعريف (الخطوات 7.1.1-7.1.3).
  2. اضبط معلمات تحليل تجميع التعبير المشترك: اضبط الحد الأدنى من ارتباط بيرسون على 0.2. تحتاج هذه المعلمة إلى الاسترخاء بسبب حجم العينة الأكبر.
  3. انقر فوق الزر " إرسال تحليل JUMPn" في الزاوية اليمنى السفلى لإرسال التحليل.
  4. عرض نتائج التحليل: جميع مخرجات البيانات هي نفسها باستثناء عرض أنماط مجموعة التعبير المشترك.
    1. في صفحة النتائج 1: إخراج WGCNA، قم بتصور مجموعات التعبير المشترك كمربعات مع عينات طبقية بواسطة مجموعات العينات أو المعالم المعرفة من قبل المستخدم. تمثل كل نقطة في المخطط الجين الذاتي (أي نمط الإجماع للمجموعة) المحسوبة بواسطة خوارزمية WGCNA.
    2. إذا قدم المستخدم ميزات متعددة (على سبيل المثال ، العمر والجنس والعلاج وما إلى ذلك) لتجميع العينات ، فانقر فوق المربع المنسدل تحديد تنسيق التعبير لتحديد ميزة أخرى لتجميع العينات.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

استخدمنا مجموعات بيانات البروتينات العميقة المنشورةلدينا 25،26،27،30 (الشكل 5 والشكل 6) بالإضافة إلى محاكاة البيانات57 (الجدول 1) لتحسين وتقييم أداء JUMPn. لتحليل تجميع البروتين المشترك عبر WGCNA ، نوصي باستخدام البروتينات التي تم تغييرها بشكل كبير عبر العينات كمدخلات (على سبيل المثال ، البروتينات المعبر عنها بشكل تفاضلي (DE) التي تم اكتشافها بواسطة التحليل الإحصائي). في حين أن تضمين بروتينات غير DE للتحليل قد يؤدي إلى المزيد من مجموعات التعبير المشترك التي يعيدها البرنامج (بسبب حجم الإدخال الأكبر) ، فإننا نفترض أن خلط الإشارة الحقيقية (على سبيل المثال ، بروتينات DE) مع الخلفية (المتبقية غير DE) للتحليل على مستوى الأنظمة قد يخفف من الإشارة ويخفي بنية الشبكة الأساسية. لاختبار ذلك ، تم إجراء تحليل المحاكاة في ظل حالتين مختلفتين: i) البروتيوم عالي الديناميكية (على سبيل المثال ، 50٪ تم تغييره في تنشيط الخلايا التائية25) و ii) البروتيوم المستقر نسبيا (على سبيل المثال ، 2٪ من البروتيوم تغير في AD26). بالنسبة للبروتيوم عالي الديناميكية، تمت محاكاة ست مجموعات للتعبير المشترك من 50٪ من البروتيوم باتباع نفس حجم الكتلة وأنماط التعبير (أي الجينات الذاتية) من نتائجنا المنشورة25. وبالمثل ، بالنسبة للبروتينات المستقرة نسبيا ، قمنا بمحاكاة ثلاث مجموعات من 2٪ من البروتيوم بعد دراستنا الأخيرة ل AD proteomics26. وكما هو متوقع، فإن زيادة عدد مدخلات البروتينات يزيد من عدد المجموعات المكتشفة (الجدول 1). بالنسبة للبروتيوم عالي الديناميكية، يمكن أن يؤدي استخدام جميع البروتينات كمدخلات إلى التقاط معظم العناقيد الحقيقية (5 من أصل 6 مجموعات محاكاة حسنة النية؛ 83٪ استدعاء) بدقة 63٪ (5 من أصل 8 مجموعات مرتجعة هي إيجابيات حقيقية؛ أي أن المجموعات الثلاث المتبقية هي إيجابيات كاذبة). ومع ذلك ، بالنسبة للبروتين المستقر نسبيا ، فإن زيادة حجم الإدخال باستخدام بروتينات غير DE تقلل بشكل كبير من الدقة (الجدول 1). على سبيل المثال ، باستخدام البروتيوم بأكمله كمدخلات ، تم اكتشاف 169 وحدة ، منها 2 فقط صحيحة (دقة 1.2٪ ؛ الوحدات المكتشفة بنسبة 98.8٪ المتبقية هي إيجابيات خاطئة). وبالتالي تشير هذه النتائج إلى أن اختيار البروتيوم المتغير فقط كمدخلات سيزيد من دقة تحليل التعبير المشترك ، خاصة بالنسبة للبروتيوم المستقر نسبيا.

بعد الكشف عن مجموعات البروتين المشتركة التعبير ، سيتم شرح كل مجموعة بواسطة JUMPn باستخدام تحليل إثراء المسار (الشكل 1). يتضمن الإصدار الحالي أربع قواعد بيانات مسار شائعة الاستخدام ، بما في ذلك Gene Ontology (GO) و KEGG و Hallmark و Reactome. يمكن للمستخدمين أيضا تجميع قاعدة البيانات الخاصة بهم بتنسيق GMT54 ، والتي يمكن تحميلها في JUMPn. وقد يوفر دمج قواعد بيانات متعددة لتحليل إثراء المسار وجهات نظر أكثر شمولا؛ ومع ذلك ، تختلف أحجام قواعد بيانات المسارات المختلفة اختلافا كبيرا ، مما قد يؤدي إلى تحيز غير مرغوب فيه لبعض قواعد البيانات (خاصة الكبيرة). يتم توفير حلين داخل JUMPn. أولا، باستخدام نهج إحصائي، يتم تعديل قيم p الاسمية (أو معاقبتها) لاختبار الفرضيات المتعددة بواسطة طريقة Benjamini-Hochberg58، مع قاعدة بيانات أكبر تتطلب قيمة p اسمية أكثر أهمية للوصول إلى نفس مستوى p المعدل من قاعدة بيانات صغيرة. ثانيا ، يسلط JUMPn الضوء على المسار العلوي الغني بشكل كبير لكل قاعدة بيانات على حدة ، وبالتالي يتم دائما عرض المسارات المثرية العلوية الخاصة بقاعدة البيانات.

على غرار تحليل إثراء المسار ، تم تجميع شبكة PPI مركبة من خلال الجمع بين STRING59,60 و BioPlex 61,62 و InWeb_IM 63 قاعدة بيانات. تم إنشاء قاعدة بيانات BioPlex باستخدام تنقية التقارب متبوعة بقياس الطيف الكتلي في خطوط الخلايا البشرية ، في حين أن STRING و InWeb يحتويان على معلومات من مصادر مختلفة. لذلك تمت تصفية قواعد بيانات STRING و InWeb بشكل أكبر بواسطة درجة الحافة لضمان الجودة العالية ، مع تحديد الحد الأدنى من خلال أفضل ملاءمة للمعايير الخالية من المقياس24. تغطي شبكة PPI المدمجة النهائية أكثر من 20000 جين بشري مع حوالي 1،100،000 حافة (الجدول 2). يتم تضمين هذا التفاعل الشامل ونشره في حزمة مع برنامج JUMPn الخاص بنا لتحليل PPI الحساس.

بعد الانتهاء من التحليل، يقوم JUMPn بإنشاء ملف جدول بيانات جدول النشر UniversalSummaryTables.xlsx، الذي يتكون من ثلاث أوراق فردية. تحتوي الورقة الأولى على نتائج مجموعات البروتين المشتركة التعبير مع بروتين واحد لكل صف: يشير العمود الأول إلى عضوية المجموعة لكل بروتين إدخال، ويتم نسخ الأعمدة المتبقية من ملف إدخال المستخدم، الذي يحتوي على انضمام البروتين وأسماء الجينات ووصف البروتين وتحديد كمية العينات الفردية. تحتوي الورقة الثانية على نتائج تحليل إثراء المسار ، حيث تعرض مسارات مهمة تم إثراؤها في كل مجموعة تعبير مشترك. يتم تنظيم هذا الجدول أولا بواسطة قواعد بيانات مسارات مختلفة ، ثم يتم فرزه حسب مجموعات التعبير المشترك ، والمسارات الوظيفية ، والعدد الإجمالي لجينات المسار ، والعدد الإجمالي للجينات في المجموعة الفردية ، وأعداد الجينات المتداخلة وأسمائها ، وطية التخصيب ، واختبار فيشر الدقيق المشتق من قيم P ومعدل اكتشاف Benjamini-Hochberg الخاطئ. تحتوي الورقة الثالثة على نتائج تحليل وحدة PPI مع وحدة PPI واحدة لكل صف ؛ تتضمن أعمدتها اسم الوحدة النمطية (المعرفة من خلال عضويتها في التعبير المشترك ومعرف الوحدة النمطية ، على سبيل المثال ، Cluster1_Module1) ، والبروتينات والأرقام المعينة ، بالإضافة إلى المسارات الوظيفية التي يتم تعريفها من خلال البحث في بروتينات الوحدة النمطية مقابل قواعد بيانات المسار.

Figure 1
الشكل 1: سير عمل JUMPn. تؤخذ مصفوفة القياس الكمي للمتغير العلوي للبروتينات المعبر عنها بشكل تفاضلي (DE) كمدخلات ، ويتم تجميع البروتينات في مجموعات التعبير المشترك بواسطة خوارزمية WGCNA. ثم يتم شرح كل تعبير مشترك عن طريق تحليل إثراء المسار وتركيبه بشكل أكبر على شبكة التفاعل بين البروتين والبروتين (PPI) لتحديد وحدات البروتين المتصلة بكثافة. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: صفحة ترحيب JUMPn. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: صفحة إدخال JUMPn. تتضمن الصفحة لوحة تحميل ملف الإدخال ولوحات تكوين المعلمات لتجميع التعبير المشترك وتحليل شبكة PPI ، على التوالي. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 4
الشكل 4: مثال على ملف الإدخال لمصفوفة القياس الكمي. وتشمل الأعمدة انضمام البروتين (أو أي معرفات فريدة)، GN (رموز الجينات الرسمية)، وصف البروتين (أو أي معلومات يقدمها المستخدم)، متبوعا بقياس كمية البروتين للعينات الفردية. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 5
الشكل 5: نتائج مجموعة التعبير المشترك التي أبلغ عنها JUMPn. تظهر أنماط تجميع التعبير المشترك (A) ، وخريطة المسار الحرارية المخصب العلوي عبر العناقيد (B) ، ووفرة البروتين التفصيلية لكل مجموعة (C). يمكن للمستخدمين تحديد خيارات عرض مختلفة والتنقل بين مجموعات مختلفة عبر مربع التحديد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 6
الشكل 6: نتائج تحليل شبكة PPI التي أبلغت عنها JUMPn. تظهر الشبكة العالمية المشتركة بين الوحدات (A) ، تليها شبكة فرعية من الوحدات الفردية (B) ومساراتها المثرية بشكل كبير (C). يمكن للمستخدمين تحديد خيارات عرض مختلفة والتنقل بين المجموعات والوحدات النمطية المختلفة عبر مربع التحديد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

٪ أعلى البروتينات للتحليل # وحدات محاكاة # الوحدات المكتشفة # الوحدات المستعادة1 الدقة2 استدعاء3
البروتيوم الديناميكي للغاية (على سبيل المثال ، أثناء تنشيط الخلايا التائية): 6 وحدات محاكاة من 50٪ من البروتيوم
2 6 2 2 1 0.33
5 6 2 2 1 0.33
10 6 3 3 1 0.5
20 6 4 4 1 0.67
50 6 6 6 1 1
100 6 8 5 0.63 0.83
البروتيوم المستقر نسبيا (على سبيل المثال ، أثناء التسبب في مرض الزهايمر): 3 وحدات محاكاة من 2٪ من البروتيوم
1 3 1 1 1 0.33
2 3 3 3 1 1
5 3 8 3 0.38 1
10 3 13 3 0.23 1
20 3 19 3 0.16 1
50 3 71 2 0.03 0.67
100 3 169 2 0.01 0.67
1 الوحدة المستعادة هي وحدة نمطية مكتشفة يرتبط جينها الذاتي ارتباطا وثيقا (Pearson R > 0.95) بأحد الجينات الذاتية المحاكاة.
2الدقة = # الوحدات المستعادة / # الوحدات المكتشفة
3استدعاء = # الوحدات المستعادة / # وحدات محاكاة

الجدول 1: دراسات محاكاة للكشف العنقودي المشترك التعبير.

شبكات PPI لا. عدد العقد لا. من الحواف
BioPlex 3.0 مجتمعة (293T + HCT116) 14,551 1,67,399
InBio_Map_core_2016_09_12 17,429 6,08,166
سلسلة (v11.0) 18,954 5,87,482
شبكة PPI المركبة 20,485 11,52,607

الجدول 2: إحصاءات شبكات التفاعل بين البروتين البشري والبروتين (PPI). تتم تصفية شبكات PPI حسب درجة الحافة لضمان الجودة العالية ، مع تحديد الحد الأدنى للنقاط من خلال أفضل ملاءمة للمعايير الخالية من المقياس.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

هنا قدمنا برنامج JUMPn الخاص بنا وبروتوكوله ، والذي تم تطبيقه في مشاريع متعددة لتشريح الآليات الجزيئية باستخدام بيانات البروتينات الكمية العميقة25،26،27،30،64. تم تحسين برنامج وبروتوكول JUMPn بشكل كامل ، بما في ذلك النظر في بروتينات DE لتحليل شبكة التعبير المشترك ، وتجميع شبكة PPI شاملة وعالية الجودة ، وتحليل إحصائي صارم (على سبيل المثال ، من خلال النظر في اختبار فرضيات متعددة) مع واجهة مبسطة وسهلة الاستخدام. تم التحقق من صحة وحدات البروتين المتعددة التي حددها JUMPn من خلال دراسات التجارب الوظيفية 25,27 أو مجموعات المرضى المستقلة26 ، مما يجسد JUMPn كأداة فعالة لتحديد الجزيئات والمسارات الرئيسية الكامنة وراء العمليات البيولوجية المتنوعة.

تتضمن الخطوات الحاسمة لهذا البروتوكول توليد النتائج المثلى لمجموعات التعبير المشترك ووحدات PPI ، والتي قد تتطلب تكرارات متعددة لضبط المعلمات ، بالإضافة إلى تحميل شبكة PPI مخصصة. في بروتوكولنا ، ناقشنا سيناريوهات عملية مشتركة ، بما في ذلك كيفية التعامل مع فقدان المجموعات المهمة ، ونسبة عالية من البروتينات غير المخصصة ، ودمج مجموعتين زائدتين عن الحاجة ، وفقدان البروتينات المهمة داخل وحدات PPI. نوصي المستخدم بإعداد العديد من بروتينات التحكم الإيجابية وتأكيد وجودها في مجموعات التعبير المشترك النهائية. في بعض الأحيان لن يتم تضمين عنصر تحكم إيجابي في وحدات PPI النهائية بسبب قاعدة بيانات شبكة PPI غير مكتملة. للتخفيف جزئيا من هذا ، قمنا بتحديث شبكة PPI الخاصة بنا بأحدث إصدارات BioPlex V362 و STRING V1160. بالإضافة إلى ذلك ، يسمح JUMPn للمستخدمين بتحميل شبكات PPI مخصصة. على سبيل المثال ، يمكن دمج التفاعلات الجديدة المستمدة من تجارب تنقية التقارب - مطياف الكتلة (AP-MS) باستخدام بروتين تحكم إيجابي مهم كطعم مع شبكة PPI المركبة الحالية لإجراء تحليل أكثر تخصيصا.

باستخدام إطار تحليل إثراء المسار لكل مجموعة بروتين مشتركة التعبير ، يمكن توسيع JUMPn لاستنتاج نشاط عامل النسخ (TF). الافتراض هو أنه إذا كان هناك تمثيل مفرط للجينات المستهدفة ل TF معين في مجموعة تعبير مشترك (أي أن هذه الأهداف يتم التعبير عنها بشكل تفاضلي وتتبع نفس نمط التعبير) ، فمن المحتمل أن يتغير نشاط TF هذا عبر الظروف التجريبية لأن وفرة البروتين المستهدفة تتغير باستمرار. من الناحية الفنية ، يمكن تحقيق ذلك ببساطة عبر JUMPn عن طريق استبدال قاعدة بيانات المسار الحالية بقاعدة بيانات TF-target (على سبيل المثال ، من مشروع ENCODE65). وبالمثل ، يمكن أيضا الاستدلال على نشاط الكيناز من خلال الاستفادة من قاعدة بيانات كيناز الركيزة ، مع أخذ الفوسفوبروتينات العميقة كمدخلات. على سبيل المثال ، نجحنا في تحديد TFs غير المنظمة والكينازات الكامنة وراء التسبب في ورم الدماغ64. في الواقع ، ظهر استخدام نهج الشبكة لاستنتاج النشاط كنهج قوي لتحديد الدوافع غير المنظمة للأمراض البشرية66,67.

يتم تطبيق برنامج JUMPn بسهولة على مجموعة واسعة من أنواع البيانات. على الرغم من استخدام البروتيوم الكمي المتساوي الضغط كمثال توضيحي ، إلا أن نفس البروتوكول ينطبق أيضا على بيانات البروتيوميات الكمية الخالية من الملصقات ، بالإضافة إلى ملفات تعريف التعبير على نطاق الجينوم (على سبيل المثال ، تم تحديدها كميا بواسطة RNA-seq أو microarray ؛ انظر مثالنا الأخير لتطبيق JUMPn لكل من ملفات تعريف التعبير الجيني والبروتيني27). يمكن أيضا أخذ بيانات البروتيوميات الفوسفاتية بواسطة JUMPn لتحديد الفوسفات المشترك ، متبوعا باستنتاج نشاط الكيناز25. بالإضافة إلى ذلك ، ستكون بيانات interactome الناتجة عن نهج AP-MS مناسبة أيضا ، حيث ستشكل بروتينات الفريسة التي تتبع قوة تفاعل الطعم المماثلة وقياس stoichiometry مجموعات تعبير مشترك وتتداخل بشكل أكبر مع PPIs المعروفة لتفسير البيانات68.

توجد قيود على الإصدار الحالي من JUMPn. أولا ، يعتمد إجراء التثبيت على سطر الأوامر ويتطلب معرفة أساسية بعلوم الكمبيوتر. هذا يعيق الاستخدام الأوسع ل JUMPn ، خاصة من علماء الأحياء الذين ليس لديهم خلفية حسابية. التنفيذ الأكثر مثالية هو نشر JUMPn على خادم عبر الإنترنت. ثانيا، تتمحور قواعد البيانات الحالية حول الإنسان بسبب تركيزنا على دراسات الأمراض البشرية. لاحظ أن بيانات البروتيوميات التي تم إنشاؤها بواسطة الفئران قد تم تحليلها أيضا بواسطة JUMPn باستخدام قواعد البيانات التي تركز على الإنسان25,27 ، على افتراض أن معظم PPIs محفوظة عبر كلا النوعين69,70. لن يتم التقاط الإشارات الخاصة بالماوس بواسطة هذا النهج ولكنها ليست ذات أهمية في تلك الدراسات البشرية. ومع ذلك ، بالنسبة للأنظمة النموذجية غير الثديية (على سبيل المثال ، أسماك الزرد أو الذبابة أو الخميرة) ، يجب إعداد قواعد بيانات خاصة بالأنواع وتحميلها على JUMPn باستخدام الخيارات المتقدمة. يمكن توفير موارد من الأنواع الإضافية عن طريق إطلاق JUMPn في المستقبل. ثالثا ، تستغرق الخطوة الحالية لتحليل الأنطولوجيا / المسار وقتا طويلا ، والذي يمكن تحسينه بشكل أكبر من خلال الحوسبة المتوازية.

في الختام ، نقدم برنامج وبروتوكول JUMPn لاستكشاف بيانات البروتينات الكمية لتحديد وتصور وحدات البروتين المعبر عنها والتي يحتمل أن تتفاعل جسديا من خلال نهج بيولوجيا الأنظمة. وتشمل السمات الرئيسية التي تميز JUMPn عن غيرها 53,71,72 ما يلي: (i) يدمج JUMPn ويبسط أربعة مكونات رئيسية لتحليل المسار والشبكة (الشكل 1)؛ (ب) يدمج JUMPn ويبسط أربعة مكونات رئيسية لتحليل المسار والشبكة (الشكل 1)؛ (ب) يدمج JUMPn ويبسط أربعة مكونات رئيسية لتحليل المسار والشبكة (الشكل 1)؛ (ج) يدمج JUMPn ويبسط أربعة مكونات رئيسية لتحليل المسار والشبكة (الشكل 1)؛ (ج) يدمج JUMPn ويبسط أربعة مكونات رئيسية لتحليل المسار والشبكة (الشكل 1)؛ (ج) ي '2' يختلف برنامج JUMPn عن معظم برامجيات تحليل المسارات التي تتخذ قائمة جينات بسيطة كمدخلات، ويبدأ من مصفوفة القياس الكمي، التي يمكن من خلالها دمج المعلومات الكمية بسلاسة مع المسارات والشبكات الموثقة في الأدبيات؛ '3' يتم شرح كل من مجموعات البروتين المشتركة التعبير ووحدات التفاعل تلقائيا بواسطة مسارات معروفة، ويتم تصورها عبر منصة R/Shiny المتفاعلة باستخدام متصفح ويب سهل الاستعمال؛ '4' تنظم النتائج النهائية في ثلاثة جداول يمكن نشرها بسهولة في شكل إكسل. وبالتالي ، نتوقع أن يكون JUMPn وهذا البروتوكول قابلا للتطبيق على نطاق واسع على العديد من الدراسات لتشريح الآليات باستخدام بيانات البروتينات الكمية.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgments

تم تقديم الدعم التمويلي من قبل المعاهد الوطنية للصحة (NIH) (R01AG047928 و R01AG053987 و RF1AG064909 و RF1AG068581 و U54NS110435) و ALSAC (الجمعيات الخيرية الأمريكية اللبنانية السورية المرتبطة). تم إجراء تحليل التصلب المتعدد في مركز البروتينات والأيض التابع لمستشفى سانت جود لأبحاث الأطفال ، والذي تم دعمه جزئيا من قبل منحة دعم مركز السرطان التابع للمعاهد الوطنية للصحة (P30CA021765). المحتوى هو مسؤولية المؤلفين وحدهم ولا يمثل بالضرورة وجهات النظر الرسمية للمعاهد الوطنية للصحة.

Materials

Name Company Catalog Number Comments
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. Apple Inc. MacBook Pro 13'' Hardware used for software development and testing
Anoconda Anaconda, Inc. version 4.9.2 https://docs.anaconda.com/anaconda/install/
miniconda Anaconda, Inc. version 4.9.2 https://docs.conda.io/en/latest/miniconda.html
RStudio RStudio Public-benefit corporation version 4.0.3 https://www.rstudio.com/products/rstudio/download/
Shiny Server RStudio Public-benefit corporation https://shiny.rstudio.com/articles/shinyapps.html

DOWNLOAD MATERIALS LIST

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
  2. Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
  3. Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
  4. Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
  5. Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
  6. Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
  7. Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
  8. Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
  9. Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer's disease. Analytical Chemistry. 92, 7162-7170 (2020).
  10. Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
  11. Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
  12. Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
  13. Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
  14. Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
  15. Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
  16. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
  17. Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
  18. Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
  19. High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
  20. Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
  21. Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
  22. Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
  23. Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
  24. Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell's functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
  25. Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
  26. Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer's disease progression. Neuron. 105, 975-991 (2020).
  27. Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
  28. Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer's disease. Cell Systems. 4, 60-72 (2017).
  29. Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer's disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
  30. Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
  31. Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
  32. Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
  33. Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
  34. Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
  35. Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
  36. Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
  37. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
  38. Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
  39. Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
  40. Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, Anaconda. miniconda (2021). RStudio (2021) Shiny Server 2301-2319 (2021).
  41. JUMPn. , Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021).
  42. Anaconda. , Available from: https://docs.anaconda.com/anaconda/install/ (2021).
  43. miniconda. , Available from: https://docs.conda.io/en/latest/miniconda.html (2021).
  44. RStudio. , Available from: https://www.rstudio.com/products/rstudio/download/ (2021).
  45. Shiny Server. , Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021).
  46. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
  47. R code. , Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021).
  48. Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
  49. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, Article 17 (2005).
  50. Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
  51. Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
  52. Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
  53. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  54. Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
  55. FlyEn rich r. , Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021).
  56. JUMPn GitHub. , Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly_ (2021).
  57. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  58. Benjamini, Y., Hochberg, Y. Controlling the false discovery rate - a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
  59. Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
  60. Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
  61. Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
  62. Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
  63. Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
  64. Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
  65. Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
  66. Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
  67. Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
  68. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
  69. Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
  70. Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
  71. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
  72. Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).

Tags

الكيمياء الحيوية ، العدد 176 ،
JUMPn: تطبيق مبسط لتجميع التعبير المشترك للبروتين وتحليل الشبكة في البروتينات
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Vanderwall, D., Suresh, P., Fu, Y.,More

Vanderwall, D., Suresh, P., Fu, Y., Cho, J. H., Shaw, T. I., Mishra, A., High, A. A., Peng, J., Li, Y. JUMPn: A Streamlined Application for Protein Co-Expression Clustering and Network Analysis in Proteomics. J. Vis. Exp. (176), e62796, doi:10.3791/62796 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter