Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

محاذاة بيانات السلاسل الزمنية المتزامنة باستخدام توصيف فقدان نموذج تزامن دورة الخلية للمقارنات عبر التجارب

Published: June 9, 2023 doi: 10.3791/65466

Summary

يتمثل أحد تحديات تحليل تجارب السلاسل الزمنية المتزامنة في أن التجارب غالبا ما تختلف في طول فترة التعافي من التزامن وفترة دورة الخلية. وبالتالي ، لا يمكن تحليل القياسات من التجارب المختلفة بشكل إجمالي أو مقارنتها بسهولة. نصف هنا طريقة لمواءمة التجارب للسماح بإجراء مقارنات خاصة بالطور.

Abstract

غالبا ما يعتمد التحقيق في دورة الخلية على مزامنة مجموعات الخلايا لقياس المعلمات المختلفة في سلسلة زمنية حيث تجتاز الخلايا دورة الخلية. ومع ذلك ، حتى في ظل ظروف مماثلة ، تظهر التجارب المكررة اختلافات في الوقت اللازم للتعافي من التزامن واجتياز دورة الخلية ، وبالتالي منع المقارنات المباشرة في كل نقطة زمنية. تتفاقم مشكلة مقارنة القياسات الديناميكية عبر التجارب في المجموعات السكانية الطافرة أو في ظروف النمو البديلة التي تؤثر على وقت استعادة التزامن و / أو فترة دورة الخلية.

لقد نشرنا سابقا نموذجا رياضيا بارامتريا يسمى توصيف فقدان تزامن دورة الخلية (CLOCCS) الذي يراقب كيفية إطلاق المجموعات المتزامنة للخلايا من التزامن والتقدم خلال دورة الخلية. يمكن بعد ذلك استخدام المعلمات المستفادة من النموذج لتحويل النقاط الزمنية التجريبية من تجارب السلاسل الزمنية المتزامنة إلى مقياس زمني طبيعي (نقاط شريان الحياة). بدلا من تمثيل الوقت المنقضي بالدقائق من بداية التجربة ، يمثل مقياس شريان الحياة التقدم من التزامن إلى دخول دورة الخلية ثم عبر مراحل دورة الخلية. نظرا لأن نقاط شريان الحياة تتوافق مع مرحلة الخلية المتوسطة داخل السكان المتزامنين ، فإن هذا المقياس الزمني الطبيعي يسمح بإجراء مقارنات مباشرة بين التجارب ، بما في ذلك تلك التي لها فترات وأوقات استرداد مختلفة. علاوة على ذلك ، تم استخدام النموذج لمواءمة تجارب دورة الخلية بين الأنواع المختلفة (على سبيل المثال ، Saccharomyces cerevisiae و Schizosaccharomyces pombe) ، مما يتيح المقارنة المباشرة لقياسات دورة الخلية ، والتي قد تكشف عن أوجه التشابه والاختلاف التطورية.

Introduction

تعد قياسات السلاسل الزمنية التي يتم إجراؤها على مجموعات متزامنة من الخلايا أثناء تقدمها خلال دورة الخلية طريقة قياسية للتحقيق في الآليات التي تتحكم في تقدم دورة الخلية1،2،3،4،5،6،7،8. تعد القدرة على إجراء مقارنات عبر تجارب السلاسل الزمنية المتزامنة / الإصدار أمرا حيويا لفهمنا لهذه العمليات الديناميكية. يمكن أن يؤدي استخدام التجارب المكررة لتأكيد النتائج إلى زيادة الثقة في إمكانية استنساخ الاستنتاجات. علاوة على ذلك ، يمكن للمقارنات بين الظروف البيئية ، عبر الطفرات ، وحتى بين الأنواع أن تكشف عن العديد من الأفكار الجديدة في تنظيم دورة الخلية. ومع ذلك ، فإن التباين بين التجارب في التعافي من التزامن وفي سرعة تقدم دورة الخلية يضعف القدرة على إجراء مقارنات من نقطة زمنية إلى نقطة زمنية عبر النسخ المتماثلة أو بين التجارب مع تغيير توقيت دورة الخلية. بسبب هذه التحديات ، غالبا ما لا يتم تضمين النسخ المتماثلة لسلسلة الدوام الكامل (على سبيل المثال ، Spellman et al.4). عندما يتم جمع النسخ المتماثلة للسلسلة الزمنية بأكملها ، لا يمكن تحليل البيانات بشكل إجمالي ، ولكن بدلا من ذلك يتم استخدام نسخة متماثلة واحدة للتحليل ، وغالبا ما يتم إنزال النسخ المتماثلة الأخرى إلى أرقام تكميلية (على سبيل المثال ، Orlando et al.8). علاوة على ذلك ، من الصعب إجراء مقارنات بين التجارب ذات الخصائص المختلفة للتعافي أو تقدم دورة الخلية. يمكن أن تساعد قياسات الفواصل الزمنية الأصغر بين حدث مهم ومعلم دورة الخلية (على سبيل المثال ، ظهور البراعم أو دخول المرحلة S أو بداية الطور) في تقليل الأخطاء إذا تم تتبع هذه الأحداث البارزة1،2،3،9،10،11،12. ومع ذلك ، قد تظل الاختلافات الدقيقة ولكن المهمة غير مكتشفة أو محجوبة باستخدام هذه الأساليب المخصصة. أخيرا ، تسمح تحليلات الخلية الواحدة بتحليل تقدم دورة الخلية دون الاعتماد على التزامن أو المحاذاة13 ، على الرغم من أن القياسات واسعة النطاق في دراسات الخلية الواحدة يمكن أن تكون صعبة ومكلفة.

للتغلب على هذه الصعوبات ، قمنا بتطوير نموذج توصيف فقدان تزامن دورة الخلية (CLOCCS) للمساعدة في تحليل قياسات السلاسل الزمنية التي تم إجراؤها على السكان المتزامنين14،15. CLOCCS هو نموذج رياضي مرن يصف توزيع الخلايا المتزامنة عبر مراحل دورة الخلية عند إطلاقها من التزامن والتقدم خلال دورة الخلية. يمكن إطار عملية التفرع النموذج من حساب الصفات غير المتماثلة لخلايا الأم والابنة بعد الانقسام ، كما لوحظ في S. cerevisiae ، بينما لا يزال مفيدا للكائنات الحية التي تنقسم عن طريق الانشطار ، مثل S. pombe. يمكن أن يأخذ النموذج مدخلات من مجموعة متنوعة من أنواع القياس لتحديد مرحلة دورة الخلية. يمكنه استيعاب بيانات مرحلة دورة الخلية الناشئة ، والتي تتضمن قياسات النسبة المئوية للخلايا الناشئة بمرور الوقت ، مما يسمح بتقدير عدد الخلايا خارج المرحلة G1 غير المهدة14,15. يمكن للنموذج أيضا استيعاب بيانات قياس التدفق الخلوي التي تقيس محتوى الحمض النووي ، مما يتيح تقييم التحولات البارزة من G1 إلى S ، و S إلى G2 ، و M إلى G115. يمكن أيضا استخدام العلامات المورفولوجية الفلورية لتحديد مرحلة دورة الخلية. يمكن استخدام العلامات الفلورية لحلقات الميوسين والنوى وأجسام قطب المغزل (SPBs) لتحديد مرحلة دورة الخلية ، وقد تم دمجها في نموذج CLOCCS11 ؛ ومع ذلك ، لن يتم وصف هذه القياسات في هذا البروتوكول. بالإضافة إلى ذلك ، تم استخدام مؤشر التقسيم كمدخل لنمذجة البيانات من S. pombe14. وبالتالي ، يمكن استخدام النموذج لتحليل دورة الخلية في مجموعة متنوعة من الكائنات الحية ويمكن توسيعه.

CLOCCS هو نموذج حدودي يسمح بالاستدلال البايزي الكامل لمعلمات متعددة من بيانات الإدخال (على سبيل المثال ، النسبة المئوية للتبرعم ، محتوى الحمض النووي). تتضمن هذه المعلمات وقت الاسترداد من التزامن ، وطول فترة دورة الخلية (المقدرة بشكل منفصل للخلايا الأم والابنة) ، ومتوسط موضع دورة الخلية للخلايا في كل نقطة زمنية. تمثل هذه المعلمات سلوك الخلية المتوسطة في المجتمع ، مما يمكن الباحث من تعيين كل نقطة زمنية إلى موضع دورة الخلية معبرا عنه كنقطة شريان الحياة. يعتمد التحويل إلى نقاط شريان الحياة على معلمات CLOCCS lambda (λ) و mu0 (μ0)14,15. تتوافق المعلمة λ مع متوسط فترة دورة الخلية للخلايا الأم. ومع ذلك ، نظرا لتأخير الأم وابنتها14,15 ، فإن هذا ليس متوسط فترة دورة الخلية لجميع السكان الذين يشملون خلايا الأم وابنتها. بالإضافة إلى ذلك ، يستنتج CLOCCS المعلمة دلتا (δ) ، والتي تتوافق مع التأخير بين الأم وابنتها ، وبالتالي ، تسمح بحساب متوسط فترة دورة الخلية لجميع السكان. أخيرا ، نظرا لأن كل تجربة تبدأ بعد الإصدار من مزامنة دورة الخلية ، يتم تمثيل الوقت اللازم للاسترداد من طريقة المزامنة بواسطة معلمة CLOCCS μ0. يناسب CLOCCS نموذجا لبيانات مرحلة دورة الخلية المدخلة ثم يستنتج هذه المعلمات باستخدام خوارزمية سلسلة ماركوف مونت كارلو العشوائية14,15. من خلال تعيين تجارب متعددة إلى مقياس زمني مشترك لشريان حياة دورة الخلية ، يمكن إجراء مقارنات مباشرة خاصة بالطور بين النسخ المتماثلة أو التجارب التي لا يكون فيها وقت الاسترداد أو فترات دورة الخلية متطابقة8،14،15.

نظرا لأن السكان المتزامنين يفقدون التزامن بمعدل ما على مدار السلسلة الزمنية14،15،16،17 ، فإن التباين في معدل فقدان التزامن يمكن أن يعيق أيضا المقارنات الكمية عبر التجارب. من خلال تحديد موقع السكان والتباين في توزيعاتهم ، يمثل CLOCCS الاختلافات في معدلات فقدان التزامن. تسمح هذه الأداة القوية بإجراء مقارنات محددة ومفصلة عبر التجارب ، وبالتالي توفير القدرة على إجراء مقارنات ذات صلة مباشرة ليس فقط بين النسخ المتماثلة ولكن أيضا بين الظروف البيئية والطفرات وحتى الأنواع التي لها توقيت دورة خلية مختلف بشكل كبير14,15.

تصف هذه الورقة طريقة تستخدم CLOCCS لتقدير المعلمات عن طريق ملاءمة البيانات من تجارب السلاسل الزمنية المتزامنة / الإصدار ، وتعيين البيانات إلى مقياس شريان الحياة المشترك ، ثم إجراء مقارنات ذات صلة بين النسخ المتماثلة أو التجارب. تسمح محاذاة شريان الحياة بإجراء مقارنات مباشرة خاصة بالطور عبر هذه التجارب ، مما يسمح بتجميع ومقارنة النسخ المتماثلة وإجراء مقارنات أكثر صلة عبر التجارب ذات توقيتات الاسترداد المختلفة وفترات دورة الخلية.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. جمع مرحلة دورة الخلية والبيانات التجريبية

  1. قم بمزامنة الخلايا فيما يتعلق بدورة الخلية باستخدام طريقة التزامن المطلوبة (على سبيل المثال ، التطهير بالطرد المركزي كما هو موضح في Leman et al.18 أو تزاوج اعتقال الفرمون كما هو موضح في Rosebrock 19 ؛ يتضمن كل من Leman et al.18 و Rosebrock 19 أيضا طرقا للإفراج عن التزامن). ابدأ في أخذ العينات عبر السلسلة الزمنية ، مع التأكد من أن السلسلة الزمنية لا تقل عن فترتين كاملتين من دورة الخلية ، وعلى النحو الأمثل ، اجمع 10 عينات على الأقل لكل دورة خلية. في كل نقطة زمنية ، اجمع عينة لبيانات طور دورة الخلية (التبرعم أو قياس التدفق الخلوي) وعينة للبيانات التجريبية ، كما هو موضح أدناه.
  2. في حالة استخدام البيانات الناشئة كبيانات طور دورة الخلية ، اجمع البيانات حول التبرعم لمحاذاة CLOCCS.
    1. عينة طوال السلسلة الزمنية. لكل نقطة زمنية ، قم بجمع الخلايا وإصلاحها عن طريق خلط 200 ميكرولتر من ثقافة الخلايا الصوتية مع 200 ميكرولتر من المحلول المثبت ، كما هو موضح في Leman et al.18.
    2. بالنسبة للتبرعم القياسي ، عد ما لا يقل عن 200 خلية لكل نقطة زمنية باستخدام مجهر ضوئي مرسل بهدف 40x ومقياس دموي. أضف عينة الخلية من الخطوة 1.2.1 إلى مقياس الدم ، وقم بتخفيفها إذا كانت الكثافة تمنع العد. سجل عدد الخلايا الناشئة وغير المهدة في كل نقطة زمنية. احسب النسبة المئوية للخلايا الناشئة ، وارسم لكل نقطة زمنية في منحنى ناشئ.
      ملاحظة: تتوفر طرق أخرى لتحديد معلومات طور دورة الخلية ، ولكن لم يتم وصفها في هذا البروتوكول. تم وصف الطرق الأخرى في الملف التمهيدي CLOCCS وفي عمل سابق11.
  3. في حالة استخدام بيانات محتوى الحمض النووي للتدفق الخلوي كبيانات طور دورة الخلية ، اجمع بيانات تلطيخ الحمض النووي لقياس التدفق الخلوي لمحاذاة CLOCCS للتدفق الخلوي.
    1. عينة طوال السلسلة الزمنية. لكل نقطة زمنية ، اجمع الخلايا وقم بإصلاحها كما هو موضح في Haase و Reed20.
    2. تلطيخ الحمض النووي ، وتحليل باستخدام تحليل التدفق الخلوي القياسي. تم وصف بروتوكول التلوين الموصى به ل S. cerevisiae في Haase و Reed20.
  4. جمع omics المرتبطة أو البيانات التجريبية ذات الصلة. للحصول على بيانات النسخ القياسية ، اجمع كما هو موضح في Leman et al.18 و Kelliher et al.21,22. تأكد من أن البيانات مرتبطة بنقاط زمنية تحتوي على بيانات مرحلة دورة الخلية للسماح بمحاذاة المصب. لتحقيق المحاذاة المثلى، تأكد من أن كل نقطة زمنية تحتوي على بيانات تجريبية تحتوي أيضا على بيانات طور مرتبطة بها.
    ملاحظة: يمكن أن تتخذ البيانات التجريبية أشكالا عديدة. تقليديا ، نستخدم طريقة المحاذاة الموضحة لمحاذاة تجارب نسخ السلاسل الزمنية. ومع ذلك ، يمكن محاذاة أي نوع من البيانات المرتبطة بالنقاط الزمنية (أي البروتينات22).

2. تثبيت البرنامج المطلوب

ملاحظة: يفترض هذا القسم أن Conda وJava 19 وGit مثبتة بالفعل (جدول المواد).

  1. قم بتنزيل الريبو CLOCCS_alignment عن طريق إدخال الأمر التالي في الجهاز:
    استنساخ بوابة استنساخ https://gitlab.com/haase-lab-group/cloccs_alignment.git
  2. قم بإنشاء بيئة Conda باستخدام ملف conda_req.yml عن طريق إدخال الأمر التالي في الجهاز في المجلد حيث تم استنساخ CLOCCS_alignment الريبو:
    Conda env create -f conda_req.yml

3. استخدام CLOCCS لتحديد معلمات التجارب

  1. انقر نقرا مزدوجا فوق الملف cloccs_v2023.jar في مجلد CLOCCS في الريبو CLOCCS_alignment ، وانتظر حتى يتم فتح واجهة مستخدم رسومية. تسمح هذه الشاشة بإدخال خيارات تشغيل CLOCCS وتعرض النتائج بمجرد تشغيلها.
  2. أدخل الإعدادات العامة.
    1. قم بتعيين Sim Anneal و Burn In والتكرارات عن طريق الكتابة في مربعات إدخال النص المرتبطة. يحدد Sim Anneal (التلدين المحاكي) قيم معلمات البدء الجيدة ، و Burn في عمليات البحث عن الأوضاع الخلفية ، وتسمح المرحلة النهائية باستخلاص جميع الاستدلالات الخلفية. تزيد القيم الأعلى من وقت التشغيل ولكنها تزيد أيضا من الدقة.
    2. أدخل الظروف التجريبية عن طريق تحديد درجة الحرارة بالدرجة المئوية وطريقة المزامنة باستخدام مربع النص المسمى درجة الحرارة والقائمة المنسدلة Synchro. الطريقة ، على التوالي.
    3. اختياريا قم بتكوين الإعدادات المتقدمة في قائمة الإعدادات المتقدمة. تسمح الإعدادات المتقدمة بتعيين المقدمات لكل معلمة من المعلمات ("mu0" ، "sigma0" ، "sigmav" ، "lambda" ، "bud.start" ، "bud.end").
      ملاحظة: يمكن العثور على مزيد من المعلومات حول الإعدادات المتقدمة في الملف التمهيدي.txt في مجلد CLOCCS في الريبو CLOCCS_alignment.
  3. أدخل الإعدادات للاستخدام مع البيانات الناشئة.
    1. اختر التحديد المناسب من القائمة المنسدلة نوع النموذج . الخيار الافتراضي Bud هو لمعلومات التبرعم القياسية للخميرة الناشئة.
      ملاحظة: توجد أيضا خيارات أخرى أكثر تقدما في القائمة المنسدلة: Mutant لمعلومات التبرعم للمتحولات التي تخضع لدورات تبرعم متعددة دون تقسيم ، و BudSSLSMR للحصول على معلومات ناشئة ومعلومات إضافية عن جسم عمود المغزل وحلقة الميوسين ، و BudNucDivNeck للحصول على معلومات ناشئة ومعلومات إضافية عن التقسيم ونوى عنق البراعم. تم وصف هذه الخيارات المتقدمة في الملف التمهيدي CLOCCS وفي العمل السابق11،14،15.
    2. قم باستيراد البيانات باستخدام لوحة استيراد البيانات عن طريق الكتابة في مربعات إدخال النص أو عن طريق تحميل ملف بالنقر فوق الزر تحديد ملف . يحدد العمود الأول النقاط الزمنية. يحدد العمودين المتبقيين البيانات الناشئة ويمكن أن يأخذا أيا من الخيارات التالية: عدد الخلايا غير المهدة (بدون برعم) أو عدد الخلايا الناشئة (برعم) أو إجمالي عدد الخلايا (الإجمالي).
  4. أدخل الإعدادات للاستخدام مع بيانات قياس التدفق الخلوي. لكل تجربة، قم بتشغيل الخطوة 3.3 أو الخطوة 3.4.
    ملاحظة: يمكن استخدام بيانات قياس التدفق الخلوي والبيانات الناشئة معا. على الرغم من أننا وصفنا سابقا تشغيلهامعا 15 ، بالنسبة لهذه الأداة ، يجب تشغيلها بشكل مستقل ثم مقارنتها.
    1. قم بتحويل ملفات .fcs إلى تنسيق إدخال CLOCCS الصحيح لقياس التدفق الخلوي باتباع الإرشادات الموجودة في الملف التكميلي 1 (الموجود أيضا في الريبو CLOCCS_alignment ك CLOCCS / flow_cytometry_conversion_instructions.txt).
    2. حدد تحديد التدفق من القائمة المنسدلة نوع النموذج .
    3. قم بإدراج البيانات باستخدام لوحة استيراد البيانات. انقر فوق تحديد ملف ، وحدد الملف الذي تم إنشاؤه في الخطوة 3.4.1.
    4. حدد النقاط الزمنية التي يجب أن يتم فيها رسم CLOCCS لقياس التدفق عن طريق تحديد النقاط الزمنية في المربع أوقات الملاءمة .
  5. بمجرد تحديد جميع المدخلات إما للتبرعم أو قياس التدفق الخلوي ، انقر فوق الزر "تطبيق" ، ثم انقر فوق الزر "عينة" أعلى الشاشة.
  6. اعرض المنحنى الناشئ أو مخططات قياس التدفق الخلوي مع الملاءمة المتوقعة عن طريق تحديد علامة التبويب الملاءمة المتوقعة . يتم فتح علامة التبويب هذه افتراضيا مباشرة بعد الخطوة السابقة.
  7. اعرض الرسوم البيانية للمعلمة لكل معلمة عن طريق تحديد علامة التبويب الرسوم البيانية للمعلمة ثم تحديد علامة التبويب الفرعية التي تتوافق مع المعلمة ذات الأهمية من الخيارات التالية: mu0 ، delta ، sigma0 ، sigmav ، lambda ، bud.start ، bud.end ، إلخ.
  8. اعرض مخطط النتيجة اللاحقة عن طريق تحديد علامة التبويب النتيجة اللاحقة .
  9. عرض الإعدادات ، وتغييرها بشكل أكبر عن طريق تحديد علامة التبويب الإعدادات ؛ اعرض سجل عمليات التشغيل السابقة عن طريق تحديد علامة التبويب سجل .
  10. احصل على معلمات CLOCCS من الملاءمة عن طريق تحديد علامة التبويب المعلمات الخلفية . سيكون للجدول الناتج الشكل التالي: يتكون كل صف من معلمة ، مع كون الصف الأخير هو الخلف. تتكون الأعمدة من المعلمة المتوقعة للمتوسط ، وفاصل الثقة الأقل بنسبة 2.5٪ ، وفاصل الثقة الأعلى بنسبة 97.5٪ ، ومعدل القبول.
    1. سجل المعلمات المستخدمة للمحاذاة لكل تجربة: وقت الاسترداد من التزامن (μ0) ومتوسط فترة دورة الخلية للخلايا الأم (λ).
    2. احسب فترة دورة الخلية عن طريق حساب متوسط فترة الخلية الأم (λ) وفترة الخلية الوليدة (λ + δ) ، حيث δ هو التأخير الخاص بالابنة.
      ملاحظة: كرر القسم 3 مع جميع التجارب المراد تضمينها في المقارنات.

4. تحويل النقاط الزمنية إلى نقاط شريان الحياة باستخدام وظائف تحويل Python ومعلمات CLOCCS

ملاحظة: يتطلب التحويل بين نقاط الوقت ونقاط شريان الحياة صيغتي تحويل21. يتوفر تطبيق Python للتحويل وتصور البيانات في الريبو CLOCCS_alignment والموضح أدناه.

  1. قم بتنشيط بيئة Conda عن طريق إدخال الأمر التالي في الجهاز: conda تنشيط CLOCCS_alignment
  2. افتح دفتر ملاحظات Python تفاعلي عن طريق كتابة الأمر التالي في الجهاز: دفتر ملاحظات jupyter
  3. قم بإنشاء دفتر ملاحظات Python جديد في المجلد المطلوب.
    ملاحظة: تم تضمين مثال دفتر ملاحظات لتوضيح الاستخدام القياسي ويمكن العثور عليه في Alignment/JOVE_example.ipynb في الريبو CLOCCS_ المحاذاة.
  4. قم باستيراد ملف Python الذي يحتوي على وظائف المحاذاة عن طريق تشغيل الأمر التالي في الخلية الأولى:
    ٪ تشغيل path_to_repo / cloccs_alignment / محاذاة / أدوات مساعدة.py
    1. استبدل المسار إلى الريبو CLOCCS_alignment ب path_to_repo.
  5. في حالة استخدام البيانات الناشئة كبيانات طور دورة الخلية، قم بإدراج إطار بيانات يحتوي على النسبة المئوية التي تم التبرع لها في كل نقطة زمنية عن طريق تشغيل الأمر التالي في خلية جديدة:
    budding_df = pd.read_csv("path_to_folder/budding_filename.tsv"، سبتمبر ="\t"، index_col=0)
    1. استبدل مسار الملف المناسب واسم الملف. إذا كان الملف ملف .csv، فقم بإزالة sep ="\t"
  6. في حالة استخدام البيانات الناشئة كبيانات طور دورة الخلية، قم بمحاذاة البيانات الناشئة إلى مقياس وقت نقطة الحياة عن طريق إدخال الوظيفة التالية في خلية جديدة:
    aligned_budding_df = df_conversion_from_parameters(budding_df ، النقاط الزمنية ، param_mu0 ، param_lambda)
    1. بالنسبة للنقاط الزمنية، استبدل قائمة بالنقاط الزمنية لتكون فهرس إطار بيانات budding_df.
    2. بالنسبة param_mu0 و param_lambda ، استبدل المعلمات المستفادة من CLOCCS الناشئة التي يتم تشغيلها في القسم 3 للتجربة.
  7. في حالة استخدام بيانات قياس التدفق الخلوي، قم باستيراد بيانات قياس التدفق الخلوي عن طريق تشغيل الأمر التالي في خلية جديدة:
    flow_samples = flow_cytometry_import(flow_input_folder)
    1. على flow_input_folder، استبدل المسار المناسب للمجلد الذي يحتوي على ملفات .fcs لقياس التدفق الخلوي.
  8. في حالة استخدام بيانات قياس التدفق الخلوي، قم بإنشاء جدول تحويل بين نقاط الوقت ونقاط شريان الحياة لكل تجربة عن طريق كتابة الأمر التالي في خلية جديدة:
    flow_converter = convert_tp_to_ll(النقاط الزمنية ، param_mu0 ، param_lambda)
    1. بالنسبة للنقاط الزمنية ، استبدل قائمة بالنقاط الزمنية من بيانات قياس التدفق الخلوي.
    2. بالنسبة param_mu0 و param_lambda ، استبدل المعلمات المستفادة من قياس التدفق الخلوي CLOCCS في القسم 3 للتجربة.
  9. قم باستيراد إطار البيانات الذي يحتوي على البيانات التجريبية إلى دفتر الملاحظات عن طريق تشغيل الأمر التالي في خلية جديدة:
    data_df = pd.read_csv("path_to_folder/exp_data_filename.tsv", sep ="\t", index_col=0)
    1. استبدل مسار الملف المناسب واسم الملف. إذا كان الملف ملف .csv، فقم بإزالة sep ="\t".
      ملاحظة: يمكن القيام بذلك لأي بيانات جدولية. يجب أن تحتوي البيانات التجريبية ببساطة على النقاط الزمنية إما كأعمدة أو فهرس لإطار البيانات. يمكن العثور على أمثلة للبيانات في الريبو CLOCCS_alignment.
  10. قم بمحاذاة البيانات التجريبية إلى مقياس وقت نقطة شريان الحياة عن طريق إدخال الدالة التالية في خلية جديدة:
    lifeline_aligned_df = df_conversion_from_parameters(data_df ، النقاط الزمنية ، param_mu0 ، param_lambda ، الاستيفاء ، السفلي ، العلوي)
    1. بالنسبة للنقاط الزمنية، استبدل قائمة بالنقاط الزمنية كفهرس أو أعمدة data_df التجريبية من الخطوة السابقة.
    2. بالنسبة لعامي param_mu0 و param_lambda ، استبدل القيم التي تم الحصول عليها في القسم 3 من CLOCCS.
      ملاحظة: يمكن أن تأتي المعلمات من أي تشغيل CLOCCS يتم إجراؤه على أي من أنواع بيانات مرحلة دورة الخلية المقبولة.
    3. اختياريا، استبدل الاستيفاء ب True أو False، أو اتركه فارغا (الإعداد الافتراضي هو False).
      ملاحظة: عند التعيين إلى False، لن يتم استيفاء البيانات. عند التعيين إلى True، سيتم تقريب نقاط شريان الحياة واستكمالها لتعبئة القيم بين نقاط شريان الحياة، بحيث توجد نقطة لكل عدد صحيح في نطاق نقاط شريان الحياة. وهذا يسمح بإجراء مقارنة أفضل عبر مجموعات البيانات.
    4. اختياريا ، استبدل lower ll و upperll بقيم لا شيء أو عدد صحيح.
      ملاحظة: عند التعيين إلى بلا، يتم الاحتفاظ بكافة نقاط شريان الحياة بعد الاستيفاء. عند توفير الأعداد الصحيحة ، يؤدي ذلك إلى اقتطاع البيانات بحيث تتراوح نقاط شريان الحياة من الأدنى إلى الأعلى. يسمح هذا بالمقارنة عبر مجموعات البيانات مع سفلي أو علوي مختلف.
  11. قم بتنزيل مجموعة البيانات المحاذاة لشريان الحياة عن طريق إدخال الأمر التالي في خلية جديدة: lifeline_aligned_df.to_csv ("path_to_desired_location/name_of_file.tsv"، sep = "\t")
  12. كرر الخطوات 4.5-4.11 مع تضمين جميع التجارب في المقارنات.

5. مقارنة منحنيات التبرعم وبيانات قياس التدفق الخلوي

  1. ارسم المنحنيات الناشئة قبل المحاذاة باستخدام وظيفة الأدوات المساعدة Python عن طريق إدخال الأمر التالي في خلية جديدة:
    plot_budding_curves(list_of_budding_curves، list_for_legend = leg_list، point_type = str_type، العنوان = str_title)
    1. استبدل قائمة تحتوي على إطارات البيانات لجميع منحنيات التبرعم المرغوبة للتخطيط ل list_of_budding_curves- [bud_df1 ، bud_df2 ، bud_df3].
    2. استبدل قائمة التسميات بوسيلة الإيضاح - [التجربة 1 ، التجربة 2 ، المسوخ] leg_list إذا رغبت في ذلك. إذا لم يكن كذلك ، استبعد أو استبدل بلا.
    3. وقت بديل ل str_type.
    4. استبدل عنوان سلسلة مقارنة منحنيات التبرعم str_title إذا رغبت في ذلك. إذا لم يكن كذلك ، استبدل لا شيء ، أو استبعد.
  2. ارسم منحنيات الناشئ بعد المحاذاة باستخدام وظيفة أدوات Python المساعدة باتباع الإرشادات الواردة في الخطوة 5.1 ، ولكن مع استبدال قائمة منحنيات التبرعم المحاذية ب list_of_budding_curves وشريان الحياة point_type بدلا من الوقت.
  3. لرسم بيانات قياس التدفق الخلوي، ارسم البيانات المرتبطة من ملفات .fcs عند نقاط شريان الحياة المقابلة باستخدام المحول الذي تم إنشاؤه في الخطوة 4.8.
  4. قم بتحويل نقاط شريان الحياة إلى مرحلة دورة الخلية باستخدام جدول المحول (الجدول 1).
    ملاحظة: يمكن أيضا رسم ذلك باتباع الإرشادات الواردة في الخطوة 5.1 ، ولكن مع مرحلة point_type بدلا من الوقت.

6. مقارنة البيانات التجريبية

  1. حدد قائمة الجينات التي سيتم رسمها في الرسوم البيانية الخطية بناء على معلومات الأدبيات أو الجينات ذات الأهمية للبحث.
  2. استخدم plot_linegraph_comparison المتوفرة في ملف أدوات Python المساعدة لإجراء مقارنات الرسم البياني الخطي على إطار البيانات الأصلي أو المحاذي أو المحاذي والمحرف عن طريق كتابة الأمر التالي في خلية جديدة:
    plot_linegraph_comparison (list_of_dfs ، list_for_legend ، جيني ، point_type = str_type ، العنوان = str_title)
    1. استبدل قائمة بإطارات بيانات التجارب المراد مقارنتها ب list_of_dfs.
      ملاحظة: يمكن أن تكون إطارات البيانات غير محاذية أو محاذية; ومع ذلك ، يجب إدخال point_type المقابلة في الخطوة 6.2.4.
    2. استبدل قائمة بالعناوين لكل إطار بيانات بنفس ترتيب قائمة إطارات البيانات ل list_for_legend.
    3. استبدل قائمة بأسماء الجينات (التي يجب تضمينها في فهرس إطارات البيانات) ليتم رسمها للجينات.
    4. استبدل نوع النقطة ب str_type. استخدم شريان الحياة (الافتراضي هو مقياس نقطة شريان الحياة ) أو المرحلة (مقياس شريان الحياة لمرحلة دورة الخلية) لإطارات البيانات المحاذاة في الخطوة 6.2.1 أو الوقت لإطارات البيانات غير المحاذاة في الخطوة 6.2.1.
    5. استبدل عنوان سلسلة اختياري ب str_title.
  3. حدد قائمة الجينات المراد تضمينها في خريطة التمثيل اللوني باستخدام الأدبيات أو الخوارزميات لتحديد الجينات الدورية العليا.
    ملاحظة: لإجراء مقارنات مناسبة للخرائط الحرارية، ينبغي محاذاة البيانات واستكمالها وتعديلها حسب الجدول الزمني في الخطوة 2.6؛ يجب أن يكون لها نفس قيمة شريان الحياة في البداية والنهاية لكل تجربة.
    1. قم بتشغيل خوارزميات الدورية لتحديد الجينات الدوريةالعليا 23,24 ، أو استخدم الطرق البديلة المطلوبة لتحديد قائمة الجينات (أي نتائج الأدبيات).
    2. قم باستيراد ملف قائمة جينات .csv أو .tsv إلى دفتر الملاحظات باستخدام الأمر التالي في خلية جديدة:
      sort_df = pd.read_csv("path_to_folder/sorting_filename.tsv"، sep="\t"، index_col=0)
    3. استبدل مسار الملف المناسب واسم الملف. إذا كان الملف ملف .csv، فقم بإزالة sep="\t".
  4. استخدم الدالة المتوفرة plot_heatmap_comparison في ملف أدوات Python المساعدة لإجراء مقارنة خريطة حرارية على إطار البيانات المحاذي والمحرف والمحاذي للطور عن طريق كتابة الأمر التالي في خلية جديدة:
    plot_heatmap_comparison(list_of_dfs ، list_for_legend ، جيني ، العنوان = str_title)
    1. استبدل قائمة بإطارات البيانات المحاذاة للتجارب المراد مقارنتها ب list_of_dfs.
    2. استبدل قائمة بالعناوين لكل إطار بيانات بنفس ترتيب قائمة إطارات البيانات ل list_for_legend.
    3. استبدل قائمة بأسماء الجينات (التي يجب تضمينها في فهرس إطارات البيانات) ليتم رسمها للجينات.
    4. استبدل عنوان سلسلة اختياري ب str_title.
      ملاحظة: إطار البيانات الأول في القائمة هو الإطار الذي سيتم استخدامه لترتيب الجينات في خريطة الحرارة. سيتم ترتيب الجينات حسب الحد الأقصى في الفترة الأولى لإطار البيانات هذا ، وسيتم استخدام نفس الترتيب لإطارات البيانات اللاحقة في القائمة.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تم تطبيق الخطوات الموضحة في البروتوكول أعلاه وفي سير العمل في الشكل 1 على خمس تجارب سلاسل زمنية متزامنة لدورة الخلية لإظهار مقارنتين تمثيليتين: بين النسخ المتماثلة بطرق تزامن مختلفة (فرمون التزاوج وشطف الطرد المركزي18) ومنصات التسلسل (تسلسل الحمض النووي الريبي [RNA-seq] والمصفوفات الدقيقة) ، وكذلك عبر الظروف التجريبية. تم إجراء تجارب متعددة باستخدام S. cerevisiae ، وتم جمع مرحلة دورة الخلية والبيانات التجريبية لكل تجربة. يتضمن سير العمل استخدام CLOCCS لتحديد معلمات تجارب السلاسل الزمنية المختلفة للتزامن / الإصدار ، باستخدام هذه المعلمات لمواءمة التجارب مع مقياس شريان حياة مشترك قابل للمقارنة ، ثم استخدام هذه التجارب المحاذاة للمقارنتين التمثيليتين.

لتوضيح المقارنة التمثيلية عبر النسخ المتماثلة ، اخترنا ثلاث تجارب أجريت بنفس السلالة وفي نفس الظروف التجريبية ، تسمى الحالة 1. كانت اثنتان من هذه التجارب تكرارات مباشرة لبعضها البعض ، وتم تحليل كلاهما عبر تحليل microarray ومزامنتها عبر التطهير بالطرد المركزي. تم تحليل التجربة الثالثة باستخدام تحليل RNA-seq ومزامنتها عبر توقف فرمون تزاوج عامل ألفا. لتوضيح المقارنة الثانية عبر التجارب ذات فترات دورة الخلية المختلفة ، تمت مقارنة تجربة الشرط 1 RNA-seq (فترة دورة الخلية: 71 دقيقة) من الأعلى مع الحالة 2 (فترة دورة الخلية: 82 دقيقة) ، والحالة 3 (فترة دورة الخلية: 110 دقيقة) (الجدول 2). لكل تجربة ، نمت الخلايا في ظروفها الخاصة ، وتمت مزامنتها ، وإطلاقها ، ثم أخذ عينات منها خلال فترتين أو أكثر من دورات الخلية. تم جمع بيانات قياس التبرعم و / أو التدفق الخلوي لتوفير معلومات عن مرحلة دورة الخلية ، وتم جمع بيانات نسخ السلاسل الزمنية microarray أو RNA-seq كما هو موضح في Leman et al.18 (الجدول التكميلي S1).

لكل تجربة ، اتخذت البيانات الأشكال الموضحة في الشكل 2 ، والذي يقدم تجربة الحالة 2 كمثال للتوضيح. كان لكل مجموعة بيانات منحنى ناشئ ، مما سمح بالاستدلال على مرحلة دورة الخلية. يتألف هذا المنحنى من قيمة النسبة المئوية الناشئة لكل نقطة زمنية في السلسلة الزمنية ، والتي تم رسمها بعد ذلك لإنتاج منحنى ناشئ يعرض تذبذبات متعددة لدورة الخلية (الشكل 2). كما اتخذت بيانات مرحلة دورة الخلية شكل بيانات تلطيخ محتوى الحمض النووي الخلوي المتدفق لكل نقطة زمنية في السلسلة الزمنية. تم رسم نقاط زمنية محددة للشرط 2 (الشكل 2). تم دمج ملفات قياس التدفق الخلوي في جدول واحد يضم الخلايا الموجودة في كل صندوق مضان لوغاريتم لكل نقطة زمنية للإدخال في CLOCCS باستخدام الدالة flow_cytometry_CLOCCS_file_from_fcs في أدوات Python المساعدة. احتوت كل مجموعة بيانات أيضا على بيانات تجريبية. في هذه الحالة ، كانت البيانات عبارة عن بيانات نسخية ، وتم تنظيم البيانات في صفوف من الجينات ، لكل منها قيمة لوفرة الحمض النووي الريبي في كل نقطة زمنية في التجربة (الشكل 2).

لقد أثبتنا استخدام CLOCCS والتحويل إلى نقاط شريان الحياة لمجموعة بيانات الشرط 2 RNA-seq ؛ ومع ذلك ، كانت العملية متطابقة بالنسبة للتجارب الأخرى أيضا. تم إدخال المعلومات الناشئة في خوارزمية CLOCCS كما هو موضح في قسم البروتوكول 3 وكما هو موضح في الشكل 3A. تم استخدام القيم الافتراضية ل Sim Anneal و Burn In و Repeatrations والإعدادات المتقدمة. تم اختيار الظروف التجريبية المناسبة. تم استخدام نوع نموذج "Bud" للبيانات الناشئة. تم عرض نوبات CLOCCS الناشئة الناتجة للتأكد من أن منحنيات الناشئ كانت مناسبة بشكل صحيح ، كما هو موضح من خلال نقاط البيانات التي تراكب منحنى الملاءمة المقابل مع نطاق ثقة صغير بنسبة 95٪ (الشكل 3B والشكل التكميلي S1). تم تسجيل المعلمات μ0 و λ من جدول المعلمات الخلفية (الشكل 3C) لاستخدامها في المحاذاة. تم إدخال بيانات قياس التدفق الخلوي للحالة 2 بشكل منفصل في CLOCCS ، كما هو موضح في قسم البروتوكول 3. حاليا ، تتوقع CLOCCS أن تنتج أجهزة قياس التدفق الخلوي بيانات 10 بت مع 1024 قناة. ومع ذلك ، يمكن أن تحتوي مقاييس التدفق الخلوي الحديثة على المزيد من القنوات. نظرا لأن مقياس التدفق الخلوي الخاص بنا ينتج بيانات بأكثر من 1024 قناة ، فقد تم تجميع البيانات في 1024 صندوقا. باستخدام بيانات مرحلة دورة الخلية لقياس التدفق الخلوي ، ينتج CLOCCS CLOCCS مناسبا لكل نقطة زمنية محددة (الشكل 3D والشكل التكميلي S2) ويوفر جدول معلمات خلفي مشابه لجدول المعلمات الخلفية الناشئة في الشكل 3C. يتم وصف معلمات التبرعم التي يديرها CLOCCS لكل تجربة من التجارب الأخرى في الجدول 2 ، ويتم وصف معلمات قياس التدفق الخلوي التي يشغلها CLOCCS في الجدول التكميلي S2.

تم استخدام معلمات CLOCCS المقابلة لفترة دورة الخلية للخلايا الأم (λ) ووقت الاسترداد (μ0) لمحاذاة شريان الحياة. من المهم ملاحظة أن λ لا تمثل بالضرورة متوسط فترة دورة الخلية لسكان الخلايا. في الحالات التي تخضع فيها الخلايا لانقسام كامل ، هناك عدد متساو من الخلايا الأم والابنة ، وبالتالي فإن متوسط فترة دورة الخلية هو المتوسط بين فترة دورة الخلية للخلايا الأم (λ) وفترة دورة الخلية للخلايا الوليدة (λ + δ) ؛ على وجه التحديد ، دلتا (δ) هو طول التأخير الخاص بالابنة. هذه هي العملية الحسابية التي استخدمناها لفترة دورة الخلية لكل تجربة (الجدول 2). لكل تجربة ، تم بعد ذلك استخدام المعلمات المقابلة λ و μ0 في دالة التحويل ، df_conversion_from_parameters ، المتوفرة في ملف أدوات Python المساعدة ، كما هو موضح للشرط 2 (الشكل 4A). بالنسبة للمنحنيات الناشئة ، لم يتم استيفاء البيانات. ومع ذلك ، بالنسبة للبيانات التجريبية ، تم إعادة تشكيل مجموعات البيانات المتوافقة مع شريان الحياة باستخدام الاستيفاء بحيث تحتوي كل نقطة شريان حياة على بيانات محفورة لتحسين التخطيط. للتأكد من أن مجموعات البيانات المحاذاة لخط الحياة لها نفس نطاق نقاط شريان الحياة، تم تعيين حدود شريان الحياة الأدنى والأعلى لاقتطاع البيانات في تلك النقاط. تم إدخال هذه المعلمات السفلية والعلوية في الدالة df_conversion_from_parameters عند تعيين الاستيفاء على True. بالنسبة لمقارنة الحالة 1 ، تم تعيينها على 44 و 270 ، على التوالي ، لجميع مجموعات البيانات ، وللمقارنة عبر الظروف البيئية ، تم تعيينها على 50 و 300 ، على التوالي. يمكن رؤية مثال على استخدام هذه الوظائف للمحاذاة والمقارنة في مثال دفتر ملاحظات Python JOVE_example.ipynb ، ويمكن رؤية الكود المستخدم لإنشاء الأشكال في دفتر ملاحظات JOVE_Figures.ipynb في الريبو CLOCCS_alignment.

يعتمد هذا التحويل من نقاط زمنية إلى نقاط شريان الحياة على صيغتين21 (الشكل 4 أ) باستخدام μ0 (وقت الاسترداد) و λ (الفترة الأم). الصيغة الأولى ، Equation 1هي صيغة مرحلة الاسترداد (الشكل 4 أ). تستخدم هذه الصيغة فقط للنقاط الزمنية خلال مرحلة الاسترداد ، والتي تتكون من النقاط الزمنية حتى μ 0 ، حيث يتوافق μ0 مع وقت الاسترداد. ثم يتم تحويل النقاط الزمنية إلى نطاق مقياس شريان الحياة ينتهي ب 100 نقطة شريان الحياة (الجدول 1) ، مما يشير إلى نهاية مرحلة الاسترداد وبداية دورة الخلية الأولى. تستخدم مرحلة ما بعد التعافي الصيغة الثانية ، Equation 2 (الشكل 4 أ) ، والتي تحول كل نقطة زمنية لاحقة بعد التعافي إلى نقطة شريان الحياة بعد 100. تتوافق كل 100 نقطة شريان حياة لاحقة مع دورة خلية جديدة ، حيث تتوافق الدورة الأولى مع نقاط شريان الحياة من 100 إلى 200 ، والدورة الثانية المقابلة لنقاط شريان الحياة من 200 إلى 300 ، وهكذا (الجدول 1). يتم تطبيق التحويل من نقاط زمنية إلى نقاط شريان الحياة على كل مجموعة بيانات على حدة باستخدام معلمات CLOCCS المقابلة لمجموعة البيانات هذه. بعد تحويل كل مجموعة بيانات إلى مقياس شريان الحياة، تتم محاذاة مراحل دورة الخلية، مما يسمح بإجراء مقارنات خاصة بالمرحلة عبر مجموعات البيانات.

يوضح الجدول 3 تحويل نقاط زمنية محددة إلى نقاط شريان الحياة الخاصة بها للتحويل التمثيلي لمجموعة بيانات الحالة 2 باستخدام معلمات من تشغيل CLOCCS الناشئ. تم رسم البيانات الناشئة التي تم جمعها من الشرط 2 RNA-seq في منحنى ناشئ يوضح النسبة المئوية للتبرعم بمرور الوقت لكل من المقياس الزمني غير المحاذي بالدقائق (الشكل 4 ب) والجدول الزمني المحاذي في نقاط شريان الحياة (الشكل 4 ج) باستخدام دالة Python plot_budding_curves في دفتر ملاحظات Python. يمكن تحويل نقاط شريان الحياة بسهولة إلى معلومات طور تجريبية ودورة الخلية (الجدول 1) ، وتم ترميز مرحلة الاسترداد ودورات الخلية من الأولى إلى الثالثة يدويا وفقا لذلك (الشكل 4B ، C). نظرا لأن كل نقطة شريان حياة تتوافق مع مرحلة دورة الخلية ، يمكن تسمية مخططات قياس التدفق الخلوي الفردية عبر وظائف Python باستخدام مرحلة دورة الخلية التي تحددها محاذاة شريان الحياة. تتطابق هذه المراحل مع المراحل المحددة عن طريق تحليل التدفق الخلوي للحالة 2. تم رسم بيانات قياس التدفق الخلوي التي تم جمعها لمجموعة بيانات الحالة 2 لنقاط زمنية محددة وتم تصنيفها باستخدام مرحلة دورة الخلية المحددة من محاذاة شريان حياة قياس التدفق الخلوي. في كل حالة ، تطابقت البيانات مع المرحلة التي تحددها المحاذاة (الشكل 4D).

من المهم ملاحظة أن مستوى التعبير لكل جين لكل عينة يظل كما هو ، ولكن يتم تغيير تسمية النقاط الزمنية من الوقت بالدقائق إلى نقاط شريان الحياة. ومع ذلك ، فإن التحويل ليس خطيا. تحتل مرحلة الاسترداد ، الموضحة باللون الرمادي ، نسبة أعلى من الوقت التجريبي بمجرد إجراء التحويل إلى نقاط شريان الحياة (الشكل 4B ، C). تتمثل ميزة مقياس شريان الحياة في أنه يسمح بمعلومات مفصلة عن المرحلة ومقارنات الطور عبر التجارب. يتم تضمين معلومات المرحلة في نقاط شريان الحياة ، كما هو موضح أعلاه وعرضها في الجدول 1. علاوة على ذلك ، يتم تضمين G1 في أول 15.5 نقطة شريان حياة لكل دورة خلية ، و S في نقاط شريان الحياة العشرين التالية ، و G2 / M في نقاط شريان الحياة 64.5 التالية (الجدول 1). ومع ذلك ، فإن هذا يقيد بشكل مصطنع وقت الاسترداد إلى نفس الفترة الزمنية لكل دورة خلية متتالية ، حتى لو بدت مرحلة الاسترداد قصيرة جدا في مقياس النقطة الزمنية الأصلي. هذا لا يحجب المقارنات ، لأن مراحل كل تجربة موائمة. في معظم الحالات ، يكون من الأنسب مقارنة البيانات في النقاط التي تحدث في نفس المرحلة التجريبية والبيولوجية بدلا من النقاط الزمنية التي تحدث في نفس الوقت بالدقائق.

بمجرد تحويل جميع التجارب إلى مقياس شريان الحياة المحاذي باستخدام وظائف Python المتوفرة في ملف أدوات Python المساعدة ، يمكن مقارنتها. هنا ، نوضح مقارنتين شائعتين بين التجارب: واحدة بين النسخ المكررة لتجربة مماثلة عبر المنصات وطرق التزامن (الشكل 5) والأخرى بين الظروف التجريبية المختلفة مع طول فترة متغير (الشكل 6 والشكل 7). كما هو موضح أعلاه ، فإن المقارنة الأولى هي عبر اثنين من النسخ المكررة الدقيقة الموضحة وتجربة واحدة متزامنة لعامل ألفا RNA-seq. قبل المحاذاة ، أظهر مكررا المصفوفات الدقيقة ديناميكيات متزامنة ودورة خلية مماثلة ، لكن تكرار Condition 1 Microarray 2 بدا متأخرا قليلا (الشكل 5A). تم العثور على الاختلاف الأكثر لفتا للنظر عند مقارنة مجموعات البيانات غير المحاذية. ظهرت الدورة الثانية للشرط 1 RNA-seq محاذاة مع الدورة الأولى من تجربتي microarray . من المحتمل ألا يكون الاختلاف مرتبطا بمنصات النسخ المختلفة بل بطرق المزامنة المختلفة. تمت مزامنة مجموعات الخلايا في تجارب microarray عن طريق التطهير بالطرد المركزي ، بينما تمت مزامنة السكان لتجربة RNA-seq عن طريق علاج فرمون التزاوج. في الواقع ، أدى التزامن مع فرمون التزاوج إلى تقليل وقت التعافي بشكل كبير مقارنة بالتطهير (الشكل 5 أ والجدول 2).

على الرغم من الاختلافات الواضحة بين النسخ المتماثلة عند رسمها من حيث الوقت المنقضي ، بعد محاذاة شريان الحياة ، كانت المنحنيات متطابقة تقريبا ، وأصبحت المقارنات الأكثر تفصيلا وذات صلة عبر النسخ المتماثلة ممكنة (الشكل 5 ب). تمت محاذاة مرحلة الاسترداد بحيث بدأت كل تجربة في نفس نقطة شريان الحياة ، وتم تطبيع الاختلافات في الفترة من خلال محاذاة شريان الحياة. بسبب المحاذاة ، حدثت القيم التجريبية في نفس نقطة شريان الحياة عبر النسخ المتماثلة في نفس مرحلة دورة الخلية ، مما يتيح حسابات التباين التجريبي عبر النسخ المتماثلة. يشار إلى مرحلتي التعافي ودورة الخلية في الشكل 5B لتوفير معلومات إضافية عن مراحل دورة الخلية في كل تجربة من التجارب. يمكن بعد ذلك تطبيق محاذاة شريان الحياة هذه على مجموعة البيانات التجريبية (الشكل 5C ، D) باستخدام وظيفة Python df_conversion_from_parameters المتوفرة في ملف الأدوات المساعدة ، كما هو موضح أعلاه.

في الشكل 5D ، تمت محاذاة البيانات النسخية ، وتم رسم ديناميكيات التعبير لجين CDC20 باستخدام دالة plot_linegraph_comparison Python في دفتر ملاحظات Python. قبل المحاذاة ، بدا كما لو أن تعبير الذروة الأول لتجارب microarray يتماشى مع الذروة الثانية لتجربة RNA-seq (الشكل 5C) ؛ ومع ذلك ، بعد المحاذاة ، تتم محاذاة قمم دورة الخلية الأولى لكل مجموعة بيانات بشكل صحيح (الشكل 5D). علاوة على ذلك ، يبدو أن عرض الذروة للتجارب يختلف بين مجموعة بيانات RNA-seq ومجموعات بيانات microarray ، ولكن بعد المحاذاة ، كان عرض الذروة أكثر محاذاة (الشكل 5C ، D).

المقارنة الثانية هي بين التجارب في ظروف بيئية مختلفة مع فترات دورة الخلية المختلفة (الشكل 6). كما هو موضح أعلاه ، هنا ، قارنا مجموعات بيانات S. cerevisiae في الحالة 1 بالحالة 2 والحالة 3 ، والتي تتوافق مع فترات دورة الخلية 71 و 82 و 110 دقيقة على التوالي. أدت هذه الاختلافات في فترة دورة الخلية إلى عدم اليقين عند المقارنة عبر التجارب قبل محاذاة طور دورة الخلية ، كما هو موضح في منحنيات التبرعم غير المحاذاة. تظهر اختلافات الفترة في منحنيات التبرعم غير المحاذية (الشكل 6 أ). ومع ذلك ، عندما تمت محاذاة CLOCCS باستخدام هذا البروتوكول ، بدت المنحنيات الثلاثة متشابهة بشكل ملحوظ ، مما يجعل مقارنات البيانات التجريبية ممكنة (الشكل 6B).

باستخدام معلمات CLOCCS لقياس التدفق الخلوي ، تمت محاذاة الحالة 1 والحالة 2 إلى مقياس شريان الحياة المشترك ، وتم رسم الرسوم البيانية لمحتوى الحمض النووي في الحالة 2 وفي نقاط شريان الحياة المكافئة في الحالة 1. تمت مقارنة قياسات التدفق الخلوي لمحتوى الحمض النووي عبر نقاط شريان الحياة (الشكل 6C). نظرا لأن قياسات محتوى الحمض النووي لم تكن مستمرة ولم يكن من السهل استيفاءها ، يمكننا فقط مقارنة أقرب نقاط شريان الحياة. لم تكن بيانات مرحلة دورة الخلية لكل نقطة شريان حياة قابلة للمقارنة متطابقة بين الشرطين (الشكل 6C) ، مما يشير إلى أن ملاءمة CLOCCS والمعلمات الناتجة من المحتمل أن تكون غير محاذاة قليلا للحالة 1. كان هذا على الأرجح بسبب ملاءمة CLOCCS الأضعف لبيانات القياس الخلوي للتدفق للحالة 1 مقارنة بالحالة 2 (الشكل التكميلي 2). ومع ذلك ، فإن المحاذاة انحرفت فقط في عينة واحدة ، وبالتالي ، لا تزال تسمح بتحسين المقارنات الخاصة بالطور.

ثم تم تطبيق محاذاة شريان الحياة الناشئ على البيانات التجريبية لتجارب RNA-seq في الحالة 1 والحالة 2 والحالة 3 (الشكل 7) باستخدام معلمات CLOCCS الناشئة في الدالة df_conversion_from_parameters على البيانات التجريبية. تمت محاذاة بيانات النسخ ، وتم عرض التعبير الجيني للجين CDC20 لكل سلسلة زمنية للتجارب الثلاث. قبل المحاذاة ، كانت ديناميكيات النص ل CDC20 غير متداخلة (الشكل 7 أ). بعد المحاذاة ، كانت القمتين الأولى والثانية للتعبير الجيني CDC20 أكثر توافقا مع مجموعات البيانات الثلاث. بعد المحاذاة ، أصبح من الواضح أن القمم حدثت في نفس مرحلة دورة الخلية ، لكن أشكال المنحنيات كانت مختلفة (الشكل 7 ب). كان للحالة 3 ذروة أولى أقل وأوسع مقارنة بالشرطين الآخرين ، حتى بعد حساب الاختلافات في فترة دورة الخلية ، مما يشير إلى أن هذه الاختلافات كانت مرتبطة على الأرجح بالظروف التجريبية التي يتم اختبارها (الشكل 7 ب).

يمكن أيضا إجراء مقارنات نسخية واسعة النطاق. لهذه المقارنات ، تم اختيار 278 جينا عن طريق تشغيل خوارزمية الدوريةJTK_CYCLE 23 على كل مجموعة بيانات وأخذ تقاطع الجينات الدورية العليا. ومع ذلك ، يمكن اختيار الجينات باستخدام أي طريقة مرغوبة أو من الأدبيات. تم رسم هذه الجينات بنفس الترتيب لجميع الشروط الثلاثة لكل من الخرائط الحرارية غير المحاذاة (الشكل 7C) والمحاذاة (الشكل 7D) باستخدام دالة plot_heatmap_comparison Python في دفتر ملاحظات Python. تسمح خرائط الحرارة هذه بإجراء مئات المقارنات على مستوى الجينات في وقت واحد. يمكن إجراء مقارنات عبر التجارب غير المحاذاة فيما يتعلق بالتغير في ديناميكيات المنحنى ، ووقت الذروة بالنسبة للجينات المجاورة ، وطول الفترة ، وما إلى ذلك (الشكل 7C). ومع ذلك ، لا يمكن إجراء مقارنات مفصلة خاصة بالطور لأن النقاط الزمنية لا ترتبط بالضرورة بنفس مرحلة دورة الخلية عبر الظروف. على الرغم من أن الدورات الثانية بدت متشابهة بعد المحاذاة ، إلا أن الدورات الأولى تحولت قليلا بين الظروف (الشكل 7 د). قد يعكس هذا التحول حقيقة أن معلومات مرحلة دورة الخلية الناشئة كانت ذات جودة أقل للحالة 3. ومع ذلك ، فإن محاذاة التجارب للشروط الثلاثة سمحت بمقارنة محسنة خاصة بالطور. قبل المحاذاة ، لم يكن من الواضح ما إذا كانت ذروة التعبير الأولى في كل حالة ستحدث في نفس مرحلة دورة الخلية (الشكل 7C) ؛ ومع ذلك ، بعد المحاذاة ، يمكن مقارنة التجارب بطريقة خاصة بالمرحلة (الشكل 7 د). قبل المحاذاة ، بدت القمم في الحالة 3 أوسع بكثير مما كانت عليه في الحالتين الأخريين (الشكل 7C) ؛ ومع ذلك ، بعد المحاذاة ، أصبح من الواضح أن القمم في الحالة 3 كانت ذات عرض مماثل للظروف الأخرى عند المحاذاة (الشكل 7D).

توضح هذه النتائج التمثيلية عملية استخدام CLOCCS لمواءمة التجارب مع مقياس زمني مشترك. قبل المحاذاة ، غالبا ما لا ترتبط مقارنات النقاط الزمنية المباشرة بمرحلة دورة خلية مماثلة. يسمح تحويل الوقت التجريبي المنقضي بالدقائق إلى نقاط شريان الحياة التي تمثل مرحلة دورة الخلية بإجراء مقارنات خاصة بالطور وذات صلة بيولوجية بين التجارب في نفس النقطة في دورة الخلية.

Figure 1
الشكل 1: نظرة عامة على سير عمل محاذاة شريان الحياة CLOCCS. سير العمل التجريبي لمحاذاة مجموعتي بيانات نموذجيتين باستخدام CLOCCS ، متبوعا بمقارنات تمثيلية بين مجموعات البيانات. يتم توضيح الخطوات الرئيسية من البروتوكول: جمع مرحلة دورة الخلية غير المحاذاة والبيانات التجريبية لكل مجموعة من مجموعات البيانات (الخطوة 1) ، واستخدام CLOCCS لتحديد معلمات كل مجموعة بيانات (الخطوة 2 والخطوة 3) ، ومواءمة مجموعات البيانات مع شريان حياة مشترك (الخطوة 4) ، وأخيرا ، مقارنة مرحلة دورة الخلية والديناميات التجريبية (الخطوة 5 والخطوة 6). يتم إدخال بيانات مرحلة دورة الخلية غير المحاذاة في CLOCCS لتوفير المعلمات المستفادة ، والتي يتم استخدامها بعد ذلك للمحاذاة إلى مقياس شريان الحياة المشترك. ثم تتم مقارنة مجموعات البيانات المتوافقة هذه. اختصار: CLOCCS = توصيف فقدان تزامن دورة الخلية. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: تنسيق مرحلة دورة الخلية والبيانات التجريبية المطلوبة لسير العمل. تتكون البيانات المطلوبة لسير العمل من مكونين رئيسيين: بيانات مرحلة دورة الخلية والبيانات التجريبية لدورة الخلية. يمكن أن تتكون بيانات طور دورة الخلية من بيانات ناشئة دورة الخلية أو بيانات محتوى الحمض النووي المتدفق الخلوي لكل نقطة زمنية في السلسلة الزمنية. يمكن أن تتخذ البيانات التجريبية أشكالا عديدة ، ولكن في هذه الحالة ، هي بيانات النسخ ، والتي تتكون من بيانات التعبير الجيني لكل جين لكل نقطة زمنية في السلسلة الزمنية. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: مثال على النتائج من تشغيل CLOCCS على مجموعة بيانات دورة الخلية S. cerevisiae. (أ) لقطة شاشة لواجهة المستخدم الرسومية CLOCCS مع قيم الإدخال والإعدادات المقدمة لبيانات الحالة 2 الناشئة. يتم إدخال الأوقات وعدد الخلايا غير الناشئة وعدد الخلايا الناشئة ، بالإضافة إلى نوع النموذج والتكرارات والشروط ، وما إلى ذلك. (ب) لقطة شاشة لملاءمة CLOCCS الناشئة الناتجة للشرط 2 ضمن علامة التبويب "الملاءمة المتوقعة" للنتائج. تحتوي كل نقطة بيانات على شريط خطأ في أخذ العينات مرتبط يتوافق مع فترات ثقة النسبة ذات الحدين بنسبة 95٪ للبيانات (لكل نقطة زمنية ، تم حساب 200 خلية على الأقل [بين 204 و 295 خلية]). يظهر منحنى الملاءمة الناشئ الناتج نطاق الثقة لفاصل الثقة 95٪ لتناسب CLOCCS باللون الأرجواني. (ج) لقطة شاشة لجدول "المعلمات الخلفية" الناتج لتشغيل CLOCCS الناشئ للشرط 2 والذي يتكون من معلمات CLOCCS عند المتوسط ، وفترة الثقة 2.5٪ ، وفترة الثقة 97.5٪. كما يتم عرض معدلات التأخير والقبول. (د) لقطة شاشة لقياس التدفق الخلوي CLOCCS يناسب الحالة 2 في 70 دقيقة و 150 دقيقة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الشكل.

Figure 4
الشكل 4: مثال على عملية التحويل من النقاط الزمنية إلى نقاط شريان الحياة المحاذاة لمجموعة بيانات الشرط 2 . (أ) صيغ التحويل المستخدمة للتحويل من نقاط زمنية إلى نقاط شريان الحياة. لقطة شاشة لوظائف Python في دفتر ملاحظات Python للتحويل ورسم المنحنيات الناشئة. (ب) منحنى التبرعم غير المحاذي للحالة 2 الذي يوضح النسبة المئوية الناشئة لكل نقطة زمنية بالدقائق. يتم تمييز مراحل دورة الخلية والاسترداد على النحو التالي: الانتعاش (الرمادي) ، دورة الخلية الأولى (الأزرق) ، دورة الخلية الثانية (أرجواني) ، ودورة الخلية الثالثة (السلمون). (ج) يظهر منحنى مهد الحالة 2 المحاذي نفس النسب المئوية للتبرعم ولكنه مرسوم على مقياس محاذاة لشريان الحياة. يتم تمييز دورة الخلية ومراحل الاسترداد كما في اللوحة C. (د) يرسم قياس التدفق الخلوي المحاذي لنقاط زمنية مختارة من الحالة 2 المقابلة لمراحل دورة الخلية المتميزة بناء على مقياس شريان الحياة: بداية G1 ، وبداية المرحلة S ، وبداية G2 / M ، وأواخر G2 / M. الرجاء النقر هنا لعرض نسخة أكبر من هذا الشكل.

Figure 5
الشكل 5: النتائج التمثيلية لمقارنة تجارب تكرار الشرط 1 المحاذاة وغير المحاذاة. مقارنة بين تكرار الشرط 1: الشرط 1 RNA-seq (أزرق) ، الشرط 1 ميكروأري 1 (أرجواني) ، والشرط 1 ميكروأري 2 (رمادي). (أ) منحنى الناشئ غير المحاذي لمجموعات بيانات الحالة 1. (ب) منحنى الناشئ المحاذي لمجموعات بيانات الشرط 1. تم تحويل نقاط شريان الحياة إلى مرحلة دورة الخلية ويتم ترميزها بالألوان أسفل المحور السيني. ) التعبير الجيني غير المحاذي لجين تمثيلي، CDC20، لمجموعات بيانات الحالة 1. د: التعبير الجيني المحاذي لجين تمثيلي، CDC20، لمجموعات بيانات الحالة 1. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 6
الشكل 6: النتائج التمثيلية لمقارنة بيانات طور دورة الخلية المحاذاة وغير المحاذاة عبر التجارب ذات الفترات المختلفة. مقارنة بيانات طور دورة الخلية لمجموعات البيانات بثلاثة ظروف بيئية مختلفة ، وبالتالي ثلاث فترات مختلفة لدورة الخلية: الحالة 1 RNA-seq (فترة دورة الخلية: 71 دقيقة) ، الحالة 2 RNA-seq (فترة دورة الخلية: 82 دقيقة) ، والحالة 3 RNA-seq (فترة دورة الخلية: 110 دقيقة). (أ) منحنى التبرعم غير المحاذي لمجموعات البيانات. (ب) منحنى الناشئ المحاذي لمجموعات البيانات. (ج) الرسوم البيانية لمحتوى الحمض النووي المتدفق الخلوي للحالة 2 (الصف العلوي) مقارنة بنقاط شريان الحياة المكافئة في الحالة 1 (الصف السفلي). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 7
الشكل 7: النتائج التمثيلية لمقارنة بيانات النسخ المحاذاة وغير المحاذاة عبر التجارب ذات الفترات المختلفة. مقارنة بين البيانات النسخية المرتبطة بمجموعات البيانات في الشكل 6: الشرط 1 RNA-seq والشرط 2 والشرط 3. (أ) التعبير الجيني غير المحاذي لجين تمثيلي، CDC20، لمجموعات بيانات الحالة 1 والشرط 2 والشرط 3 RNA-seq. ب: التعبير الجيني المحاذي ل CDC20 لمجموعات البيانات. ج: الخريطة الحرارية غير المحاذية للجينات الدورية لدورة الخلية العليا بنفس الترتيب لكل مجموعة بيانات. د: الخرائط الحرارية المحاذية لشريان الحياة لنفس الجينات الدورية لدورة الخلية من اللوحة (ج ) بنفس الترتيب. تتوافق الخطوط الأرجوانية المتقطعة مع نقطتي شريان الحياة 100 و 200. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

الجدول 1: يشير شريان الحياة إلى تحويل طور دورة الخلية. مفتاح التحويل بين مقياس نقطة شريان الحياة والمرحلة المقابلة في التجربة. تتوافق نقاط شريان الحياة من 0 إلى 100 مع الاسترداد من التزامن. تتوافق كل نقطة شريان حياة 100 لاحقة مع دورة خلية جديدة ، حيث تتوافق أول 15.5 نقطة شريان حياة مع G1 ، وتقابل العشرون التالية الطور S ، ونقاط شريان الحياة المتبقية المقابلة ل G2 / M. الرجاء النقر هنا لتنزيل هذا الجدول.

الجدول 2: معلمات CLOCCS الناشئة. معلمات CLOCCS الناشئة الناتجة "lambda" و "mu0" لكل تجربة من النتائج التمثيلية. بالإضافة إلى ذلك ، يتم عرض التأخير الخاص بالابنة "دلتا" وفترة دورة الخلية المحسوبة لكل تجربة. الرجاء الضغط هنا لتنزيل هذا الجدول.

الجدول 3: جدول التحويل الذي يوضح التحويل بين النقاط الزمنية بالدقائق ونقاط شريان الحياة المقابلة لكل منها للشرط 2. الرجاء الضغط هنا لتنزيل هذا الجدول.

الشكل التكميلي S1: مهد CLOCCS يناسب الشرط 1 والشرط 3. لقطة شاشة لمهد CLOCCS الناتج يتناسب مع (أ) بيانات ناشئة تسلسل الحمض النووي الريبي للحالة 1 ، (ب) بيانات ناشئة المصفوفات الدقيقة 1 للحالة 1 ، (ج) بيانات ناشئة المصفوفات الدقيقة 1 2 ، و (د) بيانات مهد الحالة 3. يمكن رؤية ملاءمة CLOCCS الناشئة للحالة 2 في الشكل 3B. نطاق الثقة 95٪ وأشرطة خطأ أخذ العينات كما هو موضح في وثائق CLOCCS14,15 وفي الشكل 3. لكل نقطة زمنية لكل سلسلة زمنية ، تم حساب ما يقرب من 200 خلية. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي S2: قياس التدفق الخلوي CLOCCS يناسب الحالة 1 والحالة 2. لقطة شاشة لقياس التدفق الخلوي CLOCCS يناسب العينات الموضحة في الشكل 6C للحالة 2 (الصف العلوي: A-D) والحالة 1 ( الصف السفلي: E ، F). الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي S3: حساسية المحاذاة للاختلافات في معلمات CLOCCS. مقارنة محاذاة مجموعة بيانات الشرط 1 RNA-Seq باستخدام الاختلافات (A-C) في معلمات CLOCCS λ و μ0 ضمن فترة الثقة لملاءمة CLOCCS و (D ، E) مع اختلافات كبيرة في المعلمات. مقارنة بين القيمة المتوسطة مع قيم الثقة 2.5٪ و 97.5٪ الناتجة في جدول المعلمات بواسطة CLOCCS ل (A) المعلمة μ0 ، (B) المعلمة λ ، و (C) لكل من المعلمات μ0 و λ. (د) مقارنة بين المحاذاة باستخدام القيمة المتوسطة ل μ0 مقارنة بالاختلافات الكبيرة في المعلمة μ0 (200٪ إلى 0.25٪ من μ0). (ه) مقارنة بين المحاذاة باستخدام القيمة المتوسطة ل λ مقارنة بالاختلافات الكبيرة في المعلمة λ (200٪ إلى 0.25٪ من λ). الرجاء الضغط هنا لتنزيل هذا الملف.

الجدول التكميلي S1: وصف جمع البيانات لكل تجربة. لكل تجربة ، يوفر هذا الجدول وصفا للبيانات الناشئة ، وبيانات قياس التدفق الخلوي ، وبيانات النسخ ، وطريقة التزامن. الرجاء الضغط هنا لتنزيل هذا الملف.

الجدول التكميلي S2: معلمات CLOCCS من تشغيل CLOCCS لقياس التدفق الخلوي. تعمل معلمات CLOCCS "mu0" و "lambda" لقياس التدفق الخلوي للحالة 1 والحالة 2. الرجاء الضغط هنا لتنزيل هذا الملف.

الملف التكميلي 1: تعليمات لتحويل بيانات التدفق الخلوي إلى تنسيق إدخال CLOCCS. لاستخدام CLOCCS مع بيانات التدفق الخلوي ، يلزم وجود تنسيق إدخال محدد. يوفر هذا الملف إرشادات أكثر تفصيلا بخصوص خطوة البروتوكول 3.4.1 لشرح كيفية استخدام وظائف الأداة المساعدة Python لإجراء هذا التحويل. الرجاء الضغط هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

تقدم هذه الورقة طريقة لتقييم البيانات بشكل أكثر دقة وكمية من تجارب السلاسل الزمنية على مجموعات متزامنة من الخلايا. تستخدم الطريقة المعلمات المستفادة من CLOCCS ، وهو نموذج استدلال بايزي يستخدم بيانات مرحلة دورة الخلية المدخلة ، مثل البيانات الناشئة وبيانات محتوى الحمض النووي الخلوي المتدفق ، لتحديد معلمات كل تجربة14,15. يستخدم CLOCCS بيانات مرحلة دورة الخلية المدخلة لاستنتاج المعلمات لكل تجربة ، والتي يتم استخدامها بعد ذلك للمحاذاة إلى مقياس شريان الحياة المشترك. يسمح تحويل تجارب السلاسل الزمنية المتعددة للتزامن / الإصدار إلى مقياس زمني واحد يتماشى مع شريان الحياة بإجراء مقارنات خاصة بالمرحلة وذات صلة بين التجارب وتجميع تجارب متعددة مكررة ، والتي كانت صعبة أو مستحيلة في السابق.

تتضمن الخطوات الحاسمة لهذا البروتوكول جمع البيانات وتشغيل CLOCCS ومواءمة مجموعات البيانات والمقارنة عبر مجموعات البيانات. أولا ، يجب جمع البيانات لاستخدامها في هذا البروتوكول. يجب أن تتكون البيانات من كل من المعلومات التجريبية التي تحتوي على بيانات فيما يتعلق بمسألة الاهتمام (أي البيانات النسخية ، وبيانات التعبير الجيني ، والبيانات البروتينية) - وبيانات مرحلة دورة الخلية التي تحتوي على معلومات عن مرحلة دورة الخلية (أي البيانات الناشئة ، بيانات محتوى الحمض النووي المتدفق الخلوي). بعد ذلك ، يمكن استخدام بيانات مرحلة دورة الخلية في CLOCCS لجمع معلومات المعلمة لكل تجربة. يتم استخدام المعلمات μ 0 (طول مرحلة الاسترداد) و λ (فترة دورة الخلية الأم) لتحويل النقاط الزمنية إلى نقاط شريان الحياة. تسمح محاذاة نقطة شريان الحياة بمقارنة السلسلة الزمنية المحاذية مباشرة.

أحد قيود الطريقة هو أن المحاذاة الصحيحة تعتمد على تحديد ملاءمة جيدة للبيانات. يعتمد تحقيق أفضل ملاءمة CLOCCS على جودة بيانات طور دورة الخلية واستخدام إعدادات الإدخال الصحيحة للتجربة في CLOCCS. يحدد الملاءمة لبيانات مرحلة دورة الخلية دقة المعلمات المكتسبة ، وبالتالي ، يؤثر بشكل كبير على دقة المحاذاة ، لأنه يعتمد على استخدام هذه المعلمات. وبما أن التغييرات الواسعة في البارامترات ستؤثر تأثيرا كبيرا على المواءمة، فإن التغييرات تظل ضئيلة ضمن فترة الثقة المقدمة في ناتج CLOCCS (الشكل التكميلي S3). من المهم ملاحظة أن هذه الحساسية للاختلافات في المعلمات هي أيضا ما يسمح بالمواءمة بين مجموعات البيانات مع اختلاف توقيت دورة الخلية.

يمكن تحديد دقة ملاءمة CLOCCS باستخدام منحنى ملاءمة CLOCCS الناتج وأشرطة الخطأ المقابلة ونطاق الخطأ (الشكل 3B ، D ، الشكل التكميلي S1 ، والشكل التكميلي S2). تعرض علامة التبويب ملائمة CLOCCS نقاط البيانات الأصلية ، بالإضافة إلى منحنى ملاءمة CLOCCS مع نطاق الثقة المقابل لفاصل الثقة لملاءمة CLOCCS وأشرطة الخطأ المقابلة لفاصل ثقة النسبة ذات الحدين 95٪ للبيانات ، حيث يفترض أن تكون الأعداد متغيرات عشوائية ذات حدين مستقلة14. على سبيل المثال ، تقيس أشرطة الثقة في البيانات الناشئة الثقة في نسبة الخلايا الناشئة لعينة معينة.

تتضمن إحدى طرق تحديد جودة ملاءمة CLOCCS تحديد ما إذا كانت أشرطة الخطأ في البيانات تتداخل مع نطاق فاصل الثقة لملاءمة CLOCCS. مؤشر آخر هو اتساع نطاق الثقة بنسبة 95٪ لملاءمة CLOCCS. بشكل عام ، ينخفض عرض الشريط مع زيادة جودة الملاءمة. مؤشر على ضعف المحاذاة هو إذا كانت مرحلة دورة الخلية للبيانات الأصلية لا تتطابق مع مرحلة دورة الخلية المستنتجة من المحاذاة. يمكن التحقق من كل محاذاة مرة أخرى من خلال التأكد من أنه في كل نقطة زمنية ، تتطابق المرحلة المشار إليها بواسطة بيانات معلومات مرحلة دورة الخلية مع مرحلة دورة الخلية المعينة بواسطة المحاذاة.

يمكن أن يكون سوء ملاءمة CLOCCS أو سوء المحاذاة نتيجة لبيانات طور دورة الخلية منخفضة الجودة. سيكون للبيانات الناشئة عالية الجودة نسبة تبرعم منخفضة للغاية بعد الاعتقال مباشرة ونسبة تبرعم عالية جدا في الذروة الأولى. ستفقد القمم والقيعان اللاحقة التزامن ولكن يجب أن تكون متميزة ومتباعدة بشكل متساو. نظرا لأن نقاط شريان الحياة تمثل متوسط مرحلة دورة الخلية للسكان ، فإن التزامن الضعيف يمكن أن يعيق المحاذاة الصحيحة أيضا. سيكون لبيانات محتوى الحمض النووي عالي الجودة لقياس التدفق الخلوي قمم مميزة 1C و 2C لكل نقطة زمنية تتوافق مع مرحلة دورة الخلية المناسبة. بالإضافة إلى ذلك ، تؤدي بيانات مرحلة دورة الخلية غير الكافية إلى حدوث مشاكل في تحديد المعلمات. في حالة وجود بيانات كافية ، يمكن استنتاج المعلمات ولا تتغير بشكل كبير بين عمليات تشغيل CLOCCS. ومع ذلك ، لا يمكن فصل المعلمات الموضحة في هذا البروتوكول (lambda ، delta ، mu0) عندما تحتوي بيانات طور دورة الخلية على دورة خلية كاملة واحدة فقط. للسماح بتقدير المعلمات المحسن ، يجب استخدام بيانات دورة الخلية الكافية وجيدة البناء ل CLOCCS يناسب14،15. علاوة على ذلك ، يستخدم نموذج CLOCCS معلومات مسبقة كما هو موضح في Orlando et al.15 ، ولكن يمكن تعديل هذه المعلومات لتناسب الظروف التجريبية المستخدمة بشكل أفضل.

إذا كانت جودة بيانات طور دورة الخلية جيدة ، فقد تساعد إعادة ضبط إعدادات CLOCCS في إنتاج ملاءمة أكثر دقة. على سبيل المثال ، يمكن زيادة عدد التكرارات المحددة لتحسين الدقة. يمكن أن يكون التأكد من اختيار طريقة المزامنة الصحيحة في CLOCCS مفيدا أيضا ، نظرا لأن إيقاف عامل ألفا يرتبط بوقت استرداد أقصر مقارنة بالإزالة.

هذه الطريقة محدودة أيضا من حيث أنواع بيانات مرحلة دورة الخلية المدعومة حاليا. ومع ذلك ، فإن CLOCCS مرنة ويمكن تكييفها لدعم أنواع أخرى من البيانات. على سبيل المثال ، تم تكييف CLOCCS سابقا لدعم وضع العلامات الفلورية لدورة الخلية لأجسام قطب المغزل وحلقات الميوسين والنوى11 لاستخدامها كمعرفات لطور دورة الخلية. وعلاوة على ذلك، أصبح من الممكن استخدام CLOCCS مع أنواع أخرى غير S. cerevisiae. يقبل CLOCCS مؤشرات التقسيم كعلامة لمرحلة دورة الخلية في S. pombe14 ، بالإضافة إلى بيانات محتوى الحمض النووي المتدفق الخلوي ، والتي يمكن جمعها بسهولة للعديد من الأنواع15. يسمح هذا بمقارنة البيانات التجريبية في نفس المرحلة من دورة الخلية لنوعين مختلفين تماما ويمكن أن يعطي نظرة ثاقبة للتغيرات في دورة الخلية عبر التطور.

على الرغم من أنه يمكن استخدام الأشكال المدعومة فقط من بيانات طور دورة الخلية مع طريقة محاذاة شريان الحياة هذه ، إلا أن هذه الطريقة محايدة لنوع البيانات التجريبية للسلاسل الزمنية المستخدمة. في هذا البروتوكول ، أثبتنا استخدامه في محاذاة التعبير الجيني لجين فردي ، بالإضافة إلى بيانات نسخ السلاسل الزمنية لمئات الجينات جنبا إلى جنب. لقد أظهرنا أنه يمكن استخدام هذه الطريقة للمقارنة عبر الأنظمة الأساسية ، وبالتالي إجراء مقارنات بين مجموعات بيانات RNA-seq ومجموعات بيانات microarray المأخوذة في ظروف مماثلة. لقد أظهرنا أيضا أنه يمكن استخدام هذه الطريقة لمواءمة مجموعات البيانات مع طرق المزامنة المختلفة من خلال المقارنة بين مجموعة البيانات التي تم توضيحها (الشرط 1 Microarray) مع مجموعة بيانات تم القبض على عامل ألفا (الشرط 1 RNA-seq). في السابق ، تم استخدام CLOCCS أيضا لمواءمة بيانات نسخ السلاسل الزمنية والبيانات البروتينية للسلاسل الزمنية باستخدام بيانات طور دورة الخليةالناشئة 22 ، مما سمح بإجراء مقارنات مباشرة بين ديناميكيات mRNA وديناميكيات البروتين المقابل. كما تم استخدام CLOCCS لمواءمة بيانات السلاسل الزمنية عبر الأنواع ، مثل المحاذاة بين S. cerevisiae و S. pombe14 وبين الدورة الأولى من S. cerevisiae والخميرة المسببة للأمراض Cryptococcus neoformans21. أخيرا ، تعد محاذاة CLOCCS حاليا خاصة ببيانات السلاسل الزمنية لدورة الخلية ولم يتم تكييفها بعد للاستخدام مع أنواع أخرى من العمليات الإيقاعية. أحد المجالات التي يكون فيها هذا ذا أهمية خاصة هو إيقاعات الساعة البيولوجية ، حيث يتم استخدام وقت الساعة البيولوجية (CT) تقليديا لمحاذاة التجارب ، على الرغم من عدم تطبيق تنفيذه باستمرار. مجال آخر للاهتمام هو التحقيق في إيقاعات النمو ، مثل تلك الخاصة بطفيلي الملاريا. فعلى سبيل المثال، فإن محاذاة سلالات المتصورة المنجلية مع فترات مختلفة، كما هو موضح في Smith et al.25، من شأنه أن يسمح بإجراء مقارنات أكثر تفصيلا عبر السلالات. إن مواءمة هذه العمليات الدورية للمقارنة من شأنها أن تسمح بفهم أفضل لهذه الوظائف البيولوجية الإيقاعية الهامة. أصبحت هذه الأنواع من مقارنات دورة الخلية ممكنة باستخدام CLOCCS لمحاذاة شريان الحياة ، كما هو موضح في هذا البروتوكول.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس لدى المؤلفين أي تضارب في المصالح للكشف عنه.

Acknowledgments

تم دعم S. Campione و S. Haase بتمويل من المؤسسة الوطنية للعلوم (DMS-1839288) والمعاهد الوطنية للصحة (5R01GM126555). بالإضافة إلى ذلك ، يود المؤلفون أن يشكروا Huarui Zhou (جامعة ديوك) على تعليقاتهم على المخطوطة وعلى الاختبار التجريبي للبروتوكول. نشكر أيضا فرانسيس موتا (جامعة فلوريدا أتلانتيك) وجوشوا روبنسون على مساعدتهم في كود Java.

Materials

Name Company Catalog Number Comments
2x PBS For Fixative Solution. Described in Leman 2014.
4% formaldehyde For Fixative Solution.
100% Ethanol For flow cytometry fixation. Described in Haase 2002.
CLOCCS https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer For flow cytometry protocol.
Git https://git-scm.com/
Java 19 https://www.oracle.com/java/technologies/downloads/#java19
Microscope For counting cells and buds.
Miniconda https://docs.conda.io/en/latest/
Protease solution For flow cytometry protocol. Described in Haase 2002.
RNAse A solution For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain Invitrogen S7020 For flow cytometry staining. Described in Haase 2002.
Tris pH 7.5

DOWNLOAD MATERIALS LIST

References

  1. Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
  2. Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
  3. Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
  4. Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
  5. Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
  6. Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
  7. Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
  8. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  9. Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
  10. Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
  11. Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
  12. Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
  13. Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
  14. Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
  15. Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
  16. Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
  17. Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
  18. Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
  19. Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
  20. Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
  21. Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
  22. Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
  23. Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
  24. Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
  25. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

هذا الشهر في JoVE ، العدد 196 ، المحاذاة ، السلاسل الزمنية ، علم النسخ ، التزامن ، دورة الخلية ، قياس التدفق الخلوي ، النماذج ، البرامج
محاذاة بيانات السلاسل الزمنية المتزامنة باستخدام توصيف فقدان نموذج تزامن دورة الخلية للمقارنات عبر التجارب
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Campione, S. A., Kelliher, C. M.,More

Campione, S. A., Kelliher, C. M., Orlando, D. A., Tran, T. Q., Haase, S. B. Alignment of Synchronized Time-Series Data Using the Characterizing Loss of Cell Cycle Synchrony Model for Cross-Experiment Comparisons. J. Vis. Exp. (196), e65466, doi:10.3791/65466 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter