Waiting
登录处理中...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Inherent Dynamics Visualizer ، تطبيق تفاعلي لتقييم وتصور المخرجات من خط أنابيب الاستدلال على شبكة تنظيم الجينات

Published: December 7, 2021 doi: 10.3791/63084

Summary

إن Inherent Dynamics Visualizer عبارة عن حزمة تصور تفاعلية تتصل بأداة استدلال شبكة تنظيمية جينية لتوليد محسن ومبسط لنماذج الشبكات الوظيفية. يمكن استخدام المتخيل لاتخاذ قرارات أكثر استنارة لوضع معلمات أداة الاستدلال ، وبالتالي زيادة الثقة في النماذج الناتجة.

Abstract

يعد تطوير نماذج الشبكات التنظيمية الجينية تحديا كبيرا في بيولوجيا النظم. وقد تم تطوير العديد من الأدوات الحسابية وخطوط الأنابيب لمواجهة هذا التحدي، بما في ذلك خط أنابيب الديناميكيات المتأصلة الذي تم تطويره حديثا. يتكون خط أنابيب الديناميكيات المتأصلة من العديد من الأدوات المنشورة سابقا والتي تعمل بشكل تآزري ومتصلة بطريقة خطية ، حيث يتم استخدام مخرجات أداة واحدة كمدخلات للأداة التالية. كما هو الحال مع معظم التقنيات الحسابية ، تتطلب كل خطوة من خطوات Inherent Dynamics Pipeline من المستخدم اتخاذ خيارات حول المعلمات التي ليس لها تعريف بيولوجي دقيق. يمكن أن تؤثر هذه الخيارات بشكل كبير على نماذج الشبكات التنظيمية الجينية التي ينتجها التحليل. لهذا السبب ، يمكن أن تساعد القدرة على تصور واستكشاف عواقب خيارات المعلمات المختلفة في كل خطوة على زيادة الثقة في الخيارات والنتائج. Inherent Dynamics Visualizer هي حزمة تصور شاملة تعمل على تبسيط عملية تقييم خيارات المعلمات من خلال واجهة تفاعلية داخل متصفح الويب. يمكن للمستخدم فحص مخرجات كل خطوة من خطوات خط الأنابيب بشكل منفصل ، وإجراء تغييرات بديهية استنادا إلى المعلومات المرئية ، والاستفادة من الإنتاج التلقائي لملفات الإدخال الضرورية لخط أنابيب الديناميكيات المتأصلة. يوفر Inherent Dynamics Visualizer مستوى لا مثيل له من الوصول إلى أداة معقدة للغاية لاكتشاف الشبكات التنظيمية الجينية من بيانات النسخ ذات السلاسل الزمنية.

Introduction

العديد من العمليات البيولوجية الهامة، مثل تمايز الخلايا والاستجابة البيئية، تحكمها مجموعات من الجينات التي تتفاعل مع بعضها البعض في شبكة تنظيم الجينات (GRN). تنتج GRNs هذه ديناميكيات النسخ اللازمة لتنشيط النمط الظاهري الذي تتحكم فيه والحفاظ عليه ، لذا فإن تحديد المكونات والبنية الطوبولوجية ل GRN هو المفتاح لفهم العديد من العمليات والوظائف البيولوجية. يمكن نمذجة GRN كمجموعة من الجينات المتفاعلة و / أو المنتجات الجينية التي تصفها شبكة تكون عقدها هي الجينات والتي تصف حوافها اتجاه وشكل التفاعل (على سبيل المثال ، تنشيط / قمع النسخ ، والتعديل بعد الترجمة ، وما إلى ذلك) 1. يمكن بعد ذلك التعبير عن التفاعلات كنماذج رياضية معلمة تصف تأثير الجين المنظم على إنتاج هدفه (أهدافه) 2،3،4. يتطلب الاستدلال على نموذج GRN كلا من الاستدلال على بنية شبكة التفاعل وتقدير معلمات التفاعل الأساسية. تم تطوير مجموعة متنوعة من طرق الاستدلال الحسابي التي تستوعب بيانات التعبير الجيني للسلاسل الزمنية ونماذج GRN الناتجة 5. في الآونة الأخيرة، تم تطوير طريقة استدلال GRN جديدة، تسمى خط أنابيب الديناميكيات المتأصلة (IDP)، والتي تستخدم بيانات التعبير الجيني للسلاسل الزمنية لإنتاج نماذج GRN مع تفاعلات مستهدفة من قبل المنظم قادرة على إنتاج ديناميكيات تتوافق مع الديناميكيات المرصودة في بيانات التعبير الجيني6. IDP عبارة عن مجموعة من الأدوات المتصلة خطيا بخط أنابيب ويمكن تقسيمها إلى ثلاث خطوات: خطوة العثور على العقدة التي تصنف الجينات بناء على خصائص التعبير الجيني المعروفة أو المشتبه في ارتباطها بوظيفة GRN7,8 ، وهي خطوة Edge Finding التي تصنف العلاقات التنظيمية الزوجية 8 ، 9 ، وخطوة العثور على الشبكة التي تنتج نماذج GRN القادرة على إنتاج الديناميكيات المرصودة10،11،12،13،14،15.

مثل معظم الطرق الحسابية ، يتطلب IDP مجموعة من الوسيطات المحددة من قبل المستخدم والتي تملي كيفية تحليل بيانات الإدخال ، ويمكن أن تؤدي مجموعات مختلفة من الوسيطات إلى نتائج مختلفة على نفس البيانات. على سبيل المثال، تحتوي عدة طرق، بما في ذلك IDP، على وسيطات تطبق بعض العتبة على البيانات، ويمكن أن تؤدي زيادة/تقليل هذه العتبة بين عمليات التشغيل المتتالية للطريقة المعينة إلى نتائج مختلفة بين عمليات التشغيل (انظر الملاحظة الملحق 10: طرق استدلال الشبكة من5). إن فهم كيفية تأثير كل حجة على التحليل والنتائج اللاحقة أمر مهم لتحقيق ثقة عالية في النتائج. على عكس معظم طرق الاستدلال GRN ، يتكون IDP من أدوات حسابية متعددة ، لكل منها مجموعة خاصة بها من الحجج التي يجب على المستخدم تحديدها ولكل منها نتائجها الخاصة. في حين أن IDP توفر وثائق شاملة حول كيفية وضع معلمات لكل أداة ، فإن الاعتماد المتبادل لكل أداة على مخرجات الخطوة السابقة يجعل تحديد معلمات خط الأنابيب بأكمله دون تحليلات وسيطة أمرا صعبا. على سبيل المثال ، من المرجح أن تكون الحجج في خطوات Edge و Network Finding مستنيرة بالمعرفة البيولوجية السابقة ، وبالتالي ستعتمد على مجموعة البيانات و / أو الكائن الحي. ولاستجواب النتائج الوسيطة، ستكون هناك حاجة إلى فهم أساسي للبرمجة، فضلا عن فهم عميق لجميع ملفات النتائج ومحتوياتها من IDP.

مصور الديناميكيات المتأصلة (IDV) هو حزمة تصور تفاعلية يتم تشغيلها في نافذة مستعرض المستخدم وتوفر طريقة لمستخدمي IDP لتقييم تأثير خيارات الوسيطة الخاصة بهم على النتائج من أي خطوة في IDP. يتنقل IDV في بنية دليل معقدة تنتجها IDP ويجمع البيانات اللازمة لكل خطوة ويقدم البيانات في أشكال وجداول بديهية وتفاعلية للمستخدم لاستكشافها. بعد استكشاف هذه الشاشات التفاعلية ، يمكن للمستخدم إنتاج بيانات جديدة من خطوة IDP التي يمكن أن تستند إلى قرارات أكثر استنارة. ويمكن بعد ذلك استخدام هذه البيانات الجديدة على الفور في الخطوة التالية ذات الصلة من IDP. بالإضافة إلى ذلك، يمكن أن يساعد استكشاف البيانات في تحديد ما إذا كان يجب إعادة تشغيل خطوة IDP باستخدام معلمات معدلة. يمكن ل IDV تعزيز استخدام IDP ، وكذلك جعل استخدام IDP أكثر سهولة وسهولة ، كما يتضح من خلال التحقيق في المذبذب الأساسي GRN لدورة خلية الخميرة. يتضمن البروتوكول التالي نتائج IDP من تشغيل IDP كامل المعلمات مقابل نهج يتضمن IDV بعد تشغيل كل خطوة IDP ، أي العقدة والحافة والعثور على الشبكة.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. تثبيت IDP و IDV

ملاحظة: يفترض هذا القسم أن docker و conda و pip و git مثبتة بالفعل (جدول المواد).

  1. في المحطة الطرفية، أدخل الأمر: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
  2. اتبع إرشادات التثبيت في الملف التمهيدي الخاص بموفر الهوية.
  3. في المحطة الطرفية، أدخل الأمر: git استنساخ https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
    ملاحظة: يجب أن يحدث استنساخ IDV خارج دليل المستوى الأعلى ل IDP.
  4. اتبع إرشادات التثبيت في الملف التمهيدي الخاص ب IDV.

2. العثور على العقدة

  1. إنشاء ملف تكوين IDP جديد يقوم بمعلمة الخطوة بحث عن العقدة.
    ملاحظة: يجب عدم كتابة كافة علامات الاقتباس في الخطوات التالية. يتم استخدام علامات الاقتباس هنا فقط كمحدد بين نص البروتوكول وما سيتم كتابته.
    1. أضف وسيطات IDP الرئيسية إلى ملف التكوين.
    2. افتح ملفا نصيا جديدا في محرر نصوص واكتب "data_file =" و "annotation_file =" و "output_dir =" و "num_proc =" و "IDVconnection = True" على أسطر فردية.
    3. بالنسبة إلى "data_file"، بعد المساواة في العلامة، اكتب المسار إلى ملف السلسلة الزمنية المعني واسمه واكتب فاصلة بعد الاسم. افصل كل بيانات بفاصلة، إذا كان يتم استخدام أكثر من مجموعة بيانات سلسلة زمنية واحدة. راجع الملف التكميلي 1 والملف التكميلي 2 للحصول على مثال على ملفات التعبير الجيني للسلاسل الزمنية.
    4. اكتب المسار إلى ملف التعليقات التوضيحية واسمه ل "annotation_file"، بعد علامة "يساوي ل". راجع الملف التكميلي 3 للحصول على مثال لملف تعليق توضيحي.
    5. بالنسبة إلى "output_file"، بعد المساواة في العلامة، اكتب المسار إلى المجلد الذي سيتم حفظ النتائج فيه واسمه.
    6. بعد علامة "مساواة للتوقيع num_proc"، اكتب عدد العمليات التي يجب أن يستخدمها IDP.
    7. إضافة وسيطات البحث عن العقدة إلى ملف التكوين.
    8. في نفس الملف النصي كما في الخطوة 2.1.1، اكتب الترتيب المقدم "[dlxjtk_arguments]" و "فترات =" و "dlxjtk_cutoff =" على أسطر فردية. ضع هذه بعد الحجج الرئيسية.
    9. بالنسبة إلى "الفترات"، بعد علامة المساواة للعلامة، إذا كان يجري استخدام مجموعة بيانات سلسلة لمرة واحدة، اكتب كل طول فترة مفصولة بفواصل. بالنسبة لأكثر من مجموعة بيانات سلسلة زمنية واحدة، اكتب كل مجموعة من أطوال الفترات كما كان من قبل ولكن ضع أقواس مربعة حول كل مجموعة وضع فاصلة بين المجموعات.
    10. بعد علامة المساواة، بالنسبة ل "dlxjtk_cutoff"، اكتب عددا صحيحا يحدد الحد الأقصى لعدد الجينات التي يجب الاحتفاظ بها في ناتج gene_list_file بواسطة de Lichtenberg بواسطة JTK_CYCLE (DLxJTK) (الجدول 1).
      ملاحظة: يوصى بشدة بمراجعة أقسام dlxjtk_arguments في IDP README للحصول على فهم أفضل لكل وسيطة. راجع الملف التكميلي 4 للحصول على مثال لملف تكوين مع وسيطات بحث العقدة المحددة.
  2. في المحطة الطرفية، انتقل إلى دليل IDP، المسمى inherent_dynamics_pipeline.
  3. في المحطة الطرفية ، أدخل الأمر: conda تنشيط dat2net
  4. قم بتشغيل IDP باستخدام ملف التكوين الذي تم إنشاؤه في الخطوة 2.1 عن طريق تشغيل هذا الأمر في المحطة الطرفية، حيث <اسم ملف التكوين> هو اسم الملف: اسم ملف python src/dat2net.py
  5. في المحطة الطرفية، انتقل إلى الدليل المسمى inherent_dynamics_visualizer وأدخل الأمر: . /viz_results.sh
    ملاحظة: سيشير إلى الدليل المستخدم كدليل إخراج لموفر الهوية.
  6. في مستعرض ويب، أدخل http://localhost:8050/ كعنوان URL.
  7. مع فتح IDV الآن في المتصفح ، انقر فوق علامة التبويب البحث عن العقدة وحدد مجلد البحث عن العقدة الذي يهمه من القائمة المنسدلة.
  8. قم بتنظيم قائمة جينات جديدة يدويا من جدول قائمة الجينات في IDV لاستخدامها في خطوات IDP اللاحقة.
    1. لتوسيع جدول قائمة الجينات أو تقصيره، انقر فوق السهمين لأعلى أو لأسفل أو أدخل يدويا عددا صحيحا بين 1 و50 في المربع بجوار التعبير الجيني للجينات المصنفة في DLxJTK. أعلى:.
    2. في جدول قائمة الجينات، انقر على المربع بجانب الجين لعرض ملف تعريف التعبير الجيني الخاص به في رسم بياني خطي. يمكن إضافة جينات متعددة.
    3. حدد اختياريا عدد الصناديق المتساوية الحجم لحساب الجينات وترتيبها حسب الفاصل الزمني الذي يحتوي على تعبير الذروة، عن طريق إدخال عدد صحيح في مربع الإدخال أعلى جدول قائمة الجينات المسمى عدد صحيح الإدخال لتقسيم الدورة الأولى إلى سلال:.
      ملاحظة: هذا الخيار خاص بالديناميكيات المتذبذبة وقد لا ينطبق على أنواع أخرى من الديناميكيات.
    4. حدد تفضيل عرض الخريطة الحرارية من خلال النقر على خيار ضمن ترتيب الجينات حسب: التعبير الأقصى للدورة الأولى (الجدول 1) الذي يأمر الجينات بناء على وقت ذروة التعبير الجيني في الدورة الأولى.
      ملاحظة: يقوم DLxJTK Rank بترتيب الجينات استنادا إلى ترتيب الدورية من خوارزمية DLxJTK الخاصة ب IDP.
    5. انقر فوق الزر تنزيل قائمة الجينات لتنزيل قائمة الجينات إلى تنسيق الملف المطلوب لخطوة البحث عن الحافة. راجع الملف التكميلي 5 للحصول على مثال لملف قائمة الجينات.
  9. في جدول التعليقات التوضيحية للجينات القابلة للتحرير، قم بتسمية جين كهدف أو منظم أو كليهما في ملف التعليقات التوضيحية لخطوة البحث عن الحافة في تشغيل بحث الحافة الجديد. إذا كان الجين منظما، فقم بتسمية الجين على أنه منشط أو مثبط أو كليهما.
    1. لتسمية جين كمنشط ، انقر فوق الخلية في عمود tf_act وقم بتغيير القيمة إلى 1. لتسمية جين كمثبط، قم بتغيير القيمة في عمود tf_rep إلى 1. سيتم السماح للجين بالعمل كمنشط ومثبط في خطوة Edge Finding عن طريق تعيين القيم في كل من عمودي tf_act و tf_rep إلى 1.
    2. لتسمية جين كهدف ، انقر فوق الخلية في العمود الهدف وقم بتغيير القيمة إلى 1.
  10. انقر فوق الزر تنزيل ملف Annot. File لتنزيل ملف التعليق التوضيحي بتنسيق الملف المطلوب لخطوة البحث عن الحافة.

3. العثور على حافة

  1. إنشاء ملف تكوين IDP جديد يقوم بمعلمة خطوة البحث عن الحافة.
    1. أضف وسيطات IDP الرئيسية إلى ملف التكوين. افتح ملف نصي جديد في محرر نصوص وكرر الخطوة 2.1.1.
    2. إضافة وسيطات بحث الحافة إلى ملف التكوين.
    3. في نفس الملف النصي كما في الخطوة 3.1.1، اكتب الترتيب المقدم "[lempy_arguments]" و"gene_list_file =" و"[netgen_arguments]" و"edge_score_column =" و"edge_score_thresho =" و"num_edges_for_list =" و"seed_threshold =" و"num_edges_for_seed =" على الأسطر الفردية. يجب أن تكون هذه أقل من الحجج الرئيسية.
    4. بالنسبة إلى "gene_list_file"، بعد علامة المساواة، أدخل المسار إلى ملف قائمة الجينات الذي تم إنشاؤه في الخطوة 2.8.5 واسمه.
    5. بالنسبة إلى "edge_score_column" ، بعد علامة مساو ، أدخل إما "pld" أو "norm_loss" لتحديد عمود إطار البيانات من إخراج lempy المستخدم لتصفية الحواف.
    6. حدد إما "edge_score_threshold" أو "num_edges_for_list" ، واحذف الآخر. إذا تم تحديد "edge_score_threshold"، فأدخل رقما بين 0 و1. سيتم استخدام هذا الرقم لتصفية الحواف استنادا إلى العمود المحدد في الخطوة 3.1.5.
      1. إذا تم تحديد "num_edges_for_list"، فأدخل قيمة تساوي أو تقل عن عدد الحواف الممكنة. سيتم استخدام هذا الرقم لتصفية الحواف استنادا إلى كيفية ترتيبها في العمود المحدد في الخطوة 3.1.5. سيتم استخدام الحواف المتبقية لبناء الشبكات في العثور على الشبكة.
    7. حدد إما "seed_threshold" أو "num_edges_for_seed" واحذف الآخر. إذا تم تحديد "seed_threshold"، فأدخل رقما بين 0 و1. سيتم استخدام هذا الرقم لتصفية الحواف استنادا إلى العمود المحدد في الخطوة 3.1.5.
      1. إذا تم تحديد "num_edges_for_seed"، فأدخل قيمة تساوي أو تقل عن عدد الحواف الممكنة. سيتم استخدام هذا الرقم لتصفية الحواف استنادا إلى كيفية ترتيبها في العمود المحدد في الخطوة 3.1.5. سيتم استخدام الحواف المتبقية لبناء شبكة البذور (الجدول 1) المستخدمة في العثور على الشبكة.
        ملاحظة: يوصى بشدة بمراجعة قسمي lempy_arguments و netgen_arguments في IDP README للحصول على فهم أفضل لكل وسيطة. راجع الملف التكميلي 7 للحصول على مثال لملف تكوين مع وسيطات البحث عن Edge المحددة.
  2. كرر الخطوتين 2.2 و2.3.
  3. قم بتشغيل IDP باستخدام ملف التكوين الذي تم إنشاؤه في الخطوة 3.1 عن طريق تشغيل هذا الأمر في المحطة الطرفية، حيث <اسم ملف التكوين> هو اسم الملف: اسم ملف python src/dat2net.py
  4. إذا كان IDV لا يزال قيد التشغيل، فقم بإيقافه عن طريق الضغط على Control C في النافذة الطرفية لإيقاف البرنامج. كرر الخطوتين 2.5 و2.6.
  5. مع فتح IDV في المتصفح ، انقر فوق علامة التبويب Edge Finding وحدد مجلد البحث عن الحافة الذي يهمه من القائمة المنسدلة.
    ملاحظة: إذا تم استخدام مجموعات بيانات متعددة في البحث عن الحافة، فتأكد من تحديد آخر مجموعة بيانات تم استخدامها في تحليل جهاز الحافة المحلي (LEM) (الجدول 1). من المهم عند تحديد حواف لشبكة البذور أو قائمة الحواف استنادا إلى نتائج LEM إلقاء نظرة على بيانات السلسلة الزمنية الأخيرة المدرجة في ملف التكوين لأن هذا الإخراج يتضمن جميع ملفات البيانات السابقة في استدلاله على العلاقات التنظيمية بين العقد.
  6. لتوسيع جدول الحواف أو تقصيره، أدخل عددا صحيحا يدويا في مربع الإدخال ضمن عدد الحواف:.
  7. قم اختياريا بتصفية الحواف على معلمات LEM ODE. انقر واسحب لنقل الجانب الأيسر أو الجانب الأيمن من شريط تمرير كل معلمة لإزالة الحواف من جدول الحواف التي تحتوي على معلمات خارج حدود المعلمات الجديدة المسموح بها.
  8. قم اختياريا بإنشاء شبكة بذور جديدة إذا كانت هناك حاجة إلى شبكة بذور مختلفة عن تلك التي اقترحتها IDP. راجع الملف التكميلي 8 للحصول على مثال لملف شبكة بذور.
    1. حدد إما من البذور لتحديد شبكة البذور أو من التحديد من القائمة المنسدلة ضمن الشبكة:.
    2. قم بإلغاء تحديد/تحديد الحواف من جدول الحواف بالنقر فوق خانات الاختيار المقابلة المجاورة لكل حافة لإزالة/إضافة حواف من شبكة البذور.
  9. انقر فوق الزر تنزيل DSGRN NetSpec لتنزيل الشبكة الأولية بتنسيق مواصفات الشبكة الديناميكية التي تم إنشاؤها بواسطة الشبكات التنظيمية ( DSGRN ) (الجدول 1).
  10. حدد عقدا وحواف إضافية لاستخدامها في خطوة البحث عن الشبكة.
    1. حدد حواف من جدول الحافة بالنقر فوق خانات الاختيار المقابلة لتضمينها في ملف قائمة الحافة المستخدم في البحث عن الشبكة.
    2. انقر فوق تنزيل قوائم العقدة والحافة لتنزيل قائمة العقدة وملفات قائمة الحافة بالتنسيق المطلوب لاستخدامها في العثور على الشبكة. راجع الملف التكميلي 9 والملف التكميلي 10 للحصول على أمثلة على ملفات قائمة الحافة والعقدة، على التوالي.
      ملاحظة: يجب أن تحتوي قائمة العقدة على كافة العقد في ملف قائمة الحافة، لذلك يقوم IDV تلقائيا بإنشاء ملف قائمة العقدة استنادا إلى الحواف المحددة. يتوفر خياران لعرض الحواف في البحث عن الحافة. يعرض خيار جدول ملخص LEM الحواف كقائمة مرتبة لأفضل 25 حافة. يعرض جدول LEM العلوي الحواف في قائمة متسلسلة من الحواف الثلاثة الأولى لكل منظم محتمل. يمكن للمستخدم ضبط عدد الحواف المعروضة لكل خيار عن طريق تغيير الرقم في مربع إدخال عدد الحواف .

4. العثور على الشبكة

  1. إنشاء ملف تكوين IDP جديد يقوم بمعلمة الخطوة "البحث عن الشبكة".
    1. أضف وسيطات IDP الرئيسية إلى ملف التكوين. افتح ملف نصي جديد في محرر نصوص وكرر الخطوة 2.1.1.
    2. إضافة وسيطات بحث الشبكة إلى ملف التكوين.
    3. في نفس الملف النصي كما في الخطوة 4.1.1، اكتب الترتيب المقدم "[netper_arguments]" و "edge_list_file =" و "node_list_file =" و "seed_net_file =" و "range_operations =" و "numneighbors =" و "maxparams =" و "[[الاحتمالات]]" و "addNode =" و "addEdge =" و "removeNode =" و "removeEdge =" على الأسطر الفردية، أسفل الوسيطات الرئيسية.
    4. بالنسبة إلى "seed_net_file" و "edge_list_file" و "node_list_file"، بعد علامة المساواة، أدخل المسار إلى ملف شبكة البذور واسمه وملفات قائمة الحافة والعقدة التي تم إنشاؤها في الخطوتين 3.9 و3.10.2.
    5. بعد علامة "مساواة"، اكتب رقمين مفصولين بفاصلة، بالنسبة ل "range_operations". الرقمان الأول والثاني هما الحد الأدنى والحد الأقصى لعدد إضافة أو إزالة العقد أو الحواف لكل شبكة تم إنشاؤها ، على التوالي.
    6. بالنسبة إلى "numneighbors"، بعد تساوي العلامة، أدخل رقما يمثل عدد الشبكات التي يجب العثور عليها في Network Finding.
    7. بالنسبة إلى "maxparams" ، بعد المساواة في العلامة ، أدخل رقما يمثل الحد الأقصى لعدد معلمات DSGRN للسماح بالشبكة.
    8. أدخل قيما بين 0 و1 لكل وسيطة من هذه الوسيطات: "addNode" و"addEdge" و"removeNode" و"removeEdge"، بعد تساوي العلامة. يجب جمع الأرقام إلى 1.
      ملاحظة: يوصى بشدة بمراجعة قسمي netper_arguments و netquery_arguments في IDP README للحصول على فهم أفضل لكل وسيطة. راجع الملف التكميلي 11 والملف التكميلي 12 للحصول على أمثلة لملف تكوين مع وسيطات بحث الشبكة المحددة.
  2. كرر الخطوتين 2.2 و2.3.
  3. قم بتشغيل IDP باستخدام ملف التكوين الذي تم إنشاؤه في الخطوة 4.1 عن طريق تشغيل هذا الأمر في المحطة الطرفية، حيث <اسم ملف التكوين> هو اسم الملف: اسم ملف python src/dat2net.py
  4. إذا كان IDV لا يزال قيد التشغيل، فقم بإيقافه عن طريق الضغط على Control C في النافذة الطرفية لإيقاف البرنامج. كرر الخطوتين 2.5 و2.6.
  5. مع فتح IDV في المتصفح ، انقر فوق علامة التبويب البحث عن الشبكة وحدد مجلد البحث عن الشبكة الذي يهمك.
  6. حدد شبكة أو مجموعة من الشبكات لإنشاء جدول انتشار الحافة (الجدول 1) ولعرض الشبكات مع نتائج الاستعلام الخاصة بكل منها.
    1. يتوفر خياران لتحديد الشبكات: الخيار 1 - إدخال الحدود السفلية والعليا على نتائج الاستعلام عن طريق إدخال القيم الدنيا والقصوى في مربعات الإدخال المقابلة للمحور x والمحور y للمخطط. الخيار 2 - انقر واسحب فوق مخطط التشتت لرسم مربع حول الشبكات المراد تضمينها. بعد إدخال حدود التحديد أو الإدخال، اضغط على الزر الحصول على انتشار الحافة من الشبكات المحددة .
      ملاحظة: إذا تم تحديد أكثر من استعلام DSGRN واحد، فاستخدم أزرار الاختيار المسماة بنوع الاستعلام للتبديل بين نتائج كل استعلام. وينطبق الشيء نفسه إذا تم تحديد أكثر من إبسيلون واحد (مستوى الضوضاء).
  7. انقر فوق الأسهم الموجودة أسفل جدول انتشار الحافة للانتقال إلى الصفحة التالية من الجدول. اضغط على تنزيل الجدول لتنزيل جدول انتشار الحافة.
  8. أدخل عددا صحيحا في مربع إدخال فهرس الشبكة لعرض شبكة واحدة من التحديد الذي تم إجراؤه في الخطوة 4.6. انقر فوق تنزيل DSGRN NetSpec لتنزيل الشبكة المعروضة بتنسيق مواصفات شبكة DSGRN.
  9. ابحث في الشبكات عن التشابه مع فكرة محددة أو شبكة اهتمام.
    1. استخدم خانات الاختيار المقابلة لكل حافة لتحديد الحواف المراد تضمينها في الشبكة أو الشكل المستخدم لتحليل التشابه. انقر فوق إرسال لإنشاء مخطط تشتت التشابه للشكل أو الشبكة المحددة.
      ملاحظة: استخدم الأسهم الموجودة في قائمة الحواف للفرز أبجديا والأسهم الموجودة أسفل الجدول للانتقال إلى الصفحة التالية من الجدول.
    2. انقر واسحب فوق مخطط التشتت لرسم مربع حول الشبكات المراد تضمينها لتحديد شبكة أو مجموعة من الشبكات لإنشاء جدول انتشار حافة ولعرض الشبكات مع نتائج الاستعلام الخاصة بها.
      ملاحظة: إذا تم تحديد أكثر من استعلام DSGRN واحد، فاستخدم أزرار الاختيار المسماة بنوع الاستعلام للتبديل بين نتائج كل استعلام. وينطبق الشيء نفسه إذا تم تحديد أكثر من إبسيلون واحد (مستوى الضوضاء).
    3. كرر الخطوتين 4.7 و4.8 لتنزيل جدول انتشار الحافة والشبكة المعروضة لتحليل التشابه، على التوالي.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تم تطبيق الخطوات الموصوفة نصيا أعلاه وبيانيا في الشكل 1 على GRN المتذبذب الأساسي لدورة خلية الخميرة لمعرفة ما إذا كان من الممكن اكتشاف نماذج GRN الوظيفية القادرة على إنتاج الديناميكيات التي لوحظت في بيانات التعبير الجيني للسلسلة الزمنية التي تم جمعها في دراسة دورة خلية الخميرة16. ولتوضيح كيف يمكن ل IDV توضيح وتحسين مخرجات IDP ، تمت مقارنة النتائج ، بعد إجراء هذا التحليل بطريقتين: 1) تشغيل جميع خطوات IDP في ممر واحد بدون IDV و 2) التقدم عبر IDP بمساعدة IDV ، مما يسمح بتعديل النتائج الوسيطة من خلال دمج المعرفة البيولوجية السابقة واتخاذ خيارات محسنة بناء على مخرجات IDP. إن GRN لدورة خلايا الخميرة المدروسة جيدا والمستخدمة كمثال لديها العديد من علاقاتها التنظيمية التي تم التحقق منها تجريبيا. إذا كانت هناك دراسة كائن حي أو عملية بيولوجية مختلفة و / أو أقل شرحا ، فقد تكون الخيارات المتعلقة بكيفية تعديل النتائج أو المعلمات الوسيطة مختلفة. لتوضيح نوع واحد من الاستعلام الذي يمكن استخدامه لتقييم الشبكات، تم قياس متانة كل شبكة لدعم التذبذبات المستقرة ومطابقة ديناميكيات النسخ المرصودة لعقدها عبر معلمات النموذج.

تم أخذ بيانات السلاسل الزمنية للتعبير الجيني لسلسلتين متماثلتين من أورلاندو 200816 وتمت معالجتها مسبقا لإزالة أي تعبير جيني مرتبط بطريقة مزامنة دورة الخلية المطبقة في التجربة الأصلية (الملف التكميلي 1 والملف التكميلي 2). تم إنشاء ملف تعليق توضيحي يحتوي على جميع الجينات في بيانات السلسلة الزمنية التي يدعمها كل من ربط الحمض النووي وأدلة التعبير الموجودة في Yeastract17 وبالتالي يمكن أن تعمل كمنظم في GRN. تم تضمين TOS4 و PLM2 و NRM1 أيضا كمنظمين ، على الرغم من أنه لم يتم العثور عليها في Yeastract لكلا النوعين من الأدلة ، لأنه يعتقد أنها مهمة لجوهر الخميرة GRN استنادا إلى الأدلة في الأدبيات 18,19 (الملف التكميلي 3). تم تصنيف جميع المنظمين على أنهم منشطون وقمع وكذلك أهداف.

تم تعيين معلمة IDP لأول مرة لتشغيلها عبر جميع خطوات IDP ، أي العقدة والحافة والعثور على الشبكة. تم اختيار مجموعة من الحجج التي بدت مناسبة بناء على الفهم الحالي لدورة خلية الخميرة GRN ، وهي مجموعة صغيرة من الجينات المشاركة في شبكة متصلة بقوة (الملف التكميلي 4). أثر هذا الفهم في الغالب على خيارات اكتشاف العقدة والحافة. استندت معلمات الاحتمالات في Network Finding إلى افتراض أن الجينات الحقيقية والتفاعلات التنظيمية فقط هي التي سيتم تمريرها إلى Network Finding. وقد أسفر هذا التشغيل الكامل للمعلمات من IDP عن نتائج لاكتشاف العقدة والحافة (الشكل 2B ، C) ، ولكن في Network Finding لم يتم اكتشاف أي شبكات مقبولة للنموذج (الشكل 2A ، D). يتم شرح مقبولية النموذج في وثائق الرمز الخاصة بوحدة python dsgrn_net_gen 14 ، وهي تبعية ل IDP. باختصار ، لا يمكن الاستعلام عن الشبكات التي تحتوي على حواف ذاتية القمع أو تحتوي على عدد كبير جدا من المدخلات أو المخرجات في عقدة واحدة بواسطة برنامج DSGRN (الجدول 1). يقدم IDP العديد من الأسباب لعدم العثور على الشبكات المقبولة للنماذج ويصف خطوات استكشاف الأخطاء وإصلاحها لحل المشكلة (المشكلات). في الأساس ، يتضمن ذلك تغيير المعلمات و / أو ملفات الإدخال وإعادة تشغيل خطوة IDP المعنية ، وفحص النتائج. تم استخدام IDV لجعل هذه العملية أقل مملة وتستغرق وقتا طويلا.

تم تحميل نتائج اكتشاف العقدة في IDV لفحص الجينات التي يتم تمريرها إلى خطوة Edge Finding الخاصة ب IDP. العقد التي قدمها IDP هي أعلى جينات N كما تم ترتيبها بواسطة DLxJTK (الجدول 1) ، N التي يحددها المستخدم ، ومع ذلك ، قد لا تكون قائمة الجينات هذه مناسبة لهدف التحليل. وبدون معرفة بيولوجية مسبقة، أدى الاختيار التلقائي للعقد باستخدام درجات DLxJTK فقط إلى إرجاع جين مع أدلة محدودة على وجود دور في دورة خلية الخميرة (RME1)، في حين أن عددا قليلا من منظمات النسخ المعروفة لدورة الخلية لم تكن في مرتبة عالية (الشكل 2B). تم استخدام الأدلة التجريبية Yeastract للاختيار من بين الجينات الأعلى مرتبة من قبل DLxJTK تلك التي تحتوي على تعليق توضيحي لدورة الخلية. هذه الجينات هي SWI4 و YOX1 و YHP1 و HCM1 و FKH2 و NDD1 و SWI5. ويمكن رؤية علاقاتها التنظيمية المعروفة في الشكل 3. لا يظهر FKH2 في الجينات العشرة الأولى (dlxjtk_cutoff تم تعيينه على عشرة في الملف التكميلي 4) حسب ترتيب DLxJTK ، لذلك تم توسيع قائمة الجينات باستخدام IDV حتى تم العثور على FKH2 (الشكل 4). العديد من الجينات الإضافية في قائمة الجينات الموسعة هي جينات أساسية معروفة وكان من الممكن تفويتها دون التحقيق في نتائج اكتشاف العقدة. في حين تم العثور على جينات أساسية أكثر شهرة من خلال توسيع قائمة الجينات أسفل قائمة DLxJTK المصنفة ، تم التركيز على الجينات ذات الاهتمام. لذلك ، تم إلغاء اختيار بعض الجينات عالية المستوى ، مما أدى إلى قائمة جينات (الملف التكميلي 5) تحتوي على سبعة جينات (الشكل 4). تم إنشاء ملف تعليق توضيحي جديد (الملف التكميلي 6) استنادا إلى هذه الجينات السبعة، وتم تصنيف كل جين على أنه هدف، وتم تحديد نوع المنظم باستخدام Yeastract. تم تنزيل قائمة الجينات الجديدة وملف التعليقات التوضيحية للاستخدام اللاحق في خطوة IDP التالية، Edge Finding. بدون IDV ، سيتطلب إجراء إضافة الجينات وإزالتها من قائمة الجينات وملف التعليقات التوضيحية مهارات ترميز متواضعة.

تم وضع معلمة جديدة لملف تكوين IDP لخطوة بحث الحافة فقط (الملف التكميلي 7)، مع قائمة الجينات الجديدة وملف التعليقات التوضيحية. بعد الانتهاء من IDP مع ملف التكوين الجديد ، تم تحميل النتائج في IDV (الشكل 5A). نظرا لأن خطوة العثور على الشبكة تبحث بشكل عشوائي حول مساحة الشبكة الخاصة بشبكة البذور الموردة إليها ، فقد يكون توفير شبكة بذور جيدة أمرا مهما. يمكن اعتبار شبكة البذور الجيدة شبكة تحتوي على حواف حقيقية. باستخدام IDV واستخدام قواعد البيانات عبر الإنترنت مثل Yeastract وقاعدة بيانات Saccharomyces Genome (SGD)20 ، يمكن عرض شبكة البذور وتعديلها باستخدام العلاقات التنظيمية من LEM (الجدول 1) التي تحتوي على أدلة تجريبية. على سبيل المثال ، تم إلغاء تحديد الحافة YHP1 = tf_act (HCM1) لأنه لا يوجد دليل موثق على هذه العلاقة (الشكل 5B) في Yeastract. تمت إضافة الحافة SWI5 = tf_act (FKH2) حيث توجد أدلة موثقة على هذه العلاقة21. بمجرد أن تكون شبكة البذور (الجدول 1) مرضية ، تم تنزيل ملف مواصفات شبكة DSGRN للشبكة (الملف التكميلي 8).

بدون IDV ، هناك فرصة أكبر للحواف التي لا يوجد دليل تجريبي عليها تستخدم لبناء شبكة البذور. كما يتضح من الشكل 2C ، فإن شبكة البذور التي تم إنشاؤها في خطوة Edge Finding من تشغيل IDP دون توقف خلال كل خطوة تحتوي على حافة ، SWI4 = tf_rep (NDD1) ، والتي لا تدعمها الأدلة التجريبية في Yeastract ، على الأرجح لأن NDD1 معروف بأنه منشط نسخي 22. لم يتم ترميز هذه المعلومات في ملف التعليق التوضيحي في التشغيل بدون توقف ، مما سمح لجميع المنظمين بأن يكونوا منشطين وقامعين.

باستخدام IDV، تم تنسيق شبكة البذور يدويا وهي شبكة فرعية من الشكل 3، وتم وضع الحواف الأربعة المتبقية في قائمة الحواف المستخدمة لأخذ عينات من مساحة الشبكة (YHP1 = tf_act(SWI4)، YOX1 = tf_act(SWI4)، SWI4 = tf_rep(YOX1)، SWI5 = tf_act(NDD1)). يمكن أيضا استخدام اختيار الحواف بناء على المعرفة البيولوجية السابقة لبناء قائمة الحواف ؛ ومع ذلك، في هذه الحالة، تم تحديد أعلى 20 حافة من طريقة عرض جدول ملخص LEM (الملف التكميلي 9). يتم إنشاء ملف قائمة العقدة من الحواف المحددة تلقائيا (الملف التكميلي 10). يمكن أيضا استخدام معلمات ODE من LEM لتصفية الحواف إذا اعتقد المرء أن المعلمات المستنتجة في نموذج ODE ليست واقعية بيولوجيا ، ولكن لم يتم استخدام هذه المعلومات هنا.

بعد ذلك، تمت معلمة ملف تكوين IDP جديد لخطوة "البحث عن الشبكة" باستخدام الملفات الثلاثة الجديدة. نظرا لأن شبكة البذور تم إنشاؤها بحواف مدعومة جيدا بالأدلة التجريبية ، فقد كان من المرغوب فيه إدراج هذه الحواف في جميع الشبكات. وبالتالي ، تم تعيين احتمالات البحث عن الشبكة للسماح بإضافة العقد والحواف ولكن ليس إزالتها (الملف التكميلي 11). تم تعيين المعلمة "العثور على الشبكة" numneighbors للبحث عن 2000 شبكة. بعد تشغيل IDP ، تم العثور على 37 شبكة مقبولة للنموذج في خطوة العثور على الشبكة ، بدلا من التشغيل بدون توقف الذي كان صفرا. عند تحميل نتائج Network Finding في IDV ، كان لدى 64٪ (24) من هذه الشبكات ال 37 القدرة على التذبذب بشكل مستقر (الشكل 6A). ومن بين هذه الشبكات ال 24، كانت أفضل الشبكات أداء شبكتين تطابقان البيانات بنسبة 50٪ من معلمات نموذجهما المتذبذب بشكل ثابت (الشكل 6 ب).

يجدول انتشار الحافة (الجدول 1) عدد المرات التي تحدث فيها الحافة في مجموعة مختارة من الشبكات، مما يعطي مؤشرا على انتشارها في الشبكات عالية الأداء. ويكشف فحص جدول انتشار الحافة الذي تم إنتاجه عن طريق اختيار الشبكتين السابقتين في مخطط التشتت أن جميع حواف شبكة البذور موجودة في كل من الشبكتين، كما هو متوقع، إلى جانب حافتين لشبكة غير بذرية (الشكل 6B)، SWI4 = tf_act(SWI5) وHCM1 = tf_rep(YHP1). لم يكن لدى أي من هاتين الحافتين أدلة تدعمهما في Yeastract. على هذا النحو تم استكشاف كمية صغيرة من مساحة الشبكة لذلك من الصعب تقييم أهمية الحواف والعقد في إنتاج الديناميكيات المرصودة.

تم العثور على 37 شبكة مقبولة فقط في Network Finding على الرغم من تعيين عدد المعلمات إلى 2000 ، مما يشير إلى أن البحث في الشبكة ربما كان محدودا بشكل غير مبرر. كما هو موضح في الوثائق الخاصة بوحدة dsgrn_net_gen python في IDP ، يمكن أن تكون المشكلة مرتبطة بشبكة البذور أو قائمة الحافة أو قائمة العقدة أو خيارات معلمات البحث عن الشبكة أو مزيج من هذه. للتحقيق، تم استخدام نفس شبكة البذور وقائمة الحواف وقائمة العقد كما كان من قبل، ولكن تم تغيير معلمات البحث عن الشبكة عن طريق إضافة القدرة على إزالة الحواف أثناء إنشاء الشبكة (الملف التكميلي 12). يظهر تحميل نتائج Network Finding الجديدة في IDV أنه تم العثور على 612 شبكة في هذه الخطوة ، مع 67٪ (411) من هذه الشبكات لديها القدرة على التذبذب بشكل مستقر (الشكل 7A). ومن المثير للاهتمام أن 13٪ (82) من الشبكات التي كانت قادرة على ديناميكيات تذبذبية مستقرة لم تكن قادرة على إنتاج ديناميكيات مماثلة لتلك التي شوهدت في البيانات (الشكل 7B). ومن بين 411 شبكة، أظهرت 30٪ (124) تطابقات قوية مع البيانات (أي أن أكثر من 50٪ من معلمات نموذجها المتذبذبة بشكل ثابت أظهرت تطابقا للبيانات) (الشكل 7C).

تستند أرقام انتشار الحافة الناتجة عن الجولة الثانية من Network Finding الآن إلى مجموعة أكبر بكثير من الشبكات ويمكن استخدامها بثقة أكبر في تقييم أهمية العلاقة التنظيمية في GRN. على سبيل المثال، لا يزال HCM1 = tf_rep (YHP1) ممثلا بشكل كبير في الشبكات التي تنتج ديناميكيات قوية، مما يشير إلى أن هذه العلاقة قد تستحق التحقيق تجريبيا (الشكل 7C). وكشف مزيد من الفحص لجدول انتشار الحافة (استنادا إلى الشبكات ال 124 المذكورة أعلاه) أن الحواف SWI4 = tf_rep(YOX1) و YOX1 = tf_act (SWI4) ليست في مرتبة عالية حتى الآن فإن الحواف SWI4 = tf_rep (YHP1) و YHP1 = tf_act (SWI4) في مرتبة عالية (الشكل 7C). والتغذية المرتدة السلبية مهمة لإنتاج ديناميكيات تذبذبية23 وتوفر كلتا المجموعتين من العلاقات التنظيمية هذه الوظيفة في GRN في الشكل 3. إن العثور على ما إذا كانت هناك شبكة تحتوي على جميع هذه الحواف الأربعة يمكن أن يوفر بعض الأفكار حول سبب عدم وجودها معا في كثير من الأحيان في مجموعة نماذج GRN. ومع ذلك ، فإن النقر عبر الشبكات الفردية سيكون مملا. بدلا من ذلك، تم استخدام جزء تحليل التشابه من صفحة البحث عن الشبكة للبحث عن الشبكات التي قد تحتوي على جميع الحواف الأربعة (الشكل 7D). يكشف فحص مخطط التشتت الذي يعرض مدى تشابه شبكات 612 مع شكل من هذه الحواف الأربعة مقابل النسبة المئوية لمساحة معلمة النموذج التي تتطابق مع الديناميكيات المرصودة أن 0.65٪ فقط (4) من الشبكات 612 تحتوي على جميع هذه الحواف الأربعة (الشكل 7D). يشير هذا إلى فرضية قابلة للاختبار مفادها أن هناك حاجة إلى حلقة واحدة فقط من حلقتي التغذية المرتدة السلبية لشبكة بهذا الحجم لإنتاج الديناميكيات المرصودة. يمكن إجراء مزيد من التحقيق في هذه الفرضية حسابيا عن طريق إعادة تحديد معلمات خطوات IDP والبحث الأكثر شمولا عن مساحة الشبكة أو تجريبيا ، مثل الضربات القاضية للجينات. يمكن العثور على جميع نتائج هذا التحليل في الملف التكميلي 13.

Figure 1
الشكل 1: نظرة عامة على سير عمل IDP وIDV. يصور الصف السفلي الخطوات الرئيسية الثلاث ل IDP: العقدة والحافة والبحث عن الشبكة. يصور الصف العلوي الخطوات الرئيسية ل IDV ويصف الطرق المختلفة التي يمكن للمستخدم من خلالها التفاعل مع النتائج. تصور الأسهم الرمادية الداكنة بين الاثنين كيف يمكن ل IDV و IDP العمل بشكل تآزري للسماح للمستخدمين باتخاذ قرارات مستنيرة لكل خطوة من خطوات IDP ، مع خطوات IDP الفردية التي توفر نتائج للتصورات في IDV ، وخطوات IDV الفردية التي تسمح بإدخال معلمات جديدة أو معدلة ونتائج ومدخلات معدلة لخطوة IDP اللاحقة. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 2
الشكل 2: مثال على النتائج الناتجة عن تشغيل كل خطوة من خطوات IDP على التوالي دون استخدام IDV بين الخطوات. (A) لقطة شاشة لإخراج المحطة الطرفية من تشغيل كل خطوة IDP على التوالي. تم تشغيل IDP حتى الانتهاء ، ولكن تم العثور على شبكات صفرية خلال خطوة البحث عن الشبكة. (B) دليل نتائج البحث عن العقدة node_finding_20210705183301 (الملف التكميلي 13) الذي تم تحميله في IDV. تم تحديد جميع الجينات في جدول قائمة الجينات (سهم أحمر) لإظهار ملفات تعريف التعبير الخاصة بها في الرسم البياني الخطي وإنشاء جدول تعليقات توضيحية. تم ملء جدول التعليقات التوضيحية ليعكس كيفية تسمية الجينات في ملف التعليق التوضيحي الأصلي (السهم الأخضر). (ج) edge_finding_20210705183301 دليل نتائج البحث عن الحافة (الملف التكميلي 13) الذي تم تحميله في IDV. (د) network_finding_20210705183301 دليل نتائج البحث عن الشبكة (الملف التكميلي 13) الذي تم تحميله في IDV. لا تعرض صفحة البحث عن الشبكة أي نتائج، مما يشير إما إلى إعادة معلمة خطوة بحث الشبكة أو إعادة تقييم خطوة بحث العقدة أو الحافة. تحتوي وثائق IDP على خطوات استكشاف الأخطاء وإصلاحها لمساعدة المستخدم على تحديد ما يمكنه تجربته بعد ذلك. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 3
الشكل 3: نموذج GRN لدورة خلية الخميرة. تم اختيار مجموعة من منظمات دورة خلايا الخميرة المعروفة من SGD وتم استخراج العلاقات التنظيمية المعروفة بين الجينات من Yeastract. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 4
الشكل 4: مثال على نتائج العثور على عقدة IDP في IDV. يتم تحميل دليل نتائج البحث عن العقدة في IDV node_finding_20210705183301 (الملف التكميلي 13). النتائج المعدلة بعد فحص قواعد بيانات الخميرة المنسقة عبر الإنترنت. تم توسيع جدول قائمة الجينات (السهم الأصفر) للعثور على الجين المتبقي في نموذج GRN للشكل 3 وتم إلغاء اختيار الجينات لإزالة الجينات غير الموجودة في نفس نموذج GRN (السهم الأحمر). تم ملء جدول التعليقات التوضيحية بناء على دليل على التنظيم لكل جين موجود على Yeastract (سهم أخضر). تم تنزيل قائمة الجينات الجديدة وملف التعليقات التوضيحية عن طريق تحديد أزرار التنزيل الخاصة بكل منهما (الأسهم الزرقاء). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 5
الشكل 5: مثال على نتائج آي دي بي إيدج في IDV. يتم تحميل دليل نتائج البحث عن الحافة في IDV edge_finding_20210701100152 (الملف التكميلي 13). (أ) النتيجة الأولية التي أنتجها النازحون داخليا. تم تحديد خيار القائمة المنسدلة الشبكة من البذور (سهم أحمر) لعرض شبكة البذور التي ينتجها موفر الهوية استنادا إلى الوسيطات الموجودة في ملف التكوين المستخدم (الملف التكميلي 7). الجينات المختارة في جدول الحافة هي الحواف المستخدمة في شبكة البذور. (ب) النتائج المعدلة بعد فحص شبكة البذور بحثا عن حواف لا تحتوي على أدلة تجريبية. تم تحديد خيار القائمة المنسدلة الشبكة من التحديد (سهم أحمر). تم تحديد/إلغاء تحديد الحواف من جدول الحواف (سهم أخضر). تم تنزيل ملفات شبكة البذور وقائمة الحواف وقائمة العقدة بالنقر فوق الأزرار الخاصة بها (الأسهم الصفراء). جدول الحافة الموضح هو لبيانات السلسلة الزمنية الأخيرة كما هو مدرج في ملف التكوين two_wts_EdgeFinding_config.txt (الملف التكميلي 7). من المهم عند تحديد حواف لشبكة البذور أو قائمة الحواف استنادا إلى نتائج LEM إلقاء نظرة على بيانات السلسلة الزمنية الأخيرة المدرجة في ملف التكوين لأن هذا الإخراج يتضمن جميع ملفات البيانات السابقة في استدلاله على العلاقات التنظيمية بين العقد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 6
الشكل 6: مثال على نتائج IDP Network Finding في IDV من استخدام ملف تكوين IDP two_wts_NetFind_rd1_config.txt (الملف التكميلي 11). (A) تم تحديد دورة كاملة مستقرة للاستعلام (سهم أحمر) لعرض البيانات المعنية على المحور y في مخطط التشتت. تمثل النقاط الزرقاء في مخطط التشتت نقاطا محددة باستخدام وظيفة Box Select لمخطط التشتت. تم توضيح مربع التحديد المنقط لإظهار الشكل الذي يبدو عليه تحديد المربع. (ب) تم إدخال الأعداد الصحيحة الدنيا والقصوى للمحور y والمحور x يدويا إلى شبكات مختارة داخل هذه الحدود (سهم أخضر). بعد كل تحديد، تم النقر فوق الزر الحصول على انتشار الحافة من الشبكات المحددة (الأسهم الصفراء) وتم إنشاء جدول انتشار الحافة ومناطق الشبكات المتوقعة DSGRN المحددة. في فهرس الشبكة، يمكن النقر فوق السهمين لأعلى ولأسفل لتصفح الشبكات المحددة (الأسهم الزرقاء). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

Figure 7
الشكل 7: مثال على نتائج IDP Network Finding في IDV من استخدام ملف تكوين IDP two_wts_NetFind_rd2_config.txt (الملف التكميلي 12). (أ-ج) تم اختيار الشبكات عن طريق إدخال قيم في مربعات الإدخال الدنيا والقصوى (الأسهم الحمراء). تم النقر فوق الزر الحصول على انتشار الحافة من الشبكات المحددة لإنشاء جدول انتشار الحافة ومناطق الشبكات المتوقعة DSGRN المحددة. (د) تم تحديد حواف الاهتمام في جدول edge_list (سهم أصفر) وتم النقر فوق الزر إرسال (سهم أخضر) لحساب درجات التشابه للرسم في مخطط التشتت مقابل الاستعلام المحدد (السهم الأزرق). تم استخدام الدالة Box Select لتحديد مجموعة من الشبكات (سهم أرجواني) لإنشاء جدول انتشار الحافة ومناطق الشبكات المتوقعة DSGRN المحددة. تمت زيادة فهرس الشبكة إلى 2 (سهم برتقالي) لعرض الشبكة الثانية في التحديد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

مصطلح خطوة خط الأنابيب تعريف
دي ليشتنبرغ بواسطة JTK-CYCLE (DLxJTK) العثور على العقدة مقياس كمي واحد لكل من الدورية وقوة التنظيم يستخدم لترتيب الجينات. يجمع بين مقاييس الدورية المنشورة سابقا de Lichtenberg (DL) و JTK-CYCLE (JTK).
الدورة الأولى ماكس التعبير العثور على العقدة الحد الأقصى للتعبير الجيني خلال الدورة الأولى من التعبير الجيني الدوري. سيتم ترتيب الجينات التي تم طلبها بواسطة First Cycle Max Expression بناء على النقطة الزمنية من الدورة الأولى التي تصل فيها إلى أقصى تعبير جيني لها.
آلة الحافة المحلية (LEM) البحث عن الحافة طريقة استدلال شبكة بايزي التي تصنف النماذج المحتملة للتفاعلات الجينية لتحديد المنظم (المنظمين) الأكثر احتمالا وطرق التنظيم (التنشيط أو القمع) لجين مستهدف معين باستخدام بيانات التعبير الجيني ذات السلاسل الزمنية.
شبكة البذور البحث عن الشبكة تخمين أولي لشبكة معقولة من التفاعلات العالمية من خلال اختيار حواف LEM الأعلى مرتبة. تقوم البذرة بتوطين منطقة من مساحة الشبكة متذبذبة للغاية مع احتمال كبير لإظهار الاتساق مع بيانات السلاسل الزمنية المقدمة.
التوقيعات الديناميكية التي تم إنشاؤها بواسطة الشبكات التنظيمية (DSGRN) البحث عن الشبكة حزمة برامج للحوسبة الشاملة لمجموعة متنوعة من السلوكيات الديناميكية طويلة الأجل التي يمكن أن تظهرها الشبكة.
انتشار الحافة البحث عن الشبكة النسبة المئوية لشبكات تسجيل النقاط الأعلى من خطوة العثور على الشبكة التي تتضمن الحافة المعنية. تسمح النتيجة بترتيب الحواف التي لها انتشار غير صفري.

الجدول 1: تعريف خط أنابيب الديناميكيات المتأصلة ومصطلحات مصور الديناميكيات المتأصلة.

الملف التكميلي 1: بيانات التعبير الجيني للسلاسل الزمنية (Replicate 1) المأخوذة من أورلاندو ، 200813.

الملف التكميلي 2: بيانات التعبير الجيني للسلاسل الزمنية (Replicate 2) المأخوذة من أورلاندو ، 200813.

الملف التكميلي 3: ملف التعليق التوضيحي الذي يحتوي على جميع الجينات الموجودة في الملف التكميلي 1 والملف التكميلي 2. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 4: ملف تكوين خط أنابيب الديناميكيات المتأصلة ذي المعلمات الكاملة. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 5: ملف قائمة الجينات الذي تم تنزيله من صفحة البحث عن العقدة في مصور الديناميكيات المتأصل. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 6: ملف التعليق التوضيحي الذي تم تنزيله من صفحة البحث عن العقدة في مصور الديناميكيات المتأصل. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 7: ملف تكوين خط أنابيب Dynamics المتأصل معلمة لخطوة البحث عن الحافة فقط. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 8: ملف شبكة البذور الذي تم تنزيله من صفحة البحث عن الحافة في مصور الديناميكيات المتأصل. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 9: ملف قائمة Edge الذي تم تنزيله من صفحة البحث عن الحافة في مصور الديناميكيات المتأصل. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 10: ملف قائمة العقدة الذي تم تنزيله من صفحة البحث عن الحافة في مصور الديناميكيات المتأصل. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 11: ملف تكوين خط أنابيب Dynamics المتأصل معلمة لخطوة البحث عن الشبكة فقط. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 12: ملف تكوين خط أنابيب الديناميكيات المتأصلة المحدث (الملف التكميلي 11) معلمة لخطوة "البحث عن الشبكة" فقط. يرجى النقر هنا لتنزيل هذا الملف.

الملف التكميلي 13: دليل يحتوي على النتائج من قسم النتائج التمثيلية. يرجى النقر هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

الاستدلال على GRNs هو تحد مهم في بيولوجيا النظم. يقوم IDP بإنشاء نماذج GRNs من بيانات التعبير الجيني باستخدام سلسلة من الأدوات التي تستخدم البيانات بطرق متزايدة التعقيد. تتطلب كل خطوة قرارات حول كيفية معالجة البيانات وما هي العناصر (الجينات والتفاعلات الوظيفية) التي سيتم تمريرها إلى الطبقة التالية من IDP. آثار هذه القرارات على نتائج النازحين داخليا ليست واضحة. وللمساعدة في هذا الصدد، يوفر IDV تصورات تفاعلية مفيدة للمخرجات من الخطوات الفردية لأدوات الاستدلال GRN داخل IDP. يعمل IDV على تبسيط وتسهيل عملية تقييم النتائج من طرق الاستدلال الحسابي هذه لتسريع التجريب وإبلاغ خيارات التحليل ، مما سيسمح بدوره بتسريع إنتاج نماذج وفرضيات الشبكة عالية الثقة. ينفذ IDV أيضا ميزات تتوسع في وظائف IDP ، بما في ذلك تصفية الحواف بواسطة خيارات معلمات LEM ODE ، وربط الجينات حسب وقت تعبيرها ، وتجميع الشبكات بناء على التشابه مع شكل أو شبكة. الأهم من ذلك ، يسمح IDV بالتدخلات اليدوية بين كل خطوة من خطوات IDP ، مما يسمح للمستخدم بدمج المعرفة البشرية والمعلومات السابقة بسهولة من الأدبيات بطرق لا يمكن أتمتتها بسهولة. لن تتضمن عملية التشغيل الساذجة ل IDP هذه المعلومات أصلا ، وبالتالي فإن استخدام IDV سيزيد من الثقة في النتائج كلما توفرت معلومات خاصة بالتجربة. بشكل عام ، يسمح استخدام IDV بالاقتران مع IDP للمستخدمين بإنشاء فرضيات شبكة للعمليات البيولوجية بثقة أكبر ، حتى مع معرفة قليلة أو معدومة ب GRN الحقيقي.

هناك ثلاث خطوات حاسمة في IDV. الأول هو تقييم نتائج اكتشاف عقدة IDP في IDV. يمكن لصفحة البحث عن العقدة في IDV إنتاج قائمة جينات جديدة ، وإذا رغبت في ذلك ، ملف تعليق توضيحي للجينات. يعد تنظيم قائمة جينات جديدة خطوة حاسمة لأنها تقلل بشكل كبير من مساحة الشبكة المحتملة عن طريق الحد من الجينات المسموح بنمذجتها كأهداف GRN و / أو منظمين. بالإضافة إلى ذلك ، نظرا لأن GRNs تتكون في الغالب من عوامل النسخ ، فإن وجود تعليقات توضيحية جينية سيساعد بشكل كبير في إنشاء نماذج GRN متماسكة.

الخطوة التالية هي تقييم نتائج IDP Edge Finding في IDV. يعد تنظيم شبكة بذور جديدة خطوة حاسمة لأنها تحدد موقع منطقة مساحة الشبكة التي سيتم أخذ عينات منها في خطوة العثور على الشبكة. ومع ذلك ، فإن معرفة من أين تبدأ ليست واضحة دائما ، لذلك يوصى باستخدام الحواف التي تحتوي على شكل من أشكال الأدلة التجريبية لتوفير الثقة بأن المرء يبدأ في منطقة من مساحة الشبكة تحتوي على حواف عالية الثقة. تتيح صفحة البحث عن الحافة في IDV سهولة تجميع شبكات البذور وإنشاء ملف مواصفات شبكة DSGRN المرتبط بالإضافة إلى قوائم العقدة والحافة.

الخطوة الأخيرة هي تقييم نتائج العثور على شبكة IDP في IDV. تسمح صفحة البحث عن الشبكة في IDV بسهولة استكشاف الشبكات التي تم أخذ عينات منها والدرجات المرتبطة بها التي تقدر قدرة الشبكة على إنتاج الديناميكيات المرصودة. في حين أن اكتشاف العقدة والحافة سيعرضان دائما النتائج (إذا تم تمرير جينين على الأقل من اكتشاف العقدة) ، يمكن أن يؤدي اكتشاف الشبكة إلى نتائج صفرية. لذلك ، فإن معرفة ما إذا كانت هناك حاجة إلى تعديلات في المعلمات ستكون أكثر وضوحا في Network Finding مقارنة ب Node و Edge Finding. مثل هذه الحوادث من عدد قليل من الشبكات أو عدم العثور عليها يمكن أن تكون نتيجة للقيود المفروضة على الشبكات التي يمكن تحليلها. هذه القيود هي: 1) ما إذا كانت الشبكات متصلة دائما بقوة أم لا ، 2) الحد الأدنى والحد الأقصى لعدد حواف الإدخال لكل عقدة ، 3) احتمالات إضافة وإزالة العقد والحواف ، و 4) عدد عمليات الإضافة والإزالة للعقد والحواف المسموح بها. إذا تم العثور على عدد قليل من الشبكات المقبولة من النماذج أو لم يتم العثور عليها ، كما هو الحال في الشكل 2 ، فمن المستحسن الرجوع إلى وثائق IDP للحصول على إرشادات بشأن إعادة تحديد معلمات أي أو كل خطوات IDP مع التقييم اللاحق للنتائج في IDV.

أحد القيود الحالية لهذا النهج هو أن صفحة اكتشاف العقدة تركز في الغالب على الديناميكيات المتذبذبة ، مثل تلك التي تظهر في برامج النسخ لدورة الخلية والساعة البيولوجية. على وجه الخصوص، يتم تكوين خطوة البحث عن عقدة IDP حاليا للبحث عن الجينات التي تظهر ديناميكيات تذبذبية في فترة محددة. ومع توسع IDP لتشمل التحليلات التي يمكنها تحديد أنواع مختلفة من ديناميكيات النسخ ، سيتم أيضا تحديث IDV لدعم تصور واستجواب هذه السلوكيات الأخرى. يقتصر حجم الشبكات التي يتم البحث عنها وتحليلها في خطوة العثور على الشبكة حاليا على الشبكات ذات الحجم الأصغر ، على سبيل المثال ، حوالي 10 جينات. هذه ضرورة لأن الحسابات في مقياس DSGRN تحدث بشكل جماعي. هناك قيد آخر هو أن استكشاف مساحة معلمة النموذج لشبكة محددة غير ممكن في IDV. ومع ذلك ، يمكن تنزيل ملف مواصفات شبكة DSGRN لشبكة معينة ويمكن تصور الديناميكيات المرتبطة بكل معلمة نموذج على موقع DSGRN Visualization على الويب (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). أخيرا ، تم اختبار IDV باستخدام أنظمة Linux (Ubuntu) و iOS (Big Sur). تم اختبار IDV على نظام التشغيل Windows 10 باستخدام نظام Windows الفرعي لنظام التشغيل Linux (WSL) ، والذي يسمح لمستخدمي Windows 10 بتشغيل Linux و IDV دون الحاجة إلى جهاز كمبيوتر مختلف أو جهاز ظاهري أو إعداد مزدوج التمهيد. لا يتم تشغيل IDV حاليا على Windows الأصلي.

من الصعب دراسة GRNs بسبب تعقيدها المتأصل ويمكن أن يكون من الصعب فهم أدوات الاستدلال المفيدة مثل IDP ونشرها بثقة. يوفر IDV طريقة لتقليل تعقيد دراسة GRNs المستنبطة باستخدام IDP مع تسهيل إدراج معلومات إضافية تتجاوز ديناميكيات التعبير الجيني. إن استخدام IDV بالاقتران مع IDP كما هو موضح هنا سيمكن الباحثين من تطوير وتحليل النماذج الوظيفية للأنظمة المدروسة جيدا ، مثل دورة الخلية البشرية. وعلاوة على ذلك، ستولد هذه الأدوات فرضيات قابلة للاختبار لعمليات أقل فهما، مثل دورة تطور الملاريا داخل كريات الدم الحمراء، التي يشتبه في أنها خاضعة لسيطرة GRN24 ولكن لم يقترح نموذج لها بعد.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgments

تم تمويل هذا العمل من خلال منحة المعاهد الوطنية للصحة R01 GM126555-01 ومنحة NSF DMS-1839299.

Materials

Name Company Catalog Number Comments
Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

علم الأحياء ، العدد 178 ،
Inherent Dynamics Visualizer ، تطبيق تفاعلي لتقييم وتصور المخرجات من خط أنابيب الاستدلال على شبكة تنظيم الجينات
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Moseley, R. C., Campione, S.,More

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter