Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Visualizer דינמיקה אינהרנטית, יישום אינטראקטיבי להערכה והדמיה של יציאות מצינור הסקת רשת רגולטורית גנטית

Published: December 7, 2021 doi: 10.3791/63084

Summary

Visualizer Dynamics Inherent היא חבילת ויזואליזציה אינטראקטיבית המתחברת לכלי הסקת רשת רגולטורית גנטית ליצירה משופרת ויעילה של מודלי רשת פונקציונליים. visualizer יכול לשמש כדי לקבל החלטות מושכלות יותר עבור parameterizing כלי ההסקה, ובכך להגביר את האמון במודלים המתקבלים.

Abstract

פיתוח מודלים של רשתות רגולציה גנטית הוא אתגר מרכזי בביולוגיה של מערכות. מספר כלים וצינורות חישוביים פותחו כדי להתמודד עם אתגר זה, כולל צינור הדינמיקה הטבועה החדש שפותח. צינור הדינמיקה האינהרנטית מורכב ממספר כלים שפורסמו בעבר ופועלים בסינרגיה ומחוברים באופן סינרגטי, כאשר הפלט של כלי אחד משמש לאחר מכן כקלט עבור הכלי הבא. כמו ברוב הטכניקות החישוביות, כל שלב של צינור הדינמיקה הטבועה דורש מהמשתמש לקבל החלטות לגבי פרמטרים שאין להם הגדרה ביולוגית מדויקת. בחירות אלה יכולות להשפיע באופן משמעותי על מודלים של רשת רגולטורית גנים המיוצרים על ידי הניתוח. מסיבה זו, היכולת לדמיין ולחקור את ההשלכות של בחירות פרמטרים שונות בכל שלב יכולה לעזור להגביר את הביטחון בבחירות ובתוצאות. Visualizer דינמיקה Inherent היא חבילת ויזואליזציה מקיפה המייעלת את התהליך של הערכת בחירות פרמטרים באמצעות ממשק אינטראקטיבי בתוך דפדפן אינטרנט. המשתמש יכול לבחון בנפרד את הפלט של כל שלב של הצינור, לבצע שינויים אינטואיטיביים המבוססים על מידע חזותי, וליהנות מייצור אוטומטי של קבצי קלט נחוצים עבור צינור הדינמיקה הטבוע. Visualizer דינמיקה Inherent מספק רמה חסרת תקדים של גישה לכלי מורכב מאוד לגילוי של רשתות רגולטוריות גנים מנתונים transcriptomic סדרת זמן.

Introduction

תהליכים ביולוגיים חשובים רבים, כגון בידול תאים ותגובה סביבתית, נשלטים על ידי קבוצות של גנים המקיימים אינטראקציה זה עם זה ברשת רגולטורית גנים (GRN). GRNs אלה מייצרים את הדינמיקה התמלולית הדרושה להפעלת ותחזוקה של הפנוטיפ שהם שולטים בו, ולכן זיהוי הרכיבים והמבנה הטופולוגי של GRN הוא המפתח להבנת תהליכים ופונקציות ביולוגיים רבים. GRN עשוי להיות מעוצב כקבוצה של גנים אינטראקציה ו / או מוצרי גנים המתוארים על ידי רשת שצמתים שלה הם הגנים ושקצוותיה מתארים את הכיוון והצורה של אינטראקציה (למשל, הפעלה / דיכוי של תמלול, שינוי לאחר התרגום וכו ') 1. אינטראקציות יכולות לבוא לידי ביטוי לאחר מכן כמודלים מתמטיים פרמטרים המתארים את ההשפעה שיש לגן מווסת על ייצור היעדים שלו(ים)2,3,4. הסקת מסקנות של מודל GRN דורשת הן הסקת מסקנות של מבנה רשת האינטראקציה והן הערכה של פרמטרי האינטראקציה הבסיסיים. מגוון שיטות מסקנה חישוביות פותחו כי לבלוע נתוני ביטוי גנים סדרת זמן ופלט GRN מודלים5. לאחרונה, פותחה שיטת הסקת GRN חדשה, הנקראת צינור הדינמיקה האינהרנטית (IDP), המשתמשת בנתוני ביטוי גנים של סדרות זמן כדי לייצר מודלים של GRN עם אינטראקציות רגולטור-יעד מסומנות המסוגלות לייצר דינמיקה התואמת לדינמיקה הנצפית בנתוני ביטוי הגנים6. IDP הוא חבילה של כלים המחוברים באופן ליניארי לתוך צינור וניתן לחלק אותו לשלושה שלבים: שלב איתור צומת שמדרג גנים בהתבסס על מאפייני ביטוי גנים הידועים או חשודים כקשורים לפונקציה של GRN7,8, שלב מציאת קצה המדורג יחסים רגולטוריים זוגיים8, 9, וצעד חיפוש רשת המייצר דגמי GRN המסוגלים לייצר את הדינמיקה הנצפית10,11,12,13,14,15.

בדומה לרוב השיטות החישוביות, ה- IDP דורש קבוצה של ארגומנטים שצוינו על-ידי המשתמש המכתיבים את אופן הניתוח של נתוני הקלט, וערכות שונות של ארגומנטים יכולות להפיק תוצאות שונות על אותם נתונים. לדוגמה, מספר שיטות, כולל IDP, מכילות ארגומנטים המחילים סף מסוים על הנתונים, והגדלה/הקטנה של סף זה בין ריצות רצופות של השיטה המסוימת עלולה לגרום לתוצאות שונות בין הפעלות (ראה תוספת הערה 10: שיטות הסקת מסקנות רשת של 5). הבנת האופן שבו כל ארגומנט עשוי להשפיע על הניתוח ועל התוצאות הבאות חשובה להשגת ביטחון גבוה בתוצאות. שלא כמו רוב שיטות ההסקה של GRN, ה- IDP מורכב מכלים חישוביים מרובים, שלכל אחד מהם יש קבוצת ארגומנטים משלו שהמשתמש חייב לציין ולכל אחד מהם יש תוצאות משלו. בעוד IDP מספק תיעוד נרחב על איך parameterize כל כלי, התלות ההדדית של כל כלי על הפלט של השלב הקודם עושה parameterizing הצינור כולו ללא ניתוחי ביניים מאתגר. לדוגמה, ארגומנטים בשלבי קצה ומציאת רשת עשויים להיות מעודכנים על ידי ידע ביולוגי קודם, ולכן יהיו תלויים בערכת הנתונים ו / או באורגניזם. כדי לחקור תוצאות ביניים, יהיה צורך בהבנה בסיסית של תכנות, כמו גם הבנה עמוקה של כל קבצי התוצאה ותכולתם מה- IDP.

Inherent Dynamics Visualizer (IDV) היא חבילת תצוגה חזותית אינטראקטיבית הפועלת בחלון הדפדפן של המשתמש ומספקת דרך למשתמשים ב- IDP להעריך את ההשפעה של בחירות הארגומנט שלהם על תוצאות מכל שלב ב- IDP. ה- IDV מנווט במבנה מדריך כתובות מסובך המיוצר על-ידי ה- IDP ואוסף את הנתונים הדרושים עבור כל שלב ומציג את הנתונים באיורים ובטבלאות אינטואיטיביים ואינטראקטיביים שהמשתמש יכול לחקור. לאחר בחינת תצוגות אינטראקטיביות אלה, המשתמש יכול להפיק נתונים חדשים משלב IDP שיכולים להתבסס על החלטות מושכלות יותר. לאחר מכן ניתן להשתמש בנתונים חדשים אלה באופן מיידי בשלב הבא של IDP. בנוסף, חקר הנתונים יכול לעזור לקבוע אם יש להפעיל מחדש שלב IDP עם פרמטרים מותאמים. ה- IDV יכול לשפר את השימוש ב- IDP, כמו גם להפוך את השימוש ב- IDP לאינטואיטיבי ונגיש יותר, כפי שהוכח על ידי חקירת מתנד הליבה GRN של מחזור תאי השמרים. הפרוטוקול הבא כולל תוצאות IDP מהפעלת IDP עם פרמטרים מלאים לעומת גישה המשלבת את ה- IDV לאחר הפעלות של כל שלב IDP, כלומר, צומת, קצה ואיתור רשת.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. התקנת IDP ו- IDV

הערה: סעיף זה מניח כי docker, conda, pip, ו- git מותקנים כבר (רשימת חומרים).

  1. במסוף, הזן את הפקודה: שיבוט git https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
  2. בצע את הוראות ההתקנה בקובץ README של IDP.
  3. במסוף, הזן את הפקודה: שיבוט git https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
    הערה: שיבוט ה- IDV אמור להתרחש מחוץ לספריה ברמה העליונה של IDP.
  4. בצע את הוראות ההתקנה בקובץ README של IDV.

2. מציאת צומת

  1. צור קובץ תצורה חדש של IDP המגדיר את שלב חיפוש הצמתים.
    הערה: אין להקליד את כל המרכאות בשלבים הבאים. המרכאות משמשות כאן רק כמפריד בין טקסט הפרוטוקול לבין מה שיש להקליד.
    1. הוסף את הארגומנטים העיקריים IDP לקובץ התצורה.
    2. פתח קובץ טקסט חדש בעורך טקסט והקלד "data_file =", "annotation_file =", "output_dir =", "num_proc=", "num_proc=", ו-"IDVconnection = True" בשורות בודדות.
    3. עבור "data_file", לאחר הסימן שווה ל, הקלד את הנתיב אל קובץ סידרת הזמן המתאים והקלד פסיק על שם השם. הפרד כל נתונים באמצעות פסיק, אם נעשה שימוש ביותר ממערכת נתונים של סידרה חד פעמית. ראה קובץ משלים 1 וקובץ משלים 2 לקבלת דוגמה של קבצי ביטוי גנים של סדרות זמן.
    4. הקלד את הנתיב אל קובץ הביאור והשם של קובץ הביאור עבור "annotation_file", לאחר הסימן השווה ל. ראה קובץ משלים 3 לקבלת דוגמה של קובץ ביאור.
    5. בתיבה "output_file", לאחר הסימן שווה לחתימה, הקלד את הנתיב אל התיקיה ושם התיקיה שבה יישמרו התוצאות.
    6. לאחר הסימן שווה ל, עבור "num_proc", הקלד את מספר התהליכים שה- IDP צריך להשתמש בהם.
    7. הוסף ארגומנטים של חיפוש צומת לקובץ התצורה.
    8. באותו קובץ טקסט כמו בשלב 2.1.1, הקלד בסדר המוצג "[dlxjtk_arguments]", "periods =", ו- "dlxjtk_cutoff =" בשורות בודדות. מקם אותם לאחר הטיעונים העיקריים.
    9. עבור "periods", לאחר הסימן שווה ל, אם נעשה שימוש בערכת נתונים חד-פעמית של סידרה, הקלד כל אורך תקופה המופרד באמצעות פסיקים. עבור יותר מערכת נתונים של סידרה חד פעמית, הקלד כל ערכה של אורכי תקופה כבעבר, אך מקם סוגריים מרובעים סביב כל ערכה ומקם פסיק בין הערכות.
    10. לאחר הסימן השווה ל, עבור "dlxjtk_cutoff", הקלד מספר שלם המציין את המספר המרבי של גנים שיש לשמור בפלט gene_list_file על ידי דה ליכטנברג על ידי JTK_CYCLE (DLxJTK) (טבלה 1).
      הערה: מומלץ מאוד לסקור את dlxjtk_arguments מקטעים ב- IDP README כדי לקבל הבנה טובה יותר של כל ארגומנט. ראה קובץ משלים 4 לקבלת דוגמה של קובץ תצורה עם הארגומנטים חיפוש צומת שצוינו.
  2. במסוף, עבור לספריית IDP, הנקראת inherent_dynamics_pipeline.
  3. במסוף, הזן את הפקודה: conda activate dat2net
  4. הפעל את IDP באמצעות קובץ התצורה שנוצר בשלב 2.1 על-ידי הפעלת פקודה זו במסוף, כאשר <גדיר שם קובץ> שם הקובץ: שם הקובץ python src/dat2net.py
  5. במסוף, עבור לספריה בשם inherent_dynamics_visualizer והזן את הפקודה: . /viz_results.sh
    הערה: יצביע על הספריה המשמשת כספריית הפלט עבור IDP.
  6. בדפדפן אינטרנט, הזן http://localhost:8050/ ככתובת ה- URL.
  7. כאשר IDV פתוח כעת בדפדפן, לחץ על הכרטיסיה חיפוש צומת ובחר את תיקיית מציאת הצומת של עניין מהתפריט הנפתח.
  8. אצור באופן ידני רשימת גנים חדשה מטבלת רשימת הגנים ב- IDV כדי שתשמש לשלבי IDP הבאים.
    1. כדי להרחיב או לקצר את טבלת רשימת הגנים, לחץ על החצים למעלה או למטה או הזן באופן ידני מספר שלם בין 1 ל- 50 בתיבה לצד ביטוי הגנים של גנים המדורגים DLxJTK. למעלה: .
    2. בטבלת רשימת הגנים, לחץ על התיבה לצד גן כדי להציג את פרופיל ביטוי הגנים שלו בגרף קו. ניתן להוסיף גנים מרובים.
    3. ציין באופן אופציונלי את מספר הסלים בגודל שווה לחישוב ולהזמנה של גנים לפי מרווח הזמן המכיל את ביטוי השיא שלהם, על-ידי הזנת מספר שלם לתיבת הקלט מעל טבלת רשימת הגנים הנקראת מספר שלם של קלט שכותרתו מספר שלם של קלט כדי לחלק את המחזור הראשון לפחים:.
      הערה: אפשרות זו ספציפית לדינמיקה מתנדנדת וייתכן שאינה ישימה לסוגים אחרים של דינמיקה.
    4. בחר העדפת צפייה במפת חום על-ידי לחיצה על אפשרות תחת סדר גנים לפי: ביטוי מרבי מחזור ראשון (טבלה 1) המזמין גנים בהתבסס על זמן שיא ביטוי הגנים במחזור הראשון.
      הערה: דירוג DLxJTK מזמין גנים בהתבסס על דירוג התקופתיות מאלגוריתם DLxJTK של IDP.
    5. לחץ על לחצן הורד רשימת גנים כדי להוריד את רשימת הגנים לתבנית הקובץ הדרושה לשלב חיפוש קצה. ראה קובץ משלים 5 לקבלת דוגמה של קובץ רשימת גנים.
  9. בטבלת ביאור הגנים הניתן לעריכה, סמן גן כיעד, כרגולטור או שניהם בקובץ הביאור עבור השלב 'חיפוש קצה' בריצה חדשה של 'חיפוש קצה'. אם גן הוא רגולטור, סמן את הגן כמפעיל, כמדחיק או שניהם.
    1. כדי לתייג גן כפעיל, לחץ על התא בעמודה tf_act ושנה את הערך ל- 1. כדי לתייג גן כמדחיק, שנה את הערך בעמודה tf_rep ל- 1. גן יורשה לפעול הן כמפעיל והן כמדכא בשלב חיפוש קצה על-ידי הגדרת הערכים הן בעמודות tf_act והן כעמודות tf_rep ל- 1.
    2. כדי לתייג גן כיעד, לחץ על התא בעמודת היעד ושנה את הערך ל- 1.
  10. לחץ על לחצן הורד ביאור קובץ כדי להוריד את קובץ הביאור לתבנית הקובץ הדרושה לשלב חיפוש הקצה.

3. מציאת קצה

  1. צור קובץ תצורה חדש של IDP שמפרפר את שלב חיפוש הקצה.
    1. הוסף את הארגומנטים העיקריים IDP לקובץ התצורה. פתח קובץ טקסט חדש בעורך טקסט וחזור על שלב 2.1.1.1.
    2. הוסף ארגומנטים של חיפוש קצה לקובץ התצורה.
    3. באותו קובץ טקסט כמו בשלב 3.1.1, הקלד בסדר המוצג "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =", ו-"num_edges_for_seed =" בשורות בודדות. אלה צריכים לרדת מתחת לטיעונים העיקריים.
    4. עבור "gene_list_file", לאחר הסימן שווה לחתימה, הזן את הנתיב אל שם קובץ רשימת הגנים שנוצר בשלב 2.8.5.
    5. עבור "edge_score_column", לאחר הסימן שווה לחתימה, הזן "pld" או "norm_loss" כדי לציין איזו עמודת מסגרת נתונים מפלט lempy משמשת לסינון הקצוות.
    6. בחר "edge_score_threshold" או "num_edges_for_list", ומחק את השני. אם האפשרות "edge_score_threshold" נבחרה, הזן מספר בין 0 ל- 1. מספר זה ישמש לסינון קצוות בהתבסס על העמודה שצוינה בשלב 3.1.5.
      1. אם נבחר "num_edges_for_list", הזן ערך השווה או קטן ממספר הקצוות האפשריים. מספר זה ישמש לסינון הקצוות בהתבסס על אופן הדירוג שלהם בעמודה שצוינה בשלב 3.1.5. הקצוות שנותרו ישמשו לבניית רשתות ב'חיפוש רשת'.
    7. בחר "seed_threshold" או "num_edges_for_seed" ומחק את השני. אם האפשרות "seed_threshold" נבחרה, הזן מספר בין 0 ל- 1. מספר זה ישמש לסינון קצוות בהתבסס על העמודה שצוינה בשלב 3.1.5.
      1. אם נבחר "num_edges_for_seed", הזן ערך השווה או קטן ממספר הקצוות האפשריים. מספר זה ישמש לסינון הקצוות בהתבסס על אופן הדירוג שלהם בעמודה שצוינה בשלב 3.1.5. הקצוות שנותרו ישמשו לבניית רשת הזרעים (טבלה 1) המשמשת ב'חיפוש רשת'.
        הערה: מומלץ מאוד לסקור את lempy_arguments וסעיפי netgen_arguments ב- IDP README כדי לקבל הבנה טובה יותר של כל ארגומנט. ראה קובץ משלים 7 לקבלת דוגמה של קובץ תצורה עם הארגומנטים חיפוש קצה שצוינו.
  2. חזור על שלבים 2.2 ו- 2.3.
  3. הפעל את IDP באמצעות קובץ התצורה שנוצר בשלב 3.1 על-ידי הפעלת פקודה זו במסוף, כאשר <הגדר שם קובץ> שם הקובץ: python src/dat2net.py
  4. אם ה- IDV עדיין פועל, עצור אותו על-ידי הקשה על פקד C בחלון המסוף כדי לעצור את התוכנית. חזור על שלבים 2.5 ו- 2.6.
  5. כאשר IDV פתוח בדפדפן, לחץ על הכרטיסיה חיפוש קצה ובחר את תיקיית מציאת הקצה של עניין מהתפריט הנפתח.
    הערה: אם נעשה שימוש בערכות נתונים מרובות בחיפוש קצה, הקפד לבחור את ערכת הנתונים האחרונה ששימשה בניתוח מחשב הקצה המקומי (LEM) (טבלה 1). חשוב בעת בחירת קצוות עבור רשת הזרעים או רשימת הקצוות בהתבסס על תוצאות LEM כדי להסתכל על נתוני הסדרה בפעם האחרונה המפורטים בקובץ התצורה כמו פלט זה משלב את כל קבצי הנתונים הקודמים בהסקת קשרי גומלין תקינים בין צמתים.
  6. כדי להרחיב או לקצר את טבלת הקצה, הזן באופן ידני מספר שלם בתיבת הקלט תחת מספר קצוות:.
  7. סנן קצוות באופן אופציונלי בפרמטרים של ODE LEM. לחץ וגרור כדי להזיז את הצד השמאלי או את הצד הימני של המחוון של כל פרמטר כדי להסיר קצוות מטבלת הקצה הכוללת פרמטרים מחוץ לגבולות הפרמטרים המורשים החדשים שלהם.
  8. לחלופין, צור רשת זרעים חדשה אם דרושה רשת זרעים שונה מזו המוצעת על-ידי IDP. ראה קובץ משלים 8 לקבלת דוגמה של קובץ רשת Seed.
    1. בחר מתוך Seed כדי לבחור את רשת הזרעים או מתוך בחירה מהתפריט הנפתח תחת רשת:.
    2. בטל את הבחירה/בחר קצוות מטבלת הקצוות על-ידי לחיצה על תיבות הסימון המתאימות הסמוכות לכל קצה כדי להסיר/להוסיף קצוות מרשת הזרעים.
  9. לחץ על לחצן הורד DSGRN NetSpec כדי להוריד את רשת הזרעים בפורמט מפרט הרשת של חתימות דינמיות שנוצרו על ידי רשתות תקינות (DSGRN) (טבלה 1).
  10. בחר צמתים וקצוות נוספים שישמשו בשלב חיפוש הרשת.
    1. בחר קצוות מטבלת הקצה על-ידי לחיצה על תיבות הסימון המתאימות שייכללו בקובץ רשימת הקצוות המשמש בחיפוש רשת.
    2. לחץ על הורד רשימות צומת וקצוות כדי להוריד את רשימת הצמתים ואת קבצי רשימת הקצה בתבנית הנדרשת לשימושם בחיפוש רשת. ראה קובץ משלים 9 וקובץ משלים 10 לקבלת דוגמאות של קבצי רשימת קצה וצמתים, בהתאמה.
      הערה: רשימת הצמתים חייבת להכיל את כל הצמתים בקובץ רשימת הקצוות, כך שה- IDV יוצר באופן אוטומטי את קובץ רשימת הצמתים בהתבסס על הקצוות שנבחרו. שתי אפשרויות זמינות להצגת הקצוות ב'חיפוש קצה'. האפשרות טבלת סיכום LEM מציגה את הקצוות כרשימה מדורגת של 25 הקצוות העליונים. טבלת LEM מהשורה הראשונה מציגה את הקצוות ברשימה משורשרת של שלושת הקצוות המדורגים העליונים עבור כל וסת אפשרי. המשתמש יכול להתאים את מספר הקצוות המוצגים עבור כל אפשרות על-ידי שינוי המספר בתיבת הקלט מספר קצוות .

4. מציאת רשת

  1. צור קובץ תצורה חדש של IDP המגדיר את שלב חיפוש הרשת.
    1. הוסף את הארגומנטים העיקריים IDP לקובץ התצורה. פתח קובץ טקסט חדש בעורך טקסט וחזור על שלב 2.1.1.1.
    2. הוסף ארגומנטים של חיפוש רשת לקובץ התצורה.
    3. באותו קובץ טקסט כמו בשלב 4.1.1, הקלד בסדר המוצג "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[הסתברויות]", "addNode =", "addEdge =", "removeNode =", ו-"removeEdge =" ובשורות בודדות, מתחת לארגומנטים העיקריים.
    4. עבור "seed_net_file", "edge_list_file" ו-"node_list_file", לאחר סימן השוויון, הזן את הנתיב אל קובץ רשת ה- Seed ואת קבצי רשימת הקצוות והצמתים שנוצרו בשלבים 3.9 ו- 3.10.2.
    5. לאחר הסימן שווה ל, עבור "range_operations", הקלד שני מספרים המופרדים באמצעות פסיק. המספר הראשון והשני הם המספר המינימלי והמספר המרבי של הוספה או הסרה של צמתים או קצוות לכל רשת שבוצעו, בהתאמה.
    6. עבור "numneighbors", לאחר הסימן שווה ל, הזן מספר המייצג את מספר הרשתות שיש למצוא ב'חיפוש רשת'.
    7. עבור "maxparams", לאחר השווה לסימן, הזן מספר המייצג את המספר המרבי של פרמטרי DSGRN כדי לאפשר רשת.
    8. הזן ערכים בין 0 ל- 1 עבור כל אחד מהארגומנטים הבאים: "addNode", "addEdge", "removeNode" ו- "removeEdge", לאחר הסימן שווה לחתימה. המספרים חייבים להסתכם ב- 1.
      הערה: מומלץ מאוד לסקור את המקטעים netper_arguments netquery_arguments ב- IDP README כדי לקבל הבנה טובה יותר של כל ארגומנט. ראה קובץ משלים 11 וקובץ משלים 12 לקבלת דוגמאות של קובץ תצורה עם הארגומנטים חיפוש רשת שצוינו.
  2. חזור על שלבים 2.2 ו- 2.3.
  3. הפעל את ה- IDP באמצעות קובץ התצורה שנוצר בשלב 4.1 על-ידי הפעלת פקודה זו במסוף, כאשר <גדיר שם קובץ> שם הקובץ: שם הקובץ python src/dat2net.py
  4. אם ה- IDV עדיין פועל, עצור אותו על-ידי הקשה על פקד C בחלון המסוף כדי לעצור את התוכנית. חזור על שלבים 2.5 ו- 2.6.
  5. כאשר IDV פתוח בדפדפן, לחץ על הכרטיסיה חיפוש רשת ובחר את תיקיית חיפוש הרשת של עניין.
  6. בחר רשת או קבוצת רשתות כדי ליצור טבלת שכיחות קצה (טבלה 1) וכדי להציג את הרשתות יחד עם תוצאות השאילתה המתאימות שלהן.
    1. שתי אפשרויות זמינות לבחירת רשתות: אפשרות 1 - הזן גבולות תחתונים וגבולים עליונים בתוצאות שאילתה על-ידי הזנת ערכים מינימליים ומקסימליים בתיבות הקלט המתאימות לציר ה- x ולציר ה- y של התוויית. אפשרות 2 - לחץ וגרור מעל פיזור כדי לצייר תיבה סביב הרשתות להיכלל. לאחר הזנת גבולות בחירה או קלט, לחץ על לחצן קבל שכיחות מרשתות נבחרות .
      הערה: אם צוינה יותר משאילתת DSGRN אחת, השתמש בלחצני האפשרויות המסומנים בסוג השאילתה כדי לעבור בין התוצאות של כל שאילתה. כנ"ל אם צוין יותר מאפסילון אחד (רמת רעש).
  7. לחץ על החצים מתחת לטבלת שכיחות הקצה כדי לעבור לעמוד הבא בטבלה. הקש Download Table כדי להוריד את טבלת שכיחות הקצה.
  8. הזן מספר שלם בתיבת הקלט אינדקס רשת כדי להציג רשת בודדת מהבחירה שבוצעה בשלב 4.6. לחץ על הורד DSGRN NetSpec כדי להוריד את הרשת המוצגת בתבנית מפרט רשת DSGRN.
  9. חפש ברשתות דמיון למוטיב או לרשת מעניינים שצוינו.
    1. השתמש בתיבות הסימון המתאימות לכל קצה כדי לבחור קצוות שייכללו ברשת או במוטיב המשמש לניתוח הדמיון. לחץ על שלח כדי ליצור את פיזור הדמיון עבור המוטיב או הרשת שנבחרו.
      הערה: השתמש בחצים ברשימת הקצוות כדי למיין בסדר אלפביתי ובחצים שמתחת לטבלה כדי לעבור לעמוד הבא בטבלה.
    2. לחץ וגרור מעל לוח הפיזור כדי לצייר תיבה סביב הרשתות שתיכלל כדי לבחור רשת או קבוצת רשתות כדי ליצור טבלת שכיחות קצה ולהציג את הרשתות יחד עם תוצאות השאילתה המתאימות שלהן.
      הערה: אם צוינה יותר משאילתת DSGRN אחת, השתמש בלחצני האפשרויות המסומנים בסוג השאילתה כדי לעבור בין התוצאות של כל שאילתה. כנ"ל אם צוין יותר מאפסילון אחד (רמת רעש).
    3. חזור על שלבים 4.7 ו- 4.8 כדי להוריד את טבלת שכיחות הקצה ואת הרשת המוצגת עבור ניתוח הדמיון, בהתאמה.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

השלבים שתוארו באופן טקסטואלי לעיל ובאופן גרפי באיור 1 הוחלו על הליבה המתנדנדת GRN של מחזור תאי השמרים כדי לראות אם ניתן לגלות מודלים פונקציונליים של GRN המסוגלים לייצר את הדינמיקה שנצפו בנתוני ביטוי הגנים של סדרת הזמן שנאספו במחקר מחזור תאים של שמרים16. כדי להמחיש כיצד IDV יכול להבהיר ולשפר את פלט IDP, התוצאות, לאחר ביצוע ניתוח זה בשתי דרכים, הושוו: 1) הפעלת כל השלבים של IDP במעבר אחד ללא IDV ו 2) צעד דרך IDP בעזרת IDV, המאפשר התאמה של תוצאות ביניים הן על ידי שילוב ידע ביולוגי קודם והן על ידי ביצוע בחירות מעודנות המבוססות על יציאות IDP. GRN של מחזור תאי שמרים שנחקר היטב משמש כדוגמה יש רבים של מערכות היחסים הרגולטוריות שלה מאומתים באופן ניסיוני. אם נלמד אורגניזם או תהליך ביולוגי אחר ו/או פחות, האפשרויות לגבי אופן התאמת תוצאות הביניים או הפרמטרים עשויות להיות שונות. כדי להמחיש סוג אחד של שאילתה שניתן להשתמש בו כדי להעריך רשתות, החוסן של כל רשת נמדד כדי לתמוך בתנודות יציבות ולהתאים את הדינמיקה התמלולית הנצפית של הצמתים שלהם על פני פרמטרי מודל.

נתוני סדרת זמן ביטוי גנים של שתי סדרות משוכפלות נלקחו מאורלנדו 200816 ועבדו מראש כדי להסיר כל ביטוי גנים הקשור לשיטת הסינכרון של מחזור התא שהוחלה בניסוי המקורי (קובץ משלים 1 וקובץ משלים 2). קובץ ביאורים נוצר המכיל את כל הגנים בנתוני סדרת הזמן הנתמכים הן על ידי איגוד DNA והן על ידי ראיות ביטוי שנמצאו ב- Yeastract17 ובכך יכול לתפקד כרגולטור ב- GRN. TOS4, PLM2, ו- NRM1 נכללו גם כרגולטורים, למרות שהם לא נמצאו שמרים יש שני סוגי ראיות, כי הם האמינו להיות חשוב עבור GRN הליבה שמרים מבוסס על ראיות בספרות18,19 (קובץ משלים 3). כל הרגולטורים תויגו הן כמפעיל והן כמדכאים וכן כיעדים.

IDP היה הראשון פרמטרים לרוץ דרך כל השלבים של IDP, כלומר צומת, קצה, חיפוש רשת. קבוצה של ארגומנטים נבחרה שנראו מתאימים בהתבסס על ההבנה הנוכחית של GRN מחזור תא שמרים, קבוצה קטנה של גנים המשתתפים ברשת מחוברת מאוד (קובץ משלים 4). הבנה זו השפיעה בעיקר על אפשרויות חיפוש הצומת והקצה. פרמטרי ההסתברויות ב'חיפוש רשת' התבססו על ההנחה שרק גנים אמיתיים ואינטראקציות רגולטוריות יועברו ל'חיפוש רשת'. ריצה מלאה זו של IDP הניבה תוצאות עבור איתור צמתים וקצוות (איור 2B,C), אך ברשת לא התגלו רשתות קבילות לדגם (איור 2A,D). קבילות המודל מוסברת בתיעוד הקוד של מודול הפיתון dsgrn_net_gen 14, תלות של IDP. בקצרה, רשתות המכילות קצוות של דיכוי עצמי או שיש להן קלט או פלט רבים מדי בצומת יחיד אינן ניתנות לשאילתה על-ידי תוכנת DSGRN (טבלה 1). ה- IDP מספק סיבות רבות לכך שייתכן שרשתות קבילות לדגם לא יימצאו ומתאר שלבי פתרון בעיות לפתרון הבעיות. בעיקרו של דבר, זה כרוך בשינוי פרמטרים ו / או קבצי קלט והפעלה מחדש של שלב IDP המתאים, ובדיקת תוצאות. IDV שימש כדי להפוך את התהליך הזה פחות מייגע וגוזל זמן רב.

תוצאות חיפוש הצמתים נטענו ל- IDV כדי לבחון את הגנים המועברים לשלב חיפוש הקצה של IDP. הצמתים שניתנו על-ידי IDP הם הגנים N העליון כפי שמדורגים על-ידי DLxJTK (טבלה 1), N שצוין על-ידי המשתמש, עם זאת, ייתכן שרשימת גנים זו לא תהיה מתאימה למטרת הניתוח. ללא ידע ביולוגי מוקדם, בחירה אוטומטית של צמתים באמצעות ציוני DLxJTK בלבד החזירה גן עם ראיות מוגבלות לתפקיד במחזור תאי השמרים (RME1), בעוד שכמה רגולטורים ידועים של תמלול מחזור התאים לא דורגו גבוה (איור 2B). ראיות ניסיוניות Yeastract שימש לבחירה מתוך בין הגנים בדירוג הגבוה ביותר על ידי DLxJTK אלה עם ביאור מחזור התא. גנים אלה הם SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 ו - SWI5. את היחסים הרגולטוריים הידועים שלהם ניתן לראות באיור 3. FKH2 אינו מופיע בעשרת הגנים המובילים (dlxjtk_cutoff הוגדר לעשרה בקובץ משלים 4) כפי שדורג על ידי DLxJTK, כך שרשימת הגנים הורחבה באמצעות IDV עד למציאת FKH2 (איור 4). כמה מהגנים הנוספים ברשימת הגנים המורחבת ידועים הם גנים מרכזיים ידועים והיו מוחמצים מבלי לחקור את תוצאות איתור הצומת. בעוד גנים מרכזיים ידועים יותר נמצאו על ידי הרחבת רשימת הגנים במורד הרשימה המדורגת DLxJTK, המוקד נשמר על הגנים של עניין. לכן, כמה גנים בכירים בוטלו, וכתוצאה מכך רשימת גנים (קובץ משלים 5) המכילה שבעה גנים (איור 4). קובץ ביאור חדש נוצר (קובץ משלים 6) המבוסס על שבעת הגנים האלה, כל גן תויג כיעד, וסוג הווסת צוין באמצעות Yeastract. רשימת הגנים החדשה וקובץ הביאור הורדו לשימוש לאחר מכן בשלב IDP הבא, חיפוש קצה. ללא IDV, ההליך של הוספה והסרה של גנים מרשימת הגנים וקובץ הביאור ידרוש כישורי קידוד צנועים.

קובץ תצורה חדש של IDP היה פרמטרים רק עבור שלב חיפוש קצה (קובץ משלים 7), עם רשימת הגנים החדשה וקובץ הביאור. לאחר השלמת IDP עם קובץ התצורה החדש, התוצאות נטענו לתוך IDV (איור 5A). כאשר שלב חיפוש הרשת מחפש באופן סטוגס סביב שטח הרשת של רשת הזרעים המסופקת לו, מתן רשת זרעים טובה יכול להיות חשוב. רשת זרעים טובה יכולה להיחשב כרשת המכילה קצוות אמיתיים. עם IDV ושימוש במסדי נתונים מקוונים כגון Yeastract ואת מסד הנתונים הגנום Saccharomyces (SGD)20, רשת הזרעים ניתן להציג ולהתאים באמצעות היחסים הרגולטוריים מ LEM (טבלה 1) שיש להם ראיות ניסיוניות. כדוגמה, הקצה YHP1 = tf_act(HCM1) בוטל מכיוון שאין ראיות מתועדות לקשר גומלין זה (איור 5B) ב- Yeastract. הקצה SWI5 = tf_act(FKH2) נוסף מכיוון שיש ראיות מתועדות לקשר גומלין זה21. לאחר שרשת הזרעים (טבלה 1) הייתה משביעת רצון, הורד קובץ מפרט הרשת של DSGRN עבור הרשת (קובץ משלים 8).

ללא IDV, יש סיכוי גבוה יותר של קצוות שעבורם אין ראיות ניסיוניות בשימוש לבניית רשת הזרעים. כפי שניתן לראות באיור 2C, רשת הזרעים שנוצרה בשלב מציאת הקצה מהפעלת IDP ללא הפסקה דרך כל שלב מכילה קצה, SWI4 = tf_rep(NDD1), שאינו נתמך על ידי ראיות ניסיוניות ב- Yeastract, ככל הנראה מכיוון ש-NDD1 ידוע כמפעיל תמלול22. מידע זה לא היה מקודד בקובץ הביאור בהפעלה ללא הפסקה, מה שאיפשר לכל הרגולטורים להיות גם מפעילים וגם מדכאים.

באמצעות IDV, רשת זרעים נאצרה באופן ידני שהיא רשת משנה של איור 3, וארבעת הקצוות הנותרים הוצבו ברשימת הקצוות המשמשת לדגימת שטח רשת (YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 = tf_rep(YOX1), SWI5 = tf_act(NDD1)). בחירת קצוות המבוססים על ידע ביולוגי קודם יכולה לשמש גם לבניית רשימת הקצוות; עם זאת, במקרה זה, נבחרו 20 הקצוות העליונים מתצוגת טבלת סיכום LEM (קובץ משלים 9). קובץ רשימת הצמתים נוצר מהקצוות שנבחרו באופן אוטומטי (קובץ משלים 10). הפרמטרים ODE מ LEM יכול לשמש גם כדי לסנן קצוות אם מישהו מאמין הפרמטרים מוסקים במודל ODE אינם מציאותיים מבחינה ביולוגית, אבל מידע זה לא היה בשימוש כאן.

לאחר מכן, קובץ תצורה חדש של IDP היה פרמטרים עבור שלב חיפוש הרשת באמצעות שלושת הקבצים החדשים. כמו רשת הזרעים נוצרה עם קצוות נתמך היטב על ידי ראיות ניסיוניות, הכללת קצוות אלה בכל הרשתות היה הרצוי. לפיכך, הסתברויות מציאת הרשת הוגדרו כדי לאפשר את התוספת אך לא את הסרת הצמתים והקצוות (קובץ משלים 11). numneighbors הפרמטרים של חיפוש הרשת הוגדר לחיפוש 2,000 רשתות. לאחר הפעלת ה- IDP, נמצאו 37 רשתות קבילות לדגם בשלב חיפוש הרשת, בניגוד להפעלה ללא הפסקה שבה היה אפס. טעינת תוצאות ממצאי הרשת לתוך ה- IDV, ל-64% (24) מתוך 37 הרשתות הללו הייתה היכולת להתנדנד ביציבות (איור 6A). מתוך 24 הרשתות הללו, המבצעים הטובים ביותר היו שתי רשתות שהתאימו את הנתונים ב-50% מפרמטרי המודל המתנדנדים ביציבות שלהן (איור 6B).

טבלת שכיחות הקצה (טבלה 1) מפרטת את מספר הפעמים שקצה מתרחש באוסף נבחר של רשתות, ומעניקה אינדיקציה לשכיחותו ברשתות בעלות ביצועים גבוהים. בחינת טבלת שכיחות הקצה המיוצרת על-ידי בחירת שתי הרשתות הקודמות בתרשים הפיזור מגלה כי כל קצות רשת הזרעים נמצאים בכל אחת משתי הרשתות, כצפוי, יחד עם שני קצוות רשת שאינם זרעים (איור 6B), SWI4 = tf_act(SWI5) ו- HCM1 = tf_rep(YHP1). לאף אחד משני הקצוות האלה לא היו ראיות שתומכות בהם ב-Yeastract. כמו כמות כה קטנה של שטח רשת נחקר ולכן קשה להעריך את החשיבות של קצוות וצמתים בהפקת הדינמיקה הנצפית.

רק 37 רשתות קבילות לדגם נמצאו ב'חיפוש רשת' למרות שמספר הפרמטרים הוגדר ל- 2,000, מה שמצביע על כך שייתכן שחיפוש הרשת היה מוגבל יתר על המידה. כפי שמתואר בתיעוד של מודול הפיתון dsgrn_net_gen ב- IDP, הבעיה עשויה להיות קשורה לרשת הזרעים, לרשימת הקצוות, לרשימת הצמתים, לאפשרויות הפרמטרים לחיפוש רשת או לשילוב כלשהו של אלה. כדי לחקור, נעשה שימוש באותה רשת זרעים, רשימת קצוות ורשימת צמתים כבעבר, אך הפרמטרים 'חיפוש רשת' שונו על-ידי הוספת היכולת להסיר קצוות במהלך יצירת הרשת (קובץ משלים 12). טעינת תוצאות ממצא הרשת החדשות ל- IDV מראה כי בשלב זה נמצאו 612 רשתות, כאשר ל-67% (411) מרשתות אלה יש את היכולת להתנדנד ביציבות (איור 7A). מעניין לציין ש-13% (82) מהרשתות שהיו מסוגלות לדינמיקה יציבה של תנודות לא היו מסוגלות לייצר דינמיקה דומה לזו שנראתה בנתונים (איור 7B). מתוך 411 הרשתות, 30% (124) הציגו התאמות חזקות לנתונים (כלומר, יותר מ-50% מפרמטרי המודל המתנדנדים ביציבות שלהן הציגו התאמת נתונים) (איור 7C).

מספרי שכיחות הקצה שנוצרו על ידי הסיבוב השני של חיפוש רשת מבוססים כעת על מבחר גדול בהרבה של רשתות וניתן להשתמש בהם בביטחון רב יותר בהערכת החשיבות של מערכת יחסים רגולטורית ב- GRN. לדוגמה, HCM1 = tf_rep(YHP1) עדיין מיוצג מאוד ברשתות המייצרות דינמיקה חזקה, מה שמרמז על כך שמערכת יחסים זו עשויה להיות שווה חקירה ניסיונית (איור 7C). בדיקה נוספת של טבלת שכיחות הקצה (המבוססת על 124 הרשתות שהוזכרו לעיל) העלתה כי הקצוות SWI4 = tf_rep (YOX1) ו- YOX1 = tf_act(SWI4) אינם מדורגים גבוה אך הקצוות SWI4 = tf_rep (YHP1) ו- YHP1 = tf_act(SWI4) מדורגים גבוה (איור 7C). משוב שלילי חשוב להפקת דינמיקה מתנדנדת23 ושתי קבוצות אלה של יחסים רגולטוריים מספקות פונקציה זו ב-GRN באיור 3. בדיקה אם קיימת רשת המכילה את כל ארבעת הקצוות הללו יכולה לספק תובנה מסוימת מדוע אלה אינם קיימים לעתים קרובות יחד באוסף דגמי GRN; עם זאת, לחיצה דרך רשתות בודדות תהיה מייגעת. במקום זאת, החלק 'ניתוח דמיון' בדף 'חיפוש רשת' שימש לחיפוש רשתות שעשויות להכיל את כל ארבעת הקצוות (איור 7D). בחינת עלילת הפיזור המציגה עד כמה דומות 612 הרשתות למוטיב של ארבעת הקצוות הללו לעומת אחוז מרחב הפרמטרים של המודל התואם את הדינמיקה הנצפית מגלה שרק 0.65% (4) מתוך 612 הרשתות מכילות את כל ארבעת הקצוות הללו (איור 7D). זה מרמז על השערה הניתנת לבדיקה כי רק אחת משתי לולאות משוב שליליות נדרשת עבור רשת בגודל זה כדי לייצר את הדינמיקה הנצפית. השערה זו יכולה להיחקר עוד יותר באופן חישובי על ידי שיפוץ של צעדי IDP וחיפוש ממצה יותר של מרחב הרשת או ניסיוני, כגון נוקאאוטים גנטיים. כל התוצאות מניתוח זה ניתן למצוא בקובץ משלים 13.

Figure 1
איור 1: סקירה כללית של זרימת עבודה של IDP ו- IDV. השורה התחתונה מתארת את שלושת השלבים העיקריים של IDP: צומת, קצה וחיפוש רשת. השורה העליונה מתארת את השלבים העיקריים של ה- IDV ומתארת דרכים שונות שבהן משתמש יכול לקיים אינטראקציה עם התוצאות. החצים האפורים הכהים בין השניים מתארים כיצד ה- IDV וה- IDP יכולים לפעול בסינרגיה כדי לאפשר למשתמשים לקבל החלטות מושכלות עבור כל שלב של ה- IDP, כאשר שלבי IDP בודדים מספקים תוצאות עבור הפריטים החזותיים ב- IDV, שלבי IDV בודדים המאפשרים קלט של פרמטרים חדשים או מותאמים ותוצאות וכניסות מותאמות עבור שלב IDP הבא. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 2
איור 2: דוגמה לתוצאות של הפעלת כל שלב של IDP ברציפות מבלי להשתמש ב- IDV בין שלבים. (א) צילום מסך של פלט המסוף מהפעלת כל שלב IDP ברציפות. IDP רץ עד הסוף, אך אפס רשתות נמצאו במהלך שלב חיפוש הרשת. (ב) צומת חיפוש תוצאות ספריה node_finding_20210705183301 (קובץ משלים 13) נטען לתוך IDV. כל הגנים בטבלת רשימת הגנים נבחרו (חץ אדום) כדי להציג את פרופילי הביטוי המתאימים שלהם בגרף הקו וכדי ליצור טבלת ביאורים. טבלת הביאורים מולאה כדי לשקף את האופן שבו הגנים מסומנים בקובץ הביאור המקורי (חץ ירוק). (C) ספריית תוצאות חיפוש קצה edge_finding_20210705183301 (קובץ משלים 13) נטען לתוך IDV. (ד) מדריך תוצאות חיפוש רשת network_finding_20210705183301 (קובץ משלים 13) שנטען ב- IDV. הדף 'חיפוש רשת' אינו מציג תוצאות, מה שמצביע על שינוי צורה של שלב חיפוש הרשת או להעריך מחדש את שלב איתור הצומת או הקצה. תיעוד IDP מכיל שלבי פתרון בעיות כדי לסייע למשתמש לקבוע מה הוא יכול לנסות הלאה. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 3
איור 3: דגם GRN של מחזור תאי שמרים. קבוצה של רגולטורים ידועים של מחזור תאי שמרים נבחרו מ- SGD ויחסים רגולטוריים ידועים בין גנים חולצו מ- Yeastract. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 4
איור 4: דוגמה לתוצאות חיפוש צומת IDP ב- IDV. נטען לתוך IDV הוא צומת חיפוש תוצאות הספריה node_finding_20210705183301 (קובץ משלים 13). התוצאות המותאמות לאחר בדיקת מאגרי שמרים מקוונים שאוצרו. טבלת רשימת הגנים הורחבה (חץ צהוב) כדי למצוא את הגן הנותר במודל GRN של איור 3 והגנים בוטלו כדי להסיר גנים שלא נמצאו באותו מודל GRN (חץ אדום). טבלת הביאורים מולאה על סמך ראיות לרגולציה עבור כל גן שנמצא על שמרים (חץ ירוק). רשימת הגנים החדשה וקובץ הביאור הורדו על-ידי בחירת לחצני ההורדה המתאימים שלהם (חצים כחולים). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 5
איור 5: דוגמה לתוצאות חיפוש קצה IDP ב- IDV. נטען לתוך IDV הוא קצה חיפוש תוצאות הספריה edge_finding_20210701100152 (קובץ משלים 13). (א) התוצאה הראשונית כפי שהופקה על-ידי IDP. האפשרות הנפתחת רשת מזרעים נבחרה (חץ אדום) כדי להציג את רשת הזרעים המיוצרת על-ידי IDP בהתבסס על הארגומנטים בקובץ התצורה המשמש (קובץ משלים 7). הגנים שנבחרו בטבלת הקצה הם הקצוות המשמשים ברשת הזרעים. (ב) התוצאות המותאמות לאחר בדיקת רשת הזרעים לאיתור קצוות שאינם מכילים ראיות ניסיוניות. האפשרות הנפתחת רשת מבחירה נבחרה (חץ אדום). קצוות נבחרו/לא נבחרו מטבלת הקצה (חץ ירוק). רשת הזרעים, רשימת הקצוות וקבצי רשימת הצמתים הורדו על-ידי לחיצה על הלחצנים המתאימים (חצים צהובים). טבלת הקצה המוצגת היא בפעם האחרונה שנתוני סידרה כמפורט בקובץ התצורה two_wts_EdgeFinding_config.txt (קובץ משלים 7). חשוב בעת בחירת קצוות עבור רשת הזרעים או רשימת הקצוות בהתבסס על תוצאות LEM כדי להסתכל על נתוני הסדרה בפעם האחרונה המפורטים בקובץ התצורה כמו פלט זה משלב את כל קבצי הנתונים הקודמים בהסקת קשרי גומלין תקינים בין צמתים. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 6
איור 6: דוגמה למציאת רשת IDP גורמת ל- IDV להשתמש בקובץ התצורה IDP two_wts_NetFind_rd1_config.txt (קובץ משלים 11). (A) השאילתה יציבה מחזור מלא נבחרה (חץ אדום) כדי להציג את הנתונים המתאימים על ציר y בתרשים הפיזור. נקודות כחולות בהתוויית הפיזור מייצגות נקודות נבחרות באמצעות הפונקציה Box Select עבור התוויית הפיזור. תיבת הבחירה המנוקדת אוירה כדי להראות כיצד נראית בחירת התיבה. (B) המספרים השלמים של דקה ומקסימום עבור ציר ה- y וציר ה- x הוזנו באופן ידני לרשתות נבחרות בתוך גבולות אלה (חץ ירוק). לאחר כל בחירה, לחץ על לחצן קבל שכיחות מרשתות נבחרות (חצים צהובים) ונוצרו האזורים טבלת שכיחות הקצה ורשתות חזויות נבחרות של DSGRN. באינדקס הרשת, ניתן ללחוץ על חצים למעלה ולמטה כדי לעיין ברשתות שנבחרו (חצים כחולים). לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 7
איור 7: דוגמה למציאת רשת IDP גורמת ל- IDV להשתמש בקובץ התצורה IDP two_wts_NetFind_rd2_config.txt (קובץ משלים 12). (א-ק) בחירת הרשתות בוצעה על-ידי הזנת ערכים לתיבות הקלט המינימליות והמקסימום (חצים אדומים). לחצו על הלחצן 'קבל שכיחות קצה מרשתות נבחרות' כדי ליצור את האזורים 'שכיחות קצה' ואת האזורים שנבחרו 'רשתות חזויות של DSGRN'. (D) קצוות מעניינים נבחרו בטבלת edge_list (חץ צהוב) ולחץ על לחצן שלח (חץ ירוק) כדי לחשב ציוני דמיון להתוויה בעלילת הפיזור מול השאילתה שנבחרה (חץ כחול). הפונקציה Box Select שימשה לבחירת קבוצת רשתות (חץ סגול) כדי ליצור את האזורים טבלת שכיחות הקצה ואת האזורים נבחרים של רשתות חזויות של DSGRN. אינדקס הרשת הוגדל ל- 2 (חץ כתום) כדי להציג את הרשת השניה בקטע הנבחר. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

מונח שלב צינור הגדרה
de Lichtenburg by JTK-CYCLE (DLxJTK) חיפוש צומת מדד כמותי יחיד הן של תקופתיות והן של חוזק הרגולציה המשמשים לדירוג גנים. משלב מדדי מחזור שפורסמו בעבר דה ליכטנברג (DL) ו- JTK-CYCLE (JTK).
ביטוי מרבי של מחזור ראשון חיפוש צומת ביטוי הגנים המרבי במהלך המחזור הראשון של ביטוי גנים תקופתי. גנים שהוזמנו על ידי מחזור ראשון מקסימום ביטוי יוזמן על סמך נקודת הזמן מהמחזור הראשון שבו הם מגיעים הביטוי הגני המרבי שלהם.
מכונת הקצה המקומית (LEM) חיפוש קצה שיטת הסקת מסקנות רשת בייסיאנית המדרגת מודלים פוטנציאליים של אינטראקציות גנים כדי לזהות את הרגולטורים הסבירים ביותר ואת דרכי הרגולציה (הפעלה או דיכוי) של גן יעד נתון באמצעות נתוני ביטוי גנים מסדרת זמן.
רשת זרעים חיפוש רשת ניחוש ראשוני ברשת סבירה של אינטראקציות גלובליות על ידי בחירת קצוות LEM המדורגים העליונים. הזרע הופך אזור של שטח רשת למתנדנד מאוד עם סבירות גבוהה להצגת עקביות עם נתוני סידרת הזמן שסופקו.
חתימות דינמיות שנוצרו על-ידי רשתות רגולטוריות (DSGRN) חיפוש רשת חבילת תוכנה למחשוב מקיף של מגוון ההתנהגויות הדינמיות ארוכות הטווח שרשת יכולה להציג.
שכיחות הקצה חיפוש רשת אחוז רשתות הניקוד המובילות משלב מציאת הרשת הכולל את היתרון המדובר. הציון מאפשר דירוג של קצוות בעלי שכיחות אפסית.

טבלה 1: הגדרה של קו צינור דינמיקה אינהרנטי ומונחים חזותיים דינמיים אינהרנטיים.

קובץ משלים 1: נתוני ביטוי הגנים של סדרת הזמן (Replicate 1) שנלקחו מאורלנדו, 200813. לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 2: נתוני ביטוי הגנים מסדרת הזמן (Replicate 2) שנלקחו מאורלנדו, 200813. לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 3: קובץ ביאור המכיל את כל הגנים שנמצאו בקובץ משלים 1 וקובץ משלים 2. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 4: קובץ תצורה של צינור דינמיקה טבועה עם פרמטרים מלאים. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 5: קובץ רשימת גנים שהורד מהדף חיפוש צמתים של Visualizer Dynamics Inherent. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 6: קובץ ביאור שהורד מהדף 'חיפוש צמתים' של Visualizer הדינמיקה הטבועה. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 7: קובץ התצורה של קו צינור דינמיקה אינהרנטית עם פרמטרים עבור שלב חיפוש הקצה בלבד. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 8: קובץ רשת Seed שהורד מהדף 'חיפוש קצה' של Visualizer Dynamics Inherent. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 9: קובץ רשימת קצה שהורד מהדף 'חיפוש קצה' של Visualizer הדינמיקה הטבועה. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 10: קובץ רשימת צמתים שהורד מהדף חיפוש קצה של Visualizer הדינמיקה הטבועה. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 11: קובץ התצורה הטבוע של קו צינור דינמיקה פרמטרים עבור שלב חיפוש הרשת בלבד. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 12: קובץ תצורה מעודכן של קו צינור דינמיקה אינהרנטי (קובץ משלים 11) עם פרמטרים רק עבור שלב חיפוש הרשת. נא לחץ כאן כדי להוריד קובץ זה.

קובץ משלים 13: ספריה המכילה את התוצאות מהמקטע תוצאות מייצגות. נא לחץ כאן כדי להוריד קובץ זה.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

המסקנה של GRNs היא אתגר חשוב בביולוגיה של מערכות. IDP מייצר GRNs מודל מנתוני ביטוי גנים באמצעות רצף של כלים המשתמשים בנתונים בדרכים מורכבות יותר ויותר. כל שלב דורש החלטות כיצד לעבד את הנתונים ואילו אלמנטים (גנים, אינטראקציות פונקציונליות) יועברו לשכבה הבאה של IDP. ההשפעות של החלטות אלה על תוצאות IDP אינן ברורות כל כך. כדי לסייע בעניין זה, IDV מספק פריטים חזותיים אינטראקטיביים שימושיים של היציאות משלבים בודדים של כלי ההסקה של GRN בתוך IDP. ה- IDV מייעל ומאפשר את תהליך הערכת התוצאות משיטות הסקת מסקנות חישוביות אלה כדי להאיץ את הניסויים ולהודיע על בחירות ניתוח, אשר בתורן יאפשרו ייצור מואץ של מודלים והשערות רשת בביטחון גבוה. ה- IDV מיישם גם תכונות המרחיבות את הפונקציונליות של IDP, כולל סינון קצוות לפי בחירות פרמטר LEM ODE, binning של גנים לפי זמן הביטוי שלהם, ורשתות קיבוץ באשכולות המבוססות על דמיון למוטיב או לרשת. חשוב לציין, IDV מאפשר התערבויות ידניות בין כל שלב IDP, המאפשר למשתמש לשלב בקלות ידע אנושי ומידע מוקדם מהספרות בדרכים שלא ניתן להפוך בקלות לאוטומטיות. ריצה נאיבית של IDP לא תשלב מידע זה באופן מקורי, ולכן השימוש ב- IDV יגביר את הביטחון בתוצאות בכל פעם שמידע ספציפי לניסוי זמין. בסך הכל, באמצעות IDV בשילוב עם IDP מאפשר למשתמשים ליצור השערות רשת עבור תהליכים ביולוגיים עם ביטחון רב יותר, אפילו עם מעט או ללא ידע של GRN האמיתי.

ישנם שלושה שלבים קריטיים ב- IDV. הראשון הוא הערכת תוצאות חיפוש צומת IDP ב- IDV. דף חיפוש הצמתים של IDV יכול להפיק רשימת גנים חדשה, ואם תרצה, קובץ ביאור גנים. אוצר רשימת גנים חדשה הוא צעד קריטי שכן הוא מקטין מאוד את שטח הרשת הפוטנציאלי על ידי הגבלת הגנים המורשים להיות מעוצבים כיעדי GRN ו / או רגולטורים. בנוסף, כמו GRNs מורכבים בעיקר מגורמי שעתוק, בעל ביאורים גנטיים יעזור מאוד ביצירת מודלים GRN קוהרנטי.

השלב הבא הוא הערכת תוצאות חיפוש קצה IDP ב- IDV. יצירת רשת זרעים חדשה היא צעד קריטי מכיוון שהיא הופכת את אזור שטח הרשת לשפות אחרות שיידגם בשלב חיפוש הרשת. עם זאת, לדעת איפה להתחיל לא תמיד ברור, ולכן מומלץ להשתמש בקצוות שיש להם צורה כלשהי של ראיות ניסיוניות כדי לספק ביטחון כי אחד מתחיל באזור של שטח רשת המכיל קצוות ביטחון גבוה. דף חיפוש הקצה של IDV מאפשר הרכבה קלה של רשתות זרעים ויוצר את קובץ מפרט הרשת המשויך של DSGRN וכן רשימות צמתים וקצוות.

השלב האחרון הוא הערכת תוצאות חיפוש רשת IDP ב- IDV. דף חיפוש הרשת של IDV מאפשר חקירה קלה של רשתות שנדגמו והציונים המשויכים להן המעריכים את יכולתה של הרשת לייצר את הדינמיקה הנצפית. בעוד שחיפוש צומת וקצה תמיד יחזיר תוצאות (אם לפחות שני גנים מועברים מ'איתור צמתים'), 'חיפוש רשת' יכול להחזיר אפס תוצאות. לכן, לדעת אם יש צורך בהתאמות בפרמטרים יהיה ברור יותר ב'חיפוש רשת' מאשר בחיפוש צומת וקצוות. מופעים כאלה של מעטים עד אפס רשתות שנמצאו יכולים להיות תוצאה של אילוצים שהוצבו על אילו רשתות ניתן לנתח. אילוצים אלה הם: 1) אם הרשתות תמיד מחוברות מאוד, 2) המינימום והמספר המרבי של קצות קלט לכל צומת, 3) ההסתברויות של הוספה והסרה של צמתים וקצוות, ו - 4) מספר התוספות והסרות של צמתים וקצוות מותרים. אם נמצאו מעט רשתות קבילות לדגם, כמו באיור 2, מומלץ להתייחסות לתיעוד IDP כדי לקבל הדרכה על תיקון מחדש של כל אחד מהשלבים של IDP או את כל השלבים של IDP עם הערכה מאוחרת יותר של התוצאות ב-IDV.

מגבלה נוכחית של גישה זו היא שהדף איתור צומת מתמקד בעיקר בדינמיקה מתנדנדת, כגון אלה שנראו בתוכניות התמלול של מחזור התא והשעון הביולוגי. בפרט, שלב חיפוש צומת IDP מוגדר כעת לחפש גנים המציגים דינמיקה מתנדנדת בתקופה שצוינה. ככל שה- IDP מתרחב וכולל ניתוחים שיכולים לכמת סוגים שונים של דינמיקה תמלולית, כך גם IDV יעודכן כדי לתמוך בהדמיה ובחקירה של התנהגויות אחרות אלה. גודל הרשתות שחיפשו ונותחו בשלב חיפוש הרשת מוגבל כעת לרשתות בגודל קטן יותר, למשל, כ-10 גנים. זהו הכרח כמו חישובים בסולם DSGRN להתרחש קומבינטורית. מגבלה נוספת היא שבדיקת שטח הפרמטרים של המודל עבור רשת שנבחרה אינה אפשרית ב- IDV. עם זאת, ניתן להוריד את קובץ מפרט הרשת של DSGRN עבור רשת נתונה וניתן להציג את הדינמיקה המשויכת לכל פרמטר מודל באתר האינטרנט של DSGRN Visualization (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). לבסוף, ה-IDV נבדק באמצעות מערכות לינוקס (אובונטו) ו-iOS (ביג סור). ה- IDV נבדק ב- Windows 10 באמצעות מערכת המשנה של Windows עבור לינוקס (WSL), המאפשרת למשתמשי Windows 10 להפעיל את Linux ואת ה- IDV ללא צורך במחשב אחר, מכונה וירטואלית או התקנת אתחול כפול. IDV אינו פועל כעת ב- Windows המקורי.

לימוד GRNs קשה בשל המורכבות הטבועה שלהם וכלי מסקנה שימושיים כגון IDP יכול להיות קשה להבין ולפרוס בביטחון. IDV מספק שיטה כדי להפחית את המורכבות של לימוד GRNs להסיק באמצעות IDP תוך הקלת הכללת מידע נוסף מעבר לדינמיקה ביטוי גנים. שימוש ב- IDV בשילוב עם IDP כמתואר כאן יעצים את החוקרים לפתח ולנתח מודלים פונקציונליים של מערכות שנלמדו היטב, כגון מחזור התא האנושי. יתר על כן, כלים אלה ייצרו השערות הניתנות לבדיקה עבור תהליכים פחות מובנים, כגון מחזור הפיתוח התוך אריתרוציטי של מלריה, אשר חשוד להיות נשלט על ידי GRN24 אבל שעבורו מודל עדיין לא הוצע.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

למחברים אין מה לחשוף.

Acknowledgments

עבודה זו מומנה על ידי מענק NIH R01 GM1265555-01 ומענק NSF DMS-18392999.

Materials

Name Company Catalog Number Comments
Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

ביולוגיה גיליון 178
Visualizer דינמיקה אינהרנטית, יישום אינטראקטיבי להערכה והדמיה של יציאות מצינור הסקת רשת רגולטורית גנטית
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Moseley, R. C., Campione, S.,More

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter