Biology

अंतर्निहित Dynamics Visualizer, एक जीन विनियामक नेटवर्क अनुमान पाइपलाइन से आउटपुट का मूल्यांकन और विज़ुअलाइज़िंग के लिए एक इंटरैक्टिव अनुप्रयोग

Published: December 7, 2021 doi: 10.3791/63084

Robert C. Moseley¹, Sophia Campione¹, Bree Cummins², Francis Motta³, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Mathematical Sciences, Montana State University, ³Department of Mathematical Sciences, Florida Atlantic University

Summary

अंतर्निहित Dynamics Visualizer एक इंटरैक्टिव विज़ुअलाइज़ेशन पैकेज है जो कार्यात्मक नेटवर्क मॉडल की बढ़ी हुई, सुव्यवस्थित पीढ़ी के लिए एक जीन नियामक नेटवर्क अनुमान उपकरण से जुड़ता है। विज़ुअलाइज़र का उपयोग अनुमान उपकरण को पैरामीटर करने के लिए अधिक सूचित निर्णय लेने के लिए किया जा सकता है, इस प्रकार परिणामी मॉडल में आत्मविश्वास बढ़ जाता है।

Abstract

जीन नियामक नेटवर्क मॉडल विकसित करना सिस्टम जीव विज्ञान में एक बड़ी चुनौती है। इस चुनौती से निपटने के लिए कई कम्प्यूटेशनल उपकरण और पाइपलाइनों को विकसित किया गया है, जिसमें नव विकसित अंतर्निहित गतिशीलता पाइपलाइन भी शामिल है। अंतर्निहित Dynamics पाइपलाइन में कई पहले प्रकाशित उपकरण होते हैं जो synergistically काम करते हैं और एक रैखिक फैशन में जुड़े होते हैं, जहां एक उपकरण के आउटपुट का उपयोग निम्न उपकरण के लिए इनपुट के रूप में किया जाता है। अधिकांश कम्प्यूटेशनल तकनीकों के साथ, अंतर्निहित Dynamics पाइपलाइन के प्रत्येक चरण के लिए उपयोगकर्ता को उन मापदंडों के बारे में विकल्प बनाने की आवश्यकता होती है जिनके पास सटीक जैविक परिभाषा नहीं है। ये विकल्प विश्लेषण द्वारा उत्पादित जीन नियामक नेटवर्क मॉडल को काफी हद तक प्रभावित कर सकते हैं। इस कारण से, प्रत्येक चरण में विभिन्न पैरामीटर विकल्पों के परिणामों की कल्पना करने और उनका पता लगाने की क्षमता विकल्पों और परिणामों में विश्वास बढ़ाने में मदद कर सकती है। अंतर्निहित Dynamics Visualizer एक व्यापक विज़ुअलाइज़ेशन पैकेज है जो वेब ब्राउज़र के भीतर एक इंटरैक्टिव इंटरफ़ेस के माध्यम से पैरामीटर विकल्पों का मूल्यांकन करने की प्रक्रिया को सुव्यवस्थित करता है। उपयोगकर्ता अलग से पाइपलाइन के प्रत्येक चरण के आउटपुट की जांच कर सकते हैं, दृश्य जानकारी के आधार पर सहज ज्ञान युक्त परिवर्तन कर सकते हैं, और अंतर्निहित Dynamics पाइपलाइन के लिए आवश्यक इनपुट फ़ाइलों के स्वचालित उत्पादन से लाभ उठा सकते हैं। अंतर्निहित Dynamics Visualizer समय श्रृंखला transcriptomic डेटा से जीन नियामक नेटवर्क की खोज के लिए एक अत्यधिक जटिल उपकरण के लिए उपयोग का एक अद्वितीय स्तर प्रदान करता है।

Introduction

कई महत्वपूर्ण जैविक प्रक्रियाएं, जैसे कि सेल भेदभाव और पर्यावरणीय प्रतिक्रिया, जीन के सेट द्वारा नियंत्रित की जाती हैं जो जीन नियामक नेटवर्क (जीआरएन) में एक दूसरे के साथ बातचीत करती हैं। ये जीआरएन उन फेनोटाइप को सक्रिय करने और बनाए रखने के लिए आवश्यक ट्रांसक्रिप्शनल गतिशीलता का उत्पादन करते हैं जिन्हें वे नियंत्रित करते हैं, इसलिए जीआरएन के घटकों और टोपोलॉजिकल संरचना की पहचान करना कई जैविक प्रक्रियाओं और कार्यों को समझने के लिए महत्वपूर्ण है। एक जीआरएन को एक नेटवर्क द्वारा वर्णित इंटरैक्शन जीन और / या जीन उत्पादों के एक सेट के रूप में मॉडलकिया जा सकता है, जिनके नोड्स जीन हैं और जिनके किनारे इंटरैक्शन की दिशा और रूप का वर्णन करते हैं (उदाहरण के लिए, प्रतिलेखन के सक्रियण / दमन, पोस्ट-ट्रांसलेशनल संशोधन, आदि) ¹. इंटरैक्शन तो पैरामीटर गणितीय मॉडल के रूप में व्यक्त किया जा सकता है प्रभाव एक विनियमन जीन अपने लक्ष्य (ओं) ^2,3,4 के उत्पादन पर है का वर्णन. एक जीआरएन मॉडल के अनुमान के लिए इंटरैक्शन नेटवर्क की संरचना और अंतर्निहित इंटरैक्शन पैरामीटर के अनुमान दोनों का अनुमान लगाने की आवश्यकता होती है। कम्प्यूटेशनल अनुमान विधियों की एक किस्म विकसित की गई है जो समय श्रृंखला जीन अभिव्यक्ति डेटा और आउटपुट जीआरएन मॉडल 5 को निगलती ^है। हाल ही में, एक नई जीआरएन अनुमान विधि विकसित की गई थी, जिसे अंतर्निहित गतिशीलता पाइपलाइन (आईडीपी) कहा जाता है, जो लेबल किए गए नियामक-लक्ष्य इंटरैक्शन के साथ जीआरएन मॉडल का उत्पादन करने के लिए समय श्रृंखला जीन अभिव्यक्ति डेटा का उपयोग करता है जो जीन अभिव्यक्ति डेटा ⁶ में देखी गई गतिशीलता से मेल खाने वाली गतिशीलता का उत्पादन करने में सक्षम हैं। आईडीपी एक पाइपलाइन में रैखिक रूप से जुड़े उपकरणों का एक सूट है और इसे तीन चरणों में विभाजित किया जा सकता है: एक नोड खोज चरण जो जीन अभिव्यक्ति विशेषताओं के आधार पर जीन को रैंक करता है जो जीआरएन ⁷^, ⁸ के कार्य से संबंधित होने के लिए जाना जाता है या संदेह करता है, एक एज फाइंडिंग चरण जो युग्मवार नियामक संबंधों को रैंक करता ^है8^,⁹, और एक नेटवर्क ढूँढना चरण जो GRN मॉडल का उत्पादन करता है जो मनाया dynamics10,11,12,13,14,15 का उत्पादन करने में सक्षम हैं।

अधिकांश कम्प्यूटेशनल विधियों की तरह, आईडीपी को उपयोगकर्ता-निर्दिष्ट तर्कों के एक सेट की आवश्यकता होती है जो यह निर्धारित करते हैं कि इनपुट डेटा का विश्लेषण कैसे किया जाता है, और तर्कों के विभिन्न सेट एक ही डेटा पर अलग-अलग परिणाम उत्पन्न कर सकते हैं। उदाहरण के लिए, IDP सहित कई विधियों में ऐसे तर्क होते हैं जो डेटा पर कुछ थ्रेशोल्ड लागू करते हैं, और विशेष विधि के क्रमिक रनों के बीच इस थ्रेशोल्ड को बढ़ाने/घटाने के परिणामस्वरूप रन के बीच असमान परिणाम हो सकते हैं (पूरक नोट 10: नेटवर्क अनुमान विधियाँ ^of5)। यह समझना कि प्रत्येक तर्क विश्लेषण और बाद के परिणामों को कैसे प्रभावित कर सकता है, परिणामों में उच्च आत्मविश्वास प्राप्त करने के लिए महत्वपूर्ण है। अधिकांश जीआरएन अनुमान विधियों के विपरीत, आईडीपी में कई कम्प्यूटेशनल उपकरण होते हैं, जिनमें से प्रत्येक के पास तर्कों का अपना सेट होता है जो उपयोगकर्ता को निर्दिष्ट करना चाहिए और प्रत्येक के अपने स्वयं के परिणाम होते हैं। जबकि आईडीपी प्रत्येक उपकरण को पैरामीटर करने के तरीके पर व्यापक प्रलेखन प्रदान करता है, पिछले चरण के आउटपुट पर प्रत्येक उपकरण की अंतर-निर्भरता मध्यवर्ती विश्लेषण के बिना पूरी पाइपलाइन को पैरामीटर करने को चुनौतीपूर्ण बनाती है। उदाहरण के लिए, एज और नेटवर्क फाइंडिंग चरणों में तर्कों को पूर्व जैविक ज्ञान द्वारा सूचित किए जाने की संभावना है, और इसलिए डेटासेट और / या जीव पर निर्भर करेगा। मध्यवर्ती परिणामों से पूछताछ करने के लिए, प्रोग्रामिंग की एक बुनियादी समझ, साथ ही साथ आईडीपी से सभी परिणाम फ़ाइलों और उनकी सामग्री की गहरी समझ की आवश्यकता होगी।

अंतर्निहित Dynamics Visualizer (IDV) एक इंटरैक्टिव विज़ुअलाइज़ेशन पैकेज है जो उपयोगकर्ता की ब्राउज़र विंडो में चलता है और IDP के उपयोगकर्ताओं को IDP में किसी भी चरण से परिणामों पर उनके तर्क विकल्पों के प्रभाव का आकलन करने का एक तरीका प्रदान करता है। आईडीवी आईडीपी द्वारा उत्पादित एक जटिल निर्देशिका संरचना को नेविगेट करता है और प्रत्येक चरण के लिए आवश्यक डेटा एकत्र करता है और उपयोगकर्ता का पता लगाने के लिए सहज और इंटरैक्टिव आंकड़ों और तालिकाओं में डेटा प्रस्तुत करता है। इन इंटरैक्टिव डिस्प्ले की खोज करने के बाद, उपयोगकर्ता एक आईडीपी चरण से नए डेटा का उत्पादन कर सकता है जो अधिक सूचित निर्णयों पर आधारित हो सकता है। इन नए डेटा को तुरंत आईडीपी के अगले संबंधित चरण में उपयोग किया जा सकता है। साथ ही, डेटा की खोज यह निर्धारित करने में मदद कर सकती है कि क्या कोई IDP चरण समायोजित पैरामीटर के साथ पुन: चलाएँ। आईडीवी आईडीपी के उपयोग को बढ़ा सकता है, साथ ही आईडीपी के उपयोग को अधिक सहज और पहुंच योग्य बना सकता है, जैसा कि खमीर सेल-चक्र के कोर थरथरानवाला जीआरएन की जांच करके प्रदर्शित किया गया है। निम्न प्रोटोकॉल में एक पूरी तरह से पैरामीटर किए गए IDP रन बनाम एक दृष्टिकोण से IDP परिणाम शामिल हैं जो प्रत्येक IDP चरण के रन के बाद IDV को शामिल करता है, यानी, नोड, एज और नेटवर्क ढूँढना।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. IDP और IDV स्थापित करें

नोट:: यह अनुभाग मानता है कि डॉकर, कोंडा, पाइप, और गिट पहले से ही स्थापित हैं (सामग्री की तालिका)।

एक टर्मिनल में, कमांड दर्ज करें: गिट क्लोन https://gitlab.com/biochron/inherent_dynamics_pipeline.git।
IDP की README फ़ाइल में स्थापित निर्देशों का पालन करें।
एक टर्मिनल में, कमांड दर्ज करें: गिट क्लोन https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git।
नोट:: IDV की क्लोनिंग IDP की शीर्ष-स्तरीय निर्देशिका के बाहर होना चाहिए।
IDV की README फ़ाइल में स्थापित निर्देशों का पालन करें।

2. नोड ढूँढना

नोड ढूँढना चरण parametrizes एक नई IDP कॉन्फ़िगरेशन फ़ाइल बनाएँ।
नोट:: निम्न चरणों में सभी उद्धरण चिह्न ों को टाइप आउट नहीं किया जाना चाहिए। उद्धरण चिह्नों का उपयोग यहां केवल प्रोटोकॉल पाठ के बीच एक सीमांकक के रूप में किया जाता है और क्या टाइप किया जाना है।
1. कॉन्फ़िगरेशन फ़ाइल में मुख्य IDP तर्क जोड़ें।
2. किसी पाठ संपादक में एक नई पाठ फ़ाइल खोलें और अलग-अलग पंक्तियों पर "data_file =", "annotation_file =", "output_dir =", "num_proc =", और "IDVconnection = True" लिखें.
3. "data_file" के लिए, हस्ताक्षर करने के बराबर के बाद, संबंधित समय श्रृंखला फ़ाइल का पथ और नाम लिखें और नाम के बाद अल्पविराम लिखें. प्रत्येक डेटा को अल्पविराम से अलग करें, यदि एक से अधिक बार श्रृंखला डेटा सेट का उपयोग किया जा रहा है। समय श्रृंखला जीन अभिव्यक्ति फ़ाइलों के एक उदाहरण के लिए पूरक फ़ाइल 1 और पूरक फ़ाइल 2 देखें।
4. करने के लिए पथ और "annotation_file" के लिए एनोटेशन फ़ाइल का नाम टाइप करें, हस्ताक्षर करने के बराबर के बाद। किसी एनोटेशन फ़ाइल के उदाहरण के लिए पूरक फ़ाइल 3 देखें.
5. "output_file" के लिए, हस्ताक्षर करने के बराबर के बाद, उस फ़ोल्डर का पथ और नाम लिखें जहाँ परिणाम सहेजे जाएँगे.
6. "num_proc" के लिए साइन करने के बराबर के बाद, IDP द्वारा उपयोग की जाने वाली प्रक्रियाओं की संख्या लिखें.
7. कॉन्फ़िगरेशन फ़ाइल में नोड ढूँढना तर्क जोड़ें.
8. चरण 2.1.1 के समान पाठ फ़ाइल में, अलग-अलग पंक्तियों पर "[dlxjtk_arguments]", "अवधियाँ =", और "dlxjtk_cutoff =" प्रस्तुत किए गए क्रम में लिखें. इन्हें मुख्य तर्कों के बाद रखें।
9. "अवधि" के लिए, चिह्न के बराबर होने के बाद, यदि एक बार श्रृंखला डेटा सेट का उपयोग किया जा रहा है, तो अल्पविराम द्वारा अलग की गई प्रत्येक अवधि की लंबाई लिखें. एक से अधिक बार श्रृंखला डेटा सेट के लिए, पहले की तरह अवधि लंबाई के प्रत्येक सेट को टाइप करें, लेकिन प्रत्येक सेट के चारों ओर वर्ग कोष्ठक रखें और सेट के बीच एक अल्पविराम रखें।
10. चिह्न के बराबर होने के बाद, "dlxjtk_cutoff" के लिए, JTK_CYCLE (DLxJTK) (तालिका 1) द्वारा de Lichtenberg द्वारा gene_list_file आउटपुट में बनाए रखने के लिए जीन की अधिकतम संख्या निर्दिष्ट करने वाला एक पूर्णांक लिखें।
  नोट:: यह प्रत्येक तर्क की बेहतर समझ प्राप्त करने के लिए IDP README में dlxjtk_arguments अनुभागों की समीक्षा करने के लिए अत्यधिक अनुशंसित है। नोड ढूँढना तर्क निर्दिष्ट के साथ एक कॉन्फ़िगरेशन फ़ाइल के एक उदाहरण के लिए पूरक फ़ाइल 4 देखें।
टर्मिनल में, IDP निर्देशिका में ले जाएँ, जिसका नाम inherent_dynamics_pipeline है.
टर्मिनल में, कमांड दर्ज करें: कोंडा dat2net सक्रिय करें
जहाँ <कॉन्फ़िग फ़ाइल का नाम> फ़ाइल का नाम है: python src/dat2net.py > में इस आदेश को चलाकर चरण 2.1 में बनाई गई कॉन्फ़िगरेशन फ़ाइल का उपयोग कर IDP चलाएँ।

टर्मिनल में, inherent_dynamics_visualizer नाम की निर्देशिका पर जाएँ और आदेश दर्ज करें: . /viz_results.sh
नोट:: IDP के लिए आउटपुट निर्देशिका के रूप में उपयोग की जाने वाली निर्देशिका को इंगित करेगा।

किसी वेब ब्राउज़र में, URL के रूप में http://localhost:8050/ दर्ज करें.

आईडीवी अब ब्राउज़र में खुला होने के साथ, नोड फाइंडिंग टैब पर क्लिक करें और ड्रॉपडाउन मेनू से रुचि के नोड खोज फ़ोल्डर का चयन करें।

बाद के आईडीपी चरणों के लिए उपयोग किए जाने वाले आईडीवी में जीन सूची तालिका से मैन्युअल रूप से एक नई जीन सूची को क्यूरेट करें।

जीन सूची तालिका का विस्तार या छोटा करने के लिए, ऊपर या नीचे तीर पर क्लिक करें या मैन्युअल रूप से DLxJTK-रैंक जीन की जीन अभिव्यक्ति के बगल में बॉक्स में 1 और 50 के बीच पूर्णांक में दर्ज करें। ऊपर:.

जीन सूची तालिका में, एक लाइन ग्राफ में अपने जीन अभिव्यक्ति प्रोफ़ाइल को देखने के लिए जीन के बगल में बॉक्स पर क्लिक करें। कई जीन जोड़े जा सकते हैं।

वैकल्पिक रूप से जीन की गणना करने और आदेश करने के लिए समान आकार के डिब्बे की संख्या निर्दिष्ट करें, उनके चरम अभिव्यक्ति वाले समय अंतराल द्वारा जीन को गणना और आदेश दें, जीन सूची तालिका के ऊपर इनपुट बॉक्स में एक पूर्णांक को इनपुट करके इनपुट पूर्णांक लेबल किया गया है ताकि पहले चक्र को डिब्बे में विभाजित किया जा सके:
नोट:: यह विकल्प oscillatory dynamics के लिए विशिष्ट है और अन्य प्रकार की गतिशीलता के लिए लागू नहीं हो सकता है।

ऑर्डर जीन द्वारा: फर्स्ट साइकिल मैक्स एक्सप्रेशन (तालिका 1) के तहत एक विकल्प पर क्लिक करके एक हीटमैप देखने की वरीयता का चयन करें जो पहले चक्र में जीन-अभिव्यक्ति शिखर के समय के आधार पर जीन का आदेश देता है।
नोट:: DLxJTK रैंक आदेश जीन IDP के DLxJTK एल्गोरिथ्म से आवधिकता रैंकिंग पर आधारित है।

एज फाइंडिंग चरण के लिए आवश्यक फ़ाइल स्वरूप में जीन सूची डाउनलोड करने के लिए जीन सूची डाउनलोड करें बटन पर क्लिक करें। जीन सूची फ़ाइल के एक उदाहरण के लिए पूरक फ़ाइल 5 देखें।

संपादन योग्य जीन एनोटेशन तालिका में, एक जीन को एक लक्ष्य, एक नियामक, या दोनों के रूप में लेबल करें एनोटेशन फ़ाइल में एज फाइंडिंग चरण के लिए एक नया एज फाइंडिंग रन। यदि कोई जीन एक नियामक है, तो जीन को एक उत्प्रेरक, दमनकारी, या दोनों के रूप में लेबल करें।

एक उत्प्रेरक के रूप में एक जीन को लेबल करने के लिए, tf_act कॉलम में सेल पर क्लिक करें और मान को 1 में बदलें। एक दमनकर्ता के रूप में एक जीन को लेबल करने के लिए, tf_rep कॉलम में मान को 1 में बदलें। एक जीन को एज फाइंडिंग चरण में एक उत्प्रेरक और एक दमनकारी दोनों के रूप में कार्य करने की अनुमति दी जाएगी, जो tf_act और tf_rep कॉलम दोनों में मूल्यों को 1 पर सेट करके है।

किसी जीन को लक्ष्य के रूप में लेबल करने के लिए, लक्ष्य स्तंभ में सेल पर क्लिक करें और मान को 1 में परिवर्तित करें.

एज फाइंडिंग चरण के लिए आवश्यक फ़ाइल स्वरूप में एनोटेशन फ़ाइल डाउनलोड करने के लिए डाउनलोड Annot. फ़ाइल बटन पर क्लिक करें।

3. एज ढूँढना

एक नई IDP कॉन्फ़िगरेशन फ़ाइल बनाएँ जो edge ढूँढना चरण parametrizes।

कॉन्फ़िगरेशन फ़ाइल में मुख्य IDP तर्क जोड़ें। किसी पाठ संपादक में कोई नई पाठ फ़ाइल खोलें और चरण 2.1.1 दोहराएँ।

कॉन्फ़िगरेशन फ़ाइल में किनारे ढूँढने के तर्क जोड़ें.

चरण 3.1.1 के समान पाठ फ़ाइल में, "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =", और "num_edges_for_seed =" को अलग-अलग पंक्तियों पर प्रस्तुत क्रम में टाइप करें. इन्हें मुख्य तर्कों के नीचे जाना चाहिए।

"gene_list_file" के लिए, हस्ताक्षर करने के बराबर के बाद, चरण 2.8.5 में जनरेट की गई जीन सूची फ़ाइल का पथ और नाम दर्ज करें.

"edge_score_column" के लिए, साइन टू के बराबर होने के बाद, किनारों को फ़िल्टर करने के लिए लेम्पी आउटपुट से किस डेटा फ़्रेम स्तंभ का उपयोग किया जाता है, यह निर्दिष्ट करने के लिए या तो "pld" या "norm_loss" दर्ज करें।

या तो "edge_score_threshold" या "num_edges_for_list" चुनें, और दूसरे को हटादें। यदि "edge_score_threshold" का चयन किया गया था, तो 0 और 1 के बीच की संख्या दर्ज करें. इस संख्या का उपयोग चरण 3.1.5 में निर्दिष्ट स्तंभ के आधार पर किनारों को फ़िल्टर करने के लिए किया जाएगा.

यदि "num_edges_for_list" का चयन किया गया था, तो संभावित किनारों की संख्या के बराबर या उससे कम मान दर्ज करें. इस संख्या का उपयोग चरण 3.1.5 में निर्दिष्ट स्तंभ में उन्हें कैसे स्थान दिया गया है, इसके आधार पर किनारों को फ़िल्टर करने के लिए किया जाएगा. बचे हुए किनारों का उपयोग नेटवर्क फाइंडिंग में नेटवर्क बनाने के लिए किया जाएगा।

या तो "seed_threshold" या "num_edges_for_seed" का चयन करें और दूसरे को हटाएं। यदि "seed_threshold" का चयन किया गया था, तो 0 और 1 के बीच की कोई संख्या दर्ज करें. इस संख्या का उपयोग चरण 3.1.5 में निर्दिष्ट स्तंभ के आधार पर किनारों को फ़िल्टर करने के लिए किया जाएगा.

यदि "num_edges_for_seed" का चयन किया गया था, तो संभावित किनारों की संख्या के बराबर या उससे कम मान दर्ज करें. इस संख्या का उपयोग चरण 3.1.5 में निर्दिष्ट स्तंभ में उन्हें कैसे स्थान दिया गया है, इसके आधार पर किनारों को फ़िल्टर करने के लिए किया जाएगा. बचे हुए किनारों का उपयोग नेटवर्क ढूँढने में उपयोग किए जाने वाले बीज नेटवर्क (तालिका 1) के निर्माण के लिए किया जाएगा।
नोट:: यह अत्यधिक प्रत्येक तर्क की बेहतर समझ प्राप्त करने के लिए IDP README में lempy_arguments और netgen_arguments अनुभागों की समीक्षा करने के लिए अनुशंसित है। एज ढूँढने वाले तर्क निर्दिष्ट के साथ कॉन्फ़िगरेशन फ़ाइल के एक उदाहरण के लिए पूरक फ़ाइल 7 देखें.

चरण 2.2 और 2.3 को दोहराएँ।

चरण 3.1 में बनाई गई कॉन्फ़िगरेशन फ़ाइल का उपयोग करके IDP चलाएँ टर्मिनल में इस आदेश को चलाकर, जहाँ <कॉन्फ़िग फ़ाइल नाम> फ़ाइल का नाम है: python src/dat2net.py

IDV अभी भी चल रहा है, तो प्रोग्राम को रोकने के लिए टर्मिनल विंडो में नियंत्रण C दबाकर इसे रोकें। चरण 2.5 और 2.6 को दोहराएँ।

ब्राउज़र में खुले IDV के साथ, एज फाइंडिंग टैब पर क्लिक करें और ड्रॉप-डाउन मेनू से ब्याज के किनारे खोज फ़ोल्डर का चयन करें।
नोट:: यदि Edge Finding में एकाधिक डेटासेट का उपयोग किया जाता है, तो स्थानीय एज मशीन (LEM) विश्लेषण (तालिका 1) में उपयोग किए गए अंतिम डेटासेट का चयन करना सुनिश्चित करें। कॉन्फ़िगरेशन फ़ाइल में सूचीबद्ध अंतिम समय श्रृंखला डेटा को देखने के लिए एलईएम परिणामों के आधार पर बीज नेटवर्क या एज सूची के लिए किनारों का चयन करते समय यह महत्वपूर्ण है क्योंकि यह आउटपुट नोड्स के बीच नियामक संबंधों के अपने अनुमान में सभी पूर्ववर्ती डेटाफ़ाइलों को शामिल करता है।

किनारे की तालिका को विस्तारित या छोटा करने के लिए, मैन्युअल रूप से किनारों की संख्या के अंतर्गत इनपुट बॉक्स में कोई पूर्णांक दर्ज करें:.

वैकल्पिक रूप से LEM ODE पैरामीटर पर किनारों को फ़िल्टर करें। क्लिक करें और खींचें या तो बाईं ओर या प्रत्येक पैरामीटर के स्लाइडर के दाईं ओर ले जाने के लिए किनारे तालिका से किनारों को निकालने के लिए जो उनके नए अनुमत पैरामीटर सीमा के बाहर पैरामीटर है।

वैकल्पिक रूप से एक नया बीज नेटवर्क बनाएँ यदि एक अलग बीज नेटवर्क IDP द्वारा प्रस्तावित एक से चाहता है। किसी बीज नेटवर्क फ़ाइल के एक उदाहरण के लिए पूरक फ़ाइल 8 देखें।

बीज नेटवर्क का चयन करने के लिए या तो बीज से या नेटवर्क के अंतर्गत ड्रॉपडाउन मेनू से चयन से का चयन करें:.

बीज नेटवर्क से किनारों को हटाने/जोड़ने के लिए प्रत्येक किनारे से सटे संबंधित चेकबॉक्स पर क्लिक करके किनारे की तालिका से किनारों का चयन रद्द/चयन करें.

विनियामक नेटवर्क ( DSGRN ) (तालिका 1) नेटवर्क विनिर्देश स्वरूप द्वारा जनरेट किए गए डायनेमिक हस्ताक्षर में बीज नेटवर्क डाउनलोड करने के लिए डाउनलोड DSGRN NetSpec बटन पर क्लिक करें।

नेटवर्क ढूँढना चरण में उपयोग किए जाने वाले अतिरिक्त नोड्स और किनारों का चयन करें.

नेटवर्क ढूँढ़ने में उपयोग की गई किनारे सूची फ़ाइल में शामिल करने के लिए संगत चेकबॉक्स क्लिक करके किनारे तालिका से किनारों का चयन करें.

नेटवर्क फाइंडिंग में उनके उपयोग के लिए आवश्यक प्रारूप में नोड सूची और किनारे सूची फ़ाइलों को डाउनलोड करने के लिए नोड और एज सूचियों को डाउनलोड करने के लिए डाउनलोड नोड और एज सूचियों पर क्लिक करें। क्रमशः किनारे और नोड सूची फ़ाइलों के उदाहरणों के लिए पूरक फ़ाइल 9 और पूरक फ़ाइल 10 देखें।
नोट:: नोड सूची किनारे सूची फ़ाइल में सभी नोड्स होना आवश्यक है, इसलिए IDV स्वचालित रूप से चयनित किनारों पर आधारित नोड सूची फ़ाइल बनाता है। एज फाइंडिंग में किनारों को देखने के लिए दो विकल्प उपलब्ध हैं। LEM सारांश तालिका विकल्प किनारों को शीर्ष 25 किनारों की एक रैंक सूची के रूप में प्रस्तुत करता है। शीर्ष-पंक्ति एलईएम तालिका प्रत्येक संभावित नियामक के लिए शीर्ष तीन रैंक किनारों की एक concatenated सूची में किनारों को प्रस्तुत करती है। प्रत्येक विकल्प के लिए देखे गए किनारों की संख्या को उपयोगकर्ता द्वारा किनारों की संख्या इनपुट बॉक्स में संख्या बदलकर समायोजित किया जा सकता है।

4. नेटवर्क ढूँढना

नेटवर्क ढूँढना चरण parametrizes एक नई IDP कॉन्फ़िगरेशन फ़ाइल बनाएँ।

कॉन्फ़िगरेशन फ़ाइल में मुख्य IDP तर्क जोड़ें। किसी पाठ संपादक में कोई नई पाठ फ़ाइल खोलें और चरण 2.1.1 दोहराएँ।

कॉन्फ़िगरेशन फ़ाइल में नेटवर्क ढूँढना तर्क जोड़ें.

चरण 4.1.1 के समान पाठ फ़ाइल में, "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[संभावनाएं]]", "addNode =", "addNode =", "removeNode =", और "removeEdge =" को मुख्य तर्कों के नीचे अलग-अलग पंक्तियों पर प्रस्तुत क्रम में टाइप करें।

"seed_net_file", "edge_list_file" और "node_list_file" के लिए, समान चिह्न के बाद, बीज नेटवर्क फ़ाइल का पथ और नाम और चरण 3.9 और 3.10.2 में जनरेट की गई किनारे और नोड सूची फ़ाइलों को दर्ज करें।

चिह्न के बराबर के बाद, "range_operations" के लिए, अल्पविराम द्वारा अलग की गई दो संख्याएँ लिखें. पहली और दूसरी संख्याएं क्रमशः प्रति नेटवर्क नोड्स या किनारों को जोड़ने या हटाने की न्यूनतम और अधिकतम संख्या हैं।

"numneighbors" के लिए, हस्ताक्षर करने के बराबर के बाद, एक संख्या दर्ज करें जो यह दर्शाता है कि नेटवर्क ढूँढने में कितने नेटवर्क खोजने हैं।

"maxparams" के लिए, हस्ताक्षर करने के बराबर के बाद, एक नेटवर्क के लिए अनुमति देने के लिए DSGRN पैरामीटर की अधिकतम संख्या का प्रतिनिधित्व करता है एक संख्या दर्ज करें।

इन तर्कों में से प्रत्येक के लिए 0 और 1 के बीच मान दर्ज करें: "addNode", "addEdge", "removeNode", और "removeEdge", चिह्न के बराबर के बाद। संख्याओं को 1 तक जोड़ना चाहिए।
नोट:: प्रत्येक तर्क की बेहतर समझ प्राप्त करने के लिए IDP README में netper_arguments और netquery_arguments अनुभागों की समीक्षा करने के लिए अत्यधिक अनुशंसित है। नेटवर्क ढूँढना तर्क निर्दिष्ट के साथ एक कॉन्फ़िगरेशन फ़ाइल के उदाहरण के लिए पूरक फ़ाइल 11 और पूरक फ़ाइल 12 देखें।

चरण 2.2 और 2.3 को दोहराएँ।

चरण 4.1 में बनाई गई कॉन्फ़िगरेशन फ़ाइल का उपयोग करके IDP चलाएँ टर्मिनल में इस आदेश को चलाकर, जहाँ <कॉन्फ़िग फ़ाइल नाम> फ़ाइल का नाम है: python src/dat2net.py

IDV अभी भी चल रहा है, तो प्रोग्राम को रोकने के लिए टर्मिनल विंडो में नियंत्रण C दबाकर इसे रोकें। चरण 2.5 और 2.6 को दोहराएँ।

ब्राउज़र में खुले IDV के साथ, नेटवर्क ढूँढना टैब पर क्लिक करें और रुचि के नेटवर्क ढूँढने वाले फ़ोल्डर का चयन करें।

एक किनारे प्रसार तालिका (तालिका 1) उत्पन्न करने के लिए और नेटवर्क को उनके संबंधित क्वेरी परिणामों के साथ देखने के लिए किसी नेटवर्क या नेटवर्क के सेट का चयन करें।

नेटवर्क का चयन करने के लिए दो विकल्प उपलब्ध हैं: विकल्प 1 - प्लॉट के x-अक्ष और y-अक्ष के अनुरूप इनपुट बक्से में न्यूनतम और अधिकतम मानों को इनपुट करके क्वेरी परिणामों पर कम और ऊपरी सीमाओं को इनपुट करें। विकल्प 2 - क्लिक करें और शामिल किया जा करने के लिए नेटवर्क के चारों ओर एक बॉक्स आकर्षित करने के लिए स्कैटरप्लॉट पर खींचें। चयन या इनपुट सीमा दर्ज किए जाने के बाद, चयनित नेटवर्क से एज प्रसार प्राप्त करें बटन दबाएँ .
नोट:: यदि एक से अधिक DSGRN क्वेरी निर्दिष्ट किया गया था, तो प्रत्येक क्वेरी के परिणामों के बीच स्विच करने के लिए क्वेरी प्रकार के साथ लेबल किए गए रेडियो बटन का उपयोग करें। एक ही लागू होता है यदि एक से अधिक epsilon (शोर स्तर) निर्दिष्ट किया गया था।

तालिका के अगले पृष्ठ पर जाने के लिए किनारे प्रसार तालिका के नीचे तीर क्लिक करें. किनारे प्रसार तालिका डाउनलोड करने के लिए डाउनलोड तालिका दबाएँ।

चरण 4.6 में किए गए चयन से एकल नेटवर्क प्रदर्शित करने के लिए नेटवर्क अनुक्रमणिका इनपुट बॉक्स में कोई पूर्णांक इनपुट करें. DSGRN नेटवर्क विनिर्देश स्वरूप में प्रदर्शित नेटवर्क को डाउनलोड करने के लिए डाउनलोड DSGRN NetSpec पर क्लिक करें।

किसी निर्दिष्ट आकृति या रुचि के नेटवर्क के लिए समानता के लिए नेटवर्क खोजें.

समानता विश्लेषण के लिए उपयोग किए जाने वाले नेटवर्क या मोटिफ में शामिल किए जाने वाले किनारों का चयन करने के लिए प्रत्येक किनारे से संबंधित चेकबॉक्स का उपयोग करें। चयनित आकृति या नेटवर्क के लिए समानता स्कैटरप्लॉट बनाने के लिए सबमिट पर क्लिक करें ।
नोट:: वर्णमाला के अनुसार सॉर्ट करने के लिए किनारे सूची में तीर और तालिका के अगले पृष्ठ पर ले जाने के लिए तालिका के नीचे तीर का उपयोग करें।

क्लिक करें और एक किनारे प्रसार तालिका उत्पन्न करने के लिए नेटवर्क या नेटवर्क के सेट का चयन करने के लिए और उनके संबंधित क्वेरी परिणामों के साथ नेटवर्क को देखने के लिए शामिल किया जा करने के लिए नेटवर्क के चारों ओर एक बॉक्स आकर्षित करने के लिए स्कैटरप्लॉट पर खींचें।
नोट:: यदि एक से अधिक DSGRN क्वेरी निर्दिष्ट किया गया था, तो प्रत्येक क्वेरी के परिणामों के बीच स्विच करने के लिए क्वेरी प्रकार के साथ लेबल किए गए रेडियो बटन का उपयोग करें। एक ही लागू होता है यदि एक से अधिक epsilon (शोर स्तर) निर्दिष्ट किया गया था।

क्रमशः समानता विश्लेषण के लिए किनारे प्रसार तालिका और प्रदर्शित नेटवर्क को डाउनलोड करने के लिए चरण 4.7 और 4.8 दोहराएँ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

चित्रा 1 में ऊपर और ग्राफिक रूप से वर्णित चरणों को खमीर सेल-चक्र के कोर दोलन जीआरएन पर लागू किया गया था, यह देखने के लिए कि क्या कार्यात्मक जीआरएन मॉडल की खोज करना संभव है जो खमीर सेल-चक्र अध्ययन ¹⁶ में एकत्र किए गए समय श्रृंखला जीन अभिव्यक्ति डेटा में देखी गई गतिशीलता का उत्पादन करने में सक्षम हैं। यह स्पष्ट करने के लिए कि आईडीवी आईडीपी आउटपुट को कैसे स्पष्ट और बेहतर बना सकता है, इस विश्लेषण को दो तरीकों से करने के बाद, परिणामों की तुलना की गई थी: 1) आईडीवी के बिना एक पास में आईडीपी के सभी चरणों को चलाना और 2) आईडीवी की सहायता से आईडीपी के माध्यम से कदम उठाना, जो पूर्व जैविक ज्ञान को शामिल करके और आईडीपी आउटपुट के आधार पर परिष्कृत विकल्प बनाकर मध्यवर्ती परिणामों के समायोजन की अनुमति देता है। एक उदाहरण के रूप में उपयोग किए जाने वाले अच्छी तरह से अध्ययन किए गए खमीर सेल-चक्र जीआरएन में इसके कई नियामक संबंधों को प्रयोगात्मक रूप से सत्यापित किया गया है। यदि एक अलग और / या कम एनोटेट जीव या जैविक प्रक्रिया का अध्ययन किया जा रहा है, तो मध्यवर्ती परिणामों या मापदंडों को कैसे समायोजित किया जाता है, इस पर विकल्प अलग हो सकते हैं। नेटवर्क का आकलन करने के लिए उपयोग की जा सकने वाली एक प्रकार की क्वेरी को स्पष्ट करने के लिए, प्रत्येक नेटवर्क की मजबूती को स्थिर दोलनों का समर्थन करने और मॉडल पैरामीटर में उनके नोड्स की देखी गई ट्रांसक्रिप्शनल गतिशीलता से मेल खाने के लिए मापा गया था।

दो प्रतिकृति श्रृंखला के जीन अभिव्यक्ति समय श्रृंखला डेटा ऑरलैंडो 200816 से लिया गया था और मूल प्रयोग (पूरक फ़ाइल 1 और पूरक फ़ाइल 2) में लागू सेल-चक्र सिंक्रनाइज़ेशन विधि से जुड़े किसी भी जीन अभिव्यक्ति को हटाने के लिए पूर्वसंसाधित किया गया था। एक एनोटेशन फ़ाइल बनाई गई थी जिसमें समय श्रृंखला डेटा में सभी जीन शामिल थे जो ^Yeastract17 में पाए गए डीएनए बाध्यकारी और अभिव्यक्ति साक्ष्य दोनों द्वारा समर्थित हैं और इस प्रकार एक जीआरएन में एक नियामक के रूप में कार्य कर सकते हैं। TOS4, PLM2, और NRM1 को नियामकों के रूप में भी शामिल किया गया था, भले ही वे दोनों प्रकार के सबूतों के लिए Yeastract में नहीं पाए गए थे, क्योंकि उन्हें साहित्य में सबूतों के आधार पर खमीर कोर GRN के लिए महत्वपूर्ण माना जाता ^है18,19 (पूरक फ़ाइल 3)। सभी नियामकों को एक उत्प्रेरक और दमनकारी दोनों के साथ-साथ लक्ष्यों के रूप में लेबल किया गया था।

IDP को पहले IDP के सभी चरणों के माध्यम से चलाने के लिए पैरामीटर किया गया था, जो नोड, एज और नेटवर्क ढूँढना है। तर्कों का एक सेट चुना गया था जो खमीर सेल-चक्र जीआरएन की वर्तमान समझ के आधार पर उपयुक्त दिखाई दिया, जो एक दृढ़ता से जुड़े नेटवर्क (पूरक फ़ाइल 4) में भाग लेने वाले जीन का एक छोटा सा सेट था। इस समझ ने ज्यादातर नोड और एज फाइंडिंग विकल्पों को प्रभावित किया। नेटवर्क फाइंडिंग में संभावनाएं पैरामीटर इस धारणा पर आधारित थीं कि नेटवर्क फाइंडिंग पर केवल सच्चे जीन और नियामक इंटरैक्शन को पारित किया जाएगा। आईडीपी के इस पूरी तरह से पैरामीटर किए गए रन ने नोड और एज फाइंडिंग (चित्रा 2 बी, सी) के लिए परिणाम उत्पन्न किए, फिर भी नेटवर्क खोजने में कोई मॉडल-स्वीकार्य नेटवर्क नहीं खोजा गया था (चित्रा 2 ए, डी)। मॉडल स्वीकार्यता को पायथन मॉड्यूल dsgrn_net_gen ¹⁴ के कोड प्रलेखन में समझाया गया है, जो आईडीपी की निर्भरता है। संक्षेप में, नेटवर्क जिसमें स्व-दमनकारी किनारे होते हैं या एक ही नोड पर बहुत अधिक इनपुट या आउटपुट होते हैं, वे DSGRN सॉफ़्टवेयर (तालिका 1) द्वारा क्वेरी करने योग्य नहीं होते हैं। IDP कई कारण देता है कि मॉडल-स्वीकार्य नेटवर्क क्यों नहीं मिल सकता है और समस्या (ओं) को हल करने के लिए समस्या निवारण चरणों का वर्णन करता है। अनिवार्य रूप से, इसमें पैरामीटर और / या इनपुट फ़ाइलों को बदलना और संबंधित आईडीपी चरण को फिर से चलाना और परिणामों की जांच करना शामिल है। आईडीवी का उपयोग इस प्रक्रिया को कम थकाऊ और समय लेने वाला बनाने के लिए किया गया था।

नोड ढूँढना परिणाम IDV में लोड किए गए जीन IDP के एज फाइंडिंग चरण के लिए पारित किया जा रहा है की जांच करने के लिए। आईडीपी द्वारा दिए गए नोड्स शीर्ष एन जीन हैं जैसा कि डीएलएक्सजेटीके (तालिका 1) द्वारा रैंक किया गया है, एन उपयोगकर्ता द्वारा निर्दिष्ट किया जा रहा है, हालांकि, यह जीन सूची विश्लेषण के लक्ष्य के लिए उपयुक्त नहीं हो सकती है। पूर्व जैविक ज्ञान के बिना, केवल DLxJTK स्कोर का उपयोग करके नोड्स के स्वचालित चयन ने खमीर सेल-चक्र (RME1) में भूमिका के सीमित सबूत के साथ एक जीन लौटा दिया, जबकि कुछ ज्ञात सेल-चक्र ट्रांसक्रिप्शनल नियामकों को अत्यधिक रैंक नहीं दिया गया था (चित्रा 2 बी)। Yeastract प्रयोगात्मक सबूत का उपयोग सेल-चक्र एनोटेशन वाले लोगों द्वारा DLxJTK द्वारा उच्चतम रैंकिंग वाले जीनों में से चयन करने के लिए किया गया था। ये जीन SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 और SWI5 हैं। उनके ज्ञात नियामक संबंधों को चित्र 3 में देखा जा सकता है। FKH2 शीर्ष दस जीनों में प्रकट नहीं होता है (dlxjtk_cutoff पूरक फ़ाइल 4 में दस पर सेट किया गया था) जैसा कि DLxJTK द्वारा रैंक किया गया था, इसलिए जीन सूची को IDV का उपयोग करके बढ़ाया गया था जब तक कि FKH2 नहीं मिला (चित्रा 4)। विस्तारित जीन सूची में कई अतिरिक्त जीन कोर जीन ज्ञात हैं और नोड खोज परिणामों की जांच किए बिना याद किया गया होगा। जबकि अधिक ज्ञात कोर जीन को डीएलएक्सजेटीके रैंक सूची के नीचे जीन सूची का विस्तार करके पाया गया है, ब्याज के जीन पर ध्यान केंद्रित किया गया था। इसलिए, कुछ उच्च रैंकिंग वाले जीनों का चयन रद्द कर दिया गया था, जिसके परिणामस्वरूप एक जीन सूची (पूरक फ़ाइल 5) जिसमें सात जीन (चित्रा 4) शामिल थे। इन सात जीनों के आधार पर एक नई एनोटेशन फ़ाइल बनाई गई थी (पूरक फ़ाइल 6), प्रत्येक जीन को एक लक्ष्य के रूप में लेबल किया गया था, और नियामक प्रकार को यीस्टरैक्ट का उपयोग करके निर्दिष्ट किया गया था। नई जीन सूची और एनोटेशन फ़ाइल को अगले आईडीपी चरण, एज फाइंडिंग में बाद के उपयोग के लिए डाउनलोड किया गया था। आईडीवी के बिना, जीन सूची और एनोटेशन फ़ाइल से जीन को जोड़ने और हटाने की प्रक्रिया को मामूली कोडिंग कौशल की आवश्यकता होगी।

एक नई IDP कॉन्फ़िगरेशन फ़ाइल को नई जीन सूची और एनोटेशन फ़ाइल के साथ, केवल एज फाइंडिंग चरण (पूरक फ़ाइल 7) के लिए पैरामीटर किया गया था। नई कॉन्फ़िगरेशन फ़ाइल के साथ IDP के पूरा होने के बाद, परिणाम IDV (चित्रा 5A) में लोड किए गए थे। जैसा कि नेटवर्क ढूँढना चरण इसे आपूर्ति किए गए बीज नेटवर्क के नेटवर्क स्थान के चारों ओर stochastically खोजकरता है, एक अच्छा बीज नेटवर्क प्रदान करना महत्वपूर्ण हो सकता है। एक अच्छा बीज नेटवर्क के बारे में सोचा जा सकता है कि एक के रूप में सच किनारों होता है. आईडीवी के साथ और ऑनलाइन डेटाबेस जैसे कि यीस्ट्रैक्ट और सैकैरोमाइसेस जीनोम डेटाबेस (एसजीडी) ²⁰ का उपयोग करके, बीज नेटवर्क को एलईएम (तालिका 1) से नियामक संबंधों का उपयोग करके देखा और समायोजित किया जा सकता है जिसमें प्रयोगात्मक सबूत हैं। एक उदाहरण के रूप में, किनारे YHP1 = tf_act (HCM1) अचयनित किया गया था क्योंकि Yeastract में इस संबंध (चित्रा 5B) का कोई दस्तावेज सबूत नहीं है। एज SWI5 = tf_act (FKH2) जोड़ा गया था क्योंकि इस संबंध ²¹ के प्रलेखित सबूत हैं। एक बार बीज नेटवर्क (तालिका 1) संतोषजनक था, नेटवर्क के लिए DSGRN नेटवर्क विनिर्देश फ़ाइल डाउनलोड किया गया था (पूरक फ़ाइल 8)।

आईडीवी के बिना, किनारों की एक उच्च संभावना है जिसके लिए बीज नेटवर्क के निर्माण के लिए कोई प्रयोगात्मक सबूत का उपयोग नहीं किया जा रहा है। जैसा कि चित्रा 2 C में देखा जा सकता है, प्रत्येक चरण के माध्यम से IDP नॉनस्टॉप चलाने से एज फाइंडिंग चरण में उत्पन्न बीज नेटवर्क में एक किनारे, SWI4 = tf_rep (NDD1) होता है, जो कि Yeastract में प्रयोगात्मक साक्ष्य द्वारा समर्थित नहीं है, संभवतः क्योंकि NDD1 को एक ट्रांसक्रिप्शनल एक्टिवेटर ²² के रूप में जाना जाता है। यह जानकारी नॉन-स्टॉप रन में एनोटेशन फ़ाइल में एन्कोडेड नहीं थी, जिसने सभी नियामकों को एक्टिवेटर और दमनकर्ता दोनों होने की अनुमति दी थी।

IDV का उपयोग करते हुए, एक बीज नेटवर्क को मैन्युअल रूप से क्यूरेट किया गया था जो चित्रा 3 का एक उपनेटवर्क है, और शेष चार किनारों को नमूना नेटवर्क स्पेस (YHP1 = tf_act (SWI4), YOX1 = tf_act (SWI4), SWI4 = tf_rep (YOX1), SWI5 = tf_act (NDD1)) के लिए उपयोग की जाने वाली किनारे की सूची में रखा गया था। पूर्व जैविक ज्ञान के आधार पर किनारों का चयन भी किनारे की सूची बनाने के लिए इस्तेमाल किया जा सकता है; हालांकि, इस मामले में, LEM सारांश तालिका दृश्य से शीर्ष 20 किनारों का चयन किया गया था (पूरक फ़ाइल 9)। नोड सूची फ़ाइल चयनित किनारों से स्वचालित रूप से बनाई गई है (पूरक फ़ाइल 10)। एलईएम से ओडीई पैरामीटर का उपयोग किनारों को फ़िल्टर करने के लिए भी किया जा सकता है यदि कोई मानता है कि ओडीई मॉडल में अनुमानित पैरामीटर जैविक रूप से यथार्थवादी नहीं हैं, लेकिन इस जानकारी का उपयोग यहां नहीं किया गया था।

अगला, एक नई IDP कॉन्फ़िगरेशन फ़ाइल तीन नई फ़ाइलों का उपयोग कर नेटवर्क ढूँढना चरण के लिए पैरामीटर किया गया था। चूंकि बीज नेटवर्क को प्रयोगात्मक साक्ष्य द्वारा अच्छी तरह से समर्थित किनारों के साथ बनाया गया था, इसलिए सभी नेटवर्क में इन किनारों को शामिल करना वांछित था। इस प्रकार, नेटवर्क ढूँढना संभावनाओं को इसके अलावा की अनुमति देने के लिए सेट किया गया था, लेकिन नोड्स और किनारों को हटाने के लिए नहीं (पूरक फ़ाइल 11)। नेटवर्क ढूँढना पैरामीटर numneighbors 2,000 नेटवर्क के लिए खोज करने के लिए सेट किया गया था। IDP चलाने के बाद, 37 मॉडल-स्वीकार्य नेटवर्क नेटवर्क ढूँढना चरण में पाए गए थे, जैसा कि शून्य वाले गैर-स्टॉप रन के विपरीत था। आईडीवी में नेटवर्क खोज परिणाम लोड करना, इन 37 नेटवर्कों में से 64% (24) में स्थिर रूप से दोलन करने की क्षमता थी (चित्रा 6 ए)। इन 24 नेटवर्कों में से, सबसे अच्छे कलाकार दो नेटवर्क थे जो अपने स्थिर रूप से दोलन मॉडल पैरामीटर (चित्रा 6 बी) के 50% पर डेटा से मेल खाते थे।

एज प्रचलन तालिका (तालिका 1) नेटवर्क के एक चयनित संग्रह में एक किनारे के होने की संख्या को सारणीबद्ध करती है, जिससे उच्च प्रदर्शन करने वाले नेटवर्क में इसकी व्यापकता का संकेत मिलता है। स्कैटर प्लॉट में पिछले दो नेटवर्कों का चयन करके उत्पादित एज प्रचलन तालिका की जांच करने से पता चलता है कि सभी बीज नेटवर्क किनारे दो नेटवर्कों में से प्रत्येक में मौजूद हैं, जैसा कि अपेक्षित है, दो गैर-बीज नेटवर्क किनारों (चित्रा 6 बी), SWI4 = tf_act (SWI5) और HCM1 = tf_rep (YHP1) के साथ। इन दोनों किनारों में से किसी के पास भी Yeastract में उनका समर्थन करने वाले सबूत नहीं थे। इस तरह के नेटवर्क स्पेस की एक छोटी राशि का पता लगाया गया था, इसलिए मनाया गतिशीलता के उत्पादन में किनारों और नोड्स के महत्व का आकलन करना मुश्किल है।

नेटवर्क फाइंडिंग में केवल 37 मॉडल-स्वीकार्य नेटवर्क पाए गए थे, भले ही पैरामीटर संख्या 2,000 पर सेट किया गया था, जिससे पता चलता है कि नेटवर्क खोज अनावश्यक रूप से सीमित हो सकती है। जैसा कि आईडीपी में dsgrn_net_gen पाइथन मॉड्यूल के लिए प्रलेखन में वर्णित है, समस्या बीज नेटवर्क, किनारे की सूची, नोड सूची, नेटवर्क ढूँढना पैरामीटर विकल्प, या इनमें से कुछ संयोजन से संबंधित हो सकती है। जांच करने के लिए, पहले की तरह एक ही बीज नेटवर्क, किनारे की सूची, और नोड सूची का उपयोग किया गया था, लेकिन नेटवर्क ढूँढना पैरामीटर नेटवर्क जनरेशन (पूरक फ़ाइल 12) के दौरान किनारों को हटाने की क्षमता जोड़कर बदल दिए गए थे। IDV में नए नेटवर्क ढूँढने के परिणाम लोड करने से पता चलता है कि इस चरण में 612 नेटवर्क पाए गए थे, जिनमें से 67% (411) इन नेटवर्कों में स्थिर रूप से दोलन करने की क्षमता थी (चित्रा 7A)। दिलचस्प बात यह है कि नेटवर्क के 13% (82) जो स्थिर ऑस्सिलेटरी गतिशीलता में सक्षम थे, डेटा (चित्रा 7 बी) में देखे गए लोगों के समान गतिशीलता का उत्पादन करने में सक्षम नहीं थे। 411 नेटवर्कों में से, 30% (124) ने डेटा के लिए मजबूत मैचों का प्रदर्शन किया (यानी, उनके स्थिर रूप से दोलन मॉडल पैरामीटर के 50% से अधिक ने डेटा मैच प्रदर्शित किया) (चित्रा 7 सी)।

नेटवर्क फाइंडिंग के दूसरे दौर द्वारा उत्पन्न बढ़त की व्यापकता संख्या अब नेटवर्क के बहुत बड़े चयन पर आधारित है और जीआरएन में नियामक संबंध के महत्व का आकलन करने में अधिक आत्मविश्वास से उपयोग की जा सकती है। उदाहरण के लिए, HCM1 = tf_rep (YHP1) अभी भी उन नेटवर्कों में अत्यधिक प्रतिनिधित्व करता है जो मजबूत गतिशीलता का उत्पादन करते हैं, यह सुझाव देते हुए कि यह संबंध प्रयोगात्मक रूप से जांच के लायक हो सकता है (चित्रा 7 C)। एज प्रचलन तालिका की आगे की जांच (ऊपर उल्लिखित 124 नेटवर्क के आधार पर) से पता चला है कि किनारों SWI4 = tf_rep (YOX1) और YOX1 = tf_act (SWI4) अभी तक उच्च रैंक नहीं हैं, किनारों SWI4 = tf_rep (YHP1) और YHP1 = tf_act (SWI4) को अत्यधिक रैंक दिया गया है (चित्रा 7C)। थरथरानवाला ^dynamics23 के उत्पादन के लिए नकारात्मक प्रतिक्रिया महत्वपूर्ण है और नियामक संबंधों के इन दोनों सेट चित्रा 3 में GRN में इस समारोह प्रदान करते हैं। यह पता लगाना कि क्या कोई नेटवर्क मौजूद है जिसमें इन सभी चार किनारों को शामिल किया गया है, कुछ अंतर्दृष्टि प्रदान कर सकता है कि ये जीआरएन मॉडल के संग्रह में अक्सर एक साथ क्यों मौजूद नहीं होते हैं; हालांकि, व्यक्तिगत नेटवर्क के माध्यम से क्लिक करना थकाऊ होगा। इसके बजाय, नेटवर्क ढूँढना पृष्ठ के समानता विश्लेषण भाग का उपयोग उन नेटवर्कों की खोज करने के लिए किया गया था जिनमें सभी चार किनारे हो सकते हैं (चित्र7D). स्कैटर प्लॉट की जांच करना जो प्रदर्शित करता है कि 612 नेटवर्क इन चार किनारों के एक मोटिफ के समान हैं बनाम मॉडल पैरामीटर स्पेस का प्रतिशत जो मनाया गतिशीलता से मेल खाता है, से पता चलता है कि 612 नेटवर्क के केवल 0.65% (4) में इन किनारों में से सभी चार शामिल हैं (चित्रा 7 डी)। यह एक परीक्षण योग्य परिकल्पना का सुझाव देता है कि इस आकार के नेटवर्क के लिए दो नकारात्मक प्रतिक्रिया छोरों में से केवल एक की आवश्यकता होती है ताकि मनाया गतिशीलता का उत्पादन किया जा सके। इस परिकल्पना को आगे कम्प्यूटेशनल रूप से आईडीपी चरणों के पुनर्परमापन और नेटवर्क स्पेस की अधिक संपूर्ण खोज या प्रयोगात्मक रूप से, जैसे जीन नॉकआउट द्वारा जांच की जा सकती है। इस विश्लेषण के सभी परिणाम पूरक फ़ाइल 13 में पाए जा सकते हैं।

चित्रा 1: IDP और IDV वर्कफ़्लो ओवरव्यू। निचली पंक्ति IDP के तीन प्रमुख चरणों को दर्शाती है: नोड, एज, और नेटवर्क ढूँढना. शीर्ष पंक्ति IDV के प्रमुख चरणों को दर्शाती है और विभिन्न तरीकों का वर्णन करती है जो उपयोगकर्ता परिणामों के साथ बातचीत कर सकता है। दोनों के बीच गहरे भूरे रंग के तीर दर्शाते हैं कि कैसे आईडीवी और आईडीपी उपयोगकर्ताओं को आईडीपी के प्रत्येक चरण के लिए सूचित निर्णय लेने की अनुमति देने के लिए सहक्रियात्मक रूप से काम कर सकते हैं, व्यक्तिगत आईडीपी चरणों के साथ आईडीवी में विज़ुअलाइज़ेशन के लिए परिणाम प्रदान करते हैं, व्यक्तिगत आईडीवी चरण नए या समायोजित पैरामीटर के इनपुट के लिए अनुमति देते हैं और बाद के आईडीपी चरण के लिए समायोजित परिणाम और इनपुट। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्र 2: चरणों के बीच IDV का उपयोग किए बिना IDP के प्रत्येक चरण को क्रमिक रूप से चलाने से परिणामों का उदाहरण. (A) प्रत्येक IDP चरण को क्रमिक रूप से चलाने से टर्मिनल आउटपुट का एक स्क्रीनशॉट. IDP पूरा करने के लिए चला गया, लेकिन नेटवर्क ढूँढना चरण के दौरान शून्य नेटवर्क पाए गए। (B) नोड ढूँढना परिणाम निर्देशिका node_finding_20210705183301 (पूरक फ़ाइल 13) IDV में लोड किया गया। जीन सूची तालिका में सभी जीनों को लाइन ग्राफ में अपने संबंधित अभिव्यक्ति प्रोफाइल दिखाने और एक एनोटेशन तालिका उत्पन्न करने के लिए (लाल तीर) चुना गया था। एनोटेशन तालिका को यह प्रतिबिंबित करने के लिए भरा गया था कि जीन को मूल एनोटेशन फ़ाइल (हरे तीर) में कैसे लेबल किया गया है। (C) एज ढूँढना परिणाम निर्देशिका edge_finding_20210705183301 (पूरक फ़ाइल 13) IDV में लोड किया गया. (D) नेटवर्क ढूँढना परिणाम निर्देशिका network_finding_20210705183301 (पूरक फ़ाइल 13) IDV में लोड किया गया। नेटवर्क ढूँढना पृष्ठ कोई परिणाम नहीं दिखाता है, या तो नेटवर्क ढूँढना चरण के reparameterization या नोड या एज ढूँढना चरण का पुनर्मूल्यांकन करने का सुझाव देता है। IDP दस्तावेज़ में उपयोगकर्ता को यह निर्धारित करने में मदद करने के लिए समस्या निवारण चरण हैं कि वे आगे क्या प्रयास कर सकते हैं. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्रा 3: एक खमीर सेल चक्र GRN मॉडल. ज्ञात खमीर सेल-चक्र नियामकों का एक सेट एसजीडी से चुना गया था और जीन के बीच ज्ञात नियामक संबंधों को यीस्टरैक्ट से निकाला गया था। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्रा 4: IDP नोड का उदाहरण IDV में परिणाम ढूँढना। IDV में लोड नोड ढूँढना परिणाम निर्देशिका node_finding_20210705183301 (पूरक फ़ाइल 13) है। क्यूरेटेड ऑनलाइन खमीर डेटाबेस का निरीक्षण करने के बाद समायोजित परिणाम। जीन सूची तालिका को चित्रा 3 के जीआरएन मॉडल में शेष जीन को खोजने के लिए विस्तारित (पीला तीर) किया गया था और जीन को एक ही जीआरएन मॉडल (लाल तीर) में नहीं पाए गए जीन को हटाने के लिए अचयनित किया गया था। एनोटेशन तालिका Yeastract (हरे तीर) पर पाए जाने वाले प्रत्येक जीन के लिए विनियमन के सबूत के आधार पर भरी गई थी। नई जीन सूची और एनोटेशन फ़ाइल को उनके संबंधित डाउनलोड बटन (नीले तीर) का चयन करके डाउनलोड किया गया था। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्रा 5: IDP एज का उदाहरण IDV में परिणाम ढूँढना। IDV में लोड एज ढूँढना परिणाम निर्देशिका edge_finding_20210701100152 (पूरक फ़ाइल 13) है। (ए) आईडीपी द्वारा उत्पादित प्रारंभिक परिणाम। बीज से नेटवर्क ड्रॉपडाउन विकल्प का चयन किया गया था (लाल तीर) IDP द्वारा उत्पादित बीज नेटवर्क को देखने के लिए कॉन्फ़िगरेशन फ़ाइल में तर्कों के आधार पर (पूरक फ़ाइल 7)। किनारे की मेज में चयनित जीन बीज नेटवर्क में उपयोग किए जाने वाले किनारे हैं। (बी) उन किनारों के लिए बीज नेटवर्क का निरीक्षण करने के बाद समायोजित परिणाम जिनमें प्रयोगात्मक साक्ष्य नहीं होते हैं। चयन से नेटवर्क ड्रॉपडाउन विकल्प चयनित किया गया था (लाल तीर). किनारों को किनारे तालिका (हरे तीर) से चयनित/अचयनित किया गया था। बीज नेटवर्क, किनारे की सूची, और नोड सूची फ़ाइलों को उनके संबंधित बटन (पीले तीर) पर क्लिक करके डाउनलोड किया गया था। दिखाया गया किनारे तालिका अंतिम समय श्रृंखला डेटा के लिए कॉन्फ़िगरेशन फ़ाइल two_wts_EdgeFinding_config.txt (पूरक फ़ाइल 7) में सूचीबद्ध के रूप में है। कॉन्फ़िगरेशन फ़ाइल में सूचीबद्ध अंतिम समय श्रृंखला डेटा को देखने के लिए एलईएम परिणामों के आधार पर बीज नेटवर्क या एज सूची के लिए किनारों का चयन करते समय यह महत्वपूर्ण है क्योंकि यह आउटपुट नोड्स के बीच नियामक संबंधों के अपने अनुमान में सभी पूर्ववर्ती डेटाफ़ाइलों को शामिल करता है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्र 6: IDP नेटवर्क का उदाहरण IDP कॉन्फ़िगरेशन फ़ाइल two_wts_NetFind_rd1_config.txt (पूरक फ़ाइल 11) का उपयोग करने से IDV में परिणाम ढूँढना. (A) क्वेरी स्थिर पूर्ण चक्र स्कैटर प्लॉट में y-अक्ष पर संबंधित डेटा प्रदर्शित करने के लिए चयनित (लाल तीर) किया गया था। स्कैटर प्लॉट में नीले डॉट्स स्कैटर प्लॉट के लिए बॉक्स का चयन करें फ़ंक्शन का उपयोग करके चयनित बिंदुओं का प्रतिनिधित्व करते हैं। बिंदीदार चयन बॉक्स को यह दिखाने के लिए सचित्र किया गया था कि बॉक्स चयन कैसा दिखता है। (बी) y-अक्ष और x-अक्ष के लिए न्यूनतम और अधिकतम पूर्णांक मैन्युअल रूप से इन सीमाओं (हरे तीर) के भीतर चयनित नेटवर्क में दर्ज किए गए थे। प्रत्येक चयन के बाद, चयनित नेटवर्क से एज प्रसार प्राप्त करें बटन (पीले तीर) क्लिक किया गया था और एज प्रचलन तालिका और चयनित DSGRN पूर्वानुमानित नेटवर्क क्षेत्रों को जनरेट किया गया था। नेटवर्क अनुक्रमणिका में, चयनित नेटवर्क (नीले तीर) ब्राउज़ करने के लिए ऊपर और नीचे तीर क्लिक किए जा सकते हैं. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

चित्रा 7: IDP नेटवर्क का उदाहरण IDV में IDP कॉन्फ़िगरेशन फ़ाइल two_wts_NetFind_rd2_config.txt (पूरक फ़ाइल 12) का उपयोग करने से परिणाम ढूँढना। (A-C) नेटवर्क का चयन न्यूनतम और अधिकतम इनपुट बक्से (लाल तीर) में मान दर्ज करके किया गया था। चयनित नेटवर्क से एज प्रसार प्राप्त करें बटन पर क्लिक किया गया था एज प्रचलन तालिका और चयनित DSGRN पूर्वानुमानित नेटवर्क क्षेत्रों को जनरेट करने के लिए। (डी) ब्याज के किनारों को edge_list तालिका (पीला तीर) में चुना गया था और सबमिट बटन (हरा तीर) चयनित क्वेरी (नीला तीर) के खिलाफ स्कैटर प्लॉट में प्लॉट करने के लिए समानता स्कोर की गणना करने के लिए क्लिक किया गया था। बॉक्स का चयन करें फ़ंक्शन का उपयोग एज प्रचलन तालिका और चयनित DSGRN पूर्वानुमानित नेटवर्क क्षेत्रों को जनरेट करने के लिए नेटवर्क (बैंगनी तीर) के एक सेट का चयन करने के लिए किया गया था। चयन में दूसरे नेटवर्क को देखने के लिए नेटवर्क अनुक्रमणिका को 2 (नारंगी तीर) तक बढ़ा दिया गया था. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

अवधि पाइपलाइन चरण परिभाषा

JTK-CYCLE द्वारा de Lichtenburg (DLxJTK) नोड ढूँढना जीन को रैंक करने के लिए उपयोग की जाने वाली आवधिकता और विनियमन शक्ति दोनों का एक एकल मात्रात्मक माप। पहले प्रकाशित आवधिकता मैट्रिक्स de Lichtenberg (DL) और JTK-CYCLE (JTK) को जोड़ती है।

प्रथम चक्र अधिकतम अभिव्यक्ति नोड ढूँढना आवधिक जीन अभिव्यक्ति के पहले चक्र के दौरान अधिकतम जीन अभिव्यक्ति. प्रथम चक्र अधिकतम अभिव्यक्ति द्वारा आदेशित जीन को पहले चक्र से समय बिंदु के आधार पर आदेश दिया जाएगा जिस पर वे अपनी अधिकतम जीन अभिव्यक्ति तक पहुंचते हैं।

स्थानीय एज मशीन (LEM) एज ढूँढना एक बायेसियन नेटवर्क अनुमान विधि जो जीन इंटरैक्शन के संभावित मॉडल को समय श्रृंखला जीन अभिव्यक्ति डेटा का उपयोग करके किसी दिए गए लक्ष्य जीन के सबसे संभावित नियामक (ओं) और विनियमन (सक्रियण या दमन) के तरीकों की पहचान करने के लिए रैंक करती है।

बीज नेटवर्क नेटवर्क ढूँढना शीर्ष रैंक वाले एलईएम किनारों का चयन करके वैश्विक इंटरैक्शन के एक प्रशंसनीय नेटवर्क पर एक प्रारंभिक अनुमान। बीज नेटवर्क स्पेस के एक क्षेत्र का स्थानीयकरण करता है जो प्रदान किए गए समय श्रृंखला डेटा के साथ स्थिरता दिखाने की उच्च संभावना के साथ अत्यधिक ऑस्सिलेटरी है।

विनियामक नेटवर्क (DSGRN) द्वारा जनरेट किए गए डायनेमिक हस्ताक्षर नेटवर्क ढूँढना एक सॉफ्टवेयर पैकेज जो व्यापक रूप से दीर्घकालिक गतिकीय व्यवहारों की विविधता की गणना करने के लिए एक नेटवर्क प्रदर्शित कर सकता है।

एज प्रचलन नेटवर्क ढूँढना नेटवर्क ढूँढने के चरण से शीर्ष स्कोरिंग नेटवर्क का प्रतिशत जिसमें प्रश्न में किनारे शामिल हैं. स्कोर किनारों की रैंकिंग की अनुमति देता है जिसमें एक गैर-शून्य प्रसार होता है।

तालिका 1: अंतर्निहित Dynamics पाइपलाइन और अंतर्निहित Dynamics Visualizer शब्दों की परिभाषा।

पूरक फ़ाइल 1: समय श्रृंखला जीन अभिव्यक्ति डेटा (प्रतिकृति 1) ऑरलैंडो, 200813 से लिया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

पूरक फ़ाइल 2: समय श्रृंखला जीन अभिव्यक्ति डेटा (प्रतिकृति 2) ऑरलैंडो, 200813 से लिया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

पूरक फ़ाइल 3: एनोटेशन फ़ाइल जिसमें पूरक फ़ाइल 1 और पूरक फ़ाइल 2 में पाए जाने वाले सभी जीन शामिल हैं। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 4: पूरी तरह से पैरामीटर अंतर्निहित Dynamics पाइपलाइन कॉन्फ़िगरेशन फ़ाइल। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 5: जीन सूची फ़ाइल अंतर्निहित Dynamics Visualizer के नोड ढूँढना पृष्ठ से डाउनलोड किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 6: एनोटेशन फ़ाइल अंतर्निहित Dynamics Visualizer के नोड ढूँढना पृष्ठ से डाउनलोड किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 7: अंतर्निहित Dynamics पाइपलाइन कॉन्फ़िगरेशन फ़ाइल पैरामीटरके लिए केवल किनारे ढूँढना चरण के लिए। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 8: बीज नेटवर्क फ़ाइल अंतर्निहित Dynamics Visualizer के किनारे ढूँढना पृष्ठ से डाउनलोड किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 9: एज सूची फ़ाइल अंतर्निहित Dynamics Visualizer के किनारे ढूँढना पृष्ठ से डाउनलोड किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 10: नोड सूची फ़ाइल अंतर्निहित Dynamics Visualizer के किनारे ढूँढना पृष्ठ से डाउनलोड किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 11: अंतर्निहित Dynamics पाइपलाइन कॉन्फ़िगरेशन फ़ाइल केवल नेटवर्क ढूँढना चरण के लिए पैरामीटर किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 12: अद्यतन अंतर्निहित Dynamics पाइपलाइन कॉन्फ़िगरेशन फ़ाइल (पूरक फ़ाइल 11) केवल नेटवर्क ढूँढने चरण के लिए पैरामीटर किया गया। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

पूरक फ़ाइल 13: प्रतिनिधि परिणाम अनुभाग से परिणामों वाली निर्देशिका। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।
Subscription Required. Please recommend JoVE to your librarian.

Discussion

जीआरएन का अनुमान सिस्टम जीव विज्ञान में एक महत्वपूर्ण चुनौती है। आईडीपी जीन अभिव्यक्ति डेटा से मॉडल जीआरएन उत्पन्न करता है जो उपकरणों के अनुक्रम का उपयोग करता है जो डेटा का उपयोग तेजी से जटिल तरीकों से करता है। प्रत्येक चरण के लिए डेटा को संसाधित करने के तरीके के बारे में निर्णय लेने की आवश्यकता होती है और कौन से तत्व (जीन, कार्यात्मक इंटरैक्शन) आईडीपी की अगली परत को पारित किए जाएंगे। आईडीपी परिणामों पर इन निर्णयों के प्रभाव उतने स्पष्ट नहीं हैं। इस संबंध में मदद करने के लिए, IDV IDP के भीतर GRN अनुमान उपकरण के अलग-अलग चरणों से आउटपुट के उपयोगी इंटरैक्टिव विज़ुअलाइज़ेशन प्रदान करता है। आईडीवी प्रयोग को तेज करने और विश्लेषण विकल्पों को सूचित करने के लिए इन कम्प्यूटेशनल अनुमान विधियों से परिणामों का मूल्यांकन करने की प्रक्रिया को सुव्यवस्थित और सुविधाजनक बनाता है, जो बदले में उच्च-विश्वास नेटवर्क मॉडल और परिकल्पनाओं के त्वरित उत्पादन की अनुमति देगा। IDV उन विशेषताओं को भी लागू करता है जो IDP की कार्यक्षमता पर विस्तार करते हैं, जिनमें LEM ODE पैरामीटर विकल्पों द्वारा किनारों को फ़िल्टर करना, उनके अभिव्यक्ति समय द्वारा जीन का बिनिंग, और एक आकृति या नेटवर्क की समानता के आधार पर क्लस्टरिंग नेटवर्क शामिल हैं। महत्वपूर्ण रूप से, आईडीवी प्रत्येक आईडीपी चरण के बीच मैनुअल हस्तक्षेप की अनुमति देता है, जो उपयोगकर्ता को आसानी से मानव ज्ञान और साहित्य से पूर्व जानकारी को उन तरीकों से शामिल करने की अनुमति देता है जिन्हें आसानी से स्वचालित नहीं किया जा सकता है। आईडीपी का एक भोली रन मूल रूप से इस जानकारी को शामिल नहीं करेगा, इसलिए आईडीवी का उपयोग जब भी प्रयोग के लिए विशिष्ट जानकारी उपलब्ध होती है तो परिणामों में विश्वास बढ़ेगा। कुल मिलाकर, आईडीपी के साथ संयोजन के रूप में आईडीवी का उपयोग करने से उपयोगकर्ताओं को अधिक आत्मविश्वास के साथ जैविक प्रक्रियाओं के लिए नेटवर्क परिकल्पना बनाने की अनुमति मिलती है, यहां तक कि सच्चे जीआरएन के बहुत कम या कोई ज्ञान के साथ भी।

IDV में तीन महत्वपूर्ण चरण हैं। पहला आईडीवी में आईडीपी नोड ढूँढने के परिणामों का मूल्यांकन कर रहा है। IDV का नोड फाइंडिंग पेज एक नई जीन सूची का उत्पादन कर सकता है और, यदि वांछित हो, तो एक जीन एनोटेशन फ़ाइल। एक नई जीन सूची को क्यूरेट करना एक महत्वपूर्ण कदम है क्योंकि यह सीमित करके संभावित नेटवर्क स्पेस को बहुत कम कर देता है, जो जीन को जीआरएन लक्ष्यों और / या नियामकों के रूप में मॉडलिंग करने की अनुमति है। इसके अतिरिक्त, चूंकि जीआरएन ज्यादातर प्रतिलेखन कारकों से बने होते हैं, जीन एनोटेशन होने से सुसंगत जीआरएन मॉडल बनाने में बहुत मदद मिलेगी।

अगला चरण IDV में IDP Edge ढूँढने के परिणामों का मूल्यांकन कर रहा है। एक नया बीज नेटवर्क क्यूरेट करना एक महत्वपूर्ण कदम है क्योंकि यह नेटवर्क स्पेस के क्षेत्र को स्थानीयकृत करता है जिसे नेटवर्क फाइंडिंग चरण में नमूना लिया जाएगा। हालांकि, यह जानना कि कहां से शुरू करना है, हमेशा स्पष्ट नहीं होता है, इसलिए उन किनारों का उपयोग करने की सिफारिश की जाती है जिनके पास कुछ प्रकार के प्रयोगात्मक सबूत हैं ताकि यह विश्वास प्रदान किया जा सके कि कोई नेटवर्क स्पेस के क्षेत्र में शुरू हो रहा है जिसमें उच्च आत्मविश्वास वाले किनारे होते हैं। IDV के एज फाइंडिंग पेज बीज नेटवर्क की आसान असेंबली को सक्षम बनाता है और संबंधित DSGRN नेटवर्क विनिर्देशन फ़ाइल के साथ-साथ नोड और किनारे सूचियों को उत्पन्न करता है।

अंतिम चरण IDV में IDP नेटवर्क ढूँढने के परिणामों का मूल्यांकन कर रहा है। IDV का नेटवर्क ढूँढना पृष्ठ नमूना नेटवर्क और उनके संबंधित स्कोर की आसान खोज के लिए अनुमति देता है जो मनाया गतिशीलता का उत्पादन करने के लिए नेटवर्क की क्षमता का अनुमान लगाते हैं। जबकि नोड और एज फाइंडिंग हमेशा परिणाम वापस कर देगा (यदि नोड फाइंडिंग से कम से कम दो जीन पारित किए जाते हैं), तो नेटवर्क फाइंडिंग शून्य परिणाम वापस कर सकता है। इसलिए, यह जानना कि क्या पैरामीटर में समायोजन की आवश्यकता है, नोड और एज फाइंडिंग की तुलना में नेटवर्क खोज में अधिक स्पष्ट होगा। कुछ की ऐसी घटनाएं नहीं पाए गए नेटवर्क पर रखी गई बाधाओं का परिणाम हो सकती हैं जो नेटवर्क का विश्लेषण किया जा सकता है। ये बाधाएं हैं: 1) नेटवर्क हमेशा दृढ़ता से जुड़े होते हैं या नहीं, 2) प्रत्येक नोड के लिए इनपुट किनारों की न्यूनतम और अधिकतम संख्या, 3) नोड्स और किनारों को जोड़ने और हटाने की संभावनाएं, और 4) नोड्स और किनारों के परिवर्धन और हटाने की संख्या की अनुमति है। यदि कुछ या कोई मॉडल-स्वीकार्य नेटवर्क नहीं पाए जाते हैं, जैसा कि चित्र 2 में है, तो आईडीपी प्रलेखन का उल्लेख आईडीवी में परिणामों के बाद के मूल्यांकन के साथ आईडीपी के किसी भी या सभी चरणों के पुनरुत्थान पर मार्गदर्शन के लिए अनुशंसित है।

इस दृष्टिकोण की एक वर्तमान सीमा यह है कि नोड फाइंडिंग पृष्ठ ज्यादातर ऑस्सिलेटरी गतिशीलता पर केंद्रित है, जैसे कि सेल-चक्र और सर्कैडियन घड़ी के ट्रांसक्रिप्शनल कार्यक्रमों में देखा जाता है। विशेष रूप से, IDP नोड ढूँढना चरण वर्तमान में जीन के लिए खोज करने के लिए कॉन्फ़िगर किया गया है जो एक निर्दिष्ट अवधि में oscillatory गतिशीलता प्रदर्शित करते हैं। जैसा कि आईडीपी उन विश्लेषणों को शामिल करने के लिए फैलता है जो विभिन्न प्रकार के ट्रांसक्रिप्शनल गतिशीलता को निर्धारित कर सकते हैं, इसलिए आईडीवी को इन अन्य व्यवहारों के विज़ुअलाइज़ेशन और पूछताछ का समर्थन करने के लिए भी अपडेट किया जाएगा। नेटवर्क खोज चरण में खोजे गए और विश्लेषण किए गए नेटवर्क का आकार वर्तमान में छोटे आकार के नेटवर्क तक सीमित है, उदाहरण के लिए, लगभग 10 जीन। यह एक आवश्यकता है क्योंकि DSGRN पैमाने में संगणनाएं संयोजी रूप से होती हैं। एक अन्य सीमा यह है कि किसी चयनित नेटवर्क के लिए मॉडल पैरामीटर स्थान की खोज IDV में संभव नहीं है। हालांकि, किसी दिए गए नेटवर्क के लिए DSGRN नेटवर्क विनिर्देश फ़ाइल डाउनलोड की जा सकती है और प्रत्येक मॉडल पैरामीटर से संबद्ध गतिशीलता को DSGRN विज़ुअलाइज़ेशन वेबसाइट (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/) पर विज़ुअलाइज़ किया जा सकता है। अंत में, आईडीवी का परीक्षण लिनक्स (उबंटू) और आईओएस (बिग सुर) सिस्टम का उपयोग करके किया गया है। आईडीवी को विंडोज सबसिस्टम फॉर लिनक्स (डब्ल्यूएसएल) का उपयोग करके विंडोज 10 पर परीक्षण किया गया है, जो विंडोज 10 उपयोगकर्ताओं को एक अलग कंप्यूटर, एक वर्चुअल मशीन, या डुअल-बूट सेटअप की आवश्यकता के बिना लिनक्स और आईडीवी चलाने की अनुमति देता है। IDV वर्तमान में मूल Windows पर नहीं चलता है।

जीआरएन का अध्ययन करना उनकी अंतर्निहित जटिलता और उपयोगी अनुमान उपकरणों के कारण मुश्किल है जैसे कि आईडीपी को समझना और आत्मविश्वास के साथ तैनात करना मुश्किल हो सकता है। आईडीवी जीन अभिव्यक्ति गतिशीलता से परे अतिरिक्त जानकारी को शामिल करने की सुविधा प्रदान करते हुए आईडीपी का उपयोग करके अनुमानित जीआरएन का अध्ययन करने की जटिलता को कम करने के लिए एक विधि प्रदान करता है। आईडीपी के साथ संयोजन के रूप में आईडीवी का उपयोग करना जैसा कि यहां वर्णित है, शोधकर्ताओं को मानव सेल-चक्र जैसे अच्छी तरह से अध्ययन की गई प्रणालियों के कार्यात्मक मॉडल विकसित करने और विश्लेषण करने के लिए सशक्त बनाएगा। इसके अलावा, ये उपकरण कम समझी जाने वाली प्रक्रियाओं के लिए परीक्षण योग्य परिकल्पनाएं उत्पन्न करेंगे, जैसे कि मलेरिया इंट्रा-एरिथ्रोसाइटिक विकास चक्र, जिसे जीआरएन ²⁴ द्वारा नियंत्रित करने का संदेह है, लेकिन जिसके लिए एक मॉडल अभी तक प्रस्तावित नहीं किया गया है।
Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ भी नहीं है।

Acknowledgments

इस काम को एनआईएच अनुदान R01 GM126555-01 और NSF अनुदान DMS-1839299 द्वारा वित्त पोषित किया गया था।

Materials

Name Company Catalog Number Comments

Docker https://docs.docker.com/get-docker/

Git https://git-scm.com/

Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline

Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer

Miniconda https://docs.conda.io/en/latest/miniconda.html

Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).

Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).

Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).

Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).

Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).

Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).

Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).

LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).

McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).

Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).

Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).

Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).

DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).

Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).

Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).

Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).

Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).

de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).

Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).

Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).

Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).

Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).

Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).

Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags
जीव विज्ञान अंक 178

अवधि	पाइपलाइन चरण	परिभाषा
JTK-CYCLE द्वारा de Lichtenburg (DLxJTK)	नोड ढूँढना	जीन को रैंक करने के लिए उपयोग की जाने वाली आवधिकता और विनियमन शक्ति दोनों का एक एकल मात्रात्मक माप। पहले प्रकाशित आवधिकता मैट्रिक्स de Lichtenberg (DL) और JTK-CYCLE (JTK) को जोड़ती है।
प्रथम चक्र अधिकतम अभिव्यक्ति	नोड ढूँढना	आवधिक जीन अभिव्यक्ति के पहले चक्र के दौरान अधिकतम जीन अभिव्यक्ति. प्रथम चक्र अधिकतम अभिव्यक्ति द्वारा आदेशित जीन को पहले चक्र से समय बिंदु के आधार पर आदेश दिया जाएगा जिस पर वे अपनी अधिकतम जीन अभिव्यक्ति तक पहुंचते हैं।
स्थानीय एज मशीन (LEM)	एज ढूँढना	एक बायेसियन नेटवर्क अनुमान विधि जो जीन इंटरैक्शन के संभावित मॉडल को समय श्रृंखला जीन अभिव्यक्ति डेटा का उपयोग करके किसी दिए गए लक्ष्य जीन के सबसे संभावित नियामक (ओं) और विनियमन (सक्रियण या दमन) के तरीकों की पहचान करने के लिए रैंक करती है।
बीज नेटवर्क	नेटवर्क ढूँढना	शीर्ष रैंक वाले एलईएम किनारों का चयन करके वैश्विक इंटरैक्शन के एक प्रशंसनीय नेटवर्क पर एक प्रारंभिक अनुमान। बीज नेटवर्क स्पेस के एक क्षेत्र का स्थानीयकरण करता है जो प्रदान किए गए समय श्रृंखला डेटा के साथ स्थिरता दिखाने की उच्च संभावना के साथ अत्यधिक ऑस्सिलेटरी है।
विनियामक नेटवर्क (DSGRN) द्वारा जनरेट किए गए डायनेमिक हस्ताक्षर	नेटवर्क ढूँढना	एक सॉफ्टवेयर पैकेज जो व्यापक रूप से दीर्घकालिक गतिकीय व्यवहारों की विविधता की गणना करने के लिए एक नेटवर्क प्रदर्शित कर सकता है।
एज प्रचलन	नेटवर्क ढूँढना	नेटवर्क ढूँढने के चरण से शीर्ष स्कोरिंग नेटवर्क का प्रतिशत जिसमें प्रश्न में किनारे शामिल हैं. स्कोर किनारों की रैंकिंग की अनुमति देता है जिसमें एक गैर-शून्य प्रसार होता है।

Name	Company	Catalog Number	Comments
Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.