Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

बैच खमीर 2 से अनुक्रम डेटा का स्वरूप विश्लेषण-संकर स्क्रीन

Published: June 28, 2018 doi: 10.3791/57802

Summary

खमीर आबादी के गहरे अनुक्रमण सकारात्मक खमीर के लिए चयनित 2-संकर बातचीत संभावित भागीदार प्रोटीन बातचीत के बारे में जानकारी का खजाना पैदावार । यहां, हम विशिष्ट bioinformatics उपकरण और अनुकूलित अद्यतन सॉफ्टवेयर के संचालन का वर्णन करने के लिए ऐसी स्क्रीन से अनुक्रम डेटा का विश्लेषण ।

Abstract

हम खमीर अनुकूलित किया है 2-संकर परख एक साथ उच्च प्रवाह कम-पढ़ें डीएनए अनुक्रमण का उपयोग एक ही स्क्रीन के भीतर क्षणिक और स्थिर प्रोटीन बातचीत के दर्जनों उजागर करने के लिए । परिणामी अनुक्रम डेटासेट केवल एक जनसंख्या है कि सकारात्मक खमीर 2-संकर बातचीत के लिए चयन के दौरान समृद्ध कर रहे हैं में क्या जीन ट्रैक नहीं कर सकते हैं, लेकिन यह भी संपर्क के लिए पर्याप्त प्रोटीन के प्रासंगिक उपडोमेन के बारे में विस्तृत जानकारी दे । यहां, हम खड़े अकेले सॉफ्टवेयर प्रोग्राम है कि गैर विशेषज्ञों की अनुमति के लिए सभी bioinformatics और सांख्यिकीय कदम प्रदर्शन करने की प्रक्रिया और एक बैच खमीर 2 से डीएनए अनुक्रम fastq फ़ाइलों का विश्लेषण-संकर परख की एक पूर्ण सुइट का वर्णन । इन सॉफ्टवेयर के द्वारा कवर प्रसंस्करण कदम शामिल हैं: 1) मानचित्रण और गिनती अनुक्रम एक खमीर 2-संकर शिकार पुस्तकालय के भीतर इनकोडिंग प्रत्येक उंमीदवार प्रोटीन के लिए इसी पढ़ता है; 2) एक सांख्यिकीय विश्लेषण प्रोग्राम है कि संवर्धन प्रोफाइल का मूल्यांकन करता है; और 3) उपकरण अनुवाद फ्रेम और प्रत्येक समृद्ध प्लाज्मिड है कि सांकेतिक शब्दों में बदलना हित के प्रोटीन की कोडिंग क्षेत्र के भीतर की स्थिति की जांच करने के लिए ।

Introduction

एक दृष्टिकोण प्रोटीन बातचीत की खोज करने के लिए खमीर 2-संकर (Y2H) परख है, जो इंजीनियर खमीर कोशिकाओं है कि बढ़ती ही जब ब्याज की एक प्रोटीन एक बातचीत साथी1के एक टुकड़े को बांधने का कारनामा है । कई Y2H बातचीत का पता लगाने अब बड़े पैमाने पर समानांतर उच्च प्रवाह अनुक्रमण की मदद से किया जा सकता है । कई स्वरूपों का वर्णन किया गया है2,3,4,5 एक है कि हम विकसित सहित जहां आबादी बैच में शर्तों के तहत बड़े हो रहे है कि plasmids युक्त खमीर के लिए चुनें कि उत्पादन सकारात्मक Y2H इंटरेक्शन. कार्यप्रवाह हम विकसित, DEEPN (प्रोटीन नेटवर्क के मूल्यांकन के लिए गतिशील संवर्धन) का कार्यकाल, एक ही शिकार पुस्तकालयों से अंतर interactomes की पहचान प्रोटीन है कि एक प्रोटीन के साथ बातचीत (या डोमेन) बनाम। एक और प्रोटीन या एक विशेष रूप से अलग उत्परिवर्ती डोमेन । इस कार्यप्रवाह में प्रमुख चरणों में से एक उचित प्रसंस्करण और डीएनए अनुक्रमण डेटा का विश्लेषण है । कुछ जानकारी बस से पहले और एक शाही सेना-seq प्रयोग के अनुरूप एक फैशन में Y2H बातचीत के चयन के बाद दोनों एक जीन के लिए पढ़ता की संख्या गिनती द्वारा बटोरा जा सकता है । हालांकि, बहुत अधिक गहराई में जानकारी इन डेटासेट से एक दिया प्रोटीन है कि एक Y2H बातचीत का उत्पादन करने में सक्षम है की उपडोमेन पर जानकारी सहित निकाला जा सकता है । इसके अलावा, जबकि DEEPN दृष्टिकोण मूल्यवान है, कई नमूने का विश्लेषण प्रतिकृति बोझिल और महंगा हो सकता है । यह समस्या विशेष रूप से जहाँ प्रतिकृतियों की संख्या सीमित है DEEPN datasets के लिए विकसित किया गया था एक सांख्यिकीय मॉडल का उपयोग करके समाप्त है6. bioinformatics विशेषज्ञता के बिना जांचकर्ताओं के लिए विश्वसनीय, पूर्ण, मजबूत और सुलभ डीएनए अनुक्रमण डेटासेट के प्रसंस्करण और विश्लेषण करने के लिए, हम सॉफ्टवेयर प्रोग्राम है कि विश्लेषण के सभी कदम कवर का एक सूट विकसित की है ।

अकेले खड़े सॉफ्टवेयर प्रोग्राम है कि डेस्कटॉप कंप्यूटर पर चलने के इस सुइट MAPster, DEEPN, और Stat_Maker शामिल हैं । MAPster एक ग्राफिक यूजर इंटरफेस है कि प्रत्येक fastq फ़ाइल HISAT27कार्यक्रम का उपयोग कर जीनोम के मानचित्रण के लिए पंक्तिबद्ध, बहाव अनुप्रयोगों में उपयोग के लिए एक मानक. sam फ़ाइल का निर्माण की अनुमति देता है । DEEPN कई मॉड्यूल है । यह प्रदान करता है और गिनती एक आरएनए-seq प्रकार ठहराव मॉड्यूल ' जीन गणना ' का उपयोग कर के समान विशेष जीन के लिए इसी पढ़ता है । यह भी Gal4 transcriptional डोमेन और शिकार अनुक्रम और उन जंक्शनों की स्थिति collates के बीच जंक्शन के लिए इसी अनुक्रम निष्कर्षों को तुलनात्मक तालिकाओं और रेखांकन द्वारा उनके निरीक्षण की अनुमति (' मॉड्यूल Junction_Make ' का उपयोग कर) मॉड्यूल ' Blast_Query ' आसान निरीक्षण, quantitation, और जंक्शन Gal4 जंक्शन दृश्यों की तुलना की अनुमति देता है । Stat_Maker मूल्यांकन की संभावना Y2H हिट को प्राथमिकता देने का एक तरीका के रूप में जीन संवर्धन डेटा सांख्यिकीय प्रति पढ़ता है । यहां, हम वर्णन कैसे इन सॉफ्टवेयर प्रोग्राम का उपयोग करने के लिए और पूरी तरह से एक DEEPN Y2H प्रयोग से डीएनए अनुक्रम डेटा का विश्लेषण । DEEPN के संस्करण पीसी, मैक, और लिनक्स सिस्टम पर चलाने के लिए उपलब्ध हैं । ऐसे मानचित्रण कार्यक्रम MAPster और DEEPN सांख्यिकी मॉड्यूल Stat_Maker के रूप में अंय कार्यक्रमों, उपदिनचर्या कि Unix के तहत चलाने पर निर्भर है और केवल मैक और लिनक्स सिस्टम पर उपलब्ध हैं ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. मानचित्रण Fastq फ़ाइलें

नोट: DEEPN सॉफ्टवेयर के रूप में के रूप में अच्छी तरह से कई bioinformatics कार्यक्रमों डीएनए अनुक्रम डेटा जिसमें प्रत्येक अनुक्रम पढ़ें संदर्भ डीएनए में अपनी स्थिति के लिए मैप किया गया है का उपयोग करें । मानचित्रण कार्यक्रमों की एक किस्म इस MAPster इंटरफ़ेस यहां शामिल है कि HISTAT2 कार्यक्रम का उपयोग करता है के लिए उपयोग किया जा सकता है. sam बाद में चरणों में प्रयुक्त फ़ाइलें ।

  1. अनुक्रम डेटा जीनोम के सही संस्करण के लिए मैप करें । माउस मूल के Y2H पुस्तकालयों के लिए, UCSC mm10 जीनोम का उपयोग करें; मानव जीन का उपयोग करने वालों के लिए, UCSC hg38 संदर्भ जीनोम का उपयोग करें, Saccharomyces cerevisiae जीन के लिए, UCSC SacCer3 संदर्भ जीनोम का उपयोग करें ।
  2. MAPster स्थापित करें ।
    1. डाउनलोड MAPster सॉफ्टवेयर और स्थापित करें । सॉफ्टवेयर निंनलिखित में एक वेब ब्राउज़र का उपयोग कर पाया जा सकता है: https://github.com/emptyewer/MAPster/releases । HISAT2 एक Apple Macintosh जैसे Unix-आधारित सिस्टम पर चलता है । इस वजह से, MAPster कार्यक्रम केवल ऐसे एप्पल Macintosh और लिनक्स के रूप में संगत प्रणालियों पर चलेंगे ।
      नोट: एक Apple Mac के लिए सिस्टम आवश्यकताएं हैं: OSX 10.10 +, > 4 gb RAM, > 500 gb डिस्क स्थान, और संदर्भ जीनोम डाउनलोड करने के लिए इंटरनेट का उपयोग । उपयोगकर्ताओं को एक संस्थागत आईटी व्यक्ति के साथ परामर्श करने की आवश्यकता हो सकती है यदि उनके एंटरप्राइज़ में सुरक्षा प्रोटोकॉल व्यवस्थापक अधिकारों और अनुमतियों को प्रतिबंधित है ।
  3. "मुख्य" टैब (चित्र 1) के माध्यम से आवश्यक फ़ाइलें और पैरामीटर्स दर्ज करें । उपयुक्त "Pairwise" बटन का चयन करें या तो जोड़े के रूप में या डिफ़ॉल्ट फ़ाइल स्वरूप के रूप में FASTQ के साथ भ्रष्ट फाइल दर्ज करें ।
    1. DEEPN विश्लेषण के लिए, एकल पठन स्वरूप में चलाने के लिए "Pairwise" विकल्प को "बंद" करने के लिए चालू करें ।
    2. बस खींचें द्वारा MAPster में फ़ाइलें लोड और उचित विंडो में ड्रॉप ।
    3. एक संदर्भ डीएनए/जीनोम स्रोत है कि Y2H शिकार पुस्तकालय आवेषण के स्रोत के लिए संगत का चयन करें । कई मॉडल जीवों से अनुक्रमित जीनोम "जीनोम" बॉक्स में सूचीबद्ध है और स्वचालित रूप से की गणना जीव विज्ञान के लिए जॉंस हॉपकिंस विश्वविद्यालय केंद्र से डाउनलोड किया जा सकता है । संदर्भ जीनोम बाद में उपयोग के लिए स्थानीय रूप से संग्रहीत किया जाएगा ।
    4. कंप्यूटर प्रक्रियाओं की संख्या "धागे" बॉक्स के तहत मानचित्रण कार्यक्रम के प्रति समर्पित करने के लिए संकेत मिलता है, क्योंकि HISAT2 बहु सूत्रण का समर्थन करता है । MAPster कंप्यूटर खोज करेगा और एक डिफ़ॉल्ट के रूप में उपलब्ध प्रोसेसरों की अधिकतम संख्या का सुझाव देगा ।
    5. कोई आउटपुट फ़ाइल नाम निर्दिष्ट करें । इस फ़ाइल नाम DEEPN प्रक्रिया भर में इस्तेमाल किया जाएगा तो अंतरिक्ष या विशेष वर्ण के बिना एक छोटी अभी तक वर्णनात्मक नाम की सिफारिश की है । "आउटपुट निर्देशिका खोलें" बटन का उपयोग कर मैप की गई फ़ाइलों को आउटपुट के लिए कोई फ़ोल्डर निर्दिष्ट करें ।
    6. एक बार उपयुक्त फ़ाइलें और पैरामीटर्स चयनित किए गए हैं, तो "पंक्ति में जोड़ें" बटन का उपयोग कर कार्य पंक्ति के लिए मैपिंग कार्य जोड़ें । मुख्य विंडो में फ़ाइल नाम और हटाया जा सकता है एक नया नमूना करने के लिए इसी फाइल के साथ बदल दिया और वे एक इसी आउटपुट फ़ाइल नाम प्रदान करने के बाद कतार में जोड़ा जा सकता है ।
    7. सभी कार्य नौकरी कतार में दर्ज किए जाते हैं एक बार "क्यू चलाएँ" बटन क्लिक करें ।
      नोट: एक बार एक मैपिंग कार्य कतार में रखा गया है, उस कार्य का चयन "कार्य पैरामीटर" विंडो में प्रदर्शित करने के लिए पैरामीटर सेटिंग्स और आदेश पंक्ति कथन के साथ "कार्य आदेश" विंडो में प्रदर्शित करने के लिए सभी तर्क के कारण होता है । आउटपुट विकल्प कि पढ़ता है कि संरेखित करें और प्रत्येक पढ़ने के लिए अनुमति प्राथमिक संरेखण की संख्या निर्दिष्ट करने के लिए विफल रखने के लिए निर्देशन शामिल हैं । डिफ़ॉल्ट आउटपुट फ़ाइल MAPster से सैम स्वरूप में है (जैसे एक '. sam ' फ़ाइल) । यह उन है कि (मैप) थे और (मैप नहीं) सफलतापूर्वक निर्दिष्ट geome के लिए मैप किया गया था सहित उस नमूने के लिए निर्दिष्ट fastq फ़ाइलों से सभी अनुक्रम पढ़ता हो जाएगा ।

2. Bioinformatic DEEPN सॉफ्टवेयर का उपयोग कर प्रसंस्करण

नोट: DEEPN सॉफ्टवेयर वर्तमान में माउस सीडीएनए दृश्यों, मानव सीडीएनए दृश्यों, या एस cerevisiae जीनोमिक डीएनए दृश्यों युक्त शिकार पुस्तकालयों के साथ प्रयोग के लिए संकलित किया गया है । DEEPN मानक. sam फ़ाइल स्वरूप को स्वीकार करता है और एक sam (. sam) फ़ाइल दोनों मैप की गई और बिना मैप की गई और मैप किए गए और मैप किए गए प्रत्येक पढ़ता के लिए अलग फ़ाइलें शामिल स्वीकार कर सकते हैं ।

  1. डाउनलोड DEEPN सॉफ्टवेयर और स्थापित करें । सॉफ्टवेयर निंनलिखित में एक वेब ब्राउज़र का उपयोग कर पाया जा सकता है: https://github.com/emptyewer/DEEPN/releases । चयन करें कि कौन सा संस्करण कंप्यूटिंग प्लेटफ़ॉर्म से मेल खाता है और डाउनलोड करें । स्थापित करने के लिए, डाउनलोड स्थापित पैकेज खोलें ।
    नोट: DEEPN के संस्करण पीसी, मैक और लिनक्स sysrems के लिए उपलब्ध हैं । मैक और पीसी सिस्टम > 500 जीबी हार्ड डिस्क स्थान और > 4 जीबी रैम होना चाहिए ।
  2. DEEPN सॉफ़्टवेयर खोलें । मुख्य विंडो से (चित्रा 2) शीर्ष चयन बॉक्स से इसी शिकार पुस्तकालय की जानकारी का चयन करें । एक फ़ोल्डर का चयन करें, जहां संसाधित फ़ाइलें "कार्य फ़ोल्डर" बटन पर क्लिक करके और फ़ोल्डर/निर्देशिका पर नेविगेट करके जा सकते हैं । एक नया फ़ोल्डर बना सकते है/ एक बार "कार्य फ़ोल्डर" चयनित है, DEEPN तीन सबफ़ोल्डर unmapped_sam_files, mapped_sam_files, और sam_files हकदार पैदा करेगा ।
    1. MAPster प्रोग्राम की डिफ़ॉल्ट सेटिंग्स के साथ उत्पादित उन के रूप में उन दोनों मैप की गई और बिना मैप की गई पुस्तकें युक्त. sam फ़ाइलों का उपयोग करते हैं, तो उन्हें ' sam_files ' फ़ोल्डर में रखें । अंयथा unmapped_sam_files में. sam फ़ाइलों प्लेस और तदनुसार mapped_sam_files ।
  3. "जीन गणना + जंक्शन बनाओ" बटन पर क्लिक करके प्रसंस्करण आरंभ करें ।
    नोट: प्रसंस्करण जीन गणना मॉड्यूल है कि मानचित्रण पदों का उपयोग करने के लिए कितने पढ़ता है प्रत्येक जीन के अनुरूप गणना के साथ शुरू हो जाएगा । जंक्शन बनाओ तो जंक्शन अनुक्रम (अनुक्रम Gal4-सक्रियकरण डोमेन से सीधे बहाव से जुड़े) पढ़ता है और उंहें विस्फोट एल्गोरिथ्म का उपयोग कर पहचान निकालने जाएगा । यह चित्रा 3में चित्र फ़ोल्डर्स का एक पूरा सेट बना देगा । प्रसंस्करण समय आकार और अनुक्रम डेटा फ़ाइलों और उपयोग कंप्यूटर की प्रोसेसिंग की गति की संख्या पर निर्भर करता है । ठेठ टाइंस से लेकर 12-30 के एक प्रयोगात्मक डेटासेट के लिए एच ~ २५०,०००,००० पढ़ता है । जीन गणना प्रक्रिया और Junction_Make प्रक्रिया व्यक्तिगत रूप से "जीन गणना" बटन या "जंक्शन बनाओ" बटन पर क्लिक करके शुरू किया जा सकता है ।
  4. Stat_Maker (https://github.com/emptyewer/DEEPN/releases) डाउनलोड और इंस्टॉल करें. यह एक सांख्यिकीय विश्लेषण DEEPN डेटासेट के लिए डिज़ाइन किया गया पैकेज है जो वर्तमान में केवल Unix Mac सिस्टमों पर काम करता है ।
    1. ओपन Stat_Maker और बटन पर क्लिक करें "स्थापना की पुष्टि" (चित्रा 4) । पहली बार के लिए चल रहा है, तो Stat_Maker स्वचालित रूप से इंटरनेट से इन संसाधनों खींचकर आर, JAGS, और कंडक्टर स्थापित हो जाएगा । एक बार आर, JAGS, और कंडक्टर का पता लगाया है, Stat_Maker सक्रिय हो जाएगा और आगे उपयोगकर्ता इनपुट की अनुमति ।
    2. संसाधित DEEPN कार्य फ़ोल्डर में नेविगेट करने के लिए "फ़ोल्डर चुनें" बटन क्लिक करें । Stat_Maker स्वचालित रूप से मिल जाएगा और खिड़की में सांख्यिकीय विश्लेषण के लिए फ़ाइलों की सूची ।
    3. खींचें और प्रत्येक वेक्टर और चारा डेटासेट और प्रत्येक विकास की स्थिति के लिए नीचे फ़ाइल windows में फ़ाइल सूची विंडो से ऊपर उपयुक्त फ़ाइलें ड्रॉप: गैर-चयनित (उसकी + मीडिया) और चयनित (अपने मीडिया) । महत्वपूर्ण रूप से, Stat_Maker रिक्त वेक्टर के लिए डुप्लिकेट datasets की आवश्यकता है अकेले, गैर-चयनित आबादी के दो नमूने और चयनित के दो नमूने । यह प्रयोग के भीतर परिवर्तनशीलता का अनुमान देता है ।
    4. क्लिक करें "भागो" बटन । कंप्यूटर की गति के आधार पर, अभिकलन के बीच 5-15 मिनट लगेगा ।
  5. Stat_Maker आउटपुट, जो "Stat_Maker परिणाम" लेबल मुख्य कार्य फ़ोल्डर के भीतर एक नया सबफ़ोल्डर में रखा जाता है से परिणामों की समीक्षा करें ।
    नोट: परिणाम एक CSV (कॉमा सेपरेटेड वैल्यू) फ़ाइल में पाए जाते है जिसे सामांय स्प्रेडशीट प्रोग्रांस में खोला जा सकता है । Stat_Maker जीन हिट है कि अंतर के लिए खाली pTEF-GBD (चित्रा 5) से अधिक ब्याज की चारा के साथ चयन पर समृद्ध होने की संभावना है रैंक जाएगा । इसके अलावा सारणीबद्ध प्रत्येक डेटासेट के लिए पढ़ता है, जहां जीन डालने के ऊपर, बहाव, या खुले पढ़ने के फ्रेम के भीतर पाया जाता है और क्या जीन भी सही अनुवाद पढ़ने के फ्रेम के भीतर पाया जाता है का प्रतिशत है । अक्सर, DEEPN एक दिया सीडीएनए है कि इसी प्रोटीन के उचित पढ़ने के फ्रेम से बाहर है या सीडीएनए के एक हिस्से के लिए कर रहे है कि अपनी इसी खुले पढ़ने के फ्रेम के बहाव है के भाग के साथ एक चारा की मजबूत Y2H बातचीत पर कब्जा होगा । Stat_Maker से संयुक्त उत्पादन स्कैनिंग का पता लगाने और इन अप्रासंगिक हिट के उन्मूलन को व्यवस्थित ।
  6. प्रत्येक संभावित उंमीदवार पर डेटा की समीक्षा करने के लिए, DEEPN सॉफ़्टवेयर खोलें, संबंधित शिकार लाइब्रेरी जानकारी का चयन करें और फिर "कार्य फ़ोल्डर" का उपयोग करके सही कार्य फ़ोल्डर चुनें ।
    1. "ब्लास्ट क्वेरी" बटन पर क्लिक करें । इससे एक नई विंडो (चित्रा 6) लोड होती है । शीर्ष पाठ बॉक्स में, रुचि के उंमीदवार जीन का चयन करने के लिए जीन का नाम या GenBank एनएम नंबर लिखें । ये जीन नाम StatMaker आउटपुट फ़ाइल में सूचीबद्ध नामों के अनुरूप हैं । दर्ज करें या वापस लिखें, जो ब्याज की जीन की पुनर्प्राप्ति आरंभ करता है ।
    2. चयन करें कि "डेटासेट चुनें" मेनूज़ का उपयोग करके विश्लेषण के लिए कौन से डेटासेट का उपयोग किया जाएगा. आम तौर पर, इन वेक्टर केवल और चारा गैर चुनिंदा शर्तों और चारा चयन की स्थिति के तहत हो नमूना के तहत हो नमूने शामिल हैं । प्रारंभ में, डेटासेट लोड करने के लिए कुछ ही क्षणों में ले जाएगा, तथापि, विभिन्न जीनों के साथ समान डेटासेट के अनुवर्ती क्वेरी तेजी से जाना जाएगा. Blast_Query ब्याज के अनुक्रम के साथ फ्यूजन अंक प्रदर्शित करेगा और कैसे प्रचुर मात्रा में एक संलयन बिंदु है । यह दोनों एक तालिका स्वरूप में "परिणाम" टैब या एक ग्राफिक "भूखंड" टैब का उपयोग कर प्रारूप का उपयोग कर प्रदर्शित किया जा सकता है । इन परिणामों को ऊपरी दाईं ओर "Save. csv" बटन पर क्लिक करके. csv फ़ाइल में निर्यात किया जा सकता है ।

3. DEEPN द्वारा पहचाने गए अभ्यर्थियों का सत्यापन

नोट: DEEPN और Stat_Maker के प्रयोजन के लिए उंमीदवार जीन है कि एक सकारात्मक Y2H बातचीत देने की पहचान है । इस तरह के Y2H बातचीत की पुष्टि एक पारंपरिक द्विआधारी Y2H प्रारूप खाली Gal4-सक्रियकरण डोमेन ' शिकार ' के साथ युग्मित ब्याज के प्लाज्मिड का उपयोग कर के रूप में अच्छी तरह के रूप में शिकार प्लाज्मिड के साथ युग्मित जीन/ यह व्यावहारिक Y2H चयन के अधीन खमीर जनसंख्या से पृथक डीएनए के मिश्रण के भीतर ब्याज की वास्तविक प्लाज्मिड को अलग नहीं है । हालांकि, एक गणना क्या जीन/सीडीएनए टुकड़ा है कि Y2H संपर्क, 5 ' और 3 के लिए डिजाइन प्राइमरों का उत्पादन कर सकते है कि टुकड़ा के समाप्त होता है, और बढ़ाना खमीर आबादी से अलग डीएनए से टुकड़ा । इस खंड का वर्णन कैसे 5 ' और 3 उंमीदवार शिकार टुकड़ा के अंत को खोजने के लिए ।

  1. DEEPN सॉफ्टवेयर खोलें और पैरामीटर चुनें "पैरामीटर का चयन करें" और कार्य फ़ोल्डर "चुनें कार्य फ़ोल्डर" इस परियोजना के लिए इसी । "ब्लास्ट क्वेरी" बटन पर क्लिक करके Blast_Query मॉड्यूल लांच ।
  2. शीर्ष पाठ बॉक्स में रुचि के जीन का नाम या उसके GenBank "एनएम" नंबर टाइप करें । ' परिणाम ' टैब के अंतर्गत जंक्शन पदों की तालिका पुनः प्राप्त करने के लिए रुचि के चारा के लिए चयनित खमीर जनसंख्या से संबंधित डेटासेट के लिए पुल-डाउन मेनू से चयन करें । डिफ़ॉल्ट रूप से, Blast_Query डेटासेट में अपनी बहुतायत के अनुसार विभिन्न पदों के लिए आदेश देगा, quantified डेटाबेस के भीतर पाया जंक्शनों की कुल संख्या के पीपीएम द्वारा ।
    1. सबसे प्रचुर मात्रा में है कि "ओआरएफ में " और "फ्रेम में" का पता लगाएं । स्थिति के लिए मान NCBI संदर्भ अनुक्रम (' एनएम ' संख्या) शीर्ष पाठ बॉक्स में पाया के साथ जीन की न्यूक्लियोटाइड स्थिति के अनुरूप है । इस अनुक्रम GenBank (https://www.ncbi.nlm.nih.gov/nuccore/) से प्राप्त किया जा सकता है या Blast_Query विंडो में निचले पाठ बॉक्स से प्रतिलिपि बनाई गई ।
      नोट: एक उदाहरण चित्रा 6, मध्य पैनल में पाया जा सकता है । केंद्र डेटासेट में, सबसे प्रचुर मात्रा में जंक्शन के रूप में ' परिणाम ' शो: ' स्थिति ': ८६७; ' #Junctions ': २००३३.८२१; ' वेरी स्टार्ट ', 1; सीडीएस: ओआरएफ में; और ' फ्रेम ': फ्रेम में । न्यूक्लियोटाइड ८६७ के GenBank NCBI संदर्भ अनुक्रम NM_019648 के शिकार अंश की शुरुआत है.
  3. यदि क्वेरी शुरू 1 है, किताब के 5 ' अंत डिजाइन करने के लिए स्थिति संख्या के अनुरूप न्यूक्लियोटाइड शामिल है और उस स्थिति (चित्रा 7) से 25 न्यूक्लियोटाइड बहाव का विस्तार । यदि क्वेरी प्रारंभ 1 से अधिक है, तो यह इंगित करता है कि Gal4 सक्रियण डोमेन और शिकार अनुक्रम के बीच अतिरिक्त न्यूक्लियोटाइड है और यह कि प्राइमर क्वेरी प्रारंभ मान के अनुसार आगे बहाव शुरू करना चाहिए ।
  4. DEEPN विंडो से "डेटा का विश्लेषण" के तहत "पढ़ें गहराई" बटन क्लिक करें । एक बार पढ़ने की गहराई विंडो खुली होने पर, शीर्ष पाठ बॉक्स में NCBI संदर्भ अनुक्रम (एनएम) संख्या या जीन नाम लिखें । उस संबंधित डेटासेट का चयन करने के लिए पुल-डाउन मेनू का उपयोग करें जिसमें रुचि के समृद्ध जीन हों. बाईं ओर तालिका का उपयोग करें और ग्राफ़िक्स प्रदर्शित करने के लिए दाईं ओर यह निर्धारित करने के लिए कि कितने पढ़ता है ब्याज की जीन के लिए संगत डेटा (चित्र 7B) में पाए गए ।
  5. डिजाइन एक ' 3 अंत प्राइमर है कि जीन पढ़ें गहराई से गणना टुकड़ा के अनुक्रम पर कब्जा होगा । अगर पढ़ता की बहुतायत ओआरएफ से परे चला जाता है और codon बंद करो, प्राइमर डिजाइन इतना है कि यह रोकने के codon और क्षेत्र बस स्टॉप codon के ऊपर शामिल हैं । यदि जीन के लिए दृश्यों को रोकने के codon पिछले करने के लिए विस्तार नहीं है, परिणाम तालिका का उपयोग सबसे दूर 3 ' क्षेत्र है कि पता लगाया जा सकता है खोजने के लिए और दूर 3 ' स्थिति के रूप में इस स्थिति का उपयोग करने के लिए प्राइमर जगह है ।
    नोट: पढ़ें गहराई कार्यक्रम के अंतराल में स्कैन करता है कि निर्दिष्ट जीन/सीडीएनए ब्याज के मैच के अनुक्रम को खोजने के लिए । यह भविष्यवाणी में मदद करता है जहां 5 ' और ' 3 सबसे प्रचुर मात्रा में शिकार टुकड़ा के अंत नमूना में है कि जीन के लिए है । अनुक्रम की लंबाई के साथ पढ़ने की गहराई में उतार चढ़ाव सामान्य हैं, चित्रा 7में देखा जा सकता है के रूप में. यदि पढ़ें गहराई स्पष्ट रूप से बंद codon पिछले है, यह इंगित करता है कि शिकार टुकड़ा रोक codon से परे फैली हुई है और इस तरह 3 ' प्राइमर बस रोक codon आसपास के क्षेत्र के अनुरूप कर सकते हैं ।
  6. प्रति जीन एक ५० µ एल पीसीआर प्रतिक्रिया प्रदर्शन । प्रत्येक प्रतिक्रिया के 25 pmol शामिल प्रत्येक आगे और रिवर्स किताब शिकार से मेल खाती है-पुस्तकालय प्लाज्मिड (सामग्री की तालिका देखें) । प्रतिक्रियाओं भी उच्च निष्ठा 2x पीसीआर मास्टर मिक्स, 5 डीएनए नमूने के µ जी, और ५० µ एल तक पानी के 25 µ एल शामिल
    1. ७२ डिग्री सेल्सियस पर 3 मिनट के विस्तार समय के साथ 25 चक्र के लिए प्रतिक्रियाओं बढ़ाना, 30 एस के लिए ५५ डिग्री सेल्सियस के एनीलिंग तापमान, और denaturing के लिए ९८ ° c पर 10 s. ९८ ° c पर एक 30 एस विकार द्वारा साइकिल से पहले और एक 5 मिनट की मशीन के साथ का पालन करें ७२ ° c ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

मैपिंग fastq डेटा: पहला चरण
व्यावहारिक रूप में DEEPN सहित सभी NGS अनुप्रयोगों में प्रारंभिक आउटपुट लघु अनुक्रम की एक फ़ाइल है कि जीनोमिक, transcriptomic, या अंय संदर्भ डीएनए8के लिए संरेखण द्वारा मैप किया जाना चाहिए पढ़ता है । हाल ही में, HISAT2 संरेखण कार्यक्रम विकसित किया गया था कि राज्य के अत्याधुनिक अनुक्रमण एल्गोरिदम का उपयोग करता है नाटकीय रूप से मानचित्रण गति7,9वृद्धि हुई है । HISAT2 एक डेस्कटॉप कंप्यूटर पर कुशलता से चलाता है और एक आम तौर पर आकार पठन फ़ाइल मिनटों में मैप कर सकते हैं । यह हमें एक ग्राफिक उपयोगकर्ता इंटरफ़ेस में HISAT2 लपेटो करने के लिए MAPster कहा जाता है कि fastq फ़ाइलें स्थानीय रूप से मैप कर सकते है अनुमति दी, उपयोगकर्ताओं को दूरदराज के उच्च प्रदर्शन कंप्यूटर क्लस्टर पर निर्भर है कि आम तौर पर कमांड लाइन भाषा (चित्रा 1) के साथ काम करने से बचने की अनुमति । MAPster की महत्वपूर्ण सुविधाओं आरएनए-seq और पूरे जीनोम मानचित्रण प्रयोगों के लिए पूर्व निर्धारित मापदंडों की उपस्थिति, विशेषज्ञ उपयोगकर्ताओं के लिए और अनुकूलित करने के लिए आसानी से समायोज्य HISAT2 मापदंडों का एक पूर्ण सेट करने के लिए कई नौकरियों कतार, और उपयोग करने की क्षमता शामिल अनुप्रयोगों. आदेश में MAPster की कार्यक्षमता को समझाने के लिए, एक सार्वजनिक रूप से उपलब्ध eHAP सेल आरएनए-seq डेटा फ़ाइल पहनावा GRChg38 जीनोम प्लस प्रतिलिपि संदर्भ डीएनए के लिए मैप किया गया था. eHAP A11 दोहराने 1 FASTQ फ़ाइल NCBI अनुक्रम पढ़ें संग्रह से डाउनलोड किया गया था और समाहित ३८,३००,००० पढ़ता है । MAPster एक ३.५ GHz इंटेल कोर i7 प्रोसेसर के साथ एक सेब iMac पर चला गया डिफ़ॉल्ट आरएनए-unseqd पढ़ने के लिए फ़ाइल के लिए पैरामीटर का उपयोग कर । यह मैपिंग पांच मिनट से भी कम समय में पूरी की गई । कुल मिलाकर संरेखण की दर ९६.६% थी । हालांकि समग्र संरेखण दर Y2H शिकार प्लाज्मिड से वेक्टर अनुक्रम की उपस्थिति के कारण कम है के समान परिणाम 15 – 25 लाख पढ़ता/नमूना, के विशिष्ट DEEPN डेटासेट के साथ पाए जाते हैं ।

Stat_Maker की मदद से उंमीदवार हिट ढूंढना ।
StatMaker कार्यक्रम एक एक्सेल-देखा जा सकता है कि प्रासंगिक के लिए उंमीदवार की पहचान करने के लिए आवश्यक जानकारी के अधिकांश summarizes प्रोटीन बातचीत पैदा करता है । क्योंकि Stat_Maker unix-आधारित उपदिनचर्या का उपयोग करता है, यह एक मैक (os 10.10 +) पर नहीं बल्कि पीसी पर चलेंगे । सबसे पहले, यह संक्षेप में दोनों वेक्टर नियंत्रण और चारा आबादी के लिए एक जीन के लिए पीपीएम में पढ़ता है और यह भी एक संभावना रैंकिंग है कि एक विशेष जीन के संवर्धन जब ब्याज के चारा के साथ Y2H बातचीत के लिए चयनित का उत्पादन वास्तव में अधिक से अधिक है उस जीन के संवर्धन जब वेक्टर केवल नियंत्रण (5 चित्रा) के साथ बातचीत के लिए चुना है । दूसरा, StatMaker हर जीन मूल्यांकन पर BlastQuery मॉड्यूल चंद्रग्रहण करता है और जंक्शन के प्रतिशत tabulates पढ़ता है कि सही शोधों फ्रेम और कोडिंग अनुक्रम है जो एक बोनाफाइड के लिए आवश्यक होगा जैविक प्रासंगिक इंटरैक्टकर्ता. इस संयुक्त उत्पादन यह जल्दी से तरह और फिल्टर उंमीदवारों उन है कि BlastQuery द्वारा करीब निरीक्षण किया जा सकता है की पहचान करने के लिए संभव बनाता है । इस उत्पादन के साथ, एक के उच्चतम probabily के साथ उन उंमीदवारों के लिए पहली तरह कर सकते है ब्याज की चारा प्रोटीन पर Y2H बातचीत के लिए चयन के दौरान समृद्ध और नहीं जब वेक्टर अकेले प्लाज्मिड पर बातचीत के लिए चुना जा रहा है । व्यवहार में, हम पाते है कि पी > 0.95 अच्छी तरह से काम करता है । तो उंमीदवारों उन है कि सबसे जंक्शन पढ़ता है कि दोनों कोडिंग क्षेत्र में और उचित पढ़ने के फ्रेम में एक सरल छंटाई समारोह का उपयोग कर रहे है के लिए स्थान दिया जा सकता है । यहां, जंक्शनों के > 85% के साथ उंमीदवारों कि सही शोधों फ्रेम में है और खुले पढ़ने के फ्रेम के भीतर या तो पाया जाता है/प्रोटीन (ओआरएफ) में क्षेत्र कोडन या कि शुरू codon (नदी के ऊपर) के बस ऊपर शुरू करते हैं । यह बाद फिल्टर 60-उंमीदवारों कि एक स्वीकार्य पी मूल्य है की 80% समाप्त, एक सूची है कि और अधिक जैविक रूप से प्रासंगिक है और आगे के निरीक्षण के लिए प्रबंधनीय उत्पादन ।

DEEPN सॉफ्टवेयर ।
कोर DEEPN सॉफ्टवेयर बंडलों कई गणना मॉड्यूल एक साथ सभी bioinformatics सैम फ़ाइलों का उपयोग कर कदम को एकीकृत करने के लिए । Gene_Count जीन प्रति पढ़ता की संख्या प्रदान करता है, एक आरएनए के समान एक गणना प्रदर्शन-seq quantitation. अंय प्रोग्राम है कि गणना के इस प्रकार के प्रदर्शन के रूप में अच्छी तरह से इस्तेमाल किया जा सकता है, तथापि, फ़ाइल स्वरूप की आवश्यकता के लिए अंय DEEPN मॉड्यूल और Stat_Maker कार्यक्रम के साथ संगत हो बदल जाएगा । वैकल्पिक रूप से, Gene_Count मॉड्यूल RNAseq प्रयोगों यों तो इस्तेमाल किया जा सकता है, तथापि, अंय विशिष्ट सांख्यिकी कार्यक्रम के साथ कसा हुआ10विकसित किया गया है संकुल । एक विशेष ब्याज की अपनी इसी जीन के साथ पढ़ने के लिए प्रतिचित्रित मिलान की प्रक्रिया है जीन असाइनमेंट के लिए एक डेटा वृक्ष संरचना का उपयोग करके प्रारंभिक DEEPN सॉफ्टवेयर के बाद से सुधार किया गया है । इस के प्रभाव को बहुत प्रसंस्करण की गति में तेजी लाने के लिए किया गया था कि एक ठेठ १०,०००,००० मैप की गई के साथ एक विशिष्ट डेटासेट पढ़ता है 5 – 10 न्यूनतम सिस्टम आवश्यकताओं के साथ डेस्कटॉप कंप्यूटर पर मिनट. अंय विश्लेषण, विशेष रूप से जंक्शन के विश्लेषण पढ़ता है कि Gal4-सक्रियकरण डोमेन अवधि और ब्याज की बातचीत उंमीदवार, आत्म निहित हैं । वे विस्फोट alogorithm कि स्थानीय रूप से चलाता है और प्रक्रिया को पार्स करने के लिए सही ढंग से कॉलेट सभी जंक्शन पढ़ता है और सभी दिए गए जीन के लिए उनकी स्थिति के साथ पैक कर रहे हैं । DEEPN सॉफ्टवेयर की खामियों में से एक यह है कि यह विशेष स्वरूपित डेटाबेस का उपयोग करता है कि परिभाषित जो संदर्भ जीनोम में exons cDNAs या कोडिंग क्षेत्रों को परिभाषित करने के लिए उपयोग किया जाता है, और स्वरूपित डेटाबेस है कि अनुक्रम और अनुवाद शुरू और बंद हो जाता है निर्दिष्ट प्रत्येक सीडीएनए का प्रयोग/ हमने पाया है कि यह सभी डेटाबेस जानकारी DEEPN एक विश्वसनीय प्रारूप है कि हम विशेष रूप से जीन के अनुक्रमण के साथ सामना करना पड़ा नकली गलतियों में से कुछ कमी में की आवश्यकता को पुनः प्राप्त करने के लिए मुश्किल था । इस प्रकार, हम नए डेटाबेस है कि हम गुणवत्ता नियंत्रित और उंहें लगातार आंतरिक संदर्भ के लिए DEEPN सॉफ्टवेयर में एंबेडेड इकट्ठे । वर्तमान में, माउस, मानव, और एस cerevisiae Y2H शिकार पुस्तकालयों शामिल डेटाबेस द्वारा समर्थित है कि डीएनए fastq फ़ाइलें mm10, hg38, या SacCer3 संदर्भ डेटाबेस UCSC से उपलब्ध के खिलाफ मैप किए जाते हैं । विभिंन जीवों से Y2H पुस्तकालयों DEEPN द्वारा संसाधित किया जा सकता है बशर्ते कि इसी तरह के डेटाबेस बनाया और DEEPN सॉफ्टवेयर में रखा जाता है । कुल मिलाकर, तथापि, सभी DEEPN मॉड्यूल, डेटाबेस के स्व-समाहित पैकेजिंग, और अंय कार्यक्रमों इन bioinformatic विश्लेषण विशेषज्ञता के सभी स्तरों पर जांचकर्ताओं के लिए सुलभ बनाते हैं ।

Figure 1
चित्रा 1 : MAPster इंटरफेस । MAPster की मुख्य विंडो के स्क्रीन शॉट । आवश्यक फ़ाइलें और स्वरूप दर्ज करने के लिए बक्से दिखाए जाते हैं । बारी "Pairwise" (एक) बंद अनुक्रम फ़ाइलों के इलाज के रूप में एकल अंत पढ़ता है । संदर्भ जीनोम को ' जीनोम ' मेन्यू बार (बी) के साथ चुना गया है. HISAT2 द्वारा प्रयुक्त प्रोसेसरों की संख्या "थ्रेड" मेनू (C) के साथ चुना गया है । नया नमूना नाम "आउटपुट फ़ाइल नाम" पाठ विंडो (D) में टाइप किया जा सकता है । आउटपुट फ़ाइलों के लिए निर्देशिका (E) में निर्दिष्ट किया जा सकता है । नीचे एक एकल अंत पढ़ने फ़ाइलों की कतार दिखा खिड़की है । क्यू करने के लिए नमूना जोड़ा गया है के बाद, मैपिंग "चलाएँ क्यू" बटन (F) के साथ प्रारंभ किया जा सकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 2
चित्रा 2 : DEEPN इंटरफेस । DEEPN मॉड्यूल संचालित करने के लिए उपयोग किए गए ग्राफ़िक उपयोगकर्ता इंटरफ़ेस का चित्र । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 3
चित्रा 3 : प्रसंस्करण का समापन । एक बार DEEPN डेटा संसाधित करता है, तो निंन सबफ़ोल्डर बनाए जाते हैं । ये निरीक्षण किया जा सकता है, लेकिन बहाव प्रक्रियाओं की आवश्यकता है कि इन सबफ़ोल्डर्स मुख्य कार्य फ़ोल्डर में रहना और कि वे उनकी सामग्री और नाम बनाए रखने । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 4
चित्र 4 : Stat_Maker विश्लेषण. Stat_Maker के लिए ग्राफिक यूजर इंटरफेस का चित्र है, जो उपयुक्त फ़ाइलों के साथ लोड किया गया है प्रसंस्करण के लिए अनुमति देते हैं । शीर्ष Stat_Maker के प्रारंभिक दृश्य से पता चलता है । एक बार अंतर्निहित समर्थन डेटा की उपस्थिति "सत्यापित करें स्थापना" बटन पर क्लिक करके सत्यापित किया गया है, और उचित कार्य फ़ोल्डर "फ़ोल्डर चुनें" बटन पर क्लिक करने के बाद की पहचान की, GUI सक्रिय हो जाएगा, फ़ाइलों को लोड करने के लिए अनुमति देता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 5
चित्रा 5 : Stat_Maker उत्पादन से अंश । Stat_Maker उत्पादन के भाग एक चारा प्रोटीन पर शिकार उंमीदवारों की समृद्धि की तुलना अकेले वेक्टर (खाली pTEF-GBD) । यह भी दिखाया है कि शिकार उंमीदवार के लिए इसी plasmids उचित खुले पढ़ने के फ्रेम होते है की इसी विश्लेषण है । प्रत्येक जीन का मूल्यांकन कई मूल्यों: आधार, Vec, चारा है, और एंर । ' आधार ' का औसत अनुपात है (पीपीएम) है कि 2 के भीतर जीन के लिए मनाया गया है कि केवल अकेले वेक्टर युक्त और गैर चयनात्मक शर्तों के तहत विकसित की आबादी के अनुरूप डेटासेट । "Vec" पढ़ता के औसत अनुपात को संदर्भित करता है (पीपीएम) कि 2 के भीतर जीन के लिए मनाया गया था इसी अकेले वेक्टर युक्त डुप्लिकेट आबादी और चयनात्मक शर्तों के तहत हो (जैसे-अपने) । ' चारा ' के अनुपात को संदर्भित करता है (पीपीएम) कि 2 के भीतर जीन के लिए मनाया गया था 2 इस चारा प्लाज्मिड युक्त आबादी को इसी डेटासेट और चयनात्मक शर्तों के तहत हो (जैसे-अपने) । "एंर" (enrichement) log2 है (बी एस/बीएन)/(बनाम Vn)) जहां बी एस के चयन के तहत चारा के लिए पढ़ता है, बीएन गैर के तहत चारा के लिए पढ़ता है चयन, बनाम वेक्टर चयन के तहत अकेले है, और Vn चयन के तहत अकेले वेक्टर है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 6
चित्रा 6 : Blast_Query का प्रदर्शन । 3 अलग विचारों से Blast_Query का उत्पादन । शीर्ष परीक्षार्थी के डेटासेट चयनित होने से पहले Stat_Maker का आरंभिक दृश् य होता है । मध्य कक्ष दो भिन्न डेटासेट के लिए किसी दिए गए उम्मीदवार के बारे में जानकारी प्रदर्शित करने वाली डेटा तालिका का एक उदाहरण दृश्य है. नीचे तालिका डेटा के एक ग्राफिक दृश्य से पता चलता है, जीन के साथ विशेष जंक्शन अंक की संख्या की साजिश रचने/सीडीएनए ब्याज की । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 7
चित्र 7 : खोजने 5 ' और 3 ' प्राइमरों बढ़ाना । () एक काल्पनिक अनुक्रम से पता चलता है और कैसे 5 ' oligo डिजाइन करने के लिए सही फ्रेम और Gal4-सक्रियकरण डोमेन और ब्याज की शिकार अनुक्रम के बीच फ्यूजन बिंदु पर कब्जा । 1 उदाहरण में, फ्यूजन बिंदु की स्थिति 1 की क्ष शुरू के साथ 10वें न्यूक्लियोटाइड पर है । ऊपर ऑफसेट तालिका का उपयोग करना, 0 न्यूक्लियोटाइड के लिए ' 5 प्राइमर की शुरुआत की स्थिति को खोजने के लिए जोड़ा जा रहे हैं । खंगाला शिकार प्लाज्मिड फ्यूजन प्वाइंट से पता चलता है कि Gal4 सक्रियण डोमेन न्यूक्लियोटाइड 10 में शिकार करने के लिए सीधे जुड़े हुए है । उदाहरण 2 में, क्वेरी प्रारंभ 3 है, जो एक ऑफ़सेट 1 न्यूक्लियोटाइड के क्रम में सही प्रारंभ बिंदु और शिकार सम्मिलित करें फ़्रेम को कैप्चर करने के लिए आवश्यक है । खंगाला शिकार की योजनाबद्ध पता चलता है कि वहां 2 न्यूक्लियोटाइड Gal4 सक्रियकरण डोमेन और शिकार डालने के लिए है कि के लिए जवाबदेह होना चाहिए की ज्ञात स्थिति के बीच कर रहे हैं । (B) पठन गहराई विंडो दिखाता है । शीर्ष पर पाठ बॉक्स NCBI संदर्भ अनुक्रम संख्या में प्रवेश करने के लिए प्रयोग किया जाता है और ' Select. sam ' फ़ाइल के तहत पुल-डाउन मेनू का उपयोग किया जाता है समृद्ध बातचीत जीन युक्त नमूना के लिए डेटा का चयन करने के लिए यदि ब्याज. पढ़ें गहराई से पता चलता है कि कितने अनुक्रम (Y अक्ष) डेटा में पाया गया है कि ब्याज के अनुक्रम के न्यूक्लियोटाइड पदों के अनुरूप (X-अक्ष) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

सॉफ्टवेयर सुइट यहाँ वर्णित एक पूरी तरह से प्रक्रिया और एक DEEPN प्रयोग से उच्च प्रवाह डीएनए अनुक्रमण डेटा का विश्लेषण करने के लिए अनुमति देता है. पहले इस्तेमाल किया कार्यक्रम MAPster है, जो लेता है डीएनए अनुक्रम मानक fastq फ़ाइलों में पढ़ता है और बहाव प्रसंस्करण के लिए एक संदर्भ डीएनए पर उनकी स्थिति DEEPN सॉफ्टवेयर सहित सूचना के कार्यक्रमों की एक पूरी मेजबान द्वारा । MAPster इंटरफेस की उपयोगिता और इसकी क्षमता कई नौकरियों कतार करने के लिए, इनपुट फ़ाइलें, coveniently नाम आउटपुट फ़ाइलें, अंतर्निहित HISAT2 कार्यक्रम की गति के साथ युग्मित7 यह नियंत्रण प्रदान करता है एक आसान करने के लिए उपयोग उपकरण की एक किस्म के लिए मानचित्रण DEEPN से परे आवेदन । MAPster HISAT2 प्रोग्राम है कि DEEPN के अलावा डेटा विश्लेषण के अंय प्रकार के लिए अनुकूल है के कई मापदंडों का उपयोग कर सकते हैं । इन सुविधाओं में से कुछ आरएनए-seq और पूरे जीनोम मानचित्रण प्रयोगों और विशेषज्ञ उपयोगकर्ताओं के लिए और अनुकूलित अनुप्रयोगों के लिए आसानी से समायोज्य HISAT2 मापदंडों का एक पूर्ण सेट करने के लिए उपयोग के लिए पूर्व निर्धारित मापदंडों में शामिल हैं । उदाहरण के लिए, आरएनए-seq बटन स्वरूपण है कि प्रतिलिपि विधानसभा की सुविधा होगी कहते हैं । एक संदर्भ डीएनए गाइड आरएनए अनुक्रम से व्युत्पंन फ़ाइल के लिए उपयुक्त होगा के रूप में रिवर्स करने के लिए CRISPR बटन ब्लॉक संरेखण पूरक । वैकल्पिक मापदंडों लेबल चार टैब के तहत पाए जाते हैं, "इनपुट, संरेखण, स्कोरिंग, और आउटपुट". इनपुट विकल्पों में इनपुट फ़ाइल स्वरूपों को परिवर्तित करने और मूल पठन ट्रिमिंग विकल्प निर्दिष्ट करने की क्षमता शामिल है । संरेखण और स्कोरिंग टैब्स में संदर्भ डीएनए पर केवल एक किनारा का चयन करने के लिए और संरेखण स्कोर के लिए अंतर और बेमेल दंड सेट करने के लिए विकल्प शामिल हैं । आसानी से कतार एकाधिक मानचित्रण नौकरियों अलग पैरामीटर सेटिंग के साथ प्रत्येक की क्षमता दोनों विशेषज्ञ और गैर विशेषज्ञ उपयोगकर्ताओं को जटिल NGS अनुप्रयोगों का पीछा करने के लिए ब्याज की MAPster करना चाहिए ।

DEEPN और Stat_Maker सॉफ्टवेयर प्रोग्राम बैच Y2H स्क्रीन से डेटा के विशिष्ट bioinformatics विश्लेषण करने के लिए समर्पित कर रहे हैं । यह जांचकर्ताओं की एक विस्तृत रेंज के लिए सुलभ है और एक निरंतर bioinformatic सॉफ्टवेयर एक ग्राफिक उपयोगकर्ता इंटरफ़ेस के माध्यम से चलाने के पैकेज का गठन किया । यह पैकेज और अनुकूलित किया गया है और अपने मूल विवरण6 से एकीकृत इतना है कि यह तेजी से चलाता है और उंमीदवार हिट का विश्लेषण सुव्यवस्थित है । सभी bioinformatics चरणों को किसी डेस्कटॉप कंप्यूटर पर चलाया जा सकता है । मुख्य DEEPN सॉफ्टवेयर इन मानचित्र पदों की गणना करने के लिए कितने पढ़ता प्रत्येक जीन जिससे कैसे एक दिया जीन चयन पर समृद्ध है के लिए आधार बनाने के अनुरूप लेता है । यह सॉफ्टवेयर भी ' जंक्शन ' जुगाड़ है कि ब्याज की डालने के लिए अनुरूप के रूप में यह शिकार प्लाज्मिड और tabulates इन परिणामों के transcriptional सक्रियण डोमेन से जुड़े हुए है ताकि एक एक विशेष ओआरएफ के सभी विभिंन भागों कल्पना कर सकते है पाता है या सीडीएनए कि बातचीत के लिए पर्याप्त है । इसके अलावा, यह भी प्रत्येक सम्मिलित की पठन फ़्रेम सत्यापित करने के लिए जानकारी प्रदान करता है । bioinformatic सॉफ्टवेयर के तीसरे हाथ Stat_Maker है, जो उत्पादन DEEPN द्वारा संसाधित फ़ाइलों का उपयोग करता है जीन संवर्धनों की सांख्यिकीय प्रासंगिकता की गणना करने के लिए एक दिया चारा प्रोटीन बनाम Gal4-डीएनए-बंधन डोमेन अकेले सदिश के साथ बातचीत से उत्पंन ( खाली pTEF-GBD). हाल ही में एक सुधार है कि Stat_Maker न केवल प्रत्येक उंमीदवार के एक सांख्यिकीय क्रम प्रदान करता है, लेकिन यह भी इसी जंक्शन दृश्यों से निकाली इसी जानकारी tabulates, उंहें एक एकल यह बहुत आसान बनाने फ़ाइल में उपलब्ध बना जांचकर्ताओं के लिए सर्वेक्षण और परिणामों की समीक्षा करने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है

Acknowledgments

इस काम के स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा समर्थित किया गया था: NIH R21 EB021870-01A1 और द्वारा NSF अनुसंधान परियोजना अनुदान: १५१७११० ।

Materials

Name Company Catalog Number Comments
Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
- 4 Gb RAM or better
- 500 Gb Disk spce or better
- OS 10.10 or higher
Dell Intel i5-7400 or better
- 4 Gb RAM or better
- 500 Gb Disk spce or better
- Windows 7 or higher

DOWNLOAD MATERIALS LIST

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Tags

आनुवंशिकी अंक १३६ प्रोटीन बातचीत अगली पीढ़ी अनुक्रमण डीएनए अनुक्रम विश्लेषण 2 खमीर-संकर
बैच खमीर 2 से अनुक्रम डेटा का स्वरूप विश्लेषण-संकर स्क्रीन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Krishnamani, V., Peterson, T. A.,More

Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter