Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

जीनोम-वाइड पहचान और अभिव्यक्ति मेटा-विश्लेषण के लिए व्यापक कार्यप्रवाह ATL E3 के Ubiquitin Ligase जीन परिवार में चर्चा

Published: December 22, 2017 doi: 10.3791/56626
* These authors contributed equally

Summary

इस लेख की पहचान और चर्चा में एक जीन परिवार के लक्षण वर्णन के लिए प्रक्रिया को Levadura में Arabidopsis Tóxicos (ATL) E3 ubiquitin ligases के परिवार के लिए लागू की व्याख्या करता है ।

Abstract

वर्गीकरण और एक परिवार में जीन का नामकरण काफी इनकोडिंग प्रोटीन की विविधता के वर्णन में योगदान कर सकते है और कई सुविधाओं के आधार पर परिवार के कार्यों की भविष्यवाणी के लिए, जैसे अनुक्रम रूपांकनों की उपस्थिति या विशेष रूप से पोस्ट-शोधों के संशोधन के लिए साइटें और विभिन्न स्थितियों में परिवार के सदस्यों की अभिव्यक्ति प्रोफ़ाइल. यह काम जीन परिवार लक्षण वर्णन के लिए एक विस्तृत प्रोटोकॉल का वर्णन । यहां, प्रक्रिया में Levadura (ATL) E3 ubiquitin ligase परिवार में चर्चा में Arabidopsis Tóxicos के लक्षण वर्णन करने के लिए लागू किया जाता है । तरीकों परिवार के सदस्यों की जीनोम चौड़ा पहचान, जीन स्थानीयकरण, संरचना, और दोहराव के विश्लेषण में शामिल हैं, संरक्षित प्रोटीन रूपांकनों की भविष्यवाणी, प्रोटीन स्थानीयकरण और फास्फारिलीकरण साइटों के पूर्वानुमान के रूप में अच्छी तरह के रूप में जीन अभिव्यक्ति विभिंन डेटासेट में परिवार के पार की रूपरेखा । इस तरह की प्रक्रिया है, जो प्रयोगात्मक प्रयोजनों के आधार पर आगे विश्लेषण करने के लिए बढ़ाया जा सकता है, किसी भी संयंत्र प्रजातियों के लिए जो जीनोमिक डेटा उपलब्ध है में किसी भी जीन परिवार के लिए लागू किया जा सकता है, और यह बहुमूल्य जानकारी प्रदान करता है दिलचस्प उंमीदवारों की पहचान कार्यात्मक अध्ययन के लिए, अपने पर्यावरण के लिए संयंत्र अनुकूलन के आणविक तंत्र में अंतर्दृष्टि दे ।

Introduction

पिछले दशक के दौरान, बहुत अनुसंधान दाखलता जीनोमिक्स में किया गया है । दाखलता एक मांयता प्राप्त आर्थिक रूप से प्रासंगिक फसल है, जो फल विकास पर अनुसंधान के लिए और वुडी पौधों की प्रतिक्रियाओं पर बायोटिक और अजैव तनाव के लिए एक मॉडल बन गया है । इस संदर्भ में, के रिलीज के विटिस द्राक्षा cv. PN40024 जीनोम में २००७1 और २०११2 में अपने अद्यतन संस्करण "ओमिक्स" पैमाने पर डेटा के एक तेजी से जमा करने के लिए और उच्च प्रवाह अध्ययन के एक फट करने के लिए नेतृत्व किया । प्रकाशित अनुक्रम डेटा के आधार पर, एक दिया जीन परिवार के व्यापक विश्लेषण (आम तौर पर संरक्षित रूपांकनों, संरचनात्मक और/कार्यात्मक समानताएं और विकासवादी रिश्तों को साझा प्रोटीन से बना), अब अपने को उजागर किया जा सकता है आणविक कार्य, विकास, और जीन अभिव्यक्ति प्रोफाइल । ये विश्लेषण समझ कैसे जीन परिवारों को एक जीनोम व्यापक स्तर पर शारीरिक प्रक्रियाओं को नियंत्रित करने में योगदान कर सकते हैं ।

संयंत्र जीवन चक्र के कई पहलुओं को नियमित रूप से सेलुलर प्रक्रियाओं को सुनिश्चित करने के लिए एक ठीक-देखते कारोबार की आवश्यकता है, जो प्रमुख प्रोटीन की ubiquitin-मध्यस्थता क्षरण द्वारा विनियमित रहे हैं । ubiquitin-मध्यस्थता क्षरण की प्रक्रिया के महत्वपूर्ण घटक हैं E3 ubiquitin ligases, जो सिस्टम लचीलेपन के लिए जिम्मेदार हैं, विशिष्ट लक्ष्यों की भर्ती के लिए धन्यवाद3. तदनुसार, इन एंजाइमों एक विशाल जीन परिवार का प्रतिनिधित्व करते हैं, के साथ लगभग १,४०० E3 ligase-एंकोडिंग जीन Arabidopsis थालियाना जीनोम4में भविष्यवाणी की है, प्रत्येक E3 ubiquitin ligase विशिष्ट लक्ष्य प्रोटीन के ubiquitination के लिए अभिनय । पौधों में सेलुलर विनियमन में सब्सट्रेट विशिष्ट ubiquitination के महत्व के बावजूद, थोड़ा कैसे ubiquitination मार्ग विनियमित है और लक्ष्य प्रोटीन केवल कुछ मामलों में पहचान की गई है के बारे में जाना जाता है । ऐसी विशिष्टता और विनियमन तंत्र के गूढ़ पहचान और प्रणाली के विभिंन घटकों के लक्षण वर्णन पर पहले निर्भर करता है, विशेष रूप से E3 ligases । ubiquitin ligases में, ATL उपपरिवार ९१ एक अंगूठी-H2 फिंगर डोमेन5,6, उनमें से कुछ की रक्षा और हार्मोन प्रतिक्रियाओं7में एक भूमिका निभा रहा है प्रदर्शित थालियाना में पहचाना सदस्यों द्वारा विशेषता है ।

पहला महत्वपूर्ण कदम एक नया जीन परिवार के सदस्यों को परिभाषित करने के लिए इस तरह आम सहमति रूपांकनों, कुंजी डोमेन, और प्रोटीन अनुक्रम विशेषताओं के रूप में परिवार की सुविधाओं की सटीक परिभाषा है । दरअसल, सभी जीन परिवार के सदस्यों की विश्वसनीय पुनः प्राप्ति विस्फोट विश्लेषण के आधार पर कुछ अनिवार्य अनुक्रम विशेषताओं की आवश्यकता है, विशेष रूप से प्रोटीन डोमेन में प्रोटीन समारोह के लिए जिंमेदार/ यह अंय प्रजातियों के पौधे में एक ही जीन परिवार के पिछले लक्षण वर्णन की सुविधा हो सकता है या अलग अलग प्रजातियों के पौधे में एक ही परिवार से संबंधित putatively का विश्लेषण करके हासिल की, आम दृश्यों को अलग । परिवार के सदस्यों को तो व्यक्तिगत रूप से एक दिया संयंत्र प्रजातियों के लिए अंतरराष्ट्रीय consortia द्वारा बसे आम नियमों के बाद नामित किया जा सकता है । चर्चा में, उदाहरण के लिए, इस तरह की प्रक्रिया को सुपर नामकरण अंगूर जीन एनोटेशन (sNCGGa) के लिए समिति की सिफारिशों के अधीन है, वी. द्राक्षा और थालियाना सहित एक वंशावली पेड़ के निर्माण की स्थापना जीन परिवार के सदस्यों न्यूक्लियोटाइड अनुक्रम8के आधार पर जीन एनोटेशन की अनुमति देने के लिए ।

परिवार के सदस्यों और जीन दोहराव सर्वेक्षण के गुणसूत्र स्थानीयकरण पूरे जीनोम की उपस्थिति पर प्रकाश डाला या मिलकर दोहराया जीन की अनुमति देते हैं । इस तरह की जानकारी ख्यात जीन कार्यों को खंडित करने के लिए उपयोगी प्रतीत होता है, क्योंकि यह कार्यात्मक अतिरेक दिखाने या विभिंन स्थितियों, अर्थात्, गैर functionalization, नव functionalization, या उप functionalization9प्रकट हो सकता है । दोनों नव और उप functionalization महत्वपूर्ण घटनाओं है कि आनुवंशिक नवीनता बनाने के लिए, संयंत्र अनुकूलन के लिए नई सेलुलर घटकों को उपलब्ध कराने के वातावरण10बदल रहे हैं । विशेष रूप से, पैतृक जीन और नए जीन के उत्पादन के दोहराव चर्चा जीनोम के विकास के दौरान बहुत लगातार थे और नए गठन और चर्चा में समीपस्थ और मिलकर दोहराव से उत्पंन जीन थे और नए उत्पादन की संभावना ११कामे.

जीन परिवार समारोह गूढ़ रहस्य में एक अंय महत्वपूर्ण कारक transcriptomic प्रोफ़ाइल है । सार्वजनिक डेटाबेस की उपलब्धता transcriptomic डेटा की एक बड़ी राशि के लिए उपयोग दे इस प्रकार जीन परिवार के सदस्यों को ख्यात कार्य आवंटित करने के लिए बड़े पैमाने का उपयोग कर silico अभिव्यक्ति विश्लेषण में शोषण किया जा सकता है । वास्तव में, विशिष्ट संयंत्र अंगों में कुछ जीन की अजीब अभिव्यक्ति या कुछ तनावों के जवाब में कुछ संकेत दे सकते है परिभाषित शर्तों में इसी प्रोटीन की ख्यात भूमिकाओं के बारे में, और सहायता के बारे में परिकल्पनाओं को दे संभव विभिन्न चुनौतियों का जवाब देने के लिए डुप्लिकेट जीन के उप-functionalization । इस प्रयोजन के लिए, यह कई डेटासेट पर विचार करने के लिए महत्वपूर्ण है: ये पहले से ही उपलब्ध जीन अभिव्यक्ति मैट्रिक्स, चर्चा अंगों और विकासात्मक चरणों के जीनोम-वाइड transcriptomic एटलस के रूप में कर सकते हैं12, या द्वारा तदर्थ बनाया जा सकता है विशेष संयंत्र प्रजातियों के लिए transcriptomic डेटासेट प्राप्त करने के लिए निर्धारित तनाव के अधीन । इसके अलावा, दो मैट्रिक्स का उपयोग कर एक सरल दृष्टिकोण, pairwise समानता डेटा के साथ एक और pairwise सह अभिव्यक्ति गुणांक के साथ एक अन्य एक जीन परिवार के भीतर अनुक्रम समानता और अभिव्यक्ति पैटर्न के बीच संबंधों का मूल्यांकन करने के लिए लागू किया जा सकता.

इस काम का उद्देश्य एक वैश्विक दृष्टिकोण प्रदान करने के लिए है, जीन संरचना, संरक्षित प्रोटीन रूपांकनों, गुणसूत्र स्थान, जीन दोहराव, और अभिव्यक्ति पैटर्न, के रूप में अच्छी तरह से प्रोटीन स्थानीयकरण और फास्फारिलीकरण साइटों की भविष्यवाणी को परिभाषित करने, एक प्राप्त करने के लिए पौधों में एक जीन परिवार के संपूर्ण लक्षण वर्णन । इस तरह के एक व्यापक दृष्टिकोण ATL E3 चर्चा में ubiquitin ligase परिवार के लक्षण वर्णन के लिए यहां लागू किया जाता है । कुंजी सेलुलर प्रक्रियाओं को विनियमित करने में ATL उपपरिवार के सदस्यों की उभरती भूमिका के अनुसार7, यह काम अच्छी तरह कार्यात्मक अध्ययन के लिए मजबूत उंमीदवारों की पहचान की सहायता कर सकते हैं, और अंततः आणविक शासी तंत्र को सुलझाना इस महत्वपूर्ण फसल के अपने पर्यावरण के लिए अनुकूलन ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. ख्यात ATL जीन परिवार के सदस्य (ओं) की पहचान

  1. साई विस्फोट वेब संस्करण
    1. ब्लास्ट वेब पेज13 खोलें और प्रोटीन विस्फोट अनुभाग पर क्लिक करें ।
    2. "क्वेरी अनुक्रम दर्ज करें" क्षेत्र में, प्रोटीन के एमिनो एसिड अनुक्रम दर्ज करें (यहां VIT_05s0077g01970) कि जांच के रूप में इस्तेमाल किया जाएगा के लिए अंय परिवार के सदस्यों की पहचान ।
      नोट: एक अच्छा प्रतिनिधि प्रोटीन का इस्तेमाल किया जाना चाहिए (एक प्रोटीन सभी महत्वपूर्ण विशेषताएं है कि परिवार की विशेषताएं प्रदर्शित) ।
    3. "खोज सेट चुनें" फ़ील्ड में, "संदर्भ प्रोटीन" डेटाबेस (refseq_protein) और ब्याज का जीव (V. द्राक्षा -टैक्सी्ड: 29760) का चयन करें ।
    4. क्षेत्र "कार्यक्रम चयन" में, साई विस्फोट एल्गोरिथ्म का चयन करें और विश्लेषण चलाने के लिए विस्फोट बटन क्लिक करते हैं ।
      नोट: "एल्गोरिथ्म पैरामीटर" यह कुछ उन्नत मापदंडों को समायोजित करने के लिए संभव है पर क्लिक करके (अधिकतम लक्ष्य अनुक्रम, स्कोरिंग मैट्रिक्स, साई विस्फोट दहलीज, आदि).
    5. पहला ब्लास्ट राउंड क्वेरी के साथ प्रासंगिक मेल प्रदर्शित करने वाले सभी दृश्यों को पुनर्प्राप्त करता है (इस प्रयोग में डिफ़ॉल्ट रूप से चयनित सीमा-से ऊपर का ई-मान ०.००५; ०.००१) । सभी प्रविष्टियों, जो स्पष्ट रूप से परीक्षा के तहत परिवार के लिए "साई के लिए चुनें विस्फोट" कॉलम में टिक पर क्लिक करके और दूसरा साई विस्फोट चलना के रूप में 1.1.4 कदम के रूप में विस्फोट बटन पर क्लिक करके नहीं है अचयनित ।
    6. नव पहचान दृश्यों पीले रंग में डाला जाता है । स्पष्ट रूप से गलत प्राप्त हिट अचयनित और आगे पुनरावृत्तियों को उजागर के रूप में चरण 1.1.5 में वर्णित है ।
    7. पुनरावृत्तियों के साथ जारी रखें जब तक कि एल्गोरिथ्म किसी भी प्रासंगिक प्रविष्टि नहीं ढूँढता है या यह अभिसरण तक पहुँचता है (कोई नई प्रविष्टियाँ नहीं मिलती हैं). आगे विश्लेषण के लिए ख्यात जीन परिवार के सदस्यों की सूची डाउनलोड करें । नेत्रहीन प्रत्येक पुनरावृत्ति में प्राप्त हिट निरीक्षण झूठी सकारात्मक की उपस्थिति से बचने के लिए ।
  2. साई ब्लास्ट स्टैंडअलोन संस्करण
    1. ब्लास्ट के होम पेज पर "डाउनलोड ब्लास्ट" बटन पर क्लिक करके ब्लास्ट के स्टैंडअलोन संस्करण को डाउनलोड करें13.
      नोट: स्वसंपूर्ण विस्फोट सॉफ्टवेयर वेब अंतरफलक के एक कमांड लाइन संस्करण से पहले वर्णित है । यह एक कस्टम स्थानीय या दूरदराज के डेटाबेस के खिलाफ साई विस्फोट खोज निष्पादित सक्षम बनाता है । इसके अलावा, यह एक पूर्व निर्धारित स्थिति विशिष्ट स्कोर मैट्रिक्स (PSSM) के साथ खोज की अनुमति देता है ।

2. साई विस्फोट की पहचान परिवार के सदस्यों के मैनुअल निरीक्षण

  1. एकाधिक संरेखण
    1. पहले एक फसता-स्वरूपित फ़ाइल में पहचाना एमिनो अम्लीय दृश्यों को इकट्ठा करने और कई संरेखण के साथ आगे बढ़ना करने के लिए मेगा सॉफ्टवेयर14 में इसे अपलोड करें ।
    2. मेगा सॉफ्टवेयर खोलें, "संरेखण" बटन पर क्लिक करें, क्लिक करें "संपादित करें/बनाने के लिए", क्लिक करें "एक नया संरेखण बनाएं", क्लिक करें "प्रोटीन" ।
    3. संरेखण मेनू से "संपादन" क्लिक करें और "फ़ाइल से अनुक्रम डालें" । पहले बनाई गई फसता फ़ाइल के लिए ब्राउज़ करें और सभी सर्व किए गए दृश्यों की अपलोड की पुष्टि ।
    4. संरेखण मेनू से "संरेखण" पर क्लिक करें और "मांसपेशियों से संरेखित". डिफ़ॉल्ट पैरामीटर, "गणना" बटन क्लिक करें, और एकाधिक संरेखण के पूरा होने के लिए प्रतीक्षा करेंउपयोग ।
    5. नेत्रहीन परिवार के सदस्यों की गलत भविष्यवाणी की बाहर करने के लिए एकाधिक संरेखण का निरीक्षण । विहित CxxC (13x) PxCxHxxHxxCxxxW (7x) CxxCW रूपांकन, (विशेष रूप से तीसरे cysteine से पहले की रेखा के अवशेषों की उपस्थिति) में, ATL परिवार के सदस्यों को परिभाषित करने के लिए आवश्यक कुंजी सुविधा है ।
  2. विशिष्ट लोगो का विश्लेषण
    1. परिवार के सदस्यों की निश्चित सूची भेजें (९६ दाखलता दृश्यों आवश्यकताओं को पूरा करने के लिए ATL माना जाता है) आकृति के लिए एकाधिक Em (MEME)15 को परिवार भर में संरक्षित रूपांकनों को परिभाषित करने के लिए ।
    2. मेम मुख पृष्ठ से, "meme" बटन पर क्लिक करें, और विशेष रूप से ब्याज की परिवार के बारे में जानकारी के साथ "डेटा सबमिशन फार्म" पूरा ।
    3. चर्चा ATL परिवार के सदस्यों के भीतर दो अपेक्षित रूपांकनों की उपस्थिति की पुष्टि करने के लिए MEME विश्लेषण का प्रयोग करें, अर्थात, अंगूठी-H2 और GLD रूपांकनों.
  3. वैकल्पिक रूप से, कदम २.१ और २.२ एक साथ bioinformatics सॉफ्टवेयर सुइट का उपयोग कर ( सामग्री की तालिकादेखें).
    1. अपलोड फसता फ़ाइल (चरण 2.1.1 देखें) सुइट में । चुनें "फ़ाइल" मेनू से, फिर "आयात" और क्लिक करें "से फ़ाइल" । ब्राउज़ फसता फ़ाइल और क्लिक करें "खोलो" ।
    2. सूची में सभी आयातित अनुक्रम का चयन करें और उपकरण पट्टी में "संरेखित/असेंबल" बटन पर क्लिक करें, तो "Pairwise एकाधिक संरेखण" क्लिक करें । चुनें "मांसपेशी संरेखण" और क्लिक करें "ठीक है" डिफ़ॉल्ट पैरामीटर का उपयोग कर संरेखण शुरू करने के लिए ।
    3. संरेखण के लोगो कल्पना करने के लिए, पर क्लिक करें "रेखांकन" → "विकल्प" और का चयन करें "अनुक्रम लोगो".

3. प्रोटीन शारीरिक मापदंडों और डोमेन का विश्लेषण

  1. सर्वे किए गए परिवार के सदस्यों के विभिन्न शारीरिक मापदंडों की परिभाषा के रूप में परिवार के एक व्यापक विवरण के लिए महत्वपूर्ण है, विशिष्ट वेब उपकरणों के लिए परिवार के सदस्यों की सूची प्रस्तुत करते हैं ।
    1. isoelectric बिंदु (pI) और आणविक भार (केडीए) के लिए, डिफ़ॉल्ट पैरामीटर के साथ Expasy वेबसाइट पर ProtParam उपकरण16 का उपयोग करें ।
    2. प्रोटीन उपसेलुलर स्थानीयकरण के लिए, विभिंन उपकरणों का उपयोग करें जैसे ngLOC v 1.0 डिफ़ॉल्ट सेटिंग्स के साथ17 के रूप में एक और अधिक विश्वसनीय भविष्यवाणी, डिफ़ॉल्ट सेटिंग्स के साथ targetP v 1.118 , और प्रोटीन prowler उपसेलुलर स्थानीयकरण v 1.219 ०.५ की संभावना के एक कट-ऑफ के साथ । फास्फारिलीकरण साइट्स के लिए, डिफ़ॉल्ट पैरामीटर के साथ MUsite v 1.0 वेब उपकरण20 का उपयोग करें ।
  2. परिवार के सदस्यों में अतिरिक्त प्रोटीन डोमेन की जांच ।
    1. Pfam डेटाबेस वेबपेज21खोलें, "अनुक्रम खोज" उपकरण का चयन करें, क्वेरी बॉक्स में प्रोटीन अनुक्रम सबमिट करें, और विश्लेषण को चलाने के लिए "जाएं" क्लिक करते हैं ।
      नोट: प्रत्येक प्रोटीन अनुक्रम व्यक्तिगत रूप से विश्लेषण किया है । एक डिफ़ॉल्ट सेटिंग में १.० के ई मूल्य महत्वपूर्ण और गैर महत्वपूर्ण हिट के बीच भेदभाव की अनुमति देता है ।
    2. ख्यात transmembrane क्षेत्रों की उपस्थिति की जांच करने के लिए जैविक अनुक्रम विश्लेषण के लिए केंद्र से TMHMM सर्वर22 खोलें ।
सभी प्रोटीन अनुक्रम एक साथ चिपकाएं क्वेरी बॉक्स में (या वैकल्पिक रूप से फसता प्रारूप में सभी प्रोटीन दृश्यों सहित एक पाठ फ़ाइल अपलोड) और विश्लेषण चलाने के लिए "Submit" पर क्लिक करें ।
  • विश्लेषण प्रोटीन कमी transmembrane डोमेन की भविष्यवाणी की, TMHMM के अनुसार (कदम 3.2.2), ProtScale उपकरण के साथ ख्यात hydrophobic क्षेत्रों की पहचान । ProtScale वेबपेज23खोलें । प्रत्येक प्रोटीन अनुक्रम को क्वेरी बॉक्स में चिपकाएँ और "Hphob का चयन करें. /Kyte & #38; Doolittle "एमिनो एसिड स्केल के रूप में । विश्लेषण चलाने के लिए "सबमिट" क्लिक करें ।
  • 4. गुणसूत्र वितरण, दोहराव, और एक्सॉन-intron संगठन

    1. चर्चा जीनोम CRIBI बायोटेक केंद्र वेबसाइट24से प्राप्त जानकारी के आधार पर गुणसूत्रों पर ATL परिवार के सदस्यों को मैप ।
      1. ब्राउज़ करें PhenoGram वेबसाइट मुखपृष्ठ25। "इनपुट फ़ाइल" एक टैब के रूप में लिखें-गुणसूत्रों पर मैप किया जा करने के लिए जीन की विशिष्ट सुविधाओं के साथ सीमांकित पाठ फ़ाइल, पथ के बाद प्रदान की गई फ़ाइल के संकलन के बारे में विस्तृत दिशा निर्देशों और उदाहरणों के अनुसार "Phenogram" → " प्रलेखन "→" विकल्प "→" इनपुट फ़ाइल "।
      2. काम का "शीर्षक" लिखिए. तैयार किए जाने वाले जीनोम का चयन करें. इस तरह की दाखलता जीनोम के रूप में सॉफ्टवेयर में लागू नहीं जीनोम के लिए, ड्रॉप डाउन मेनू में "अंय" का चयन करें । के दिशा निर्देशों और उदाहरणों के अनुसार जीनोम फ़ाइल लिखें, पथ "Phenogram" → "प्रलेखन" → "विकल्प" → "जीनोम" के बाद, और इसे अपलोड करें ।
      3. "Phenotype रिक्ति", "Phenotype रंग", "छवि स्वरूप" के डिफ़ॉल्ट पैरामीटर्स का उपयोग करें, या संबंधित मेनू में विकल्प का चयन करें, और गुणसूत्रों पर जीन का दृश्य प्राप्त करने के लिए "साजिश" पर क्लिक करे ।
    2. MCScanX सॉफ़्टवेयर26का उपयोग करके परिवार के सदस्यों की दोहराव स्थिति को परिभाषित करें ।
      1. डाउनलोड और एक स्थानीय मशीन चल कमांड लाइंस 1 (अनुपूरक फ़ाइल 1) पर MCscanX की एक प्रति खोलना । MCscanX फ़ोल्डर दर्ज करें और आवश्यक निष्पादन योग्य चल रहे आदेश पंक्तियां 2 (अनुपूरक फ़ाइल 1) बनाएं ।
        नोट: MCscanX की स्थापना के लिए कुछ लिनक्स ६४ बिट एक समारोह chdir के बारे में समस्या के कारण मशीनों पर विफल जाना जाता है । आदेश का निष्पादन करने पर इस फ़ंक्शन से संबंधित कोई त्रुटि संदेश दिया जाता है, तो आदेश पंक्तियाँ 3 (अनुपूरक फ़ाइल 1) चलाया जाना चाहिए और आदेश "बनाएं" बाद में प्रयास किया जाना चाहिए ।
      2. डाउनलोड V. द्राक्षा प्रोटीन और एनोटेशन फ़ाइल कमांड लाइंस 4 (अनुपूरक फ़ाइल 1) चल रहा है ।
        नोट: चर्चा एनोटेशन फ़ाइल को ज़िपित और एकल गुणसूत्रों जानकारी बिल्ली एक अद्वितीय फ़ाइल में कमांड लाइंस 5 (अनुपूरक फ़ाइल 1) चल रहा द्वारा की जरूरत है ।
      3. दोनों क्वेरी और विषय के रूप में V. द्राक्षा प्रोटीन फ़ाइल का उपयोग कर एक "सभी बनाम सभी" blastp खोज चलाएं ।
      4. V. द्राक्षा प्रोटीन फ़ाइल कमांड लाइंस 6 (अनुपूरक फ़ाइल 1) चलाने का उपयोग कर एक खोज विस्फोट डेटाबेस बनाएं । blastp खोज करने से पहले बनाए गए डेटाबेस के विरुद्ध कोई क्वेरी के रूप में V. द्राक्षा प्रोटीन फ़ाइल का उपयोग कर आदेश पंक्तियां 7 (अनुपूरक फ़ाइल 1) को चला कर ।
      5. एनोटेशन फ़ाइल MCScanX के लिए एक उपयुक्त स्वरूप में कनवर्ट करें । चलाएं कमांड लाइंस 8 (अनुपूरक फ़ाइल 1) कस्टम perl स्क्रिप्ट parseMSCanXgff.pl डाउनलोड करने के लिए । विश्लेषण चल रहा है आदेश पंक्तियाँ 9 (अनुपूरक फ़ाइल 1) निष्पादित करें ।
        नोट: एक फ़ाइल विटिस. gff उत्पन्न होता है जो निम्न स्वरूप में जीन निर्देशांक रखता है:
        sp # जीन शुरू स्थिति समाप्त होने की स्थिति
        जहां "sp" प्रजातियों के लिए एक दो पत्र कोड है (दाखलता के लिए Vv) जबकि "#" पाड़ का नाम है । ध्यान दें कि प्रदान की कस्टम पर्ल स्क्रिप्ट सबसे रूपांतरण के लिए उपयुक्त है, हालांकि कुछ कोड संशोधन कुछ विशिष्ट उपलब्ध एनोटेशन फ़ाइल में उपलब्ध कराई गई जानकारी की विविधता के कारण मामलों में आवश्यक हो सकता है ।
      6. लॉंच MCScanX रनिंग कमांड लाइंस 10 (अनुपूरक फ़ाइल 1) ।
        नोट: "विटिस" दोनों एनोटेशन और विस्फोट उत्पादन फ़ाइल के उपसर्ग है । यह सॉफ्टवेयर चलाने के लिए एक अनिवार्य आवश्यकता का प्रतिनिधित्व करता है ।
      7. विश्लेषण MCScanX परिणाम । MCScanX एक पाठ फ़ाइल "विटिस. collinearity" है, जो collinear ब्लॉकों में पैदा करता है । इस तरह के एक फ़ाइल किसी भी पाठ संपादक द्वारा निरीक्षण किया जा सकता है (उदाहरण के उत्पादन 1 अनुपूरक फ़ाइल 1देखें).
        नोट: एक "mcscaxOutput. html" निर्देशिका में html फ़ाइलें प्रत्येक संदर्भ गुणसूत्र के विरुद्ध collinear ब्लॉक के एकाधिक संरेखण विशेषता है जो उत्पन्न होता है । इन फ़ाइलों को एक वेब ब्राउज़र के माध्यम से निरीक्षण किया जा सकता है ।
      8. आदेश लाइंस 11 (अनुपूरक फ़ाइल 1) चल रहे गुणसूत्रों में उनके रिश्तेदार पदों के आधार पर paralogous जीन वर्गीकृत ।
        नोट: Paralogous जीन वर्गीकरण अनुपूरक तालिका IIमें वर्णित है । जनरेट किया गया आउटपुट फ़ाइल "विटिस. gene_type" एक साधारण टैब सीमांकित स्वरूप के साथ सभी मूल जानकारी शामिल है ।
      9. आकलन करने के लिए संवर्धन विश्लेषण प्रदर्शन कि जीन परिवार प्रचलित एक विशेष कमांड लाइंस 12 (अनुपूरक फ़ाइल 1) चल रहे तंत्र द्वारा उत्पंन किया है ।
        नोट: फ़ाइल "विटिस. gene_type" चरण 4.2.8 पर जनरेट किया गया है, जबकि फ़ाइल "gene_family_file" एक पंक्ति पाठ फ़ाइल का प्रतिनिधित्व करता है जिसमें परिवार का नाम (जैसे, ATL_genes) परिवार से संबंधित सभी जीनों के लिए लोकस नामों के बाद किया जाता है एक टैब से अलग किया । संवर्धन के लिए एप्लाइड सांख्यिकीय परीक्षण एक फिशर सटीक परीक्षण और p-विभिंन मूल के मूल्यों फ़ाइल में संग्रहित कर रहे है "outputFile. txt" ।
    3. जीवन के इंटरैक्टिव पेड़ (iTOL)27, प्रदर्शन, एनोटेशन के लिए एक ऑन लाइन उपकरण का उपयोग कर जीन के एक्सॉन-intron संगठन कल्पना, और वंशावली पेड़ों के प्रबंधन ।
      1. iTOL वेबसाइट के "अपलोड" अनुभाग में एक वंशावली ट्री अपलोड करें । पेड़ के नीचे धारा 5 के अनुसार बनाया गया है । प्रत्येक परिवार के सदस्य जीन के लिए, चर्चा जीनोम के V1 एनोटेशन से जीन संरचना भविष्यवाणी पुनः प्राप्त (CRIBI ऊपर उद्धृत वेबसाइट) । ख्यात exons, introns, और अनअनुवादित क्षेत्रों (UTRs) की लंबाई (बीपी में) की गणना करें ।
      2. एक्सॉन-intron प्रतिमान के ग्राफ़िकल विज़ुअलाइज़ेशन के लिए "प्रोटीन डोमेन" डेटासेट का उपयोग करें.
    पथ के बाद प्रदान विनिर्देशों के अनुसार एक सादा पाठ फ़ाइल लिखें "मदद" → "मदद पृष्ठों" → "डेटासेट प्रकार" → "iTOL वेबसाइट में प्रोटीन डोमेन"27। "प्रोटीन डोमेन" डेटासेट का उपयोग करते हुए, "आयत (RE)" और "आयत गैप (GP)" आकार क्रमश: एक्सॉन और UTRs का प्रतिनिधित्व करते हैं ।

    5. वंशावली विश्लेषण और नामकरण

    1. एक उच्च गुणवत्ता वंशावली ट्री के निर्माण के माध्यम से ATL परिवार के सदस्यों के बीच संबंधों का विश्लेषण और एक परिवार के नामकरण की परिभाषा ।
      1. एक चर्चा जीन परिवार के लिए, चर्चा सुपर नामकरण समिति8द्वारा स्थापित नियमों का पालन करें ।
      2. थालियाना ATL अनुक्रम, चर्चा जीन नामकरण8, UniProt डेटाबेस28 से के लिए संदर्भ के रूप में आवश्यक पुनर्प्राप्त करें ।
      3. वंशावली विश्लेषण में शामिल होने के लिए चर्चा और ए. थालियाना जीन परिवार के सदस्यों के सभी न्यूक्लियोटाइड दृश्यों सहित एक फसता फ़ाइल लिखें । न्यूक्लियोटाइड अनुक्रम परिवार के सदस्यों के बीच परिवर्तनशीलता की अधिकतम अनुमति (प्रोटीन दृश्यों की तुलना में) ।
    2. वंशावली ट्री
      नोट: Phylogeny.fr 29 पाइपलाइन के उपयोग के लिए एक उच्च गुणवत्ता वंशावली पेड़ पाने के लिए सिफारिश की है, लेकिन अनिवार्य नहीं है ।
      1. Phylogeny.fr मुखपृष्ठ29ब्राउज़ करें, और "फाइलोजेनी विश्लेषण" पाइपलाइन का चयन करें ।
        नोट: "एक क्लिक" अधिकांश मामलों में उपयुक्त है, लेकिन यदि आवश्यक हो तो विशिष्ट उंनत सेटिंग्स ("उंनत") या यहां तक कि एक पूरी तरह से अनुकूलित विश्लेषण ("a la कार्टे"; चरण 5.2.5 देखें) का चयन करना संभव है ।
      2. "विश्लेषण का नाम" लिखें, पहले बनाई गई फसता फ़ाइल अपलोड करें (चरण 5.2.1, और विश्लेषण चलाने के लिए "Submit" क्लिक करे ।
      3. वैकल्पिक रूप से, यदि प्रक्रिया ऊपर वर्णित (चरण 5.2.1, 5.2.2) एक त्रुटि संदेश में परिणाम, फाइलोजेनी सुइट पाइपलाइन के प्रत्येक चरण को व्यक्तिगत रूप से, पूर्ण निंनानुसार है ।
        1. स्नायु सॉफ्टवेयर मुखपृष्ठ30से, "चरण 1" में फसता फ़ाइल अपलोड करें, "पियरसन/फसता" के रूप में "आउटपुट स्वरूप" में "चरण 2" का चयन करें, और क्वेरी दृश्यों को संरेखित करने के लिए "चरण 3" में "Submit" क्लिक करे ।
        2. "डाउनलोड संरेखण फ़ाइल" पर क्लिक करें और आगे के चरणों के लिए फसता फ़ाइल के रूप में सहेजें ।
        3. Gblocks सर्वर उपकरण31का उपयोग करके खराब संरेखित स्थितियों को समाप्त करने के लिए संरेखण फसता फ़ाइल संसाधित करें । संरेखण फसता फ़ाइल अपलोड करें, "डीएनए" "अनुक्रम के प्रकार" के रूप में चुनें और stringency के विकल्प (ओं) को चुना है कि सबसे अच्छा विश्लेषण के साथ फिट बैठता है (उदा., चर्चा ATL जीन परिवार के लिए "कम कड़े चयन" के लिए प्रस्तावित सभी तीन विकल्पों का चयन करें क्योंकि उच्च अनुक्रम विचलन की) । विश्लेषण चलाने के लिए "ब्लॉक्स प्राप्त करें" पर क्लिक करे.
        4. आउटपुट पृष्ठ के निचले भाग पर "परिणामी संरेखण" क्लिक करें और परिणामों को एक नई फसता फ़ाइल के रूप में सहेजें ।
        5. Phylogeny.fr मुखपृष्ठ29से, "फाइलोजेनी विश्लेषण" पाइपलाइन के रूप में "A la कार्टे" चुनें । फिर, अचयनित "एकाधिक संरेखण" और "संरेखण उपचारात्मक". "कार्यप्रवाह बनाएं" पर क्लिक करें, Gblocks-उपचारात्मक फसता फ़ाइल (step 5.2.5.4) अपलोड करे, "सेटिंग" में डिफ़ॉल्ट पैरामीटर के साथ "Bootstrapping कार्यविधि" चुनें, और विश्लेषण चलाने के लिए "Submit" पर क्लिक करें ।
      4. खराब समर्थित शाखाओं को संक्षिप्त करें (अर्थात, बूटस्ट्रैप values & #60; ७०%) "शाखाएं संक्षिप्त" चुनें और क्रिया "अनुभाग में क्लिक करके और अंतिम परिणाम Newick स्वरूप में आगे विश्लेषण करने के लिए डाउनलोड करें ।
    3. फाइलोजेनी के आधार पर एक जीन नाम निरुपित ।
      1. वंशावली पेड़ की समीक्षा के लिए यह iTOL सुइट में अपलोड करके पेड़ की संरचना की विश्वसनीयता का मूल्यांकन ऊपर उद्धृत (धारा ४.३) ।
      2. प्रत्येक परिवार के सदस्य को मैंयुअल रूप से एक जीन नाम निरुपित । एक-से-एक orthologues के मामले में, Arabidopsis-like नाम (उदा., AtATL3 → VviATL3) असाइन करें । चर्चा जीन अंतर (दो या अधिक) एक ही वंशावली दूरी के साथ एक ही Arabidopsis homolog से व्युत्पंन संख्या, या पत्र का उपयोग कर अगर Arabidopsis जीन एक संख्या के साथ समाप्त होताहै (जैसे, AtATL23 → VviATL23a, VviATL23b) ।
      3. एक-से-कई या कई-से-कई orthologues के मामले में, Arabidopsisनाम (यहां, "ATL") से बना एक नया जीन नाम असाइन करें, जो पहले से ही दोनों V. द्राक्षा और Arabidopsis के लिए उपयोग की गई उच्चतम संख्या से अधिक संख्या के साथ युग्मित है (उदा., VviATL83).
      4. वंशावली वृक्ष के नीचे से ऊपर की ओर उतरते हुए नव परिभाषित परिवार का नामकरण पूर्ण करें ।

    6. चर्चा अंग और मंच अभिव्यक्ति रूपरेखा

    1. परिवार के सदस्यों के लिए कार्य डेटा मैट्रिक्स युक्त अभिव्यक्ति डेटा जनरेट करें ।
      1. डाउनलोड V. द्राक्षा cv. Corvina जीन एक्सप्रेशन एटलस datamatrix लिंक से ResearchGate प्लेटफार्म३२पर वितरित । इस फ़ाइल में निंन चरणों में उपयोग करने के लिए RMA सामान्यीकृत व्यंजक मान हैं ।
      2. एटलस datamatrix से प्रत्येक परिवार के जीन के लिए अभिव्यक्ति मूल्यों को निकालने और एक "काम datamatrix" एटलस datamatrix के रूप में एक ही हेडर पंक्ति युक्त लिखें । "कार्य datamatrix" एक टैब-सीमांकित पाठ फ़ाइल के रूप में सहेजें ।
    2. बहु प्रयोग व्यूअर (MeV) सॉफ़्टवेयर का उपयोग करते हुए पदानुक्रमित द्वि-संकुल विश्लेषण निष्पादित करें ।
      1. MeV सॉफ़्टवेयर३३डाउनलोड और स्थापित करें ।
      2. "कार्य datamatrix" (चरण 6.1.2) पथ "फ़ाइल" → "लोड डेटा" → "ब्राउज़ करें" और पाठ फ़ाइल का चयन करने के बाद अपलोड करें । "एकल-रंग सरणी" का चयन करें और स्वचालित एनोटेशन प्रदान नहीं किया गया है, जब "लोड एनोटेशन" से टिक निकालें । व्यंजक तालिका पूर्वावलोकन के ऊपरी-बाएं व्यंजक मान का चयन करें और "लोड करें" बटन क्लिक करे ।
      3. ("डेटा समायोजित करें" → "लॉग रूपांतरण" → "Log2 रूपांतरण") और जीन/पंक्ति मानकीकरण ("समायोजित डेटा" → "जीन/पंक्ति समायोजन" → "माध्य केंद्र जीन/") डेटा को समायोजित Log2 रूपांतरण लागू करने के लिए । उचित पैमाने सीमा सेट ("प्रदर्शन" → "सेट रंग पैमाने सीमा") ।
      4. पदानुक्रम क्लस्टरिंग पथ "विश्लेषण" → "clustering" → "HCL" के बाद परिकलित करें ।
    "अनुकूलन जीन पत्ती आदेश" का चयन करें और "नमूना पत्ती आदेश" अनुकूलन क्षेत्र आदेश "में", "दूरी मैट्रिक्स चयन" क्षेत्र में "पियरसन सहसंबंध", और "लिंकेज विधि चयन" क्षेत्र में "औसत लिंकेज clustering" । उसके बाद, विश्लेषण को चलाने के लिए "ठीक" क्लिक करें ।
  • विंडो के बाएँ फलक पर "विश्लेषण परिणाम" → "HCL" मेनू में परिणाम देखें. "फ़ाइल" मेनू में "छवि सहेजें" क्लिक करके हीट मैप निर्यात करें ।
  • 7. अभिव्यक्ति बायोटिक और अजैव तनाव के जवाब में profiling

    1. GSE प्रवेश आईडी संबंधित प्रकाशनों और अध्ययन बायोटिक और चर्चा पर अजैव तनाव की जांच से प्राप्त के साथ दोहराएं चरण ६.१ । उदाहरण के लिए, चर्चा कवक रोगज़नक़ के साथ संक्रमित जामुन की transcriptome प्रोफ़ाइल प्रदान प्रयोगों Botrytis cinerea का उपयोग कर NimbleGen अंगूर पूरे-जीनोम microarray GSE के GSE52586 आईडी के साथ ब्राउज़ किया जा सकता है । चरण 6.1.1 और 6.1.2 दोहराएं ।
    2. खोज NCBI अनुक्रम SRA/(जैसे, SRP055458 या PRJNA275778 के लिए "चर्चा पुष्प छायांकन" प्रयोगों) के साथ३४ पुरालेख पढ़ता है और सभी संबंधित कच्चे अनुक्रम डाउनलोड पढ़ता है । आरएनए-seq डेटासेट कई विभिन्न अध्ययनों से निरंतरता के लिए एक एकल पाइपलाइन का उपयोग कर संसाधित कर रहे हैं.
      1. संक्षेप में, ट्रिम कच्चे अनुक्रम FASTQ (एकल और जोड़ी अंत) पढ़ता है और Trimmomatic३५के साथ फ़िल्टर गुणवत्ता । 20 और ४०, क्रमशः और सभी पैरामीटर डिफ़ॉल्ट के एक AVGQUAL और MINLEN फ़िल्टर का उपयोग करें ।
      2. सूचकांक 12X चर्चा संदर्भ जीनोम1 Bowtie2३६का उपयोग कर । bowtie2 कमांड चलाने से पहले 12X चर्चा संदर्भ जीनोम (जैसे, bowtie2-निर्माण) डाउनलोड करें ।
      3. गणना मैट्रिक्स तालिकाओं के साथ htseq-count३७ का उपयोग कर चर्चा V1 जीन मॉडल एनोटेशन (GFF/GTF) फ़ाइल प्राप्त करें ।
    3. अंतर जीन अभिव्यक्ति (पुन) विश्लेषण RMA-सामान्यीकृत मैट्रिक्स और DESeq2 ४० पुस्तकालयों के लिए limma३९ पुस्तकालयों के साथ की गणना मैट्रिक्स तालिकाओं 7.1.1 और 7.2.1, क्रमशः से प्राप्त करने के लिए के साथ अनुसंधान में प्रदर्शन ।
      1. एक मानक "दो समूह" तुलना करें (यानी, "उपचार"/"नियंत्रण") । सुनिश्चित करें कि डिज़ाइन मैट्रिक्स/समूहीकरण "नियंत्रण" और "उपचार" शर्तों को ठीक से निर्दिष्ट हैं ।
        नोट: microarray विभेदक अभिव्यक्ति विश्लेषण के लिए एक ठेठ डिजाइन (GSE52586) EL-३३ जामुन के खिलाफ नियंत्रण (स्वस्थ) के खिलाफ एक ही विकास के स्तर पर Botrytis cinerea से संक्रमित बेरीज limma रनिंग कमांड लाइंस के साथ 13 अनुपूरक फ़ाइल 1में दिखाया गया है । आरएनए के लिए एक ठेठ डिजाइन-seq विभेदक अभिव्यक्ति विश्लेषण (SRP055458 या PRJNA275778) फूल की तुलना करने के लिए (कैप गिरने के बाद 7 दिनों में) नियंत्रण के खिलाफ छाया उपचार के तहत DESeq2 चल रहे आदेश लाइंस 14 में दिखाया गया है अनुपूरक फ़ाइल 1 .
      2. प्रत्येक कंट्रास्ट में विभेदक व्यक्त जीन (डिग्री) की सूचियां प्राप्त करें, limmaके लिए, फ़ंक्शन lmFit ()का उपयोग करते हैं, जिसके बाद ईबे (), और फिर topTable() फ़ंक्शंस द्वारा, जबकि DESeq2के लिए, का उपयोग करें DESeqDataSetFromMatrix (), DESeq (), और परिणाम () फ़ंक्शंस । नीचे, एक ठेठ कार्यप्रवाह का पालन किया जाना है ।
        1. microarray अवकलन व्यंजक विश्लेषण के लिए, आदेश पंक्तियाँ 15 (अनुपूरक फ़ाइल 1) देखें । आरएनए-seq विभेदक अभिव्यक्ति विश्लेषण के लिए आदेश पंक्तियाँ 16 (अनुपूरक फ़ाइल 1) देखें । अन्य उपयुक्त डिज़ाइन स्कीमा के साथ अन्य सभी विरोधाभासों के लिए उपरोक्त चरण दोहराएँ (चरण 7.3.1 में उदाहरण देखें)
    4. DEGs जनरेट की गई सूचियों से, सभी पंक्तियाँ ATL V1 प्रवेश करने के लिए संगत नहीं है, जो log2 फ़ोल्ड परिवर्तन (उपचार/नियंत्रण) वाले स्तंभों को बनाए रखने निकालें & #62; | ०.५ | और समायोजित p-मान (एफडीआर) & #60; ०.०५, और उंहें एक मैट्रिक्स तालिका में मर्ज करें, चाहे एक अध्ययन "अजैव" या "बायोटिक/रोगज़नक़ संपर्क" compendia में आता है ।
    5. पदानुक्रम संकुल heatmaps (अजैव और बायोटिक compendia) के निर्माण में आर पुस्तकालयों gplotsका उपयोग कर ।
      नोट: heatmap. 2 फ़ंक्शन को कॉल करने से संबंधित मैट्रिक्स तालिकाओं से पंक्ति dendrograms के साथ heatmap का निर्माण होता है । cellnote फ़ंक्शन का उपयोग करते हुए अतिरिक्त तर्क अंतर व्यक्त करने में मदद करता है (log2FC & #62; ०.५, एफडीआर & #60; ०.०५) ATL जीन एक * प्रतीक द्वारा प्रयोगात्मक शर्तों की एक बड़ी रेंज में प्रत्येक तुलना में । सामान्य कार्यप्रवाह R चल रहा है आदेश पंक्तियाँ 17 में लागू करें (अनुपूरक फ़ाइल 1) या वैकल्पिक रूप से, MeV सॉफ़्टवेयर का उपयोग heatmaps का निर्माण करने के लिए 6.2.5 करने के लिए चरण 6.2.2 दोहराएँ ।

    8. Paralogous अनुक्रम विचलन और जीन सह अभिव्यक्ति के बीच संबंधों का विश्लेषण

    1. pairwise समानता युक्त मैट्रिक्स का निर्माण । समानता मैट्रिक्स के तत्वों अनुक्रम pairwise प्रोटीन संरेखण से गणना समानता के मूल्यों रहे हैं ।
      1. pairwise अनुक्रम संरेखण बनाने और पाठ फ़ाइल के रूप में सहेजने के लिए डिफ़ॉल्ट सेटिंग्स के साथ उभरा सुई वेब सर्वर४१ का उपयोग करें । आउटपुट पाठ फ़ाइल खोलें और सभी टिप्पणी पंक्तियाँ निकालें, एक साथ स्तंभ और पंक्ति नाम के साथ "similarityTable. txt" नामक फ़ाइल जनरेट करने के लिए ।
        नोट: ऐसी तालिका प्रत्येक ATL जीन pairwise संरेखण में से प्रत्येक में परिकलित समानता मान रिपोर्टिंग के लिए एक पंक्ति सुविधाएँ । पंक्तियों और स्तंभों में loci का क्रम एक ही है जिससे विकर्ण मानों के संबंध में एक सममित मैट्रिक्स उत्पन्न होता है.
    2. मैट्रिक्स पियरसन सहसंबंध गुणांक की गणना करके सह-अभिव्यक्ति डेटा के साथ निर्माण । निंन प्रक्रिया R और perl मॉड्यूल PDL की आवश्यकता है ।
      1. ९६ ATL जीन एक टर्मिनल के भीतर कमांड लाइंस 18 (अनुपूरक फ़ाइल 1) चल रहे के लिए अभिव्यक्ति मान डाउनलोड करें । आदेश पंक्तियाँ 19 (अनुपूरक फ़ाइल 1) चला कर डाउनलोड किया जा सकता जो किसी कस्टम perl स्क्रिप्ट का उपयोग कर एक सह-व्यंजक विश्लेषण निष्पादित करें । ऐसी स्क्रिप्ट पहले रिपोर्ट की गई के रूप में ATL loci के जोड़ों के बीच सहसंबंध गुणांक पियरसन की गणना करेगा ।
      2. लॉंच स्क्रिप्ट चल रहे आदेश पंक्तियां 20 (अनुपूरक फ़ाइल 1) और आउटपुट निर्देशों का पालन करें ।
    स्क्रिप्ट एक आउटपुट फ़ाइल का उत्पादन होगा (अर्थात् "coexpressionTable. txt") एक सह अभिव्यक्ति मैट्रिक्स के समान लोकस नाम क्रम की विशेषता मैट्रिक्स ८.१ कदम में प्राप्त (यह आदेश Mantel परीक्षण चलाने के लिए आवश्यक है, नीचे देखें) ।
  • ८.१ और ८.२ चरणों में प्राप्त डेटा मैट्रिक्स के बीच एक Mantel परीक्षण निष्पादित करें । r वातावरण में प्रवेश करने के बाद (चलाएँ आदेश "R" से एक टर्मिनल के भीतर), निम्न आदेश का उपयोग कर ade4 लायब्रेरी लोड: लाइब्रेरी (ade4)
    1. दो डेटा मैट्रिक्स लोड हो रहा है और आदेश पंक्तियाँ 21 (अनुपूरक फ़ाइल 1), "nrep" परिवर्तन की संख्या का प्रतिनिधित्व करने के साथ चल रहे आँकड़ों को चलाने के द्वारा Mantel परीक्षण चलाएँ । परीक्षण इन मैट्रिक्स के तत्वों के बीच सहसंबंध की गणना, मैट्रिक्स permuting और फिर एक ही परीक्षण आँकड़ों की गणना फिर से होते हैं ।
      नोट: सांख्यिकीय परीक्षण के सभी प्राप्त मानों का उपयोग सांख्यिकीय परीक्षण के संदर्भ वितरण के लिए किया जाता है, जिसका उपयोग p-मान को महत्व के लिए जांच करने के लिए परिकलित करने के लिए किया जाएगा । परिवर्तन की संख्या वह शुद्धता निर्धारित करती है जिसके साथ p-मान प्राप्त किया जा सकता है ।
  • Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    VIT_05s0077g01970 जीन, एक BLASTp खोज के माध्यम से सबसे ए. थालियाना ATL2 (At3g16720) के लिए इसी तरह के रूप में पहचान की, चर्चा जीनोम में ATL परिवार के सदस्यों के सर्वेक्षण के लिए जांच के रूप में इस्तेमाल किया गया था (वी द्राक्षा cv Pinot शिद्दत से PN40024) । साई विस्फोट विश्लेषण कुछ दाखलताओं ख्यात जीन की एक सूची खुलासा करने के बाद एकाग्र-चर्चा ATL जीन परिवार (चित्र 1a) । प्रत्येक उंमीदवार के लिए विहित रिंग-H2 डोमेन की उपस्थिति विश्लेषण (चित्र 1b) में पहचानी गई सभी प्रविष्टियों की मांसपेशी संरेखण के दृश्य निरीक्षण द्वारा मूल्यांकित की गई थी । केवल उन जीनों युक्त सही ढंग से अंतरिक्ष संरक्षित अमीनो एसिड, दो histidine अवशेषों, साथ ही साथ तीसरे cysteine से पहले की रेखा अवशेषों ATLs के रूप में मूल ATL परिभाषा के अनुसार माना जाता था Arabidopsisमें5। ९६ दाखलता की कुल जीन आवश्यकताओं को पूरा और आगे लक्षण वर्णन के लिए विचार किया गया । प्रत्येक ATL परिवार के सदस्य जीन और इसी इनकोडिंग प्रोटीन की विशिष्ट विशेषताओं को परिभाषित करने के लिए विश्लेषण किया गया था, यानी, अंगूठी के अलावा अन्य ज्ञात डोमेन (ओं) की उपस्थिति-H2, transmembrane या hydrophobic अमीर क्षेत्रों, उपसेलुलर स्थानीयकरण, और ख्यात फास्फारिलीकरण साइट्स (तालिका 1 और तालिका 2) ।

    Figure 1
    चित्रा 1: साई विस्फोट सर्वेक्षण और ख्यात चर्चा ATLs के संरेखण । () चारा के रूप में प्रोटीन अनुक्रम VIT_05s0077g01970 का उपयोग कर पहली साई-विस्फोट चलना खोज के शीर्ष 10 हिट के स्क्रीनशॉट । () ९६ चयनित दाखलता ख्यात ATLs के संरेखण का हिस्सा अपनी अंगूठी दिखा-H2 डोमेन और इसी लोगो आणविक जीवविज्ञान के एक सुइट का उपयोग कर प्राप्त ( सामग्री की तालिकादेखें) । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त ।कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

    नाम जीन आईडी जीन की लंबाई (बीपी) Intron संख्या UniProt आयडी प्रोटीन लंबाई (एए) रिंग-H2 आकृति TM/एच डोमेन संख्या अंय डोमेन
    VviATL3 VIT_09s0002g00220 १२४५ 0 F6HXK6 ३०४ pxc 1
    VviATL4 [VviRHX1A] VIT_15s0021g00890 १८२७ 3 D7SM36 २०३ pxc 0
    VviATL18 VIT_11s0118g00780 १११३ 2 F6HCI8 १९३ पीसी 0
    VviATL23a VIT_18s0001g01060 ९३५ 0 F6H0E4 ११४ pxc ०.५
    VviATL23b VIT_18s0001g01050 ३९९ 0 E0CQX3 १३२ pxc 1
    VviATL24 VIT_17s0000g06460 ४४६६ 4 D7SI89 २१७ pxc 1
    VviATL27 VIT_00s0264g00020 २५५४ 4 D7T1R5 २३५ pxc 1
    VviATL43 VIT_11s0052g00530 १५७६ 2 D7SQD9 ४५७ pxc 3
    VviATL54a VIT_18s0001g06640 ३२२१ 1 F6H0Y5 ४०५ pxc 1
    VviATL54b VIT_03s0017g00670 २७७४ 1 F6HTI0 ४२७ pxc 1
    VviATL55 [VviRING1] VIT_07s0191g00230 १८४४ 0 F6HRP9 ३७२ pxc 1
    VviATL63 VIT_06s0004g06930 ८०४ 0 D7SJU6 २६७ pxc 1
    VviATL65 VIT_03s0063g01890 २०६८ 0 F6HQI8 ३९६ pxc 1
    VviATL82 VIT_01s0026g02540 ८२० 0 F6HPQ9 २३३ पीसी ०.५
    VviATL83 VIT_17s0000g08400 १८८७ 0 F6GSQ4 १४३ पीसी 0
    VviATL84 VIT_06s0004g00120 १८५३ 0 F6GUP5 ३६८ पीसी ०.५ zf-RING_3
    VviATL85 VIT_12s0034g01400 ७८६ 0 F6H965 २६१ पीसी ०.५
    VviATL86 VIT_12s0034g01390 १४३४ 1 D7T016 ४५१ पीसी ०.५
    VviATL87 VIT_18s0001g03270 १००२ 0 F6H0T2 ३३३ पीसी ०.५ zf-RING_3
    VviATL88 VIT_08s0040g00590 १३२० 0 F6HQR2 ३१४ पीसी 0 zf-RING_3

    तालिका 1: पहले 20 VviATL जीन और इसी प्रोटीन के अनुक्रम विशेषताओं । TM: transmembrane; ज: hydrophobic; ०.५ एक या अधिक hydrophobic क्षेत्रों की उपस्थिति को इंगित करता है । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त ।

    Table 2
    तालिका 2: विवरण पहले 20 पर VviATL जीन में स्थिति V. द्राक्षा जीनोम, दोहराव राज्य, और ATL प्रोटीन फिजिको-रासायनिक विशेषताओं और स्थान । () Musite द्वारा अनुमानित फास्फारिलीकरण स्थलों की संख्या; (b) समान भविष्यवाणियों के साथ कम से प्राप्त दो सॉफ़्टवेयर बोल्ड में हाइलाइट किए गए हैं; ngLOC डिफ़ॉल्ट सेटिंग्स के साथ प्रयोग किया जाता था, जबकि TargetP v 1.1 और प्रोटीन Prowler उपसेलुलर स्थानीयकरण ०.५ की संभावना के एक कट-ऑफ के साथ इस्तेमाल किया गया । NUC, नाभिक; एमआईटी, mitochondria; CHL, chloroplast; पीएलए, प्लाज्मा झिल्ली; एस, स्रावी मार्ग (एक संकेत पेप्टाइड की उपस्थिति); मी, mitochondria; ग, chloroplast; O या-, अं य स् थान; एनडी, निर्धारित नहीं (यानी, दहलीज के नीचे मूल्य). Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

    पहचान की चर्चा atl के न्यूक्लियोटाइड दृश्यों सहित एक वंशावली विश्लेषण-संदर्भ के अनुक्रम के साथ एक साथ एंकोडिंग जीन A. थालियाना atl जीन परिवार चर्चा atl नामकरण के लिए इस्तेमाल किया गया था, के दिशा निर्देशों के अनुसार sNCGGa8. ९६ और ८३ न्यूक्लियोटाइड से अनुक्रम V. द्राक्षा और a. थालियाना, क्रमशः, Phylogeny.fr पाइप लाइन के लिए एक विश्वसनीय वंशावली पेड़ प्राप्त करने के लिए अधीन थे ।बाद के दृश्यों के बाद व्याख्या करने के लिए और ठोस संबंधों के आधार पर चर्चा जीन नाम (चित्रा 2) किया गया । इस दृष्टिकोण के बाद, 13 से बाहर ९६ चर्चा ATLs एक विशिष्ट पहचानकर्ता प्राप्त एक एक-से-एक orthology एक . थालियाना ATL के साथ । अंय ८३ जीन के नाम वंशावली पेड़ के आधार पर असाइन किए गए थे, ऊपर से नीचे तक एक प्रगतिशील क्रमांकन के साथ, एक ATL जीन संख्या से प्रारंभ कर रहा है सबसे अधिक a. थालियानामें प्रयुक्त संख्या से अधिक है ।

    Figure 2
    चित्रा 2: वंशावली ट्री V. द्राक्षा और ए. थालियाना ATL E3 ubiquitin ligase-एंकोडिंग जीन । अनजड़ें पेड़ Phylogeny.fr सुइट (V. द्राक्षा (हरे रंग में) और ८३ ATL जीन के साथ उत्पन्न किया गया था A. थालियाना में रिपोर्ट की UniProt डेटाबेस (पीले में). शाखा समर्थन मान १०० बूटस्ट्रैप प्रतिकृति से प्राप्त किए गए थे । लाल तारे इसी प्रोटीन में BCA2 जिंक फिंगर (BZF) डोमेन की उपस्थिति दर्शाते हैं । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

    मानचित्रण atl-चर्चा गुणसूत्रों एंकोडिंग जीन के जीनोम भर में एक व्यापक वितरण दिखाया, दाखलता में ATL जीन परिवार के विस्तार में प्रमुख विकासवादी बल के रूप में पूरे जीनोम दोहराव का सुझाव । दरअसल, 31 ATLs मुताबिक़ गुणसूत्र क्षेत्रों में संभावित फॉल्ट या पूरे जीनोम दोहराव की घटनाओं से उत्पंन पाया गया । इसके अलावा, एक ही विश्लेषण 13 मिलकर दोहराया जीन, एक समीपस्थ डुप्लिकेट, और ५१ फैलाया डुप्लिकेट (चित्रा 3) पर प्रकाश डाला. ATL परिवार में डुप्लिकेट जीन की बहुत बड़ी संख्या को ध्यान में रखते हुए, हम एक संवर्धन परीक्षण (फिशर सटीक परीक्षण) के लिए जीनोम भिंन के दौरान दोहराया जीन की तरजीही प्रतिधारण की जांच प्रदर्शन किया । a p-मान & #60; ०.००१, इस परीक्षण की परिकल्पना की पुष्टि की है कि दोहराया atl जीन से अधिक बेतरतीब ढंग से बनाए रखा गया था, चर्चा अनुकूलन और विकास के दौरान atl जीन परिवार के लिए एक भूमिका का सुझाव ।

    Figure 3
    चित्र 3: चर्चा ATL-एंकोडिंग जीन वितरण V. द्राक्षा गुणसूत्रों और दोहराव स्थिति पर । ९६ चर्चा ATL जीन डेटाबेस में उपलब्ध सटीक गुणसूत्र जानकारी के साथ 19 V. द्राक्षा गुणसूत्रों के लिए मैप किए गए थे । रंग मूल दोहराव ईवेंट का संकेत देते हैं । ऊर्ध्वाधर काले लाइनों और लाल लाइनों क्रमशः मिलकर दोहराव और पूरे जीनोम दोहराव से व्युत्पंन जोड़े की पहचान । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

    आगे चर्चा में ATLs के ख्यात जैविक कार्यों की जांच करने के लिए, एक मेटा-विश्लेषण V. द्राक्षा cv. Corvina ग्लोबल जीन अभिव्यक्ति एटलस12पर किया गया था । डेटासेट ५४ विभिन्न चर्चा अंगों और विकासात्मक चरणों के पूरे जीनोम अभिव्यक्ति मान शामिल हैं और एक पदानुक्रम द्वि-clustered विश्लेषण करने के लिए उपयोग किया गया था । परिणाम न केवल पुष्टि की है कि सभी ९६ ATLs में व्यक्त किए गए थे ५४ ऊतकों/चरणों में से एक है, लेकिन यह भी अभिव्यक्ति प्रोफाइल (चित्रा 4a) के पांच मुख्य समूहों की उपस्थिति की ओर इशारा किया. संक्षेप में, समूहों ए और ई विपरीत व्यवहार दिखाया, विशेष रूप से पहली बार बेरी चरणों, युवा पत्ती, tendrils, फूलना, और कली चरणों का सबसे सहित किशोर के नमूनों में ATL जीन की एक सामांय downregulation की विशेषता है । दूसरी ओर, एक ही क्लस्टर में एक, पकने और बाद फसल मुरझाने चरणों, वुडी ऊतकों, और बीज विकास ATL जीन की देर चरणों में जामुन के रूप में परिपक्व नमूने एक प्रमुखता के ऊपर विनियमन दिखाया । क्लस्टर सी में जीन मुख्य रूप से नमूनों में से अधिकांश में downregulated थे, जबकि क्लस्टर डी में ATL जीन अक्सर बेरी विकास के देर से चरणों में विनियमित थे । अंत में, क्लस्टर B कोई भी प्रासंगिक भिंनता अभिव्यक्ति प्रोफ़ाइल में नहीं दिखा ।

    इस उद्देश्य के लिए बनाए गए विशिष्ट datasets का उपयोग करते हुए, बायोटिक और अजैव तनाव के जवाब में चर्चा ATL परिवार के सदस्यों की अभिव्यक्ति का अध्ययन करने के लिए एक समान दृष्टिकोण लागू किया गया था । microarray और आरएनए-seq प्रयोगों से प्राप्त अभिव्यक्ति डेटा की एक बड़ी राशि सार्वजनिक पहुँच डेटाबेस जैसे जीन एक्सप्रेशन सर्वग्राही (भू) और ArrayExpress से उपलब्ध हैं. एक बार एकत्र और आसानी से सामान्यीकृत, जानकारी संयंत्र प्रतिक्रिया में ATLs के संभावित समारोह में आगे अंतर्दृष्टि के लिए शोषण किया गया था तनाव । बायोटिक तनाव के जवाब में चर्चा ATLs की अभिव्यक्ति प्रोफाइल का विश्लेषण से पता चला कि ६२ ९६ टेप से बाहर एक महत्वपूर्ण मॉडुलन दिखाया (log2 गुना-परिवर्तन (एफसी) & #62;| ०.५ ।) कम से दो स्थितियों में, एक झूठी डिस्कवरी दर के साथ (एफडीआर) & #60; ०.०५ ( चित्रा 4B). संख्या बढ़ाता है केवल एफडीआर थ्रेशोल्ड एक ही स्थिति में विचार ८१ करने के लिए । ये परिणाम दृढ़ता से भी चर्चा में रोगजनकों के जवाब में ATL जीन परिवार की एक सीधी भागीदारी का सुझाव दिया । विशेष रूप से, 12 जीन (VviATL3-27-54b-55-90-97-123-144-148-149-156) के एक समूह के अधिकांश रोगजनकों, biotrophic और necrotrophic कवक और शाकाहारी सहित, के जवाब में दृढ़ता से विनियमित थे, और इस प्रकार, आगे कार्यात्मक के लिए ध्यान लायक िरा.

    Figure 4
    चित्रा 4: पदानुक्रमित clusteringof ATL जीन अभिव्यक्ति में चर्चा एटलस और चर्चा में बायोटिक तनाव से संबंधित डेटासेट. () लॉग में तब्दील चर्चा ATL जीन की अभिव्यक्ति मूल्यों चर्चा एटलस12 पियरसन की दूरी मीट्रिक पर आधारित पदानुक्रमित क्लस्टर विश्लेषण के लिए इस्तेमाल किया गया. रंग पैमाने पर उच्च (लाल) या कम (हरी) अभिव्यक्ति के स्तर का प्रतिनिधित्व करता है सभी नमूनों भर में प्रत्येक जीन की औसत प्रतिलेखन बहुतायत के संबंध में । अक्षर A को दाईं ओर ई के लिए अलग पहचाने गए क्लस्टर इंगित करता है ।AB: फटने के बाद; ख: फट; बड-W: शीतकालीन कली; च: फूल; FB: फूल शुरू होता है; FS: फल सेट; छ: हरा; श्री: मध्य पकने; PFS: पोस्ट फल सेट; PHWI-II-III: कटाई के बाद 1, 2 और 3 महीने सूख; आर: पकने; S: होनेवाला; स्टेम-डब्ल्यू: वुडी स्टेम; वि: veraison; WD: अच्छी तरह से विकसित; Y: युवा । (B) रंग स्केल का प्रतिनिधित्व करता है वृद्धि हुई (लाल) या कम (नीला) संक्रमित नमूनों में चर्चा ATL जीन अभिव्यक्ति के परिवर्तनों को प्रत्येक शर्त के लिए नियंत्रणों की तुलना में मोड़ता है । तारांकन संबंधित शर्तों के अंतर्गत प्रत्येक ATL के महत्वपूर्ण अवकलन व्यंजक (एफडीआर & #60; ०.०५) इंगित करता है. Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

    अनुपूरक तालिका 1: ATL जीन वैकल्पिक ब्याह के लिए उंमीदवारों । () atl जीन आईडी V1 अंगूर जीन पूर्वानुमान और एनोटेशन के अनुसार, (b) atl जीन पहचान के अनुसार V2 अंगूर जीन पूर्वानुमान और एनोटेशन४३, (c) ख्यात ATL वैकल्पिक ब्याह वेरिएंट की संख्या, (d) प्रत्येक ख्यात ATL वैरिएंट के अनुक्रम कोडिंग पर जानकारी । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

    अनुपूरक तालिका 2: इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

    अनुपूरक फ़ाइल 1: इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    जीनोमिक युग में अनेक जीन परिवारों में कई प्रजातियों के पौधे का गहराई से वर्णन किया गया है । यह जानकारी कार्यात्मक अध्ययन करने के लिए प्रारंभिक और एक परिवार में विभिन्न सदस्यों की भूमिका आगे की जांच करने के लिए एक फ्रेम प्रदान करते हैं । इस संदर्भ में, वहां भी एक नामकरण के लिए अद्वितीय रूप से एक परिवार में प्रत्येक सदस्य की पहचान की अनुमति प्रणाली के लिए एक की जरूरत है, अतिरेक और भ्रम है कि पैदा हो सकता है जब नाम स्वतंत्र रूप से अलग जीन के लिए विभिंन अनुसंधान समूहों द्वारा सौंपा है परहेज ।

    विचारशील विचार के बाद, चर्चा वैज्ञानिक समुदाय के लिए एक Arabidopsis जीन के साथ समानता के आधार पर परिवार में चर्चा जीन नाम पर सहमत हुए और नियमों की एक श्रृंखला है कि चर्चा में नए जीन परिवारों का वर्णन लागू किया जाना चाहिए की स्थापना की, मूल रूप से चर्चा और Arabidopsis परिवार के सदस्यों के बीच न्यूक्लियोटाइड दृश्यों के वंशावली तुलना से शुरू8। इसलिए, केवल जीन है कि पहले से ही व्याख्या कर रहे है और ठीक से Arabidopsis में नाम चर्चा नामकरण में इस्तेमाल किया जा सकता है । प्रक्रिया Arabidopsis में चर्चा ATL orthologues की पहचान के लिए आवेदन किया था यहां वर्णित इसलिए सही चर्चा जीन परिवार के नामकरण निर्दिष्ट की आवश्यकता को पूरा करने के लिए पूरी तरह से किए गए । फिर भी, अंय प्रजातियों के पौधे के लिए, वैकल्पिक दृष्टिकोण एक विकल्प हो सकता है । उदाहरण के लिए, orthology एक द्वि-दिशा विस्फोट हिट (BBH) का उपयोग कर आस्थगित किया जा सकता है, जहां orthologues दो प्रजातियों में जीन के जोड़े के रूप में परिभाषित कर रहे हैं कि अधिक समान हैं (यानी, उच्चतम संरेखण स्कोर के साथ) अन्य में किसी अन्य जीन की तुलना में एक दूसरे के लिए प्रजातियों४४। हालांकि, इस पद्धति के पौधों और जानवरों में४५के रूप में जीन दोहराव की उच्च दर के मामले में कई orthologues याद कर सकते हैं । इसके अलावा, ATL एंकोडिंग जीन के मामले में, BBH सटीक ATL-प्रकार की अंगूठी-H2 संरचना की कमी जीन पुनः प्राप्त कर सकते है (सहित लाइन अवशेषों) या जीन है कि व्याख्या और Arabidopsis में ATLs के रूप में नाम नहीं हैं । हालांकि एक विकासवादी परिप्रेक्ष्य से इस खोज प्रासंगिक हो सकता है, orthologues की बहाली कि व्याख्या ATL जीन परिवार एनोटेशन और नामकरण की गुंजाइश पूरी नहीं होता है, और orthologues कि ATLs के रूप में व्याख्या नहीं कर रहे है नहीं कर रहे है चर्चा परिवार के सदस्यों के नाम के लिए इस्तेमाल नहीं किया जा सकता । एक अंय संभावना के बजाय न्यूक्लियोटाइड पागल४६, या सबसे हाल ही में Hieranoid 2४७का उपयोग कर दृश्यों के अमीनो एसिड के आधार पर orthology अनुमान है, हालांकि ऐसे वर्कफ़्लोज़ स्पष्ट रूप से वैज्ञानिक समुदाय द्वारा की सिफारिश नहीं कर रहे हैं ।

    अभिव्यक्ति मेटा-विश्लेषण, जो एक व्यवस्थित दृष्टिकोण के रूप में परिभाषित किया जा सकता है अध्ययन करने के लिए और अभिव्यक्ति डेटा के विभिंन सार्वजनिक रूप से उपलब्ध डेटासेट खजाने गठबंधन, शर्तों के विभिंन प्रकार में साझा और विभिंन आणविक तंत्र को उजागर करने की अनुमति देता है । इस प्रकार, कई बड़े पैमाने पर transcriptomic प्रयोगों से जीन अभिव्यक्ति की जानकारी के एकीकरण के प्रयोगों में परिवार के सदस्यों की अभिव्यक्ति प्रोफाइल को परिभाषित करके, एक जीन परिवार के लक्षण वर्णन में सुधार कर सकते हैं, इस प्रकार कम प्रयोग विशेष कारकों का प्रभाव है और विशेष रूप से प्रक्रियाओं में ख्यात जीन समारोह का एक और अधिक मजबूत धारणा का समर्थन । तथापि, microarray डेटा के उपयोग के लिए विभिंन प्लेटफार्मों के साथ प्राप्त अभिव्यक्ति डेटा के एकीकरण की आवश्यकता है, अपनी सीमाओं पर विचार । उदाहरण के लिए, चर्चा Nimblegen microarray मंच, इसी सरणी (~ १३,००० जीन) पर प्रतिनिधित्व जीन के लिए probesets का एक महत्वपूर्ण अनुपात में संभावित पार है संकरण मुद्दों४८। चर्चा ATL परिवार के मामले में, 15 जीन ऐसी घटना से प्रभावित हो सकता है । फिर भी, के रूप में Cramer एट अल द्वारा चर्चा की । ४८, पार एक ही जांच द्वारा अत्यधिक समान जीन परिवार के सदस्यों की पहचान दिलचस्प अभिव्यक्ति के बारे में जानकारी प्रदान कर सकता है, विशिष्ट परिस्थितियों में, एक भी जीन की ही नहीं, लेकिन दो से अधिक उच्च अनुक्रम साझा जीन के लिए समानताएं, और इस प्रकार संभावित लक्ष्य और कार्य साझा । microarray डेटासेट से संबंधित एक और संभावित मुद्दा microarray प्लेटफार्मों की अभिव्यक्ति की पहचान की सीमा है, जो बहुत संवेदनशील नहीं हैं । दोनों चिंताओं, यानी, क्रॉस-संकरण और सिग्नल संवेदनशीलता को हल करने के लिए, एक संभावित समाधान केवल RNAseq व्यंजक डेटासेट पर विचार करने के लिए हो सकता है । हालांकि, बहुत से विभिंन अध्ययनों से बहुत बड़े डेटासेट के RNAseq डेटा का मेटा-विश्लेषण अत्यधिक समय लेने वाला बन सकता है और कई गणनात्मक संसाधनों और उच्च विशेषज्ञता की आवश्यकता हो सकती है ।

    हालांकि यहां प्रस्तुत दृष्टिकोण को संपूर्ण होना चाहिए, यह निश्चित रूप से आगे अंय विश्लेषण के साथ पूरित किया जा सकता है । सबसे पहले, आणविक विकास और पौधों में जीन परिवार के सदस्यों के बीच वंशावली रिश्ते में अंतर्दृष्टि प्राप्त करने के लिए, वंशावली विश्लेषण एक वंशावली परिवार के सदस्यों के कई अनुक्रम संरेखण का उपयोग कर पेड़ का निर्माण बढ़ाया जा सकता है कई प्रजातियों के पौधे से । यह भी परिवार के जीन के विकासवादी समय की गणना करने के लिए संभव है, विकास के दौरान उनके पर्यायी और गैर पर्यायवाची प्रतिस्थापन दरों का एक अनुमान, मूल्यों के निर्धारण के द्वारा (समानार्थी साइट प्रति समानार्थी प्रतिस्थापन की संख्या में एक दिया समय की अवधि) और (एक ही अवधि में गैर-पर्यायवाची साइट प्रति पर्यायवाची प्रतिस्थापन की संख्या) का मीत । Ka/Ks अनुपात को अपने पूर्वजों से विचलन के बाद जीन दोहराव की घटनाओं के तंत्र का अनुमान लगाने के लिए प्रयोग किया जाता है । ka/ks = 1 का मान तटस्थ चयन का सुझाव देता है, & #60 का एक मीत/; 1 शुद्ध चयन का सुझाव देता है, और & #62 का एक ka/ks मान; 1 सकारात्मक चयन का सुझाव देता है४९। इसके अलावा, यदि जीन संरचना विश्लेषण introns की उपस्थिति से पता चलता है, जीन परिवार लक्षण वर्णन आगे वैकल्पिक ब्याह वेरिएंट का पता लगाने के लिए बढ़ाया जा सकता है । दरअसल, विभिन्न ऊतकों से आरएनए-seq डेटा के एक गहरे सर्वेक्षण पर आधारित, तनाव की स्थिति और पादी४३, 21 (९६ के) ATLs वैकल्पिक ब्याह की घटनाओं के लिए मजबूत उंमीदवारों रहे हैं, isoforms की संभावित संख्या के साथ 2 से लेकर 16 इन ATLs के लिए (देखें अनुपूरक तालिका 1) । वैकल्पिक टेप अक्सर प्रोटीन isoforms कि एमिनो एसिड अनुक्रम में बदलती है और इन परिवर्तनों प्रोटीन के सेलुलर गुण बदल सकते है और सूक्ष्म मॉडुलन से जीन उत्पाद के समारोह के नुकसान के कारण परिवर्तन का उत्पादन हो सकता है । कि कारण के लिए, वैकल्पिक ब्याह की घटनाओं महत्वपूर्ण संयंत्र कार्यों में शामिल किया गया है, तनाव प्रतिक्रिया सहित, रोग प्रतिरोध, प्रकाश संश्लेषण, और फूल५०,५१।ATL जीन प्रमोटर जानकारी है कि ख्यात सीआईएस-विनियामक तत्वों५२ या अणुओं को खोजने के एकीकरण (उदा., microRNA और लंबे समय गैर-कोडिंग आरएनए) संभावित रूप से लक्ष्यीकरण ATLs५३ को भी पूरक किया जा सकता है जटिल आणविक विनियमन और चर्चा ATLs की बातचीत में प्रणाली अंतर्दृष्टि प्रकट करते हैं ।

    अंत में, विश्लेषण के विकल्प के रूप में के रूप में अच्छी तरह से प्रदर्शन के लिए प्रक्रियाओं के लिए एक संयंत्र प्रजातियों में एक नया जीन परिवार विशेषताएं लागू हो मुख्य रूप से वैज्ञानिक समुदाय के नियमों के रूप में के रूप में अच्छी तरह से जीन परिवार की पहचान के दायरे से संचालित कर रहे हैं । यह संभव बाद जांच कदम है, जो सूचना के सेट का दोहन होगा, जो बीच में संयंत्र प्रजातियों, जीनोम संरचना विवरण, या कार्यात्मक में चयन के लिए विश्वसनीय उंमीदवारों के बीच जीन विकास भी शामिल है ध्यान में रखना महत्वपूर्ण है पढ़ाई.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    लेखकों का खुलासा करने के लिए कुछ नहीं है ।

    Acknowledgments

    काम संयुक्त परियोजना २०१४ के फ्रेम के भीतर वेरोना विश्वविद्यालय द्वारा समर्थित किया गया था (चर्चा में ATL जीन परिवार के लक्षण वर्णन और Plasmopara viticolaके लिए प्रतिरोध में अपनी भागीदारी के) ।

    Materials

    Name Company Catalog Number Comments
    Personal computer
    Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME) http://meme-suite.org/
    Geneious Biomatters Limited http://www.geneious.com/
    ProtParam Tool http://web.expasy.org/protparam/
    ngLOC http://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
    Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsite http://musite.sourceforge.net/
    Pfam http://pfam.xfam.org/
    TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
    ProtScale http://web.expasy.org/protscale/
    Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
    PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanX http://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL) http://itol.embl.de/
    UniProt http://www.uniprot.org/
    Phylogeny.fr http://www.phylogeny.fr/index.cgi
    MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
    R https://www.r-project.org/
    EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    DOWNLOAD MATERIALS LIST

    References

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
    2. Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. , Science Publishers. 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
    13. BLAST. BLAST2.6.0. , Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
    14. MEGA. MEGA7.0.25 build 7170412. , Available from: http://www.megasoftware.net/ (2017).
    15. MEME. MEME Suite Version 4.11.4. , Available from: http://meme-suite.org/ (2017).
    16. ProtParam. ExPASy Server. , Available from: http://web.expasy.org/protparam/ (2005).
    17. ngLOC v1.0. , Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
    18. TargetP v1.1 Server. , Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
    19. Prowler v1.2. , Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
    20. MuSite v1.0. , Available from: http://musite.sourceforge.net/ (2010).
    21. Pfam. Pfam version 31.0. , Available from: http://pfam.xfam.org/ (2016).
    22. TMHMM v2.0c. , Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
    23. ExPASy. ProtScale. , Available from: http://web.expasy.org/protscale/ (2005).
    24. CRIBI. Grape genome database. , Available from: http://genomes.cribi.unipd.it/grape/ (2012).
    25. PhenoGram. , Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
    26. ScanX v0.8. , Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
    27. Interactive Tree Of Life (iTOL). Version3.5.3. , Available from: http://itol.embl.de/ (2016).
    28. UniProt. , Available from: http://www.uniprot.org/ (2016).
    29. Phylogeny.fr. , Available from: http://www.phylogeny.fr/index.cgi (2008).
    30. MUSCLE. , Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
    31. Gblocks Server. Version 0.91b. , Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
    32. Vitis vinifera cv. Corvina gene expression Atlas. , Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
    33. Multiple Experiment Viewer (MeV). Version 4.8.1. , Available from: http://mev.tm4.org/ (2017).
    34. Sequence Read Archive (SRA). , Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
    35. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
    36. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
    37. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
    38. R. Version 3.4.1. , Available from: https://www.r-project.org/ (2017).
    39. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
    40. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
    41. EMBL-EBI. EMBOSS Needle. , Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
    42. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    43. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
    44. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
    45. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
    46. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
    47. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
    48. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    49. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
    50. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
    51. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
    52. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
    53. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Tags

    आनुवंशिकी १३० अंक ATL E3 ubiquitin ligase जीन परिवार जीनोम चौड़ा नामकरण फाइलोजेनी अभिव्यक्ति मेटा-विश्लेषण जीन दोहराव चर्चा
    जीनोम-वाइड पहचान और अभिव्यक्ति मेटा-विश्लेषण के लिए व्यापक कार्यप्रवाह ATL E3 के Ubiquitin Ligase जीन परिवार में चर्चा
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Ariani, P., Vandelle, E., Wong, D.,More

    Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter