Biology

जीनोम-वाइड पहचान और अभिव्यक्ति मेटा-विश्लेषण के लिए व्यापक कार्यप्रवाह ATL E3 के Ubiquitin Ligase जीन परिवार में चर्चा

Published: December 22, 2017 doi: 10.3791/56626

Pietro Ariani*¹, Elodie Vandelle*¹, Darren Wong², Alejandro Giorgetti¹, Andrea Porceddu³, Salvatore Camiolo³, Annalisa Polverari¹

¹Dipartimento di Biotecnologie, Università degli Studi di Verona, ²Ecology and Evolution, Research School of Biology, The Australian National University, ³Dipartimento di Agraria, SACEG, Università degli Studi di Sassari

* These authors contributed equally

Summary

इस लेख की पहचान और चर्चा में एक जीन परिवार के लक्षण वर्णन के लिए प्रक्रिया को Levadura में Arabidopsis Tóxicos (ATL) E3 ubiquitin ligases के परिवार के लिए लागू की व्याख्या करता है ।

Abstract

वर्गीकरण और एक परिवार में जीन का नामकरण काफी इनकोडिंग प्रोटीन की विविधता के वर्णन में योगदान कर सकते है और कई सुविधाओं के आधार पर परिवार के कार्यों की भविष्यवाणी के लिए, जैसे अनुक्रम रूपांकनों की उपस्थिति या विशेष रूप से पोस्ट-शोधों के संशोधन के लिए साइटें और विभिन्न स्थितियों में परिवार के सदस्यों की अभिव्यक्ति प्रोफ़ाइल. यह काम जीन परिवार लक्षण वर्णन के लिए एक विस्तृत प्रोटोकॉल का वर्णन । यहां, प्रक्रिया में Levadura (ATL) E3 ubiquitin ligase परिवार में चर्चा में Arabidopsis Tóxicos के लक्षण वर्णन करने के लिए लागू किया जाता है । तरीकों परिवार के सदस्यों की जीनोम चौड़ा पहचान, जीन स्थानीयकरण, संरचना, और दोहराव के विश्लेषण में शामिल हैं, संरक्षित प्रोटीन रूपांकनों की भविष्यवाणी, प्रोटीन स्थानीयकरण और फास्फारिलीकरण साइटों के पूर्वानुमान के रूप में अच्छी तरह के रूप में जीन अभिव्यक्ति विभिंन डेटासेट में परिवार के पार की रूपरेखा । इस तरह की प्रक्रिया है, जो प्रयोगात्मक प्रयोजनों के आधार पर आगे विश्लेषण करने के लिए बढ़ाया जा सकता है, किसी भी संयंत्र प्रजातियों के लिए जो जीनोमिक डेटा उपलब्ध है में किसी भी जीन परिवार के लिए लागू किया जा सकता है, और यह बहुमूल्य जानकारी प्रदान करता है दिलचस्प उंमीदवारों की पहचान कार्यात्मक अध्ययन के लिए, अपने पर्यावरण के लिए संयंत्र अनुकूलन के आणविक तंत्र में अंतर्दृष्टि दे ।

Introduction

पिछले दशक के दौरान, बहुत अनुसंधान दाखलता जीनोमिक्स में किया गया है । दाखलता एक मांयता प्राप्त आर्थिक रूप से प्रासंगिक फसल है, जो फल विकास पर अनुसंधान के लिए और वुडी पौधों की प्रतिक्रियाओं पर बायोटिक और अजैव तनाव के लिए एक मॉडल बन गया है । इस संदर्भ में, के रिलीज के विटिस द्राक्षा cv. PN40024 जीनोम में २००७¹ और २०११² में अपने अद्यतन संस्करण "ओमिक्स" पैमाने पर डेटा के एक तेजी से जमा करने के लिए और उच्च प्रवाह अध्ययन के एक फट करने के लिए नेतृत्व किया । प्रकाशित अनुक्रम डेटा के आधार पर, एक दिया जीन परिवार के व्यापक विश्लेषण (आम तौर पर संरक्षित रूपांकनों, संरचनात्मक और/कार्यात्मक समानताएं और विकासवादी रिश्तों को साझा प्रोटीन से बना), अब अपने को उजागर किया जा सकता है आणविक कार्य, विकास, और जीन अभिव्यक्ति प्रोफाइल । ये विश्लेषण समझ कैसे जीन परिवारों को एक जीनोम व्यापक स्तर पर शारीरिक प्रक्रियाओं को नियंत्रित करने में योगदान कर सकते हैं ।

संयंत्र जीवन चक्र के कई पहलुओं को नियमित रूप से सेलुलर प्रक्रियाओं को सुनिश्चित करने के लिए एक ठीक-देखते कारोबार की आवश्यकता है, जो प्रमुख प्रोटीन की ubiquitin-मध्यस्थता क्षरण द्वारा विनियमित रहे हैं । ubiquitin-मध्यस्थता क्षरण की प्रक्रिया के महत्वपूर्ण घटक हैं E3 ubiquitin ligases, जो सिस्टम लचीलेपन के लिए जिम्मेदार हैं, विशिष्ट लक्ष्यों की भर्ती के लिए धन्यवाद³. तदनुसार, इन एंजाइमों एक विशाल जीन परिवार का प्रतिनिधित्व करते हैं, के साथ लगभग १,४०० E3 ligase-एंकोडिंग जीन Arabidopsis थालियाना जीनोम⁴में भविष्यवाणी की है, प्रत्येक E3 ubiquitin ligase विशिष्ट लक्ष्य प्रोटीन के ubiquitination के लिए अभिनय । पौधों में सेलुलर विनियमन में सब्सट्रेट विशिष्ट ubiquitination के महत्व के बावजूद, थोड़ा कैसे ubiquitination मार्ग विनियमित है और लक्ष्य प्रोटीन केवल कुछ मामलों में पहचान की गई है के बारे में जाना जाता है । ऐसी विशिष्टता और विनियमन तंत्र के गूढ़ पहचान और प्रणाली के विभिंन घटकों के लक्षण वर्णन पर पहले निर्भर करता है, विशेष रूप से E3 ligases । ubiquitin ligases में, ATL उपपरिवार ९१ एक अंगूठी-H2 फिंगर डोमेन⁵^,⁶, उनमें से कुछ की रक्षा और हार्मोन प्रतिक्रियाओं⁷में एक भूमिका निभा रहा है प्रदर्शित थालियाना में पहचाना सदस्यों द्वारा विशेषता है ।

पहला महत्वपूर्ण कदम एक नया जीन परिवार के सदस्यों को परिभाषित करने के लिए इस तरह आम सहमति रूपांकनों, कुंजी डोमेन, और प्रोटीन अनुक्रम विशेषताओं के रूप में परिवार की सुविधाओं की सटीक परिभाषा है । दरअसल, सभी जीन परिवार के सदस्यों की विश्वसनीय पुनः प्राप्ति विस्फोट विश्लेषण के आधार पर कुछ अनिवार्य अनुक्रम विशेषताओं की आवश्यकता है, विशेष रूप से प्रोटीन डोमेन में प्रोटीन समारोह के लिए जिंमेदार/ यह अंय प्रजातियों के पौधे में एक ही जीन परिवार के पिछले लक्षण वर्णन की सुविधा हो सकता है या अलग अलग प्रजातियों के पौधे में एक ही परिवार से संबंधित putatively का विश्लेषण करके हासिल की, आम दृश्यों को अलग । परिवार के सदस्यों को तो व्यक्तिगत रूप से एक दिया संयंत्र प्रजातियों के लिए अंतरराष्ट्रीय consortia द्वारा बसे आम नियमों के बाद नामित किया जा सकता है । चर्चा में, उदाहरण के लिए, इस तरह की प्रक्रिया को सुपर नामकरण अंगूर जीन एनोटेशन (sNCGGa) के लिए समिति की सिफारिशों के अधीन है, वी. द्राक्षा और थालियाना सहित एक वंशावली पेड़ के निर्माण की स्थापना जीन परिवार के सदस्यों न्यूक्लियोटाइड अनुक्रम⁸के आधार पर जीन एनोटेशन की अनुमति देने के लिए ।

परिवार के सदस्यों और जीन दोहराव सर्वेक्षण के गुणसूत्र स्थानीयकरण पूरे जीनोम की उपस्थिति पर प्रकाश डाला या मिलकर दोहराया जीन की अनुमति देते हैं । इस तरह की जानकारी ख्यात जीन कार्यों को खंडित करने के लिए उपयोगी प्रतीत होता है, क्योंकि यह कार्यात्मक अतिरेक दिखाने या विभिंन स्थितियों, अर्थात्, गैर functionalization, नव functionalization, या उप functionalization⁹प्रकट हो सकता है । दोनों नव और उप functionalization महत्वपूर्ण घटनाओं है कि आनुवंशिक नवीनता बनाने के लिए, संयंत्र अनुकूलन के लिए नई सेलुलर घटकों को उपलब्ध कराने के वातावरण¹⁰बदल रहे हैं । विशेष रूप से, पैतृक जीन और नए जीन के उत्पादन के दोहराव चर्चा जीनोम के विकास के दौरान बहुत लगातार थे और नए गठन और चर्चा में समीपस्थ और मिलकर दोहराव से उत्पंन जीन थे और नए उत्पादन की संभावना ^११कामे.

जीन परिवार समारोह गूढ़ रहस्य में एक अंय महत्वपूर्ण कारक transcriptomic प्रोफ़ाइल है । सार्वजनिक डेटाबेस की उपलब्धता transcriptomic डेटा की एक बड़ी राशि के लिए उपयोग दे इस प्रकार जीन परिवार के सदस्यों को ख्यात कार्य आवंटित करने के लिए बड़े पैमाने का उपयोग कर silico अभिव्यक्ति विश्लेषण में शोषण किया जा सकता है । वास्तव में, विशिष्ट संयंत्र अंगों में कुछ जीन की अजीब अभिव्यक्ति या कुछ तनावों के जवाब में कुछ संकेत दे सकते है परिभाषित शर्तों में इसी प्रोटीन की ख्यात भूमिकाओं के बारे में, और सहायता के बारे में परिकल्पनाओं को दे संभव विभिन्न चुनौतियों का जवाब देने के लिए डुप्लिकेट जीन के उप-functionalization । इस प्रयोजन के लिए, यह कई डेटासेट पर विचार करने के लिए महत्वपूर्ण है: ये पहले से ही उपलब्ध जीन अभिव्यक्ति मैट्रिक्स, चर्चा अंगों और विकासात्मक चरणों के जीनोम-वाइड transcriptomic एटलस के रूप में कर सकते हैं¹², या द्वारा तदर्थ बनाया जा सकता है विशेष संयंत्र प्रजातियों के लिए transcriptomic डेटासेट प्राप्त करने के लिए निर्धारित तनाव के अधीन । इसके अलावा, दो मैट्रिक्स का उपयोग कर एक सरल दृष्टिकोण, pairwise समानता डेटा के साथ एक और pairwise सह अभिव्यक्ति गुणांक के साथ एक अन्य एक जीन परिवार के भीतर अनुक्रम समानता और अभिव्यक्ति पैटर्न के बीच संबंधों का मूल्यांकन करने के लिए लागू किया जा सकता.

इस काम का उद्देश्य एक वैश्विक दृष्टिकोण प्रदान करने के लिए है, जीन संरचना, संरक्षित प्रोटीन रूपांकनों, गुणसूत्र स्थान, जीन दोहराव, और अभिव्यक्ति पैटर्न, के रूप में अच्छी तरह से प्रोटीन स्थानीयकरण और फास्फारिलीकरण साइटों की भविष्यवाणी को परिभाषित करने, एक प्राप्त करने के लिए पौधों में एक जीन परिवार के संपूर्ण लक्षण वर्णन । इस तरह के एक व्यापक दृष्टिकोण ATL E3 चर्चा में ubiquitin ligase परिवार के लक्षण वर्णन के लिए यहां लागू किया जाता है । कुंजी सेलुलर प्रक्रियाओं को विनियमित करने में ATL उपपरिवार के सदस्यों की उभरती भूमिका के अनुसार⁷, यह काम अच्छी तरह कार्यात्मक अध्ययन के लिए मजबूत उंमीदवारों की पहचान की सहायता कर सकते हैं, और अंततः आणविक शासी तंत्र को सुलझाना इस महत्वपूर्ण फसल के अपने पर्यावरण के लिए अनुकूलन ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. ख्यात ATL जीन परिवार के सदस्य (ओं) की पहचान

साई विस्फोट वेब संस्करण
1. ब्लास्ट वेब पेज¹³ खोलें और प्रोटीन विस्फोट अनुभाग पर क्लिक करें ।
2. "क्वेरी अनुक्रम दर्ज करें" क्षेत्र में, प्रोटीन के एमिनो एसिड अनुक्रम दर्ज करें (यहां VIT_05s0077g01970) कि जांच के रूप में इस्तेमाल किया जाएगा के लिए अंय परिवार के सदस्यों की पहचान ।
  नोट: एक अच्छा प्रतिनिधि प्रोटीन का इस्तेमाल किया जाना चाहिए (एक प्रोटीन सभी महत्वपूर्ण विशेषताएं है कि परिवार की विशेषताएं प्रदर्शित) ।
3. "खोज सेट चुनें" फ़ील्ड में, "संदर्भ प्रोटीन" डेटाबेस (refseq_protein) और ब्याज का जीव (V. द्राक्षा -टैक्सी्ड: 29760) का चयन करें ।
4. क्षेत्र "कार्यक्रम चयन" में, साई विस्फोट एल्गोरिथ्म का चयन करें और विश्लेषण चलाने के लिए विस्फोट बटन क्लिक करते हैं ।
  नोट: "एल्गोरिथ्म पैरामीटर" यह कुछ उन्नत मापदंडों को समायोजित करने के लिए संभव है पर क्लिक करके (अधिकतम लक्ष्य अनुक्रम, स्कोरिंग मैट्रिक्स, साई विस्फोट दहलीज, आदि).
5. पहला ब्लास्ट राउंड क्वेरी के साथ प्रासंगिक मेल प्रदर्शित करने वाले सभी दृश्यों को पुनर्प्राप्त करता है (इस प्रयोग में डिफ़ॉल्ट रूप से चयनित सीमा-से ऊपर का ई-मान ०.००५; ०.००१) । सभी प्रविष्टियों, जो स्पष्ट रूप से परीक्षा के तहत परिवार के लिए "साई के लिए चुनें विस्फोट" कॉलम में टिक पर क्लिक करके और दूसरा साई विस्फोट चलना के रूप में 1.1.4 कदम के रूप में विस्फोट बटन पर क्लिक करके नहीं है अचयनित ।
6. नव पहचान दृश्यों पीले रंग में डाला जाता है । स्पष्ट रूप से गलत प्राप्त हिट अचयनित और आगे पुनरावृत्तियों को उजागर के रूप में चरण 1.1.5 में वर्णित है ।
7. पुनरावृत्तियों के साथ जारी रखें जब तक कि एल्गोरिथ्म किसी भी प्रासंगिक प्रविष्टि नहीं ढूँढता है या यह अभिसरण तक पहुँचता है (कोई नई प्रविष्टियाँ नहीं मिलती हैं). आगे विश्लेषण के लिए ख्यात जीन परिवार के सदस्यों की सूची डाउनलोड करें । नेत्रहीन प्रत्येक पुनरावृत्ति में प्राप्त हिट निरीक्षण झूठी सकारात्मक की उपस्थिति से बचने के लिए ।
साई ब्लास्ट स्टैंडअलोन संस्करण
1. ब्लास्ट के होम पेज पर "डाउनलोड ब्लास्ट" बटन पर क्लिक करके ब्लास्ट के स्टैंडअलोन संस्करण को डाउनलोड करें¹³.
  नोट: स्वसंपूर्ण विस्फोट सॉफ्टवेयर वेब अंतरफलक के एक कमांड लाइन संस्करण से पहले वर्णित है । यह एक कस्टम स्थानीय या दूरदराज के डेटाबेस के खिलाफ साई विस्फोट खोज निष्पादित सक्षम बनाता है । इसके अलावा, यह एक पूर्व निर्धारित स्थिति विशिष्ट स्कोर मैट्रिक्स (PSSM) के साथ खोज की अनुमति देता है ।

2. साई विस्फोट की पहचान परिवार के सदस्यों के मैनुअल निरीक्षण

एकाधिक संरेखण
1. पहले एक फसता-स्वरूपित फ़ाइल में पहचाना एमिनो अम्लीय दृश्यों को इकट्ठा करने और कई संरेखण के साथ आगे बढ़ना करने के लिए मेगा सॉफ्टवेयर¹⁴ में इसे अपलोड करें ।
2. मेगा सॉफ्टवेयर खोलें, "संरेखण" बटन पर क्लिक करें, क्लिक करें "संपादित करें/बनाने के लिए", क्लिक करें "एक नया संरेखण बनाएं", क्लिक करें "प्रोटीन" ।
3. संरेखण मेनू से "संपादन" क्लिक करें और "फ़ाइल से अनुक्रम डालें" । पहले बनाई गई फसता फ़ाइल के लिए ब्राउज़ करें और सभी सर्व किए गए दृश्यों की अपलोड की पुष्टि ।
4. संरेखण मेनू से "संरेखण" पर क्लिक करें और "मांसपेशियों से संरेखित". डिफ़ॉल्ट पैरामीटर, "गणना" बटन क्लिक करें, और एकाधिक संरेखण के पूरा होने के लिए प्रतीक्षा करेंउपयोग ।
5. नेत्रहीन परिवार के सदस्यों की गलत भविष्यवाणी की बाहर करने के लिए एकाधिक संरेखण का निरीक्षण । विहित CxxC (13x) PxCxHxxHxxCxxxW (7x) CxxCW रूपांकन, (विशेष रूप से तीसरे cysteine से पहले की रेखा के अवशेषों की उपस्थिति) में, ATL परिवार के सदस्यों को परिभाषित करने के लिए आवश्यक कुंजी सुविधा है ।
विशिष्ट लोगो का विश्लेषण
1. परिवार के सदस्यों की निश्चित सूची भेजें (९६ दाखलता दृश्यों आवश्यकताओं को पूरा करने के लिए ATL माना जाता है) आकृति के लिए एकाधिक Em (MEME)¹⁵ को परिवार भर में संरक्षित रूपांकनों को परिभाषित करने के लिए ।
2. मेम मुख पृष्ठ से, "meme" बटन पर क्लिक करें, और विशेष रूप से ब्याज की परिवार के बारे में जानकारी के साथ "डेटा सबमिशन फार्म" पूरा ।
3. चर्चा ATL परिवार के सदस्यों के भीतर दो अपेक्षित रूपांकनों की उपस्थिति की पुष्टि करने के लिए MEME विश्लेषण का प्रयोग करें, अर्थात, अंगूठी-H2 और GLD रूपांकनों.
वैकल्पिक रूप से, कदम २.१ और २.२ एक साथ bioinformatics सॉफ्टवेयर सुइट का उपयोग कर ( सामग्री की तालिकादेखें).
1. अपलोड फसता फ़ाइल (चरण 2.1.1 देखें) सुइट में । चुनें "फ़ाइल" मेनू से, फिर "आयात" और क्लिक करें "से फ़ाइल" । ब्राउज़ फसता फ़ाइल और क्लिक करें "खोलो" ।
2. सूची में सभी आयातित अनुक्रम का चयन करें और उपकरण पट्टी में "संरेखित/असेंबल" बटन पर क्लिक करें, तो "Pairwise एकाधिक संरेखण" क्लिक करें । चुनें "मांसपेशी संरेखण" और क्लिक करें "ठीक है" डिफ़ॉल्ट पैरामीटर का उपयोग कर संरेखण शुरू करने के लिए ।
3. संरेखण के लोगो कल्पना करने के लिए, पर क्लिक करें "रेखांकन" → "विकल्प" और का चयन करें "अनुक्रम लोगो".

3. प्रोटीन शारीरिक मापदंडों और डोमेन का विश्लेषण

सर्वे किए गए परिवार के सदस्यों के विभिन्न शारीरिक मापदंडों की परिभाषा के रूप में परिवार के एक व्यापक विवरण के लिए महत्वपूर्ण है, विशिष्ट वेब उपकरणों के लिए परिवार के सदस्यों की सूची प्रस्तुत करते हैं ।
1. isoelectric बिंदु (pI) और आणविक भार (केडीए) के लिए, डिफ़ॉल्ट पैरामीटर के साथ Expasy वेबसाइट पर ProtParam उपकरण¹⁶ का उपयोग करें ।
2. प्रोटीन उपसेलुलर स्थानीयकरण के लिए, विभिंन उपकरणों का उपयोग करें जैसे ngLOC v 1.0 डिफ़ॉल्ट सेटिंग्स के साथ¹⁷ के रूप में एक और अधिक विश्वसनीय भविष्यवाणी, डिफ़ॉल्ट सेटिंग्स के साथ targetP v 1.1¹⁸ , और प्रोटीन prowler उपसेलुलर स्थानीयकरण v 1.2¹⁹०.५ की संभावना के एक कट-ऑफ के साथ । फास्फारिलीकरण साइट्स के लिए, डिफ़ॉल्ट पैरामीटर के साथ MUsite v 1.0 वेब उपकरण²⁰ का उपयोग करें ।
परिवार के सदस्यों में अतिरिक्त प्रोटीन डोमेन की जांच ।
1. Pfam डेटाबेस वेबपेज²¹खोलें, "अनुक्रम खोज" उपकरण का चयन करें, क्वेरी बॉक्स में प्रोटीन अनुक्रम सबमिट करें, और विश्लेषण को चलाने के लिए "जाएं" क्लिक करते हैं ।
  नोट: प्रत्येक प्रोटीन अनुक्रम व्यक्तिगत रूप से विश्लेषण किया है । एक डिफ़ॉल्ट सेटिंग में १.० के ई मूल्य महत्वपूर्ण और गैर महत्वपूर्ण हिट के बीच भेदभाव की अनुमति देता है ।
2. ख्यात transmembrane क्षेत्रों की उपस्थिति की जांच करने के लिए जैविक अनुक्रम विश्लेषण के लिए केंद्र से TMHMM सर्वर²² खोलें ।

सभी प्रोटीन अनुक्रम एक साथ चिपकाएं क्वेरी बॉक्स में (या वैकल्पिक रूप से फसता प्रारूप में सभी प्रोटीन दृश्यों सहित एक पाठ फ़ाइल अपलोड) और विश्लेषण चलाने के लिए "Submit" पर क्लिक करें ।

विश्लेषण प्रोटीन कमी transmembrane डोमेन की भविष्यवाणी की, TMHMM के अनुसार (कदम 3.2.2), ProtScale उपकरण के साथ ख्यात hydrophobic क्षेत्रों की पहचान । ProtScale वेबपेज²³खोलें । प्रत्येक प्रोटीन अनुक्रम को क्वेरी बॉक्स में चिपकाएँ और "Hphob का चयन करें. /Kyte & #38; Doolittle "एमिनो एसिड स्केल के रूप में । विश्लेषण चलाने के लिए "सबमिट" क्लिक करें ।

4. गुणसूत्र वितरण, दोहराव, और एक्सॉन-intron संगठन

चर्चा जीनोम CRIBI बायोटेक केंद्र वेबसाइट²⁴से प्राप्त जानकारी के आधार पर गुणसूत्रों पर ATL परिवार के सदस्यों को मैप ।
1. ब्राउज़ करें PhenoGram वेबसाइट मुखपृष्ठ²⁵। "इनपुट फ़ाइल" एक टैब के रूप में लिखें-गुणसूत्रों पर मैप किया जा करने के लिए जीन की विशिष्ट सुविधाओं के साथ सीमांकित पाठ फ़ाइल, पथ के बाद प्रदान की गई फ़ाइल के संकलन के बारे में विस्तृत दिशा निर्देशों और उदाहरणों के अनुसार "Phenogram" → " प्रलेखन "→" विकल्प "→" इनपुट फ़ाइल "।
2. काम का "शीर्षक" लिखिए. तैयार किए जाने वाले जीनोम का चयन करें. इस तरह की दाखलता जीनोम के रूप में सॉफ्टवेयर में लागू नहीं जीनोम के लिए, ड्रॉप डाउन मेनू में "अंय" का चयन करें । के दिशा निर्देशों और उदाहरणों के अनुसार जीनोम फ़ाइल लिखें, पथ "Phenogram" → "प्रलेखन" → "विकल्प" → "जीनोम" के बाद, और इसे अपलोड करें ।
3. "Phenotype रिक्ति", "Phenotype रंग", "छवि स्वरूप" के डिफ़ॉल्ट पैरामीटर्स का उपयोग करें, या संबंधित मेनू में विकल्प का चयन करें, और गुणसूत्रों पर जीन का दृश्य प्राप्त करने के लिए "साजिश" पर क्लिक करे ।
MCScanX सॉफ़्टवेयर²⁶का उपयोग करके परिवार के सदस्यों की दोहराव स्थिति को परिभाषित करें ।
1. डाउनलोड और एक स्थानीय मशीन चल कमांड लाइंस 1 (अनुपूरक फ़ाइल 1) पर MCscanX की एक प्रति खोलना । MCscanX फ़ोल्डर दर्ज करें और आवश्यक निष्पादन योग्य चल रहे आदेश पंक्तियां 2 (अनुपूरक फ़ाइल 1) बनाएं ।
  नोट: MCscanX की स्थापना के लिए कुछ लिनक्स ६४ बिट एक समारोह chdir के बारे में समस्या के कारण मशीनों पर विफल जाना जाता है । आदेश का निष्पादन करने पर इस फ़ंक्शन से संबंधित कोई त्रुटि संदेश दिया जाता है, तो आदेश पंक्तियाँ 3 (अनुपूरक फ़ाइल 1) चलाया जाना चाहिए और आदेश "बनाएं" बाद में प्रयास किया जाना चाहिए ।
2. डाउनलोड V. द्राक्षा प्रोटीन और एनोटेशन फ़ाइल कमांड लाइंस 4 (अनुपूरक फ़ाइल 1) चल रहा है ।
  नोट: चर्चा एनोटेशन फ़ाइल को ज़िपित और एकल गुणसूत्रों जानकारी बिल्ली एक अद्वितीय फ़ाइल में कमांड लाइंस 5 (अनुपूरक फ़ाइल 1) चल रहा द्वारा की जरूरत है ।
3. दोनों क्वेरी और विषय के रूप में V. द्राक्षा प्रोटीन फ़ाइल का उपयोग कर एक "सभी बनाम सभी" blastp खोज चलाएं ।
4. V. द्राक्षा प्रोटीन फ़ाइल कमांड लाइंस 6 (अनुपूरक फ़ाइल 1) चलाने का उपयोग कर एक खोज विस्फोट डेटाबेस बनाएं । blastp खोज करने से पहले बनाए गए डेटाबेस के विरुद्ध कोई क्वेरी के रूप में V. द्राक्षा प्रोटीन फ़ाइल का उपयोग कर आदेश पंक्तियां 7 (अनुपूरक फ़ाइल 1) को चला कर ।
5. एनोटेशन फ़ाइल MCScanX के लिए एक उपयुक्त स्वरूप में कनवर्ट करें । चलाएं कमांड लाइंस 8 (अनुपूरक फ़ाइल 1) कस्टम perl स्क्रिप्ट parseMSCanXgff.pl डाउनलोड करने के लिए । विश्लेषण चल रहा है आदेश पंक्तियाँ 9 (अनुपूरक फ़ाइल 1) निष्पादित करें ।
  नोट: एक फ़ाइल विटिस. gff उत्पन्न होता है जो निम्न स्वरूप में जीन निर्देशांक रखता है:
  sp # जीन शुरू स्थिति समाप्त होने की स्थिति
  जहां "sp" प्रजातियों के लिए एक दो पत्र कोड है (दाखलता के लिए Vv) जबकि "#" पाड़ का नाम है । ध्यान दें कि प्रदान की कस्टम पर्ल स्क्रिप्ट सबसे रूपांतरण के लिए उपयुक्त है, हालांकि कुछ कोड संशोधन कुछ विशिष्ट उपलब्ध एनोटेशन फ़ाइल में उपलब्ध कराई गई जानकारी की विविधता के कारण मामलों में आवश्यक हो सकता है ।
6. लॉंच MCScanX रनिंग कमांड लाइंस 10 (अनुपूरक फ़ाइल 1) ।
  नोट: "विटिस" दोनों एनोटेशन और विस्फोट उत्पादन फ़ाइल के उपसर्ग है । यह सॉफ्टवेयर चलाने के लिए एक अनिवार्य आवश्यकता का प्रतिनिधित्व करता है ।
7. विश्लेषण MCScanX परिणाम । MCScanX एक पाठ फ़ाइल "विटिस. collinearity" है, जो collinear ब्लॉकों में पैदा करता है । इस तरह के एक फ़ाइल किसी भी पाठ संपादक द्वारा निरीक्षण किया जा सकता है (उदाहरण के उत्पादन 1 अनुपूरक फ़ाइल 1देखें).
  नोट: एक "mcscaxOutput. html" निर्देशिका में html फ़ाइलें प्रत्येक संदर्भ गुणसूत्र के विरुद्ध collinear ब्लॉक के एकाधिक संरेखण विशेषता है जो उत्पन्न होता है । इन फ़ाइलों को एक वेब ब्राउज़र के माध्यम से निरीक्षण किया जा सकता है ।
8. आदेश लाइंस 11 (अनुपूरक फ़ाइल 1) चल रहे गुणसूत्रों में उनके रिश्तेदार पदों के आधार पर paralogous जीन वर्गीकृत ।
  नोट: Paralogous जीन वर्गीकरण अनुपूरक तालिका IIमें वर्णित है । जनरेट किया गया आउटपुट फ़ाइल "विटिस. gene_type" एक साधारण टैब सीमांकित स्वरूप के साथ सभी मूल जानकारी शामिल है ।
9. आकलन करने के लिए संवर्धन विश्लेषण प्रदर्शन कि जीन परिवार प्रचलित एक विशेष कमांड लाइंस 12 (अनुपूरक फ़ाइल 1) चल रहे तंत्र द्वारा उत्पंन किया है ।
  नोट: फ़ाइल "विटिस. gene_type" चरण 4.2.8 पर जनरेट किया गया है, जबकि फ़ाइल "gene_family_file" एक पंक्ति पाठ फ़ाइल का प्रतिनिधित्व करता है जिसमें परिवार का नाम (जैसे, ATL_genes) परिवार से संबंधित सभी जीनों के लिए लोकस नामों के बाद किया जाता है एक टैब से अलग किया । संवर्धन के लिए एप्लाइड सांख्यिकीय परीक्षण एक फिशर सटीक परीक्षण और p-विभिंन मूल के मूल्यों फ़ाइल में संग्रहित कर रहे है "outputFile. txt" ।
जीवन के इंटरैक्टिव पेड़ (iTOL)²⁷, प्रदर्शन, एनोटेशन के लिए एक ऑन लाइन उपकरण का उपयोग कर जीन के एक्सॉन-intron संगठन कल्पना, और वंशावली पेड़ों के प्रबंधन ।
1. iTOL वेबसाइट के "अपलोड" अनुभाग में एक वंशावली ट्री अपलोड करें । पेड़ के नीचे धारा 5 के अनुसार बनाया गया है । प्रत्येक परिवार के सदस्य जीन के लिए, चर्चा जीनोम के V1 एनोटेशन से जीन संरचना भविष्यवाणी पुनः प्राप्त (CRIBI ऊपर उद्धृत वेबसाइट) । ख्यात exons, introns, और अनअनुवादित क्षेत्रों (UTRs) की लंबाई (बीपी में) की गणना करें ।
2. एक्सॉन-intron प्रतिमान के ग्राफ़िकल विज़ुअलाइज़ेशन के लिए "प्रोटीन डोमेन" डेटासेट का उपयोग करें.

पथ के बाद प्रदान विनिर्देशों के अनुसार एक सादा पाठ फ़ाइल लिखें "मदद" → "मदद पृष्ठों" → "डेटासेट प्रकार" → "iTOL वेबसाइट में प्रोटीन डोमेन"²⁷। "प्रोटीन डोमेन" डेटासेट का उपयोग करते हुए, "आयत (RE)" और "आयत गैप (GP)" आकार क्रमश: एक्सॉन और UTRs का प्रतिनिधित्व करते हैं ।

5. वंशावली विश्लेषण और नामकरण

एक उच्च गुणवत्ता वंशावली ट्री के निर्माण के माध्यम से ATL परिवार के सदस्यों के बीच संबंधों का विश्लेषण और एक परिवार के नामकरण की परिभाषा ।
1. एक चर्चा जीन परिवार के लिए, चर्चा सुपर नामकरण समिति⁸द्वारा स्थापित नियमों का पालन करें ।
2. थालियाना ATL अनुक्रम, चर्चा जीन नामकरण⁸, UniProt डेटाबेस²⁸ से के लिए संदर्भ के रूप में आवश्यक पुनर्प्राप्त करें ।
3. वंशावली विश्लेषण में शामिल होने के लिए चर्चा और ए. थालियाना जीन परिवार के सदस्यों के सभी न्यूक्लियोटाइड दृश्यों सहित एक फसता फ़ाइल लिखें । न्यूक्लियोटाइड अनुक्रम परिवार के सदस्यों के बीच परिवर्तनशीलता की अधिकतम अनुमति (प्रोटीन दृश्यों की तुलना में) ।
वंशावली ट्री
नोट: Phylogeny.fr ²⁹ पाइपलाइन के उपयोग के लिए एक उच्च गुणवत्ता वंशावली पेड़ पाने के लिए सिफारिश की है, लेकिन अनिवार्य नहीं है ।
1. Phylogeny.fr मुखपृष्ठ²⁹ब्राउज़ करें, और "फाइलोजेनी विश्लेषण" पाइपलाइन का चयन करें ।
  नोट: "एक क्लिक" अधिकांश मामलों में उपयुक्त है, लेकिन यदि आवश्यक हो तो विशिष्ट उंनत सेटिंग्स ("उंनत") या यहां तक कि एक पूरी तरह से अनुकूलित विश्लेषण ("a la कार्टे"; चरण 5.2.5 देखें) का चयन करना संभव है ।
2. "विश्लेषण का नाम" लिखें, पहले बनाई गई फसता फ़ाइल अपलोड करें (चरण 5.2.1, और विश्लेषण चलाने के लिए "Submit" क्लिक करे ।
3. वैकल्पिक रूप से, यदि प्रक्रिया ऊपर वर्णित (चरण 5.2.1, 5.2.2) एक त्रुटि संदेश में परिणाम, फाइलोजेनी सुइट पाइपलाइन के प्रत्येक चरण को व्यक्तिगत रूप से, पूर्ण निंनानुसार है ।
  1. स्नायु सॉफ्टवेयर मुखपृष्ठ³⁰से, "चरण 1" में फसता फ़ाइल अपलोड करें, "पियरसन/फसता" के रूप में "आउटपुट स्वरूप" में "चरण 2" का चयन करें, और क्वेरी दृश्यों को संरेखित करने के लिए "चरण 3" में "Submit" क्लिक करे ।
  2. "डाउनलोड संरेखण फ़ाइल" पर क्लिक करें और आगे के चरणों के लिए फसता फ़ाइल के रूप में सहेजें ।
  3. Gblocks सर्वर उपकरण³¹का उपयोग करके खराब संरेखित स्थितियों को समाप्त करने के लिए संरेखण फसता फ़ाइल संसाधित करें । संरेखण फसता फ़ाइल अपलोड करें, "डीएनए" "अनुक्रम के प्रकार" के रूप में चुनें और stringency के विकल्प (ओं) को चुना है कि सबसे अच्छा विश्लेषण के साथ फिट बैठता है (उदा., चर्चा ATL जीन परिवार के लिए "कम कड़े चयन" के लिए प्रस्तावित सभी तीन विकल्पों का चयन करें क्योंकि उच्च अनुक्रम विचलन की) । विश्लेषण चलाने के लिए "ब्लॉक्स प्राप्त करें" पर क्लिक करे.
  4. आउटपुट पृष्ठ के निचले भाग पर "परिणामी संरेखण" क्लिक करें और परिणामों को एक नई फसता फ़ाइल के रूप में सहेजें ।
  5. Phylogeny.fr मुखपृष्ठ²⁹से, "फाइलोजेनी विश्लेषण" पाइपलाइन के रूप में "A la कार्टे" चुनें । फिर, अचयनित "एकाधिक संरेखण" और "संरेखण उपचारात्मक". "कार्यप्रवाह बनाएं" पर क्लिक करें, Gblocks-उपचारात्मक फसता फ़ाइल (step 5.2.5.4) अपलोड करे, "सेटिंग" में डिफ़ॉल्ट पैरामीटर के साथ "Bootstrapping कार्यविधि" चुनें, और विश्लेषण चलाने के लिए "Submit" पर क्लिक करें ।
4. खराब समर्थित शाखाओं को संक्षिप्त करें (अर्थात, बूटस्ट्रैप values & #60; ७०%) "शाखाएं संक्षिप्त" चुनें और क्रिया "अनुभाग में क्लिक करके और अंतिम परिणाम Newick स्वरूप में आगे विश्लेषण करने के लिए डाउनलोड करें ।
फाइलोजेनी के आधार पर एक जीन नाम निरुपित ।
1. वंशावली पेड़ की समीक्षा के लिए यह iTOL सुइट में अपलोड करके पेड़ की संरचना की विश्वसनीयता का मूल्यांकन ऊपर उद्धृत (धारा ४.३) ।
2. प्रत्येक परिवार के सदस्य को मैंयुअल रूप से एक जीन नाम निरुपित । एक-से-एक orthologues के मामले में, Arabidopsis-like नाम (उदा., AtATL3 → VviATL3) असाइन करें । चर्चा जीन अंतर (दो या अधिक) एक ही वंशावली दूरी के साथ एक ही Arabidopsis homolog से व्युत्पंन संख्या, या पत्र का उपयोग कर अगर Arabidopsis जीन एक संख्या के साथ समाप्त होताहै (जैसे, AtATL23 → VviATL23a, VviATL23b) ।
3. एक-से-कई या कई-से-कई orthologues के मामले में, Arabidopsisनाम (यहां, "ATL") से बना एक नया जीन नाम असाइन करें, जो पहले से ही दोनों V. द्राक्षा और Arabidopsis के लिए उपयोग की गई उच्चतम संख्या से अधिक संख्या के साथ युग्मित है (उदा., VviATL83).
4. वंशावली वृक्ष के नीचे से ऊपर की ओर उतरते हुए नव परिभाषित परिवार का नामकरण पूर्ण करें ।

6. चर्चा अंग और मंच अभिव्यक्ति रूपरेखा

परिवार के सदस्यों के लिए कार्य डेटा मैट्रिक्स युक्त अभिव्यक्ति डेटा जनरेट करें ।
1. डाउनलोड V. द्राक्षा cv. Corvina जीन एक्सप्रेशन एटलस datamatrix लिंक से ResearchGate प्लेटफार्म^३२पर वितरित । इस फ़ाइल में निंन चरणों में उपयोग करने के लिए RMA सामान्यीकृत व्यंजक मान हैं ।
2. एटलस datamatrix से प्रत्येक परिवार के जीन के लिए अभिव्यक्ति मूल्यों को निकालने और एक "काम datamatrix" एटलस datamatrix के रूप में एक ही हेडर पंक्ति युक्त लिखें । "कार्य datamatrix" एक टैब-सीमांकित पाठ फ़ाइल के रूप में सहेजें ।
बहु प्रयोग व्यूअर (MeV) सॉफ़्टवेयर का उपयोग करते हुए पदानुक्रमित द्वि-संकुल विश्लेषण निष्पादित करें ।
1. MeV सॉफ़्टवेयर^३३डाउनलोड और स्थापित करें ।
2. "कार्य datamatrix" (चरण 6.1.2) पथ "फ़ाइल" → "लोड डेटा" → "ब्राउज़ करें" और पाठ फ़ाइल का चयन करने के बाद अपलोड करें । "एकल-रंग सरणी" का चयन करें और स्वचालित एनोटेशन प्रदान नहीं किया गया है, जब "लोड एनोटेशन" से टिक निकालें । व्यंजक तालिका पूर्वावलोकन के ऊपरी-बाएं व्यंजक मान का चयन करें और "लोड करें" बटन क्लिक करे ।
3. ("डेटा समायोजित करें" → "लॉग रूपांतरण" → "Log2 रूपांतरण") और जीन/पंक्ति मानकीकरण ("समायोजित डेटा" → "जीन/पंक्ति समायोजन" → "माध्य केंद्र जीन/") डेटा को समायोजित Log2 रूपांतरण लागू करने के लिए । उचित पैमाने सीमा सेट ("प्रदर्शन" → "सेट रंग पैमाने सीमा") ।
4. पदानुक्रम क्लस्टरिंग पथ "विश्लेषण" → "clustering" → "HCL" के बाद परिकलित करें ।

"अनुकूलन जीन पत्ती आदेश" का चयन करें और "नमूना पत्ती आदेश" अनुकूलन क्षेत्र आदेश "में", "दूरी मैट्रिक्स चयन" क्षेत्र में "पियरसन सहसंबंध", और "लिंकेज विधि चयन" क्षेत्र में "औसत लिंकेज clustering" । उसके बाद, विश्लेषण को चलाने के लिए "ठीक" क्लिक करें ।

विंडो के बाएँ फलक पर "विश्लेषण परिणाम" → "HCL" मेनू में परिणाम देखें. "फ़ाइल" मेनू में "छवि सहेजें" क्लिक करके हीट मैप निर्यात करें ।

7. अभिव्यक्ति बायोटिक और अजैव तनाव के जवाब में profiling

GSE प्रवेश आईडी संबंधित प्रकाशनों और अध्ययन बायोटिक और चर्चा पर अजैव तनाव की जांच से प्राप्त के साथ दोहराएं चरण ६.१ । उदाहरण के लिए, चर्चा कवक रोगज़नक़ के साथ संक्रमित जामुन की transcriptome प्रोफ़ाइल प्रदान प्रयोगों Botrytis cinerea का उपयोग कर NimbleGen अंगूर पूरे-जीनोम microarray GSE के GSE52586 आईडी के साथ ब्राउज़ किया जा सकता है । चरण 6.1.1 और 6.1.2 दोहराएं ।
खोज NCBI अनुक्रम SRA/(जैसे, SRP055458 या PRJNA275778 के लिए "चर्चा पुष्प छायांकन" प्रयोगों) के साथ^३४ पुरालेख पढ़ता है और सभी संबंधित कच्चे अनुक्रम डाउनलोड पढ़ता है । आरएनए-seq डेटासेट कई विभिन्न अध्ययनों से निरंतरता के लिए एक एकल पाइपलाइन का उपयोग कर संसाधित कर रहे हैं.
1. संक्षेप में, ट्रिम कच्चे अनुक्रम FASTQ (एकल और जोड़ी अंत) पढ़ता है और Trimmomatic^३५के साथ फ़िल्टर गुणवत्ता । 20 और ४०, क्रमशः और सभी पैरामीटर डिफ़ॉल्ट के एक AVGQUAL और MINLEN फ़िल्टर का उपयोग करें ।
2. सूचकांक 12X चर्चा संदर्भ जीनोम¹ Bowtie2^३६का उपयोग कर । bowtie2 कमांड चलाने से पहले 12X चर्चा संदर्भ जीनोम (जैसे, bowtie2-निर्माण) डाउनलोड करें ।
3. गणना मैट्रिक्स तालिकाओं के साथ htseq-count^३७ का उपयोग कर चर्चा V1 जीन मॉडल एनोटेशन (GFF/GTF) फ़ाइल प्राप्त करें ।
अंतर जीन अभिव्यक्ति (पुन) विश्लेषण RMA-सामान्यीकृत मैट्रिक्स और DESeq2 ^४० पुस्तकालयों के लिए limma^३९ पुस्तकालयों के साथ की गणना मैट्रिक्स तालिकाओं 7.1.1 और 7.2.1, क्रमशः से प्राप्त करने के लिए के साथ अनुसंधान में प्रदर्शन ।
1. एक मानक "दो समूह" तुलना करें (यानी, "उपचार"/"नियंत्रण") । सुनिश्चित करें कि डिज़ाइन मैट्रिक्स/समूहीकरण "नियंत्रण" और "उपचार" शर्तों को ठीक से निर्दिष्ट हैं ।
  नोट: microarray विभेदक अभिव्यक्ति विश्लेषण के लिए एक ठेठ डिजाइन (GSE52586) EL-३३ जामुन के खिलाफ नियंत्रण (स्वस्थ) के खिलाफ एक ही विकास के स्तर पर Botrytis cinerea से संक्रमित बेरीज limma रनिंग कमांड लाइंस के साथ 13 अनुपूरक फ़ाइल 1में दिखाया गया है । आरएनए के लिए एक ठेठ डिजाइन-seq विभेदक अभिव्यक्ति विश्लेषण (SRP055458 या PRJNA275778) फूल की तुलना करने के लिए (कैप गिरने के बाद 7 दिनों में) नियंत्रण के खिलाफ छाया उपचार के तहत DESeq2 चल रहे आदेश लाइंस 14 में दिखाया गया है अनुपूरक फ़ाइल 1 .
2. प्रत्येक कंट्रास्ट में विभेदक व्यक्त जीन (डिग्री) की सूचियां प्राप्त करें, limmaके लिए, फ़ंक्शन lmFit ()का उपयोग करते हैं, जिसके बाद ईबे (), और फिर topTable() फ़ंक्शंस द्वारा, जबकि DESeq2के लिए, का उपयोग करें DESeqDataSetFromMatrix (), DESeq (), और परिणाम () फ़ंक्शंस । नीचे, एक ठेठ कार्यप्रवाह का पालन किया जाना है ।
  1. microarray अवकलन व्यंजक विश्लेषण के लिए, आदेश पंक्तियाँ 15 (अनुपूरक फ़ाइल 1) देखें । आरएनए-seq विभेदक अभिव्यक्ति विश्लेषण के लिए आदेश पंक्तियाँ 16 (अनुपूरक फ़ाइल 1) देखें । अन्य उपयुक्त डिज़ाइन स्कीमा के साथ अन्य सभी विरोधाभासों के लिए उपरोक्त चरण दोहराएँ (चरण 7.3.1 में उदाहरण देखें)
DEGs जनरेट की गई सूचियों से, सभी पंक्तियाँ ATL V1 प्रवेश करने के लिए संगत नहीं है, जो log2 फ़ोल्ड परिवर्तन (उपचार/नियंत्रण) वाले स्तंभों को बनाए रखने निकालें & #62; | ०.५ | और समायोजित p-मान (एफडीआर) & #60; ०.०५, और उंहें एक मैट्रिक्स तालिका में मर्ज करें, चाहे एक अध्ययन "अजैव" या "बायोटिक/रोगज़नक़ संपर्क" compendia में आता है ।
पदानुक्रम संकुल heatmaps (अजैव और बायोटिक compendia) के निर्माण में आर पुस्तकालयों gplotsका उपयोग कर ।
नोट: heatmap. 2 फ़ंक्शन को कॉल करने से संबंधित मैट्रिक्स तालिकाओं से पंक्ति dendrograms के साथ heatmap का निर्माण होता है । cellnote फ़ंक्शन का उपयोग करते हुए अतिरिक्त तर्क अंतर व्यक्त करने में मदद करता है (log2FC & #62; ०.५, एफडीआर & #60; ०.०५) ATL जीन एक * प्रतीक द्वारा प्रयोगात्मक शर्तों की एक बड़ी रेंज में प्रत्येक तुलना में । सामान्य कार्यप्रवाह R चल रहा है आदेश पंक्तियाँ 17 में लागू करें (अनुपूरक फ़ाइल 1) या वैकल्पिक रूप से, MeV सॉफ़्टवेयर का उपयोग heatmaps का निर्माण करने के लिए 6.2.5 करने के लिए चरण 6.2.2 दोहराएँ ।

8. Paralogous अनुक्रम विचलन और जीन सह अभिव्यक्ति के बीच संबंधों का विश्लेषण

pairwise समानता युक्त मैट्रिक्स का निर्माण । समानता मैट्रिक्स के तत्वों अनुक्रम pairwise प्रोटीन संरेखण से गणना समानता के मूल्यों रहे हैं ।
1. pairwise अनुक्रम संरेखण बनाने और पाठ फ़ाइल के रूप में सहेजने के लिए डिफ़ॉल्ट सेटिंग्स के साथ उभरा सुई वेब सर्वर^४१ का उपयोग करें । आउटपुट पाठ फ़ाइल खोलें और सभी टिप्पणी पंक्तियाँ निकालें, एक साथ स्तंभ और पंक्ति नाम के साथ "similarityTable. txt" नामक फ़ाइल जनरेट करने के लिए ।
  नोट: ऐसी तालिका प्रत्येक ATL जीन pairwise संरेखण में से प्रत्येक में परिकलित समानता मान रिपोर्टिंग के लिए एक पंक्ति सुविधाएँ । पंक्तियों और स्तंभों में loci का क्रम एक ही है जिससे विकर्ण मानों के संबंध में एक सममित मैट्रिक्स उत्पन्न होता है.
मैट्रिक्स पियरसन सहसंबंध गुणांक की गणना करके सह-अभिव्यक्ति डेटा के साथ निर्माण । निंन प्रक्रिया R और perl मॉड्यूल PDL की आवश्यकता है ।
1. ९६ ATL जीन एक टर्मिनल के भीतर कमांड लाइंस 18 (अनुपूरक फ़ाइल 1) चल रहे के लिए अभिव्यक्ति मान डाउनलोड करें । आदेश पंक्तियाँ 19 (अनुपूरक फ़ाइल 1) चला कर डाउनलोड किया जा सकता जो किसी कस्टम perl स्क्रिप्ट का उपयोग कर एक सह-व्यंजक विश्लेषण निष्पादित करें । ऐसी स्क्रिप्ट पहले रिपोर्ट की गई के रूप में ATL loci के जोड़ों के बीच सहसंबंध गुणांक पियरसन की गणना करेगा ।
2. लॉंच स्क्रिप्ट चल रहे आदेश पंक्तियां 20 (अनुपूरक फ़ाइल 1) और आउटपुट निर्देशों का पालन करें ।

स्क्रिप्ट एक आउटपुट फ़ाइल का उत्पादन होगा (अर्थात् "coexpressionTable. txt") एक सह अभिव्यक्ति मैट्रिक्स के समान लोकस नाम क्रम की विशेषता मैट्रिक्स ८.१ कदम में प्राप्त (यह आदेश Mantel परीक्षण चलाने के लिए आवश्यक है, नीचे देखें) ।

८.१ और ८.२ चरणों में प्राप्त डेटा मैट्रिक्स के बीच एक Mantel परीक्षण निष्पादित करें । r वातावरण में प्रवेश करने के बाद (चलाएँ आदेश "R" से एक टर्मिनल के भीतर), निम्न आदेश का उपयोग कर ade4 लायब्रेरी लोड: लाइब्रेरी (ade4)

दो डेटा मैट्रिक्स लोड हो रहा है और आदेश पंक्तियाँ 21 (अनुपूरक फ़ाइल 1), "nrep" परिवर्तन की संख्या का प्रतिनिधित्व करने के साथ चल रहे आँकड़ों को चलाने के द्वारा Mantel परीक्षण चलाएँ । परीक्षण इन मैट्रिक्स के तत्वों के बीच सहसंबंध की गणना, मैट्रिक्स permuting और फिर एक ही परीक्षण आँकड़ों की गणना फिर से होते हैं ।
नोट: सांख्यिकीय परीक्षण के सभी प्राप्त मानों का उपयोग सांख्यिकीय परीक्षण के संदर्भ वितरण के लिए किया जाता है, जिसका उपयोग p-मान को महत्व के लिए जांच करने के लिए परिकलित करने के लिए किया जाएगा । परिवर्तन की संख्या वह शुद्धता निर्धारित करती है जिसके साथ p-मान प्राप्त किया जा सकता है ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

VIT_05s0077g01970 जीन, एक BLASTp खोज के माध्यम से सबसे ए. थालियाना ATL2 (At3g16720) के लिए इसी तरह के रूप में पहचान की, चर्चा जीनोम में ATL परिवार के सदस्यों के सर्वेक्षण के लिए जांच के रूप में इस्तेमाल किया गया था (वी द्राक्षा cv Pinot शिद्दत से PN40024) । साई विस्फोट विश्लेषण कुछ दाखलताओं ख्यात जीन की एक सूची खुलासा करने के बाद एकाग्र-चर्चा ATL जीन परिवार (चित्र 1a) । प्रत्येक उंमीदवार के लिए विहित रिंग-H2 डोमेन की उपस्थिति विश्लेषण (चित्र 1b) में पहचानी गई सभी प्रविष्टियों की मांसपेशी संरेखण के दृश्य निरीक्षण द्वारा मूल्यांकित की गई थी । केवल उन जीनों युक्त सही ढंग से अंतरिक्ष संरक्षित अमीनो एसिड, दो histidine अवशेषों, साथ ही साथ तीसरे cysteine से पहले की रेखा अवशेषों ATLs के रूप में मूल ATL परिभाषा के अनुसार माना जाता था Arabidopsisमें⁵। ९६ दाखलता की कुल जीन आवश्यकताओं को पूरा और आगे लक्षण वर्णन के लिए विचार किया गया । प्रत्येक ATL परिवार के सदस्य जीन और इसी इनकोडिंग प्रोटीन की विशिष्ट विशेषताओं को परिभाषित करने के लिए विश्लेषण किया गया था, यानी, अंगूठी के अलावा अन्य ज्ञात डोमेन (ओं) की उपस्थिति-H2, transmembrane या hydrophobic अमीर क्षेत्रों, उपसेलुलर स्थानीयकरण, और ख्यात फास्फारिलीकरण साइट्स (तालिका 1 और तालिका 2) ।

चित्रा 1: साई विस्फोट सर्वेक्षण और ख्यात चर्चा ATLs के संरेखण । (ए) चारा के रूप में प्रोटीन अनुक्रम VIT_05s0077g01970 का उपयोग कर पहली साई-विस्फोट चलना खोज के शीर्ष 10 हिट के स्क्रीनशॉट । (ख) ९६ चयनित दाखलता ख्यात ATLs के संरेखण का हिस्सा अपनी अंगूठी दिखा-H2 डोमेन और इसी लोगो आणविक जीवविज्ञान के एक सुइट का उपयोग कर प्राप्त ( सामग्री की तालिकादेखें) । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त ।कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

नाम	जीन आईडी	जीन की लंबाई (बीपी)	Intron संख्या	UniProt आयडी	प्रोटीन लंबाई (एए)	रिंग-H2 आकृति	TM/एच डोमेन संख्या	अंय डोमेन
VviATL3	VIT_09s0002g00220	१२४५	0	F6HXK6	३०४	pxc	1
VviATL4 [VviRHX1A]	VIT_15s0021g00890	१८२७	3	D7SM36	२०३	pxc	0
VviATL18	VIT_11s0118g00780	१११३	2	F6HCI8	१९३	पीसी	0
VviATL23a	VIT_18s0001g01060	९३५	0	F6H0E4	११४	pxc	०.५
VviATL23b	VIT_18s0001g01050	३९९	0	E0CQX3	१३२	pxc	1
VviATL24	VIT_17s0000g06460	४४६६	4	D7SI89	२१७	pxc	1
VviATL27	VIT_00s0264g00020	२५५४	4	D7T1R5	२३५	pxc	1
VviATL43	VIT_11s0052g00530	१५७६	2	D7SQD9	४५७	pxc	3
VviATL54a	VIT_18s0001g06640	३२२१	1	F6H0Y5	४०५	pxc	1
VviATL54b	VIT_03s0017g00670	२७७४	1	F6HTI0	४२७	pxc	1
VviATL55 [VviRING1]	VIT_07s0191g00230	१८४४	0	F6HRP9	३७२	pxc	1
VviATL63	VIT_06s0004g06930	८०४	0	D7SJU6	२६७	pxc	1
VviATL65	VIT_03s0063g01890	२०६८	0	F6HQI8	३९६	pxc	1
VviATL82	VIT_01s0026g02540	८२०	0	F6HPQ9	२३३	पीसी	०.५
VviATL83	VIT_17s0000g08400	१८८७	0	F6GSQ4	१४३	पीसी	0
VviATL84	VIT_06s0004g00120	१८५३	0	F6GUP5	३६८	पीसी	०.५	zf-RING_3
VviATL85	VIT_12s0034g01400	७८६	0	F6H965	२६१	पीसी	०.५
VviATL86	VIT_12s0034g01390	१४३४	1	D7T016	४५१	पीसी	०.५
VviATL87	VIT_18s0001g03270	१००२	0	F6H0T2	३३३	पीसी	०.५	zf-RING_3
VviATL88	VIT_08s0040g00590	१३२०	0	F6HQR2	३१४	पीसी	0	zf-RING_3

तालिका 1: पहले 20 VviATL जीन और इसी प्रोटीन के अनुक्रम विशेषताओं । TM: transmembrane; ज: hydrophobic; ०.५ एक या अधिक hydrophobic क्षेत्रों की उपस्थिति को इंगित करता है । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त ।

Table 2
तालिका 2: विवरण पहले 20 पर VviATL जीन में स्थिति V. द्राक्षा जीनोम, दोहराव राज्य, और ATL प्रोटीन फिजिको-रासायनिक विशेषताओं और स्थान । (क) Musite द्वारा अनुमानित फास्फारिलीकरण स्थलों की संख्या; (b) समान भविष्यवाणियों के साथ कम से प्राप्त दो सॉफ़्टवेयर बोल्ड में हाइलाइट किए गए हैं; ngLOC डिफ़ॉल्ट सेटिंग्स के साथ प्रयोग किया जाता था, जबकि TargetP v 1.1 और प्रोटीन Prowler उपसेलुलर स्थानीयकरण ०.५ की संभावना के एक कट-ऑफ के साथ इस्तेमाल किया गया । NUC, नाभिक; एमआईटी, mitochondria; CHL, chloroplast; पीएलए, प्लाज्मा झिल्ली; एस, स्रावी मार्ग (एक संकेत पेप्टाइड की उपस्थिति); मी, mitochondria; ग, chloroplast; O या-, अं य स् थान; एनडी, निर्धारित नहीं (यानी, दहलीज के नीचे मूल्य). Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

पहचान की चर्चा atl के न्यूक्लियोटाइड दृश्यों सहित एक वंशावली विश्लेषण-संदर्भ के अनुक्रम के साथ एक साथ एंकोडिंग जीन A. थालियाना atl जीन परिवार चर्चा atl नामकरण के लिए इस्तेमाल किया गया था, के दिशा निर्देशों के अनुसार sNCGGa⁸. ९६ और ८३ न्यूक्लियोटाइड से अनुक्रम V. द्राक्षा और a. थालियाना, क्रमशः, Phylogeny.fr पाइप लाइन के लिए एक विश्वसनीय वंशावली पेड़ प्राप्त करने के लिए अधीन थे ।बाद के दृश्यों के बाद व्याख्या करने के लिए और ठोस संबंधों के आधार पर चर्चा जीन नाम (चित्रा 2) किया गया । इस दृष्टिकोण के बाद, 13 से बाहर ९६ चर्चा ATLs एक विशिष्ट पहचानकर्ता प्राप्त एक एक-से-एक orthology एक . थालियाना ATL के साथ । अंय ८३ जीन के नाम वंशावली पेड़ के आधार पर असाइन किए गए थे, ऊपर से नीचे तक एक प्रगतिशील क्रमांकन के साथ, एक ATL जीन संख्या से प्रारंभ कर रहा है सबसे अधिक a. थालियानामें प्रयुक्त संख्या से अधिक है ।

चित्रा 2: वंशावली ट्री V. द्राक्षा और ए. थालियाना ATL E3 ubiquitin ligase-एंकोडिंग जीन । अनजड़ें पेड़ Phylogeny.fr सुइट (V. द्राक्षा (हरे रंग में) और ८३ ATL जीन के साथ उत्पन्न किया गया था A. थालियाना में रिपोर्ट की UniProt डेटाबेस (पीले में). शाखा समर्थन मान १०० बूटस्ट्रैप प्रतिकृति से प्राप्त किए गए थे । लाल तारे इसी प्रोटीन में BCA2 जिंक फिंगर (BZF) डोमेन की उपस्थिति दर्शाते हैं । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

मानचित्रण atl-चर्चा गुणसूत्रों एंकोडिंग जीन के जीनोम भर में एक व्यापक वितरण दिखाया, दाखलता में ATL जीन परिवार के विस्तार में प्रमुख विकासवादी बल के रूप में पूरे जीनोम दोहराव का सुझाव । दरअसल, 31 ATLs मुताबिक़ गुणसूत्र क्षेत्रों में संभावित फॉल्ट या पूरे जीनोम दोहराव की घटनाओं से उत्पंन पाया गया । इसके अलावा, एक ही विश्लेषण 13 मिलकर दोहराया जीन, एक समीपस्थ डुप्लिकेट, और ५१ फैलाया डुप्लिकेट (चित्रा 3) पर प्रकाश डाला. ATL परिवार में डुप्लिकेट जीन की बहुत बड़ी संख्या को ध्यान में रखते हुए, हम एक संवर्धन परीक्षण (फिशर सटीक परीक्षण) के लिए जीनोम भिंन के दौरान दोहराया जीन की तरजीही प्रतिधारण की जांच प्रदर्शन किया । a p-मान & #60; ०.००१, इस परीक्षण की परिकल्पना की पुष्टि की है कि दोहराया atl जीन से अधिक बेतरतीब ढंग से बनाए रखा गया था, चर्चा अनुकूलन और विकास के दौरान atl जीन परिवार के लिए एक भूमिका का सुझाव ।

चित्र 3: चर्चा ATL-एंकोडिंग जीन वितरण V. द्राक्षा गुणसूत्रों और दोहराव स्थिति पर । ९६ चर्चा ATL जीन डेटाबेस में उपलब्ध सटीक गुणसूत्र जानकारी के साथ 19 V. द्राक्षा गुणसूत्रों के लिए मैप किए गए थे । रंग मूल दोहराव ईवेंट का संकेत देते हैं । ऊर्ध्वाधर काले लाइनों और लाल लाइनों क्रमशः मिलकर दोहराव और पूरे जीनोम दोहराव से व्युत्पंन जोड़े की पहचान । Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

आगे चर्चा में ATLs के ख्यात जैविक कार्यों की जांच करने के लिए, एक मेटा-विश्लेषण V. द्राक्षा cv. Corvina ग्लोबल जीन अभिव्यक्ति एटलस¹²पर किया गया था । डेटासेट ५४ विभिन्न चर्चा अंगों और विकासात्मक चरणों के पूरे जीनोम अभिव्यक्ति मान शामिल हैं और एक पदानुक्रम द्वि-clustered विश्लेषण करने के लिए उपयोग किया गया था । परिणाम न केवल पुष्टि की है कि सभी ९६ ATLs में व्यक्त किए गए थे ५४ ऊतकों/चरणों में से एक है, लेकिन यह भी अभिव्यक्ति प्रोफाइल (चित्रा 4a) के पांच मुख्य समूहों की उपस्थिति की ओर इशारा किया. संक्षेप में, समूहों ए और ई विपरीत व्यवहार दिखाया, विशेष रूप से पहली बार बेरी चरणों, युवा पत्ती, tendrils, फूलना, और कली चरणों का सबसे सहित किशोर के नमूनों में ATL जीन की एक सामांय downregulation की विशेषता है । दूसरी ओर, एक ही क्लस्टर में एक, पकने और बाद फसल मुरझाने चरणों, वुडी ऊतकों, और बीज विकास ATL जीन की देर चरणों में जामुन के रूप में परिपक्व नमूने एक प्रमुखता के ऊपर विनियमन दिखाया । क्लस्टर सी में जीन मुख्य रूप से नमूनों में से अधिकांश में downregulated थे, जबकि क्लस्टर डी में ATL जीन अक्सर बेरी विकास के देर से चरणों में विनियमित थे । अंत में, क्लस्टर B कोई भी प्रासंगिक भिंनता अभिव्यक्ति प्रोफ़ाइल में नहीं दिखा ।

इस उद्देश्य के लिए बनाए गए विशिष्ट datasets का उपयोग करते हुए, बायोटिक और अजैव तनाव के जवाब में चर्चा ATL परिवार के सदस्यों की अभिव्यक्ति का अध्ययन करने के लिए एक समान दृष्टिकोण लागू किया गया था । microarray और आरएनए-seq प्रयोगों से प्राप्त अभिव्यक्ति डेटा की एक बड़ी राशि सार्वजनिक पहुँच डेटाबेस जैसे जीन एक्सप्रेशन सर्वग्राही (भू) और ArrayExpress से उपलब्ध हैं. एक बार एकत्र और आसानी से सामान्यीकृत, जानकारी संयंत्र प्रतिक्रिया में ATLs के संभावित समारोह में आगे अंतर्दृष्टि के लिए शोषण किया गया था तनाव । बायोटिक तनाव के जवाब में चर्चा ATLs की अभिव्यक्ति प्रोफाइल का विश्लेषण से पता चला कि ६२ ९६ टेप से बाहर एक महत्वपूर्ण मॉडुलन दिखाया (log2 गुना-परिवर्तन (एफसी) & #62;| ०.५ ।) कम से दो स्थितियों में, एक झूठी डिस्कवरी दर के साथ (एफडीआर) & #60; ०.०५ ( चित्रा 4B). संख्या बढ़ाता है केवल एफडीआर थ्रेशोल्ड एक ही स्थिति में विचार ८१ करने के लिए । ये परिणाम दृढ़ता से भी चर्चा में रोगजनकों के जवाब में ATL जीन परिवार की एक सीधी भागीदारी का सुझाव दिया । विशेष रूप से, 12 जीन (VviATL3-27-54b-55-90-97-123-144-148-149-156) के एक समूह के अधिकांश रोगजनकों, biotrophic और necrotrophic कवक और शाकाहारी सहित, के जवाब में दृढ़ता से विनियमित थे, और इस प्रकार, आगे कार्यात्मक के लिए ध्यान लायक िरा.

चित्रा 4: पदानुक्रमित clusteringof ATL जीन अभिव्यक्ति में चर्चा एटलस और चर्चा में बायोटिक तनाव से संबंधित डेटासेट. (क) लॉग में तब्दील चर्चा ATL जीन की अभिव्यक्ति मूल्यों चर्चा एटलस¹² पियरसन की दूरी मीट्रिक पर आधारित पदानुक्रमित क्लस्टर विश्लेषण के लिए इस्तेमाल किया गया. रंग पैमाने पर उच्च (लाल) या कम (हरी) अभिव्यक्ति के स्तर का प्रतिनिधित्व करता है सभी नमूनों भर में प्रत्येक जीन की औसत प्रतिलेखन बहुतायत के संबंध में । अक्षर A को दाईं ओर ई के लिए अलग पहचाने गए क्लस्टर इंगित करता है ।AB: फटने के बाद; ख: फट; बड-W: शीतकालीन कली; च: फूल; FB: फूल शुरू होता है; FS: फल सेट; छ: हरा; श्री: मध्य पकने; PFS: पोस्ट फल सेट; PHWI-II-III: कटाई के बाद 1, 2 और 3 महीने सूख; आर: पकने; S: होनेवाला; स्टेम-डब्ल्यू: वुडी स्टेम; वि: veraison; WD: अच्छी तरह से विकसित; Y: युवा । (B) रंग स्केल का प्रतिनिधित्व करता है वृद्धि हुई (लाल) या कम (नीला) संक्रमित नमूनों में चर्चा ATL जीन अभिव्यक्ति के परिवर्तनों को प्रत्येक शर्त के लिए नियंत्रणों की तुलना में मोड़ता है । तारांकन संबंधित शर्तों के अंतर्गत प्रत्येक ATL के महत्वपूर्ण अवकलन व्यंजक (एफडीआर & #60; ०.०५) इंगित करता है. Ariani एट अल से reproduced. एक क्रिएटिव कॉमंस रोपण ४.० अंतर्राष्ट्रीय लाइसेंस^४२के तहत लाइसेंस प्राप्त । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

अनुपूरक तालिका 1: ATL जीन वैकल्पिक ब्याह के लिए उंमीदवारों । (क) atl जीन आईडी V1 अंगूर जीन पूर्वानुमान और एनोटेशन के अनुसार, (b) atl जीन पहचान के अनुसार V2 अंगूर जीन पूर्वानुमान और एनोटेशन^४३, (c) ख्यात ATL वैकल्पिक ब्याह वेरिएंट की संख्या, (d) प्रत्येक ख्यात ATL वैरिएंट के अनुक्रम कोडिंग पर जानकारी । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक तालिका 2: इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फ़ाइल 1: इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

जीनोमिक युग में अनेक जीन परिवारों में कई प्रजातियों के पौधे का गहराई से वर्णन किया गया है । यह जानकारी कार्यात्मक अध्ययन करने के लिए प्रारंभिक और एक परिवार में विभिन्न सदस्यों की भूमिका आगे की जांच करने के लिए एक फ्रेम प्रदान करते हैं । इस संदर्भ में, वहां भी एक नामकरण के लिए अद्वितीय रूप से एक परिवार में प्रत्येक सदस्य की पहचान की अनुमति प्रणाली के लिए एक की जरूरत है, अतिरेक और भ्रम है कि पैदा हो सकता है जब नाम स्वतंत्र रूप से अलग जीन के लिए विभिंन अनुसंधान समूहों द्वारा सौंपा है परहेज ।

विचारशील विचार के बाद, चर्चा वैज्ञानिक समुदाय के लिए एक Arabidopsis जीन के साथ समानता के आधार पर परिवार में चर्चा जीन नाम पर सहमत हुए और नियमों की एक श्रृंखला है कि चर्चा में नए जीन परिवारों का वर्णन लागू किया जाना चाहिए की स्थापना की, मूल रूप से चर्चा और Arabidopsis परिवार के सदस्यों के बीच न्यूक्लियोटाइड दृश्यों के वंशावली तुलना से शुरू⁸। इसलिए, केवल जीन है कि पहले से ही व्याख्या कर रहे है और ठीक से Arabidopsis में नाम चर्चा नामकरण में इस्तेमाल किया जा सकता है । प्रक्रिया Arabidopsis में चर्चा ATL orthologues की पहचान के लिए आवेदन किया था यहां वर्णित इसलिए सही चर्चा जीन परिवार के नामकरण निर्दिष्ट की आवश्यकता को पूरा करने के लिए पूरी तरह से किए गए । फिर भी, अंय प्रजातियों के पौधे के लिए, वैकल्पिक दृष्टिकोण एक विकल्प हो सकता है । उदाहरण के लिए, orthology एक द्वि-दिशा विस्फोट हिट (BBH) का उपयोग कर आस्थगित किया जा सकता है, जहां orthologues दो प्रजातियों में जीन के जोड़े के रूप में परिभाषित कर रहे हैं कि अधिक समान हैं (यानी, उच्चतम संरेखण स्कोर के साथ) अन्य में किसी अन्य जीन की तुलना में एक दूसरे के लिए प्रजातियों^४४। हालांकि, इस पद्धति के पौधों और जानवरों में^४५के रूप में जीन दोहराव की उच्च दर के मामले में कई orthologues याद कर सकते हैं । इसके अलावा, ATL एंकोडिंग जीन के मामले में, BBH सटीक ATL-प्रकार की अंगूठी-H2 संरचना की कमी जीन पुनः प्राप्त कर सकते है (सहित लाइन अवशेषों) या जीन है कि व्याख्या और Arabidopsis में ATLs के रूप में नाम नहीं हैं । हालांकि एक विकासवादी परिप्रेक्ष्य से इस खोज प्रासंगिक हो सकता है, orthologues की बहाली कि व्याख्या ATL जीन परिवार एनोटेशन और नामकरण की गुंजाइश पूरी नहीं होता है, और orthologues कि ATLs के रूप में व्याख्या नहीं कर रहे है नहीं कर रहे है चर्चा परिवार के सदस्यों के नाम के लिए इस्तेमाल नहीं किया जा सकता । एक अंय संभावना के बजाय न्यूक्लियोटाइड पागल^४६, या सबसे हाल ही में Hieranoid 2^४७का उपयोग कर दृश्यों के अमीनो एसिड के आधार पर orthology अनुमान है, हालांकि ऐसे वर्कफ़्लोज़ स्पष्ट रूप से वैज्ञानिक समुदाय द्वारा की सिफारिश नहीं कर रहे हैं ।

अभिव्यक्ति मेटा-विश्लेषण, जो एक व्यवस्थित दृष्टिकोण के रूप में परिभाषित किया जा सकता है अध्ययन करने के लिए और अभिव्यक्ति डेटा के विभिंन सार्वजनिक रूप से उपलब्ध डेटासेट खजाने गठबंधन, शर्तों के विभिंन प्रकार में साझा और विभिंन आणविक तंत्र को उजागर करने की अनुमति देता है । इस प्रकार, कई बड़े पैमाने पर transcriptomic प्रयोगों से जीन अभिव्यक्ति की जानकारी के एकीकरण के प्रयोगों में परिवार के सदस्यों की अभिव्यक्ति प्रोफाइल को परिभाषित करके, एक जीन परिवार के लक्षण वर्णन में सुधार कर सकते हैं, इस प्रकार कम प्रयोग विशेष कारकों का प्रभाव है और विशेष रूप से प्रक्रियाओं में ख्यात जीन समारोह का एक और अधिक मजबूत धारणा का समर्थन । तथापि, microarray डेटा के उपयोग के लिए विभिंन प्लेटफार्मों के साथ प्राप्त अभिव्यक्ति डेटा के एकीकरण की आवश्यकता है, अपनी सीमाओं पर विचार । उदाहरण के लिए, चर्चा Nimblegen microarray मंच, इसी सरणी (~ १३,००० जीन) पर प्रतिनिधित्व जीन के लिए probesets का एक महत्वपूर्ण अनुपात में संभावित पार है संकरण मुद्दों^४८। चर्चा ATL परिवार के मामले में, 15 जीन ऐसी घटना से प्रभावित हो सकता है । फिर भी, के रूप में Cramer एट अल द्वारा चर्चा की । ^४८, पार एक ही जांच द्वारा अत्यधिक समान जीन परिवार के सदस्यों की पहचान दिलचस्प अभिव्यक्ति के बारे में जानकारी प्रदान कर सकता है, विशिष्ट परिस्थितियों में, एक भी जीन की ही नहीं, लेकिन दो से अधिक उच्च अनुक्रम साझा जीन के लिए समानताएं, और इस प्रकार संभावित लक्ष्य और कार्य साझा । microarray डेटासेट से संबंधित एक और संभावित मुद्दा microarray प्लेटफार्मों की अभिव्यक्ति की पहचान की सीमा है, जो बहुत संवेदनशील नहीं हैं । दोनों चिंताओं, यानी, क्रॉस-संकरण और सिग्नल संवेदनशीलता को हल करने के लिए, एक संभावित समाधान केवल RNAseq व्यंजक डेटासेट पर विचार करने के लिए हो सकता है । हालांकि, बहुत से विभिंन अध्ययनों से बहुत बड़े डेटासेट के RNAseq डेटा का मेटा-विश्लेषण अत्यधिक समय लेने वाला बन सकता है और कई गणनात्मक संसाधनों और उच्च विशेषज्ञता की आवश्यकता हो सकती है ।

हालांकि यहां प्रस्तुत दृष्टिकोण को संपूर्ण होना चाहिए, यह निश्चित रूप से आगे अंय विश्लेषण के साथ पूरित किया जा सकता है । सबसे पहले, आणविक विकास और पौधों में जीन परिवार के सदस्यों के बीच वंशावली रिश्ते में अंतर्दृष्टि प्राप्त करने के लिए, वंशावली विश्लेषण एक वंशावली परिवार के सदस्यों के कई अनुक्रम संरेखण का उपयोग कर पेड़ का निर्माण बढ़ाया जा सकता है कई प्रजातियों के पौधे से । यह भी परिवार के जीन के विकासवादी समय की गणना करने के लिए संभव है, विकास के दौरान उनके पर्यायी और गैर पर्यायवाची प्रतिस्थापन दरों का एक अनुमान, मूल्यों के निर्धारण के द्वारा (समानार्थी साइट प्रति समानार्थी प्रतिस्थापन की संख्या में एक दिया समय की अवधि) और (एक ही अवधि में गैर-पर्यायवाची साइट प्रति पर्यायवाची प्रतिस्थापन की संख्या) का मीत । Ka/Ks अनुपात को अपने पूर्वजों से विचलन के बाद जीन दोहराव की घटनाओं के तंत्र का अनुमान लगाने के लिए प्रयोग किया जाता है । ka/ks = 1 का मान तटस्थ चयन का सुझाव देता है, & #60 का एक मीत/; 1 शुद्ध चयन का सुझाव देता है, और & #62 का एक ka/ks मान; 1 सकारात्मक चयन का सुझाव देता है^४९। इसके अलावा, यदि जीन संरचना विश्लेषण introns की उपस्थिति से पता चलता है, जीन परिवार लक्षण वर्णन आगे वैकल्पिक ब्याह वेरिएंट का पता लगाने के लिए बढ़ाया जा सकता है । दरअसल, विभिन्न ऊतकों से आरएनए-seq डेटा के एक गहरे सर्वेक्षण पर आधारित, तनाव की स्थिति और पादी^४३, 21 (९६ के) ATLs वैकल्पिक ब्याह की घटनाओं के लिए मजबूत उंमीदवारों रहे हैं, isoforms की संभावित संख्या के साथ 2 से लेकर 16 इन ATLs के लिए (देखें अनुपूरक तालिका 1) । वैकल्पिक टेप अक्सर प्रोटीन isoforms कि एमिनो एसिड अनुक्रम में बदलती है और इन परिवर्तनों प्रोटीन के सेलुलर गुण बदल सकते है और सूक्ष्म मॉडुलन से जीन उत्पाद के समारोह के नुकसान के कारण परिवर्तन का उत्पादन हो सकता है । कि कारण के लिए, वैकल्पिक ब्याह की घटनाओं महत्वपूर्ण संयंत्र कार्यों में शामिल किया गया है, तनाव प्रतिक्रिया सहित, रोग प्रतिरोध, प्रकाश संश्लेषण, और फूल^५०^,^५१।ATL जीन प्रमोटर जानकारी है कि ख्यात सीआईएस-विनियामक तत्वों^५२ या अणुओं को खोजने के एकीकरण (उदा., microRNA और लंबे समय गैर-कोडिंग आरएनए) संभावित रूप से लक्ष्यीकरण ATLs^५३ को भी पूरक किया जा सकता है जटिल आणविक विनियमन और चर्चा ATLs की बातचीत में प्रणाली अंतर्दृष्टि प्रकट करते हैं ।

अंत में, विश्लेषण के विकल्प के रूप में के रूप में अच्छी तरह से प्रदर्शन के लिए प्रक्रियाओं के लिए एक संयंत्र प्रजातियों में एक नया जीन परिवार विशेषताएं लागू हो मुख्य रूप से वैज्ञानिक समुदाय के नियमों के रूप में के रूप में अच्छी तरह से जीन परिवार की पहचान के दायरे से संचालित कर रहे हैं । यह संभव बाद जांच कदम है, जो सूचना के सेट का दोहन होगा, जो बीच में संयंत्र प्रजातियों, जीनोम संरचना विवरण, या कार्यात्मक में चयन के लिए विश्वसनीय उंमीदवारों के बीच जीन विकास भी शामिल है ध्यान में रखना महत्वपूर्ण है पढ़ाई.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

काम संयुक्त परियोजना २०१४ के फ्रेम के भीतर वेरोना विश्वविद्यालय द्वारा समर्थित किया गया था (चर्चा में ATL जीन परिवार के लक्षण वर्णन और Plasmopara viticolaके लिए प्रतिरोध में अपनी भागीदारी के) ।

Materials

Name	Company	Catalog Number	Comments
Personal computer
Basic Local Alignment Search Tool (BLAST)			https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA)			http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME)			http://meme-suite.org/
Geneious	Biomatters Limited		http://www.geneious.com/
ProtParam Tool			http://web.expasy.org/protparam/
ngLOC			http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server			http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler			http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite			http://musite.sourceforge.net/
Pfam			http://pfam.xfam.org/
TMHMM Server v. 2.0			http://www.cbs.dtu.dk/services/TMHMM/
ProtScale			http://web.expasy.org/protscale/
Grape Genome Database (CRIBI)			http://genomes.cribi.unipd.it/grape/
PhenoGram			http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX			http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL)			http://itol.embl.de/
UniProt			http://www.uniprot.org/
Phylogeny.fr			http://www.phylogeny.fr/index.cgi
MUSCLE			http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server			http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix			https://www.researchgate.net/publication/273383414_54sample_ datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV)			http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA)			https://www.ncbi.nlm.nih.gov/sra
R			https://www.r-project.org/
EMBOSS Needle (EMBL-EBI)			http://www.ebi.ac.uk/Tools/psa/emboss_needle/

DOWNLOAD MATERIALS LIST

References

Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. , Science Publishers. 211-234 (2011).
Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
BLAST. BLAST2.6.0. , Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
MEGA. MEGA7.0.25 build 7170412. , Available from: http://www.megasoftware.net/ (2017).
MEME. MEME Suite Version 4.11.4. , Available from: http://meme-suite.org/ (2017).
ProtParam. ExPASy Server. , Available from: http://web.expasy.org/protparam/ (2005).
ngLOC v1.0. , Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
TargetP v1.1 Server. , Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
Prowler v1.2. , Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
MuSite v1.0. , Available from: http://musite.sourceforge.net/ (2010).
Pfam. Pfam version 31.0. , Available from: http://pfam.xfam.org/ (2016).
TMHMM v2.0c. , Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
ExPASy. ProtScale. , Available from: http://web.expasy.org/protscale/ (2005).
CRIBI. Grape genome database. , Available from: http://genomes.cribi.unipd.it/grape/ (2012).
PhenoGram. , Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
ScanX v0.8. , Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
Interactive Tree Of Life (iTOL). Version3.5.3. , Available from: http://itol.embl.de/ (2016).
UniProt. , Available from: http://www.uniprot.org/ (2016).
Phylogeny.fr. , Available from: http://www.phylogeny.fr/index.cgi (2008).
MUSCLE. , Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
Gblocks Server. Version 0.91b. , Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
Vitis vinifera cv. Corvina gene expression Atlas. , Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
Multiple Experiment Viewer (MeV). Version 4.8.1. , Available from: http://mev.tm4.org/ (2017).
Sequence Read Archive (SRA). , Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
R. Version 3.4.1. , Available from: https://www.r-project.org/ (2017).
Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
EMBL-EBI. EMBOSS Needle. , Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Biology

जीनोम-वाइड पहचान और अभिव्यक्ति मेटा-विश्लेषण के लिए व्यापक कार्यप्रवाह ATL E3 के Ubiquitin Ligase जीन परिवार में चर्चा

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.