Waiting
Traitement de la connexion…

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Behavior

बनाने और चर्चा और एक विविध समूह में प्रोटीन के वर्गीकरण की सुविधा के लिए एक संदर्भ लागू

Published: August 16, 2017 doi: 10.3791/56107

Summary

इस प्रोटोकॉल का लक्ष्य एक समूह है कि नामकरण और वर्गीकरण के लिए सुसंगत मानदंडों का अभाव में अलग प्रोटीन के लिए एक संदर्भ विकसित करना है । इस संदर्भ में एक पूरे के रूप में समूह के विश्लेषण और चर्चा की सुविधा होगी और स्थापित नामों के अलावा इस्तेमाल किया जा सकता है ।

Abstract

अलग जीवों का उपयोग कर विभिन्न प्रयोगशालाओं में अध्ययन किया गया है कि संबंधित प्रोटीन नामकरण और वर्गीकरण की एक समान प्रणाली की कमी हो सकती है, यह मुश्किल एक पूरे के रूप में समूह पर चर्चा करने के लिए और उपयुक्त संदर्भ में नए दृश्यों जगह करने के लिए बना. संरचना और/या गतिविधि से संबंधित महत्वपूर्ण अनुक्रम सुविधाओं को प्राथमिकता देने वाले एक संदर्भ का विकास करने के लिए स्थापित नामों के अलावा इस्तेमाल किया जा सकता है प्रोटीन के एक विविध समूह के लिए कुछ अनुकूल जोड़ें । इस पेपर का उपयोग करता है cysteine-अल्फा स्थिर-कुंडलित (CS-αβ) superfamily एक उदाहरण के रूप में दिखाने के लिए कैसे एक स्प्रेडशीट सॉफ्टवेयर में उत्पंन संदर्भ superfamily में मौजूदा प्रोटीन के बीच संबंधों को स्पष्ट कर सकते हैं, साथ ही साथ नए के अलावा की सुविधा जुगाड़. यह भी दिखाता है कि कैसे संदर्भ सामांय रूप से इस्तेमाल किया सॉफ्टवेयर, जो वंशावली विश्लेषण की वैधता प्रभावों में उत्पंन अनुक्रम संरेखण को परिष्कृत करने में मदद कर सकते हैं । एक संदर्भ के उपयोग की संभावना प्रोटीन समूहों है कि taxa की एक व्यापक स्पेक्ट्रम से अत्यधिक अलग अनुक्रम शामिल हैं, सुविधाओं है कि पर्याप्त रूप से आणविक विश्लेषण द्वारा कब्जा नहीं कर रहे है के साथ के लिए सबसे उपयोगी होगा ।

Introduction

एक प्रोटीन का नाम दर्शाना चाहिए विशेषताओं और अंय प्रोटीन के संबंध है । दुर्भाग्य से, नाम आम तौर पर खोज के समय में सौंपा जाता है और, के रूप में अनुसंधान जारी है, बड़े संदर्भ की समझ बदल सकते हैं । यह कई नामों के लिए नेतृत्व कर सकते हैं अगर एक प्रोटीन स्वतंत्र रूप से एक से अधिक प्रयोगशाला द्वारा पहचान की गई थी, नामकरण में या विशेषताओं में परिवर्तन करने के लिए निश्चित है जब नाम निर्दिष्ट करने के लिए सोचा, और नाम के लिए पर्याप्त प्रोटीन अंतर नहीं रह दूसरों से ।

Invertebrate defensins नामकरण और वर्गीकरण में अध-पतन का एक अच्छा उदाहरण प्रदान करते हैं । पहले invertebrate defensins कीड़ों से सूचित किया गया था, और नाम "कीट defensin" स्तनधारी defensins1,2के लिए कथित समरूपता के आधार पर प्रस्तावित किया गया था । शब्द defensin अभी भी प्रयोग किया जाता है, हालांकि अब यह स्पष्ट है कि invertebrate और स्तनधारी defensins एक आम पूर्वज3,4हिस्सा नहीं है । प्रजातियों के आधार पर, एक invertebrate "defensin" छह या आठ cysteines (है कि तीन या चार डाइसल्फ़ाइड बांड फार्म) और रोगाणुरोधी गतिविधियों की एक किस्म हो सकता है । इस स्थिति को जटिल करने के लिए, defensins के रूप में एक ही विशेषताओं के साथ प्रोटीन हमेशा "defensins," जैसे कि हाल ही में पहचान cremycins से Caenorhabditis remanei5के रूप में नहीं कहा जाता है । इसके अलावा, invertebrate बड़े defensins हड्डीवाला β-defensins के लिए अन्य invertebrate defensins6से संबंधित evolutionarily होने की संभावना है । इस के बावजूद, शोधकर्ताओं ने कई बार नाम "defensin" जब निर्धारण जो जुगाड़ में विश्लेषण में शामिल किया जाना चाहिए पर भरोसा करते हैं ।

संरचनात्मक अध्ययन कीट defensins और बिच्छू विषाक्त पदार्थों के बीच समानता से पता चला7, और सीएस-αβ गुना बाद में कीट defensins की परिभाषित संरचनात्मक विशेषता के रूप में स्थापित किया गया था8. इस गुना बिच्छू विष की तरह (CS-αβ) superfamily प्रोटीन के संरचनात्मक वर्गीकरण में परिभाषित करता है (SCOP) डेटाबेस9, जो वर्तमान में पांच परिवारों में शामिल हैं: कीट defensins, लघु श्रृंखला बिच्छू विषाक्त पदार्थों, लंबी श्रृंखला बिच्छू विषाक्त पदार्थों, MGD-1 (एक मोलस्क से), और संयंत्र defensins । यह superfamily हाल ही में वर्णित सीआईएस-defensins4 और superfamily 3.30.30.10 में कैथ/जीन 3d डाटाबेस10,11के साथ पर्याय है । invertebrate taxa, पौधों की एक किस्म से अध्ययन, और कवक बताते है कि प्रोटीन है कि इस गुना शामिल के नाम स्पष्ट रूप से cysteine संख्या या बांडिंग पैटर्न, रोगाणुरोधी गतिविधि, या विकासवादी इतिहास से संबंधित नहीं है12

निरंतरता और स्पष्ट मानदंडों का अभाव यह नाम और इस superfamily में नव पहचान दृश्यों वर्गीकृत करने के लिए चुनौतीपूर्ण बनाते हैं । इस superfamily में प्रोटीन की तुलना करने के लिए एक प्रमुख बाधा यह है कि cysteines प्रत्येक व्यक्ति अनुक्रम (प्रत्येक अनुक्रम में पहली cysteine C1 है) के संबंध में गिने जाते हैं, संरचनात्मक भूमिका के लिए खाते में कोई रास्ता नहीं है । इसका मतलब यह है कि केवल cysteines की संख्या के साथ दृश्यों की तुलना की जा सकती है । वहां थोड़ा अनुक्रम सीएस-αβ गुना है, जो बनाता है cysteines और वंशावली विश्लेषण मुश्किल के गठन के अलावा अंय संरक्षण है । एक नंबर प्रणाली है कि संरचनात्मक सुविधाओं को प्राथमिकता के विकास के द्वारा, superfamily दृश्यों और अधिक आसानी से की तुलना में और गठबंधन किया जा सकता है । संरक्षित सुविधाओं, साथ ही उन उपसमूह को परिभाषित करने, जल्दी से visualized किया जा सकता है, और नए दृश्यों और अधिक आसानी से उपयुक्त संदर्भ में रखा जा सकता है ।

यह काग़ज़ किसी स्प्रेडशीट सॉफ़्टवेयर (उदा., Excel) का उपयोग CS-αβ superfamily के लिए एक संदर्भ क्रमांकन सिस्टम जनरेट करने के लिए करता है । यह दिखाता है कि यह कैसे अनुक्रम के बीच तुलना स्पष्ट और नए सीएस-αβ tardigrades से पहचाना दृश्यों पर लागू होता है । एक उदाहरण के रूप में सीएस-αβ superfamily का उपयोग करना, प्रोटोकॉल जब ब्याज के अनुक्रम का उपयोग कर मार्गदर्शन प्रदान करने के लिए लिखा गया था; हालांकि, यह इस superfamily करने के लिए या cysteine-रिच अनुक्रम के लिए विशिष्ट होना करने के लिए लक्षित नहीं है । इस विधि की संभावना सबसे अधिक प्रोटीन है कि अलग taxa में स्वतंत्र रूप से शोध किया गया है के समूहों के लिए उपयोगी हो जाएगा और/या थोड़ा समग्र अनुक्रम समरूपता है, असतत विशेषताओं है कि आसानी से आणविक विश्लेषण सॉफ्टवेयर द्वारा मांयता प्राप्त नहीं हो सकता है के साथ । इस विधि में महत्वपूर्ण सुविधाओं के संबंध में कुछ एक प्राथमिकताओं निर्णय की आवश्यकता है, तो यह सीमित उपयोगिता का होगा यदि कोई महत्वपूर्ण सुविधाओं की पहचान की गई है । प्राथमिक लक्ष्य दिखाने के लिए कैसे अनुक्रम संबंधों का एक सरल दृश्य प्राप्त किया जा सकता है । यह तो अनुक्रम संरेखण और विश्लेषण को सूचित करने के लिए इस्तेमाल किया जा सकता है, लेकिन यदि संरेखण और विश्लेषण प्राथमिक लक्ष्य हैं, एक बारकोड विधि एक उपयुक्त विकल्प है कि13स्वचालन के लिए और अधिक क्षमता है होगा । वर्तमान विधि एक रैखिक रूप में प्रत्येक पेप्टाइड की सुविधाओं को प्रदर्शित करता है, तो यह 3d संरचना के प्रत्यक्ष दृश्य के लिए उपयोगी नहीं होगा.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

< p class = "jove_title" > 1. ब्याज के प्रोटीन समूह की परिभाषित सुविधाओं को निर्धारित करें

  1. पिछले प्रकाशनों से परामर्श करने के लिए निर्धारित अगर वहां सुविधाओं है कि समूह का हिस्सा माना जा करने के लिए आवश्यक है के बारे में आम सहमति है । किसी भी असंगतता या अनुसंधान समूहों के बीच राय में अंतर का ध्यान रखें, और विशेषताओं है कि एक उपसमूह दूसरे से अंतर करने के लिए सेवा कर सकते है शामिल हैं ।
  2. यदि पिछले साहित्य को परिभाषित करने विशेषताओं का पता नहीं है, का उपयोग अनुक्रम है कि समूह के प्रतिनिधि माना जाता है एक प्रारंभिक बिंदु के रूप में संरक्षित सुविधाओं की पहचान करने के लिए ।
< p class = "jove_title" > 2. लीजिए प्रासंगिक जुगाड़

  1. यदि समीक्षाएँ लिखी गई हैं जो समूह का प्रतिनिधित्व करने वाले दृश्यों का विश्लेषण शामिल करती हैं, तो इन दृश्यों को कच्चे डेटासेट में शामिल करें. साहित्य में संदर्भित प्रवेश संख्या का उपयोग कर अनुक्रम निकालते हैं और एक मानक अनुक्रम संपादन कार्यक्रम में सहेजें ( उदा., Lasergene सुइट में EditSeq या मुफ्त ऑनलाइन के लिए उपलब्ध कई में से एक).
  2. में एक संरचनात्मक डेटाबेस में समूह निर्धारित किया गया है, तो अनुक्रम डेटाबेस सूची समूह का भाग होने के रूप में शामिल हैं । & #160; डेटाबेस में प्रदान की गई पहुंच संख्या का उपयोग कर अनुक्रम पुनर्प्राप्त करें और एक मानक अनुक्रम संपादन में सहेजें कार्यक्रम, के रूप में ऊपर ।
    नोट: उदाहरण के लिए, सीएस में वर्गीकृत अनुक्रम-& #945; & #946; (बिच्छू विष की तरह) SCOP डाटाबेस में superfamily यहां पाया जा सकता है: http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.h.c.h.html. & #160;
  3. बुनियादी स्थानीय प्रदर्शन संरेखण खोज उपकरण (ब्लास्ट) < सुप वर्ग = "xref" > 14 लोक, ऑनलाइन जैव प्रौद्योगिकी सूचना (NCBI) के लिए राष्ट्रीय केंद्र के माध्यम से उपलब्ध डेटाबेस की खोज के लिए अनुक्रम है कि साहित्य या संरचनात्मक में शामिल नहीं किया गया है हो सकता है खोजने के लिए डेटाबेस. सबसे पूर्ण परिणाम के लिए, दोनों प्रोटीन विस्फोट (blastp) और प्रोटीन क्वेरी (tblastn) कार्यक्रमों के साथ अनुवाद विस्फोट का उपयोग करें; ये दोनों में उपलब्ध हैं: https://blast.ncbi.nlm.nih.gov/Blast.cgi.
    1. क्वेरी अनुक्रम के रूप में रुचि के समूह का भाग होने के लिए जाना जाता अनुक्रम का उपयोग करें । प्रतिलिपि बनाएँ और अनुक्रम शीर्ष पर खोज बॉक्स में चिपकाएँ, या उपलब्ध होने पर एक GenBank पहुँच संख्या या सैनिक पहचानकर्ता प्रदान करें.
    2. ड्रॉपडाउन मेनू से डेटाबेस चुनें । blastp के लिए गैर निरर्थक प्रोटीन अनुक्रम (nr) चुनें और tblastn.
    3. के लिए अनुक्रम टैग व्यक्त जीव या taxon नाम टाइप करके और टाइपिंग करते समय दिखाई देने वाली सूची में से चुनकर जीव सेटिंग में विशिष्ट taxa में परिणाम के लिए खोज
    4. . अतिरिक्त जीवों या taxa को जोड़ने के लिए, & #34 पर क्लिक करें; + & #34; बटन और अंय फ़ील्ड दिखाई देगा । जीव या taxon नाम लिखकर जीव बॉक् स में किसी भी अवांछित taxa को बाहर निकालें, टाइप करते समय दिखाई देने वाली सूची में से चुनकर, और & #34 की जांच; छोड़ें & #34; बॉक्स दाईं ओर ।
    5. पर क्लिक करके अतिरिक्त मापदंडों पर पहुंचें & #34; एल्गोरिथम पैरामीटर्स & #34; पृष्ठ के निचले भाग के निकट । डिफ़ॉल्ट पर छोड़ दें जब तक कि वहां एक पैरामीटर बदलने के लिए एक तर्क है ।
    6. क्लिक करें & #34; ब्लास्ट & #34; विश्लेषण चलाने के लिए बटन; परिणाम आने में कुछ समय लग सकता है । सामांय में, किसी अपेक्षा मान (या e-value) के साथ हिट्स पुनर्प्राप्त करें & #34;-05 & #34; या बेहतर और एक मानक अनुक्रम संपादन प्रोग्राम में सहेजें ।
      1. यदि सभी हिट्स इस थ्रेशोल्ड से ऊपर हैं, तो सभी प्रासंगिक अनुक्रम प्राप्त करने के लिए लक्ष्य अनुक्रम (एल्गोरिथ्म पैरामीटर अनुभाग में) की एक बढ़ी हुई संख्या के साथ खोज फिर से चलाएं ।
  4. यदि आवश्यक हो, तो अप्रासंगिक सूचनाओं को बाहर करने के लिए अनुक्रम को ट्रिम करें ( उदा., सीएस-& #945; & #946; गुना केवल परिपक्व पेप्टाइड के लिए लागू होता है) । सिग्नल पेप्टाइड्स और pro-पेप्टाइड्स की पहचान करें प्रोप का उपयोग कर हटाने के लिए < सुप वर्ग = "xref" > 15 (उपलब्ध ऑनलाइन), या SignalP अधिक परिष्कृत संकेत पेप्टाइड पूर्वानुमान के लिए < सुप वर्ग = "xref" > 16 (उपलब्ध ऑनलाइन).
< p class = "jove_title" > 3. एक स्प्रेडशीट में एक संदर्भ उत्पंन महत्वपूर्ण विशेषताएं है कि पहचाने गए थे पर आधारित

  1. हित के समूह की परिभाषित विशेषताओं की पहचान । उदाहरण के लिए, CS-& #945 का उपयोग करें; & #946; पंचमुखी निश्चित रूप से कीट की समाधान संरचना द्वारा स्थापित defensin A from Phormia terraenovae (< सुदृढ वर्ग = "xfig" > चित्र 1 ) < सुप वर्ग = "xref" > 8 .
    1. इस गुना एक छोटे आकृति शामिल cysteine-स्थिर कुंडलित कुण्डली (CSH) < सुप वर्ग = "xref" > १७ ; एक CXXXC द्वारा इस आकृति की पहचान (जहां X किसी भी एमिनो एसिड है) एक CXC के ऊपर है कि दो डाइसल्फ़ाइड बांड फार्म (< मजबूत वर्ग = "xfig" > चित्रा 1 , ठोस गुलाबी लाइनें).
      नोट: CS-& #945 पूरा करने के लिए; & #946; रूपांकन, एक तिहाई डाइसल्फ़ाइड बांड CSH आकृति के प्रत्येक आधे से पहले रखा अतिरिक्त cysteines से बना है (< मजबूत वर्ग = "xfig" > चित्रा 1 , बिंदीदार गुलाबी लाइनों).
  2. एक स्प्रेडशीट में इन परिभाषित सुविधाओं दर्ज करें । See < सुदृढ वर्ग = "xfig" > चित्रा २ .
    1. संरक्षित सुविधाओं के लिए स्तंभों का उपयोग करें और इन सुविधाओं के बीच रिक्तियों का प्रतिनिधित्व करने के लिए । संख्याओं को फ़िट करने के लिए स्तंभों को पर्याप्त चौड़ा रखें और सुनिश्चित करें कि उनके पास कोई संगत चौड़ाई है । का उपयोग कर चौड़ाई सेट करें & #34; स्वरूप | स्तंभ चौड़ाई & #34; फ़ंक्शन (< सबल वर्ग = "xfig" > चित्र 2 , गुलाबी तीर).
    2. अनुक्रम नामों के लिए पंक्तियों का उपयोग करें ।
    3. जब किसी अनुक्रम में सुविधा हो, तो भरण फ़ंक्शन का उपयोग करके बॉक्स में भरें (< सशक्त वर्ग = "xfig" > आरेख 2 , गुलाबी वर्ग). सुविधाओं के बीच रिक्ति के लिए, के बीच बॉक्स में अमीनो एसिड की संख्या दर्ज करें और इसे छोड़ infill । उदाहरण के लिए, कीट defensin अनुक्रम का उपयोग करते हुए एक संदर्भ देता है जिसमें छह cysteines, C2 और C3 के बीच और C5 और सी 6 के बीच निर्धारित रिक्ति के साथ शामिल हैं.
  3. प्रतिनिधि अनुक्रम जोड़ें जो पहले संरचनात्मक डेटाबेस और साहित्य पर आधारित समूह के सदस्यों के रूप में स्थापित किए गए हैं ।
    नोट: उदाहरण के लिए, पिछले साहित्य और SCOP डेटाबेस शामिल किए जाने के लिए कई समूहों की पहचान: कीट defensins, लघु श्रृंखला बिच्छू विषाक्त पदार्थों, लंबी श्रृंखला बिच्छू विषाक्त पदार्थों, MGD-1, संयंत्र defensins, निमेटोड ABFs, drosomycins से Drosophila, और macins । साहित्य भी केवल चार cysteines के साथ एक जीवाणु अनुक्रम की पहचान करता है जो इस superfamily के पूर्वज का प्रतिनिधित्व कर सकता है < सुप वर्ग = "xref" > १८ . इन दृश्यों को जोड़ने से संदर्भ में cysteines की संख्या छह से दस तक बढ़ जाती है लेकिन महत्वपूर्ण संरचनात्मक सुविधाओं के संरेखण को बनाए रखता है (< सशक्त वर्ग = "xfig" > आरेख 3 ).
    1. (उदाहरण के लिए, एक अतिरिक्त cysteine) अनुक्रम के किसी उपसमूह को परिभाषित करने के लिए संभावित है एक सुविधा जोड़ने के लिए, & #34 का उपयोग करें; Insert & #34; फंक्शन (< सुदृढ वर्ग = "xfig" > आरेख 3 , गुलाबी तीर).
    2. अगर वहां एक दिया अनुक्रम से लापता विशेषताएं हैं, बॉक्स unfilled छोड़ दो और यह हस्तक्षेप अमीनो एसिड का प्रतिनिधित्व बक्से के साथ गठबंधन । यदि आवश्यक हो, तो मर्ज और केंद्र सुविधा का उपयोग करके कक्षों को मर्ज करें (< सशक्त वर्ग = "xfig" > आरेख 3 , गुलाबी बॉक्स).
  4. बड़े superfamily के प्रत्येक समूह में भिंनता का बेहतर चित्र प्राप्त करने के लिए समूहों में अनुक्रम जोड़ना जारी रखें । तुलना की सुविधा के लिए समूह विशेषताओं को सारांशित करें (< सबल वर्ग = "xfig" > चित्रा ४ ).
    1. जब प्रमुख विशेषताओं के बीच अमीनो अम्ल की संख्या भिन्न होती है, तो किसी श्रेणी को इंगित करने के लिए एक हायफ़न का उपयोग करें, जैसे 6-12 (6 से 12 अमीनो एसिड), और या तो/या, जैसे 7/10 (7 या 10 अमीनो एसिड) को इंगित करने के लिए स्लैश ।
    2. प्रासंगिक हो सकता है कि दृश्यों की सुविधाओं की व्याख्या करने के लिए एक तरीका चुनें, लेकिन अक्सर संदर्भ में शामिल करने के लिए पर्याप्त नहीं होते. उदाहरण के लिए, चूंकि cysteines इस superfamily में महत्वपूर्ण हैं, लैबल थप cysteines (< सुदृढ वर्ग = "xfig" > चित्रा 4 , गुलाबी बक्से).
  5. जोड newly-पहचाना अनुक्रम एक मार्गदर्शिका के रूप में स्थापित अनुक्रम का उपयोग कर स्प्रेडशीट के लिए । उदाहरण के लिए, tardigrades (पीला) से अनुक्रम जोड़ने से पता चलता है कि tardigrade अनुक्रम superfamily के कई भिन्न समूहों में गिर जाते हैं (< सशक्त वर्ग = "xfig" > चित्रा 5 अंतरिक्ष प्रयोजनों के लिए अनुक्रम प्रति एक पंक्ति के बजाय सारांश दिखाता है).
  6. पंक्तियों को पुनर्व्यवस्थित करके वर्गीकरण समूह में परिवर्तनशीलता दिखाएं (< सशक्त वर्ग = "xfig" > आरेख 6 ).
< p class = "jove_title" > 4. एमिनो एसिड संरेखण को परिष्कृत करने के लिए संदर्भ का उपयोग करें

< p class = "jove_content" > नोट: कई प्रोग्राम है कि एकाधिक अनुक्रम संरेखण के लिए इस्तेमाल किया जा सकता है, लेकिन इस प्रदर्शन आणविक विकासवादी आनुवंशिकी विश्लेषण का उपयोग करेगा (MEGA6) < सुप वर्ग = "xref" > १९ क्योंकि यह मुफ्त में डाउनलोड करने के लिए उपलब्ध है ।

  1. डाउनलोड और सॉफ्टवेयर स्थापित करें.
  2. & #34 का चयन करके मेगा में एक नया संरेखण शुरू; संरेखण को संपादित करें/& #34; संरेखित करें टैब के अंतर्गत । select & #34; एक नया संरेखण & #34 बनाएं; दिखाई देने वाले बॉक्स में और & #34; ठीक पर क्लिक करें. & #34; तब चय & #34;P rotein & #34;
  3. Select & #34; से अनुक्रम संमिलित करें फ़ाइल & #34; में & #34; संपादित करें & #34; मेनू अनुक्रम आयात करने के लिए ।
    नोट: दृश्यों मेगा में आयात के लिए फसता प्रारूप में होने की आवश्यकता होगी । विभिन्न अमीनो अम्ल प्रकारों को प्रतिबिंबित करने वाली पृष्ठभूमि रंग डिफ़ॉल्ट रूप से उपयोग किए जाते हैं, लेकिन इस विकल्प के तहत बंद किया जा सकता & #34;D इसपलए & #34; menu.
  4. एक बार जब सभी जुगाड़ में प्रवेश कर जाएं तो ठोके हुए आर्म आइकॉन पर क्लिक करें और फिर & #34; संरेखित प्रोटीन & #34; मांसपेशी एल्गोरिथ्म का उपयोग कर अनुक्रम संरेखित करने के लिए < सुप वर्ग = "xref" > २० .
    नोट: ClustalW भी उपलब्ध है ।
    1. यदि कोई संदेश कह रहा है कि कुछ भी नहीं चुना गया है चबूतरे का चयन करें और सभी को चुनने के लिए पूछता है, & #34; ok. & #34;
    2. नोट: यह एक खिड़की है कि कुछ मापदंडों को बदलने के लिए अनुमति देता है खोलता है, लेकिन वे केवल परिवर्तित किया जाना चाहिए ऐसा करने के लिए कारण है यह विश्लेषण किसी पिछले काग़ज़ में विश्लेषित अनुक्रम के सबसेट का उपयोग करता है < सुप वर्ग = "xref" > १२ .
  5. महत्वपूर्ण सुविधाओं के आधार पर संरेखण की जांच करें; ध्यान दें कि अनुक्रम के ऊपर पट्टी किसी भी कॉलम जहां एमिनो एसिड पूरी तरह से संरक्षित है दिखाएगा (*) । See < सुदृढ वर्ग = "xfig" > चित्रा ७ . देखें कि प्रारंभिक संरेखण केवल तीन के चार रोपा cysteines (< मजबूत वर्ग = "xfig" > चित्रा 7 , गुलाबी बक्से) दिखाता है; स्तंभ को नीचे देख रहा है, AlCRP अनुक्रम स्पष्ट रूप से है डिग्रियों (< सबल वर्ग = "xfig" > चित्रा ७ , गुलाबी तीर).
  6. I और the
  7. C के बीच के बड़े अंतर से छुटकारा पाने के लिए, डैश हाइलाइट करें और & #34 को दबाएं;d टाएं & #34; कुंजी । किसी भी अमीनो एसिड को हाइलाइट न करें, या वे के रूप में अच्छी तरह से हटा दिया जाएगा ।
  8. अमीनो एसिड को दाईं ओर ले जाने के लिए, हाइलाइट करें और स्पेस बार दबाएँ.
    1. ध्यान दें कि AlCRP अब संरचनात्मक cysteines गठबंधन किया है और कि CXXXC आकृति के अंतिम ग संरेखण भर में संरक्षित है (< मजबूत वर्ग = "xfig" > चित्रा 8 ). अनुक्रम की सबसे महत्वपूर्ण सुविधाओं को प्राथमिकता देने के लिए आवश्यकतानुसार संरेखण को समायोजित करें ।
< p class = "jove_title" > 5. वंशावली विश्लेषणों से परिणामों के साथ संदर्भ का उपयोग कर पहचाने गए समूहों की तुलना करें

  1. प्रारंभिक संरेखण से, निर्धारित करें कि कौन सा अनुक्रम एक वंशावली विश्लेषण में शामिल किया जाना चाहिए; अनुक्रम की एक छोटी संख्या के लिए, यह चरण हो सकता है अनावश्यक हो.
    1. एक संरेखण फ़ाइल रखें जिसमें सभी अनुक्रम शामिल हों, लेकिन एक वंशावली विश्लेषण के लिए, अनावश्यक अनुक्रम निकालें (< सशक्त वर्ग = "xfig" > चित्र 9 , गुलाबी बक्से निरर्थक दृश्यों के जोड़े दिखाएँ).
    2. यदि डेटा सेट अनुक्रम की एक बड़ी संख्या में शामिल हैं, एक प्रारंभिक विश्लेषण चलाने के लिए और समूहों है कि हमेशा एक पहने फार्म से प्रतिनिधियों का चयन करें ।
  2. सर्वश्रेष्ठ एमिनो एसिड प्रतिस्थापन मॉडल का निर्धारण ।
    1. (डेटा टैब के अंतर्गत) मेगा स्वरूप में संरेखण निर्यात करें ।
    2. मॉडल मेनू पर जाएं और & #34 का चयन करें; उत्तम DNA/प्रोटीन मॉडल खोजें । & #34; अभी सहेजी गई फ़ाइल चुनें और उसे खोलें; यह एक विंडो खुलेगी जिसमें कुछ पैरामीटर्स होंगे जिन्हें बदला जा सकता है.
    3. डिफ़ॉल्ट पैरामीटर का उपयोग करें जब तक कि उंहें बदलने के लिए एक कारण है । क्लिक करें & #34; गणना & #34; विश्लेषण शुरू करने के लिए
  3. मेगा. में अधिकतम संभावना (एमएल) विश्लेषण चलाएं
    1. चुन & #34; का निर्माण/परीक्षण अधिकतम संभावना ट्री & #34; फाइलोजेनी मेनू से.
    2. चरण ५.२ से डेटा के लिए सबसे अच्छा फिट होने के लिए निर्धारित मॉडल का चयन करें (आउटपुट प्रतिस्थापन मॉडल के साथ ही श्रेष्ठ & #34 देगा; साइट्स के बीच दरें & #34; पैरामीटर).
    3. चुनें १,००० बूटस्ट्रैप के पेड़ के लिए समर्थन के उपाय प्राप्त करने के लिए प्रतिकृति ।
    4. Click & #34; गणना & #34; विश्लेषण चलाने के लिए; मेगा ने एक & #34; ट्री एक्स्प्लोरर & #34; ट्री की कल्पना करने के लिए ।
  4. ्न एक Bayesian विश्लेषण मे MrBayes ओपन-सोर्स सॉफ्टवेर < सुप class = "xref" > 21 .
    नोट: एक MrBayes मैनुअल भी इस साइट से उपलब्ध है । यह बुनियादी कदम प्रदान करने के लिए करना है और Bayesian वंशावली विश्लेषण के संचालन के लिए एक व्यापक गाइड नहीं है ।
    1. प्याव (Nexus) स्वरूप में MrBayes प्रोग्राम के रूप में एक ही फ़ोल्डर में मेगा संरेखण निर्यात करें ।
    2. ओपन MrBayes और टाइप & #34; exe फ़ाइल नाम & #34; ( उदा, & #34; exe संरेखण. नेक्स & #34;).
    3. मॉडल और विश्लेषण पैरामीटर निर्दिष्ट करें । या तो चरण ५.२ में निर्दिष्ट मॉडल चुनें या & #34; मिश्रित & #34; सेटिंग जो विभिन्न मॉडलों की कोशिश करेंगे और सबसे अच्छा पीछे संभावनाओं के साथ पेड़ों में मॉडल की आवृत्ति रिपोर्ट (prset aamodelpr = मिश्रित). Type & #34; showmodel & #34; वर्तमान मॉडल सेटिंग्स की रिपोर्ट करने के लिए और & #34; मदद एमसीएमसी & #34; प्रत्येक के एक संक्षिप्त विवरण के साथ वर्तमान पैरामीटर सेटिंग्स, दिखाने के लिए.
    4. का उपयोग कर पीढ़ियों की संख्या निर्धारित करें & #34; mcmcp ngen = & #34; आदेश (१,०००,००० विशिष्ट है).
    5. प्रकार & #34; एमसीएमसी & #34; विश्लेषण शुरू करने के लिए.
    6. जब पीढ़ियों की संख्या पूरी हो गई है, कार्यक्रम के लिए और अधिक पीढ़ियों को जोड़ने के लिए पूछना होगा । विभाजन आवृत्तियों का औसत मानक विचलन ०.१ से कम है, तो नहीं लिखें । यदि यह ०.१ से ऊपर है, विश्लेषण जारी रखने के लिए अनुमति दी जानी चाहिए, या कुछ पैरामीटर्स परिवर्तित किया जाना चाहिए (मैनुअल देखें) ।
    7. उपयोग & #34; sumt & #34; ट्री फ़ाइलें जनरेट करने के लिए आदेश ।
    8. के बाद विश्लेषण पूरा हो गया है और एक आम सहमति पेड़ उत्पन्न होता है, पेड़ FigTree में देखा जा सकता है (उपलब्ध ऑनलाइन).
  5. अगर तरीकों अनुरूप परिणाम उत्पंन देखने के लिए पेड़ों की तुलना करें ।
    नोट: कुछ अनुक्रम जानकारी प्रदान नहीं करते हैं: पेड़ अच्छी तरह से हल नहीं किया जा सकता है और शाखाओं न्यूनतम समर्थन हो सकता है (< मजबूत वर्ग = "xfig" > चित्रा 10 ).
  6. यदि वंशावली विश्लेषण इन समूहों का समर्थन देखने के लिए संदर्भ का उपयोग कर पहचाने गए समूहों के लिए पेड़ों की तुलना करें ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

साहित्य में रिपोर्ट किए गए सीएस-αβ superfamily में जुगाड़ के समूह चित्रा 4में दर्शाए गए हैं । प्रत्येक अनुक्रम के लिए क्रमांकन के आधार पर cysteine पेयरिंग पांच मूल समूहों (तालिका 1, मध्य स्तंभ) का सुझाव देती है । समूह 1 में छह cysteines है जो तीन डाइसल्फ़ाइड बांड से और कीड़े, नुकसानदेय, घोंघे, सूत्रकृमि, और कवक से अनुक्रम भी शामिल है । समूह 2, 3, और 4 है 8 cysteines कि फार्म चार डाइसल्फ़ाइड बांड । समूह 2 में कीट, मकड़ी, और संयंत्र अनुक्रम शामिल हैं; समूह 3 में मकड़ी, मोलस्क, और निमेटोड अनुक्रम शामिल हैं; और समूह 4 स्निडेरिएंस, annelids, घोंघे, और कवक से अनुक्रम शामिल हैं । ग्रुप 5 में 10 cysteine macins शामिल हैं । कुछ दृश्यों काफी इन पैटर्न फिट नहीं था, लेकिन आम तौर पर दूसरों की तुलना में एक समूह के करीब थे ।

1 और 2 समूह दो बांड साझा करने के लिए लग रहे हैं: C2-C5 और C3-सी-6; हालांकि, इसके पहले cysteine के साथ प्रत्येक अनुक्रम के क्रमांकन की शुरुआत बांड के संरचनात्मक संदर्भ को स्वीकार नहीं करता है । समूह 1 अनुक्रम में c2-c5 CSH आकृति में दो बांडों में से एक है, जबकि समूह 2 में c2-c5 अनुक्रम सीएस-αβ गुना को स्थिर करने के लिए आवश्यक अंतिम बांड रूपों. समूह 1 C2-C5 करने के लिए मुताबिक़ बॉन्ड Group2 C3-6 है, जो नंबर से स्पष्ट नहीं है. यह भी स्पष्ट नहीं है कि समूह 3 में, C2-सी 6 बॉण्ड एक ही संरचनात्मक भूमिका निभाता है.

साहित्य से अनुक्रम का उपयोग कर कुल दस cysteines के साथ एक संदर्भ उत्पन्न किया । CSH आकृति बांड C3-C8 और C4-C9 से बना है, C2-6 सीएस-αβ को पूरा करने के साथ गुना. संदर्भ संख्याओं के आधार पर cysteine जोड़ों को पुनर्क्रमांकित करना प्रत्येक अनुक्रम (तालिका 1, दायां स्तंभ) में मौजूद बांडों को स्पष्ट करता है । अब यह स्पष्ट है कि सभी दृश्यों C2-सी 6, C3-C8 है, और C4-C9, संरचनात्मक गुना है कि superfamily को परिभाषित करता है को दर्शाती है । एक संदर्भ का उपयोग अनुक्रम है कि असंगत नामकरण और अस्पष्ट वर्गीकरण मानदंड है के बीच आसान तुलना के लिए अनुमति देता है । यह दृश्यों के उपसमूह को परिभाषित करने वाली सुविधाओं को पहचानने में भी मदद कर सकता है । उदाहरण के लिए, C1-C7 बांड अन्य superfamily सदस्यों से macins में अंतर कर सकता है, जिससे "defensins" (तालिका 1 और आरेख 4) के बजाय "macins" के रूप में इस बांड के साथ अनुक्रम वर्गीकृत करना उचित हो ।

सार्वजनिक ऑनलाइन डेटाबेस की खोज tardigrades से सोलह दृश्यों कि स्पष्ट रूप से सीएस-αβ गुना, आठ प्रत्येक Hypsibius dujardini और Milnesium tardigradum से पता चला है । नए दृश्यों में से चार छह cysteines, नौ है आठ, एक है नौ, और दो दस है । यह बहुत कम जानकारी देता है, लेकिन अनुक्रम को संदर्भ में संरेखित करके, यह स्पष्ट हो जाता है कि tardigrade अनुक्रम cysteines के समान संख्या के साथ हमेशा संरचनात्मक रूप से महत्वपूर्ण cysteines अनुक्रम के भीतर एक ही स्थान पर नहीं है ( चित्रा 5 और चित्रा 6). संदर्भ के साथ संरेखण भी बंधन पैटर्न के अनुमान के लिए अनुमति देता है (तालिका 2, आस्थगित संबंध कोष्ठकों में दिखाया गया पैटर्न) । tardigrade दृश्यों के कुछ स्पष्ट रूप से 1-4 पैटर्न फिट । दूसरों के प्रस्तावित बैक्टीरियल पूर्वज, बिच्छू सीएल-विष, या फंगल defensin के एक परिवार की तरह पेप्टाइड्स के लिए सबसे समान हैं । 2 पैटर्न दो उपसमूह हो सकता है, एक बिच्छू ना + विषाक्त पदार्थों, drosomycin, और संयंत्र defensins, और बिच्छू सीएल-विषाक्त पदार्थों से दूसरे का प्रतिनिधित्व किया । इसके अलावा काम tardigrade प्रोटीन के समारोह की जांच अगर कुछ विषाक्त पदार्थों पर विचार किया जाना चाहिए बजाय defensins निर्धारित करने की जरूरत है ।

वंशावली विश्लेषण अक्सर अध्ययन कैसे प्रोटीन का एक समूह विकसित हो सकता है किया जाता है । सीएस-αβ superfamily में अनुक्रम आम तौर पर कम और अत्यधिक अलग हैं; परिणामस्वरूप पेड़ अक्सर खराब हल कर रहे है और छोटी अंतर्दृष्टि प्रदान करते हैं । दोनों के क्रम के सबसेट के लिए एमएल और Bayesian पेड़ यहां विश्लेषण खराब कई पहने (चित्रा 10, अनुपूरक फ़ाइलें 1-4) के लिए कम समर्थन के साथ, हल कर रहे थे । यह केवल ७० (या ०.७ से अधिक पीछे संभावनाओं) पर बूटस्ट्रैप स्तर दिखाने के लिए आम बात है, लेकिन चित्रा 10 समर्थन के समग्र निंन स्तर को प्रदर्शित करने के लिए सभी नंबरों को बरकरार रखता है । पांच समूहों में 70/0.7 से ऊपर का समर्थन किया गया दो पेड़ों की कम से एक: (क) एक 6C और एक 8C बिच्छू विष; (ख) macins; (ग) टिक और बिच्छू defensins; (घ) पादप defensins; और (ङ) कीड़ों, नुकसानदेय, और घोंघे से 6C defensins । एमएल पेड़ में, पहने ई भी एक 8C विष और एक 8C tardigrade defensin, लेकिन समर्थन बहुत कम था (चित्रा 10A) शामिल हैं । सामांय में, ये संदर्भ cysteine क्रमांकन का उपयोग करके पहचानी गई श्रेणियां प्रतिबिंबित करते हैं, लेकिन यह भी दिखाते है कि एक बड़े taxonomical समूह में भिंन cysteine संख्याओं वाला अनुक्रम एक ही प्रतिमान के साथ दृश्यों से अधिक निकटता से संबंधित हो सकता है विभिंन समूहों । जबकि केवल इस अध्ययन में अनुक्रम की एक छोटी संख्या का उपयोग किया गया, २५० दृश्यों का एक बड़ा विश्लेषण संकल्प की कमी को खत्म नहीं किया (अनुपूरक फ़ाइलें 5-8)12. स्प्रेडशीट संदर्भ संरेखण वंशावली पेड़ों की तुलना में संरचनात्मक या कार्यात्मक प्रासंगिकता के साथ समानता की आसान दृश्य प्रस्तुत कर सकता है ।

Figure 1
चित्र 1: अनुक्रम और सीएस-αβ Superfamily के संरचनात्मक सुविधाओं को परिभाषित. एमिनो एसिड और 3 डी संरचना रंग कोडित रहे हैं: पाश (नीला), अल्फा-कुण्डली (हरा), बीटा-चादरें (सोना), और डाइसल्फ़ाइड बांड (गुलाबी). कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 2
चित्र 2: प्रारंभिक छह-cysteine संदर्भ कीट Defensin के अनुक्रम पर आधारित है । कॉलम संरक्षित cysteines (C1-सी 6) और, CSH आकृति के लिए, cysteines के बीच संरक्षित अमीनो एसिड की संख्या से संकेत मिलता है । भरे बक्से से संकेत मिलता है कि अनुक्रम दिया cysteine और संख्या cysteines के बीच अमीनो एसिड का संकेत है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

एर. भीतर-पृष्ठ = "1" >Figure 3
चित्र 3: परिष्कृत दस-cysteine संदर्भ के आधार पर प्रतिनिधि अनुक्रम के समूहों से CS-αβ Superfamily. कॉलम संरक्षण cysteines और उन दोनों के बीच एमिनो एसिड संकेत मिलता है । Cysteines CSH आकृति (C3, C4, C8, और C9) के लिए योगदान और सीएस-αβ गुना (C2 और सी 6) के लिए लेबल कर रहे हैं. अनुक्रम वर्गीकरण समूह द्वारा रंग कोडित हैं: Arachnida (हल्का नारंगी), बैक्टीरिया (काला), Cnidaria (ग्रे), Hexapoda (नारंगी), Mollusca (नीला), Nematoda (बैंगनी), और Plantae (हरा). कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 4
चित्र 4 : CS-αβ Superfamily अनुक्रम का सारांश समूह विशेषताओं द्वारा संदर्भ के साथ संरेखित । कॉलम संरक्षण cysteines और उन दोनों के बीच एमिनो एसिड संकेत मिलता है । Cysteines CSH आकृति (C3, C4, C8, और C9) के लिए योगदान और सीएस-αβ गुना (C2 और सी 6) के लिए लेबल कर रहे हैं. अनुक्रम वर्गीकरण समूह द्वारा रंग-कोडेड होते हैं: Annelida (गहरा लाल), Arachnida (हल्का नारंगी), जीवाणु (काला), Cnidaria (धूसर), कवक (हल्का हरा), Hexapoda (नारंगी), Mollusca (नीला), Nematoda (जामुनी), और Plantae (हरा) । एक डैश से अलग संख्या अमीनो एसिड के हस्तक्षेप की एक सीमा से संकेत मिलता है; स्लैश द्वारा पृथक की गई संख्याएं या तो प्रतिनिधित्व करती हैं । एक "C" संदर्भ के अलावा वारंट करने के लिए पर्याप्त आवृत्ति के साथ उत्पन्न नहीं होती है एक अतिरिक्त cysteine इंगित करता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 5
चित्र 5 : समूह विशेषताओं द्वारा संदर्भ के साथ संरेखण को Superfamily करने के लिए Tardigrade CS-αβ अनुक्रम के अतिरिक्त । कॉलम संरक्षण cysteines और उन दोनों के बीच एमिनो एसिड संकेत मिलता है । Cysteines CSH आकृति (C3, C4, C8, और C9) के लिए योगदान और सीएस-αβ गुना (C2 और सी 6) के लिए लेबल कर रहे हैं. अनुक्रम वर्गीकरण समूह द्वारा रंग-कोडेड होते हैं: Annelida (गहरा लाल), Arachnida (हल्का नारंगी), जीवाणु (काला), Cnidaria (धूसर), कवक (हल्का हरा), Hexapoda (नारंगी), Mollusca (नीला), Nematoda (जामुनी), Plantae (हरा), और Tardigrada (पीला) । एक डैश से अलग संख्या अमीनो एसिड के हस्तक्षेप की एक सीमा से संकेत मिलता है; स्लैश द्वारा पृथक की गई संख्याएं या तो प्रतिनिधित्व करती हैं । एक "C" संदर्भ के अलावा वारंट करने के लिए पर्याप्त आवृत्ति के साथ उत्पन्न नहीं होती है एक अतिरिक्त cysteine इंगित करता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 6
चित्र 6: Tardigrade सीएस-αβ अनुक्रम वर्गीकरण समूह द्वारा संदर्भ के साथ संरेखण Superfamily करने के लिए के अलावा । कॉलम संरक्षण cysteines और उन दोनों के बीच एमिनो एसिड संकेत मिलता है । Cysteines CSH आकृति (C3, C4, C8, और C9) के लिए योगदान और सीएस-αβ गुना (C2 और सी 6) के लिए लेबल कर रहे हैं. अनुक्रम वर्गीकरण समूह द्वारा रंग-कोडेड होते हैं: Annelida (गहरा लाल), Arachnida (हल्का नारंगी), जीवाणु (काला), Cnidaria (धूसर), कवक (हल्का हरा), Hexapoda (नारंगी), Mollusca (नीला), Nematoda (जामुनी), Plantae (हरा), और Tardigrada (पीला) । एक डैश से अलग संख्या अमीनो एसिड के हस्तक्षेप की एक सीमा से संकेत मिलता है; स्लैश द्वारा पृथक की गई संख्याएं या तो प्रतिनिधित्व करती हैं । एक "C" संदर्भ के अलावा वारंट करने के लिए पर्याप्त आवृत्ति के साथ उत्पन्न नहीं होती है एक अतिरिक्त cysteine इंगित करता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 7
चित्र 7: स्वचालित संरेखण का उपयोग करके डिग्रियों का अनुक्रम. अमीनो एसिड सभी दृश्यों में संरक्षित * द्वारा संकेत दिया जाता है पहले अनुक्रम के ऊपर पंक्ति में (गुलाबी बक्से में उल्लिखित) । AlCRP है । अंतर को सही तरीके से संरेखित करने के लिए C (गुलाबी तीर) को निकालने की आवश्यकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 8
चित्र 8: मैंयुअल परिशोधन संरेखण के अनुक्रम की संरचनात्मक रूप से महत्वपूर्ण सुविधाओं को संरक्षित रखता है । AlCRP अब सही ढंग से गठबंधन है (गुलाबी तीर), और CXXXC आकृति पूरी तरह से अनुक्रम (गुलाबी बक्से) के लिए संरक्षित है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 9
चित्र 9 : किसी संरेखण में अनावश्यक अनुक्रम. अगर वहां लगभग समान दृश्यों (गुलाबी बक्से) के जोड़े हैं, एक हटाया जा सकता है, क्योंकि इन की संभावना हमेशा एक साथ क्लस्टर में और पेड़ के समग्र टोपोलॉजी को थोड़ा योगदान होगा । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 10
चित्र 10 : वंशावली िरा से उत्पन्न पेड़ों की तुलना । () मेगा में अधिकतम संभावना विश्लेषण, १,००० बूटस्ट्रैप के साथ WAG + जी का उपयोग कर प्रतिकृति + मैं मॉडल । (B) मिश्रित-मॉडल सेटिंग का उपयोग करके १,०००,००० पीढ़ियों के साथ Bayesian विश्लेषण । पहने 70/0.7 में समर्थित ठोस गुलाबी लाइनों में दिखाए जाते हैं; अंय वृक्ष में 70/0.7 पर समर्थित गुलाबी लाइनों शो ढंकी हुई । (क) एक 6C और एक 8C बिच्छू विष; (ख) macins; (ग) टिक और बिच्छू defensins; (घ) पादप defensins; और (ङ) कीड़ों, नुकसानदेय, और घोंघे से 6C defensins । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Table 1
तालिका 1: Cysteine-युग्मन प्रतिमानों पर आधारित CS-αβ Superfamily के भीतर के समूह. बांड गठन के पांच मूल पैटर्न आंतरिक संख्याओं (मध्य स्तंभ) या संदर्भ संख्याओं (दाएं स्तंभ) का उपयोग करके दिखाए जाते हैं । बिच्छू सीएल-विषाक्त पदार्थों, ASABF 6Cys-अल्फा, और कवक पेप्टाइड्स के एक समूह पैटर्न के साथ रखा जाता है कि एमost निकट मैचों । संदर्भ में शामिल नहीं एक cysteine से पहले cysteines की एक सुपरस्क्रिप्ट द्वारा इंगित किया गया है (उदा., C3/4 C3 और C4 के बीच है).

Table 2
तालिका 2: Cysteine-युग्मन प्रतिमान समूहों के लिए Tardigrade CS-αβ अनुक्रम के अलावा. Tardigrade defensins और macins (बोल्ड) पहले से स्थापित समूहों जहां संभव में डाल रहे हैं । कुछ tardigrade अनुक्रम समूह-विशिष्ट प्रतिमान दिखा सकता है । संदर्भ में शामिल नहीं एक cysteine से पहले cysteines की एक सुपरस्क्रिप्ट द्वारा इंगित किया गया है (उदा., C3/4 C3 और C4 के बीच है). नोटेशन "2c/1" संदर्भ C1 के दो cysteines ऊपर हैं, यह इंगित करता है ।

अनुपूरक फ़ाइल 1 (s): मेगा में इस डेटासेट का संरेखण. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फ़ाइल 2 (S2): इस डेटासेट के लिए अधिकतम संभावना ट्री मेगा फ़ाइल. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फ़ाइल 3 (S3): MrBayes के लिए Nexus स्वरूप में इस डेटासेट का संरेखण. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फ़ाइल 4 (S4): इस डेटासेट के MrBayes विश्लेषण से सहमति फाइल. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फाइल 5 (S5): मेगा में २५० सीएस-αβ दृश्यों का संरेखण । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फाइल 6 (S6): २५० सीएस-αβ दृश्यों की अधिकतम संभावना पेड़ । इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फाइल 7 (S7): MrBayes के लिए नेक्सस प्रारूप में २५० सीएस-αβ दृश्यों का संरेखण. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

अनुपूरक फाइल 8 (S8): २५० सीएस-αβ दृश्यों के MrBayes विश्लेषण से सहमति फाइल. इस फ़ाइल को डाउनलोड करने के लिए कृपया यहां क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

एक समूह के भीतर एक प्रोटीन के नामकरण के लिए मानदंड स्पष्ट होना चाहिए, लेकिन यह हमेशा मामला नहीं है । अनुक्रम है कि सीएस-αβ गुना है कई प्रयोगशालाओं में अध्ययन किया गया है जीवों की एक किस्म का उपयोग, नामकरण के विभिंन प्रणालियों में जिसके परिणामस्वरूप, के रूप में अच्छी तरह के रूप में लक्षण वर्णन के अलग स्तर । एक पूरी तरह से नए नामकरण थोपने का प्रयास उचित नहीं है और जब पिछले साहित्य परामर्श भ्रम का एक बड़ा सौदा में परिणाम होगा । एक संदर्भ क्रमांकन प्रणाली superfamily के सापेक्ष अपनी विशेषताओं को स्पष्ट करने के लिए एक प्रोटीन के नाम के अलावा इस्तेमाल किया जा सकता है ।

नामकरण और वर्गीकरण के लिए स्पष्ट मानदंडों के साथ प्रोटीन के समूह की संभावना एक स्प्रेडशीट में एक संदर्भ पैदा करने से लाभ नहीं होगा, हालांकि यह अनुक्रम की बड़ी संख्या में सारांश और महत्वपूर्ण विशेषताओं visualizing के लिए उपयोगी हो सकता है । अनुक्रम संरेखण और लोगो प्रत्येक साइट पर संरक्षण के स्तर की जांच के लिए उपयोगी होते हैं, लेकिन संरचना या समारोह के लिए महत्वपूर्ण अनुक्रम सुविधाओं को सक्रिय रूप से प्राथमिकता नहीं देते हैं । सीएस-αβ उदाहरण संरचना पर ध्यान केंद्रित है, लेकिन विशिष्ट अमीनो एसिड है कि एक बाध्यकारी साइट के रूप में भी एक परिभाषित सुविधा के रूप में शामिल किया जा सकता है । सीएस-αβ पेप्टाइड्स की विशिष्ट रोगाणुरोधी/विषाक्त गतिविधियों प्रदान अनुक्रम सुविधाओं के रूप में पहचाने जाते हैं, इन गतिविधि पर आधारित समूहों को स्पष्ट करने के लिए संदर्भ में जोड़ा जा सकता है. हालांकि केवल भविष्यवाणी परिपक्व पेप्टाइड्स इस उदाहरण में इस्तेमाल किया गया, अगर एक संकेत पेप्टाइड या समर्थक पेप्टाइड की उपस्थिति महत्वपूर्ण है, कि जानकारी प्रत्येक अनुक्रम के लिए जोड़ा जा सकता है. विशिष्ट प्रविष्टि या विलोपन घटनाओं, साथ ही साथ intron स्थानों, भी शामिल किया जा सकता है अगर वे जानकारीपूर्ण होने लगा रहे हैं । वंशावली विश्लेषण के लिए MrBayes का उपयोग करने का एक लाभ यह है कि यह आणविक डेटा तक ही सीमित नहीं है-यह अन्य विशेषताओं के लिए डेटा कोडिंग का विश्लेषण कर सकता है जो विकासवादी महत्व का हो सकता है । ये वर्तमान या अनुपस्थित के रूप में कोडित किया जा सकता है, अकेले अनुक्रम से अधिक जानकारी प्रदान.

प्रासंगिक दृश्यों का संग्रह प्रोटोकॉल का एक महत्वपूर्ण कदम है । अध्ययन और समूह के सदस्यों के वितरण के क्षेत्र के आधार पर, यह व्यापक taxonomical समूहों हो सकता है । यदि लक्ष्य को प्रोटीन के एक पूरे समूह को समझने की है, विचार है कि कुछ दृश्यों प्रजातियों है कि वे आम तौर पर से सूचित कर रहे है बाहर पाया जा सकता है । यदि एक taxon पहले से ही अच्छी तरह से प्रतिनिधित्व किया है और अतिरिक्त अनुक्रम की संभावना नहीं है या निरर्थक है, उंहें खोज से छोड़कर उपयुक्त हो सकता है । के एक मूल नियम-अंगूठे एक विस्फोट खोज में हिट प्राप्त करने के लिए ई के लिए-05 का कटऑफ का उपयोग करने के लिए है मूल्य । ई-मूल्य मौका द्वारा अपेक्षित हिट की संख्या है । हालांकि यह कुछ स्थितियों के लिए उपयुक्त है, अगर वहां दृश्यों का एक समूह है कि अत्यधिक अलग लेकिन शेयर विशिष्ट विशेषताओं है, यह कम विश्वसनीय हो सकता है-यह जुगाड़ है कि समान हैं, लेकिन विशिष्ट सुविधाओं नहीं चाहता था प्राप्त कर सकते हैं, और यह नहीं हो सकता वापसी अनुक्रम है कि प्रमुख विशेषताओं है, लेकिन है कि अत्यधिक अलग हैं । इस समस्या को हल करने के कुछ संभावित तरीके हैं । सबसे पहले खोज में पहचाने गए जुगाड़ को देखने पर लग जाता है कि-05 कट-ऑफ से नीचे हैं तो उन्हें शामिल करने का मापदंड पूरा देख लें । दूसरा, अगर वहां पर्याप्त जानकारी है, स्थिति का उपयोग करें विशिष्ट दोहराया विस्फोट (साई विस्फोट)22 या पैटर्न-मारो शुरू विस्फोट (फी विस्फोट)23। साई-ब्लास्ट अगले दौर के लिए एक नया मॉडल उत्पन्न करने के लिए एक प्रारंभिक खोज से परिणाम का उपयोग करता है और कई बार प्रारंभिक खोज की पहचान नहीं की है कि अलग अनुक्रम पा सकते हैं. फी-ब्लास्ट क्वेरी अनुक्रम के साथ प्रस्तुत किया जा करने के लिए एक पैटर्न की आवश्यकता है. यह उन लोगों के लिए प्राप्त किए गए अनुक्रम को प्रतिबंधित करता है जिसमें रुचि के प्रतिमान हैं । इस उपकरण विशेष रूप से उपयोगी है अगर एक आकृति समूह के लिए अद्वितीय स्पष्ट रूप से पहचाना जा सकता है ।

एक सटीक संरेखण वंशावली विश्लेषण के लिए महत्वपूर्ण है; वृक्षों की व्याख्याएँ तभी मान्य होती हैं, जब वे अच्छे संरेखण का प्रयोग कर उत्पन्ना होती हैं. संरेखण को सूचित करने के लिए संदर्भ का उपयोग करने से उन त्रुटियों से बचने में मदद मिल सकती है जो केवल तभी स्पष्ट होती है जब संरचना या गतिविधि मानी जाती है । अनुक्रम अतिरेक परियोजना के लिए परिभाषित करने की आवश्यकता होगी । दो दृश्यों कि निरर्थक लगता है वंशावली प्रयोजनों के लिए नहीं हो सकता है अगर वे व्यापक रूप से अलग taxa से कर रहे है या अनुक्रम में लगभग समान हैं, लेकिन विभिंन संरचनात्मक या कार्यात्मक गुण है । यदि अस्पष्टता के बारे में जो अनुक्रम शामिल किया जाना चाहिए है, एकाधिक संरेखण उत्पंन किया जा सकता है और अलग से विश्लेषण के लिए देखने के कैसे संरेखण परिवर्तन प्रभाव वंशावली अनुमान । यहां प्रस्तुत विधि संरेखण के मैनुअल समायोजन के लिए की जरूरत को खत्म नहीं करता है, लेकिन यह स्पष्ट करने के लिए कैसे अनुक्रम संरेखित करना चाहिए और संभवतः एक अधिक परिष्कृत बारकोडिंग तकनीक के साथ संयोजन के रूप में इस्तेमाल किया जा सकता है की तुलना में वर्णित किया गया है मदद कर सकते है पहले13

संदर्भ के लिए उपयोगी हो, यह परिभाषित विशेषताओं है कि वर्तमान में अकेले अनुक्रम से स्पष्ट नहीं कर रहे है की पहचान करने के लिए महत्वपूर्ण है । उदाहरण के लिए, प्रत्येक अनुक्रम स्वयं के लिए सम्मान के साथ क्रमांकित है जब cysteines की विभिन्न संख्याओं के साथ अनुक्रम के बीच cysteine संबंध प्रतिमान तुलना करने के लिए अक्षमता पर विचार करें । लक्ष्य की तुलना और चर्चा की सुविधा है, भ्रम की एक और परत को जोड़ने के लिए नहीं है । इस संदर्भ के कई पुनरावृत्तियों और निर्णय जो सुविधाओं को शामिल करने के लिए तय करने में कॉल शामिल हो सकते हैं । यह आशा की जाती है कि एक समूह में अलग दृश्यों पर चर्चा की एक आम विधि को अपनाने के एक पूरे के रूप में समूह की समझ में वृद्धि होगी ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखक का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

चल tardigrade रोगाणुरोधी पेप्टाइड अनुसंधान अनुसंधान और प्रायोजित कार्यक्रम (ORSP) के Midwestern विश्वविद्यालय कार्यालय से अंदर धन द्वारा समर्थित है । ORSP अध्ययन डिजाइन, डेटा संग्रह, विश्लेषण, व्याख्या, या पांडुलिपि तैयारी में कोई भूमिका नहीं थी ।

Materials

Name Company Catalog Number Comments
BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

DOWNLOAD MATERIALS LIST

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, (Database issue) 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, (Database issue) 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Tags

व्यवहार अंक १२६ प्रोटीन superfamily प्रोटीन नामकरण प्रोटीन वर्गीकरण अनुक्रम संरेखण फाइलोजेनी invertebrate defensins CS-αβ superfamily
बनाने और चर्चा और एक विविध समूह में प्रोटीन के वर्गीकरण की सुविधा के लिए एक संदर्भ लागू
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Tarr, D. E. K. Creating and Applying More

Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter