The Journal of Visualized Experiments (JoVE) is a peer reviewed, PubMed-indexed video journal. Our mission is to increase the productivity of scientific research.
This translation into Hindi was automatically generated through Google Translate.
English Version | Other Languages
1Center for Computational Medicine and Bioinformatics, University of Michigan, 2Center for Bioinformatics and Department of Molecular Bioscience, University of Kansas
Roy, A., Xu, D., Poisson, J., Zhang, Y. A Protocol for Computer-Based Protein Structure and Function Prediction. J. Vis. Exp. (57), e3259, doi:10.3791/3259 (2011).
जीनोम अनुक्रमण परियोजनाओं प्रोटीन अनुक्रम के लाखों है, जो उनकी संरचना और समारोह के ज्ञान की आवश्यकता होती है उनके जैविक भूमिका की समझ में सुधार ciphered है. हालांकि प्रयोगात्मक विधियों इन प्रोटीनों की एक छोटा सा अंश के लिए विस्तृत जानकारी प्रदान कर सकते हैं, कम्प्यूटेशनल मॉडलिंग प्रोटीन अणु जो प्रयोगात्मक uncharacterized हैं के बहुमत के लिए की जरूरत है. मैं - TASSER सर्वर प्रोटीन संरचना और समारोह के उच्च संकल्प मॉडलिंग के लिए एक ऑन - लाइन कार्यक्षेत्र है. एक प्रोटीन अनुक्रम को देखते हुए, मैं TASSER सर्वर से एक ठेठ उत्पादन माध्यमिक संरचना भविष्यवाणी शामिल है, प्रत्येक अवशेषों की विलायक पहुंच, मुताबिक़ टेम्पलेट सूत्रण और संरचना संरेखण द्वारा पता लगाया प्रोटीन, पाँच पूर्ण लंबाई तृतीयक संरचनात्मक मॉडल, और संरचना के आधार पर भविष्यवाणी एंजाइम के वर्गीकरण के लिए कार्यात्मक एनोटेशन, जीन सत्तामीमांसा नियम और प्रोटीन ligand बाध्यकारी साइटों. सभी भविष्यवाणियों विश्वास स्कोर के साथ टैग कर रहे हैं जोबताता है कि कैसे सटीक भविष्यवाणियों प्रयोगात्मक डेटा जानने के बिना कर रहे हैं. अंत उपयोगकर्ताओं के विशेष अनुरोध को सुविधाजनक बनाने के लिए, सर्वर चैनल प्रदान करने के लिए उपयोगकर्ता द्वारा निर्दिष्ट अवशेषों अंतर दूरी को स्वीकार करने और नक्शे संपर्क करने के लिए interactively मैं - TASSER मॉडलिंग बदल, यह भी उपयोगकर्ताओं को निर्दिष्ट करने के लिए टेम्पलेट के रूप में किसी भी प्रोटीन की अनुमति देता है, या किसी टेम्पलेट बाहर संरचना विधानसभा सिमुलेशन के दौरान प्रोटीन. संरचनात्मक जानकारी या मैं TASSER भविष्यवाणियों की गुणवत्ता में सुधार लाने के उद्देश्य के साथ प्रयोगात्मक सबूत जैविक अंतर्दृष्टि के आधार पर उपयोगकर्ताओं द्वारा एकत्र किया जा सकता है है. सर्वर प्रोटीन संरचना के लिए सबसे अच्छा कार्यक्रमों और हाल ही में समुदाय चौड़ा CASP प्रयोगों में समारोह भविष्यवाणियों के रूप में मूल्यांकन किया गया था. वहाँ वर्तमान में कर रहे हैं> 100 से अधिक देशों से 20,000 पंजीकृत वैज्ञानिकों ने ऑन - लाइन मैं TASSER सर्वर का उपयोग कर रहे हैं.
विधि सिंहावलोकन
प्रतिमान अनुक्रम संरचना करने के लिए समारोह के बाद, संरचना और समारोह मॉडलिंग के लिए मैं TASSER 1-4 प्रक्रिया के लगातार कदम चार शामिल है: (एक) 5 LOMETS द्वारा टेम्पलेट पहचान, (ख) प्रतिकृति के द्वारा reassembly टुकड़ा संरचना मुद्रा मोंटे कार्लो सिमुलेशन 6, (ग) परमाणु स्तर संरचना 7 रेमो और FG-8 एमडी का उपयोग शोधन, और (घ) संरचना के आधार पर समारोह का उपयोग कर व्याख्याओं cofactor 9 .
टेम्पलेट पहचान: एक क्वेरी उपयोगकर्ता द्वारा प्रस्तुत अनुक्रम के लिए, अनुक्रम पहले मेटा - सूत्रण सर्वर स्थानीय रूप से स्थापित LOMETS द्वारा एक प्रतिनिधि PDB संरचना और पुस्तकालय के माध्यम से लड़ी पिरोया है. सूत्रण एक अनुक्रम संरचना संरेखण प्रक्रिया है जो इसी तरह की संरचना है या क्वेरी प्रोटीन के रूप में इसी तरह के संरचनात्मक आकृति शामिल कर सकते हैं टेम्पलेट प्रोटीन की पहचान के लिए प्रयोग किया जाता है. मुताबिक़ templ के कवरेज बढ़ानेखाया detections, LOMETS कई राज्य के-the-कला अलग सूत्रण के तरीके को कवर एल्गोरिदम को जोड़ती है. चूंकि अलग सूत्रण कार्यक्रमों विभिन्न स्कोरिंग सिस्टम और संरेखण संवेदनशीलता है, प्रत्येक सूत्रण कार्यक्रम से उत्पन्न सूत्रण संरेखण की गुणवत्ता सामान्यीकृत Z स्कोर, जो के रूप में परिभाषित किया गया है द्वारा मूल्यांकन है: 
जहां Z स्कोर मानक विचलन इकाइयों में सभी कार्यक्रम द्वारा उत्पन्न alignments के सांख्यिकीय मतलब के सापेक्ष स्कोर है, और जेड 0 विशेष कार्यक्रम Z स्कोर सूत्रण बेंचमार्क 5 बड़े पैमाने पर परीक्षण के आधार पर निर्धारित किया है 'अच्छा अंतर cutoff 'और' बुरा टेम्पलेट्स '. एक उच्च Z स्कोर के साथ एक टेम्पलेट का मतलब है कि शीर्ष टेम्पलेट्स एक संरेखण काफी अन्य टेम्पलेट्स, जो आम तौर पर अर्थ है कि संरेखण एक अच्छा मॉडल से मेल खाती है है की तुलना में सबसे अधिक स्कोर है. यदि शीर्ष सूत्रण टेम्पलेट्स का सबसे हायसामान्यीकृत gh Z-स्कोर, अंतिम मैं TASSER मॉडल की सटीकता आमतौर पर उच्च है . हालांकि, अगर प्रोटीन बड़ी है और सूत्रण alignments के कवरेज क्वेरी प्रोटीन के एक छोटे से क्षेत्र तक ही सीमित है, एक उच्च सामान्यीकृत Z स्कोर जरूरी पूर्ण लंबाई मॉडल के लिए एक उच्च सटीकता मॉडलिंग नहीं मतलब है. प्रत्येक सूत्रण कार्यक्रम से शीर्ष दो सूत्रण संरेखण एकत्र कर रहे हैं और संरचना विधानसभा के अगले कदम के लिए प्रयोग किया जाता है.
संरचना विधानसभा अनुकार चलने का सूत्रण प्रक्रिया के बाद, क्वेरी अनुक्रम गठबंधन और unaligned क्षेत्रों सूत्रण में विभाजित है. सूत्रण संरेखण में निरंतर टुकड़े टेम्पलेट्स से excised और संरचना विधानसभा के लिए सीधे इस्तेमाल किया, जबकि unaligned पाश क्षेत्रों आदितः मॉडलिंग द्वारा निर्मित कर रहे हैं. संरचना विधानसभा प्रक्रिया एक जाली प्रतिकृति मुद्रा मोंटे कार्लो 6 सिमुलेशन द्वारा निर्देशित प्रणाली पर किया जाता है. मैं TASSER बल हाइड्रोजन बो क्षेत्र शामिल हैं10 बातचीत, ज्ञान आधारित सांख्यिकीय ऊर्जा PDB 11, अनुक्रम आधारित 12 SVMSEQ से संपर्क भविष्यवाणियों, और स्थानिक LOMETS 5 सूत्रण टेम्पलेट्स से एकत्र मजबूरी में जाना जाता प्रोटीन संरचनाओं से व्युत्पन्न शर्तों nding. गठनात्मक सिमुलेशन के दौरान कम तापमान प्रतिकृतियां में उत्पन्न decoys 13 SPICKER द्वारा clustered रहे हैं कम मुक्त ऊर्जा राज्यों के ढांचे की पहचान . शीर्ष समूहों के क्लस्टर centroids सभी संकुल संरचनात्मक decoys के 3 डी निर्देशांक औसत और अंतिम मॉडल पीढ़ी के लिए इस्तेमाल किया द्वारा प्राप्त कर रहे हैं. क्लस्टरिंग और प्रक्रिया अनुकरण steric संघर्ष को हटाने और आगे वैश्विक टोपोलॉजी परिष्कृत करने के लिए दो बार दोहराया जाता है.
परमाणु स्तर के मॉडल निर्माण और शोधन: क्लस्टर SPICKER क्लस्टरिंग के बाद प्राप्त centroids प्रोटीन (प्रत्येक अपनी सी α और द्रव्यमान का केंद्र पक्ष श्रृंखला द्वारा प्रतिनिधित्व अवशेषों) मॉडल और घंटे कम कर रहे हैंएवेन्यू सीमित जैविक आवेदन. कम मॉडल से पूर्ण परमाणु मॉडल का निर्माण दो चरणों में किया जाता है. पहले चरण में 7 रेमो सी अल्फा निशान से एच बंधन नेटवर्क के अनुकूलन के द्वारा पूर्ण परमाणु मॉडल का निर्माण किया है. दूसरे चरण में, रेमो पूर्ण परमाणु मॉडल आगे FG 14-एमडी, जो रीढ़ मरोड़ कोण, बंधन लंबाई, और पक्ष श्रृंखला रोटामर झुकाव में सुधार के द्वारा परिष्कृत कर रहे हैं, आणविक गतिशील सिमुलेशन के द्वारा, के रूप में संरचनात्मक से खोजा टुकड़े द्वारा निर्देशित पंक्ति द्वारा PDB संरचनाओं टीएम. FG-एमडी परिष्कृत मॉडल तृतीयक संरचना भविष्यवाणियों के लिए अंतिम मॉडल के रूप में मैं TASSER द्वारा किया जाता है.
उत्पन्न मॉडल की गुणवत्ता विश्वास स्कोर (सी स्कोर), जो जेड LOMETS सूत्रण संरेखण के स्कोर और मैं TASSER सिमुलेशन के अभिसरण, गणितीय के रूप में तैयार के आधार पर परिभाषित किया गया है के आधार पर अनुमान है: 
जहां
सी स्कोर मैं TASSER मॉडल की गुणवत्ता के साथ एक मजबूत सहसंबंध है. सी - स्कोर और प्रोटीन की लंबाई के संयोजन से, पहले मैं TASSER मॉडल की सटीकता टीएम स्कोर और 2 RMSD 15 के लिए एक के लिए 0.08 के औसत त्रुटि के साथ अनुमान लगाया जा सकता है. सामान्य में, सी -> स्कोर के साथ मॉडल - 1.5 के लिए एक सही गुना की उम्मीद कर रहे हैं. यहाँ, RMSD और TM स्कोर दोनों मॉडल और देशी संरचना के बीच topological समानता की अच्छी तरह से जाना जाता है उपाय. टीएम के स्कोर valu[0 1] तों रेंज, जहां एक उच्च स्कोर इंगित करता है एक बेहतर संरचना मैच 16,17. लेकिन निचले क्रम मॉडल (यानी 2 एन डी -5 वें मॉडल) के लिए, टीएम स्कोर और RMSD के साथ सी - स्कोर के संबंध बहुत कमजोर है (~ 0.5), और निरपेक्ष मॉडल गुणवत्ता के विश्वसनीय आकलन के लिए नहीं किया जा सकता है.
पहला मॉडल मैं TASSER सिमुलेशन में हमेशा सबसे अच्छा मॉडल है? इस सवाल का जवाब लक्ष्य प्रकार पर निर्भर करता है. आसान लक्ष्य के लिए, पहली मॉडल आम तौर पर सबसे अच्छा मॉडल और सी स्कोर आम तौर पर मॉडलों के बाकी की तुलना में ज्यादा है. हालांकि, मुश्किल लक्ष्य है, जहां सूत्रण महत्वपूर्ण टेम्पलेट हिट नहीं है के लिए, पहली मॉडल जरूरी बेहतरीन मॉडल नहीं है और मैं TASSER वास्तव में सबसे अच्छा टेम्पलेट और मॉडल का चयन करने में कठिनाई है. इसलिए यह कठिन लक्ष्य के लिए सभी 5 मॉडल का विश्लेषण करने और उन्हें प्रायोगिक जानकारी और जैविक ज्ञान के आधार पर चयन करें की सिफारिश की है.
फंक्शन predictions: अंतिम चरण में, अंतिम FG-एमडी से उत्पन्न 3D मॉडल प्रोटीन समारोह के तीन पहलुओं की भविष्यवाणी, अर्थात् करने के लिए उपयोग किया जाता है:) एनजाइम आयोग (ईसी) 18 नंबर और (ख) जीन (जाओ) आंटलजी 19 नियम और ( ग) छोटे अणु ligands के लिए बाध्यकारी साइटों. सभी तीन पहलुओं के लिए कार्यात्मक व्याख्याओं cofactor, जो प्रोटीन PDB में जाना जाता संरचना और कार्यों के साथ वैश्विक और स्थानीय टेम्पलेट प्रोटीन समानता के आधार पर समारोह की भविष्यवाणी के लिए एक नया दृष्टिकोण है का उपयोग कर उत्पन्न कर रहे हैं. सबसे पहले, भविष्यवाणी मॉडल की वैश्विक टोपोलॉजी कार्यात्मक टेम्पलेट पुस्तकालयों के खिलाफ मिलान संरचनात्मक संरेखण प्रोग्राम का उपयोग कर 20 TM-संरेखित. अगला, अपने वैश्विक संरचना समानता के आधार पर लायब्रेरी से सबसे लक्षित मॉडल करने के लिए इसी तरह की प्रोटीन का एक सेट का चयन कर रहे हैं, और एक व्यापक स्थानीय खोज साइट सक्रिय / बाध्यकारी क्षेत्र के निकट संरचना और अनुक्रम समानता को पहचानने के लिए किया जाता है. परिणामी वैश्विक और स्थानीय समानता स्कोर रैंक करने के लिए इस्तेमाल किया जाता हैटेम्पलेट (कार्य homologues) प्रोटीन और एनोटेशन (ईसी संख्या और जीन सत्तामीमांसा 19 संदर्भ) शीर्ष स्कोरिंग हिट पर आधारित हस्तांतरण. इसी तरह, ligand बाध्यकारी साइट के अवशेष और ligand बाध्यकारी मोड शीर्ष स्कोरिंग समारोह 9 टेम्पलेट्स में जाना जाता है ligand बाध्यकारी साइट के अवशेषों के साथ क्वेरी के स्थानीय संरेखण पर आधारित अनुमानित हैं.
समारोह की गुणवत्ता (ईसी और जाओ शब्द) मैं TASSER में भविष्यवाणी कार्यात्मक अनुरूपता स्कोर (FH-स्कोर) जो क्वेरी और टेम्पलेट के बीच वैश्विक और स्थानीय समानता का एक उपाय है के आधार पर मूल्यांकन किया जाता है, और के रूप में परिभाषित किया है: 
जहां सी स्कोर भविष्यवाणी मॉडल के रूप में Eq में परिभाषित की गुणवत्ता के एक अनुमान है. (2), टीएम स्कोर मॉडल और टेम्पलेट प्रोटीन के बीच वैश्विक संरचनात्मक समानता के उपाय, RMSD अली से 20 TM-संरेखित structurally गठबंधन क्षेत्र में टेम्पलेट और संरचना मॉडल के बीच RMSD, Cov संरचनात्मक संरेखण है (अर्थात संरचनात्मक गठबंधन क्वेरी लंबाई से विभाजित अवशेषों का अनुपात) के कवरेज का प्रतिनिधित्व करता है, आईडी अली अनुक्रम संरेखण टीएम पंक्ति में पहचान है. चुनाव आयोग संख्या भविष्यवाणियों के लिए अनुमानित विश्वास स्कोर क्वेरी और टेम्पलेट के बीच एक परिभाषित स्थानीय क्षेत्र के भीतर सक्रिय साइट मैच (ACM), के मूल्यांकन के रूप में गणना के लिए एक शब्द भी शामिल हैं: 
घ = 0 3.0 Å, घ द्वितीय, एन अली, जहां एन टी टेम्पलेट स्थानीय क्षेत्र के भीतर मौजूद अवशेषों की संख्या का प्रतिनिधित्व करता है गठबंधन क्वेरी टेम्पलेट अवशेषों जोड़े की संख्या है मैं गठबंधन अवशेषों वें जोड़ी के बीच सी α दूरी है दूरी cutoff, एम ii गठबंधन अवशेषों का ith जोड़ी के बीच BLOSUM स्कोर है. सामान्य में, FH-स्कोर रेंज में है. [0 5] और ACM स्कोर 0 [2 के बीच,], जहां उच्च स्कोर अधिक विश्वास कार्यात्मक कार्य का संकेत है. ACM स्कोर भी स्थानीय संरचना और अनुक्रम समानता ligand बाध्यकारी साइटों, जो बी एस स्कोर के रूप में संदर्भित किया जाता है के पास के मूल्यांकन के लिए प्रयोग किया जाता है.
1. प्रोटीन अनुक्रम प्रस्तुत
2. परिणामों की उपलब्धता
3. माध्यमिक संरचना और विलायक पहुँच भविष्यवाणियों
4. तृतीयक संरचना भविष्यवाणियों
5. LOMETS लक्ष्य टेम्पलेट संरेखण
6.PDB में स्ट्रक्चरल analogs
7. फंक्शन cofactor का उपयोग भविष्यवाणी
8. एनजाइम आयोग संख्या भविष्यवाणी
9. जीन सत्तामीमांसा (जाओ) अवधि भविष्यवाणियों
10. प्रोटीन ligand बाध्यकारी साइट भविष्यवाणियों
11. प्रतिनिधि परिणाम

चित्रा 1 मैं TASSER परिणाम पृष्ठ का एक अंश दिखा (ए) FASTA क्वेरी अनुक्रम स्वरूपित, (बी) माध्यमिक संरचना और संबद्ध विश्वास स्कोर की भविष्यवाणी की, और (सी) अवशेषों की विलायक पहुँच की भविष्यवाणी की. विश्लेषण कोर क्षेत्र और क्वेरी में संभावित जलयोजन साइट सियान और लाल आयत में डाला जाता है, क्रमशः.

चित्रा 2.

चित्रा 3. मैं TASSER परिणाम पृष्ठ LOMETS 5 सूत्रण कार्यक्रमों द्वारा शीर्ष दस पहचान सूत्रण टेम्पलेट्स और संरेखण दिखाने का एक उदाहरण है. सूत्रण संरेखण की गुणवत्ता सामान्यीकृत Z-स्कोर (हरे रंग में प्रकाश डाला) है, जहां एक मूल्य 1> एक विश्वास संरेखण को दर्शाता है के आधार पर मूल्यांकन किया जाता है. टेम्पलेट में निरपेक्ष अवशेषों है कि इसी क्वेरी अवशेषों के लिए समान हैं रंग में हाइलाइट किया जाता है संरक्षित अवशेषों / आकृति की उपस्थिति का संकेत है, जबकि संरेखण की कमी के अधिकांश में शीर्ष टेम्पलेट्स इंगित करता है क्वेरी प्रोटीन और unaligned अवशेषों में एकाधिक डोमेन की उपस्थिति डोमेन linker क्षेत्रों के अनुरूप 3 आंकड़ा के संस्करण पूर्ण आकार देखने के लिए यहाँ क्लिक करें.

चित्रा 4. परिणाम पृष्ठ के शीर्ष दस पहचान संरचनात्मक analogs और संरचनात्मक संरेखण, द्वारा की पहचान दिखा एक उदाहरण 20 संरचनात्मक संरेखण कार्यक्रम टीएम - संरेखित. में दिखाया analogs की रैंकिंग संरचनात्मक संरेखण TM-स्कोर (नीले रंग में हाइलाइट) पर आधारित है. एक> 0.5 TM-स्कोर इंगित करता है कि दोनों की तुलना संरचनाओं एक समान टोपोलॉजी है, जबकि एक 0.3 <टीएम के स्कोर दो यादृच्छिक संरचनाओं के बीच समानता का मतलब है. संरचनात्मक गठबंधन अवशेषों जोड़े उनकी संपत्ति एमिनो एसिड पर आधारित रंग में हाइलाइट किया जाता है, जबकि unaligned क्षेत्रों से संकेत कर रहे हैं "-" है.ove.com/files/ftp_upload/3259/3259fig4large.jpg "> यहाँ क्लिक करें आंकड़ा 4 पूर्ण आकार संस्करण को देखने.

चित्रा 5 मैं TASSER परिणाम पृष्ठ PDB लायब्रेरी में क्वेरी प्रोटीन की पहचान एंजाइम homologues दिखाने का एक उदाहरण है . चुनाव आयोग संख्या भविष्यवाणी के आत्मविश्वास के स्तर (हरे रंग में प्रकाश डाला) चुनाव आयोग स्कोर, जहां चुनाव आयोग स्कोर 1.1> कार्यात्मक क्वेरी और टेम्पलेट प्रोटीन के बीच समानता (एक ही चुनाव आयोग संख्या के पहले 3 अंक) इंगित करता है के आधार पर विश्लेषण किया है.

चित्रा 6 मैं TASSER परिणाम दिखा पृष्ठ का एक उदाहरण क्वेरी प्रोटीन के लिए अवधि भविष्यवाणियों जाओ. जीन सत्तामीमांसा टेम्पलेट लायब्रेरी में क्वेरी प्रोटीन के लिए कार्यात्मक homologues उनके FH-स्कोर (नारंगी आयत में) के आधार पर क्रमबद्ध हैं. इन शीर्ष स्कोरिंग हिट से आम कार्यात्मक सुविधाओं gener प्राप्त कर रहे हैं अंतिम क्वेरी प्रोटीन के लिए अवधि भविष्यवाणियों जाओ खा लिया. भविष्यवाणी जाओ शर्तों की गुणवत्ता का अनुमान आंकड़ा 6 संस्करण पूर्ण आकार देखने के लिए यहाँ क्लिक करें जाओ - (हरे रंग में दिखाया गया है) स्कोर है, जहां एक GO के स्कोर> 0.5 एक विश्वसनीय भविष्यवाणी इंगित करता है. पर आधारित है.

7 चित्रा मैं TASSER परिणाम पृष्ठ शीर्ष दस प्रोटीन ligand बाध्यकारी साइट cofactor 9 एल्गोरिथ्म का उपयोग कर भविष्यवाणियों दिखाने का एक उदाहरण है. भविष्यवाणी बाध्यकारी साइटों की रैंकिंग भविष्यवाणी ligand रचना है कि क्वेरी में आम बाध्यकारी जेब साझा की संख्या पर आधारित है. बी एस-स्कोर (लाल रंग में हाइलाइट) स्थानीय अनुक्रम और संरचना भविष्यवाणी की है और टेम्पलेट बाध्यकारी साइट के बीच समानता के एक उपाय है, और बाध्यकारी साइट जेब के संरक्षण का विश्लेषण करने के लिए उपयोगी है.
les/ftp_upload/3259/3259fig8.jpg "/>
8 चित्रा बाहरी संयम अवशेषों अवशेषों संपर्क / दूरी मजबूरी निर्दिष्ट करने के लिए करने के लिए इस्तेमाल किया फाइलों का एक उदाहरण है .

9 चित्रा संयम मैं TASSER सर्वर के लिए एक टेम्पलेट प्रोटीन निर्दिष्ट करने के लिए उपयोग की गई फ़ाइलों का उदाहरण है . या (बी) 3 डी स्वरूप, उपयोगकर्ता क्वेरी टेम्पलेट (ए) FASTA प्रारूप में संरेखण या तो निर्दिष्ट कर सकते हैं.

10 चित्रा एक उदाहरण मैं TASSER संरचना मॉडलिंग की प्रक्रिया के दौरान टेम्पलेट को छोड़कर के लिए इस्तेमाल किया फ़ाइल . प्रथम स्तंभ टेम्पलेट के लिए बाहर रखा जाना प्रोटीन की PDB आईडी शामिल हैं. दूसरे स्तंभ के लिए अनुक्रम पहचान cutoff जो टेम्पलेट लायब्रेरी में अन्य समान टेम्पलेट्स के लिए इस्तेमाल किया जाएगा निर्दिष्ट करने के लिए प्रयोग किया जाता है.
ऊपर प्रस्तुत प्रोटोकॉल संरचना और समारोह मैं TASSER सर्वर का उपयोग कर मॉडलिंग के लिए एक सामान्य दिशानिर्देश है. हालांकि, यह स्वचालित प्रक्रिया प्रोटीन के अधिकांश के लिए बहुत अच्छी तरह से काम करता है, मानव हस्तक्षेप अक्सर काफी मॉडलिंग सटीकता में सुधार प्रोटीन जो PDB पुस्तकालय में करीब टेम्पलेट्स कमी के लिए विशेष रूप से, मदद. उपयोगकर्ता मैं TASSER निम्न तरीकों में मॉडलिंग के दौरान हस्तक्षेप कर सकते हैं: (क) बहु - डोमेन प्रोटीन के बंटवारे, (ख) बाहरी मजबूरी प्रदान करने के लिए संरचना विधानसभा में सुधार, और (ग) मॉडलिंग के दौरान टेम्पलेट्स हटाने.
बंटवारे प्रोटीन बहु - डोमेन:
कई लंबे प्रोटीन दृश्यों अक्सर एकाधिक डोमेन लचीला linker क्षेत्रों, जो उनकी संरचना की व्याख्या दोनों प्रयोगात्मक और कम्प्यूटेशनल तकनीकों का उपयोग कर मुश्किल बनाता द्वारा सीमित होते हैं. फिर भी, के रूप में डोमेन स्वतंत्र संस्थाओं तह कर रहे हैं और अलग आणविक समारोह में प्रदर्शन कर सकते हैं, यह हैप्रत्येक डोमेन लंबे बहु - डोमेन प्रोटीन और मॉडल अलग - अलग विभाजित वांछनीय. मॉडलिंग डोमेन केवल व्यक्तिगत भविष्यवाणी की प्रक्रिया को गति नहीं होगा, लेकिन यह भी क्वेरी-टेम्पलेट संरेखण की गुणवत्ता बढ़ जाती है, और अधिक विश्वसनीय संरचना और समारोह भविष्यवाणियों में जिसके परिणामस्वरूप.
प्रोटीन दृश्यों में डोमेन सीमाओं आज़ादी से उपलब्ध NCBI CDD 24, PFAM 25 या 26 InterProScan जैसे बाह्य ऑनलाइन कार्यक्रम का उपयोग कर भविष्यवाणी की जा सकती है. इसके अलावा, अगर LOMETS सूत्रण संरेखण क्वेरी प्रोटीन के लिए उपलब्ध हैं, डोमेन सीमाओं नेत्रहीन शीर्ष सूत्रण टेम्पलेट्स में unaligned अवशेषों की लंबी हिस्सों की पहचान (5.4 चरण देखें) द्वारा स्थित किया जा सकता है. इन unaligned क्षेत्रों ज्यादातर डोमेन linker क्षेत्रों के अनुरूप. यदि बहु - डोमेन टेम्पलेट्स सभी क्वेरी गठबंधन डोमेन के साथ टेम्पलेट PDB लायब्रेरी में पहले से ही उपलब्ध हैं, तो क्वेरी प्रोटीन पूरी लंबाई के रूप में modeled किया जा सकता है.
बाहरी मजबूरी प्रदान
(Norm. Z स्कोर> 1) के लिए, व्युत्पन्न स्थानिक मजबूरी उच्च सटीकता के ज्यादातर रहे हैं और मैं TASSER इन प्रोटीनों के लिए उच्च संकल्प संरचनात्मक मॉडल उत्पन्न होगा. इसके विपरीत, क्वेरी प्रोटीन है कि कमजोर है या नहीं सूत्रण हिट (Norm. Z स्कोर <1) के लिए, एकत्र स्थानिक मजबूरी अक्सर टेम्पलेट और संरेखण की अनिश्चितता की वजह से त्रुटियों के होते हैं. इन प्रोटीन लक्ष्य के लिए, उपयोगकर्ता द्वारा निर्दिष्ट स्थानिक जानकारी बहुत उपयोगी हो सकता भविष्यवाणी मॉडल की गुणवत्ता में सुधार कर सकते हैं. उपयोगकर्ता बाहरी मजबूरी मैं TASSER दो मायनों में सर्वर करने के लिए प्रदान कर सकते हैं:
ए / संपर्क दूरी मजबूरी निर्दिष्ट
प्रयोगात्मक विशेषता अंतर - अवशेषों संपर्कों / दूरी, या उदाहरण के लिए एनएमआर सेपार से जोड़ने प्रयोगों, एक संयम फ़ाइल को अपलोड करने के द्वारा निर्दिष्ट किया जा सकता है है. एक उदाहरण फ़ाइल 8 चित्रा, जहां संयम के एक स्तंभ प्रकार निर्दिष्ट में दिखाया गया है, "जिला" या "संपर्क" अर्थात्. दूरी संयम के लिए (जिला), 2 कॉलम और 4 अवशेषों पदों (i, j) होते हैं, 3 कॉलम और 5 अवशेषों और 6 स्तंभ में परमाणु प्रकार के होते हैं दो निर्दिष्ट परमाणुओं के बीच दूरी निर्दिष्ट. संपर्क मजबूरी (संपर्क), 2 स्तंभ और 3 अवशेष है जो संपर्क में होना चाहिए की स्थिति (i, j) शामिल हैं. इन अवशेषों जोड़े संपर्क के पक्ष श्रृंखला केंद्र के बीच की दूरी PDB में जाना जाता संरचनाओं में मनाया दूरी के आधार पर फैसला किया है. मैं - TASSER इन परमाणु संरचना शोधन सिमुलेशन के दौरान निर्दिष्ट दूरी के करीब जोड़े को आकर्षित करने की कोशिश करेंगे.
बी एक प्रोटीन संरचना टेम्पलेट निर्दिष्ट
LOMETS सूत्रण प्रोग्राम एक प्रतिनिधि PDB पुस्तकालय का उपयोग करने के लिए क्वेरी prot के लिए प्रशंसनीय सिलवटों मिलईआईऍन. हालांकि एक प्रतिनिधि संरचना पुस्तकालय का उपयोग कर के अनुक्रम संरचना संरेखण गणना करने के लिए आवश्यक समय को कम करने में मदद करता है, यह संभव है कि एक अच्छा टेम्पलेट प्रोटीन पुस्तकालय में याद किया जाता है या टेम्पलेट LOMETS सूत्रण कार्यक्रमों द्वारा पहचान नहीं हो सकता है, भले ही यह है पुस्तकालय में उपस्थित थे. इन मामलों में, उपयोगकर्ता को टेम्पलेट के रूप में वांछित प्रोटीन संरचना को निर्दिष्ट करना चाहिए.
एक अतिरिक्त टेम्पलेट के रूप में प्रोटीन की संरचना को निर्दिष्ट करने के लिए, उपयोगकर्ताओं को या तो एक PDB स्वरूपित संरचना फ़ाइल अपलोड कर सकते हैं या एक PDB पुस्तकालय में जमा प्रोटीन संरचना के PDB ID निर्दिष्ट. मैं TASSER क्वेरी टेम्पलेट का उपयोग मस्टर कार्यक्रम 23 संरेखण पैदा करते हैं और दोनों निर्दिष्ट उपयोगकर्ता टेम्पलेट और LOMETS संरचना विधानसभा अनुकार गाइड टेम्पलेट्स से स्थानिक मजबूरी इकट्ठा करेंगे. क्योंकि LOMETS मजबूरी की सटीकता लक्ष्यों के लिए अलग अलग है, LOMETS मजबूरी के वजन आसान टा (मुताबिक़) में मजबूत हैहार्ड (गैर - मुताबिक़) लक्ष्य है, जो व्यवस्थित किया गया है हमारे बेंचमार्क प्रशिक्षण में देखते है कि तुलना में rgets.
उपयोगकर्ताओं को भी अपने स्वयं क्वेरी टेम्पलेट संरेखण निर्दिष्ट कर सकते हैं. FASTA स्वरूप (चित्रा 9A) और 3 डी स्वरूप (9b चित्रा): सर्वर के दो स्वरूपों में संरेखण स्वीकार करता है. FASTA प्रारूप मानक और में वर्णित है http://zhanglab. ccmb.med.umich.edu / / FASTA . 3 डी स्वरूप मानक PDB स्वरूप (समान है http://www.wwpdb.org/documentation/format32/sect9.html ), लेकिन दो अतिरिक्त टेम्पलेट्स से व्युत्पन्न स्तंभों परमाणु रिकॉर्ड (चित्रा 9b देखें) करने के लिए जोड़ रहे हैं:
1-30 कॉलम: एटम (केवल सी अल्फा) और क्वेरी अनुक्रम के लिए नाम अवशेषों.
31-54 कॉलम: टेम्पलेट में संगत परमाणुओं से नकल क्वेरी के सी अल्फा परमाणुओं के निर्देशांक.
55-59 स्तंभ: टेम्पलेट में संगत अवशेषों संख्या संरेखण पर आधारित
टेम्पलेट में संगत अवशेषों नाम: 60-64 स्तंभ
टेम्पलेट्स प्रोटीन अपवर्जित
प्रोटीन लचीला अणु होते हैं और कई गठनात्मक राज्यों को अपनाने के लिए उनके जैविक गतिविधि को बदल सकते हैं. उदाहरण के लिए, कई प्रोटीन kinases और झिल्ली प्रोटीन की संरचना दोनों सक्रिय और निष्क्रिय रचना में हल किया गया है. इसके अलावा बाध्य ligand की उपस्थिति या अनुपस्थिति बड़े संरचनात्मक आंदोलनों का कारण बन सकती है. जबकि टेम्पलेट के सभी गठनात्मक राज्यों सूत्रण कार्यक्रमों के लिए एक जैसे हैं, यह केवल एक विशेष राज्य में टेम्पलेट्स का उपयोग कर क्वेरी मॉडल वांछनीय है. सर्वर पर एक नया विकल्प संरचना मॉडलिंग के दौरान टेम्पलेट प्रोटीन को बाहर करने के लिए उपयोगकर्ता की अनुमति देता है. यह सुविधा भी उपयोगकर्ता मॉडलिंग के लिए इस्तेमाल किया जा टेम्पलेट्स समरूपता के स्तर का चयन करने के लिए अनुमति होगी. उपयोगकर्ता टेम्पलेट प्रोटीन fr बाहर कर सकते हैंपुस्तकालय मैं - TASSER ओम द्वारा:
ए निर्दिष्ट एक अनुक्रम पहचान cutoff
मैं TASSER टेम्पलेट लायब्रेरी से मुताबिक़ प्रोटीन को अलग उपयोगकर्ता इस विकल्प का उपयोग कर सकते हैं. अनुरूपता स्तर अनुक्रम पहचान cutoff पर आधारित है, क्वेरी और टेम्पलेट क्वेरी अनुक्रम के अनुक्रम की लंबाई से विभाजित प्रोटीन के बीच समान अवशेषों की संख्या अर्थात्. उदाहरण के लिए, यदि प्रदान किए गए प्रपत्र में उपयोगकर्ता "70%" में प्रकार, सभी टेम्पलेट्स प्रोटीन है जो> 70% क्वेरी प्रोटीन मैं मैं TASSER टेम्पलेट लायब्रेरी से बाहर रखा जाना करने के लिए एक दृश्य पहचान है.
बी विशिष्ट टेम्पलेट प्रोटीन अपवर्जित करें
विशिष्ट टेम्पलेट प्रोटीन बाहर रखा जा संरचनाओं के PDB आईडी युक्त सूची अपलोड करके मैं TASSER टेम्पलेट लायब्रेरी से बाहर रखा जा सकता है. एक उदाहरण फ़ाइल चित्रा 10 में दिखाया गया है. के रूप में एक ही प्रोटीन PDB लायब्रेरी में एकाधिक प्रविष्टियाँ, मैं - TASSER से के रूप में मौजूद कर सकते हैंrver डिफ़ॉल्ट रूप से निर्दिष्ट टेम्पलेट्स (स्तंभ 1 में) के रूप में के रूप में अच्छी तरह से है कि एक पहचान है पुस्तकालय से सभी अन्य टेम्पलेट्स> 90% निर्दिष्ट टेम्पलेट्स बाहर होगा. उपयोगकर्ताओं को भी एक अलग पहचान cutoff, 70 उदाहरण%, जहां पहचान के साथ सभी टेम्पलेट्स> 70% निर्दिष्ट टेम्पलेट प्रोटीन के लिए बाहर हो जाएगा निर्दिष्ट कर सकते हैं.
ब्याज की कोई संघर्ष की घोषणा की.
परियोजना में भाग अल्फ्रेड पी. स्लोअन फाउंडेशन, NSF कैरियर अवार्ड (1,027,394 DBI), और जनरल मेडिकल साइंसेज के राष्ट्रीय संस्थान (GM084222 GM083107) द्वारा समर्थित है.
| Name | Company | Catalog Number | Comments |
| Material Name | Type | Company | Catalogue Number |
| FASTA formatted amino acid sequence of the protein to be modeled (see, http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml). | |||
| A personal computer with access to the internet and a web browser. | |||
| Molecular visualizing software, e.g. RASMOL or PYMOL, for analyzing the predicted tertiary structure and functional sites. |
1
ReplyPosted by: Alexandre BuenoNovember 3, 2011, 2:35 PM