Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

आनुवंशिक भिन्नता के एमिनो एसिड स्तर संकेत करने के लिए शोर विश्लेषण का उपयोग Pathogenicity के संस्करण की संभावना का निर्धारण

Published: January 16, 2019 doi: 10.3791/58907

Summary

एमिनो एसिड स्तर के संकेत करने वाली शोर विश्लेषण एक दिया एमिनो एसिड की स्थिति में आनुवंशिक भिंनता की व्यापकता को निर्धारित करता है एक दिया जनसंख्या का आनुवंशिक भिंनता पृष्ठभूमि सामान्यीकृत । यह एक प्रोटीन अनुक्रम (संकेत) है कि एक जनसंख्या (शोर) में पाया दुर्लभ वेरिएंट की आवृत्ति से ऊपर उगता के भीतर संस्करण "हॉटस्पॉट" की पहचान के लिए अनुमति देता है ।

Abstract

लागत और अगली पीढ़ी के आनुवंशिक अनुक्रमण की गति में प्रगति नैदानिक पूरे exome और पूरे जीनोम परीक्षण के एक विस्फोट उत्पन्न किया है । हालांकि यह संभावना रोगजनकों आनुवंशिक सिंड्रोम के साथ जुड़े उत्परिवर्तनों की वृद्धि की पहचान के लिए नेतृत्व किया गया है, यह भी नाटकीय रूप से संयोग से अज्ञात महत्व (ववस) के आनुवंशिक वेरिएंट पाया की संख्या बढ़ गई है । इन वेरिएंट के नैदानिक महत्व का निर्धारण वैज्ञानिकों और चिकित्सकों दोनों के लिए एक बड़ी चुनौती है । pathogenicity की संभावना का निर्धारण करने में सहायता करने के लिए एक दृष्टिकोण प्रोटीन अनुक्रम स्तर पर संकेत करने वाली शोर विश्लेषण है. इस प्रोटोकॉल एमिनो एसिड स्तर के संकेत के लिए एक विधि का वर्णन करने वाली शोर विश्लेषण है कि ज्ञात प्रोटीन टोपोलॉजी के साथ प्रोटीन के प्रत्येक एमिनो एसिड की स्थिति पर संस्करण आवृत्ति का लाभ उठाया संभावना के साथ प्राथमिक अनुक्रम के क्षेत्रों की पहचान करने के लिए रोग भिन्नता (जनसंख्या "पृष्ठभूमि" भिन्नता के सापेक्ष). इस विधि एमिनो एसिड अवशेषों स्थान उच्च रोग संकेत है, जो VUSs के नैदानिक वजन ऐसे अगली पीढ़ी आनुवंशिक परीक्षण द्वारा पहचान की उन के रूप में परिष्कृत करने के लिए इस्तेमाल किया जा सकता है की "आकर्षण के बीच" की पहचान कर सकते हैं ।

Introduction

आनुवंशिक अनुक्रमण प्लेटफार्मों में तेजी से सुधार की पहुंच और चिकित्सा में आनुवंशिकी की भूमिका में क्रांति आई है । एक बार एक जीन, या जीन की एक मुट्ठी भर तक ही सीमित, लागत में कमी और अगली पीढ़ी के आनुवंशिक अनुक्रमण की गति में वृद्धि के जीनोम कोडिंग अनुक्रम (पूरे exome अनुक्रमण, वेस) और पूरे जीनोम की पूरी तरह से नियमित अनुक्रमण का नेतृत्व किया है ( नैदानिक सेटिंग में पूरे जीनोम अनुक्रमण, WGS) । वेस और WGS गंभीर रूप से बीमार नवजात शिशुओं और आनुवंशिक सिंड्रोम के लिए चिंता के साथ बच्चों की सेटिंग में अक्सर इस्तेमाल किया गया है, जहां यह एक सिद्ध नैदानिक उपकरण है कि नैदानिक प्रबंधन1,2बदल सकते है । हालांकि यह संभावना रोगजनकों आनुवंशिक सिंड्रोम के साथ जुड़े उत्परिवर्तनों की वृद्धि की पहचान के लिए प्रेरित किया है, यह भी नाटकीय रूप से संयोग से पाया आनुवंशिक वेरिएंट की संख्या में वृद्धि हुई है, या अप्रत्याशित सकारात्मक परिणाम, अज्ञात निदान की माहात्म्य (ववस) । हालांकि इन वेरिएंट में से कुछ की अवहेलना कर रहे हैं और रिपोर्ट नहीं, संभावित घातक या अत्यधिक रुग्ण रोगों से जुड़े जीन के लिए स्थानीय वेरिएंट अक्सर सूचित कर रहे हैं । वर्तमान दिशानिर्देश विशिष्ट जीन में पाए जाने वाले आकस्मिक वेरिएंट की रिपोर्टिंग की सलाह देते हैं, जो रोगी को चिकित्सा लाभ का हो सकता है, जिसमें अचानक कार्डियक डेथ के विकास से जुड़े जीन शामिल हैं-cardiomyopathies जैसे संवेदनशील रोग और channelopathies3. हालांकि इस सिफारिश को एक SCD के जोखिम में व्यक्तियों पर कब्जा करने के लिए डिज़ाइन किया गया था-संवेदनशील रोग, संस्करण का पता लगाने की संवेदनशीलता अब तक विशिष्टता से अधिक है । यह स्पष्ट निदान उपयोगिता है कि अब तक एक दिया जनसंख्या4में संबंधित रोगों की आवृत्ति से अधिक के साथ VUSs और संयोग से पहचान वेरिएंट की बढ़ती संख्या में परिलक्षित होता है । एक ऐसी बीमारी, लांग क्यूटी सिंड्रोम (LQTS), एक विहित कार्डियक channelopathy जीन है जो हृदय आयन चैनल सांकेतिक शब्दों में बदलना, या चैनल प्रोटीन, देरी हृदय ध्रुवीकरण5में जिसके परिणामस्वरूप के लिए स्थानीयकरण उत्परिवर्तनों की वजह से है । यह देरी ध्रुवीकरण, आराम इलेक्ट्रोकार्डियोग्राम पर एक लंबे समय तक क्यूटी अंतराल द्वारा देखा, एक विद्युत गड़बड़ी में संभावित घातक वेंट्रिकुलर अतालता जैसे torsades de points. जबकि जीन की एक संख्या इस रोग के विकास के लिए जोड़ा गया है, KCNQ1में उत्परिवर्तनों-इनकोडिंग मैंएस पोटेशियम चैनल (KCNQ1, 7.1 केवी) LQTS प्रकार 1 के कारण है और6के नीचे एक उदाहरण के रूप में उपयोग किया जाता है । भिन्नता व्याख्या में जटिलता illustrating, LQTS में दुर्लभ वेरिएंट की उपस्थिति-जुड़े जीन, तथाकथित "पृष्ठभूमि आनुवंशिक भिन्नता" पहले7,8वर्णित किया गया है.

ज्ञात रोगजनक वेरिएंट के बड़े संग्रह-शैली डेटाबेस के अलावा, कई रणनीतियों प्रभाव अलग वेरिएंट उत्पादन होगा भविष्यवाणी करने के लिए मौजूद हैं । कुछ एल्गोरिदम पर आधारित हैं, जैसे मैदे और Polyphen 2, जो deleteriousness9,10की भविष्यवाणी करने के लिए उपन्यास के गैर-पर्यायवाची वेरिएंट की बड़ी संख्या को फ़िल्टर कर सकते हैं । इन उपकरणों के व्यापक उपयोग के बावजूद, कम विशिष्टता उनके प्रयोज्य सीमा जब यह "बुला" नैदानिक VUSs11आता है । "सिग्नल से शोर" विश्लेषण एक उपकरण है जो एक संस्करण की संभावना की पहचान करता है एक जनसंख्या से दुर्लभ आनुवंशिक परिवर्तन के खिलाफ सामान्यीकृत सवाल में loci पर ज्ञात रोग भिन्नता की आवृत्ति पर आधारित रोग के साथ जुड़े जा रहा है । आनुवंशिक loci करने के लिए स्थानीय वेरिएंट जहां जनसंख्या आधारित भिन्नता की तुलना में रोग से जुड़े उत्परिवर्तनों की एक उच्च व्याप्ति है, एक उच्च संकेत करने के लिए शोर, रोग स्वयं जुड़े होने की संभावना है । इसके अलावा, दुर्लभ वेरिएंट संयोग से रोग से जुड़े आवृत्ति की तुलना में दुर्लभ जनसंख्या वेरिएंट की एक उच्च आवृत्ति के साथ एक जीन के लिए स्थानीयकृत पाया, एक कम संकेत करने के लिए शोर, रोग से जुड़े होने की संभावना कम हो सकती है. सिग्नल से शोर विश्लेषण की नैदानिक उपयोगिता cardiomyopathies और channelopathies के लिए आनुवंशिक परीक्षण के लिए नवीनतम दिशा निर्देशों में सचित्र किया गया है; तथापि, यह केवल पूरे जीन स्तर या डोमेन विशेष स्तर12पर कार्यरत किया गया है । हाल ही में, दोनों रोग वेरिएंट की वृद्धि की उपलब्धता को देखते हुए (रोग डेटाबेस, साहित्य में समानता अध्ययन) और जनसंख्या आधारित नियंत्रण वेरिएंट (Exome एकत्रीकरण कंसोर्टियम, ExAC और जीनोम एकत्रीकरण डाटाबेस, GnomAD13), यह एक प्रोटीन के प्राथमिक अनुक्रम के भीतर व्यक्तिगत एमिनो एसिड पदों के लिए लागू किया गया है । एमिनो एसिड स्तर के संकेत करने वाली शोर विश्लेषण के रूप में संभावना "पृष्ठभूमि" आनुवंशिक भिंनता के बजाय रोग से जुड़े LQTS के साथ जुड़े जीन में संयोग से पहचान वेरिएंट वर्गीकृत में उपयोगी साबित किया है । तीन प्रमुख LQTS के साथ जुड़े जीन के अलावा, KCNQ1सहित, इन संयोग से पहचाना वेरिएंट एक महत्वपूर्ण संकेत करने वाली शोर अनुपात का अभाव है, सुझाव है कि व्यक्तिगत एमिनो एसिड पदों पर इन वेरिएंट की आवृत्ति दुर्लभ प्रतिबिंबित जनसंख्या रूपांतर के बजाय रोग से जुड़े उत्परिवर्तनों । इसके अलावा, जब प्रोटीन विशेष डोमेन टोपोलॉजी उच्च संकेत के क्षेत्रों के खिलाफ मढ़ा था शोर करने के लिए, रोग उत्परिवर्तन "हॉटस्पॉट" प्रोटीन14के मुख्य कार्यात्मक डोमेन के लिए स्थानीयकृत । यह पद्धति 1 निर्धारित करने में वादा रखती है) संभावना एक संस्करण रोग है या आबादी से जुड़े और 2) एक प्रोटीन मानव रोग के साथ जुड़े के उपंयास महत्वपूर्ण कार्यात्मक डोमेन की पहचान ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. रुचि के जीन और विशिष्ट ब्याह Isoform की पहचान

नोट: यहां, हम Ensembl15 के उपयोग के लिए ब्याज के जीन जो ब्याज की बीमारी के रोगजनन (यानी KCNQ1 उत्परिवर्तनों LQTS के साथ जुड़े रहे है के साथ जुड़ा हुआ है के लिए आम सहमति अनुक्रम की पहचान का प्रदर्शन) । Ensembl के लिए वैकल्पिक जैव प्रौद्योगिकी सूचना (NCBI)16 और कैलिफोर्निया विश्वविद्यालय, सांता क्रूज़ (UCSC) मानव जीनोम17 ब्राउज़र ( सामग्री की तालिकादेखें) के लिए राष्ट्रीय केंद्र के माध्यम से RefSeq शामिल हैं ।

  1. Ensembl मुखपृष्ठ में, ड्रॉप डाउन मेनू में प्रजातियों (यानी मानव) का चयन करें, और क्षेत्र (यानी KCNQ1) में संक्षिप्त ब्याज की जीन दर्ज करें । "Go" पर क्लिक करें
  2. ब्याज की जीन के लिए इसी लिंक का चयन करें (यानी "KCNQ1 (मानव जीन)"
  3. का चयन करें ब्याज की प्रतिलिपि के लिए इसी लिंक "प्रतिलिपि तालिका से" (यानी TranscriptID enst 00000155840.10, NM_000218 [आरएनए प्रतिलिपि], NP_000209 [आरएनए प्रतिलिपि के प्रोटीन उत्पाद]) ।
    नोट: उचित साहित्य की समीक्षा के लिए सही प्रतिलिपि आम सहमति अनुक्रम सुनिश्चित करने की जरूरत है चुना है ।
  4. "प्रतिलिपि तालिका" के RefSeq "कॉलम में पाया भविष्य के संदर्भ के लिए प्रतिलिपि-विशिष्ट एनएम और एनपी पहचान संख्या नोट करें ।
  5. NCBI प्रोटीन डेटाबेस से एक नया वेबपेज खोलने के लिए NP ID संख्या के साथ संबद्ध लिंक का चयन करें ।
  6. "मूल" खंड के लिए नीचे स्क्रॉल करने के लिए ब्याज की जीन प्रतिलिपि के लिए प्रोटीन (प्राथमिक) अनुक्रम प्राप्त करते हैं ।
  7. प्रोटीन सुविधाओं की एक सूची प्राप्त करने के लिए "सुविधाएं" अनुभाग तक स्क्रॉल करें (कार्यात्मक डोमेन, बाइंडिंग डोमेन, पद-अनुवाद संशोधन साइटें).
    नोट: यह जानकारी भी NCBI प्रोटीन डेटाबेस के माध्यम से या साहित्य में प्राथमिक स्रोतों से प्राप्त किया जा सकता है । यह आगे चरण 5 में चर्चा की जाएगी ।

2. प्रयोगात्मक आनुवंशिक संस्करण डेटाबेस बनाएँ ("संकेत")

नोट: यहां, हम इस रोग की आवृत्ति के साथ ब्याज की जीन में संबंधित वेरिएंट के एक डेटाबेस बनाने के लिए कैसे प्रदर्शन-ब्याज की बीमारी के साथ व्यक्तियों के बीच जुड़े वेरिएंट । इस डेटाबेस में कई प्रपत्र ले सकते है और "संकेत" (phenotype-धनात्मक आनुवंशिक भिन्नता) जो नियंत्रण संस्करण डेटाबेस के विरुद्ध सामान्यीकृत किया जाएगा का प्रतिनिधित्व करता है । यह 1 शामिल कर सकते हैं) VUSs के खिलाफ तुलना के लिए रोग जुड़े वेरिएंट प्रोटीन और/या 2 के उपंयास कार्यात्मक डोमेन की पहचान करने के लिए VUSs, संयोग से पहचान VUSs सहित, रोग के खिलाफ तुलना करने के लिए संबंधित वेरिएंट की संभावना निर्धारित करने के लिए pathogenicity । KCNQ1 में रोग-संबंधित वेरिएंट चित्रण के लिए प्रस्तुत किया जाएगा; हालांकि, विधि संयोग से पहचाने VUSs या प्रयोगात्मक वेरिएंट के किसी भी अन्य सेट के विश्लेषण के लिए एक ही है ।

  1. असंबद्ध सूचकांक मामलों के पलटन (ओं) की पहचान करें/जिसके लिए ब्याज की जीन सभी बैंड्स के लिए व्यापक genotyped थी (यानी एक अध्ययन में KCNQ1 से बाहर के 24 असंबंधित बैंड होस्टिंग वेरिएंट की पहचान करताहै ) २०० से बाहर LQTS के साथ व्यक्तियों, जो KCNQ1 आनुवंशिक पूछताछ के अधीन थे) ।
    नोट: इन साथियों को साहित्य से, प्रयोगात्मक आनुवंशिक विश्लेषण से, या दोनों के संयोजन से पहचाना जा सकता है ।
    1. बाहर अध्ययन जो पलटना नहीं कर रहे है आधारित है (एक मामले की रिपोर्ट एक एकल उत्परिवर्तन का वर्णन-सकारात्मक व्यक्ति), ब्याज की जीन के लिए genotyped व्यक्तियों की कुल संख्या प्रदान नहीं करते हैं, या नहीं व्यापक आनुवंशिक रूप से जीन का विश्लेषण ( यानी एक "लक्षित" केवल KCNQ1 exons 2-4 की आनुवंशिक स्क्रीनिंग) इन बाधा एक संस्करण की आवृत्ति की गणना ।
    2. ऐसे व्यक्तियों को शामिल करें जो असंबंधित बैंड है और संबंधित व्यक्तियों को इस रूप में संमिलित कर सकते है कि यह अधिक-अनुमान लगाने योग्य है (यानी एक अध्ययन LQTS के साथ 20 रोगियों के पलटने में KCNQ1 उत्परिवर्तनों के साथ 4 असंबंधित व्यक्तियों की पहचान करता है । इनमें से एक बैंड के साथ एक परिवार का हिस्सा है 5 अंय उत्परिवर्तन-सकारात्मक कुनबा । परिवार के सभी सदस्यों को छोड़ें और केवल 4 असंबंधित बैंड्स शामिल करें) ।
  2. सभी प्रयोगात्मक आनुवंशिक वेरिएंट की पहचान की (ओं) में पाया संकलन
    1. नामकरण कि जंगली प्रकार अमीनो एसिड, एमिनो एसिड की स्थिति है, और संस्करण एमिनो एसिड (एमिनो एसिड नंबर २१२ परअर्थात् alanine वैलिन, Ala212Val या A212V के लिए बदल दिया है निरुपित) । नामकरण के एक ऐसे प्रकार चित्रा 1में प्रदर्शन किया है ।
    2. पुष्टि करें कि सभी प्रयोगात्मक आनुवंशिक वेरिएंट के संस्करण नामकरण एक ही संदर्भ जीन प्रतिलिपि के रूप में कदम १.४ में नोट पर आधारित है । यदि प्रयोगात्मक आनुवंशिक वेरिएंट एक ही संदर्भ जीन प्रतिलिपि पर व्याख्या नहीं कर रहे हैं, तो एक संदर्भ प्रतिलिपि करने के लिए संस्करण की स्थिति पुनर्व्याख्या प्रतिलिपि संरेखण का उपयोग (१.२ कदम देखें)
  3. पता लगाया जा रहा सवाल के आधार पर लागू नहीं कर रहे हैं कि वेरिएंट को छोड़ दें.
    1. जीनोम या वेरिएंट के गैर कोडिंग क्षेत्रों, जो प्रोटीन अनुक्रम जैसे पर्याय, intronic वेरिएंट, 5 ' या 3 ' untranslated क्षेत्र [UTR], और intergenic क्षेत्र वेरिएंट (यानी एक रिपोर्ट रोग के रूप में परिवर्तन नहीं करने के लिए स्थानीयकृत वेरिएंट शामिल न करें KCNQ1 में संस्करण जो कोडिंग क्षेत्र के 5 ' UTR के लिए स्थानीयकरण के रूप में यह प्रोटीन अनुक्रम में परिवर्तन की भविष्यवाणी नहीं है बाहर रखा जाएगा) ।
    2. इस अध्ययन के लिए शामिल मानदंडों को पूरा नहीं करते हैं कि वेरिएंट को छोड़ दें. रोग-संबंधित वेरिएंट के लिए, यह अब रोग समझा रहे हैं कि वेरिएंट शामिल हैं ।
      1. पुष्टि करें कि प्रत्येक भिन्न वर्तमान में माना जाता है, रोगजनक, संभावना रोगजनक, या कम नहीं सौम्य, क्रॉस-संदर्भित वेरिएंट द्वारा ClinVar डेटाबेस के साथ ( सामग्री की तालिकादेखें).
      2. जीन और ClinVar खोज क्षेत्र में ब्याज के संस्करण दर्ज करें (यानी KCNQ1-Y111C), "खोज" का चयन करें
      3. "भिंनता/स्थान" स्तंभ के अंतर्गत रुचि के संस्करण को पहचानें ।
      4. नोट "नैदानिक महत्व" स्तंभ के अंतर्गत pathogenicity की सहमति व्याख्या (यानी KCNQ1-Y111C "रोगजनक" के रूप में व्याख्या की है) ।
      5. जो "संभावना रोगजनक" या "रोगजनक" वेरिएंट शामिल हैं ।
      6. "pathogenicity की परस्पर विरोधी व्याख्याओं," "अनिश्चित महत्व" के पदनाम के साथ वेरिएंट शामिल करें, या जब कोई रिकॉर्ड उपलब्ध नहीं है ("प्रदान नहीं किया गया") अगर अध्ययन द्वारा वारंट ।
      7. "संभावना सौंय" (यानी KCNQ1-A62T) के रूप में नामित वेरिएंट को बाहर निकालें ।
  4. प्रत्येक प्रयोगात्मक संस्करण स्थिति की माइनर एलील फ़्रीक्वेंसी (MAF) की गणना करें.
    1. गणना कैसे किसी भी alleles प्रत्येक संबंधित संस्करण के लिए सकारात्मक थे (यानी अगर एक KCNQ1-Y111C heterozygous उत्परिवर्तन 2 असंबंधित व्यक्तियों में पाया जाता है, संस्करण की संख्या-सकारात्मक alleles 2 है) ।
    2. पलटन के भीतर अनुक्रम alleles की कुल संख्या की गणना करें
      1. नोट प्रत्येक पलटन अध्ययन में अनुक्रम व्यक्तियों की कुल संख्या (चरण २.१)
      2. alleles की कुल संख्या निर्धारित करने के लिए 2 द्वारा व्यक्तियों की कुल संख्या गुणा करें ।
        नोट: यह शायद द्विगुणित जीनोम जिससे प्रत्येक एलील के प्रत्येक व्यक्ति मेजबान 2 ।
    3. प्रत्येक अमीनो अम्ल स्थिति के लिए भिन्न-धनात्मक व्यक्तियों की कुल संख्या की गणना करें (चरण में alleles 2.4.1/alleles in step 2.4.2). उदाहरण के लिए, यदि 2 असंबंधित व्यक्तियों प्रत्येक मेजबान heterozygous KCNQ1-१०० और २०० LQTS-पीड़ित व्यक्तियों के साथियों में उत्परिवर्तनों Y111C, क्रमशः, तो एमिनो एसिड की स्थिति १११ पर प्रयोगात्मक वेरिएंट की आवृत्ति 2 वेरिएंट है/((100 + 200 व्यक्तियों ) * 2 alleles/वैयक्तिक) (अर्थात संयुक्त MAF ०.००३३).
    4. प्रत्येक संस्करण के लिए इस मान की गणना प्रत्येक प्रयोगात्मक संस्करण के संबंधित MAF के रूप में करें । अतिरिक्त विवरण के लिए चरण ४.२ देखें ।

3. नियंत्रण आनुवंशिक संस्करण डेटाबेस बनाएं ("शोर")

नोट: यहां, हम कैसे एक नियंत्रण जनसंख्या में एक संबद्ध आवृत्ति के साथ ब्याज की जीन में नियंत्रण वेरिएंट के एक डाटाबेस बनाने के लिए प्रदर्शन करते हैं । इस डाटाबेस का प्रतिनिधित्व करता है "शोर" (phenotype-नकारात्मक, जनसंख्या आधारित आनुवंशिक भिन्नता) जो पृष्ठभूमि के खिलाफ प्रयोगात्मक संस्करण डेटाबेस सामान्यीकृत किया जाएगा. यह "नियंत्रण" भिन्नता के रूप में संदर्भित किया जाता है ।

  1. किसी दी गई जनसंख्या के बीच दुर्लभ वेरिएंट की पहचान करने के लिए स्वस्थ, असंबंधित बैंड या बड़ी आबादी आधारित अध्ययनों का उपयोग के एक पलटन (ओं) की पहचान करें ।
    नोट: इस डाटाबेस के लिए स्रोत विविध रहे है और शामिल हैं: 1) स्वस्थ व्यक्तियों और/या अंयथा phenotype-नकारात्मक व्यक्तियों को सैंज अनुक्रमण के अधीन है, या सार्वजनिक रूप से जनसंख्या-आधारित व्यक्तियों के डेटाबेस का आयोजन किया है जिसके लिए सवाल में बीमारी है आवृत्ति में दुर्लभ जैसे 2) १००० जीनोम परियोजना (एन = १,०९४ विषयों)18, 3) राष्ट्रीय हार्ट, फेफड़े, और रक्त संस्थान जाओ Exome अनुक्रमण परियोजना (ESP, N = ५,३७९ विषयों)19, 4) Exome एग्रीगेटर कंसोर्टियम (ExAC, एन = ६०,७०६ विषय)13 , और/या 5) जीनोम एकत्रीकरण डाटाबेस (GnomAD, N = १३८,६३२ व्यक्तियों)13 ( सामग्री की तालिकादेखें) । GnomAD डाटाबेस एक उदाहरण के उदहारण के रूप में उपयोग किया जाएगा ।
    1. GnomAD होमपेज (यानी KCNQ1) पर खोज बॉक्स में रूचि का जीन डालें ।
    2. पुष्टि करें कि ब्राउज़र सही जीन और ब्याज की प्रतिलिपि (१.४ कदम) का चयन किया ।
    3. पुष्टि करें कि "कवरेज का मतलब है" और "कवरेज साजिश." की समीक्षा करके लोकस के अनुक्रमण के उपयुक्त कवरेज है
    4. का चयन करके अनुक्रम आनुवंशिक भिंनता कोडिंग के लिए चुनें "बकवास + LoF."
    5. "CSV में तालिका निर्यात करें" चुनें, जो "अज्ञात" नामक एक TextEdit फ़ाइल जेनरेट करेगा.
    6. फ़ाइल को फिर से लेबल करें और एक नया एक्सटेंशन "*. csv" (अर्थात "KCNQ1 Control भिंनता. csv") शामिल करे ।
    7. *. csv फ़ाइलों के विश्लेषण के लिए एक उपयुक्त सॉफ़्टवेयर प्रोग्राम का उपयोग करके फ़ाइल खोलें ( सामग्री तालिकादेखें).
  2. पहचान "प्रोटीन परिणाम लेबल कॉलम में आनुवंशिक भिंनता बदलने प्रोटीन ।
  3. प्रायोगिक आनुवंशिक वेरिएंट (step 2.3.1) के रूप में इन नियंत्रण आनुवंशिक वेरिएंट के लिए एक ही अपवर्जन मानदंड लागू करें ।
  4. प्रत्येक नियंत्रण वैरिएंट के MAF को पहचानें ।
    1. "एलील Count" स्तंभ का पता लगाएँ, जो भिन्न प्रकार के हार्बर को मिली alleles की संख्या को नोट करते हैं.
    2. "एलील संख्या" कॉलम है, जो इस दिया एमिनो एसिड की स्थिति में अनुक्रम alleles की कुल संख्या अर्थ है पता लगाएँ ।
      नोट: अनुक्रम alleles की कुल संख्या उस स्थान पर कवरेज के आधार पर भिन्न हो जाएगा । उच्च कवरेज के क्षेत्रों GnomAD के भीतर व्यक्तियों की कुल संख्या 2 * दृष्टिकोण (१३८,६३२ व्यक्तियों के लिए अर्थात् होगा, पूर्ण कवरेज शामिल २७७,२६४ कुल alleles genotyped) ।  इसके विपरीत, कम कवरेज के क्षेत्रों में एक कम कुल एलील संख्या होगी
    3. "एलील आवृत्ति" स्तंभ में पूर्व-परिकलित है जो भिन्न MAF का पता लगाएँ और "एलील संख्या" द्वारा विभाजित "एलील गणना" का प्रतिनिधित्व करता है ।
      नोट: मानव जीनोम प्रत्येक एलील के दो है (यानी 1 विषय को 10 लोगों में एक heterozygous संस्करण है पाया 1/20 की एक MAF है)
    4. प्रत्येक संस्करण के लिए MAF प्रत्येक नियंत्रण संस्करण के संबंधित MAF के रूप में नोट करें ।
      नोट: प्रत्येक नस्लीय/जातीय समूह के लिए GnomAD शामिल संस्करण विशिष्ट MAF "एलील आवृत्ति के दाईं ओर स्तंभों में देखा जा सकता है."
  5. जो नियंत्रण वेरिएंट "आम." के रूप में छोड़ दिया है ऊपर दुर्लभ वेरिएंट के लिए एक MAF थ्रेशोल्ड लागू करें
    1. MAF थ्रेशोल्ड को अधिकतम मूल्य पर सेट करें जिस पर सभी सही मायने में रोग-संबंधित वेरिएंट (चरण 2 देखें) भी नियंत्रण डेटाबेस में स्वीकार्य सीमा के नीचे शामिल किए गए हैं (यानी, सभी रोग से जुड़े KCNQ1 वेरिएंट भी GnomAD में पाया सबसे आम वैरिएंट MAF ०.००९ है, फिर ०.०१ की दहलीज के ऊपर सभी GnomAD वेरिएंट को बाहर रखा जाना चाहिए) ।
  6. सुनिश्चित करें कि प्रयोगात्मक संस्करण नामकरण नियंत्रण के समान है (चरण २.२ देखें) ।
  7. फ़ाइल सहेजें । कुछ मामलों में, यह फ़ाइल प्रकार/एक्सटेंशन को बदलने की आवश्यकता हो सकती है ।

4. एमिनो एसिड स्तर संकेत करने वाली शोर गणना और मानचित्रण

  1. एक नियंत्रण संस्करण के साथ प्रत्येक एमिनो एसिड की स्थिति के लिए एक MAF की गणना ( चित्र 1 उदाहरण KCNQ1 GnomAD वेरिएंट से युक्त देखें) ।
    1. एक रेखांकन में सक्षम स्प्रेडशीट, सभी प्रयोगात्मक वेरिएंट के पदों का एक कॉलम बनाएं ।
    2. केवल भिन्न स्थिति छोड़ने के लिए भिन्न पाठ निकालें ।
      नोट: विभिन्न कार्य/सूत्र स्वचालित रूप से इन पाठ तत्वों को कक्षों के भीतर हटाने के लिए उपयोग किया जा सकता है (चित्रा 1, स्तंभ C; सामग्री की तालिकादेखें).
    3. जिन स्थितियों में इसके साथ संबद्ध 1 से अधिक संस्करण हैं, उनकी पहचान करने के लिए आरोही मान में भिंनता सॉर्ट करें (चित्र 1, स्तंभ E; अर्थात एमिनो एसिड स्थिति 10 कॉलम ई में दो बार सूचीबद्ध है जो स्थिति में 2 अद्वितीय वेरिएंट अर्थ है) ।
    4. किसी दी गई स्थिति के लिए सभी MAFs का योग (चित्र 1, स्तंभ G और H) लेकर किसी दिए गए स्थान के साथ संबद्ध प्रत्येक भिन्न के लिए MAF संयोजित करें.
  2. एक प्रयोगात्मक संस्करण के साथ प्रत्येक एमिनो एसिड की स्थिति के लिए एक MAF की गणना ( चित्रा 2 नकली KCNQ1 रोग वेरिएंट युक्त देखें).
    1. इसी तरह के ज़माने में शुू करने के लिए अमीनो अम्ल पदों का एक कॉलम बना जो प्रयोगात्मक वेरिएंट (figure 2, column B) है ।
    2. प्रत्येक भिन्न स्थिति के लिए, चरण २.४ (चित्रा 2, स्तंभ C-G) से उस स्थिति के साथ संबद्ध सभी वेरिएंट की MAF की गणना करें.
  3. प्रायोगिक और नियंत्रण दोनों वेरिएंट के लिए MAF के एक रोलिंग औसत बनाएं ।
    1. ४.१ और ४.२ में बनाए गए स्तंभों का विस्तार करें एमिनो एसिड पदों है कि एक MAF = 0 के रूप में कोई भिंनता है के लिए कक्षों को शामिल करने के लिए । (चित्रा 3) ।
      1. ब्याज के जीन में सभी अमीनो अम्ल पदों वाले स्तंभ बनाएँ (अर्थात १ से ६७६ के लिए KCNQ1, चित्रा ३, स्तम्भ सी और आई. आई. सी.).
      2. नियंत्रण और प्रायोगिक डेटा सेट दोनों के लिए वेरिएंट नहीं है कि सभी पदों के लिए 0 की एक MAF जोड़ें ।
        नोट: यह स्वचालित रूप से एक सामान्य रूप से उपयोग सॉफ्टवेयर प्रोग्राम में "VLOOKUP" समारोह का उपयोग करके किया जा सकता है (चित्रा 3, कॉलम डी और जे, सामग्री की तालिकादेखें).
    2. प्रत्येक प्रयोगात्मक और नियंत्रण प्रसार कॉलम के लिए एक रोलिंग औसत बनाएं ।
      नोट: यह आसंन स्थिति pathogenicity के अनुमान के लिए अनुमति देता है और संशोधित किया जा सकता है, या भी बाहर रखा, के लिए अध्ययन की जरूरतों को फिट ।
      1. दोनों के लिए नियंत्रण और प्रायोगिक डेटा सेट (चित्र 3, स्तंभ E और K) दोनों के लिए MAF के एक रोलिंग औसत का प्रतिनिधित्व करने वाला एक स्तंभ बनाएं ।
      2. rolling average स्तंभ में, 5 भिन् न पदों के लिए संबंधित MAF का औसत रखें N-टर्मिनल और 5 भिन् न स्थितियां C-टर्मिनल दिए गए स्थान पर.
        नोट: यह +/-5 के एक रोलिंग औसत बनाता है । से कम 5 एमिनो एसिड अवशेषों के साथ पदों के लिए पूर्ववर्ती, या निंनलिखित, एक रोलिंग औसत स्थान (यानी एन या सी-टर्मिनस), रोलिंग औसत ही खाते में उन अवशेषों कि मौजूद है ले जाएगा (यानी रोलिंग औसत पर एमिनो एसिड स्थिति 3 एमिनो एसिड पदों पर MAF के एक औसत होगा 1 हालांकि 8, इन 8 से विभाजित MAFs के योग के रूप में गणना) ।
  4. 2 द्वारा सबसे कम रोलिंग MAF विभाजित करके न्यूनतम नियंत्रण आवृत्ति की गणना.
    1. 0 के नियंत्रण MAF के साथ किसी भी कक्ष को एक सिग्नल-टू-शोर अनुपात की गणना करते समय 0 से विभाजित करने से बचने के लिए न्यूनतम आवृत्ति से परिवर्तित करें.
  5. एमिनो एसिड स्तर संकेत करने वाली शोर अनुपात (चित्रा 4) की गणना.
    1. संबंधित नियंत्रण रोलिंग औसत द्वारा प्रत्येक एमिनो एसिड की स्थिति प्रयोगात्मक रोलिंग औसत विभाजित ।
    2. ग्राफ इस अनुपात (Y-अक्ष) बनाम एमिनो एसिड स्थिति (X-अक्ष) ।

5. प्रोटीन डोमेन टोपोलॉजी ओवरले

  1. कार्यात्मक डोमेन के आम सहमति अमीनो एसिड स्थानों की पहचान/सुविधाओं, या पद के अनुवाद के क्षेत्रों में संशोधन, ब्याज की प्रोटीन की (चरण १.७) ।
    नोट: इन डोमेन की पहचान करने के लिए कई संसाधनों का उपयोग किया जा सकता है । इन संसाधनों, और साथ ही उपंयास प्रोटीन में ख्यात डोमेन की पहचान के लिए संसाधनों, साहित्य20में अच्छी तरह से की समीक्षा की गई है । इस प्रोटोकॉल NCBI, जो व्यापक रूप से उपयोग किया जाता है और मजबूत ( सामग्री की तालिकादेखें) के माध्यम से उपलब्ध प्रोटीन डाटाबेस का वर्णन करेंगे ।
  2. प्रोटीन डोमेन से जुड़े अमीनो अम्ल पदों की पहचान/
    1. NCBI वेबपेज खोलें ।
    2. खोज के क्षेत्र में ब्याज की प्रोटीन के एनपी दर्ज करें ।
    3. ज्ञात प्रोटीन डोमेन की पहचान करें और सुविधाएँ "सुविधाएँ" के अंतर्गत कैटलॉग हैं ।
    4. पहचान और नोट डोमेन नाम/प्रकार और एमिनो एसिड पदों ।
    5. सुविधा के लिए इसी लिंक का चयन करने के लिए ब्याज प्राथमिक अनुक्रम के प्रोटीन पर क्षेत्र कल्पना ।
  3. डोमेन/सुविधाओं की सीमाओं वाले स्तंभ बनाएं ।
    1. संकेत के बगल में एक कॉलम बनाएं: शोर कॉलम ताकि एमिनो एसिड स्थिति कॉलम संदर्भित किया जा सकता है (चित्रा 5, कॉलम सी) ।
    2. प्रत्येक डोमेन के एन-टर्मिनल या सी-टर्मिनल पहलू पर संगत कक्षों की पहचान करें और प्रत्येक कक्ष में एक 1 रखें (यानी अगर KCNQ1 के एस १ transmembrane डोमेन का एन-टर्मिनल डोमेन एमिनो एसिड पोजीशन १२२ है, और c-टर्मिनल डोमेन की स्थिति है १४२, तो एक 1 एमिनो एसिड स्थिति १२२ और १४२ के लिए पंक्ति में रखा गया है) ।
    3. ओवरलैप करने वाले डोमेन/सुविधाओं के लिए, 1 को अंय मानों (अर्थात १.५, 2, २.५) में बदलकर एकाधिक डोमेन प्रदर्शित करें; यह डोमेन भेद में सहायता कर सकते हैं ।
  4. X-अक्ष पर एक Y-अक्ष और एमिनो एसिड की स्थिति के रूप में इन सीमाओं के साथ एक ग्राफ बनाएं (चित्रा 5बी) ।
  5. चरण ४.४ में बनाए गए सिग्नल-टू-शोर ग्राफ़ के साथ इस ग्राफ़ को अधिव्याप्त करें ।
  6. ज्ञात प्रोटीन डोमेन/सुविधाओं और सिग्नल से शोर विश्लेषण के बीच सहसंबंध की पहचान करें ।

6. भिन् न स्थिति ओवरले

  1. रेखांकन के ओवरले के लिए व्यक्तिगत संस्करण पदों का नक्शा ४.४ और ५.४ चरणों में उत्पादित ।
    1. डोमेन/सुविधा स्तंभ के आगे एक स्तंभ बनाएं, जैसे कि कॉलम में पंक्तियां एमिनो एसिड पदों (चित्रा 5, कॉलम डी) के अनुरूप होंगी ।
    2. किसी संबंधित संस्करण वाली स्थिति के संगत जोड़ी गई पंक्ति में प्रत्येक कक्ष में 1 रखें ।
    3. X-अक्ष पर एक Y-अक्ष और एमिनो एसिड की स्थिति के रूप में इस कॉलम के साथ एक ग्राफ बनाएं (चित्रा 5सी) ।
  2. चरण ४.४ और डोमेन ग्राफ़ में बनाए गए चरण ५.४ में बनाए गए सिग्नल-टू-शोर ग्राफ़ के साथ इस ग्राफ़ को अधिव्याप्त करें ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

KCNQ1 के लिए शोर विश्लेषण करने के लिए एमिनो एसिड स्तर के संकेत के लिए एक प्रतिनिधि परिणाम चित्रा 6में दर्शाया गया है । इस उदाहरण में, GnomAD पलटन (नियंत्रण पलटन) में पहचाने गए दुर्लभ वेरिएंट, संयोग से पहचाने गए वेस वेरिएंट (प्रायोगिक पलटन #1), और LQTS केस-संबंधित वेरिएंट्स समझा जाता है, जो संभावित रोग-संबद्ध (प्रायोगिक पलटन #2) दर्शाया गया है । इसके अलावा, संकेत करने वाली शोर वेस और LQTS पलटना संस्करण आवृत्ति के खिलाफ सामान्यीकृत GnomAD संस्करण आवृत्ति की तुलना विश्लेषण दर्शाया गया है । LQTS-संबद्ध वेरिएंट चैनल ताकना, selectivity फिल्टर, और KCNE1-बाइंडिंग डोमेन के साथ संगत डोमेन में उच्च सिग्नल से शोर अनुपात का प्रदर्शन किया । तुलना में, संयोग से वेस पलटन में वेरिएंट की पहचान स्पष्ट रूप से उच्च संकेत करने वाली शोर उन्नयन के विशिष्ट क्षेत्रों का प्रदर्शन नहीं किया था, सुझाव है कि इन वेरिएंट पृष्ठभूमि आनुवंशिक भिन्नता को प्रतिबिंबित. इस उदाहरण संस्करण MAFs के रूप में ऊपर नोट का उपयोग नहीं किया; हालांकि, यह वर्णित के रूप में एक ही सिद्धांत के सभी प्रदर्शित करता है ।

Figure 1
चित्रा 1 : MAF परिकलन के साथ नियंत्रण भिन् न डेटाबेस का उदाहरण । स्तंभ A, सीधे आयातित GnomAD दुर्लभ वेरिएंट को नियंत्रित । स्तंभ B, बाएँ पक्षीय के हटाए जाने वाले, गैर-स्थिति-संस्करण से संबंधित पाठ वर्ण हटाने के लिए एक उदाहरण सूत्र का उपयोग करके (अर्थात: B2 के लिए "= दाएँ (a2, लेन (a2)-5", सामग्री की तालिकादेखें). स्तंभ C, दाएं-तरफा, गैर-स्थिति से संबंधित पाठ को भिन् न नामकरण से हटाने से संबंधित सूत्र का उपयोग करना (यानी: C2 के लिए "= LEFT (b2, लेन (b2)-3"). स्तंभ D, परिणामी सॉर्ट न की गई अमीनो अम्ल स्थितियां । कॉलम ई, एमिनो एसिड एक आरोही फैशन में हल पदों के लिए डुप्लिकेट पदों की पहचान के लिए अनुमति देते हैं । स्तंभ F, GnomAD से आयातित के रूप में प्रत्येक संस्करण के लिए संबद्ध MAF । कॉलम जी और एच, एक दिया एमिनो एसिड की स्थिति के लिए संयुक्त MAF (एक विशिष्ट स्थान पर MAF प्रत्येक संस्करण की राशि) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 2
चित्रा 2 : MAF गणना के साथ प्रयोगात्मक संस्करण डेटाबेस का उदाहरण । कॉलम ए, नकली LQTS की एक सूची-KCNQ1 में जुड़े उत्परिवर्तनों एक रोग का प्रतिनिधित्व करने वाले उत्परिवर्तन प्रयोगात्मक डाटाबेस जुड़े । कॉलम बी, उत्परिवर्तन की स्थिति प्रत्येक संस्करण के लिए इसी । कॉलम सी, उत्परिवर्तन की गिनती-नकली अध्ययन के भीतर सकारात्मक व्यक्तियों 1 । प्रत्येक माना को heterozygous उत्परिवर्तन वाहक हो रहे हैं । अध्ययन में genotyped व्यक्तियों की कुल संख्या पत्रक के तल पर स्थित है. कॉलम डी, उत्परिवर्तन की गणना-नकली अध्ययन में सकारात्मक व्यक्ति 2 । कॉलम ई, उत्परिवर्तन की गिनती-नकली अध्ययन में सकारात्मक व्यक्ति 3 । कॉलम एफ, कुल उत्परिवर्तन-सकारात्मक सभी अध्ययनों में मनाया उत्परिवर्तन की मेजबानी व्यक्तियों । ध्यान दें कि विशिष्ट एक ही एमिनो एसिड की स्थिति के साथ जुड़े उत्परिवर्तनों संयुक्त किया जाना चाहिए । कॉलम जी, प्रत्येक उत्परिवर्तन और एमिनो एसिड की स्थिति के MAF एक उदाहरण के फार्मूले का उपयोग (यानी: G2 के लिए "= 2/(176 * 2)", सामग्री की तालिकादेखें) । ध्यान दें कि जब से सभी व्यक्तियों को heterozygous और प्रत्येक व्यक्ति माना KCNQ1 लोकस के 2 alleles ले जाने के लिए माना हैं, कुल व्यक्तियों एलील आवृत्ति के लिए 2 से गुणा किया जाना चाहिए । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 3
चित्रा 3 : नियंत्रण और प्रायोगिक वेरिएंट के लिए औसत गणना रोलिंग का उदाहरण । स्तंभ A और B, GnomAD नियंत्रण संस्करण स्थितियां और संबंधित MAFs । कॉलम सी, एमिनो एसिड की स्थिति से KCNQ1 के सभी एमिनो एसिड पदों के लिए अंतिम । स्तंभ D, GnomAD भिन् न MAF के साथ सभी स्थितियों के लिए एक भिन् न के बिना स्थिति के स्थान पर 0 के MAF. यह स्वचालित रूप से एक vlookup समारोह का उपयोग कर की गणना कर सकते हैं (D2 के लिएअर्थात , "= IFERROR (VLOOKUP (C2, A:B, 2,), 0), सामग्री की तालिकादेखें). स्तंभ E, स्थान का औसत MAF उदाहरण सूत्र (जैसे E2 के लिए, "= sum (d2: D7)/6" और E7 के लिए, "= sum (d2: D12)/ कॉलम जी और एच, LQTS संबंधित MAFs के साथ प्रयोगात्मक संस्करण पदों । कॉलम मैं, KCNQ1 के सभी एमिनो एसिड पदों । स्तंभ J, सभी पदों के लिए LQTS वैरिएंट MAF । स्तंभ K, rolling LQTS MAF. धूसर भरण कक्षों के उदाहरण हैं, जहां स्तंभ B और H से MAF मानों का स् तंभ D और J में विस् तृत किया जाता है, जो क्रमशः स्तंभ C/I में संबंधित स्थितियों के साथ सहसंबंधी करते हैं, यह विचारणीय है कि सभी कक्ष उचित सूत्र के लिए "संख्याओं" के रूप में स्वरूपित किए गए है कार्य. कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 4
चित्र 4 : सिग्नल के लिए शोर विश्लेषण और रेखांकन का उदाहरण । बाएँ, उदाहरण डेटाबेस और परिकलन. कॉलम ए, KCNQ1 के सभी एमिनो एसिड पदों । कॉलम बी, LQTS प्रयोगात्मक MAF प्रत्येक स्थिति के लिए औसत रोलिंग । स्तंभ C, GnomAD नियंत्रण MAF प्रत्येक स्थिति के लिए औसत रोलिंग । डी: सिग्नल से शोर अनुपात (D2 के लिएअर्थात् , "= B2/C2") । ठीक है, संकेत के ग्राफ के उदाहरण के लिए शोर अनुपात (Y-अक्ष) बनाम अमीनो एसिड की स्थिति (X-अक्ष) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 5
चित्रा 5 : प्रोटीन और संस्करण स्थिति मानचित्रण का उदाहरण । A, उदाहरण डेटाबेस और परिकलन । कॉलम ए, KCNQ1 के सभी एमिनो एसिड पदों । कॉलम बी, KCNQ1 पदों जो एक दुर्लभ नियंत्रण GnomAD में पहचान संस्करण है । स्तंभ C, डोमेन मैपिंग स्तंभ जहां कक्षों वाले मानों की पहचान KCNQ1 प्रोटीन डोमेन या सुविधाओं के N या C-टर्मिनल पहलू से संबंधित है । के रूप में सबसे अधिक n-टर्मिनल डोमेन है एस s डोमेन एमिनो एसिड १२२ में N-टर्मिनल सीमा है, कोई मूल्य यहां नोट कर रहे हैं । स्तंभ D, भिन् न मैपिंग स्तंभ जहां एक 1 वाले कक्ष KCNQ1 पदों के लिए संगत है जो दुर्लभ वेरिएंट को स्थानीयकृत करते हैं । धूसर भरण कक्ष दो उदाहरण है जहां स्तंभ B में भिन् न पदों को स् तंभ D में विस् तृत किया जाता है जो स् तंभ a में संबंधित पदों के साथ सहसंबंधित करते हैं । इस आंकड़े का एक बड़ा संस्करण देखने के लिए कृपया यहां क्लिक करें ।

Figure 6
चित्रा 6 : KCNQ1-एनकोडेड KCNQ1 (7.1 केवी) के अमीनो अम्ल-स्तरीय सिग्नल-टू-शोर विश्लेषण का उदाहरण । शीर्ष, संस्करण पदों ऊर्ध्वाधर लाइनों के साथ प्रदर्शन कर रहे हैं, दुर्लभ GnomAD पलटन वेरिएंट (काला), संयोग से पहचान की है वेस रेफरल (ब्लू) में वेरिएंट, और LQTS मामलों (हरा) में पहचान वेरिएंट सहित । कार्यात्मक डोमेन नोट कर रहे हैं । GnomAD वेरिएंट (ग्रीन लाइन) के लिए सामान्यीकृत LQTS मामले वेरिएंट की सापेक्ष आवृत्ति वेस (ब्लू लाइन) की तुलना में चित्रित किया गया है । एस-S6, transmembrane डोमेन; एस एफ, आयन selectivity फ़िल्टर; KCNE1 और AKAP9, संबंधित प्रोटीन बाइंडिंग डोमेन । संशोधित और पिछले काम14से अनुमति के साथ पुनर्मुद्रित । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

उच्च प्रवाह आनुवंशिक परीक्षण नाटकीय रूप से अपने आवेदन और उपलब्धता में पिछले एक दशक से अधिक उंनत है । हालांकि, cardiomyopathies के रूप में अच्छी तरह से स्थापित आनुवंशिक आधार के साथ कई रोगों में, विस्तारित परीक्षण नैदानिक उपज21में सुधार करने में विफल रहा है । इसके अलावा, कई पहचाने गए वेरिएंट के नैदानिक उपयोगिता के बारे में महत्वपूर्ण अनिश्चितता है । यह आंशिक रूप से संयोग से पहचाने गए दुर्लभ वेरिएंट वेस और WGS पर की खोज की एक बढ़ती हुई संख्या के कारण है, जो22निदान करने के लिए नेतृत्व कर सकते हैं । एमिनो एसिड स्तर संकेत करने वाली शोर विश्लेषण संस्करण pathogenicity की भविष्यवाणी के लिए अच्छी तरह से स्थापित रणनीतियों पर आधारित है और बड़े पैमाने पर जनसंख्या लाभ जीनोम अध्ययन आधारित संस्करण व्याख्या को परिष्कृत करने का लाभ प्रदान करता है ।

यह इस प्रकार है कि इस प्रोटोकॉल के लिए सबसे महत्वपूर्ण चरणों में से एक नियंत्रण और प्रयोगात्मक साथियों के चयन है । सार्वजनिक रूप से उपलब्ध बड़े जीनोम अध्ययन के कई ऐसे GnomAD के रूप में कुल डेटाबेस, के माध्यम से पहुंच रहे हैं, कि इस प्रोटोकॉल में प्रतिनिधि नियंत्रण साथियों के लिए अनुमति देने के लिए वर्तमान तिथि में १३८,६३२ व्यक्तियों के रूप में बड़े हो सकते हैं । हालांकि नहीं इन समग्र साथियों में सभी विषयों जाहिरा तौर पर स्वस्थ हैं, दुर्लभ रोग की स्थापना में बड़े नमूना आकार इस संसाधन अमूल्य बनाता है और एक कड़े MAF अपवर्जन दहलीज के लिए अनुमति देता है । आम वेरिएंट का बहिष्करण आवश्यक है क्योंकि वे अत्यधिक व्याप्ति Mendelian रोग का एक कारण होने की संभावना नहीं है । पिछले काम के आधार पर, channelopathy के लिए ०.०१ के एक MAF दहलीज-संबद्ध जीन और ०.०००१ cardiomyopathy जीन के लिए उपयुक्त हो सकता है और स्वतंत्र23,24समूहों द्वारा मांय किया गया है । महत्वपूर्ण बात, MAF दहलीज के महत्व को देखते हुए, यह सेट और स्वतंत्र रूप से प्रत्येक अध्ययन के लिए मान्य किया जाना चाहिए. एक MAF दहलीज एक प्रयोगात्मक पलटने के लिए लागू नहीं की जरूरत है, channelopathies और cardiomyopathies में संस्थापक उत्परिवर्तनों की अच्छी तरह से स्थापित उपस्थिति दी । प्रायोगिक पलटन के आकार को उन क्षेत्रों की पहचान करने के लिए पर्याप्त होना चाहिए जहां वेरिएंट क्लस्टर हो सकता है; हालांकि, कोई सख्त आकार नहीं है । इसके अतिरिक्त, प्रयोगात्मक पलटन में साहित्य के भीतर सौम्य होना ज्ञात वेरिएंट शामिल नहीं होना चाहिए, के रूप में यह रोगजनक संकेत के सच्चाई कम हो जाएगा ।

ठीक से अपवर्जन मानदंड का चयन भी व्याख्या और परिणाम की प्रयोज्यता के लिए महत्वपूर्ण है । हालांकि इस प्रोटोकॉल पर्यायवाची वेरिएंट के रूप में कुछ उत्परिवर्तन वर्गों को छोड़कर की सिफारिश की है, इन feasibly रोग प्रक्रियाओं में बचके पर्यायी वेरिएंट25,26की पहचान की गई है के लिए शामिल किया जा सकता है । इसके अतिरिक्त, जब विभिंन अपवर्जन मानदंड दोनों प्रयोगात्मक और नियंत्रण समूहों के लिए लागू कर रहे हैं, यह उत्परिवर्तन उपवर्ग द्वारा संकेत करने के लिए शोर मानचित्रण के स्तरीकरण के लिए अनुमति दे सकते है (यानी की तुलना करने के लिए वेरिएंट कटने) ।

MAFs के लिए एक रोलिंग औसत स्थापना की अनुमति पड़ोसी अमीनो एसिड को शामिल करने का अनुमान के लिए । उदाहरण के लिए, यदि एमिनो एसिड की स्थिति ३५ एक रोग संस्करण शामिल है और एक महत्वपूर्ण प्रोटीन डोमेन में रहता है, तो स्थिति ३६ pathogenicity की डिग्री जब रूपांतरित हो सकता है । इसी तरह, प्राथमिक अनुक्रम के एक खंड दुर्लभ नियंत्रण वेरिएंट की एक बड़ी राशि है चाहिए, तो इस क्षेत्र है कि दुर्लभ वेरिएंट होस्ट नहीं है के भीतर अमीनो एसिड अभी तक एक जनसंख्या में पाया दुर्लभ वेरिएंट युक्त की एक उच्च संभावना हो सकती है । इस प्रोटोकॉल में रोलिंग औसत +/-5 है, जबकि इस श्रेणी के सिग्नल के लिए शोर अनुपात और विशिष्ट प्रोटीन का अध्ययन किया जा रहा के संकल्प के उपयोगकर्ता के वांछित स्तर के आधार पर भिन्न हो सकते हैं । LQTS के उदाहरण में, पूछताछ KCNQ1-इनकोडिंग KCNQ1 चैनल कई transmembrane डोमेन फैले ~ 10 अमीनो एसिड है, लेखकों को अपने वांछित संकल्प को समायोजित करने के लिए कि पैमाने14पर महत्वपूर्ण निष्कर्षों को प्रतिबिंबित संकेत । एक लंबे समय तक प्राथमिक अनुक्रम और प्रोटीन लंबाई के साथ प्रोटीन के लिए, रोलिंग औसत की अवधि नियंत्रण भिन्नता के बिना प्रोटीन अनुक्रम के बड़े spans के कारण वृद्धि की जरूरत हो सकती है.

इस विधि के लिए कई सीमाएं हैं । जैसा कि पहले कहा, एक पर्याप्त phenotype-सकारात्मक जनसंख्या ख्यात रोग वेरिएंट की मेजबानी के क्रम में एक स्पष्ट रोग संकेत ड्राइव करने के लिए पहचान की जानी चाहिए । इसके अतिरिक्त, इन रोग वेरिएंट चर penetrance हो सकता है, इस प्रकार वास्तव में रोग उत्परिवर्तनों एक रोग phenotype प्रकट नहीं हो सकता है या नहीं तो पूरी तरह से व्याप्ति और बीमारी के कारण हो सकता है । जबकि कई सार्वजनिक रूप से आयोजित डेटाबेस, जैसे GnomAD, अक्सर "स्वस्थ साथियों" माना जाता है, आनुवंशिक रोगों की व्यापकता इस डाटाबेस में जनसंख्या अध्ययन के रूप में इसी तरह की संभावना है । के रूप में विस्तृत, इस प्रोटोकॉल अमीनो एसिड स्तर परिवर्तन exonic जीन वेरिएंट से उत्पंन पर विशेष रूप से ध्यान केंद्रित है कि अमीनो एसिड है, जो कि रोगजनक intronic ब्याह वेरिएंट monogenic रोग में खेल सकते है की भूमिका शामिल नहीं है के लिए कोड । cardiomyopathies में उनकी हाल ही में प्रदर्शित भूमिका को देखते हुए, संकल्प का विस्तार इस दृष्टिकोण को intergenic की पहचान के लिए वारंट किया जा सकता है "के आकर्षण के रूप में अच्छी तरह से" । इसके अलावा, एक MAF दहलीज के आवेदन कुछ "जोखिम alleles" याद कर सकते हैं कि, हालांकि एक MAF रोग प्रसार की तुलना में अधिक के साथ आबादी में मौजूदा,27,28रोगजनन रोग के लिए योगदान कर सकते हैं. इन सीमाओं के बावजूद, इस विश्लेषण अनुकूलनीय है और चिकित्सकों प्रदान करने में एक महत्वपूर्ण भूमिका निभा सकते है रोग pathogenicity के सापेक्ष संभाव्यता जब उचित लागू होता है ।

अंत में, इस विश्लेषण के predilection दिया एक प्रोटीन के भीतर महत्वपूर्ण क्षेत्रों की पहचान करने के लिए, एमिनो एसिड स्तर संकेत करने वाली शोर गणना रोग उत्परिवर्तनों का उपयोग प्रोटीन के उपंयास कार्यात्मक डोमेन की पहचान की संभावना प्रदान करता है अध्ययन. उच्च pathogenicity संकेत के अवलोकन को देखते हुए आयन चैनलों के प्रमुख स्थानों पर शोर करने के लिए, ऐसे ताकना डोमेन के रूप में, selectivity फिल्टर, S2 transmembrane डोमेन, और KCNE1-KCNQ1 के बंधन डोमेन, एक क्षेत्र के भीतर pathogenicity की "चोटी की पहचान" एक ज्ञात समारोह के बिना प्रोटीन की एक उपंयास महत्वपूर्ण डोमेन सुझाव हो सकता है । उदाहरण के लिए, LQTS-जुड़े उत्परिवर्तनों के pathogenicity के एक चिह्नित चोटी KCNH2इनकोडिंग KCNH2 (केवी 11.1) के एमिनो एसिड अवशेषों के लिए स्थानीयकरण की पहचान की गई है 912-930 । प्रोटीन के इस क्षेत्र में कोई पहचान योग्य कार्यात्मक डोमेन है अभी तक LQTS के लिए एक चिह्नित प्रवृत्ति-जुड़े उत्परिवर्तनों14दर्शाता है । प्रोटीन टोपोलॉजी के ज्ञान के रूप में फैलता है, और अधिक परिष्कृत प्रोटियोमिक् feasibly एक प्रोटीन प्राथमिक संरचना के साथ संकेत करने के लिए शोर अनुपात का विश्लेषण करने से भविष्य में इस पद्धति के समाधान में सुधार कर सकता है अपने माध्यमिक, तृतीयक, या शामिल चतुर्धातुक संरचना । इस तरह की मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस के रूप में इस विश्लेषण के लिए उन्नत गणना विज्ञान के अलावा, जनसंख्या आधारित आनुवंशिक भिन्नता बनाम रोग के बीच उपन्यास पैटर्न की पहचान करने का अवसर affords, यदि इन के मजबूत डेटाबेस वेरिएंट29,30उत्पन्न किया जा सकता है । बदले में, इस विधि बेहतर निस्र्पक में सहायता और विशिष्ट रोगों के जीनोटाइप-phenotype संबंध की भविष्यवाणी कर सकता है और एक व्यक्ति के पूर्व परीक्षण रोग की संभावना के साथ संयोजन के रूप में इस्तेमाल किया आनुवंशिक परीक्षण के नैदानिक उपज में सुधार होगा । इसके अलावा, इस विश्लेषण उपंयास प्रोटीन जीवविज्ञान की खोज और मानव जीनोम जो रोग के साथ प्रकट जब बदल के भीतर उपंयास loci की पहचान कर सकते हैं ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

एपीएल स्वास्थ्य K08-HL136839 के राष्ट्रीय संस्थानों द्वारा समर्थित है ।

Materials

Name Company Catalog Number Comments
1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. Lawless, C. , Springer. New York, NY. (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , Chapter 7 (Unit 7.20) (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, Database issue 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Tags

आनुवंशिकी मुद्दा १४३ आनुवंशिक विश्लेषण आनुवंशिक परीक्षण उत्परिवर्तन टोपोलॉजी अनिश्चित महत्व के संस्करण पूरे exome अनुक्रमण
आनुवंशिक भिन्नता के एमिनो एसिड स्तर संकेत करने के लिए शोर विश्लेषण का उपयोग Pathogenicity के संस्करण की संभावना का निर्धारण
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jones, E. G., Landstrom, A. P.More

Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter