Summary

आनुवंशिक भिन्नता के एमिनो एसिड स्तर संकेत करने के लिए शोर विश्लेषण का उपयोग Pathogenicity के संस्करण की संभावना का निर्धारण

Published: January 16, 2019
doi:

Summary

एमिनो एसिड स्तर के संकेत करने वाली शोर विश्लेषण एक दिया एमिनो एसिड की स्थिति में आनुवंशिक भिंनता की व्यापकता को निर्धारित करता है एक दिया जनसंख्या का आनुवंशिक भिंनता पृष्ठभूमि सामान्यीकृत । यह एक प्रोटीन अनुक्रम (संकेत) है कि एक जनसंख्या (शोर) में पाया दुर्लभ वेरिएंट की आवृत्ति से ऊपर उगता के भीतर संस्करण “हॉटस्पॉट” की पहचान के लिए अनुमति देता है ।

Abstract

लागत और अगली पीढ़ी के आनुवंशिक अनुक्रमण की गति में प्रगति नैदानिक पूरे exome और पूरे जीनोम परीक्षण के एक विस्फोट उत्पन्न किया है । हालांकि यह संभावना रोगजनकों आनुवंशिक सिंड्रोम के साथ जुड़े उत्परिवर्तनों की वृद्धि की पहचान के लिए नेतृत्व किया गया है, यह भी नाटकीय रूप से संयोग से अज्ञात महत्व (ववस) के आनुवंशिक वेरिएंट पाया की संख्या बढ़ गई है । इन वेरिएंट के नैदानिक महत्व का निर्धारण वैज्ञानिकों और चिकित्सकों दोनों के लिए एक बड़ी चुनौती है । pathogenicity की संभावना का निर्धारण करने में सहायता करने के लिए एक दृष्टिकोण प्रोटीन अनुक्रम स्तर पर संकेत करने वाली शोर विश्लेषण है. इस प्रोटोकॉल एमिनो एसिड स्तर के संकेत के लिए एक विधि का वर्णन करने वाली शोर विश्लेषण है कि ज्ञात प्रोटीन टोपोलॉजी के साथ प्रोटीन के प्रत्येक एमिनो एसिड की स्थिति पर संस्करण आवृत्ति का लाभ उठाया संभावना के साथ प्राथमिक अनुक्रम के क्षेत्रों की पहचान करने के लिए रोग भिन्नता (जनसंख्या “पृष्ठभूमि” भिन्नता के सापेक्ष). इस विधि एमिनो एसिड अवशेषों स्थान उच्च रोग संकेत है, जो VUSs के नैदानिक वजन ऐसे अगली पीढ़ी आनुवंशिक परीक्षण द्वारा पहचान की उन के रूप में परिष्कृत करने के लिए इस्तेमाल किया जा सकता है की “आकर्षण के बीच” की पहचान कर सकते हैं ।

Introduction

आनुवंशिक अनुक्रमण प्लेटफार्मों में तेजी से सुधार की पहुंच और चिकित्सा में आनुवंशिकी की भूमिका में क्रांति आई है । एक बार एक जीन, या जीन की एक मुट्ठी भर तक ही सीमित, लागत में कमी और अगली पीढ़ी के आनुवंशिक अनुक्रमण की गति में वृद्धि के जीनोम कोडिंग अनुक्रम (पूरे exome अनुक्रमण, वेस) और पूरे जीनोम की पूरी तरह से नियमित अनुक्रमण का नेतृत्व किया है ( नैदानिक सेटिंग में पूरे जीनोम अनुक्रमण, WGS) । वेस और WGS गंभीर रूप से बीमार नवजात शिशुओं और आनुवंशिक सिंड्रोम के लिए चिंता के साथ बच्चों की सेटिंग में अक्सर इस्तेमाल किया गया है, जहां यह एक सिद्ध नैदानिक उपकरण है कि नैदानिक प्रबंधन1,2बदल सकते है । हालांकि यह संभावना रोगजनकों आनुवंशिक सिंड्रोम के साथ जुड़े उत्परिवर्तनों की वृद्धि की पहचान के लिए प्रेरित किया है, यह भी नाटकीय रूप से संयोग से पाया आनुवंशिक वेरिएंट की संख्या में वृद्धि हुई है, या अप्रत्याशित सकारात्मक परिणाम, अज्ञात निदान की माहात्म्य (ववस) । हालांकि इन वेरिएंट में से कुछ की अवहेलना कर रहे हैं और रिपोर्ट नहीं, संभावित घातक या अत्यधिक रुग्ण रोगों से जुड़े जीन के लिए स्थानीय वेरिएंट अक्सर सूचित कर रहे हैं । वर्तमान दिशानिर्देश विशिष्ट जीन में पाए जाने वाले आकस्मिक वेरिएंट की रिपोर्टिंग की सलाह देते हैं, जो रोगी को चिकित्सा लाभ का हो सकता है, जिसमें अचानक कार्डियक डेथ के विकास से जुड़े जीन शामिल हैं-cardiomyopathies जैसे संवेदनशील रोग और channelopathies3. हालांकि इस सिफारिश को एक SCD के जोखिम में व्यक्तियों पर कब्जा करने के लिए डिज़ाइन किया गया था-संवेदनशील रोग, संस्करण का पता लगाने की संवेदनशीलता अब तक विशिष्टता से अधिक है । यह स्पष्ट निदान उपयोगिता है कि अब तक एक दिया जनसंख्या4में संबंधित रोगों की आवृत्ति से अधिक के साथ VUSs और संयोग से पहचान वेरिएंट की बढ़ती संख्या में परिलक्षित होता है । एक ऐसी बीमारी, लांग क्यूटी सिंड्रोम (LQTS), एक विहित कार्डियक channelopathy जीन है जो हृदय आयन चैनल सांकेतिक शब्दों में बदलना, या चैनल प्रोटीन, देरी हृदय ध्रुवीकरण5में जिसके परिणामस्वरूप के लिए स्थानीयकरण उत्परिवर्तनों की वजह से है । यह देरी ध्रुवीकरण, आराम इलेक्ट्रोकार्डियोग्राम पर एक लंबे समय तक क्यूटी अंतराल द्वारा देखा, एक विद्युत गड़बड़ी में संभावित घातक वेंट्रिकुलर अतालता जैसे torsades de points. जबकि जीन की एक संख्या इस रोग के विकास के लिए जोड़ा गया है, KCNQ1में उत्परिवर्तनों-इनकोडिंग मैंएस पोटेशियम चैनल (KCNQ1, 7.1 केवी) LQTS प्रकार 1 के कारण है और6के नीचे एक उदाहरण के रूप में उपयोग किया जाता है । भिन्नता व्याख्या में जटिलता illustrating, LQTS में दुर्लभ वेरिएंट की उपस्थिति-जुड़े जीन, तथाकथित “पृष्ठभूमि आनुवंशिक भिन्नता” पहले7,8वर्णित किया गया है.

ज्ञात रोगजनक वेरिएंट के बड़े संग्रह-शैली डेटाबेस के अलावा, कई रणनीतियों प्रभाव अलग वेरिएंट उत्पादन होगा भविष्यवाणी करने के लिए मौजूद हैं । कुछ एल्गोरिदम पर आधारित हैं, जैसे मैदे और Polyphen 2, जो deleteriousness9,10की भविष्यवाणी करने के लिए उपन्यास के गैर-पर्यायवाची वेरिएंट की बड़ी संख्या को फ़िल्टर कर सकते हैं । इन उपकरणों के व्यापक उपयोग के बावजूद, कम विशिष्टता उनके प्रयोज्य सीमा जब यह “बुला” नैदानिक VUSs11आता है । “सिग्नल से शोर” विश्लेषण एक उपकरण है जो एक संस्करण की संभावना की पहचान करता है एक जनसंख्या से दुर्लभ आनुवंशिक परिवर्तन के खिलाफ सामान्यीकृत सवाल में loci पर ज्ञात रोग भिन्नता की आवृत्ति पर आधारित रोग के साथ जुड़े जा रहा है । आनुवंशिक loci करने के लिए स्थानीय वेरिएंट जहां जनसंख्या आधारित भिन्नता की तुलना में रोग से जुड़े उत्परिवर्तनों की एक उच्च व्याप्ति है, एक उच्च संकेत करने के लिए शोर, रोग स्वयं जुड़े होने की संभावना है । इसके अलावा, दुर्लभ वेरिएंट संयोग से रोग से जुड़े आवृत्ति की तुलना में दुर्लभ जनसंख्या वेरिएंट की एक उच्च आवृत्ति के साथ एक जीन के लिए स्थानीयकृत पाया, एक कम संकेत करने के लिए शोर, रोग से जुड़े होने की संभावना कम हो सकती है. सिग्नल से शोर विश्लेषण की नैदानिक उपयोगिता cardiomyopathies और channelopathies के लिए आनुवंशिक परीक्षण के लिए नवीनतम दिशा निर्देशों में सचित्र किया गया है; तथापि, यह केवल पूरे जीन स्तर या डोमेन विशेष स्तर12पर कार्यरत किया गया है । हाल ही में, दोनों रोग वेरिएंट की वृद्धि की उपलब्धता को देखते हुए (रोग डेटाबेस, साहित्य में समानता अध्ययन) और जनसंख्या आधारित नियंत्रण वेरिएंट (Exome एकत्रीकरण कंसोर्टियम, ExAC और जीनोम एकत्रीकरण डाटाबेस, GnomAD13), यह एक प्रोटीन के प्राथमिक अनुक्रम के भीतर व्यक्तिगत एमिनो एसिड पदों के लिए लागू किया गया है । एमिनो एसिड स्तर के संकेत करने वाली शोर विश्लेषण के रूप में संभावना “पृष्ठभूमि” आनुवंशिक भिंनता के बजाय रोग से जुड़े LQTS के साथ जुड़े जीन में संयोग से पहचान वेरिएंट वर्गीकृत में उपयोगी साबित किया है । तीन प्रमुख LQTS के साथ जुड़े जीन के अलावा, KCNQ1सहित, इन संयोग से पहचाना वेरिएंट एक महत्वपूर्ण संकेत करने वाली शोर अनुपात का अभाव है, सुझाव है कि व्यक्तिगत एमिनो एसिड पदों पर इन वेरिएंट की आवृत्ति दुर्लभ प्रतिबिंबित जनसंख्या रूपांतर के बजाय रोग से जुड़े उत्परिवर्तनों । इसके अलावा, जब प्रोटीन विशेष डोमेन टोपोलॉजी उच्च संकेत के क्षेत्रों के खिलाफ मढ़ा था शोर करने के लिए, रोग उत्परिवर्तन “हॉटस्पॉट” प्रोटीन14के मुख्य कार्यात्मक डोमेन के लिए स्थानीयकृत । यह पद्धति 1 निर्धारित करने में वादा रखती है) संभावना एक संस्करण रोग है या आबादी से जुड़े और 2) एक प्रोटीन मानव रोग के साथ जुड़े के उपंयास महत्वपूर्ण कार्यात्मक डोमेन की पहचान ।

Protocol

1. रुचि के जीन और विशिष्ट ब्याह Isoform की पहचान नोट: यहां, हम Ensembl15 के उपयोग के लिए ब्याज के जीन जो ब्याज की बीमारी के रोगजनन (यानी KCNQ1 उत्परिवर्तनों LQTS के साथ जुड़े रहे है के साथ जुड़ा हुआ है क…

Representative Results

KCNQ1 के लिए शोर विश्लेषण करने के लिए एमिनो एसिड स्तर के संकेत के लिए एक प्रतिनिधि परिणाम चित्रा 6में दर्शाया गया है । इस उदाहरण में, GnomAD पलटन (नियंत्रण पलटन) में पहचाने गए दुर्लभ वेरि?…

Discussion

उच्च प्रवाह आनुवंशिक परीक्षण नाटकीय रूप से अपने आवेदन और उपलब्धता में पिछले एक दशक से अधिक उंनत है । हालांकि, cardiomyopathies के रूप में अच्छी तरह से स्थापित आनुवंशिक आधार के साथ कई रोगों में, विस्तारित परीक्षण ?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

एपीएल स्वास्थ्य K08-HL136839 के राष्ट्रीय संस्थानों द्वारा समर्थित है ।

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Play Video

Cite This Article
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video