Targeted Next-generation Sequencing and Bioinformatics Pipeline to Evaluate Genetic Determinants of Constitutional Disease

Allison A. Dilliott; Sali M.K. Farhan; Mahdi Ghani; Christine Sato; Eric Liang; Ming Zhang; Adam D. McIntyre; Henian Cao; Lemuel Racacho; John F. Robinson; Michael J. Strong; Mario Masellis; Dennis E. Bulman; Ekaterina Rogaeva; Anthony Lang; Carmela Tartaglia; Elizabeth Finger; Lorne Zinman; John Turnbull; Morris Freedman; Rick Swartz; Sandra E. Black; Robert A. Hegele

doi:10.3791/57266

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

संवैधानिक रोग के आनुवंशिक निर्धारकों का मूल्यांकन करने के लिए लक्षित अगली पीढ़ी के अनुक्रमण और Bioinformatics पाइपलाइन

Published: April 04, 2018

doi:

10.3791/57266

Allison A. Dilliott², Sali M.K. Farhan, Mahdi Ghani, Christine Sato, Eric Liang, Ming Zhang, Adam D. McIntyre, Henian Cao, Lemuel Racacho⁷, John F. Robinson, Michael J. Strong⁸, Mario Masellis¹⁰, Dennis E. Bulman⁷, Ekaterina Rogaeva, Anthony Lang¹¹, Carmela Tartaglia¹⁰, Elizabeth Finger¹³, Lorne Zinman, John Turnbull, Morris Freedman¹⁵, Rick Swartz, Sandra E. Black¹⁶, Robert A. Hegele²

¹Robarts Research Institute, Schulich School of Medicine and Dentistry,Western University, ²Department of Biochemistry, Schulich School of Medicine and Dentistry,Western University, ³Analytic and Translational Genetics Unit, Center for Genomic Medicine,Harvard Medical School, Massachusetts General Hospital, Stanley Centre for Psychiatric Research, Broad Institute of MIT and Harvard, ⁴Tanz Centre for Research in Neurodegenerative Diseases,University of Toronto, ⁵School of Medicine, Faculty of Health Sciences,Queen’s University, ⁶Faculty of Medicine, Department of Biochemistry, Microbiology and Immunology,University of Ottawa, ⁷CHEO Research Institute, Faculty of Medicine,University of Ottawa, ⁸Department of Clinical Neurological Sciences,Western University, ⁹Division of Neurology, Department of Medicine, Sunnybrook Health Sciences Centre,University of Toronto, ¹⁰Division of Neurology, Department of Medicine,University of Toronto, ¹¹Morton and Gloria Shulman Movement Disorders Centre,Toronto Western Hospital, ¹²Department of Clinical Neurological Sciences, Schulich School of Medicine and Dentistry,Western University, ¹³Parkwood Institute,St. Joseph’s Health Care, ¹⁴Department of Medicine, Division of Neurology,McMaster University, ¹⁵Division of Neurology, Department of Medicine,Baycrest Health Sciences, ¹⁶Canadian Partnership for Stroke Recovery Sunnybrook Site, Sunnybrook Health Science Centre,University of Toronto

Summary

लक्षित अगली पीढ़ी अनुक्रमण एक समय और लागत कुशल दृष्टिकोण है कि दोनों रोग अनुसंधान और नैदानिक निदान में तेजी से लोकप्रिय होता जा रहा है । प्रोटोकॉल यहां वर्णित जटिल अनुक्रमण के लिए आवश्यक कार्यप्रवाह और आनुवंशिक वेरिएंट है कि रोग में योगदान की पहचान करने के लिए इस्तेमाल किया bioinformatics प्रक्रिया प्रस्तुत करता है ।

Abstract

अगली पीढ़ी के अनुक्रमण (NGS) जल्दी क्रांति है कैसे संवैधानिक रोग के आनुवंशिक निर्धारकों में अनुसंधान किया जाता है । तकनीक अनुक्रमण के लाखों के साथ अत्यधिक कुशल है एक कम समय अवधि में उत्पादन किया जा रहा है और अपेक्षाकृत कम कीमत पर पढ़ता है । विशेष रूप से, लक्षित NGS अध्ययन की बीमारी के आधार पर विशेष रूप से ब्याज की जीनोमिक क्षेत्रों के लिए जांच ध्यान केंद्रित करने में सक्षम है । न केवल यह आगे लागत को कम करता है और इस प्रक्रिया की गति में वृद्धि, लेकिन यह गणना बोझ है कि अक्सर NGS के साथ कम करती है । हालांकि लक्षित NGS जीनोम के कुछ क्षेत्रों के लिए प्रतिबंधित है, ब्याज की संभावित उपंयास loci की पहचान को रोकने, यह एक उत्कृष्ट तकनीक जब एक phenotypically और आनुवंशिक रूप से विषम बीमारी के साथ सामना करना पड़ सकता है, जिसके लिए वहां है पहले आनुवंशिक संघों जाना जाता है । अनुक्रमण तकनीक की जटिल प्रकृति की वजह से, यह बारीकी से उच्च कवरेज और गुणवत्ता के अनुक्रमण पढ़ता प्राप्त करने के क्रम में प्रोटोकॉल और तरीकों का पालन करने के लिए महत्वपूर्ण है । इसके अलावा, एक बार अनुक्रमण पढ़ता प्राप्त कर रहे हैं, एक परिष्कृत bioinformatics कार्यप्रवाह सही नक्शा एक संदर्भ जीनोम के लिए पढ़ता है, वेरिएंट को कॉल करने के लिए, और वेरिएंट गुणवत्ता मैट्रिक्स पारित सुनिश्चित करने के लिए उपयोग किया जाता है । वेरिएंट भी व्याख्या और उनके नैदानिक महत्व है, जो चिकित्सा आनुवंशिकी और जीनोमिक्स Pathogenicity दिशानिर्देश के अमेरिकन कॉलेज को लागू करने से मानकीकृत किया जा सकता है के आधार पर उपचारात्मक होना चाहिए । यहां प्रस्तुत तरीकों को पैदा करने और एक लक्षित अनुक्रमण पैनल से NGS डेटा का विश्लेषण, एक मॉडल के रूप में ONDRISeq neurodegenerative रोग पैनल का उपयोग, वेरिएंट है कि नैदानिक महत्व का हो सकता है की पहचान करने में शामिल कदम प्रदर्शित करेगा ।

Introduction

विभिंन स्थितियों के आनुवंशिक निर्धारकों को परिभाषित करने के रूप में अनुसंधान में एक उच्च प्राथमिकता पर लेता है और क्लिनिक में, अगली पीढ़ी के अनुक्रमण (NGS) के लिए एक उच्च प्रवाह और लागत प्रभावी उपकरण के लिए इन लक्ष्यों को प्राप्त करने के लिए साबित हो रहा है¹^,² ^,³. लगभग 40 वर्षों के लिए, सैंज अनुक्रमण आनुवंशिक वेरिएंट की पहचान करने के लिए सोने के मानक किया गया था⁴; हालांकि, आनुवंशिक विविधता या अज्ञात आनुवंशिक एटियलजि के साथ रोगों के लिए, कई संभावित उंमीदवार जीन का मूल्यांकन किया जाना चाहिए, अक्सर समवर्ती । इस संदर्भ में, सैंज अनुक्रमण महंगा और समय लेने वाली हो जाता है । हालांकि, NGS डीएनए टुकड़े के लाखों के बड़े पैमाने पर समानांतर अनुक्रमण शामिल है, एक लागत और समय कुशल तकनीक के लिए अनुमति देता है एक साथ जीनोम के विभिंन क्षेत्रों में आनुवंशिक भिंनता की एक विस्तृत श्रृंखला का पता लगाने के लिए ।

sequencing डीएनए के लिए NGS के तीन प्रकार के होते हैं: 1) पूरे-जीनोम अनुक्रमण (WGS), 2) पूरे-exome अनुक्रमण (वेस), और 3) लक्षित अनुक्रमण⁵. WGS एक व्यक्ति के पूरे जीनोमिक सामग्री का मूल्यांकन करता है, जबकि वेस अनुक्रमण केवल प्रोटीन के जीनोम⁶कोडिंग क्षेत्रों में शामिल है । लक्षित अनुक्रमण, इसके विपरीत, आम रोग तंत्र या ज्ञात नैदानिक phenotype द्वारा जुड़े अपेक्षाकृत कुछ विशिष्ट जीन के आधार पर जीनोम के विशिष्ट क्षेत्रों पर केंद्रित है । या तो exons या introns, या जीन के एक जीन या विशिष्ट समूह के किसी भी intergenic क्षेत्रों इस दृष्टिकोण का उपयोग कर निर्दिष्ट किया जा सकता है । इसलिए, लक्षित अनुक्रमण एक उत्कृष्ट दृष्टिकोण जब पहले से ही उंमीदवार के लिए ब्याज की बीमारी के साथ जुड़े जीन ज्ञात की नींव है हो सकता है । जीनोम के विशिष्ट क्षेत्रों लक्ष्यीकरण अनावश्यक और अप्रासंगिक आनुवंशिक भिंनता है कि बादल या नैदानिक व्याख्या से विचलित कर सकते है के उंमूलन के लिए अनुमति देता है । जबकि WGS और वेस दोनों उच्च गुणवत्ता वाले डेटा की एक बड़ी राशि का उत्पादन, डेटा की राशि भारी हो सकता है । न केवल डेटा की इस बड़ी राशि है अभिकलनी गहन bioinformatics विश्लेषण की आवश्यकता होती है, लेकिन डेटा भंडारण अक्सर समस्या⁷उपस्थित कर सकते हैं । डेटा भंडारण की यह चुनौती भी WGS और वेस, जो अक्सर शुरू नहीं माना जाता है जब अनुक्रमण के खर्च की गणना करने के लिए अतिरिक्त लागत कहते हैं । इसके अलावा, यद्यपि यह कम है, WGS और वेस की लागत अपेक्षाकृत अधिक रहती है । लक्षित अनुक्रमण एक अधिक लागत कुशल विकल्प है, खासकर जब व्यक्तियों की एक बड़ी संख्या के अनुक्रमण की आवश्यकता है हो सकता है ।

ओंटारियो Neurodegenerative रोग अनुसंधान पहल (ONDRI) एक बहु मंच, प्रांतीय चौड़ा, प्रेक्षणीय पलटन अध्ययन निस्र्पक सहित पांच Neurodegenerative रोगों, है: 1) अल्जाइमर रोग और हल्के संज्ञानात्मक हानि, 2) पेशीशोषी पार्श्व स्केलेरोसिस, 3) frontotemporal मनोभ्रंश, 4) पार्किंसंस रोग, और 5) संवहनी संज्ञानात्मक हानि⁸. ONDRI जीनोमिक्स उपसमूह इस पलटना अक्सर छूट, अभी तक अत्यंत महत्वपूर्ण आनुवंशिक परिदृश्य इन phenotypically और आनुवंशिक रूप से विषम रोगों के आधारभूत लक्षण वर्णन के भाग के रूप में स्पष्ट करने के लिए लक्ष्य है । Neurodegenerative रोगों इस प्रकार NGS के तरीके के लिए उपयुक्त उंमीदवारों और विशेष रूप से लक्षित अनुक्रमण के लिए कर रहे हैं ।

हम कस्टम-बनाया गया है एक लक्षित NGS पैनल, ONDRISeq, को अनुक्रम 528 प्रतिभागियों प्रोटीन के लिए ONDRI में शामिल-कोडिंग क्षेत्रों के 80 जीन है कि पहले ब्याज की पांच बीमारियों के साथ संबद्ध किया गया है । इस पद्धति के साथ, हम एक केंद्रित और कुशल तरीके से उच्च गुणवत्ता वाले NGS डेटा का दोहन करने में सक्षम हैं । डिजाइन और कई सामंजस्य अध्ययन के साथ ONDRISeq पैनल के सत्यापन पहले वर्णित किया गया है, जिसके लिए ONDRISeq पैनल के उपंयास की पहचान करने में सक्षम था, 216 के ७२.२% में संभव नैदानिक महत्व के दुर्लभ वेरिएंट पैनल सत्यापन के लिए इस्तेमाल किया मामलों की ⁹. हालांकि NGS प्रौद्योगिकी तेजी से उंनत और हाल के वर्षों में उल्लेखनीय है, कई शोधकर्ताओं ने एक चुनौती का सामना जब प्रयोग करने योग्य, व्याख्या वेरिएंट¹⁰की एक सूची में कच्चे डेटा प्रसंस्करण । इसके अलावा, वेरिएंट की व्याख्या जटिल हो सकता है, खासकर जब कई कि दुर्लभ या उपंयास¹¹के साथ सामना करना पड़ा ।

यहाँ, हम एक उदाहरण के रूप में ONDRISeq अध्ययन का उपयोग करके चरण-दर-चरण तरीके से, लक्षित NGS की कार्यप्रणाली और पुनर्अनुक्रमणन के लिए आवश्यक संबद्ध bioinformatics कार्यप्रवाह, भिन्न कॉलिंग, और भिन्न एनोटेशन का वर्णन करते हैं. NGS डेटा की पीढ़ी के बाद, कच्चे अनुक्रमण फ़ाइलें सही वेरिएंट कॉल करने के क्रम में मानव संदर्भ जीनोम के लिए गठबंधन किया जाना चाहिए । वेरिएंट तो बाद में संस्करण उपचारात्मक प्रदर्शन करने के क्रम में व्याख्या की जानी चाहिए । हम भी सही संस्करण pathogenicity वर्गीकृत करने के लिए चिकित्सा ‘ जेनेटिक्स मानकों और दिशा निर्देशों के अमेरिकी कॉलेज के हमारे कार्यांवयन की व्याख्या करेंगे ।

Protocol

ONDRI, आचार प्रोटोकॉल और सूचित सहमति के प्रयोजनों के लिए Baycrest केंद्र में शोध नीति बोर्डों के आधार पर वृद्धावस्था देखभाल के लिए प्राप्त किए गए (टोरंटो, ओंटारियो, कनाडा); लत और मानसिक स्वास्थ्य के लिए केंद्र (टोरंटो, ओंटारियो, कनाडा); एलिजाबेथ Bruyère अस्पताल (ओटावा, ओंटारियो, कनाडा); हैमिल्टन जनरल अस्पताल (हैमिल्टन, ओंटारियो, कनाडा); लंदन स्वास्थ्य विज्ञान केंद्र (लंदन, ओंटारियो, कनाडा); McMaster (हैमिल्टन, ओंटारियो, कनाडा); ओटावा अस्पताल (ओटावा, ओंटारियो, कनाडा); Parkwood अस्पताल (लंदन, ओंटारियो, कनाडा); सेंट माइकल अस्पताल (टोरंटो, ओंटारियो, कनाडा); Sunnybrook स्वास्थ्य विज्ञान केंद्र (टोरंटो, ओंटारियो, कनाडा); और विश्वविद्यालय स्वास्थ्य नेटवर्क-टोरंटो वेस्टर्न अस्पताल (टोरंटो, ओंटारियो, कनाडा) । 1. मानव रक्त के नमूनों से डीएनए अलगाव उपयुक्त आचार प्रोटोकॉल और सूचित सहमति के अनुसार sequencing प्रतिभागियों से नमूने ले लीजिए । उच्च गुणवत्ता के डीएनए प्राप्त करने के लिए, निष्कर्षण के प्रयोजनों के लिए रक्त के नमूने आकर्षित ।नोट: डीएनए भी लार या buccal कोशिकाओं से निकाला जा सकता है, यह सुनिश्चित करना है कि एक उचित डीएनए निष्कर्षण किट का प्रयोग किया जाता है । यदि रक्त से निकालने, डीएनए की एक उच्च उपज प्राप्त करने के लिए, तीन 4 मिलीलीटर EDTA K2 ट्यूबों में नमूना इकट्ठा, कुल मात्रा का एक नमूना प्रदान ~ 12 मिलीलीटर । 750 x जी में 20 मिनट के लिए रक्त के नमूनों को प्लाज्मा के एक ऊपरी चरण में अंश करने के लिए, पतली, ल्यूकोसाइट्स के मध्य चरण, और एरिथ्रोसाइट्स के नीचे चरण । रक्त के नमूने से प्लाज्मा को निकालकर उसे एक डिस्पोजेबल ट्रांसफर पिपेट के साथ नमूने के ऊपर से pipetting । उचित रूप से प्लाज्मा को छोड़ दें या भविष्य में जैव रासायनिक विश्लेषण के लिए-80 डिग्री सेल्सियस पर भंडारण के लिए एकाधिक 500 µ l aliquots में बांटें । सुनिश्चित करें कि एक नया, बाँझ पिपेट प्रत्येक नमूने के लिए प्रयोग किया जाता है । निर्माता के निर्देशों के अनुसार एक रक्त निष्कर्षण किट12 (सामग्री की तालिका) के साथ रक्त के नमूने से डीएनए निकालें ।नोट: यदि ऊपर वर्णित मात्रा का एक नमूना प्राप्त है, ~ ल्यूकोसाइट्स के 3 मिलीलीटर डीएनए निष्कर्षण में उपयोग करने के लिए प्राप्त किया जाएगा । एक पूर्ण स्पेक्ट्रम spectrophotometer13 (सामग्री की तालिका) का उपयोग करते हुए एनजी/µ एल में प्रारंभिक डीएनए एकाग्रता उपाय, निर्माता के निर्देशों के अनुसार । सीधे चरण 2 पर आगे बढ़ें । वैकल्पिक रूप से, 4 डिग्री सेल्सियस पर डीएनए की दुकान । 2. sequencing पुस्तकालय की तैयारी तीन दिनों के पाठ्यक्रम पर डीएनए नमूनों पर धारावाहिक कमजोर पड़ने के लिए 5.0 ± 1.0 एनजी/µ एल के एक अंतिम एकाग्रता प्राप्त करने के लिए प्रदर्शन पतला 1 मीटर Tris बफर पीएच 8.5 से 10 µ मीटर के साथ जल ।नोट: मात्रा पतला डीएनए नमूनों की संख्या है कि बाद के चरणों में पतला होने की आवश्यकता होगी पर निर्भर करेगा । अगर 1.4 कदम के बाद डीएनए कमजोर पड़ने सीधे प्रदर्शन, निंनलिखित कदम के लिए आगे बढ़ें । अगर एक ही दिन पर नहीं, डीएनए एकाग्रता के रूप में कदम 1.4 में किया गया था उपाय । मापा एकाग्रता के आधार पर, के लिए डीएनए के 40 µ एल पतला ~ 10 एनजी/µ एल का उपयोग कर 10 µ m Tris बफर पीएच 8.5 और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देते हैं । एक fluorometer के साथ डीएनए एकाग्रता को मापने14 डीएनए के ठहराव के लिए उपयुक्त (सामग्री की तालिका), निर्माता के निर्देशों के अनुसार.नोट: नमूने की एकाग्रता होना चाहिए > 10 एनजी/µ एल spectrophotometer पहले इस्तेमाल की कम संवेदनशीलता की वजह से । मापा एकाग्रता के आधार पर, 10 µ एम Tris बफर पीएच 8.5 का उपयोग करने और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देने के लिए डीएनए के 20 µ एल पतला । fluorometer14के साथ डीएनए एकाग्रता को मापने, निर्माता के निर्देशों के अनुसार. मापा एकाग्रता के आधार पर, डीएनए के 10 µ एल को पतला 5 एनजी/µ एल का उपयोग कर 10 µ एम Tris-एचसीएल पीएच 8.5 और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देते हैं । लक्षित NGS पैनल के उपयुक्त लक्ष्य संवर्धन किट15 (सामग्री की तालिका) के साथ निर्माता के निर्देशों के अनुसार अनुक्रमण पुस्तकालय तैयार करते हैं । सुनिश्चित करें कि संवर्धन किट NGS मंच इस्तेमाल किया जा रहा के लिए उपयुक्त है । निर्माता के निर्देशों का पालन करें16 plexity और लायब्रेरीज़ के पूलिंग के बारे में ।नोट: ONDRISeq के लिए, पुस्तकालयों 12 डीएनए नमूनों से बना रहे हैं, दो के सेट में परित, और NGS डेस्कटॉप साधन (सामग्री की मेज) पर चलाते हैं । नमूनों की संख्या जो एक एकल प्रतिक्रिया में चलाया जा सकता है, sequencing किट और उपयोग किए गए प्लेटफ़ॉर्म पर निर्भर करेगा । उच्च गुणवत्ता अनुक्रमण डेटा प्राप्त करने के लिए, लक्ष्य संवर्धन किट15के निर्माता के निर्देश में वर्णित tagmentation, निम्नलिखित डीएनए पुस्तकालय की गुणवत्ता को मान्य करने के लिए वैकल्पिक कदम प्रदर्शन. पुस्तकालय उपज की गुणवत्ता सुनिश्चित करने के लिए तपसिल में प्रत्येक पुस्तकालय का विश्लेषण । यदि पुस्तकालयों पूलिंग, fluorometer14के साथ डीएनए एकाग्रता को मापने, निर्माता के निर्देशों के अनुसार । लक्ष्य संवर्धन किट द्वारा अनुशंसित equimolar अनुपात प्राप्त करने के लिए पूल करने के लिए प्रत्येक डीएनए पुस्तकालय की मात्रा निर्धारित करने के लिए इस एकाग्रता का उपयोग किया जा रहा है । 3. अगली पीढ़ी के अनुक्रमण अनुक्रम NGS डेस्कटॉप उपकरण के एजेंट किट निर्माता के निर्देश के अनुसार17,18 (सामग्री की मेज) । निर्माता के निर्देश के अनुसार एक नमूना शीट तैयार करें18 उपयुक्त NGS प्रौद्योगिकी सॉफ्टवेयर (सामग्री की तालिका) का उपयोग कर, जो NGS डेस्कटॉप साधन के कार्यप्रवाह में आयात किया जाएगा.नोट: ONDRISeq के प्रयोजनों के लिए, आवेदन विकल्प चुना ‘ अन्य ‘ है, केवल FASTQ फ़ाइलों का अनुरोध के साथ (चित्रा 1). क्रमिक चरणों इन FASTQ फ़ाइलें, संरेखण और गुणवत्ता पैरामीटर्स का पूर्ण अनुकूलन के लिए अनुमति देने के लिए प्रक्रिया करेगा । लक्षित अनुक्रमण चुना जाता है, तो हालांकि, कुछ NGS उपकरण स्वयं VCF फ़ाइलों में sequencing डेटा को संसाधित करने में सक्षम हैं । निर्माता के निर्देश18 विकल्पों में से एक पूर्ण चयन के लिए परामर्श किया जा सकता है । एक क्लाउड-आधारित कंप्यूटिंग वातावरण19 (सामग्री तालिका) का उपयोग करते हैं, तो sequencing चलाएँ सेट करते समय में लॉग ऑन करें । NGS डेस्कटॉप इंस्ट्रूमेंट मुख पृष्ठ पर “अनुक्रमण” क्लिक करने के बाद ऐसा करें । निंनलिखित पुस्तकालय विकार18 निर्माता के निर्देश के अनुसार, fluorometer14के साथ डीएनए पुस्तकालय एकाग्रता को मापने । एक उपयुक्त स्वचालित ट्रो प्रणाली और डीएनए गुणवत्ता विश्लेषण किट20 (सामग्री की तालिका), निर्माता के निर्देशों के अनुसार का उपयोग करके डीएनए लाइब्रेरी की गुणवत्ता को मान्य करें । एनजी/µ एल से एनएम के लिए डीएनए एकाग्रता में परिवर्तित करने के लिए, निम्नलिखित सूत्र का उपयोग करें16नोट: औसत लायब्रेरी आकार लक्ष्य संवर्धन किट का उपयोग किया जा रहा करने के लिए विशिष्ट हो जाएगा, और चरण 3.1.4 में स्वीकार्य ट्रो ट्रेस से प्राप्त किया जा सकता है । sequencing लाइब्रेरी 6 – 20 pM, उपयुक्त के रूप में, और 600 μL की वॉल्यूम के अंतिम एकाग्रता के लिए निर्माता के निर्देशों के अनुसार21को पतला करें ।नोट: सटीक एकाग्रता की जरूरत sequencing इस्तेमाल किया किट पर निर्भर है । उचित लोडिंग एकाग्रता निर्धारित करने के लिए संवर्धन किट निर्माता से परामर्श करें । , स्वभाव को पतला, और निर्माता के निर्देशों के अनुसार एक सकारात्मक नियंत्रण sequencing पुस्तकालय21शामिल हैं । हर sequencing चलाने का एक लॉग रखें, जो डीएनए लाइब्रेरी एकाग्रता भरी हुई (पीएम), सकारात्मक नियंत्रण का प्रतिशत शामिल जोड़ा गया, एजेंट कारतूस बारकोड, चरण 3.1.1 में चुना आवेदन, सूचकांक की संख्या पढ़ता है, संवर्धन किट का इस्तेमाल किया, पढ़ें लंबाई (ओं), और नमूना पत्रक का नाम ।नोट: NGS डेस्कटॉप साधन के चलाने के समय साधन, संवर्धन किट पर निर्भर करेगा, और (4 – 56 एच इस प्रयोग22में प्रयुक्त sequencer के लिए) चुना लंबाई पढ़ें. sequencing चलाने के पूरा होने पर, NGS डेस्कटॉप इंस्ट्रूमेंट मुख पृष्ठ पर नेविगेट और “फ़ाइलें प्रबंधित करें” क्लिक करके सभी outputs शामिल है जो “भागो फ़ोल्डर”, का उपयोग. बाद में प्रवेश के लिए एक स्थानीय ड्राइव पर फ़ाइलों को ले जाएं । एक अलग विकल्प के लिए, कंप्यूटर पर, नेविगेशन पैनल पर “रन” का चयन करके क्लाउड-आधारित कंप्यूटिंग वातावरण19 में फ़ाइलों को ढूंढें । चलाएँ सारांश पृष्ठ पर नेविगेट करने के लिए उपयुक्त sequencing चलाएँ का चयन करें । क्लाउड से डेटा प्राप्त करने के लिए “डाउनलोड करें” चुनें. प्रकट होने वाले संवाद बॉक्स से, डाउनलोड करने के लिए फ़ाइल प्रकार के रूप में FASTQ फ़ाइलें चुनें और “डाउनलोड” पर क्लिक करें । क्लाउड-आधारित कंप्यूटिंग वातावरण19,23के रन सारांश पृष्ठ से, कंप्यूटिंग वातावरण द्वारा उत्पादित विभिन्न आंकड़ों के साथ अनुक्रमण चलाने की गुणवत्ता का विश्लेषण करने के लिए “चार्ट” करने के लिए नेविगेट । उत्पादित प्रत्येक आंकड़े के बारे में विवरण के लिए निर्माता के निर्देश23 देखें । भागो चार्ट पृष्ठ से, “चक्र द्वारा डेटा” लेबल आंकड़ा खोजें । चार्ट के अंतर्गत, “तीव्रता” का चयन करें और चैनल के अंतर्गत “सभी चैनल” चुनें. यह संकेत तीव्रता भूखंड का उत्पादन किया है कि एक ही संवर्धन किट और NGS डेस्कटॉप साधन के साथ अतीत में प्रदर्शन अनुक्रमण रन द्वारा उत्पादित करने के लिए समान है सुनिश्चित करें ।नोट: यह सभी 150 चक्रों भर में प्रत्येक आधार द्वारा दिखाया तीव्रता का प्रतिशत को दर्शाता है. आंकड़ा व्यापक रूप से संवर्धन किट का इस्तेमाल किया, यही वजह है कि यह एक ही पैनल के पिछले sequencing रन की तुलना में किया जाना चाहिए पर निर्भर करता है भिन्न हो सकते हैं । अनुक्रमण गुणवत्ता नियंत्रण (QC) हिस्टोग्राम, जो पृष्ठ के दाईं ओर है खोजने के लिए चलाएं नेविगेशन पैनल के भीतर “अनुक्रमण QC” टैब का चयन करें । सुनिश्चित करें कि एक अपेक्षाकृत समान वितरण% पढ़ता की पहचान (पीएफ) सभी नमूनों में मनाया जाता है ।नोट: यदि किसी भी नमूने एक बहुत कम% है पहचाने गए (पीएफ) के बाकी नमूनों से, ध्यान दें कि sequencing डेटा की गुणवत्ता प्रभावित हो सकता है । क्लाउड-आधारित कंप्यूटिंग परिवेश का सारांश पृष्ठ चलाएँ से, चलाएँ नेविगेशन पैनल के भीतर “मीट्रिक” पर क्लिक करके गुणवत्ता मीट्रिक पर नेविगेट करें.नोट: मीट्रिक कट-नापसंद अनुक्रमण मंच पर निर्भर करेगा और उपयोग किया जा रहा संवर्धन किट. वहां कई मैट्रिक्स है कि निर्माता के निर्देश के आधार पर उपयोग किया जा सकता है23, निंन चरणों के साथ तीन कि उच्च गुणवत्ता नियंत्रण के लिए सिफारिश कर रहे है पर प्रकाश डाला । के तहत “घनत्व (K/mm2)” क्लस्टर घनत्व सुनिश्चित करने के लिए संवर्धन किट द्वारा अनुशंसित सीमा के भीतर है (इस मामले में 1200-1400 k/2) । के अंतर्गत कुल “% ≥ Q30” सुनिश्चित करें कि मान ≥ 85% है, sequencing की गुणवत्ता को प्रतिबिंबित करता है पढ़ता है ।नोट: यदि 85% की इस सीमा से कम, sequencing की गुणवत्ता compromised किया जा सकता है कि ध्यान दें । “संरेखित (%)” के अंतर्गत सुनिश्चित करें कि मान sequencing रन में शामिल किया गया था जो धनात्मक नियंत्रण के% के समान है ।नोट: यह सकारात्मक नियंत्रण के एक उपाय के रूप में कार्य करता है, ऐसी है कि केवल कुल पढ़ता के इस प्रतिशत के लिए सकारात्मक नियंत्रण जीनोम को संरेखित पाया गया । यदि 1% सकारात्मक नियंत्रण का इस्तेमाल किया गया था यह उंमीद की जाएगी कि गठबंधन (%) ~ 1-5% होगा । चित्रा 1: NGS प्रौद्योगिकी सॉफ्टवेयर (सामग्री की तालिका) नमूना शीट निर्माता आवेदन विकल्प के स्क्रीनशॉट. ONDRISeq के प्रयोजनों के लिए, FASTQ केवल अनुप्रयोग का उपयोग किया जाता है । हालांकि, यदि उपयोगकर्ता अंय फ़ाइलों का उत्पादन, जैसे VCF फ़ाइलें चाहते हैं, तो यह अनुशंसित है कि लक्षित अनुक्रमण श्रेणी के भीतर किसी अनुप्रयोग का उपयोग किया जाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए । 4. अनुक्रमण और संस्करण कॉलिंग डेटा पूर्व प्रसंस्करण के लिए, कच्चे FASTQ फ़ाइलों को मानव संदर्भ जीनोम में संरेखित करने के लिए और वेरिएंट (सामग्री की तालिका) को कॉल करने के लिए उपयुक्त सॉफ़्टवेयर का चयन करें । आयात FASTQ अनुक्रमण डेटा पूर्व प्रसंस्करण सॉफ्टवेयर में पढ़ता है ।नोट: ONDRISeq के प्रयोजनों के लिए, 48 FASTQ 24 नमूनों की एक एकल अनुक्रमण चलाने से उत्पादित फ़ाइलों को आयात और सॉफ्टवेयर के माध्यम से संसाधित कर रहे हैं । एक बार में संसाधित नमूनों की संख्या शोधकर्ता और NGS पैनल के आकार की जरूरतों के आधार पर भिन्न हो सकते हैं । “नेविगेशन क्षेत्र” के भीतर, ठीक क्लिक करें और चुनें “नया फ़ोल्डर” । ऐसी है कि प्रदर्शन किया गया था sequencing चलाने के लिए के रूप में स्पष्टता है कि फ़ोल्डर नाम है । शीर्ष पर टूलबार से, “आयात करें” चुनें । अनुक्रमणित प्लेटफार्मों की ड्रॉपडाउन सूची से जो अनुक्रमण किया गया था मंच चुना है ।नोट: ONDRISeq के प्रयोजनों के लिए, “Illumina” चुना जाता है । हालांकि, यदि किसी भिंन sequencing प्लेटफ़ॉर्म का उपयोग करते हुए FASTQ चरण24आयात करने के शेष के लिए निर्माता के निर्देशों से परामर्श करें । संवाद बॉक्स में, नेविगेट करें और संसाधित किया जा रहा है जो sequencing रन से FASTQ फ़ाइलों का चयन करें । सुनिश्चित करें कि आयात की जा रही फ़ाइलें में संग्रहीत और स्थानीय ड्राइव से आयात किए जाते हैं, यदि एक से अधिक सर्वरों वाले कंप्यूटर का उपयोग कर । संवाद बॉक्स के “सामांय विकल्प” से, “युग्मित पढ़ता” के पास बॉक्स को क्लिक करें यदि sequencing युग्मित अंत chemistries उपयोग किया जाता है ।नोट: इस मामले में, एक आगे और एक रिवर्स प्रत्येक नमूना के लिए आयात दो FASTQ नमूने भी होना चाहिए. संवाद बॉक्स की युग्मित पठन जानकारी से, फ़ाइल सूची में उल्टे पढ़ने से पहले आगे पढ़ें FASTQ फ़ाइल प्रकट होता है, तो “युग्मित-अंत (अग्रेषित करें-रिवर्स)” का चयन करें । यदि फ़ाइलें विपरीत क्रम में दिखाई देती हैं, तो “मेट-युग्म (रिवर्स-फॉरवर्ड)” का चयन करें । सेट करने के लिए 1 और अधिकतम दूरी के लिए जोड़ा गया पढ़ें ंयूनतम दूरी 1000, नमूना अनुक्रम के भीतर छोटे पैमाने पर संरचनात्मक पुनर्व्यवस्थाओं का पता लगाने के लिए अनुमति देने के लिए । से “Illumina विकल्प” संवाद बॉक्स में, का चयन करें “निकालें विफल पढ़ता”, पढ़ता अनुक्रमण विफल रहा निकालने के लिए । यदि NGS डेस्कटॉप इंस्ट्रूमेंट de-division FASTQ फ़ाइलों को निर्यात करने से पहले डेटा “MiSeq de-division” बॉक्स का चयन न करें । “गुणवत्ता स्कोर” ड्रॉपडाउन सूची से, sequencing के लिए उपयोग किया गया था NGS पाइपलाइन का चयन करें । संवाद बॉक्स के नीचे “अगला” चुनें.नोट: उपयोग पाइपलाइन FASTQ फ़ाइल गुणवत्ता स्कोर का स्वरूप को प्रभावित करेगा । कौन सी पाइपलाइन का चयन करने के बारे में अधिक जानकारी के लिए, निर्माता के निर्देश24देखें । नया संवाद बॉक्स से, “सहेजें” का चयन करें और “प्रत्येक नमूना FASTQ फ़ाइलें अपने व्यक्तिगत फ़ोल्डर में रखने के लिए प्रति स्नान इकाई सबफ़ोल्डर बनाएं । संवाद बॉक्स के नीचे “अगला” चुनें. नया संवाद बॉक्स में, चरण 4.2.1 में बनाया गया था जो फ़ोल्डर का चयन करें । यह वह स्थान है जहां FASTQ फ़ाइलें आयात की जाएंगी । संवाद बॉक्स के निचले भाग पर “समाप्त” चुनें और FASTQ फ़ाइलों के आयात होने तक प्रतीक्षा करें । फ़ाइल आयात की स्थिति देखने के लिए “प्रक्रियाएँ” टैब पर क्लिक करें. निर्माता के निर्देशों के अनुसार, अनुक्रमण और भिन्न कॉलिंग करने के लिए सॉफ़्टवेयर में कार्यप्रवाह डिज़ाइन करें.नोट: यह कार्यप्रवाह शोधकर्ता की आवश्यकताओं के आधार पर भिंन हो सकता है, लेकिन निंन चरणों को ONDRISeq (चित्र 2) के प्रयोजनों के लिए शामिल किया गया है । इस वर्कफ़्लो में दिए गए चरणों को अंय NGS पुनर्अनुक्रमण और भिन्न कॉलिंग सॉफ़्टवेयर के लिए उपयुक्त के रूप में लागू किया जा सकता है । ONDRI के प्रयोजनों के लिए सभी bioinformatics प्रसंस्करण मानव संदर्भ जीनोम GRCH37/hg19 के संदर्भ में किया जाता है, डेटा प्रोसेसिंग और विश्लेषण की निरंतरता के लिए । अनुक्रमण संदर्भ जीनोम के लिए पढ़ता नक्शा । कॉंफ़िगर करते समय, संदर्भ जीनोम को उपयुक्त के रूप में चुनें, यह सुनिश्चित करना कि यह वही संदर्भ जीनोम है जो सभी bioinformatics चरणों के लिए उपयोग किया जाता है । मास्किंग मोड ड्रॉप-डाउन सूची से “कोई मास्किंग” का चयन करें ताकि संदर्भ अनुक्रम का कोई क्षेत्र मास्क किए गए हैं । सॉफ़्टवेयर द्वारा असाइन किए गए डिफ़ॉल्ट मैपिंग विकल्पों का उपयोग करें । इस शोध के प्रयोजनों के आधार पर स्वीकार्य है कि यह सत्यापित करने के लिए निर्माता के निर्देश24 की समीक्षा करें । किसी भी पठन मैपिंग त्रुटियों, विशेष रूप से सम्मिलन-हटाने वाले वेरिएंट को हल करने के लिए मानव संदर्भ जीनोम को वर्कफ़्लो स्थानीय पुनर्संरेखण में शामिल करें. सॉफ़्टवेयर द्वारा असाइन किए गए डिफ़ॉल्ट स्थानीय पुनर्संरेखण विकल्पों का उपयोग करें । इस शोध के प्रयोजनों के आधार पर स्वीकार्य है कि यह सत्यापित करने के लिए निर्माता के निर्देश24 की समीक्षा करें । पीसीआर प्रवर्धन पूर्वाग्रह के प्रभाव को कम करने के लिए NGS प्रोटोकॉल के भीतर पीसीआर द्वारा उत्पादित डुप्लिकेट मैप की गई पुस्तकें निकालें, जो झूठी सकारात्मक25का उत्पादन कर सकते हैं । “अल्पसंख्यक अनुक्रम का अधिकतम प्रतिनिधित्व (%)”, अनुसंधान की जरूरतों के आधार पर सेट करें ।नोट: एक नरम सेटिंग, ONDRISeq के प्रयोजनों के लिए इस्तेमाल के रूप में, 5% है; हालांकि, सॉफ्टवेयर की डिफ़ॉल्ट सेटिंग अधिक कड़े 20% है । जब दो पढ़ता बहुत समान हैं, तो यह सेटिंग निर्धारित करता है कि कम पठन गणना के साथ अनुक्रम पीसीआर प्रवर्धन बायस से एक sequencing त्रुटि माना जाना चाहिए । इसलिए, 5% की स्थापना करके, अल्पसंख्यक पढ़ें गिनती ≤ होना चाहिए बहुमत का 5% पढ़ें गिनती करने के लिए बहुमत के समान हो सही पढ़ें । चरण 4.3.3 में जेनरेट किए गए पठन ट्रैक से कवरेज सारांश पाठ फ़ाइल के रूप में लक्ष्य क्षेत्रों के लिए आँकड़े निर्यात करें. सेटिंग्स में गैर-विशिष्ट मेल और भंग जोड़े पर ध्यान न दें । इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें । एक बाइनरी अनुक्रम संरेखण मैप (BAM) फ़ाइल चरण 4.3.3 में जनरेट किया गया पठन ट्रैक से प्रत्येक नमूने के लिए निर्यात करें । यह क्रम संरेखण डेटा है, यदि भविष्य में विश्लेषण की जरूरत है । इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें । अनुक्रम के भीतर वेरिएंट को कॉल करने के लिए भिन्न डिटेक्शन की एक विधि चुनें ।नोट: जब मांयताओं के नमूनों की ploidy के बारे में किया जा सकता है, यह अनुशंसित है कि एक निश्चित ploidy संस्करण का पता लगाने एल्गोरिथ्म का उपयोग किया जा, के रूप में ONDRISeq के प्रयोजनों के लिए प्रयोग किया जाता है । यदि यह धारणा नहीं बनाई जा सकती, तो शोध के प्रयोजनों के लिए सर्वोत्तम एल्गोरिथम निर्धारित करने के लिए निर्माता के निर्देश24 देखें । निर्धारित ploidy भिन्न पैरामीटर्स विकल्प से कॉन्फ़िगर करते समय, ploidy के रूप में उपयुक्त नमूना जीव के लिए सेट करें । “आवश्यक भिन् न संभाव्यता”, या किसी भिन् न सही रूप से इसे बनाए रखने के लिए क्रम में कॉल किया गया है कि प्रायिकता सेट करें ९०.०% पर । सामान्य फ़िल्टर्स के लिए निम्न अनुशंसित सेटिंग्स का उपयोग करें: “10x की न्यूनतम कवरेज”, “न्यूनतम गणना” 2, “20% की ंयूनतम पढ़ें आवृत्ति”, “टूटी हुई जोड़े की अनदेखी”, पर आधारित विशिष्ट मैचों की अनदेखी “पढ़ता”, और “न्यूनतम पढ़ें लंबाई” 20.नोट: ये पैरामीटर ONDRISeq के प्रयोजनों पर आधारित होते हैं । निर्माता के निर्देशों का संदर्भ लें24 सुनिश्चित करने के लिए वे किया जा रहा अनुसंधान के लिए उपयुक्त हैं । शोर फिल्टर के लिए निम्नलिखित अनुशंसित सेटिंग्स का उपयोग करें: “पड़ोस त्रिज्या” 5 का मानचित्रण गुणवत्ता स्कोर, “न्यूनतम केंद्रीय गुणवत्ता” 20 के मानचित्रण स्कोर, और “न्यूनतम पड़ोस गुणवत्ता” 15 के मानचित्रण स्कोर के साथ “आधार गुणवत्ता फिल्टर”; 5.0% की “पढ़ें दिशा फ़िल्टर”; और 1.0% महत्व के “सापेक्ष पढ़ें दिशा फ़िल्टर” ।नोट: ये पैरामीटर ONDRISeq के प्रयोजनों पर आधारित होते हैं । निर्माता के निर्देशों का संदर्भ लें24 सुनिश्चित करने के लिए वे किया जा रहा अनुसंधान के लिए उपयुक्त हैं । ब्राउज़र एक्सटेंसिबल डेटा (बिस्तर) फ़ाइल द्वारा निर्दिष्ट के रूप में लक्षित पैनल के लक्ष्य क्षेत्रों के साथ उनके ओवरलैप के आधार पर बुलाया गया है कि वेरिएंट फ़िल्टर, केवल जीनोमिक के लिए लक्षित NGS पैनल के लिए चयनित क्षेत्रों के भीतर होने वाले वेरिएंट की अनुमति कायम.नोट: बिस्तर फ़ाइल लक्षित NGS पैनल है कि उपयोग किया जा रहा है, जीनोम है कि पैनल को कवर करने में सक्षम है के क्षेत्रों के आधार पर अद्वितीय होगा । चरण 4.3.7 में निर्मित भिन् न ट्रैक से भिन् न कॉलिंग फ़ॉर्मेट (VCF) फ़ाइल में एक भिन् न रिपोर्ट निर्यात करें. इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें । निर्माता के निर्देशों के अनुसार कार्यप्रवाह सहेजें और स्थापित करें24, इसे सॉफ़्टवेयर के “उपकरण बॉक्स” में उपलब्ध कराने के लिए । सुनिश्चित करें कि यह भविष्य में क्या NGS पैनल के लिए उपयुक्त है में स्पष्ट है कि इस तरह के कार्यप्रवाह का नाम है । स्थापना के दौरान “संदर्भ डेटा निर्यात” विकल्पों के साथ संवाद बॉक्स में, “बंडल” करने के लिए सभी विकल्प सेट करें । संवाद बॉक्स में स्थापना के दौरान “स्थापना स्थान” विकल्प के साथ, क्लिक करें “अपने स्थानीय कंप्यूटर पर वर्कफ़्लो स्थापित” । आयातित FASTQ अनुक्रमण को चलाने के लिए अनुकूलित bioinformatics कार्यप्रवाह के माध्यम से कदम 4.3, निर्माता के निर्देशों के अनुसार24में डिज़ाइन किया गया पढ़ें । सॉफ़्टवेयर के “उपकरण बॉक्स” में चरण 4.3 में डिज़ाइन किए गए कार्यप्रवाह को पहचानें और उसे डबल-क्लिक करें । संवाद बॉक्स प्रकट होता है, के भीतर “नेविगेशन क्षेत्र” के भीतर चरण 4.2 में आयात किए गए FASTQ फ़ाइलों के फ़ोल्डरों की स्थिति जानें । “नेविगेशन क्षेत्र” के भीतर का चयन करके सभी फ़ोल्डरों को हाइलाइट करें और फिर “बैच” के पास वाले बॉक्स पर क्लिक करे । फ़ाइलों को “चयनित तत्वों” पर ले जाने के लिए दाएं-फ़ेसिंग तीर का उपयोग करें । संवाद बॉक्स के निचले भाग पर “अगला” क्लिक करें । संवाद बॉक्स के भीतर, सही FASTQ फ़ाइलों का चयन किया गया था सुनिश्चित करने के लिए “बैच अवलोकन” की समीक्षा करें और उसके बाद “अगला” । चरण 4.3 में वर्कफ़्लो डिज़ाइन करते समय सही फ़ाइलें और निर्यात स्थान सुनिश्चित करने के लिए संवाद बॉक्स में वर्कफ़्लो के निंन चरणों की समीक्षा करें: “मानचित्र संदर्भ में पढ़ता है”; डुप्लिकेट मैप की गई पुस्तकें निकालें “; “लक्ष्य क्षेत्रों के लिए आंकड़े बनाएं”; “निर्यात BAM”; “निर्यात टैब सीमांकित पाठ”; “ओवरलैप पर आधारित फ़िल्टर”; और “निर्यात VCF” संवाद बॉक्स में अंतिम चरण के भीतर-“परिणाम हैंडलिंग”-विकल्प का चयन करें “इनपुट फ़ोल्डर में सहेजें” । संवाद बॉक्स के निचले भाग पर “समाप्त” क्लिक करें ।नोट: इसका मतलब यह है कि प्रत्येक नमूने के लिए उत्पादित फ़ाइलें एक ही फ़ोल्डर है कि डेटा पूर्व प्रसंस्करण सॉफ्टवेयर के भीतर FASTQ फ़ाइल भंडार में रखा जाएगा । चित्रा 2: अनुक्रमण और डेटा पूर्व प्रसंस्करण सॉफ्टवेयर (सामग्री तालिका) ONDRISeq के प्रयोजनों के लिए अनुकूलित के भीतर FASTQ फ़ाइलों के संस्करण कॉलिंग के लिए कार्यप्रवाह । कार्यप्रवाह में दिए गए चरणों को शोधकर्ता की आवश्यकताओं के आधार पर अंय NGS पुनर्अनुक्रमणित और भिन्न कॉलिंग सॉफ़्टवेयर पर लागू किया जा सकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए । 5. संस्करण एनोटेशन प्रत्येक नमूने की VCF फ़ाइल पर भिन् न एनोटेशन का प्रदर्शन करने के लिए व्याख्या भिन्नता (ANNOVAR)26 स्क्रिप्ट डाउनलोड करें और अनुकूलित करे । निंन डेटाबेस को ANNOVAR से डाउनलोड करें एनोटेशन के रूप में शामिल करने के लिए: 1) RefSeq27 (अगस्त 2015 अद्यतन); 2) dbSNP13828 (सितंबर 2014 अद्यतन); 3) Exome एकत्रीकरण कंसोर्टियम29 (ExAC, संस्करण 0.3 नवंबर 2015 अद्यतन); 4) राष्ट्रीय दिल, फेफड़े, और रक्त संस्थान Exome अनुक्रमण परियोजना यूरोपीय पलटन30 (ESP, मार्च 2015 अद्यतन); 5) 1000 जीनोम परियोजना यूरोपीय पलटन31 (1KGP, अगस्त 2015 अद्यतन); 6) ClinVar32 (मार्च 2016 अद्यतन); और 7) संयुक्त एनोटेशन निर्भर कमी33 (CADD), सहिष्णु34 (झारना), और PolyPhen-235से असहिष्णु छंटाई ।नोट: जीनोम निर्देशांक और सभी ANNOVAR द्वारा संदर्भित डेटाबेस मानव जीनोम का निर्माण GRCh37/hg19 के लिए भेजा । इसके अतिरिक्त, डेटाबेस संस्करण सूचीबद्ध ONDRISeq के प्रयोजनों के लिए उपयोग किया जाता है, जब डेटाबेस डाउनलोड करने के लिए सबसे अधिक अद्यतन संस्करण उपलब्ध का उपयोग करें । यदि वांछित, व्याख्या वेरिएंट की पूरी सूची के उत्पादन के लिए ANNOVAR अनुकूलित, साथ ही साथ–फ़िल्टर कार्रवाई26का उपयोग करके व्याख्या वेरिएंट का एक कम संकलन ।नोट: कम सूची शोधकर्ता की जरूरतों के आधार पर अनुकूलित किया जा सकता है । ONDRISeq के प्रयोजनों के लिए, व्याख्या की कम सूची वेरिएंट शामिल नहीं है कि निकटतम एक्सॉन से 15 कुर्सियां या किसी भी वेरिएंट के साथ एक छोटी एलील आवृत्ति (MAF) > 3% में से किसी भी तीन डेटाबेस: 1) ExAC; 2) ESP; आणि ३) 1KGP. यह चरण अत्यधिक अनुशंसित है । यदि वांछित, एक बाहर विशिष्ट एलील कॉल शोधकर्ता26की जरूरतों के आधार पर ANNOVAR को अनुकूलित ।नोट: ONDRISeq के प्रयोजनों के लिए, ANNOVAR APOE जोखिम alleles rs429358 (सी > टी):p. C130R और rs7412 (सी > टी):p. R176C के लिए किए गए sequencing कॉल का आकलन करने के क्रम में उत्पादन के लिए समग्र APOE जीनोटाइप, जिनमें से छह संभव है संयोजन, सहित: 1) e2/ 2) E3/E2; 3) E4/E2; 4) e3/ 5) E4/E3; 6) E4/E4. इनमें से छह संभावित APOE पादी, E4/E4 हाल-शुरुआत अल्जाइमर रोग36के विकास के लिए सबसे अधिक स्वीकार्य आनुवंशिक जोखिम कारक है । क्वेरी रोग उत्परिवर्तन डेटाबेस (सामग्री की तालिका) यदि वेरिएंट पहले रोग के साथ संबद्ध किया गया है, उचित सबूत के साथ निर्धारित करने के लिए । किसी भी वेरिएंट है कि पहले एक उपंयास संस्करण के रूप में रिपोर्ट नहीं किया गया है पर विचार करें । ClinVar से ANNOVAR एनोटेशन का आकलन करें, जैसे कि रोग-संबंधित वेरिएंट में किसी भी तरह के वर्गीकृत होने की संभावना रोगजनक या रोगजनक शामिल है । silico भविष्यवाणी उपकरण के माध्यम से ब्याह-वेरिएंट37 (SPANR) और मानव ब्याह खोजक38 (HSF, संस्करण 3.0) के आधारित विश्लेषण की प्रक्रिया । बड़ी संख्या में नमूने संसाधित कर रहा है, तो विभिन्न नमूनों द्वारा साझा किए गए हैं जो निर्धारित करने के लिए प्रत्येक नमूने के भीतर भिन्न कॉल्स की तुलना करें । यह मैन्युअल रूप से या एक कस्टम डिजाइन स्क्रिप्ट के साथ, संभव अनुक्रमण कलाकृतियों और संदूषण घटनाओं का पता लगाने के लिए अनुमति देता है.नोट: ONDRI के प्रयोजनों के लिए, एक कस्टम स्क्रिप्ट के लिए उंहें एक दूसरे से तुलना करके ANNOVAR उत्पादन फ़ाइलों व्याख्या करने के लिए प्रयोग किया जाता है । स्क्रिप्ट एक एनोटेशन शामिल है, एक ही संस्करण बंदरगाह किसी भी अंय नमूनों की विषय आईडी के साथ, अंयथा अध्ययन पलटन में संस्करण के इतिहास का कार्यकाल । अमेरिकन कॉलेज ऑफ मेडिकल जेनेटिक्स (ACMG) Pathogenicity दिशानिर्देश39के आधार पर वर्गीकृत वेरिएंट, निंन में से एक के रूप में प्रत्येक संस्करण एक वर्गीकरण निर्दिष्ट: 1) रोगजनक; 2) की संभावना रोगजनक; 3) अनिश्चित महत्व के संस्करण; 4) की संभावना सौम्य; या 5) सौम्य ।नोट: ONDRI के प्रयोजनों के लिए, एक घर में डिजाइन पायथन स्क्रिप्ट के लिए एक अर्द्ध स्वचालित आधार पर ACMG वर्गीकरण प्रदर्शन किया जाता है । हालांकि इस अध्ययन के लिए इस्तेमाल नहीं किया, InterVar40 एक समान रूप से डिजाइन उपकरण है कि एक अनुरूप तरीके से उपयोग किया जा सकता है । सैंज अनुक्रम 10% अध्ययन पलटन की पहचान की गई है41.

Representative Results

इस के तहत यहां वर्णित के तरीके 528 भागीदार व्यक्तियों कि ONDRI में दाखिल किया गया है से डीएनए नमूने के लिए आवेदन किया गया । नमूने प्रति रन के 24 नमूनों में से 22 रन में ONDRISeq पैनल पर चलाए गए । कुल मिलाकर, sequencing डेटा 78 ± 13x का एक मतलब नमूना कवरेज के साथ उच्च गुणवत्ता का होना निर्धारित किया गया था और सभी व्यक्तिगत एक मतलब नमूना कवरेज > 30एक्स व्यक्त रन । इसके अलावा, औसत पर, सभी लक्षित क्षेत्रों के 94% कम 20x (तालिका 1) कवर किया गया था । एक माध्य ९५.६% पढ़ता संदर्भ अनुक्रम के लिए मैप किए गए थे और सभी ONDRISeq चलता था > 90% मैप की गई (तालिका 1) । की मैप की गई पढ़ता, ९२.०% था एक Phred स्कोर ≥ Q30, के साथ केवल एक ही रन है < 80% मैप्ड पढ़ता है इस गुणवत्ता मेट्रिक की मीटिंग । हालांकि, इस रन अभी भी 79x के एक मतलब कवरेज प्रदर्शित और लक्ष्य क्षेत्रों के 93% कम से 20x कवर किया गया । पैरामीटर मतलब (± एसडी) सर्वश्रेष्ठ प्रदर्शन खराब प्रदर्शन क्लस्टर घनत्व (x103/mm2) १४२४ (± 269) १३४७ १८३५ कुल पुस्तकें (106) ४३.१ (± 6.0) ४८.७ ४७.४ मैप की गई पुस्तकें (106) ४०.१ (± 6.0) ४७.१ २५.७ मैप की गई पुस्तकें (%) ९५.६ (± 1.3) ९६.८ ९२.६ Phred क्वालिटी स्कोर ≥ Q30 (%) ९२.० (± 6.0) 92 ६८.३ नमूना कवरेज (x) 78 (± 13) ९९ 51 तालिका 1: sequencing गुणवत्ता मैट्रिक्स ONDRISeq पर 22 रन के लिए । केस स्टडी: एक पीडी मरीज में दुर्लभ वेरिएंट की पहचान । हमारे लक्षित NGS कार्यप्रवाह की उपयोगिता को प्रदर्शित करने के लिए, हम एक 68 वर्षीय, पुरुष, पार्किंसंस रोग रोगी का उदाहरण पेश करते हैं । डीएनए नमूना 23 अन्य ONDRI नमूनों के साथ ONDRISeq पैनल का उपयोग कर NGS डेस्कटॉप साधन (सामग्री की मेज) पर चलाया गया था. भागो १,५५५ x 103/mm2के एक क्लस्टर घनत्व प्रदर्शित किया । रोगी के विशेष नमूने 76x का मतलब कवरेज प्रदर्शित, लक्ष्य क्षेत्रों के ९३.९% के साथ कम से कवर 20x । कस्टम bioinformatics कार्यप्रवाह के साथ भिन् न कॉलिंग और एनोटेशन निष्पादित करने के बाद, रोगी को exons और आसपास के 250 ONDRISeq पैनल पर शामिल 80 जीन की बीपी के भीतर बंदरगाह के लिए पाया गया था । हालांकि, ANNOVAR पाइपलाइन संस्करण अनुक्रम आंटलजी और MAF, जैसा कि ऊपर वर्णित पर विचार करके वेरिएंट की संख्या को कम करने में सक्षम था । यह सात वेरिएंट कि मैनुअल उपचारात्मक (चित्रा 3) से गुजरा की एक सूची का उत्पादन किया । इन सात वेरिएंट से, दो संभावित नैदानिक महत्व होने के रूप में पहचान की गई । इस प्रक्रिया को ONDRI की जरूरतों के लिए विशिष्ट है और उन है कि अपेक्षाकृत आम आबादी में दुर्लभ है और आंटलजी में इस तरह के प्रोटीन में परिवर्तन पैदा कर रहे है की पहचान के द्वारा किया गया । क्या संस्करण पहले रोग के साथ संबद्ध किया गया था, प्रोटीन के लिए deleteriousness के silico भविष्यवाणियों में और वेरिएंट के ACMG pathogenicity वर्गीकरण भी इस प्रक्रिया में उपयोग किया गया । कम सूची से पहले की पहचान एक heterozygous संस्करण, अर्थात् LRRK2: c. T3939A, बकवास संस्करण पी C1313 * में जिसके परिणामस्वरूप था । LRRK2 encodes प्रोटीन Leucine-रिच दोहराने कळेनासे 2, जो दोनों GTPase और कळेनासे गतिविधि42के पास । इसके अलावा, इस जीन के भीतर उत्परिवर्तनों को पारिवारिक पार्किंसंस रोग43के प्रमुख कारणों के बीच में जाना जाता है । इस संस्करण के भीतर एक समयपूर्व बंद codon परिचय LRRK2, जिससे एमिनो एसिड अवशेषों 1314-2527 खोने । यह जटिल प्रोटीन (Roc), Roc के सी-टर्मिनल (ï) के प्रोटीन रास के अनुवाद को रोकता है, और प्रोटीन कळेनासे डोमेन, जो एक असामान्य Rho GTPase, GTP बाइंडिंग प्रोटीन, और प्रोटीन कळेनासे के रूप में कार्य करने में शामिल हैं, क्रमशः, और भविष्यवाणी की गई थी CADD (CADD Phred = ३६) द्वारा उत्पन्न silico विश्लेषण द्वारा में हानिकारक होना. इस संस्करण भी ExAC और ESP, क्रमशः में ०.००४% और 0.01% की एक MAF के साथ दुर्लभ है, और 1000G डेटाबेस से अनुपस्थित है । इसके अतिरिक्त, यह सभी 528 के बाहर ही रोगी है अनुक्रम जो इस संस्करण है, जो उपंयास है, क्योंकि यह पहले रोग उत्परिवर्तन डेटाबेस में वर्णित नहीं किया गया है (सामग्री की मेज) वहन करती है । वैरिएंट कॉल के भरोसे 109x की अपनी गहरी कवरेज से पुष्टि हुई । अंत में, संस्करण AMCG मानकों और pathogenicity के लिए दिशा निर्देशों के साथ मूल्यांकन किया गया था और रोगजनक होने के रूप में वर्गीकृत किया गया । रोगी भी एक दूसरे heterozygous संस्करण, NR4A2: c. C755A, में परिणाम किया जाता है, जो अर्थ परिवर्तन पी P252Q । प्रोटीन द्वारा इनकोडिंग NR4A2, परमाणु रिसेप्टर उपपरिवार 4 समूह के एक सदस्य 2, एक प्रतिलेखन कारक इस जीन के भीतर dopaminergic न्यूरॉन्स44 और उत्परिवर्तनों की पीढ़ी में शामिल किया गया है पहले से जुड़े हुए है पार्किंसंस रोग४५. गैर ध्रुवीय glutamine को ध्रुवीय पंक्ति के प्रतिस्थापन CADD द्वारा उत्पंन silico भविष्यवाणी विश्लेषण में द्वारा हानिकारक होने की भविष्यवाणी की थी (CADD Phred = २१.१), लेकिन नहीं झारना या PolyPhen द्वारा उत्पंन विश्लेषण द्वारा-2 । संस्करण दुर्लभ है, ExAC और ESP और 1000G दोनों से अनुपस्थिति में ०.००४% की एक MAF के साथ । संस्करण भी एक ONDRI संवहनी संज्ञानात्मक हानि के साथ का निदान भागीदार में पहचान की थी, लेकिन पहले रोग उत्परिवर्तन डेटाबेस में वर्णित नहीं किया गया है । इस संस्करण केवल 18x की कवरेज था, तथापि, इस क्रम में अपनी वैधता सुनिश्चित करने के लिए सैंज अनुक्रमण किया जाएगा । अंत में, संस्करण अनिश्चित महत्व का होना निर्धारित किया गया था जब ACMG मानकों और pathogenicity के लिए दिशानिर्देश के साथ मूल्यांकन किया । ONDRISeq पैनल और bioinformatics पाइपलाइन भी प्रत्येक नमूने के APOE जीनोटाइप को निर्धारित करने में सक्षम है । इस रोगी के लिए निर्धारित किया गया था APOE जीनोटाइप e3/ चित्रा 3: ANNOVAR से एक कम उत्पादन का उदाहरण मैन्युअल रूप से प्रदर्शित उपचारात्मक, व्याख्या वेरिएंट. एक 68 साल पुराने, पुरुष, पार्किंसंस रोग के साथ रोगी के मामले अध्ययन से कम ANNOVAR उत्पादन । व्याख्या वेरिएंट उन है कि सबसे नैदानिक महत्व के होने की संभावना है की पहचान करने के लिए, लाल बक्से द्वारा चिह्नित के रूप में उपपादरी हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Discussion

डीएनए नमूना निष्कर्षण से पथ में ब्याज की है कि जब एक रोगी के निदान, रोग प्रगति, और संभव उपचार के विकल्प पर विचार कर सकते हैं की पहचान करने के लिए, यह महत्वपूर्ण है की विविध प्रकृति की पहचान करने के लिए आवश्यक कार्यप्रणाली दोनों अनुक्रमण और उचित डेटा प्रोसेसिंग के लिए । यहां वर्णित प्रोटोकॉल लक्षित NGS और बाद में संभावित नैदानिक महत्व के दुर्लभ वेरिएंट की पहचान करने के लिए आवश्यक bioinformatic विश्लेषण के उपयोग का एक उदाहरण है । विशेष रूप से, हम ONDRI जीनोमिक्स उपसमूह द्वारा उठाए गए दृष्टिकोण जब ONDRISeq कस्टम डिजाइन NGS पैनल का उपयोग कर प्रस्तुत करते हैं ।

यह मान्यता है कि इन तरीकों एक विशिष्ट NGS मंच के आधार पर विकसित किया गया है और वहाँ अन्य अनुक्रमण प्लेटफार्मों और लक्ष्य संवर्धन किट है कि इस्तेमाल किया जा सकता है । हालांकि, NGS मंच और डेस्कटॉप साधन (सामग्री की तालिका) अपने प्रारंभिक अमेरिकी खाद्य और औषधि प्रशासन (एफडीए) अनुमोदन के आधार पर चुना गया था⁴⁶। यह प्राधिकरण NGS प्रोटोकॉल की पसंद के साथ किया जा सकता जो उच्च-गुणवत्ता sequencing और अनुक्रमण पर रखा जा सकता जो विश्वसनीयता को प्रतिबिंबित करता है पढ़ता है ।

हालांकि कवरेज की गहराई के साथ सटीक अनुक्रमण पढ़ता प्राप्त करना बहुत महत्वपूर्ण है, अंतिम दुर्लभ संस्करण विश्लेषण के लिए आवश्यक bioinformatics प्रसंस्करण महत्वपूर्ण है और अभिकलनी गहन किया जा सकता है । sequencing प्रक्रिया में उत्पन्न हो सकने वाली त्रुटियों के कई स्रोतों के कारण, एक मज़बूत bioinformatics पाइपलाइन पेश किया जा सकता जो विभिन्न अशुद्धियों के लिए सही होना चाहिए । वे मानचित्रण की प्रक्रिया में, प्रवर्धन पूर्वाग्रह पुस्तकालय की तैयारी में पीसीआर प्रवर्धन द्वारा शुरू की, और प्रौद्योगिकी sequencing कलाकृतियों का उत्पादन⁴⁷में से उत्पंन हो सकता है । कोई फर्क नहीं पड़ता पढ़ने मैपिंग और भिन्न कॉलिंग करने के लिए उपयोग किया गया सॉफ़्टवेयर, स्थानीय पुनर्संरेखण, डुप्लिकेट मैप की गई पढ़ता को निकालने, और भिन्न रूप से कॉल करते समय गुणवत्ता नियंत्रण के लिए उचित पैरामीटर सेट करने सहित इन त्रुटियों को कम करने के लिए सामान्य तरीके हैं । इसके अतिरिक्त, भिन्नता कॉलिंग के दौरान चुने गए पैरामीटर्स के आधार पर अध्ययन के लिए सबसे उपयुक्त क्या है हाथ¹¹भिन्न हो सकते हैं । न्यूनतम कवरेज और एक संस्करण और आसपास के न्यूक्लियोटाइड कि यहां लागू किया गया के गुणवत्ता स्कोर के रूप में उपयुक्त विशिष्टता और संवेदनशीलता के बीच एक संतुलन बनाने के लिए चुना गया । इन मापदंडों ONDRISeq पैनल के लिए मान्य किया गया है के आधार पर तीन अलग आनुवंशिक तकनीक के साथ सामंजस्य कॉलिंग, के रूप में पहले वर्णित, सहित: 1) चिप आधारित genotyping; 2) allelic भेदभाव परख; और 3)⁹सैंज अनुक्रमण ।

सही संस्करण बुला निंनलिखित, क्रम में संभावित नैदानिक महत्व, एनोटेशन और उपचारात्मक के उन निर्धारित करने के लिए आवश्यक हैं । अपनी खुली पहुंच मंच के कारण, ANNOVAR दोनों एनोटेशन और प्रारंभिक संस्करण स्क्रीनिंग या उंमूलन के लिए एक उत्कृष्ट उपकरण है । के अलावा आसानी से सुलभ जा रहा है, ANNOVAR किसी भी VCF फ़ाइल के लिए लागू किया जा सकता है, कोई बात नहीं क्या अनुक्रमण मंच प्रयोग किया जाता है, और शोध²⁶की जरूरतों के आधार पर अनुकूलन योग्य है ।

एनोटेशन के बाद, वेरिएंट यदि वे नैदानिक महत्व के होना करने के लिए विचार किया जाना चाहिए यह निर्धारित करने के लिए व्याख्या की जानी चाहिए । न केवल यह प्रक्रिया जटिल हो जाता है, लेकिन यह अक्सर मनोवाद और मानव त्रुटि के लिए प्रवण है । इस कारण से, ACMG किसी भी संस्करण के pathogenicity के लिए सबूत का आकलन करने के लिए दिशानिर्देश निर्धारित किया है । हम एक गैर पर्याय, दुर्लभ संस्करण आधारित मैनुअल उपचारात्मक दृष्टिकोण है, जो इन दिशानिर्देशों के आधार पर निर्माण किया है और व्यक्तिगत रूप से प्रत्येक संस्करण है कि एक कस्टम डिजाइन अजगर स्क्रिप्ट के साथ पाइप लाइन के माध्यम से पारित करने में सक्षम है आकलन द्वारा सुरक्षा लागू है कि दिशानिर्देशों के आधार पर वेरिएंट को वर्गीकरण । इस तरह, प्रत्येक संस्करण रोगजनक की एक रैंकिंग, संभावना रोगजनक, अनिश्चित महत्व, की संभावना सौम्य, या सौम्य सौंपा है, और हम संस्करण उपचारात्मक प्रक्रिया के लिए मानकीकरण और पारदर्शिता जोड़ने में सक्षम हैं । यह पहचान करने के लिए महत्वपूर्ण है कि संस्करण उपचारात्मक के विशेष, bioinformatics पाइपलाइन से परे, अनुसंधान की जरूरतों के आधार पर व्यक्तिगत रूप से किया जाएगा, और इसलिए प्रस्तुत तरीके के दायरे से परे था ।

हालांकि यहां प्रस्तुत तरीके ONDRI के लिए विशिष्ट हैं, जब ब्याज की संवैधानिक रोगों की एक बड़ी संख्या पर विचार अनुवाद किया जा सकता है वर्णित कदम । कई phenotypes के लिए जीन संघों की संख्या में वृद्धि के रूप में, लक्षित NGS एक दृष्टिकोण है कि पिछले अनुसंधान कि क्षेत्र में किया गया है पर कैपिटल कर सकते है प्रेरित परिकल्पना के लिए अनुमति देता है । फिर भी, वहां लक्षित NGS और पद्धति प्रस्तुत करने की सीमाएं हैं । केवल जीनोम के विशिष्ट क्षेत्रों पर ध्यान केंद्रित करके, खोज के क्षेत्रों में रुचि के उपंयास alleles तक ही सीमित हैं । इसलिए, उपंयास जीन या अंय जीनोमिक loci अनुक्रमण लक्ष्य है, जो WGS या वेस दृष्टिकोण के साथ पता चला सकता है, की पहचान नहीं की जा सकती द्वारा कवर से परे । वहां भी जीनोम के भीतर क्षेत्र है कि NGS दृष्टिकोण के साथ सही अनुक्रम के लिए मुश्किल हो सकता है, दोहराया दृश्यों का एक उच्च डिग्री के साथ उन सहित⁴⁸ या उन है कि जीसी सामग्री में अमीर है⁴⁹। सौभाग्य से, जब लक्षित NGS का उपयोग, वहां एक प्राथमिकताओं जीनोमिक क्षेत्रों के साथ अपनेपन का एक उच्च डिग्री है अनुक्रम, और क्या इन तकनीकी चुनौतियों का सामना हो सकता है । अंत में, वर्तमान में NGS डेटा से प्रतिलिपि संख्या वेरिएंट का पता लगाने के मानकीकृत⁵⁰नहीं है । हालांकि, इन चिंताओं के bioinformatics समाधान क्षितिज पर हो सकता है; नए अभिकलनी उपकरण ONDRI रोगियों में भिन्नता के इन अतिरिक्त रूपों का विश्लेषण करने में मदद कर सकते हैं.

अपनी सीमाओं के बावजूद, लक्षित NGS उच्च गुणवत्ता वाले डेटा प्राप्त करने में सक्षम है, एक परिकल्पना के भीतर संचालित दृष्टिकोण है, जबकि शेष अपने WGS और वेस समकक्षों की तुलना में कम खर्चीला । न केवल इस पद्धति कुशल और निर्देशित अनुसंधान के लिए उपयुक्त है, लक्षित NGS के नैदानिक कार्यांवयन तेजी से बढ़ रहा है । इस तकनीक में विभिन्ना रोगों के आणविक मार्ग के संबंध में कई तरह के सवालों के जवाब दिए जा रहे हैं. यह भी अपेक्षाकृत कम लागत पर एक सटीक नैदानिक उपकरण में विकसित किया जा रहा है जब वेस और WGS का विरोध किया । यहां तक कि जब सोने की तुलना में मानक सैंज अनुक्रमण, लक्षित NGS अपने समय में प्रतिस्पर्धा कर सकते है और लागत कुशलता । इन कारणों के लिए, यह एक वैज्ञानिक या चिकित्सक जो प्राप्त करता है और NGS डेटा का उपयोग करता है के लिए महत्वपूर्ण है, उदाहरण के लिए, एक प्रयोगशाला या नैदानिक रिपोर्ट में पाठ के रूप में दिया, को समझने के लिए जटिल “ब्लैक बॉक्स” कि परिणाम पर निर्भर । यहां प्रस्तुत तरीकों में मदद करनी चाहिए उपयोगकर्ताओं को NGS डेटा की पीढ़ी और व्याख्या अंतर्निहित प्रक्रिया को समझते हैं ।

Disclosures

The authors have nothing to disclose.

Acknowledgements

हम अपने अध्ययन के साथ उनकी सहमति और सहयोग के लिए सभी ONDRI प्रतिभागियों का शुक्रिया अदा करना चाहेंगे । ONDRI जांचकर्ताओं के लिए धंयवाद (www । ONDRI.ca/people), हमारे नेतृत्व जांचकर्ता (MJS), और ONDRI शासी समितियों सहित: कार्यकारी समिति, संचालन समिति, प्रकाशन समिति, भर्ती समिति, मूल्यांकन प्लेटफार्मों, और परियोजना प्रबंधन टीम । हम उनकी तकनीकी विशेषज्ञता के लिए लंदन के रीजनल जीनोमिक्स सेंटर का भी शुक्रिया अदा करते हैं । AAD लंदन और मिडिलसेक्स परास्नातक स्नातक अनुसंधान छात्रवृत्ति के अल्जाइमर सोसायटी द्वारा समर्थित है । SMKF ALS कनाडा टिम ई. Noël Postdoctoral फैलोशिप द्वारा समर्थित है ।

Materials

4 ml EDTA K2 tubes	Fisher Scientific	02-689-4
1 M Tris Buffer	Bio Basic Canada Inc.	SD8141
Gentra Puregene Blood Kit	Qiagen	158389	1000 mL Kit. This is the blood extraction kit, referred to in step 1.3.
NanoDrop-1000 Spectrophotometer	Thermo Fisher Scientific	ND-2000	Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2.
Qubit 2.0 fluorometer	Invitrogen	Q32866	This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3.
Nextera Rapid Custom Capture Enrichment Kit	Illumina, Inc.	FC-140-1009	Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion.
2100 BioAnalyzer	Agilent Technologies	G2939BA	This is a automated electrophoresis system, referred to in step 3.1.4.
High Sensitivity DNA Reagent Kit	Agilent Technologies	5067-4626	110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4.
MiSeq Reagent Kit v3	Illumina, Inc.	MS-102-3003	600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1.
MiSeq Personal Genome Sequencer	Illumina, Inc.	SY-410-1003	This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion.
Experiment Manager	Illumina, Inc.		This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html
BaseSpace	Illumina, Inc.	SW-410-1000	This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/
CLC Genomics Workbench 10.1.1	Qiagen	832000	Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2.
Annotate Variation			http://annovar.openbioinformatics.org/en/latest/user-guide/download/
RefSeq	National Center for Biotechnology Information		https://www.ncbi.nlm.nih.gov/refseq/
dbSNP138	National Center for Biotechnology Information		https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138
Exome Aggregation Consortium	Broad Institute		http://exac.broadinstitute.org/
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort	University of Washington and the Broad Institute		http://evs.gs.washington.edu/EVS/
ClinVar	National Center for Biotechnology Information		https://www.ncbi.nlm.nih.gov/clinvar/
Combined Annotation Dependent Depletion	University of Washington and Hudson-Alpha Institute for Biotechnology		http://cadd.gs.washington.edu/
Sorting Intolerant from Tolerant	J. Craig Venter Instutite		http://sift.jcvi.org/
PolyPhen-2	Brigham and Women's Hospital, Harvard Medical School		http://genetics.bwh.harvard.edu/pph2/
Human Gene Mutation Database	Qiagen	834050	This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php
Splicing-based Analysis of Variants	Frey lab, University of Toronto		http://tools.genes.toronto.edu/
Human Splicing Finder	Aix Marseille Université		http://www.umd.be/HSF3/HSF.shtml
Other materials
Centrifuge
Disposable transfer pipets

References

Metzker, M. L. Sequencing technologies – the next generation. Nat Rev Genet. 11 (1), 31-46 (2010).
Mardis, E. R. Next-generation DNA sequencing methods. Annu Rev Genomics Hum Genet. 9, 387-402 (2008).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nat Biotechnol. 26 (10), 1135-1145 (2008).
Sanger, F., Nicklen, S., Coulson, A. R. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74 (12), 5463-5467 (1977).
Farhan, S. M. K., Hegele, R. A. Exome Sequencing: New Insights into Lipoprotein Disorders. Current Cardiology Reports. 16 (7), (2014).
Choi, M., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 106 (45), 19096-19101 (2009).
Mardis, E. R. DNA sequencing technologies: 2006-2016. Nat Protoc. 12 (2), 213-218 (2017).
Farhan, S. M., et al. The Ontario Neurodegenerative Disease Research Initiative (ONDRI). Can J Neurol Sci. 44 (2), 196-202 (2017).
Farhan, S. M. K., et al. The ONDRISeq panel: custom-designed next-generation sequencing of genes related to neurodegeneration. NPJ Genom Med. (16032), 1-11 (2016).
El-Metwally, S., Hamza, T., Zakaria, M., Helmy, M. Next-generation sequence assembly: four stages of data processing and computational challenges. PLoS Comput Biol. 9 (12), e1003345 (2013).
Yohe, S., Thyagarajan, B. Review of Clinical Next-Generation Sequencing. Arch Pathol Lab Med. , (2017).
Qiagen. . Gentra Puregene Handbook. , (2014).
NanoDrop Technologies, Inc. . Spectrophotometer V3.5 User’s Manual. , (2007).
Invitrogen by Life Technologies. . Qubit 2.0 Fluorometer User Manual. Vol. Q32866. , (2010).
Illumina, Inc. . Nextera Rapid Capture Enrichment Guide. , (2016).
Illumina, Inc. . Nextera Rapid Capture Enrichment Reference Guide. , (2016).
Rev. B. Illumina, Inc. . MiSeq Reagent Kit v3 Reagent Preparation Guide. , (2013).
Illumina, Inc. . MiSeq System Guide. , (2015).
. BaseSpace Sequence Hub Available from: https://basespace.illumina.com/dashboard (2017)
Rev. B. Agilent Technologies. . Agilent High Sensitivity DNA Kit Guide. , (2013).
Illumina, Inc. . MiSeq System Denature and Dilute Libraries Guide. , (2016).
Illumina, Inc. . System Specification Sheet: MiSeq System. , (2016).
. BaseSpace Sequence Hub Help Center Available from: https://help.basespace.illumina.com/ (2017)
Qiagen. . Genomics Workbench 10.1.1 User Manual. , (2017).
Ebbert, M. T., et al. Evaluating the necessity of PCR duplicate removal from next-generation sequencing data and a comparison of approaches. BMC Bioinformatics. 17, 239 (2016).
Wang, K., Li, M., Hakonarson, H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res. 38 (16), e164 (2010).
Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 44 (D1), D733-D745 (2016).
Kitts, A., Phan, L., Ward, M., Bradley Holmes, J. . The Database of Short Genetic Variation (dbSNP). , (2013).
Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
Auton, A., et al. A global reference for human genetic variation. Nature. 526 (7571), 68-74 (2015).
Landrum, M. J., et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44 (D1), D862-D868 (2016).
Kircher, M., et al. A general framework for estimating the relative pathogenicity of human genetic variants. Nat Genet. 46 (3), 310-315 (2014).
Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Protoc. 4 (7), 1073-1081 (2009).
Adzhubei, I. A., et al. A method and server for predicting damaging missense mutations. Nat Methods. 7 (4), 248-249 (2010).
Bertram, L., McQueen, M. B., Mullin, K., Blacker, D., Tanzi, R. E. Systematic meta-analyses of Alzheimer disease genetic association studies: the AlzGene database. Nat Genet. 39 (1), 17-23 (2007).
Xiong, H. Y., et al. The human splicing code reveals new insights into the genetic determinants of disease. Science. 347 (6218), (2015).
Desmet, F. O., et al. Human Splicing Finder: an online bioinformatics tool to predict splicing signals. Nucleic Acids Res. 37 (9), e67 (2009).
Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 17 (5), 405-424 (2015).
Li, Q., Wang, K. InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Am J Hum Genet. 100 (2), 267-280 (2017).
Yang, Z. L., Sun, G. L. High-frequency, low-coverage "false positives" mutations may be true in GS Junior sequencing studies. Scientific Reports. 7, (2017).
Gandhi, P. N., Wang, X., Zhu, X., Chen, S. G., Wilson-Delfosse, A. L. The Roc domain of leucine-rich repeat kinase 2 is sufficient for interaction with microtubules. J Neurosci Res. 86 (8), 1711-1720 (2008).
Goldwurm, S., et al. The G6055A (G2019S) mutation in LRRK2 is frequent in both early and late onset Parkinson’s disease and originates from a common ancestor. J Med Genet. 42 (11), e65 (2005).
Caiazzo, M., et al. Direct generation of functional dopaminergic neurons from mouse and human fibroblasts. Nature. 476 (7359), 224-227 (2011).
Grimes, D. A., et al. Translated mutation in the Nurr1 gene as a cause for Parkinson’s disease. Mov Disord. 21 (7), 906-909 (2006).
Collins, F. S., Hamburg, M. A. First FDA authorization for next-generation sequencer. N Engl J Med. 369 (25), 2369-2371 (2013).
Van der Auwera, G. A., et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline. Curr Protoc Bioinformatics. 43, 11-33 (2013).
Treangen, T. J., Salzberg, S. L. Repetitive DNA and next-generation sequencing: computational challenges and solutions. Nat Rev Genet. 13 (1), 36-46 (2011).
Shin, S., Park, J. Characterization of sequence-specific errors in various next-generation sequencing systems. Mol Biosyst. 12 (3), 914-922 (2016).
Povysil, G., et al. panelcn.MOPS: Copy-number detection in targeted NGS panel data for clinical diagnostics. Hum Mutat. 38 (7), 889-897 (2017).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Dilliott, A. A., Farhan, S. M., Ghani, M., Sato, C., Liang, E., Zhang, M., McIntyre, A. D., Cao, H., Racacho, L., Robinson, J. F., Strong, M. J., Masellis, M., Bulman, D. E., Rogaeva, E., Lang, A., Tartaglia, C., Finger, E., Zinman, L., Turnbull, J., Freedman, M., Swartz, R., Black, S. E., Hegele, R. A. Targeted Next-generation Sequencing and Bioinformatics Pipeline to Evaluate Genetic Determinants of Constitutional Disease. J. Vis. Exp. (134), e57266, doi:10.3791/57266 (2018).

संवैधानिक रोग के आनुवंशिक निर्धारकों का मूल्यांकन करने के लिए लक्षित अगली पीढ़ी के अनुक्रमण और Bioinformatics पाइपलाइन

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

संवैधानिक रोग के आनुवंशिक निर्धारकों का मूल्यांकन करने के लिए लक्षित अगली पीढ़ी के अनुक्रमण और Bioinformatics पाइपलाइन

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below