Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

संवैधानिक रोग के आनुवंशिक निर्धारकों का मूल्यांकन करने के लिए लक्षित अगली पीढ़ी के अनुक्रमण और Bioinformatics पाइपलाइन

Published: April 4, 2018 doi: 10.3791/57266

Summary

लक्षित अगली पीढ़ी अनुक्रमण एक समय और लागत कुशल दृष्टिकोण है कि दोनों रोग अनुसंधान और नैदानिक निदान में तेजी से लोकप्रिय होता जा रहा है । प्रोटोकॉल यहां वर्णित जटिल अनुक्रमण के लिए आवश्यक कार्यप्रवाह और आनुवंशिक वेरिएंट है कि रोग में योगदान की पहचान करने के लिए इस्तेमाल किया bioinformatics प्रक्रिया प्रस्तुत करता है ।

Abstract

अगली पीढ़ी के अनुक्रमण (NGS) जल्दी क्रांति है कैसे संवैधानिक रोग के आनुवंशिक निर्धारकों में अनुसंधान किया जाता है । तकनीक अनुक्रमण के लाखों के साथ अत्यधिक कुशल है एक कम समय अवधि में उत्पादन किया जा रहा है और अपेक्षाकृत कम कीमत पर पढ़ता है । विशेष रूप से, लक्षित NGS अध्ययन की बीमारी के आधार पर विशेष रूप से ब्याज की जीनोमिक क्षेत्रों के लिए जांच ध्यान केंद्रित करने में सक्षम है । न केवल यह आगे लागत को कम करता है और इस प्रक्रिया की गति में वृद्धि, लेकिन यह गणना बोझ है कि अक्सर NGS के साथ कम करती है । हालांकि लक्षित NGS जीनोम के कुछ क्षेत्रों के लिए प्रतिबंधित है, ब्याज की संभावित उपंयास loci की पहचान को रोकने, यह एक उत्कृष्ट तकनीक जब एक phenotypically और आनुवंशिक रूप से विषम बीमारी के साथ सामना करना पड़ सकता है, जिसके लिए वहां है पहले आनुवंशिक संघों जाना जाता है । अनुक्रमण तकनीक की जटिल प्रकृति की वजह से, यह बारीकी से उच्च कवरेज और गुणवत्ता के अनुक्रमण पढ़ता प्राप्त करने के क्रम में प्रोटोकॉल और तरीकों का पालन करने के लिए महत्वपूर्ण है । इसके अलावा, एक बार अनुक्रमण पढ़ता प्राप्त कर रहे हैं, एक परिष्कृत bioinformatics कार्यप्रवाह सही नक्शा एक संदर्भ जीनोम के लिए पढ़ता है, वेरिएंट को कॉल करने के लिए, और वेरिएंट गुणवत्ता मैट्रिक्स पारित सुनिश्चित करने के लिए उपयोग किया जाता है । वेरिएंट भी व्याख्या और उनके नैदानिक महत्व है, जो चिकित्सा आनुवंशिकी और जीनोमिक्स Pathogenicity दिशानिर्देश के अमेरिकन कॉलेज को लागू करने से मानकीकृत किया जा सकता है के आधार पर उपचारात्मक होना चाहिए । यहां प्रस्तुत तरीकों को पैदा करने और एक लक्षित अनुक्रमण पैनल से NGS डेटा का विश्लेषण, एक मॉडल के रूप में ONDRISeq neurodegenerative रोग पैनल का उपयोग, वेरिएंट है कि नैदानिक महत्व का हो सकता है की पहचान करने में शामिल कदम प्रदर्शित करेगा ।

Introduction

विभिंन स्थितियों के आनुवंशिक निर्धारकों को परिभाषित करने के रूप में अनुसंधान में एक उच्च प्राथमिकता पर लेता है और क्लिनिक में, अगली पीढ़ी के अनुक्रमण (NGS) के लिए एक उच्च प्रवाह और लागत प्रभावी उपकरण के लिए इन लक्ष्यों को प्राप्त करने के लिए साबित हो रहा है1,2 ,3. लगभग 40 वर्षों के लिए, सैंज अनुक्रमण आनुवंशिक वेरिएंट की पहचान करने के लिए सोने के मानक किया गया था4; हालांकि, आनुवंशिक विविधता या अज्ञात आनुवंशिक एटियलजि के साथ रोगों के लिए, कई संभावित उंमीदवार जीन का मूल्यांकन किया जाना चाहिए, अक्सर समवर्ती । इस संदर्भ में, सैंज अनुक्रमण महंगा और समय लेने वाली हो जाता है । हालांकि, NGS डीएनए टुकड़े के लाखों के बड़े पैमाने पर समानांतर अनुक्रमण शामिल है, एक लागत और समय कुशल तकनीक के लिए अनुमति देता है एक साथ जीनोम के विभिंन क्षेत्रों में आनुवंशिक भिंनता की एक विस्तृत श्रृंखला का पता लगाने के लिए ।

sequencing डीएनए के लिए NGS के तीन प्रकार के होते हैं: 1) पूरे-जीनोम अनुक्रमण (WGS), 2) पूरे-exome अनुक्रमण (वेस), और 3) लक्षित अनुक्रमण5. WGS एक व्यक्ति के पूरे जीनोमिक सामग्री का मूल्यांकन करता है, जबकि वेस अनुक्रमण केवल प्रोटीन के जीनोम6कोडिंग क्षेत्रों में शामिल है । लक्षित अनुक्रमण, इसके विपरीत, आम रोग तंत्र या ज्ञात नैदानिक phenotype द्वारा जुड़े अपेक्षाकृत कुछ विशिष्ट जीन के आधार पर जीनोम के विशिष्ट क्षेत्रों पर केंद्रित है । या तो exons या introns, या जीन के एक जीन या विशिष्ट समूह के किसी भी intergenic क्षेत्रों इस दृष्टिकोण का उपयोग कर निर्दिष्ट किया जा सकता है । इसलिए, लक्षित अनुक्रमण एक उत्कृष्ट दृष्टिकोण जब पहले से ही उंमीदवार के लिए ब्याज की बीमारी के साथ जुड़े जीन ज्ञात की नींव है हो सकता है । जीनोम के विशिष्ट क्षेत्रों लक्ष्यीकरण अनावश्यक और अप्रासंगिक आनुवंशिक भिंनता है कि बादल या नैदानिक व्याख्या से विचलित कर सकते है के उंमूलन के लिए अनुमति देता है । जबकि WGS और वेस दोनों उच्च गुणवत्ता वाले डेटा की एक बड़ी राशि का उत्पादन, डेटा की राशि भारी हो सकता है । न केवल डेटा की इस बड़ी राशि है अभिकलनी गहन bioinformatics विश्लेषण की आवश्यकता होती है, लेकिन डेटा भंडारण अक्सर समस्या7उपस्थित कर सकते हैं । डेटा भंडारण की यह चुनौती भी WGS और वेस, जो अक्सर शुरू नहीं माना जाता है जब अनुक्रमण के खर्च की गणना करने के लिए अतिरिक्त लागत कहते हैं । इसके अलावा, यद्यपि यह कम है, WGS और वेस की लागत अपेक्षाकृत अधिक रहती है । लक्षित अनुक्रमण एक अधिक लागत कुशल विकल्प है, खासकर जब व्यक्तियों की एक बड़ी संख्या के अनुक्रमण की आवश्यकता है हो सकता है ।

ओंटारियो Neurodegenerative रोग अनुसंधान पहल (ONDRI) एक बहु मंच, प्रांतीय चौड़ा, प्रेक्षणीय पलटन अध्ययन निस्र्पक सहित पांच Neurodegenerative रोगों, है: 1) अल्जाइमर रोग और हल्के संज्ञानात्मक हानि, 2) पेशीशोषी पार्श्व स्केलेरोसिस, 3) frontotemporal मनोभ्रंश, 4) पार्किंसंस रोग, और 5) संवहनी संज्ञानात्मक हानि8. ONDRI जीनोमिक्स उपसमूह इस पलटना अक्सर छूट, अभी तक अत्यंत महत्वपूर्ण आनुवंशिक परिदृश्य इन phenotypically और आनुवंशिक रूप से विषम रोगों के आधारभूत लक्षण वर्णन के भाग के रूप में स्पष्ट करने के लिए लक्ष्य है । Neurodegenerative रोगों इस प्रकार NGS के तरीके के लिए उपयुक्त उंमीदवारों और विशेष रूप से लक्षित अनुक्रमण के लिए कर रहे हैं ।

हम कस्टम-बनाया गया है एक लक्षित NGS पैनल, ONDRISeq, को अनुक्रम 528 प्रतिभागियों प्रोटीन के लिए ONDRI में शामिल-कोडिंग क्षेत्रों के 80 जीन है कि पहले ब्याज की पांच बीमारियों के साथ संबद्ध किया गया है । इस पद्धति के साथ, हम एक केंद्रित और कुशल तरीके से उच्च गुणवत्ता वाले NGS डेटा का दोहन करने में सक्षम हैं । डिजाइन और कई सामंजस्य अध्ययन के साथ ONDRISeq पैनल के सत्यापन पहले वर्णित किया गया है, जिसके लिए ONDRISeq पैनल के उपंयास की पहचान करने में सक्षम था, 216 के ७२.२% में संभव नैदानिक महत्व के दुर्लभ वेरिएंट पैनल सत्यापन के लिए इस्तेमाल किया मामलों की 9. हालांकि NGS प्रौद्योगिकी तेजी से उंनत और हाल के वर्षों में उल्लेखनीय है, कई शोधकर्ताओं ने एक चुनौती का सामना जब प्रयोग करने योग्य, व्याख्या वेरिएंट10की एक सूची में कच्चे डेटा प्रसंस्करण । इसके अलावा, वेरिएंट की व्याख्या जटिल हो सकता है, खासकर जब कई कि दुर्लभ या उपंयास11के साथ सामना करना पड़ा ।

यहाँ, हम एक उदाहरण के रूप में ONDRISeq अध्ययन का उपयोग करके चरण-दर-चरण तरीके से, लक्षित NGS की कार्यप्रणाली और पुनर्अनुक्रमणन के लिए आवश्यक संबद्ध bioinformatics कार्यप्रवाह, भिन्न कॉलिंग, और भिन्न एनोटेशन का वर्णन करते हैं. NGS डेटा की पीढ़ी के बाद, कच्चे अनुक्रमण फ़ाइलें सही वेरिएंट कॉल करने के क्रम में मानव संदर्भ जीनोम के लिए गठबंधन किया जाना चाहिए । वेरिएंट तो बाद में संस्करण उपचारात्मक प्रदर्शन करने के क्रम में व्याख्या की जानी चाहिए । हम भी सही संस्करण pathogenicity वर्गीकृत करने के लिए चिकित्सा ' जेनेटिक्स मानकों और दिशा निर्देशों के अमेरिकी कॉलेज के हमारे कार्यांवयन की व्याख्या करेंगे ।

Protocol

ONDRI, आचार प्रोटोकॉल और सूचित सहमति के प्रयोजनों के लिए Baycrest केंद्र में शोध नीति बोर्डों के आधार पर वृद्धावस्था देखभाल के लिए प्राप्त किए गए (टोरंटो, ओंटारियो, कनाडा); लत और मानसिक स्वास्थ्य के लिए केंद्र (टोरंटो, ओंटारियो, कनाडा); एलिजाबेथ Bruyère अस्पताल (ओटावा, ओंटारियो, कनाडा); हैमिल्टन जनरल अस्पताल (हैमिल्टन, ओंटारियो, कनाडा); लंदन स्वास्थ्य विज्ञान केंद्र (लंदन, ओंटारियो, कनाडा); McMaster (हैमिल्टन, ओंटारियो, कनाडा); ओटावा अस्पताल (ओटावा, ओंटारियो, कनाडा); Parkwood अस्पताल (लंदन, ओंटारियो, कनाडा); सेंट माइकल अस्पताल (टोरंटो, ओंटारियो, कनाडा); Sunnybrook स्वास्थ्य विज्ञान केंद्र (टोरंटो, ओंटारियो, कनाडा); और विश्वविद्यालय स्वास्थ्य नेटवर्क-टोरंटो वेस्टर्न अस्पताल (टोरंटो, ओंटारियो, कनाडा) ।

1. मानव रक्त के नमूनों से डीएनए अलगाव

  1. उपयुक्त आचार प्रोटोकॉल और सूचित सहमति के अनुसार sequencing प्रतिभागियों से नमूने ले लीजिए ।
    1. उच्च गुणवत्ता के डीएनए प्राप्त करने के लिए, निष्कर्षण के प्रयोजनों के लिए रक्त के नमूने आकर्षित ।
      नोट: डीएनए भी लार या buccal कोशिकाओं से निकाला जा सकता है, यह सुनिश्चित करना है कि एक उचित डीएनए निष्कर्षण किट का प्रयोग किया जाता है ।
    2. यदि रक्त से निकालने, डीएनए की एक उच्च उपज प्राप्त करने के लिए, तीन 4 मिलीलीटर EDTA K2 ट्यूबों में नमूना इकट्ठा, कुल मात्रा का एक नमूना प्रदान ~ 12 मिलीलीटर ।
    3. 750 x जी में 20 मिनट के लिए रक्त के नमूनों को प्लाज्मा के एक ऊपरी चरण में अंश करने के लिए, पतली, ल्यूकोसाइट्स के मध्य चरण, और एरिथ्रोसाइट्स के नीचे चरण ।
  2. रक्त के नमूने से प्लाज्मा को निकालकर उसे एक डिस्पोजेबल ट्रांसफर पिपेट के साथ नमूने के ऊपर से pipetting । उचित रूप से प्लाज्मा को छोड़ दें या भविष्य में जैव रासायनिक विश्लेषण के लिए-80 डिग्री सेल्सियस पर भंडारण के लिए एकाधिक 500 µ l aliquots में बांटें । सुनिश्चित करें कि एक नया, बाँझ पिपेट प्रत्येक नमूने के लिए प्रयोग किया जाता है ।
  3. निर्माता के निर्देशों के अनुसार एक रक्त निष्कर्षण किट12 (सामग्री की तालिका) के साथ रक्त के नमूने से डीएनए निकालें ।
    नोट: यदि ऊपर वर्णित मात्रा का एक नमूना प्राप्त है, ~ ल्यूकोसाइट्स के 3 मिलीलीटर डीएनए निष्कर्षण में उपयोग करने के लिए प्राप्त किया जाएगा ।
  4. एक पूर्ण स्पेक्ट्रम spectrophotometer13 (सामग्री की तालिका) का उपयोग करते हुए एनजी/µ एल में प्रारंभिक डीएनए एकाग्रता उपाय, निर्माता के निर्देशों के अनुसार ।
  5. सीधे चरण 2 पर आगे बढ़ें । वैकल्पिक रूप से, 4 डिग्री सेल्सियस पर डीएनए की दुकान ।

2. sequencing पुस्तकालय की तैयारी

  1. तीन दिनों के पाठ्यक्रम पर डीएनए नमूनों पर धारावाहिक कमजोर पड़ने के लिए 5.0 ± 1.0 एनजी/µ एल के एक अंतिम एकाग्रता प्राप्त करने के लिए प्रदर्शन
    1. पतला 1 मीटर Tris बफर पीएच 8.5 से 10 µ मीटर के साथ जल ।
      नोट: मात्रा पतला डीएनए नमूनों की संख्या है कि बाद के चरणों में पतला होने की आवश्यकता होगी पर निर्भर करेगा ।
    2. अगर 1.4 कदम के बाद डीएनए कमजोर पड़ने सीधे प्रदर्शन, निंनलिखित कदम के लिए आगे बढ़ें । अगर एक ही दिन पर नहीं, डीएनए एकाग्रता के रूप में कदम 1.4 में किया गया था उपाय ।
    3. मापा एकाग्रता के आधार पर, के लिए डीएनए के 40 µ एल पतला ~ 10 एनजी/µ एल का उपयोग कर 10 µ m Tris बफर पीएच 8.5 और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देते हैं ।
    4. एक fluorometer के साथ डीएनए एकाग्रता को मापने14 डीएनए के ठहराव के लिए उपयुक्त (सामग्री की तालिका), निर्माता के निर्देशों के अनुसार.
      नोट: नमूने की एकाग्रता होना चाहिए > 10 एनजी/µ एल spectrophotometer पहले इस्तेमाल की कम संवेदनशीलता की वजह से ।
    5. मापा एकाग्रता के आधार पर, 10 µ एम Tris बफर पीएच 8.5 का उपयोग करने और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देने के लिए डीएनए के 20 µ एल पतला ।
    6. fluorometer14के साथ डीएनए एकाग्रता को मापने, निर्माता के निर्देशों के अनुसार.
    7. मापा एकाग्रता के आधार पर, डीएनए के 10 µ एल को पतला 5 एनजी/µ एल का उपयोग कर 10 µ एम Tris-एचसीएल पीएच 8.5 और नमूना 4 डिग्री सेल्सियस पर रात भर बैठने के लिए अनुमति देते हैं ।
  2. लक्षित NGS पैनल के उपयुक्त लक्ष्य संवर्धन किट15 (सामग्री की तालिका) के साथ निर्माता के निर्देशों के अनुसार अनुक्रमण पुस्तकालय तैयार करते हैं । सुनिश्चित करें कि संवर्धन किट NGS मंच इस्तेमाल किया जा रहा के लिए उपयुक्त है ।
    1. निर्माता के निर्देशों का पालन करें16 plexity और लायब्रेरीज़ के पूलिंग के बारे में ।
      नोट: ONDRISeq के लिए, पुस्तकालयों 12 डीएनए नमूनों से बना रहे हैं, दो के सेट में परित, और NGS डेस्कटॉप साधन (सामग्री की मेज) पर चलाते हैं । नमूनों की संख्या जो एक एकल प्रतिक्रिया में चलाया जा सकता है, sequencing किट और उपयोग किए गए प्लेटफ़ॉर्म पर निर्भर करेगा ।
    2. उच्च गुणवत्ता अनुक्रमण डेटा प्राप्त करने के लिए, लक्ष्य संवर्धन किट15के निर्माता के निर्देश में वर्णित tagmentation, निम्नलिखित डीएनए पुस्तकालय की गुणवत्ता को मान्य करने के लिए वैकल्पिक कदम प्रदर्शन.
      1. पुस्तकालय उपज की गुणवत्ता सुनिश्चित करने के लिए तपसिल में प्रत्येक पुस्तकालय का विश्लेषण ।
    3. यदि पुस्तकालयों पूलिंग, fluorometer14के साथ डीएनए एकाग्रता को मापने, निर्माता के निर्देशों के अनुसार । लक्ष्य संवर्धन किट द्वारा अनुशंसित equimolar अनुपात प्राप्त करने के लिए पूल करने के लिए प्रत्येक डीएनए पुस्तकालय की मात्रा निर्धारित करने के लिए इस एकाग्रता का उपयोग किया जा रहा है ।

3. अगली पीढ़ी के अनुक्रमण

  1. अनुक्रम NGS डेस्कटॉप उपकरण के एजेंट किट निर्माता के निर्देश के अनुसार17,18 (सामग्री की मेज) ।
    1. निर्माता के निर्देश के अनुसार एक नमूना शीट तैयार करें18 उपयुक्त NGS प्रौद्योगिकी सॉफ्टवेयर (सामग्री की तालिका) का उपयोग कर, जो NGS डेस्कटॉप साधन के कार्यप्रवाह में आयात किया जाएगा.
      नोट: ONDRISeq के प्रयोजनों के लिए, आवेदन विकल्प चुना ' अन्य ' है, केवल FASTQ फ़ाइलों का अनुरोध के साथ (चित्रा 1). क्रमिक चरणों इन FASTQ फ़ाइलें, संरेखण और गुणवत्ता पैरामीटर्स का पूर्ण अनुकूलन के लिए अनुमति देने के लिए प्रक्रिया करेगा । लक्षित अनुक्रमण चुना जाता है, तो हालांकि, कुछ NGS उपकरण स्वयं VCF फ़ाइलों में sequencing डेटा को संसाधित करने में सक्षम हैं । निर्माता के निर्देश18 विकल्पों में से एक पूर्ण चयन के लिए परामर्श किया जा सकता है ।
    2. एक क्लाउड-आधारित कंप्यूटिंग वातावरण19 (सामग्री तालिका) का उपयोग करते हैं, तो sequencing चलाएँ सेट करते समय में लॉग ऑन करें । NGS डेस्कटॉप इंस्ट्रूमेंट मुख पृष्ठ पर "अनुक्रमण" क्लिक करने के बाद ऐसा करें ।
    3. निंनलिखित पुस्तकालय विकार18 निर्माता के निर्देश के अनुसार, fluorometer14के साथ डीएनए पुस्तकालय एकाग्रता को मापने ।
    4. एक उपयुक्त स्वचालित ट्रो प्रणाली और डीएनए गुणवत्ता विश्लेषण किट20 (सामग्री की तालिका), निर्माता के निर्देशों के अनुसार का उपयोग करके डीएनए लाइब्रेरी की गुणवत्ता को मान्य करें ।
    5. एनजी/µ एल से एनएम के लिए डीएनए एकाग्रता में परिवर्तित करने के लिए, निम्नलिखित सूत्र का उपयोग करें16
      Equation
      नोट: औसत लायब्रेरी आकार लक्ष्य संवर्धन किट का उपयोग किया जा रहा करने के लिए विशिष्ट हो जाएगा, और चरण 3.1.4 में स्वीकार्य ट्रो ट्रेस से प्राप्त किया जा सकता है ।
    6. sequencing लाइब्रेरी 6 – 20 pM, उपयुक्त के रूप में, और 600 μL की वॉल्यूम के अंतिम एकाग्रता के लिए निर्माता के निर्देशों के अनुसार21को पतला करें ।
      नोट: सटीक एकाग्रता की जरूरत sequencing इस्तेमाल किया किट पर निर्भर है । उचित लोडिंग एकाग्रता निर्धारित करने के लिए संवर्धन किट निर्माता से परामर्श करें ।
    7. , स्वभाव को पतला, और निर्माता के निर्देशों के अनुसार एक सकारात्मक नियंत्रण sequencing पुस्तकालय21शामिल हैं ।
    8. हर sequencing चलाने का एक लॉग रखें, जो डीएनए लाइब्रेरी एकाग्रता भरी हुई (पीएम), सकारात्मक नियंत्रण का प्रतिशत शामिल जोड़ा गया, एजेंट कारतूस बारकोड, चरण 3.1.1 में चुना आवेदन, सूचकांक की संख्या पढ़ता है, संवर्धन किट का इस्तेमाल किया, पढ़ें लंबाई (ओं), और नमूना पत्रक का नाम ।
      नोट: NGS डेस्कटॉप साधन के चलाने के समय साधन, संवर्धन किट पर निर्भर करेगा, और (4 – 56 एच इस प्रयोग22में प्रयुक्त sequencer के लिए) चुना लंबाई पढ़ें.
  2. sequencing चलाने के पूरा होने पर, NGS डेस्कटॉप इंस्ट्रूमेंट मुख पृष्ठ पर नेविगेट और "फ़ाइलें प्रबंधित करें" क्लिक करके सभी outputs शामिल है जो "भागो फ़ोल्डर", का उपयोग. बाद में प्रवेश के लिए एक स्थानीय ड्राइव पर फ़ाइलों को ले जाएं । एक अलग विकल्प के लिए, कंप्यूटर पर, नेविगेशन पैनल पर "रन" का चयन करके क्लाउड-आधारित कंप्यूटिंग वातावरण19 में फ़ाइलों को ढूंढें । चलाएँ सारांश पृष्ठ पर नेविगेट करने के लिए उपयुक्त sequencing चलाएँ का चयन करें । क्लाउड से डेटा प्राप्त करने के लिए "डाउनलोड करें" चुनें. प्रकट होने वाले संवाद बॉक्स से, डाउनलोड करने के लिए फ़ाइल प्रकार के रूप में FASTQ फ़ाइलें चुनें और "डाउनलोड" पर क्लिक करें ।
  3. क्लाउड-आधारित कंप्यूटिंग वातावरण19,23के रन सारांश पृष्ठ से, कंप्यूटिंग वातावरण द्वारा उत्पादित विभिन्न आंकड़ों के साथ अनुक्रमण चलाने की गुणवत्ता का विश्लेषण करने के लिए "चार्ट" करने के लिए नेविगेट । उत्पादित प्रत्येक आंकड़े के बारे में विवरण के लिए निर्माता के निर्देश23 देखें ।
    1. भागो चार्ट पृष्ठ से, "चक्र द्वारा डेटा" लेबल आंकड़ा खोजें । चार्ट के अंतर्गत, "तीव्रता" का चयन करें और चैनल के अंतर्गत "सभी चैनल" चुनें. यह संकेत तीव्रता भूखंड का उत्पादन किया है कि एक ही संवर्धन किट और NGS डेस्कटॉप साधन के साथ अतीत में प्रदर्शन अनुक्रमण रन द्वारा उत्पादित करने के लिए समान है सुनिश्चित करें ।
      नोट: यह सभी 150 चक्रों भर में प्रत्येक आधार द्वारा दिखाया तीव्रता का प्रतिशत को दर्शाता है. आंकड़ा व्यापक रूप से संवर्धन किट का इस्तेमाल किया, यही वजह है कि यह एक ही पैनल के पिछले sequencing रन की तुलना में किया जाना चाहिए पर निर्भर करता है भिन्न हो सकते हैं ।
    2. अनुक्रमण गुणवत्ता नियंत्रण (QC) हिस्टोग्राम, जो पृष्ठ के दाईं ओर है खोजने के लिए चलाएं नेविगेशन पैनल के भीतर "अनुक्रमण QC" टैब का चयन करें । सुनिश्चित करें कि एक अपेक्षाकृत समान वितरण% पढ़ता की पहचान (पीएफ) सभी नमूनों में मनाया जाता है ।
      नोट: यदि किसी भी नमूने एक बहुत कम% है पहचाने गए (पीएफ) के बाकी नमूनों से, ध्यान दें कि sequencing डेटा की गुणवत्ता प्रभावित हो सकता है ।
  4. क्लाउड-आधारित कंप्यूटिंग परिवेश का सारांश पृष्ठ चलाएँ से, चलाएँ नेविगेशन पैनल के भीतर "मीट्रिक" पर क्लिक करके गुणवत्ता मीट्रिक पर नेविगेट करें.
    नोट: मीट्रिक कट-नापसंद अनुक्रमण मंच पर निर्भर करेगा और उपयोग किया जा रहा संवर्धन किट. वहां कई मैट्रिक्स है कि निर्माता के निर्देश के आधार पर उपयोग किया जा सकता है23, निंन चरणों के साथ तीन कि उच्च गुणवत्ता नियंत्रण के लिए सिफारिश कर रहे है पर प्रकाश डाला ।
    1. के तहत "घनत्व (K/mm2)" क्लस्टर घनत्व सुनिश्चित करने के लिए संवर्धन किट द्वारा अनुशंसित सीमा के भीतर है (इस मामले में 1200-1400 k/2) ।
    2. के अंतर्गत कुल "% ≥ Q30" सुनिश्चित करें कि मान ≥ 85% है, sequencing की गुणवत्ता को प्रतिबिंबित करता है पढ़ता है ।
      नोट: यदि 85% की इस सीमा से कम, sequencing की गुणवत्ता compromised किया जा सकता है कि ध्यान दें ।
    3. "संरेखित (%)" के अंतर्गत सुनिश्चित करें कि मान sequencing रन में शामिल किया गया था जो धनात्मक नियंत्रण के% के समान है ।
      नोट: यह सकारात्मक नियंत्रण के एक उपाय के रूप में कार्य करता है, ऐसी है कि केवल कुल पढ़ता के इस प्रतिशत के लिए सकारात्मक नियंत्रण जीनोम को संरेखित पाया गया । यदि 1% सकारात्मक नियंत्रण का इस्तेमाल किया गया था यह उंमीद की जाएगी कि गठबंधन (%) ~ 1-5% होगा ।

Figure 1
चित्रा 1: NGS प्रौद्योगिकी सॉफ्टवेयर (सामग्री की तालिका) नमूना शीट निर्माता आवेदन विकल्प के स्क्रीनशॉट. ONDRISeq के प्रयोजनों के लिए, FASTQ केवल अनुप्रयोग का उपयोग किया जाता है । हालांकि, यदि उपयोगकर्ता अंय फ़ाइलों का उत्पादन, जैसे VCF फ़ाइलें चाहते हैं, तो यह अनुशंसित है कि लक्षित अनुक्रमण श्रेणी के भीतर किसी अनुप्रयोग का उपयोग किया जाता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

4. अनुक्रमण और संस्करण कॉलिंग

  1. डेटा पूर्व प्रसंस्करण के लिए, कच्चे FASTQ फ़ाइलों को मानव संदर्भ जीनोम में संरेखित करने के लिए और वेरिएंट (सामग्री की तालिका) को कॉल करने के लिए उपयुक्त सॉफ़्टवेयर का चयन करें ।
  2. आयात FASTQ अनुक्रमण डेटा पूर्व प्रसंस्करण सॉफ्टवेयर में पढ़ता है ।
    नोट: ONDRISeq के प्रयोजनों के लिए, 48 FASTQ 24 नमूनों की एक एकल अनुक्रमण चलाने से उत्पादित फ़ाइलों को आयात और सॉफ्टवेयर के माध्यम से संसाधित कर रहे हैं । एक बार में संसाधित नमूनों की संख्या शोधकर्ता और NGS पैनल के आकार की जरूरतों के आधार पर भिन्न हो सकते हैं ।
    1. "नेविगेशन क्षेत्र" के भीतर, ठीक क्लिक करें और चुनें "नया फ़ोल्डर" । ऐसी है कि प्रदर्शन किया गया था sequencing चलाने के लिए के रूप में स्पष्टता है कि फ़ोल्डर नाम है ।
    2. शीर्ष पर टूलबार से, "आयात करें" चुनें । अनुक्रमणित प्लेटफार्मों की ड्रॉपडाउन सूची से जो अनुक्रमण किया गया था मंच चुना है ।
      नोट: ONDRISeq के प्रयोजनों के लिए, "Illumina" चुना जाता है । हालांकि, यदि किसी भिंन sequencing प्लेटफ़ॉर्म का उपयोग करते हुए FASTQ चरण24आयात करने के शेष के लिए निर्माता के निर्देशों से परामर्श करें ।
    3. संवाद बॉक्स में, नेविगेट करें और संसाधित किया जा रहा है जो sequencing रन से FASTQ फ़ाइलों का चयन करें । सुनिश्चित करें कि आयात की जा रही फ़ाइलें में संग्रहीत और स्थानीय ड्राइव से आयात किए जाते हैं, यदि एक से अधिक सर्वरों वाले कंप्यूटर का उपयोग कर ।
    4. संवाद बॉक्स के "सामांय विकल्प" से, "युग्मित पढ़ता" के पास बॉक्स को क्लिक करें यदि sequencing युग्मित अंत chemistries उपयोग किया जाता है ।
      नोट: इस मामले में, एक आगे और एक रिवर्स प्रत्येक नमूना के लिए आयात दो FASTQ नमूने भी होना चाहिए.
    5. संवाद बॉक्स की युग्मित पठन जानकारी से, फ़ाइल सूची में उल्टे पढ़ने से पहले आगे पढ़ें FASTQ फ़ाइल प्रकट होता है, तो "युग्मित-अंत (अग्रेषित करें-रिवर्स)" का चयन करें । यदि फ़ाइलें विपरीत क्रम में दिखाई देती हैं, तो "मेट-युग्म (रिवर्स-फॉरवर्ड)" का चयन करें । सेट करने के लिए 1 और अधिकतम दूरी के लिए जोड़ा गया पढ़ें ंयूनतम दूरी 1000, नमूना अनुक्रम के भीतर छोटे पैमाने पर संरचनात्मक पुनर्व्यवस्थाओं का पता लगाने के लिए अनुमति देने के लिए ।
    6. से "Illumina विकल्प" संवाद बॉक्स में, का चयन करें "निकालें विफल पढ़ता", पढ़ता अनुक्रमण विफल रहा निकालने के लिए । यदि NGS डेस्कटॉप इंस्ट्रूमेंट de-division FASTQ फ़ाइलों को निर्यात करने से पहले डेटा "MiSeq de-division" बॉक्स का चयन न करें ।
    7. "गुणवत्ता स्कोर" ड्रॉपडाउन सूची से, sequencing के लिए उपयोग किया गया था NGS पाइपलाइन का चयन करें । संवाद बॉक्स के नीचे "अगला" चुनें.
      नोट: उपयोग पाइपलाइन FASTQ फ़ाइल गुणवत्ता स्कोर का स्वरूप को प्रभावित करेगा । कौन सी पाइपलाइन का चयन करने के बारे में अधिक जानकारी के लिए, निर्माता के निर्देश24देखें ।
    8. नया संवाद बॉक्स से, "सहेजें" का चयन करें और "प्रत्येक नमूना FASTQ फ़ाइलें अपने व्यक्तिगत फ़ोल्डर में रखने के लिए प्रति स्नान इकाई सबफ़ोल्डर बनाएं । संवाद बॉक्स के नीचे "अगला" चुनें.
    9. नया संवाद बॉक्स में, चरण 4.2.1 में बनाया गया था जो फ़ोल्डर का चयन करें । यह वह स्थान है जहां FASTQ फ़ाइलें आयात की जाएंगी । संवाद बॉक्स के निचले भाग पर "समाप्त" चुनें और FASTQ फ़ाइलों के आयात होने तक प्रतीक्षा करें । फ़ाइल आयात की स्थिति देखने के लिए "प्रक्रियाएँ" टैब पर क्लिक करें.
  3. निर्माता के निर्देशों के अनुसार, अनुक्रमण और भिन्न कॉलिंग करने के लिए सॉफ़्टवेयर में कार्यप्रवाह डिज़ाइन करें.
    नोट: यह कार्यप्रवाह शोधकर्ता की आवश्यकताओं के आधार पर भिंन हो सकता है, लेकिन निंन चरणों को ONDRISeq (चित्र 2) के प्रयोजनों के लिए शामिल किया गया है । इस वर्कफ़्लो में दिए गए चरणों को अंय NGS पुनर्अनुक्रमण और भिन्न कॉलिंग सॉफ़्टवेयर के लिए उपयुक्त के रूप में लागू किया जा सकता है । ONDRI के प्रयोजनों के लिए सभी bioinformatics प्रसंस्करण मानव संदर्भ जीनोम GRCH37/hg19 के संदर्भ में किया जाता है, डेटा प्रोसेसिंग और विश्लेषण की निरंतरता के लिए ।
    1. अनुक्रमण संदर्भ जीनोम के लिए पढ़ता नक्शा ।
      1. कॉंफ़िगर करते समय, संदर्भ जीनोम को उपयुक्त के रूप में चुनें, यह सुनिश्चित करना कि यह वही संदर्भ जीनोम है जो सभी bioinformatics चरणों के लिए उपयोग किया जाता है ।
      2. मास्किंग मोड ड्रॉप-डाउन सूची से "कोई मास्किंग" का चयन करें ताकि संदर्भ अनुक्रम का कोई क्षेत्र मास्क किए गए हैं ।
      3. सॉफ़्टवेयर द्वारा असाइन किए गए डिफ़ॉल्ट मैपिंग विकल्पों का उपयोग करें । इस शोध के प्रयोजनों के आधार पर स्वीकार्य है कि यह सत्यापित करने के लिए निर्माता के निर्देश24 की समीक्षा करें ।
    2. किसी भी पठन मैपिंग त्रुटियों, विशेष रूप से सम्मिलन-हटाने वाले वेरिएंट को हल करने के लिए मानव संदर्भ जीनोम को वर्कफ़्लो स्थानीय पुनर्संरेखण में शामिल करें.
      1. सॉफ़्टवेयर द्वारा असाइन किए गए डिफ़ॉल्ट स्थानीय पुनर्संरेखण विकल्पों का उपयोग करें । इस शोध के प्रयोजनों के आधार पर स्वीकार्य है कि यह सत्यापित करने के लिए निर्माता के निर्देश24 की समीक्षा करें ।
    3. पीसीआर प्रवर्धन पूर्वाग्रह के प्रभाव को कम करने के लिए NGS प्रोटोकॉल के भीतर पीसीआर द्वारा उत्पादित डुप्लिकेट मैप की गई पुस्तकें निकालें, जो झूठी सकारात्मक25का उत्पादन कर सकते हैं ।
      1. "अल्पसंख्यक अनुक्रम का अधिकतम प्रतिनिधित्व (%)", अनुसंधान की जरूरतों के आधार पर सेट करें ।
        नोट: एक नरम सेटिंग, ONDRISeq के प्रयोजनों के लिए इस्तेमाल के रूप में, 5% है; हालांकि, सॉफ्टवेयर की डिफ़ॉल्ट सेटिंग अधिक कड़े 20% है । जब दो पढ़ता बहुत समान हैं, तो यह सेटिंग निर्धारित करता है कि कम पठन गणना के साथ अनुक्रम पीसीआर प्रवर्धन बायस से एक sequencing त्रुटि माना जाना चाहिए । इसलिए, 5% की स्थापना करके, अल्पसंख्यक पढ़ें गिनती ≤ होना चाहिए बहुमत का 5% पढ़ें गिनती करने के लिए बहुमत के समान हो सही पढ़ें ।
    4. चरण 4.3.3 में जेनरेट किए गए पठन ट्रैक से कवरेज सारांश पाठ फ़ाइल के रूप में लक्ष्य क्षेत्रों के लिए आँकड़े निर्यात करें. सेटिंग्स में गैर-विशिष्ट मेल और भंग जोड़े पर ध्यान न दें । इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें ।
    5. एक बाइनरी अनुक्रम संरेखण मैप (BAM) फ़ाइल चरण 4.3.3 में जनरेट किया गया पठन ट्रैक से प्रत्येक नमूने के लिए निर्यात करें । यह क्रम संरेखण डेटा है, यदि भविष्य में विश्लेषण की जरूरत है । इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें ।
    6. अनुक्रम के भीतर वेरिएंट को कॉल करने के लिए भिन्न डिटेक्शन की एक विधि चुनें ।
      नोट: जब मांयताओं के नमूनों की ploidy के बारे में किया जा सकता है, यह अनुशंसित है कि एक निश्चित ploidy संस्करण का पता लगाने एल्गोरिथ्म का उपयोग किया जा, के रूप में ONDRISeq के प्रयोजनों के लिए प्रयोग किया जाता है । यदि यह धारणा नहीं बनाई जा सकती, तो शोध के प्रयोजनों के लिए सर्वोत्तम एल्गोरिथम निर्धारित करने के लिए निर्माता के निर्देश24 देखें ।
      1. निर्धारित ploidy भिन्न पैरामीटर्स विकल्प से कॉन्फ़िगर करते समय, ploidy के रूप में उपयुक्त नमूना जीव के लिए सेट करें । "आवश्यक भिन् न संभाव्यता", या किसी भिन् न सही रूप से इसे बनाए रखने के लिए क्रम में कॉल किया गया है कि प्रायिकता सेट करें ९०.०% पर ।
      2. सामान्य फ़िल्टर्स के लिए निम्न अनुशंसित सेटिंग्स का उपयोग करें: "10x की न्यूनतम कवरेज", "न्यूनतम गणना" 2, "20% की ंयूनतम पढ़ें आवृत्ति", "टूटी हुई जोड़े की अनदेखी", पर आधारित विशिष्ट मैचों की अनदेखी "पढ़ता", और "न्यूनतम पढ़ें लंबाई" 20.
        नोट: ये पैरामीटर ONDRISeq के प्रयोजनों पर आधारित होते हैं । निर्माता के निर्देशों का संदर्भ लें24 सुनिश्चित करने के लिए वे किया जा रहा अनुसंधान के लिए उपयुक्त हैं ।
      3. शोर फिल्टर के लिए निम्नलिखित अनुशंसित सेटिंग्स का उपयोग करें: "पड़ोस त्रिज्या" 5 का मानचित्रण गुणवत्ता स्कोर, "न्यूनतम केंद्रीय गुणवत्ता" 20 के मानचित्रण स्कोर, और "न्यूनतम पड़ोस गुणवत्ता" 15 के मानचित्रण स्कोर के साथ "आधार गुणवत्ता फिल्टर"; 5.0% की "पढ़ें दिशा फ़िल्टर"; और 1.0% महत्व के "सापेक्ष पढ़ें दिशा फ़िल्टर" ।
        नोट: ये पैरामीटर ONDRISeq के प्रयोजनों पर आधारित होते हैं । निर्माता के निर्देशों का संदर्भ लें24 सुनिश्चित करने के लिए वे किया जा रहा अनुसंधान के लिए उपयुक्त हैं ।
    7. ब्राउज़र एक्सटेंसिबल डेटा (बिस्तर) फ़ाइल द्वारा निर्दिष्ट के रूप में लक्षित पैनल के लक्ष्य क्षेत्रों के साथ उनके ओवरलैप के आधार पर बुलाया गया है कि वेरिएंट फ़िल्टर, केवल जीनोमिक के लिए लक्षित NGS पैनल के लिए चयनित क्षेत्रों के भीतर होने वाले वेरिएंट की अनुमति कायम.
      नोट: बिस्तर फ़ाइल लक्षित NGS पैनल है कि उपयोग किया जा रहा है, जीनोम है कि पैनल को कवर करने में सक्षम है के क्षेत्रों के आधार पर अद्वितीय होगा ।
    8. चरण 4.3.7 में निर्मित भिन् न ट्रैक से भिन् न कॉलिंग फ़ॉर्मेट (VCF) फ़ाइल में एक भिन् न रिपोर्ट निर्यात करें. इन फ़ाइलों के लिए स्थानीय ड्राइव पर कोई गंतव्य चुनें ।
    9. निर्माता के निर्देशों के अनुसार कार्यप्रवाह सहेजें और स्थापित करें24, इसे सॉफ़्टवेयर के "उपकरण बॉक्स" में उपलब्ध कराने के लिए । सुनिश्चित करें कि यह भविष्य में क्या NGS पैनल के लिए उपयुक्त है में स्पष्ट है कि इस तरह के कार्यप्रवाह का नाम है ।
      1. स्थापना के दौरान "संदर्भ डेटा निर्यात" विकल्पों के साथ संवाद बॉक्स में, "बंडल" करने के लिए सभी विकल्प सेट करें ।
      2. संवाद बॉक्स में स्थापना के दौरान "स्थापना स्थान" विकल्प के साथ, क्लिक करें "अपने स्थानीय कंप्यूटर पर वर्कफ़्लो स्थापित" ।
  4. आयातित FASTQ अनुक्रमण को चलाने के लिए अनुकूलित bioinformatics कार्यप्रवाह के माध्यम से कदम 4.3, निर्माता के निर्देशों के अनुसार24में डिज़ाइन किया गया पढ़ें ।
    1. सॉफ़्टवेयर के "उपकरण बॉक्स" में चरण 4.3 में डिज़ाइन किए गए कार्यप्रवाह को पहचानें और उसे डबल-क्लिक करें ।
    2. संवाद बॉक्स प्रकट होता है, के भीतर "नेविगेशन क्षेत्र" के भीतर चरण 4.2 में आयात किए गए FASTQ फ़ाइलों के फ़ोल्डरों की स्थिति जानें । "नेविगेशन क्षेत्र" के भीतर का चयन करके सभी फ़ोल्डरों को हाइलाइट करें और फिर "बैच" के पास वाले बॉक्स पर क्लिक करे । फ़ाइलों को "चयनित तत्वों" पर ले जाने के लिए दाएं-फ़ेसिंग तीर का उपयोग करें । संवाद बॉक्स के निचले भाग पर "अगला" क्लिक करें ।
    3. संवाद बॉक्स के भीतर, सही FASTQ फ़ाइलों का चयन किया गया था सुनिश्चित करने के लिए "बैच अवलोकन" की समीक्षा करें और उसके बाद "अगला" ।
    4. चरण 4.3 में वर्कफ़्लो डिज़ाइन करते समय सही फ़ाइलें और निर्यात स्थान सुनिश्चित करने के लिए संवाद बॉक्स में वर्कफ़्लो के निंन चरणों की समीक्षा करें: "मानचित्र संदर्भ में पढ़ता है"; डुप्लिकेट मैप की गई पुस्तकें निकालें "; "लक्ष्य क्षेत्रों के लिए आंकड़े बनाएं"; "निर्यात BAM"; "निर्यात टैब सीमांकित पाठ"; "ओवरलैप पर आधारित फ़िल्टर"; और "निर्यात VCF"
    5. संवाद बॉक्स में अंतिम चरण के भीतर-"परिणाम हैंडलिंग"-विकल्प का चयन करें "इनपुट फ़ोल्डर में सहेजें" । संवाद बॉक्स के निचले भाग पर "समाप्त" क्लिक करें ।
      नोट: इसका मतलब यह है कि प्रत्येक नमूने के लिए उत्पादित फ़ाइलें एक ही फ़ोल्डर है कि डेटा पूर्व प्रसंस्करण सॉफ्टवेयर के भीतर FASTQ फ़ाइल भंडार में रखा जाएगा ।

Figure 2
चित्रा 2: अनुक्रमण और डेटा पूर्व प्रसंस्करण सॉफ्टवेयर (सामग्री तालिका) ONDRISeq के प्रयोजनों के लिए अनुकूलित के भीतर FASTQ फ़ाइलों के संस्करण कॉलिंग के लिए कार्यप्रवाह । कार्यप्रवाह में दिए गए चरणों को शोधकर्ता की आवश्यकताओं के आधार पर अंय NGS पुनर्अनुक्रमणित और भिन्न कॉलिंग सॉफ़्टवेयर पर लागू किया जा सकता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

5. संस्करण एनोटेशन

  1. प्रत्येक नमूने की VCF फ़ाइल पर भिन् न एनोटेशन का प्रदर्शन करने के लिए व्याख्या भिन्नता (ANNOVAR)26 स्क्रिप्ट डाउनलोड करें और अनुकूलित करे ।
    1. निंन डेटाबेस को ANNOVAR से डाउनलोड करें एनोटेशन के रूप में शामिल करने के लिए: 1) RefSeq27 (अगस्त 2015 अद्यतन); 2) dbSNP13828 (सितंबर 2014 अद्यतन); 3) Exome एकत्रीकरण कंसोर्टियम29 (ExAC, संस्करण 0.3 नवंबर 2015 अद्यतन); 4) राष्ट्रीय दिल, फेफड़े, और रक्त संस्थान Exome अनुक्रमण परियोजना यूरोपीय पलटन30 (ESP, मार्च 2015 अद्यतन); 5) 1000 जीनोम परियोजना यूरोपीय पलटन31 (1KGP, अगस्त 2015 अद्यतन); 6) ClinVar32 (मार्च 2016 अद्यतन); और 7) संयुक्त एनोटेशन निर्भर कमी33 (CADD), सहिष्णु34 (झारना), और PolyPhen-235से असहिष्णु छंटाई ।
      नोट: जीनोम निर्देशांक और सभी ANNOVAR द्वारा संदर्भित डेटाबेस मानव जीनोम का निर्माण GRCh37/hg19 के लिए भेजा । इसके अतिरिक्त, डेटाबेस संस्करण सूचीबद्ध ONDRISeq के प्रयोजनों के लिए उपयोग किया जाता है, जब डेटाबेस डाउनलोड करने के लिए सबसे अधिक अद्यतन संस्करण उपलब्ध का उपयोग करें ।
    2. यदि वांछित, व्याख्या वेरिएंट की पूरी सूची के उत्पादन के लिए ANNOVAR अनुकूलित, साथ ही साथ--फ़िल्टर कार्रवाई26का उपयोग करके व्याख्या वेरिएंट का एक कम संकलन ।
      नोट: कम सूची शोधकर्ता की जरूरतों के आधार पर अनुकूलित किया जा सकता है । ONDRISeq के प्रयोजनों के लिए, व्याख्या की कम सूची वेरिएंट शामिल नहीं है कि निकटतम एक्सॉन से 15 कुर्सियां या किसी भी वेरिएंट के साथ एक छोटी एलील आवृत्ति (MAF) > 3% में से किसी भी तीन डेटाबेस: 1) ExAC; 2) ESP; आणि ३) 1KGP. यह चरण अत्यधिक अनुशंसित है ।
    3. यदि वांछित, एक बाहर विशिष्ट एलील कॉल शोधकर्ता26की जरूरतों के आधार पर ANNOVAR को अनुकूलित ।
      नोट: ONDRISeq के प्रयोजनों के लिए, ANNOVAR APOE जोखिम alleles rs429358 (सी > टी):p. C130R और rs7412 (सी > टी):p. R176C के लिए किए गए sequencing कॉल का आकलन करने के क्रम में उत्पादन के लिए समग्र APOE जीनोटाइप, जिनमें से छह संभव है संयोजन, सहित: 1) e2/ 2) E3/E2; 3) E4/E2; 4) e3/ 5) E4/E3; 6) E4/E4. इनमें से छह संभावित APOE पादी, E4/E4 हाल-शुरुआत अल्जाइमर रोग36के विकास के लिए सबसे अधिक स्वीकार्य आनुवंशिक जोखिम कारक है ।
  2. क्वेरी रोग उत्परिवर्तन डेटाबेस (सामग्री की तालिका) यदि वेरिएंट पहले रोग के साथ संबद्ध किया गया है, उचित सबूत के साथ निर्धारित करने के लिए । किसी भी वेरिएंट है कि पहले एक उपंयास संस्करण के रूप में रिपोर्ट नहीं किया गया है पर विचार करें ।
    1. ClinVar से ANNOVAR एनोटेशन का आकलन करें, जैसे कि रोग-संबंधित वेरिएंट में किसी भी तरह के वर्गीकृत होने की संभावना रोगजनक या रोगजनक शामिल है ।
  3. silico भविष्यवाणी उपकरण के माध्यम से ब्याह-वेरिएंट37 (SPANR) और मानव ब्याह खोजक38 (HSF, संस्करण 3.0) के आधारित विश्लेषण की प्रक्रिया ।
  4. बड़ी संख्या में नमूने संसाधित कर रहा है, तो विभिन्न नमूनों द्वारा साझा किए गए हैं जो निर्धारित करने के लिए प्रत्येक नमूने के भीतर भिन्न कॉल्स की तुलना करें । यह मैन्युअल रूप से या एक कस्टम डिजाइन स्क्रिप्ट के साथ, संभव अनुक्रमण कलाकृतियों और संदूषण घटनाओं का पता लगाने के लिए अनुमति देता है.
    नोट: ONDRI के प्रयोजनों के लिए, एक कस्टम स्क्रिप्ट के लिए उंहें एक दूसरे से तुलना करके ANNOVAR उत्पादन फ़ाइलों व्याख्या करने के लिए प्रयोग किया जाता है । स्क्रिप्ट एक एनोटेशन शामिल है, एक ही संस्करण बंदरगाह किसी भी अंय नमूनों की विषय आईडी के साथ, अंयथा अध्ययन पलटन में संस्करण के इतिहास का कार्यकाल ।
  5. अमेरिकन कॉलेज ऑफ मेडिकल जेनेटिक्स (ACMG) Pathogenicity दिशानिर्देश39के आधार पर वर्गीकृत वेरिएंट, निंन में से एक के रूप में प्रत्येक संस्करण एक वर्गीकरण निर्दिष्ट: 1) रोगजनक; 2) की संभावना रोगजनक; 3) अनिश्चित महत्व के संस्करण; 4) की संभावना सौम्य; या 5) सौम्य ।
    नोट: ONDRI के प्रयोजनों के लिए, एक घर में डिजाइन पायथन स्क्रिप्ट के लिए एक अर्द्ध स्वचालित आधार पर ACMG वर्गीकरण प्रदर्शन किया जाता है । हालांकि इस अध्ययन के लिए इस्तेमाल नहीं किया, InterVar40 एक समान रूप से डिजाइन उपकरण है कि एक अनुरूप तरीके से उपयोग किया जा सकता है ।
  6. सैंज अनुक्रम < 30एक्स और/या वेरिएंट की एक अनुक्रमण कवरेज के साथ किसी भी वेरिएंट कि वे अनुक्रमण नहीं कर रहे हैं मान्य करने के लिए > 10% अध्ययन पलटन की पहचान की गई है41.

Representative Results

इस के तहत यहां वर्णित के तरीके 528 भागीदार व्यक्तियों कि ONDRI में दाखिल किया गया है से डीएनए नमूने के लिए आवेदन किया गया । नमूने प्रति रन के 24 नमूनों में से 22 रन में ONDRISeq पैनल पर चलाए गए । कुल मिलाकर, sequencing डेटा 78 ± 13x का एक मतलब नमूना कवरेज के साथ उच्च गुणवत्ता का होना निर्धारित किया गया था और सभी व्यक्तिगत एक मतलब नमूना कवरेज > 30एक्स व्यक्त रन । इसके अलावा, औसत पर, सभी लक्षित क्षेत्रों के 94% कम 20x (तालिका 1) कवर किया गया था ।

एक माध्य ९५.६% पढ़ता संदर्भ अनुक्रम के लिए मैप किए गए थे और सभी ONDRISeq चलता था > 90% मैप की गई (तालिका 1) । की मैप की गई पढ़ता, ९२.०% था एक Phred स्कोर ≥ Q30, के साथ केवल एक ही रन है < 80% मैप्ड पढ़ता है इस गुणवत्ता मेट्रिक की मीटिंग । हालांकि, इस रन अभी भी 79x के एक मतलब कवरेज प्रदर्शित और लक्ष्य क्षेत्रों के 93% कम से 20x कवर किया गया ।

पैरामीटर मतलब (± एसडी) सर्वश्रेष्ठ प्रदर्शन खराब प्रदर्शन
क्लस्टर घनत्व (x103/mm2) १४२४ (± 269) १३४७ १८३५
कुल पुस्तकें (106) ४३.१ (± 6.0) ४८.७ ४७.४
मैप की गई पुस्तकें (106) ४०.१ (± 6.0) ४७.१ २५.७
मैप की गई पुस्तकें (%) ९५.६ (± 1.3) ९६.८ ९२.६
Phred क्वालिटी स्कोर ≥ Q30 (%) ९२.० (± 6.0) 92 ६८.३
नमूना कवरेज (x) 78 (± 13) ९९ 51

तालिका 1: sequencing गुणवत्ता मैट्रिक्स ONDRISeq पर 22 रन के लिए ।

केस स्टडी: एक पीडी मरीज में दुर्लभ वेरिएंट की पहचान ।

हमारे लक्षित NGS कार्यप्रवाह की उपयोगिता को प्रदर्शित करने के लिए, हम एक 68 वर्षीय, पुरुष, पार्किंसंस रोग रोगी का उदाहरण पेश करते हैं । डीएनए नमूना 23 अन्य ONDRI नमूनों के साथ ONDRISeq पैनल का उपयोग कर NGS डेस्कटॉप साधन (सामग्री की मेज) पर चलाया गया था. भागो १,५५५ x 103/mm2के एक क्लस्टर घनत्व प्रदर्शित किया । रोगी के विशेष नमूने 76x का मतलब कवरेज प्रदर्शित, लक्ष्य क्षेत्रों के ९३.९% के साथ कम से कवर 20x ।

कस्टम bioinformatics कार्यप्रवाह के साथ भिन् न कॉलिंग और एनोटेशन निष्पादित करने के बाद, रोगी को exons और आसपास के 250 ONDRISeq पैनल पर शामिल 80 जीन की बीपी के भीतर बंदरगाह के लिए पाया गया था । हालांकि, ANNOVAR पाइपलाइन संस्करण अनुक्रम आंटलजी और MAF, जैसा कि ऊपर वर्णित पर विचार करके वेरिएंट की संख्या को कम करने में सक्षम था । यह सात वेरिएंट कि मैनुअल उपचारात्मक (चित्रा 3) से गुजरा की एक सूची का उत्पादन किया । इन सात वेरिएंट से, दो संभावित नैदानिक महत्व होने के रूप में पहचान की गई । इस प्रक्रिया को ONDRI की जरूरतों के लिए विशिष्ट है और उन है कि अपेक्षाकृत आम आबादी में दुर्लभ है और आंटलजी में इस तरह के प्रोटीन में परिवर्तन पैदा कर रहे है की पहचान के द्वारा किया गया । क्या संस्करण पहले रोग के साथ संबद्ध किया गया था, प्रोटीन के लिए deleteriousness के silico भविष्यवाणियों में और वेरिएंट के ACMG pathogenicity वर्गीकरण भी इस प्रक्रिया में उपयोग किया गया ।

कम सूची से पहले की पहचान एक heterozygous संस्करण, अर्थात् LRRK2: c. T3939A, बकवास संस्करण पी C1313 * में जिसके परिणामस्वरूप था । LRRK2 encodes प्रोटीन Leucine-रिच दोहराने कळेनासे 2, जो दोनों GTPase और कळेनासे गतिविधि42के पास । इसके अलावा, इस जीन के भीतर उत्परिवर्तनों को पारिवारिक पार्किंसंस रोग43के प्रमुख कारणों के बीच में जाना जाता है । इस संस्करण के भीतर एक समयपूर्व बंद codon परिचय LRRK2, जिससे एमिनो एसिड अवशेषों 1314-2527 खोने । यह जटिल प्रोटीन (Roc), Roc के सी-टर्मिनल (ï) के प्रोटीन रास के अनुवाद को रोकता है, और प्रोटीन कळेनासे डोमेन, जो एक असामान्य Rho GTPase, GTP बाइंडिंग प्रोटीन, और प्रोटीन कळेनासे के रूप में कार्य करने में शामिल हैं, क्रमशः, और भविष्यवाणी की गई थी CADD (CADD Phred = ३६) द्वारा उत्पन्न silico विश्लेषण द्वारा में हानिकारक होना. इस संस्करण भी ExAC और ESP, क्रमशः में ०.००४% और 0.01% की एक MAF के साथ दुर्लभ है, और 1000G डेटाबेस से अनुपस्थित है । इसके अतिरिक्त, यह सभी 528 के बाहर ही रोगी है अनुक्रम जो इस संस्करण है, जो उपंयास है, क्योंकि यह पहले रोग उत्परिवर्तन डेटाबेस में वर्णित नहीं किया गया है (सामग्री की मेज) वहन करती है । वैरिएंट कॉल के भरोसे 109x की अपनी गहरी कवरेज से पुष्टि हुई । अंत में, संस्करण AMCG मानकों और pathogenicity के लिए दिशा निर्देशों के साथ मूल्यांकन किया गया था और रोगजनक होने के रूप में वर्गीकृत किया गया ।

रोगी भी एक दूसरे heterozygous संस्करण, NR4A2: c. C755A, में परिणाम किया जाता है, जो अर्थ परिवर्तन पी P252Q । प्रोटीन द्वारा इनकोडिंग NR4A2, परमाणु रिसेप्टर उपपरिवार 4 समूह के एक सदस्य 2, एक प्रतिलेखन कारक इस जीन के भीतर dopaminergic न्यूरॉन्स44 और उत्परिवर्तनों की पीढ़ी में शामिल किया गया है पहले से जुड़े हुए है पार्किंसंस रोग४५. गैर ध्रुवीय glutamine को ध्रुवीय पंक्ति के प्रतिस्थापन CADD द्वारा उत्पंन silico भविष्यवाणी विश्लेषण में द्वारा हानिकारक होने की भविष्यवाणी की थी (CADD Phred = २१.१), लेकिन नहीं झारना या PolyPhen द्वारा उत्पंन विश्लेषण द्वारा-2 । संस्करण दुर्लभ है, ExAC और ESP और 1000G दोनों से अनुपस्थिति में ०.००४% की एक MAF के साथ । संस्करण भी एक ONDRI संवहनी संज्ञानात्मक हानि के साथ का निदान भागीदार में पहचान की थी, लेकिन पहले रोग उत्परिवर्तन डेटाबेस में वर्णित नहीं किया गया है । इस संस्करण केवल 18x की कवरेज था, तथापि, इस क्रम में अपनी वैधता सुनिश्चित करने के लिए सैंज अनुक्रमण किया जाएगा । अंत में, संस्करण अनिश्चित महत्व का होना निर्धारित किया गया था जब ACMG मानकों और pathogenicity के लिए दिशानिर्देश के साथ मूल्यांकन किया ।

ONDRISeq पैनल और bioinformatics पाइपलाइन भी प्रत्येक नमूने के APOE जीनोटाइप को निर्धारित करने में सक्षम है । इस रोगी के लिए निर्धारित किया गया था APOE जीनोटाइप e3/

Figure 3
चित्रा 3: ANNOVAR से एक कम उत्पादन का उदाहरण मैन्युअल रूप से प्रदर्शित उपचारात्मक, व्याख्या वेरिएंट. एक 68 साल पुराने, पुरुष, पार्किंसंस रोग के साथ रोगी के मामले अध्ययन से कम ANNOVAR उत्पादन । व्याख्या वेरिएंट उन है कि सबसे नैदानिक महत्व के होने की संभावना है की पहचान करने के लिए, लाल बक्से द्वारा चिह्नित के रूप में उपपादरी हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Discussion

डीएनए नमूना निष्कर्षण से पथ में ब्याज की है कि जब एक रोगी के निदान, रोग प्रगति, और संभव उपचार के विकल्प पर विचार कर सकते हैं की पहचान करने के लिए, यह महत्वपूर्ण है की विविध प्रकृति की पहचान करने के लिए आवश्यक कार्यप्रणाली दोनों अनुक्रमण और उचित डेटा प्रोसेसिंग के लिए । यहां वर्णित प्रोटोकॉल लक्षित NGS और बाद में संभावित नैदानिक महत्व के दुर्लभ वेरिएंट की पहचान करने के लिए आवश्यक bioinformatic विश्लेषण के उपयोग का एक उदाहरण है । विशेष रूप से, हम ONDRI जीनोमिक्स उपसमूह द्वारा उठाए गए दृष्टिकोण जब ONDRISeq कस्टम डिजाइन NGS पैनल का उपयोग कर प्रस्तुत करते हैं ।

यह मान्यता है कि इन तरीकों एक विशिष्ट NGS मंच के आधार पर विकसित किया गया है और वहाँ अन्य अनुक्रमण प्लेटफार्मों और लक्ष्य संवर्धन किट है कि इस्तेमाल किया जा सकता है । हालांकि, NGS मंच और डेस्कटॉप साधन (सामग्री की तालिका) अपने प्रारंभिक अमेरिकी खाद्य और औषधि प्रशासन (एफडीए) अनुमोदन के आधार पर चुना गया था46। यह प्राधिकरण NGS प्रोटोकॉल की पसंद के साथ किया जा सकता जो उच्च-गुणवत्ता sequencing और अनुक्रमण पर रखा जा सकता जो विश्वसनीयता को प्रतिबिंबित करता है पढ़ता है ।

हालांकि कवरेज की गहराई के साथ सटीक अनुक्रमण पढ़ता प्राप्त करना बहुत महत्वपूर्ण है, अंतिम दुर्लभ संस्करण विश्लेषण के लिए आवश्यक bioinformatics प्रसंस्करण महत्वपूर्ण है और अभिकलनी गहन किया जा सकता है । sequencing प्रक्रिया में उत्पन्न हो सकने वाली त्रुटियों के कई स्रोतों के कारण, एक मज़बूत bioinformatics पाइपलाइन पेश किया जा सकता जो विभिन्न अशुद्धियों के लिए सही होना चाहिए । वे मानचित्रण की प्रक्रिया में, प्रवर्धन पूर्वाग्रह पुस्तकालय की तैयारी में पीसीआर प्रवर्धन द्वारा शुरू की, और प्रौद्योगिकी sequencing कलाकृतियों का उत्पादन47में से उत्पंन हो सकता है । कोई फर्क नहीं पड़ता पढ़ने मैपिंग और भिन्न कॉलिंग करने के लिए उपयोग किया गया सॉफ़्टवेयर, स्थानीय पुनर्संरेखण, डुप्लिकेट मैप की गई पढ़ता को निकालने, और भिन्न रूप से कॉल करते समय गुणवत्ता नियंत्रण के लिए उचित पैरामीटर सेट करने सहित इन त्रुटियों को कम करने के लिए सामान्य तरीके हैं । इसके अतिरिक्त, भिन्नता कॉलिंग के दौरान चुने गए पैरामीटर्स के आधार पर अध्ययन के लिए सबसे उपयुक्त क्या है हाथ11भिन्न हो सकते हैं । न्यूनतम कवरेज और एक संस्करण और आसपास के न्यूक्लियोटाइड कि यहां लागू किया गया के गुणवत्ता स्कोर के रूप में उपयुक्त विशिष्टता और संवेदनशीलता के बीच एक संतुलन बनाने के लिए चुना गया । इन मापदंडों ONDRISeq पैनल के लिए मान्य किया गया है के आधार पर तीन अलग आनुवंशिक तकनीक के साथ सामंजस्य कॉलिंग, के रूप में पहले वर्णित, सहित: 1) चिप आधारित genotyping; 2) allelic भेदभाव परख; और 3)9सैंज अनुक्रमण ।

सही संस्करण बुला निंनलिखित, क्रम में संभावित नैदानिक महत्व, एनोटेशन और उपचारात्मक के उन निर्धारित करने के लिए आवश्यक हैं । अपनी खुली पहुंच मंच के कारण, ANNOVAR दोनों एनोटेशन और प्रारंभिक संस्करण स्क्रीनिंग या उंमूलन के लिए एक उत्कृष्ट उपकरण है । के अलावा आसानी से सुलभ जा रहा है, ANNOVAR किसी भी VCF फ़ाइल के लिए लागू किया जा सकता है, कोई बात नहीं क्या अनुक्रमण मंच प्रयोग किया जाता है, और शोध26की जरूरतों के आधार पर अनुकूलन योग्य है ।

एनोटेशन के बाद, वेरिएंट यदि वे नैदानिक महत्व के होना करने के लिए विचार किया जाना चाहिए यह निर्धारित करने के लिए व्याख्या की जानी चाहिए । न केवल यह प्रक्रिया जटिल हो जाता है, लेकिन यह अक्सर मनोवाद और मानव त्रुटि के लिए प्रवण है । इस कारण से, ACMG किसी भी संस्करण के pathogenicity के लिए सबूत का आकलन करने के लिए दिशानिर्देश निर्धारित किया है । हम एक गैर पर्याय, दुर्लभ संस्करण आधारित मैनुअल उपचारात्मक दृष्टिकोण है, जो इन दिशानिर्देशों के आधार पर निर्माण किया है और व्यक्तिगत रूप से प्रत्येक संस्करण है कि एक कस्टम डिजाइन अजगर स्क्रिप्ट के साथ पाइप लाइन के माध्यम से पारित करने में सक्षम है आकलन द्वारा सुरक्षा लागू है कि दिशानिर्देशों के आधार पर वेरिएंट को वर्गीकरण । इस तरह, प्रत्येक संस्करण रोगजनक की एक रैंकिंग, संभावना रोगजनक, अनिश्चित महत्व, की संभावना सौम्य, या सौम्य सौंपा है, और हम संस्करण उपचारात्मक प्रक्रिया के लिए मानकीकरण और पारदर्शिता जोड़ने में सक्षम हैं । यह पहचान करने के लिए महत्वपूर्ण है कि संस्करण उपचारात्मक के विशेष, bioinformatics पाइपलाइन से परे, अनुसंधान की जरूरतों के आधार पर व्यक्तिगत रूप से किया जाएगा, और इसलिए प्रस्तुत तरीके के दायरे से परे था ।

हालांकि यहां प्रस्तुत तरीके ONDRI के लिए विशिष्ट हैं, जब ब्याज की संवैधानिक रोगों की एक बड़ी संख्या पर विचार अनुवाद किया जा सकता है वर्णित कदम । कई phenotypes के लिए जीन संघों की संख्या में वृद्धि के रूप में, लक्षित NGS एक दृष्टिकोण है कि पिछले अनुसंधान कि क्षेत्र में किया गया है पर कैपिटल कर सकते है प्रेरित परिकल्पना के लिए अनुमति देता है । फिर भी, वहां लक्षित NGS और पद्धति प्रस्तुत करने की सीमाएं हैं । केवल जीनोम के विशिष्ट क्षेत्रों पर ध्यान केंद्रित करके, खोज के क्षेत्रों में रुचि के उपंयास alleles तक ही सीमित हैं । इसलिए, उपंयास जीन या अंय जीनोमिक loci अनुक्रमण लक्ष्य है, जो WGS या वेस दृष्टिकोण के साथ पता चला सकता है, की पहचान नहीं की जा सकती द्वारा कवर से परे । वहां भी जीनोम के भीतर क्षेत्र है कि NGS दृष्टिकोण के साथ सही अनुक्रम के लिए मुश्किल हो सकता है, दोहराया दृश्यों का एक उच्च डिग्री के साथ उन सहित48 या उन है कि जीसी सामग्री में अमीर है49। सौभाग्य से, जब लक्षित NGS का उपयोग, वहां एक प्राथमिकताओं जीनोमिक क्षेत्रों के साथ अपनेपन का एक उच्च डिग्री है अनुक्रम, और क्या इन तकनीकी चुनौतियों का सामना हो सकता है । अंत में, वर्तमान में NGS डेटा से प्रतिलिपि संख्या वेरिएंट का पता लगाने के मानकीकृत50नहीं है । हालांकि, इन चिंताओं के bioinformatics समाधान क्षितिज पर हो सकता है; नए अभिकलनी उपकरण ONDRI रोगियों में भिन्नता के इन अतिरिक्त रूपों का विश्लेषण करने में मदद कर सकते हैं.

अपनी सीमाओं के बावजूद, लक्षित NGS उच्च गुणवत्ता वाले डेटा प्राप्त करने में सक्षम है, एक परिकल्पना के भीतर संचालित दृष्टिकोण है, जबकि शेष अपने WGS और वेस समकक्षों की तुलना में कम खर्चीला । न केवल इस पद्धति कुशल और निर्देशित अनुसंधान के लिए उपयुक्त है, लक्षित NGS के नैदानिक कार्यांवयन तेजी से बढ़ रहा है । इस तकनीक में विभिन्ना रोगों के आणविक मार्ग के संबंध में कई तरह के सवालों के जवाब दिए जा रहे हैं. यह भी अपेक्षाकृत कम लागत पर एक सटीक नैदानिक उपकरण में विकसित किया जा रहा है जब वेस और WGS का विरोध किया । यहां तक कि जब सोने की तुलना में मानक सैंज अनुक्रमण, लक्षित NGS अपने समय में प्रतिस्पर्धा कर सकते है और लागत कुशलता । इन कारणों के लिए, यह एक वैज्ञानिक या चिकित्सक जो प्राप्त करता है और NGS डेटा का उपयोग करता है के लिए महत्वपूर्ण है, उदाहरण के लिए, एक प्रयोगशाला या नैदानिक रिपोर्ट में पाठ के रूप में दिया, को समझने के लिए जटिल "ब्लैक बॉक्स" कि परिणाम पर निर्भर । यहां प्रस्तुत तरीकों में मदद करनी चाहिए उपयोगकर्ताओं को NGS डेटा की पीढ़ी और व्याख्या अंतर्निहित प्रक्रिया को समझते हैं ।

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

हम अपने अध्ययन के साथ उनकी सहमति और सहयोग के लिए सभी ONDRI प्रतिभागियों का शुक्रिया अदा करना चाहेंगे । ONDRI जांचकर्ताओं के लिए धंयवाद (www । ONDRI.ca/people), हमारे नेतृत्व जांचकर्ता (MJS), और ONDRI शासी समितियों सहित: कार्यकारी समिति, संचालन समिति, प्रकाशन समिति, भर्ती समिति, मूल्यांकन प्लेटफार्मों, और परियोजना प्रबंधन टीम । हम उनकी तकनीकी विशेषज्ञता के लिए लंदन के रीजनल जीनोमिक्स सेंटर का भी शुक्रिया अदा करते हैं । AAD लंदन और मिडिलसेक्स परास्नातक स्नातक अनुसंधान छात्रवृत्ति के अल्जाइमर सोसायटी द्वारा समर्थित है । SMKF ALS कनाडा टिम ई. Noël Postdoctoral फैलोशिप द्वारा समर्थित है ।

Materials

Name Company Catalog Number Comments
4 mL EDTA K2 tubes Fisher Scientific 02-689-4
1 M Tris Buffer Bio Basic Canada Inc. SD8141
Gentra Puregene Blood Kit Qiagen 158389 1,000 mL Kit. This is the blood extraction kit, referred to in step 1.3.
NanoDrop-1000 Spectrophotometer Thermo Fisher Scientific ND-2000 Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2.
Qubit 2.0 fluorometer Invitrogen Q32866 This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3.
Nextera Rapid Custom Capture Enrichment Kit Illumina, Inc. FC-140-1009 Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion.
2100 BioAnalyzer Agilent Technologies G2939BA This is a automated electrophoresis system, referred to in step 3.1.4.
High Sensitivity DNA Reagent Kit Agilent Technologies 5067-4626 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. 
MiSeq Reagent Kit v3 Illumina, Inc. MS-102-3003 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1.
MiSeq Personal Genome Sequencer Illumina, Inc. SY-410-1003 This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion.
Experiment Manager Illumina, Inc. This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html
BaseSpace Illumina, Inc. SW-410-1000 This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/
CLC Genomics Workbench 10.1.1 Qiagen 832000 Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2
Annotate Variation http://annovar.openbioinformatics.org/en/latest/user-guide/download/
RefSeq National Center for Biotechnology Information https://www.ncbi.nlm.nih.gov/refseq/
dbSNP138 National Center for Biotechnology Information https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138
Exome Aggregation Consortium Broad Institute http://exac.broadinstitute.org/
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort University of Washington and the Broad Institute http://evs.gs.washington.edu/EVS/
ClinVar National Center for Biotechnology Information https://www.ncbi.nlm.nih.gov/clinvar/
Combined Annotation Dependent Depletion University of Washington and Hudson-Alpha Institute for Biotechnology http://cadd.gs.washington.edu/
Sorting Intolerant from Tolerant J. Craig Venter Instutite http://sift.jcvi.org/
PolyPhen-2 Brigham and Women's Hospital, Harvard Medical School http://genetics.bwh.harvard.edu/pph2/
Human Gene Mutation Database Qiagen 834050 This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php
Splicing-based Analysis of Variants Frey lab, University of Toronto http://tools.genes.toronto.edu/
Human Splicing Finder Aix Marseille Université http://www.umd.be/HSF3/HSF.shtml
Other materials
Centrifuge
Disposable transfer pipets

DOWNLOAD MATERIALS LIST

References

  1. Metzker, M. L. Sequencing technologies - the next generation. Nat Rev Genet. 11 (1), 31-46 (2010).
  2. Mardis, E. R. Next-generation DNA sequencing methods. Annu Rev Genomics Hum Genet. 9, 387-402 (2008).
  3. Shendure, J., Ji, H. Next-generation DNA sequencing. Nat Biotechnol. 26 (10), 1135-1145 (2008).
  4. Sanger, F., Nicklen, S., Coulson, A. R. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74 (12), 5463-5467 (1977).
  5. Farhan, S. M. K., Hegele, R. A. Exome Sequencing: New Insights into Lipoprotein Disorders. Current Cardiology Reports. 16 (7), (2014).
  6. Choi, M., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 106 (45), 19096-19101 (2009).
  7. Mardis, E. R. DNA sequencing technologies: 2006-2016. Nat Protoc. 12 (2), 213-218 (2017).
  8. Farhan, S. M., et al. The Ontario Neurodegenerative Disease Research Initiative (ONDRI). Can J Neurol Sci. 44 (2), 196-202 (2017).
  9. Farhan, S. M. K., et al. The ONDRISeq panel: custom-designed next-generation sequencing of genes related to neurodegeneration. NPJ Genom Med. (16032), 1-11 (2016).
  10. El-Metwally, S., Hamza, T., Zakaria, M., Helmy, M. Next-generation sequence assembly: four stages of data processing and computational challenges. PLoS Comput Biol. 9 (12), e1003345 (2013).
  11. Yohe, S., Thyagarajan, B. Review of Clinical Next-Generation Sequencing. Arch Pathol Lab Med. , (2017).
  12. Qiagen. Gentra Puregene Handbook. , 4th edn, (2014).
  13. NanoDrop Technologies, Inc. Spectrophotometer V3.5 User's Manual. , (2007).
  14. Invitrogen by Life Technologies. Qubit 2.0 Fluorometer User Manual. Vol. Q32866. , (2010).
  15. Illumina, Inc. Nextera Rapid Capture Enrichment Guide. , Vol. 15037436 v01 (2016).
  16. Illumina, Inc. Nextera Rapid Capture Enrichment Reference Guide. , Vol. 15037436 v01 (2016).
  17. Rev. B. Illumina, Inc. MiSeq Reagent Kit v3 Reagent Preparation Guide. , Vol. 15044932 Rev. B (2013).
  18. Illumina, Inc. MiSeq System Guide. , Vol. 15027617 v01 (2015).
  19. BaseSpace Sequence Hub. , https://basespace.illumina.com/dashboard (2017).
  20. Rev. B. Agilent Technologies. Agilent High Sensitivity DNA Kit Guide. , Vol. G2938-90321 (2013).
  21. Illumina, Inc. MiSeq System Denature and Dilute Libraries Guide. , Vol. 15039740 v01 (2016).
  22. Illumina, Inc. System Specification Sheet: MiSeq System. , (2016).
  23. BaseSpace Sequence Hub Help Center. , Available from: https://help.basespace.illumina.com/ (2017).
  24. Qiagen. Genomics Workbench 10.1.1 User Manual. , (2017).
  25. Ebbert, M. T., et al. Evaluating the necessity of PCR duplicate removal from next-generation sequencing data and a comparison of approaches. BMC Bioinformatics. 17, Suppl 7. 239 (2016).
  26. Wang, K., Li, M., Hakonarson, H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res. 38 (16), e164 (2010).
  27. Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 44 (D1), D733-D745 (2016).
  28. Kitts, A., Phan, L., Ward, M., Bradley Holmes, J. The Database of Short Genetic Variation (dbSNP). , National Center for Biotechnology Information. Bethesda, MD. (2013).
  29. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  30. Exome Variant Server, NHLBI GO Exome Sequencing Project (ESP). , http://evs.gs.washington.edu/EVS/ (2017).
  31. Auton, A., et al. A global reference for human genetic variation. Nature. 526 (7571), 68-74 (2015).
  32. Landrum, M. J., et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44 (D1), D862-D868 (2016).
  33. Kircher, M., et al. A general framework for estimating the relative pathogenicity of human genetic variants. Nat Genet. 46 (3), 310-315 (2014).
  34. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Protoc. 4 (7), 1073-1081 (2009).
  35. Adzhubei, I. A., et al. A method and server for predicting damaging missense mutations. Nat Methods. 7 (4), 248-249 (2010).
  36. Bertram, L., McQueen, M. B., Mullin, K., Blacker, D., Tanzi, R. E. Systematic meta-analyses of Alzheimer disease genetic association studies: the AlzGene database. Nat Genet. 39 (1), 17-23 (2007).
  37. Xiong, H. Y., et al. The human splicing code reveals new insights into the genetic determinants of disease. Science. 347 (6218), (2015).
  38. Desmet, F. O., et al. Human Splicing Finder: an online bioinformatics tool to predict splicing signals. Nucleic Acids Res. 37 (9), e67 (2009).
  39. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 17 (5), 405-424 (2015).
  40. Li, Q., Wang, K. InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Am J Hum Genet. 100 (2), 267-280 (2017).
  41. Yang, Z. L., Sun, G. L. High-frequency, low-coverage "false positives" mutations may be true in GS Junior sequencing studies. Scientific Reports. 7, (2017).
  42. Gandhi, P. N., Wang, X., Zhu, X., Chen, S. G., Wilson-Delfosse, A. L. The Roc domain of leucine-rich repeat kinase 2 is sufficient for interaction with microtubules. J Neurosci Res. 86 (8), 1711-1720 (2008).
  43. Goldwurm, S., et al. The G6055A (G2019S) mutation in LRRK2 is frequent in both early and late onset Parkinson's disease and originates from a common ancestor. J Med Genet. 42 (11), e65 (2005).
  44. Caiazzo, M., et al. Direct generation of functional dopaminergic neurons from mouse and human fibroblasts. Nature. 476 (7359), 224-227 (2011).
  45. Grimes, D. A., et al. Translated mutation in the Nurr1 gene as a cause for Parkinson's disease. Mov Disord. 21 (7), 906-909 (2006).
  46. Collins, F. S., Hamburg, M. A. First FDA authorization for next-generation sequencer. N Engl J Med. 369 (25), 2369-2371 (2013).
  47. Van der Auwera, G. A., et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline. Curr Protoc Bioinformatics. 43, 11-33 (2013).
  48. Treangen, T. J., Salzberg, S. L. Repetitive DNA and next-generation sequencing: computational challenges and solutions. Nat Rev Genet. 13 (1), 36-46 (2011).
  49. Shin, S., Park, J. Characterization of sequence-specific errors in various next-generation sequencing systems. Mol Biosyst. 12 (3), 914-922 (2016).
  50. Povysil, G., et al. panelcn.MOPS: Copy-number detection in targeted NGS panel data for clinical diagnostics. Hum Mutat. 38 (7), 889-897 (2017).

Tags

आनुवंशिकी 134 अंक अगली पीढ़ी अनुक्रमण लक्षित अनुक्रमण अनुक्रमण संस्करण कॉलिंग संस्करण एनोटेशन संवैधानिक रोग
संवैधानिक रोग के आनुवंशिक निर्धारकों का मूल्यांकन करने के लिए लक्षित अगली पीढ़ी के अनुक्रमण और Bioinformatics पाइपलाइन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Dilliott, A. A., Farhan, S. M. K.,More

Dilliott, A. A., Farhan, S. M. K., Ghani, M., Sato, C., Liang, E., Zhang, M., McIntyre, A. D., Cao, H., Racacho, L., Robinson, J. F., Strong, M. J., Masellis, M., Bulman, D. E., Rogaeva, E., Lang, A., Tartaglia, C., Finger, E., Zinman, L., Turnbull, J., Freedman, M., Swartz, R., Black, S. E., Hegele, R. A. Targeted Next-generation Sequencing and Bioinformatics Pipeline to Evaluate Genetic Determinants of Constitutional Disease. J. Vis. Exp. (134), e57266, doi:10.3791/57266 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter