Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

त्रुटि-सही डीएनए और आरएनए अनुक्रमण का उपयोग कर दुर्लभ घटना का पता लगाने

Published: August 3, 2018 doi: 10.3791/57509
* These authors contributed equally

Summary

अगली पीढ़ी के अनुक्रमण (NGS) जीनोमिक विशेषता है कि मंच के उच्च त्रुटि दर (~ 0.5-2.0%) द्वारा सीमित है के लिए एक शक्तिशाली उपकरण है । हम त्रुटि-सही sequencing है कि हमें NGS त्रुटि दर निराकरण और ०.०००१ के रूप में दुर्लभ रूप में संस्करण एलील अंश पर उत्परिवर्तनों का पता लगाने की अनुमति के हमारे तरीकों का वर्णन ।

Abstract

पारंपरिक अगली पीढ़ी के अनुक्रमण तकनीक (NGS) एक दशक से अधिक के लिए अपार जीनोमिक लक्षण वर्णन के लिए अनुमति दी है । विशेष रूप से, NGS द्रोह में क्लोनल उत्परिवर्तनों के स्पेक्ट्रम का विश्लेषण करने के लिए इस्तेमाल किया गया है । हालांकि अभी तक पारंपरिक सैंज तरीकों की तुलना में अधिक कुशल, NGS अपने ~ 0.5-2.0% की उच्च त्रुटि दर के कारण दुर्लभ क्लोनिंग और उपक्लोन उत्परिवर्तनों की पहचान के साथ संघर्ष । इस प्रकार, मानक NGS है कि उत्परिवर्तनों के लिए पता लगाने की एक सीमा है > 0.02 संस्करण एलील अंश (VAF) । जबकि रोग ज्ञात बीमारी के बिना रोगियों में इस दुर्लभ उत्परिवर्तन के लिए नैदानिक महत्व स्पष्ट रहता है, ल्यूकेमिया के लिए इलाज रोगियों काफी परिणाम में सुधार हुआ है जब अवशिष्ट रोग < 0.0001 द्वारा प्रवाह cytometry है । आदेश में NGS के इस artefactual पृष्ठभूमि को कम करने के लिए, कई तरीकों को विकसित किया गया है । यहां हम त्रुटि के लिए एक विधि का वर्णन-सही डीएनए और आरएनए अनुक्रमण (ईसीएस), जो दोनों एक 16 बीपी यादृच्छिक सूचकांक के साथ टैगिंग व्यक्तिगत अणुओं शामिल है त्रुटि-सुधार और मल्टीप्लेक्स के लिए एक 8 बीपी रोगी-विशिष्ट सूचकांक । हमारे विधि का पता लगाने और संस्करण एलील भिन्न (VAFs) परिमाण के दो आदेश NGS का पता लगाने की सीमा से कम है और ०.०००१ VAF के रूप में दुर्लभ के रूप में विरल पर ट्रैक कर सकते हैं ।

Introduction

जैसा कि हम उंर, सेल प्रभाग के दौरान mutagens और stochastic त्रुटियों के लिए जोखिम जीनोम में दैहिक विचलन के संचय में परिणाम है, और यह घातक परिवर्तन, न्यूरो विकासात्मक रोगों, बाल चिकित्सा के मौलिक रोगजनन पर निर्भर विकारों और सामांय उंर बढ़ने1,2। रोग के साथ दैहिक उत्परिवर्तनों-ड्राइविंग संभावित प्रारंभिक पता लगाने और जोखिम प्रबंधन3,4,5के लिए महत्वपूर्ण नैदानिक और शकुनी मार्क्स हैं । आदेश में बेहतर शारीरिक clonogenesis, जो नैदानिक और अनुसंधान फैसलों को सूचित करेंगे समझने के लिए, सटीक ठहराव और इन उत्परिवर्तनों के लक्षण वर्णन प्राथमिक महत्व का है । अगली पीढ़ी के अनुक्रमण (NGS) वर्तमान में विषम डीएनए नमूनों में क्लोनल उत्परिवर्तनों का अध्ययन करने के लिए प्रयोग किया जाता है; हालांकि, NGS पर उत्परिवर्तनों की पहचान करने के लिए सीमित है > 0.02 संस्करण एलील अंश (VAF)-के कारण अंतर्निहित त्रुटि-0.5 की दर-2.0% के अनुक्रमण प्लेटफार्मों6,7,8। नतीजतन, कम VAF में नैदानिक और prognostically महत्वपूर्ण दैहिक वेरिएंट ट्रैकिंग मानक NGS का उपयोग कर प्राप्त नहीं किया जा सकता है ।

हाल ही में, NGS8,9,10,11की त्रुटि दर को दरकिनार करने के लिए विभिन्न विधियों का विकास किया गया है । इन तरीकों आणविक टैगिंग, जो अनुक्रमण के बाद त्रुटि सुधार सक्षम बनाता है का उपयोग । अनुक्रमण लाइब्रेरी में प्रत्येक अणु या जीनोमिक टुकड़ा एक यादृच्छिक अद्वितीय आणविक पहचानकर्ता (UMI) है कि अणु के लिए विशिष्ट है के साथ टैग किया जाता है । UMIs यादृच्छिक न्यूक्लियोटाइड (8-16 एन) के एक स्ट्रिंग के परिवर्तन के द्वारा निर्माण कर रहे हैं । एक दूसरा नमूना-विशिष्ट बारकोड भी कार्यप्रवाह में एकीकृत है जो एक ही NGS अनुक्रमण चलाने में कई नमूने मल्टीप्लेक्सिंग सक्षम बनाता है । पीसीआर प्रवर्धन आणविक टैग पुस्तकालय पर किया जाता है, और बाद में पुस्तकालय अनुक्रमण के लिए भेजा जाता है । पुस्तकालय की तैयारी के दौरान, यह है कि त्रुटियों बेतरतीब ढंग से पीसीआर प्रवर्धन और अनुक्रमण8के दौरान जीनोमिक टुकड़ा करने के लिए पेश किया जाएगा उम्मीद है । यादृच्छिक sequencing त्रुटियों को निकालने के लिए, अपुष्ट sequencing पढ़ता UMI के अनुसार समूहीकृत होते हैं । sequencing से कलाकृतियों की उंमीद नहीं कर रहे है सभी में एक ही UMI के साथ एक ही जीनोमिक स्थिति में परिचय की stochastic प्रकृति के कारण पढ़ता है, जबकि एक सच्चे संस्करण ईमानदारी से परिलक्षित किया जाएगा और सभी पढ़ता है कि शेयर एक ही UMI में अनुक्रम । कलाकृतियों को bioinformatically निकाला जाता है । यहां, हम एक न्यूक्लियोटाइड वेरिएंट (SNVs) और छोटे सम्मिलन-विलोपन (Indels) की पहचान करने के लिए डीएनए के लिए प्रयोगशाला में अनुकूलित त्रुटि-सही sequencing (ईसीएस) की तीन विधियों का वर्णन है, और नीचे जीन अभिव्यक्ति की ठहराव की सुविधा के लिए आरएनए के लिए NGS त्रुटि थ्रेशोल्ड ।

पहली विधि का वर्णन एक तरह से दुर्लभ दैहिक जीन विशिष्ट शोधकर्ताओं द्वारा डिजाइन प्राइमरों का उपयोग कर घटना के लिए देखो । पुस्तकालय की तैयारी करने से पहले, शोधकर्ताओं डिजाइन प्राइमरों के लिए ब्याज के टुकड़े लक्ष्य चाहिए । हमने वेब-एप Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/) का इस्तेमाल किया था । Amplicons 200 – 250 bp पोलीमरेज़ श्रृंखला प्रतिक्रिया के लिए आदर्श होते हैं (पीसीआर) के रूप में ये होगा, एक बार UMIs शामिल किया गया है, उत्पन्न अतिव्यापी युग्मित-अंत १५० बीपी युग्मित अंत पढ़ता के साथ पढ़ता है. इष्टतम प्राइमर डिजाइन शर्तों के लिए इस्तेमाल किया जा रहे हैं: ंयूनतम प्राइमर आकार = 19; इष्टतम प्राइमर आकार = 25; अधिकतम प्राइमर आकार = 30; न्यूनतम Tm = ६४ ° c; इष्टतम Tm = ७० ° c; अधिकतम Tm = ७४ डिग्री सेल्सियस; अधिकतम Tm अंतर = 5 ° c; न्यूनतम GC सामग्री = ४५; अधिकतम GC सामग्री = ८०; वापसी के लिए संख्या = 20; अधिकतम 3 ' अंत स्थिरता = १०० ।

विधि 2 में, हम एक Illumina रसायन विज्ञान के साथ ईसीएस-डीएनए प्रोटोकॉल के संयोजन के रूप में ०.०००१ VAF व्यावसायिक रूप से उपलब्ध जीन पैनलों है कि amplicons के सैकड़ों शामिल का उपयोग दुर्लभ के रूप में कम से कम क्लोनल SNVs और छोटे Indels के लिए सर्वेक्षण विधि का वर्णन । हम हमारे प्रयोग के लिए TruSight माइलॉयड अनुक्रमण पैनल (Illumina) का इस्तेमाल किया है और बाल चिकित्सा माइलॉयड रोगों के लिए ब्याज की अतिरिक्त जीन शामिल करने के लिए एक विस्तारित पैनल डिजाइन किए हैं । इन पैनलों अद्वितीय आणविक पहचानकर्ता (UMIs) है कि त्रुटि सुधार की सुविधा होगी की पेशकश नहीं की है, तो हम इन पैनलों के लिए अपने स्वयं के अनुकूलक रणनीति जोड़ लिया है । ईसीएस को विभिन्न रोगों से जुड़े जीन के लिए समृद्ध करने के लिए बनाए गए अन्य पैनलों में से किसी के साथ समान रूप से अच्छी तरह काम करना चाहिए । डीएनए अलगाव और ऊतक या ब्याज के नमूने से बाद में ठहराव के बाद, यह नमूना प्रति शेयर डीएनए के कम से ५०० एनजी की सिफारिश की है । हम नियमित रूप से एक एकल sequencing पुस्तकालय डीएनए के २५० एनजी का उपयोग करने के लिए बहाव के लिए संभव के रूप में ज्यादा अद्वितीय जीनोमिक टुकड़ा पर कब्जा करने के लिए de-दोहराव और VAF गणना पढ़ता है । एक वैकल्पिक दोहराने अनुक्रमण पुस्तकालय डीएनए के शेष २५० एनजी के साथ किया जा सकता है । हम हमेशा दो नमूने के अनुसार नकल पुस्तकालयों बनाने के लिए, और हम केवल उन घटनाओं पर विचार दोनों में स्वतंत्र रूप से पता चला सच सकारात्मक रूप में प्रतिकृतियां । हम भी4,13फोन करने वाले संस्करण की सटीकता बढ़ाने के लिए एक जीनोमिक स्थिति-विशिष्ट द्विपद त्रुटि मॉडल लागू किया गया ।

अंत में, हम एक विधि का वर्णन करने के लिए ईसीएस अनुक्रमण करने के लिए प्रतिलिपि ठहराव के लिए एक युग्मन-शेल्फ QIAseq लक्षित आरएनए पैनलों (Qiagen) का उपयोग कर । de-दोहराव और त्रुटि सुधार के लिए आवश्यक UMIs को किट में शामिल किया गया है, और शोधकर्ताओं ने निर्माता की सिफारिशों के बाद पुस्तकालयों कर सकते हैं । Bioinformatically, शोधकर्ताओं ईसीएस-डीएनए, जो प्रोटोकॉल अनुभाग में विस्तार से समझाया जाएगा के लिए उल्लिखित पाइपलाइन का पालन कर सकते हैं ।

Protocol

1. लक्षित त्रुटि-डीएनए के लिए सही अनुक्रमण

  1. पीसीआर ब्याज के जीनोमिक टुकड़े का प्रवर्धन ।
    1. एक उच्च निष्ठा डीएनए पोलीमरेज़ का उपयोग करने के लिए amplicons बढ़ाना (सामग्री तालिका, आइटम 1) । एक थर्मल साइकिल चालक में निम्नलिखित स्थितियों के साथ पीसीआर प्रतिक्रिया बढ़ाना: ९८ डिग्री सेल्सियस पर 30 एस; 18 – 10 एस के 40 चक्र ९८ ° c, 30 s at ६६ ° c, और 30 s at ७२ ° c; ७२ डिग्री सेल्सियस पर 2 मिनट; 4 डिग्री सेल्सियस पर पकड़ो ।
    2. paramagnetic मोतियों (सामग्री तालिका, आइटम 2) के साथ पीसीआर उत्पादों को शुद्ध । एक 1 में मोतियों की प्रतिक्रिया जोड़ें: १.८ अनुपात (पीसीआर रिएक्शन वॉल्यूम: मनका मात्रा) निर्माता के प्रोटोकॉल के अनुसार । ddH2ओ के 20 µ l के साथ Elute ।
    3. डीएनए की एकाग्रता को बढ़ाता है (सामग्री तालिका, आइटम 3) डीएनए की अंतिम एकाग्रता निर्धारित करने के लिए ।
    4. amplicons के आकार की पुष्टि करने के लिए 2% agarose जेल (सामग्री तालिका, आइटम 4) पर डीएनए का एक aliquot भागो ।
      नोट: वैकल्पिक रूप से, शोधकर्ताओं ने प्रवर्धित जीनोमिक अंशों के आकार का निर्धारण करने के साथ ही उत्पादों की एकाग्रता को निर्धारित करने के लिए पीसीआर उत्पादों पर विश्लेषक विश्लेषण करने का विकल्प चुन सकते हैं ।
  2. sequencing एडेप्टर एनीलिंग
    1. i7 एडाप्टर (सामग्री तालिका, आइटम 5) प्राप्त करें । उंहें उपयोग के रूप में वे बाद के चरणों के लिए प्रदान की जाती हैं ।
    2. खरीद 16N i5 एडेप्टर वाणिज्यिक रूप से निम्नलिखित oligo अनुक्रम के साथ (सामग्री तालिका आइटम 6): AATGATACGGCGACCACCGAGATCTACAC (N1:25252525) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCT
      नोट: 16N i5 एडेप्टर मानक i5 एडेप्टर की जगह है और वे एडाप्टर 16 यादृच्छिक-न्यूक्लियोटाइड की एक स्ट्रिंग के साथ ईसीएस की सुविधा के लिए कर रहे हैं ।
    3. बनाने 16N i5 अनुकूलक काम समाधान: ४० µ l की १०० µ m 16N i5 अनुकूलक स्टॉक, 10 µ l के ते बफर, और 10 µ l के ५०० µ m NaCl हल.
    4. Aliquot ७.५ µ एल के i5 काम समाधान में तैयार कदम 1.2.3 अलग पीसीआर कुओं में ।
    5. इसी कुएं में नमूना विशिष्ट i7 एडाप्टर के 5 µ एल जोड़ें ।
    6. 5 मिनट के लिए ९५ ° c पर मशीन तो 1 ° c द्वारा शांत एक थर्मल साइकिल चालक में 4 डिग्री सेल्सियस के लिए हर 30 एस ।
    7. 4 डिग्री सेल्सियस पर पकड़ो ।
  3. पुस्तकालयों की एंड-रिपेयर एंड दा-टेल
    नोट: एडेप्टर एनीलिंग के साथ समानांतर में, एक अंत मरंमत और १.१ कदम से पीसीआर amplicons पर दा-पूंछ प्रदर्शन कर सकते हैं । इन चरणों के पूरा होने के बाद, बंधाव annealed एडेप्टर से चरण १.२ पर सुधारा और दा-पुच्छ पीसीआर amplicons किया जाता है । निंनलिखित एडेप्टर बंधाव, ईसीएस पुस्तकालय निर्माण पूरा हो गया है ।
    1. शुरू डीएनए (ंयूनतम ~ २०० एनजी) के सबसे 1 µ जी पर के साथ
    2. amplicons (सामग्री तालिका, आइटम 7) पर अंत-मरंमत और डीए-पूंछ प्रदर्शन ।
      1. अंत तैयारी एंजाइम मिश्रण और ६.५ अंत की मरंमत बफर के µ एल के ३.० µ एल जोड़ें ।
      2. 20 डिग्री सेल्सियस पर 30 मिनट के लिए मिश्रण की मशीन, तो ६५ डिग्री सेल्सियस पर 30 मिनट के लिए और 4 डिग्री सेल्सियस पर पकड़ ।
    3. annealed एडेप्टर (सामग्री तालिका, आइटम 8) पर बंधाव निष्पादित करें ।
      1. annealed एडेप्टर के चरण 2, 15 µ l की कुंदी/टा Ligase Mastermix, और µ बढ़ाने के 1 बंधाव l से जोड़ें २.५ µ l
      2. 20 डिग्री सेल्सियस पर 15 मिनट के लिए मिश्रण की मशीन, तो ३७ डिग्री सेल्सियस पर 15 मिनट के लिए ।
    4. चुंबकीय मोती (सामग्री तालिका आइटम 2) के साथ पुस्तकालयों को साफ: एक संशोधित 1:०.७५ अनुपात में मोती की प्रतिक्रिया जोड़ें (पीसीआर प्रतिक्रिया मात्रा: चुंबकीय मनका मात्रा):
      1. पिपेट ६२.६ µ में चुंबकीय मनका समाधान के एल चरण 1.2.7 से पीसीआर उत्पादों के ८३.५ µ l में ।
      2. मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण ।
      3. pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण ।
      4. मिश्रण को 5 मिनट के लिए कमरे के तापमान पर खड़े रहने के लिए छोड़ दें ।
      5. एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर 2 मिनट के लिए या supernatant जब तक गर्मी साफ है ।
      6. निकाल supernatant.
      7. धो ७०% इथेनॉल के २०० µ एल के साथ मोती ।
      8. 30 एस के लिए मशीन इथेनॉल निकालें ।
      9. एक बार इथेनॉल धोने कदम दोहराएं ।
      10. हवा-मोतियों को सुखाएं ।
      11. ddH2ओ के 20 µ l के साथ Elute ।
        नोट: चुंबकीय मनका अनुपात को पीसीआर प्रतिक्रिया में यह संशोधन तरजीही डीएनए टुकड़े कि २०० बीपी से छोटे है हटा देगा ।
  4. छोटी बूंद डिजिटल पीसीआर द्वारा ठहराव
    नोट: सटीक उत्परिवर्तन ठहराव sequencer पर लोड कर रहे हैं कि प्रत्येक पुस्तकालय के अणुओं की संख्या के सख्त पालन की आवश्यकता है. इस लक्ष्य को प्राप्त करने के लिए, इकाई मात्रा प्रति व्यक्तिगत पुस्तकालयों के लिए अणुओं की संख्या को बढ़ाता QX200 छोटी बूंद डिजिटल पीसीआर (ddPCR) मंच का उपयोग किया जाता है-मात्रात्मक पीसीआर एक वैकल्पिक विकल्प है । ddPCR विश्लेषण के बाद, readout प्रति पुस्तकालय µ एल प्रति अणुओं की संख्या निर्दिष्ट करेगा ।
    1. ईसीएस पुस्तकालयों को पतला 1:1000 से मक़सद कमजोर द्वारा पीसीआर स्ट्रिप-ट्यूब में 10 का एक पहलू है ।
    2. १.५ एमएल ट्यूब में ddPCR के लिए निम्नलिखित mastermix तैयार करें: पीसीआर मिक्स की 10 µ l (सामग्री तालिका, मद 9), P5 प्राइमरी की ०.२ µ l, P7 प्राइमरी की ०.२ µ l, ईसीएस के 5 µ l को क्लीन-अप उत्पाद से स्टेप 1.4.1., और ४.५ µ l की ddH2हे.
    3. Aliquot 20 µ एल mastermix के प्रत्येक नमूने में अच्छी तरह से यकीन है कि वहां 8 के गुणकों कर रहे हैं ।
      1. Aliquot ७० छोटी बूंद पीढ़ी के तेल के µ एल (सामग्री तालिका, आइटम 10) प्रत्येक तेल में अच्छी तरह से । कवर एक रबर गैसकेट के साथ कैसेट ।
    4. छोटी बूंद जनरेटर (सामग्री तालिका, आइटम 11) का उपयोग कर बूंदें बनाओ ।
    5. एक मल्टीचैनल पिपेट का उपयोग करना, चरण 1.4.4 में उत्पन्न बूंदों को एक पीसीआर प्लेट में लोड करना सुनिश्चित करना कि pipetting नमूने के डीएनए को बाल काटना से बचने के लिए 5 सेकंड की अवधि में धीरे से किया जाता है ।
    6. निम्नलिखित स्थितियों का उपयोग कर एक थर्मल साइकिल चालक में ४० चक्र के लिए बूंदों में संकेत बढ़ाना: ९५ डिग्री सेल्सियस पर 5 मिनट; ९५ डिग्री सेल्सियस पर 30 एस के ४० चक्र, ६३ डिग्री सेल्सियस पर 1 मिनट; 4 डिग्री सेल्सियस पर 5 मिनट, ९० डिग्री सेल्सियस पर 5 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ ।
    7. ddPCR टेम्पलेट छोटी बूंद रीडर मशीन (सामग्री तालिका, आइटम 11) तैयार करें । पूर्ण ठहराव के लिए मानकों के लिए विनिर्देश सुनिश्चित करने और QX200 ddPCR ईवा ग्रीन Supermix का उपयोग कर.
    8. एक बार ddPCR विश्लेषण पूरा हो गया है, सभी नमूनों में एक ही विभाजनकारी थ्रेशोल्ड सेट करने के लिए सुनिश्चित करें ।
    9. QX200 छोटी बूंद पाठक से एकाग्रता readout का उपयोग करना, aliquot उचित मात्रा में अणुओं के बाद के कदम में वांछित संख्या शुरू करने के लिए ।
  5. अनुक्रमण के लिए पुस्तकालयों के पीसीआर प्रवर्धन
    1. चरण 1.4.9 से अणुओं की वांछित संख्या के लिए निम्नलिखित mastermix तैयार करें: Q5 mastermix के 25 µ l (सामग्री तालिका, मद 1), २.५ µ l की P5 प्राइमरी (10 µ मी), २.५ µ l की P7 प्राइमरी (10 µ मी), डीएनए की x µ l, 20-x µ l की ddH2हे.
    2. निम्न स्थितियों का उपयोग कर एक थर्मल साइकिल चालक में कदम 1.5.1 से पुस्तकालयों बढ़ाना: ९८ ° c पर 30 एस; ९८ डिग्री सेल्सियस पर 10 एस के 20 चक्र, ६३ डिग्री सेल्सियस पर 30 एस, ७२ डिग्री सेल्सियस पर 30 एस; ७२ डिग्री सेल्सियस पर 2 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ ।
    3. चुंबकीय मोती (सामग्री तालिका, आइटम 2) के साथ पुस्तकालयों को साफ: एक संशोधित 1 में एक चुंबकीय मोती के लिए पीसीआर प्रतिक्रिया जोड़ें: ०.७५ अनुपात (पीसीआर प्रतिक्रिया मात्रा: चुंबकीय मनका मात्रा) ।
      1. कदम 1.5.2 से ५० µ एल पीसीआर उत्पादों में चुंबकीय मनका समाधान के पिपेट ३७.५ µ एल ।
      2. मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण ।
      3. pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण ।
      4. मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ ।
      5. एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर 2 मिनट के लिए या supernatant जब तक गर्मी साफ है ।
      6. निकाल supernatant.
      7. धो ७०% इथेनॉल के २०० µ एल के साथ मोती ।
      8. 30 एस के लिए मशीन इथेनॉल निकालें ।
      9. एक बार इथेनॉल धोने कदम दोहराएं ।
      10. हवा-मोतियों को सुखाएं ।
      11. ddH2ओ के 20 µ l के साथ Elute ।
    4. amplicons के आकार की पुष्टि करने के लिए 2% agarose जेल पर डीएनए की एक aliquot भागो ।
    5. डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) अलग ईसीएस पुस्तकालयों की एकाग्रता निर्धारित करने के लिए ।
    6. equimolar मात्रा में पुस्तकालयों पूल ।
      नोट: उदाहरण के लिए, शोधकर्ताओं ने एक equimolar समूह4 में आठ पुस्तकालयों के साथ एक अनुक्रमण मंच का उपयोग कर sequencing के लिए ४,०००,००० शुरू अणुओं पूल कर सकते हैं जो ४००,०००,००० तक outputs पढ़ता है. रूढ़िवादी, यह दस कच्चे के एक औसत का उपयोग करने के लिए सिफारिश की है त्रुटि के अणुओं के प्रति सुधार के लिए पढ़ता है । यह ऊपर ले जाएगा ३६०,०००,००० पुस्तकें (४,०००,००० अणु * 8 पुस्तकालयों * 10 त्रुटि सुधार के लिए पढ़ता है) । पुस्तकालय प्रति ४,०००,००० अद्वितीय अणुओं के साथ, शोधकर्ताओं के लिए एक सैद्धांतिक मतलब आम सहमति के प्रति amplicon (4 मिलियन/568 amplicons जीन पैनल से) 7042x की रीडिंग कवरेज पाने की उम्मीद कर सकते हैं ।
    7. डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) परित ईसीएस पुस्तकालय की एकाग्रता निर्धारित करने के लिए ।
    8. लगभग 4 एनएम में परित की ईसीएस लाइब्रेरी जमा करें ।
    9. Illumina sequencing प्लेटफ़ॉर्म (MiSeq, HiSeq या NextSeq) के लिए निम्न sequencing सेटिंग्स प्रदान करें: 2x144 युग्मित-अंत पढ़ता, 8 चक्र अनुक्रमणिका 1 और 16 चक्र अनुक्रमणिका 2.

2. त्रुटि के साथ जीन पैनलों-डीएनए के अनुक्रमण सही

  1. जीन पैनलों से ओलिगोस्पर्मिया की संकरण
    नोट: इस चरण में, एक sequencing एक संशोधित Illumina TruSight या TruSeq प्रोटोकॉल UMIs (सामग्री तालिका, आइटम 17) को शामिल करने के लिए का उपयोग कर पुस्तकालयों का निर्माण होगा ।
    1. संकरण ओलिगोस्पर्मिया पर जीनोमिक टुकड़ा निंनलिखित निर्माता के प्रोटोकॉल । का प्रयोग करें २५० डीएनए के एनजी (या शुरू सामग्री के किसी भी वांछित राशि) ।
    2. अनबाउंड ओलिगोस्पर्मिया निम्न निर्माता के प्रोटोकॉल को निकालें ।
    3. एक्सटेंशन-बंधाव निम्न निर्माता का प्रोटोकॉल निष्पादित करें ।
      नोट: निर्माता के प्रोटोकॉल में संशोधनों के नीचे शुरू करते हैं ।
  2. पीसीआर के माध्यम से i5 और i7 एडेप्टर का निगमन
    1. उचित मात्रा आकार की एक ट्यूब में निम्नलिखित रिएजेंटों pipetting द्वारा पीसीआर mastermix तैयार: ३७.५ µ l के Q5 mastermix (सामग्री तालिका, मद 1), 6 µ l के 10 µ m 16N i5 एडेप्टर (विधि 1 में विस्तृत, चरण 1.2.2), i7 एडाप्टर के 6 µ l (विभिन्न i7 का उपयोग करें एडाप्टर मल्टीप्लेक्स के लिए अलग नमूनों के लिए), और 22 µ एल एक्सटेंशन-बंधाव चरण 2.1.3 से मोतियों के साथ समाधान ।
      नोट: Q5 Mastermix Illumina द्वारा प्रदान की पोलीमरेज़ Mastermix की जगह । Q5 पोलीमरेज़ उच्च निष्ठा और कम पेश त्रुटियों के साथ जीनोमिक टुकड़ा प्रवर्धक ।
    2. एक थर्मल साइकिल चालक पर पीसीआर कार्यक्रम चलाने के लिए निंनलिखित मापदंडों का उपयोग: 30 एस ९८ ° c, 4-6 चक्रों पर 10 एस के ९८ ° c, 30 s पर ६६ ° c, 30 s पर ७२ ° c; ७२ डिग्री सेल्सियस पर 2 मिनट, और फिर 4 डिग्री सेल्सियस पर पकड़ ।
      नोट: चक्र की संख्या पैनल के आकार पर निर्भर करता है । हमारे अनुभव से, एक 4 चक्र पीसीआर पर्याप्त है अगर जीन पैनल जीन विशिष्ट ओलिगोस्पर्मिया के बारे में १,५०० विभिंन जोड़े हैं, जबकि 500 के साथ एक पैनल-600 ओलिगोस्पर्मिया के जोड़े को पीसीआर के 6 चक्र की आवश्यकता है ।
    3. चुंबकीय मोतियों के साथ पीसीआर प्रतिक्रियाओं को साफ (सामग्री तालिका, आइटम 2): एक संशोधित 1 में पीसीआर प्रतिक्रिया चुंबकीय मोती जोड़ें पीसीआर रिएक्शन: ०.७५ चुंबकीय मनका अनुपात:
      1. पिपेट ५६.२५ µ में चुंबकीय मनका समाधान के एल चरण -8 से पीसीआर उत्पादों के ७५ µ l में ।
      2. मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण ।
      3. pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण ।
      4. मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ ।
      5. एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर या supernatant स्पष्ट है जब तक 2 मिनट के लिए मशीन ।
      6. निकाल supernatant.
      7. धो ७०% इथेनॉल के २०० µ एल के साथ मोती ।
      8. 30 एस के लिए मशीन इथेनॉल निकालें ।
      9. एक बार इथेनॉल धोने कदम दोहराएं ।
      10. हवा-मोतियों को सुखाएं ।
      11. ddH2ओ के 20 µ l के साथ Elute ।
  3. QX200 ddPCR प्लेटफ़ॉर्म का उपयोग करके लाइब्रेरीज़ को बढ़ाता है.
    1. विधि 1 में १.४ चरण का पालन करें ।
      नोट: ४,०००,००० अणुओं प्रतिनिधि परिणाम (चित्रा 2) में नमूना पुस्तकालय4 प्रति सामान्यीकृत थे क्रम में ७,०४२ विशिष्ट रूप से अनुक्रमित अणुओं (४,०००,००० ५६८ जीन विशेष ओलिगोस्पर्मिया द्वारा विभाजित) का एक सैद्धांतिक मतलब प्राप्त करने के लिए ।
  4. बढ़ाना और अनुक्रमण के लिए पुस्तकालयों को सामान्य.
    1. अंतिम पीसीआर totaling ५० µ एल के लिए निंनलिखित mastermix का उपयोग कर अणुओं की वांछित संख्या बढ़ाना: 25 µ l के Q5 mastermix, 2 µ l के P5 प्राइमरी (1 µ m), µ प्राइमरी के 2 P7 l (1 µ m), और डीएनए अणुओं के 21 µ l.
    2. एक थर्मल साइकिल चालक पर चलाएं पीसीआर कार्यक्रम निंनलिखित पैरामीटर का उपयोग: 30 एस ९८ डिग्री सेल्सियस पर; ९८ डिग्री सेल्सियस पर 10 एस के 16 चक्र, ६६ डिग्री सेल्सियस पर 30 एस, ७२ डिग्री सेल्सियस पर 30 एस; ७२ डिग्री सेल्सियस पर 2 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ ।
    3. चुंबकीय मोतियों का उपयोग अनुक्रमण पुस्तकालयों को साफ (सामग्री तालिका, आइटम 2): एक संशोधित 1 में पीसीआर प्रतिक्रिया चुंबकीय मोती जोड़ें पीसीआर रिएक्शन: ०.७५ चुंबकीय मनका अनुपात:
      1. कदम 2.4.2 से ५० µ एल पीसीआर उत्पादों में चुंबकीय मनका समाधान के पिपेट ३७.५ µ एल ।
      2. मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण ।
      3. pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण ।
      4. मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ ।
      5. एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर या supernatant स्पष्ट है जब तक 2 मिनट के लिए मशीन ।
      6. निकाल supernatant.
      7. धो ७०% इथेनॉल के २०० µ एल के साथ मोती ।
      8. 30 एस के लिए मशीन इथेनॉल निकालें ।
      9. एक बार इथेनॉल धोने कदम दोहराएं ।
      10. हवा-मोतियों को सुखाएं ।
      11. ddH2ओ के 20 µ l के साथ Elute ।
    4. amplicons के आकार की पुष्टि करने के लिए एक 2% agarose जेल पर eluted डीएनए (~ 3 µ एल) के एक aliquot भागो ।
    5. डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) अलग ईसीएस पुस्तकालयों की एकाग्रता निर्धारित करने के लिए ।
    6. equimolar मात्रा में पुस्तकालयों पूल । विधि 1 चरण 1.5.6 का संदर्भ लें । और भी पूलिंग पर अधिक जानकारी के लिए चर्चा ।
    7. लगभग 4 एनएम में परित की ईसीएस लाइब्रेरी जमा करें ।
    8. Illumina sequencing प्लेटफ़ॉर्म (MiSeq, HiSeq या NextSeq) के लिए निम्न sequencing सेटिंग्स प्रदान करें: 2x144 युग्मित-अंत पढ़ता, 8 चक्र अनुक्रमणिका 1 और 16 चक्र अनुक्रमणिका 2.
  5. ईसीएस Bioinformatic प्रोसेसिंग और विश्लेषण
    1. नमूना प्राप्त करें-division से sequencer पढ़ता है या प्रदर्शन कच्चे अनुक्रम के division एक कस्टम स्क्रिप्ट के साथ bioinformatically i7 एडाप्टर अनुक्रम का उपयोग कर विभिन्न नमूनों में पढ़ता है ।
    2. बंद ट्रिम कर दीजिए प्रत्येक के पहले 30 न्यूक्लियोटाइड का जीन पैनल से oligo जुगाड़ हटाने के लिए पढ़िए ।
    3. पढ़ता है कि एक दूसरे के लिए एक ही UMIs साझा पढ़ें परिवारों के रूप में संरेखित करें ।
      नोट: शोधकर्ताओं का उपयोग कर सकते हैं UMI-वाकिफ सॉफ्टवेयर जैसे MAGERI13 पढ़ने परिवारों को निकालने के लिए. विधि की विशिष्टता को बढ़ाने के लिए इस प्रयोग में UMI अनुक्रम के भीतर कोई हैमिंग दूरी की अनुमति नहीं थी ।
    4. निम्न अनुशंसित पैरामीटर्स का उपयोग करके de-डुप्लिकेशन और त्रुटि-सुधार निष्पादित करें ।
      1. एक ही पढ़ा परिवार में ≥ 5 पढ़ें जोड़े का उपयोग करें । तीन पढ़ें जोड़े की एक ंयूनतम सिफारिश की है ।
      2. सभी भर में हर स्थिति में न्यूक्लियोटाइड तुलना एक ही पढ़ा परिवार में पढ़ता है, और एक आम सहमति न्यूक्लियोटाइड उत्पंन अगर वहां है कम से ९०% के बीच सामंजस्य विशेष न्यूक्लियोटाइड के लिए पढ़ता है । न्यूक्लियोटाइड स्थिति के लिए ९०% से कम अनुबंध है, तो एक N कॉल करें ।
      3. छोड़ें आम सहमति है कि > 10% है सहमति की कुल संख्या का न्यूक्लियोटाइड N के रूप में बुलाया जा रहा है ।
    5. सभी बनाए रखने आम सहमति के लिए स्थानीय रूप से या तो hg19 या hg38 मानव संदर्भ जीनोम जैसे Bowtie2 और BWA के रूप में शोधकर्ता पसंदीदा संरेखण (ओं) का उपयोग कर पढ़ता है संरेखित करें ।
    6. प्रक्रिया संरेखित Mpileup पैरामीटर का उपयोग कर के साथ पढ़ता है – BQ0 – d १०,०००,०००,०००,००० VAF की परवाह किए बिना एक उचित pileup आउटपुट सुनिश्चित करने के लिए कवरेज थ्रेशोल्ड को निकालने के लिए ।
    7. से कम 1000x आम सहमति पढ़ें कवरेज के साथ पदों को फ़िल्टर ।
      ध्यान दें: शोधकर्ता प्रत्येक न्यूक्लियोटाइड स्थिति के लिए मनमाने ढंग से ंयूनतम कवरेज निर्धारित करता है, यह नीचे बहाव विश्लेषण के लिए कम से 500x आम सहमति पढ़ें कवरेज की सिफारिश की है ।
    8. निंन पैरामीटर के साथ चरण 2.5.7 से बनाए गए डेटा में एकल न्यूक्लियोटाइड वेरिएंट (SNPs) को कॉल करने के लिए द्विपद वितरण का उपयोग करें । द्विपद सांख्यिकीय एक जीनोमिक स्थिति-विशिष्ट त्रुटि मॉडल पर आधारित होगा । प्रत्येक जीनोमिक स्थिति स्वतंत्र रूप से बाहर है कि विशेष रूप से स्थिति के लिए सभी नमूनों की त्रुटि दरों संक्षेप के बाद मॉडलिंग की है । उदाहरण के बाद:
      किसी दी जीनोमिक स्थिति में न्यूक्लियोटाइड प्रोफ़ाइल की प्रायिकता, p
      ∑ वैरिएंट RF2 ∑ कुल RFs
      = 26/255505
      = ०.०००१०१७५९
      ३५९११ कुल RFs, P(x ≥ x) का नमूना K में से बाहर 24 संस्करण RFs की द्विपद प्रायिकता
      = 1-द्विपद (24, ३५९११, ०.०००१०१७५९)
      = 2.26485 ई-13
      नोट: प्रत्येक जीनोमिक स्थिति के लिए पूछे, वहां तीन संभव उत्परिवर्तन परिवर्तन (यानी,एक > टी, एक > सी, एक > जी) होगा, और जिनमें से प्रत्येक पृष्ठभूमि विरूपण साक्ष्य के रूप में प्रतिनिधित्व किया जाएगा । दैहिक घटनाओं है कि Bonferroni सुधार के बाद पृष्ठभूमि से काफी अलग है बनाए रखा जाता है । 1 तालिकामें दिखाए गए उदाहरण में, निष्पादित परीक्षणों की संख्या 11 थी, इसलिए एक Bonferroni सही p-मान ≤ ०.००४५४५४५ (0.05/11) एक घटना सांख्यिकीय रूप से महत्वपूर्ण के रूप में कॉल करने के लिए आवश्यक था ।
    9. दैहिक घटनाओं के लिए एक ही नमूना से दोनों प्रतिकृति में उपस्थित होने की आवश्यकता है; अंयथा, उंहें झूठी सकारात्मक के रूप में संबंध है ।

Table 1
तालिका 1: उदाहरण एक स्थिति-विशिष्ट द्विपद त्रुटि मॉडल के निर्माण के लिए तरीके का प्रदर्शन ।

3. आरएनए की त्रुटि-सही अनुक्रमण

  1. डीएनए स्तर पर उत्परिवर्तनों के लिए आकलन करने के अलावा, आरएनए स्तर पर दुर्लभ या कम बहुतायत प्रतिलिपि का पता लगाने के लिए विभिन्न लक्षित आरएनए अनुक्रमण पैनलों के साथ ईसीएस एकीकृत । बंद-the-शेल्फ Qiagen आरएनए अनुक्रमण पैनलों के साथ ईसीएस के संयोजन के द्वारा, हम एक गृह व्यवस्था जीन के खिलाफ सामान्य करने के लिए एक की आवश्यकता के बिना दस प्रतियां के रूप में के रूप में कुछ के साथ टेप के लिए जीन अभिव्यक्ति की डिजिटल ठहराव का प्रदर्शन किया । त्रुटि-सुधार के लिए आवश्यक UMIs को पैनल में एकीकृत कर दिया गया है ।
    1. कुल आरएनए निष्कर्षण (सामग्री तालिका, आइटम 20) निष्पादित करें ।
    2. निर्माता के प्रोटोकॉल (सामग्री तालिका, आइटम 19) के अनुसार ईसीएस-आरएनए पुस्तकालय तैयारी जारी है ।
    3. चरण 2.5.1 के अनुसार bioinformatics पाइपलाइन प्रदर्शन – 2.5.6. पिछले अनुभाग में उल्लिखित विधि 2 के । कदम 2.5.6 के बाद, गठबंधन आम सहमति की संख्या जीन जीन की लंबाई सामान्यीकरण के लिए आवश्यकता के बिना जीन की अभिव्यक्ति के स्तर का प्रतिनिधित्व करता है पढ़ता है ।

Representative Results

डीएनए के लिए लक्षित त्रुटि-सही अनुक्रमण के साथ, हम वाणिज्यिक जीनोमिक डीएनए में सिद्धांत प्रयोग कमजोर उत्परिवर्ती रोगी डीएनए का सबूत प्रदर्शन किया है । रोगी ०.१९ के मूल VAF के साथ GATA1 (chrX: 48650264, सी > जी) में उत्परिवर्तन था । हम चित्र 1 कि ईसीएस एक न्यूक्लियोटाइड संस्करण के लिए 1:10000 के स्तर के लिए मात्रात्मक है में प्रदर्शित करते हैं ।

Figure 1
चित्रा 1: GATA1 SNV के कमजोर पड़ने श्रृंखला का प्रदर्शन है कि ईसीएस 1 के स्तर पर मात्रात्मक है: 10000कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

हम यह भी बताते है कि ईसीएस-डीएनए मज़बूती से स्वस्थ बुजुर्ग व्यक्तियों4में वयस्क तीव्र माइलॉयड ल्यूकेमिया (एएमएल) में आवर्तक जीन में दुर्लभ क्लोनल उत्परिवर्तनों का पता लगाता है । हम नर्स के स्वास्थ्य के अध्ययन में 20 स्वस्थ व्यक्तियों से buffy कोट नमूने प्राप्त लगभग ~ 10 साल के अलावा । हमने इन नमूनों पर ईसीएस-डीएनए पैनल प्रोटोकॉल लागू किया था । इस प्रयोग के लिए, हम Illumina TruSight माइलॉयड अनुक्रमण पैनल है कि ५६८ amplicons (https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html पर जीन सूची पर अधिक जानकारी) और अनुक्रम के होते है अनुकूलित 20 व्यक्तियों से ८० पुस्तकालयों (अलग समय अंक में 2 संग्रह, 2 प्रति समय बिंदु प्रति व्यक्ति प्रतिकृति) Illumina NextSeq मंच है, जो ४७,७००,००० के एक औसत उत्पंन-अंत पढ़ता है और ३,४००,००० त्रुटि का एक औसत-सही बनाया का उपयोग कर लाइब्रेरी के प्रति आम सहमति अनुक्रम4. पुस्तकालय प्रति मतलब न्यूक्लियोटाइड कवरेज लगभग 6, 000x (३.४ लाखों ५६८ द्वारा विभाजित) था । प्रत्येक नमूने के लिए, हम एक स्थिति-विशिष्ट त्रुटि प्रोफ़ाइल का उपयोग करते हुए एक ही नमूना से नहीं है sequenced लायब्रेरी का निर्माण किया । हमने पाया है १०९ क्लोनी दैहिक उत्परिवर्तनों कि दोनों में मौजूद थे कम से एक संग्रह समय बिंदु की प्रतिकृति । इन उत्परिवर्तनों 0.0003 से लेकर VAF है – 0.1451. हम ज्ञात लौकिक निरूपण के साथ 21 उत्परिवर्तनों का चयन किया है, और एक या दो संग्रह समय बिंदु (ओं) का उपयोग ddPCR (n = ३४, चित्रा 2, युवा एट अल. २०१६4से अनुकूलित) में सभी 21 उत्परिवर्तनों की पुष्टि की ।

Figure 2
चित्रा 2: ईसीएस द्वारा की पहचान उत्परिवर्तनों उच्च बेताल VAFs के साथ ddPCR के माध्यम से सत्यापित किया गया । (एन = 34, युवा एट अल. २०१६4से संशोधित) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

के साथ त्रुटि-सही अभिव्यक्ति स्तर ईसीएस-आरएनए प्रोटोकॉल का उपयोग करने के संबंध में, हम एक जीन QIAseq रसायन विज्ञान है कि ४१६ विभिंन कैंसर (QIAseq मानव कैंसर Transcriptome पैनल से अनुकूलित) के साथ जुड़े होने के लिए जाना जाता जीन के होते है का उपयोग कर पैनल अनुकूलित, और हम प्रवर्धित सबसे अधिक एक दिया जीन के एक्सॉन व्यक्त ( अनुपूरक सामग्री 1में जीन सूची) । हम Illumina MiSeq प्लेटफ़ॉर्म का उपयोग करते हुए लाइब्रेरीज़ में युग्मित-अंत स्वरूप जो ८,३००,००० की एक औसत दिया लाइब्रेरी प्रति पढ़ता है, और हम ४१७,००० त्रुटि-सही आम सहमति दृश्यों की एक औसत पर कब्जा करने में कामयाब रहे । हमें पता चला है कि कम बहुतायत प्रतिलिपि की अभिव्यक्ति स्तर (< 1, 000 कुल आरएनए के एनजी ५० में गिनती) प्रतिकृति के बीच अत्यधिक reproducible है (डेटा बिंदु n = ३००, चित्रा 3) । ddPCR द्वारा मांयता (अभिव्यक्ति की डिग्री बदलती के छह चयनित जीन) का प्रदर्शन किया है कि जीन की अभिव्यक्ति स्तर सही ढंग से ईसीएस प्रोटोकॉल द्वारा सामांय की आवश्यकता के बिना कब्जा कर लिया गया था ।

Figure 3
चित्रा 3: ऊपर, प्रतिलिपि का सहसंबंध एक ही नमूना (n = ३००) की प्रतिकृति के बीच ईसीएस-आरएनए द्वारा गिना जाता है । नीचे, प्रतिलिपि ईसीएस द्वारा की पहचान की गिनती ddPCR द्वारा सत्यापित किया गया (n = 6) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Discussion

यहाँ, हम त्रुटि-सही अनुक्रमण प्रोटोकॉल है कि आसानी से विभिन्न रोगों में कम VAFs के साथ उत्परिवर्तनों का अध्ययन करने के लिए लागू किया जा सकता का एक सूट प्रदर्शित करता है । सबसे महत्वपूर्ण कारक अनुक्रमण से पहले प्रत्येक अणु के साथ UMIs के शामिल होने के रूप में वे रॉ पढ़ता के त्रुटि-सुधार सक्षम है । यहां वर्णित तरीकों शोधकर्ताओं दोनों व्यावसायिक रूप से उपलब्ध जीन पैनलों और स्वयं जीन विशिष्ट ओलिगोस्पर्मिया डिजाइन करने के लिए अनुकूलित UMIs शामिल करने के लिए अनुमति देते हैं ।

मानक NGS प्रोटोकॉल अनुक्रमण त्रुटि दर के कारण 2% से नीचे VAF के साथ उत्परिवर्तनों का पता लगाने precludes, और इस अध्ययन में NGS के आवेदन सीमा जहां दुर्लभ वेरिएंट का पता लगाने महत्वपूर्ण है । मानक NGS त्रुटि दर को दरकिनार करके, ईसीएस इन रॉ वेरिएंट के संवेदनशील पता लगाने में सक्षम बनाता है । उदाहरण के लिए, रोगजनक उत्परिवर्तनों का पता लगाने जब इन उत्परिवर्तनों पहले उठता (इसलिए कम VAF होने)14,15रोग के जल्दी हस्तक्षेप को सूचित करने के लिए आवश्यक है । ल्यूकेमिया अनुसंधान में, न्यूनतम अवशिष्ट रोग का पता लगाने (अवशिष्ट ल्यूकेमिया से प्रभावित कोशिकाओं के बाद उपचार) जोखिम स्तरीकरण को सूचित करता है और एक तरह से है कि बाइनरी फ्लो cytometric आकलन नहीं कर सकते में उपचार के विकल्पों को सूचना देने के लिए इस्तेमाल किया जा सकता है । इसके अलावा, ईसीएस परिचालित ट्यूमर न्यूक्लिक एसिड का पता लगाने के लिए और उपस्थिति के लिए आकलन द्वारा ठोस ट्यूमर रोगियों में मेटास्टेटिक क्षमता का मूल्यांकन करने के लिए लागू है/अनुपस्थिति के साथ ही कुछ उत्परिवर्तनों के संस्करण बोझ है कि प्राथमिक की विशेषताओं रहे हैं ट्यूमर16.

तालिका 1में प्रदर्शित किया गया के रूप में, वेरिएंट को कॉल करने के लिए द्विपद वितरण-आधारित स्थिति-विशिष्ट त्रुटि मॉडल का उपयोग करने की शक्ति काफी हद तक अनुक्रम पुस्तकालयों की संख्या के रूप में के रूप में अच्छी तरह से त्रुटि मॉडल बनाने के लिए इस्तेमाल अनुक्रमण की गहराई पर निर्भर करता है । नमूनों की अधिक संख्या और अधिक अनुक्रमण गहराई के साथ त्रुटि मॉडल की मजबूती बढ़ जाती है । यह प्रत्येक नमूने के लिए एक त्रुटि प्रोफ़ाइल बनाने के लिए प्रति नमूना 3000x की त्रुटि-सही पढ़ा कवरेज का एक औसत के साथ कम से कम 10 अनुक्रम नमूनों का उपयोग करने के लिए अनुशंसित है । स्थिति-विशिष्ट दृष्टिकोण MAGERI के समान है, लेकिन इसके बजाय सभी छह अलग प्रतिस्थापन प्रकार के लिए एक समग्र त्रुटि दर का उपयोग कर के (ए > सी/टी > जी, एक > जी/टी > सी, एक > टी/टी > ए, सी > ए/जी > टी, सी > जी/ , सी > टी/जी > एक)13, हम प्रत्येक प्रतिस्थापन स्वतंत्र रूप से हर स्थिति में मॉडल । उदाहरण के लिए, एक दिया जीनोमिक स्थिति में सी > टी की एक त्रुटि दर एक और स्थिति से अलग है । हमारे दृष्टिकोण भी खाते में एक sequencing बैच प्रभाव लेता है, के रूप में एक sequencing रन में मनाया आधार प्रतिस्थापन दर दूसरे रन से अलग हो सकता है । इसलिए यह मॉडल बनाने के लिए अलग sequencing रन से नमूने विशेष रूप से सभी प्रतिस्थापन प्रकार के लिए प्रत्येक स्थिति के लिए महत्वपूर्ण है.

एक महत्वपूर्ण विचार जब एक ईसीएस प्रयोग डिजाइनिंग वांछित पता लगाने सीमा है । NGS अध्ययनों की खूबसूरती है कि वे आसानी से जीन के मामले में स्केल किया जा सकता है/ब्याज के लक्ष्य, पता लगाने सीमा (अनुक्रमण की गहराई से तय), और व्यक्तियों की संख्या पूछे । उदाहरण के लिए, यदि शोधकर्ताओं ने ०.०००१ का पता लगाने की दहलीज के साथ दो amplicons में दुर्लभ उत्परिवर्तनों को खोजने के लिए रुचि रखते हैं, वे एक एकल sequencing MiSeq V2 रसायन विज्ञान जो १५,०००,००० तक outputs का उपयोग कर चलाने में अधिक से अधिक ७५ नमूनों पूल कर सकते हैं (2 amplicons * १०,००० अणु * 10 त्रुटि के लिए पढ़ता-सुधार * ७५ नमूने = १५,०००,००० अनुक्रमण पढ़ता). शोधकर्ताओं sequencing में जा रहे अणुओं की संख्या में भिन्न हो सकते हैं या पता लगाना थ्रेशोल्ड को समायोजित करने के लिए चलाएँ एक एकल sequencing में pooled नमूनों की संख्या. हमारे अध्ययन में, हम Illumina जीन पैनल का उपयोग ०.०००१ VAF (1:10000) का पता लगाने दहलीज के साथ उत्परिवर्तनों को खोजने के उद्देश्य से । हम नियमित रूप से डीएनए शुरू करने के लिए सुनिश्चित करें कि पर्याप्त अणुओं पर कब्जा कर लिया है क्रम में aforementioned पता लगाने की सीमा को प्राप्त करने के २५० एनजी का इस्तेमाल करते हैं । शोधकर्ताओं ने डीएनए की कम राशि के साथ शुरू करने के लिए विकल्प चुन सकते हैं (५० एनजी की सिफारिश की है) यदि वांछित पता लगाने की सीमा है > 0.001 VAF.

के रूप में UMIs i5 अनुक्रमित पर जोड़े जाते हैं, sequencing सेटिंग्स तदनुसार संशोधन किया जाना है । उदाहरण के लिए, हम 16 N UMIs उपयोग किया, और sequencing सेटिंग्स थे 2x144 युग्मित अंत पढ़ता, अनुक्रमणिका 2 के 8 चक्रों और अनुक्रमणिका 2 के 16 चक्र के रूप में सामांय 8 चक्रों के लिए विरोध किया है । सूचकांक 2 चक्र में वृद्धि के लिए आवंटित चक्रों की कुल संख्या में कमी से मुआवजा दिया है पढ़ता है । शोधकर्ताओं 12N UMIs10,17का उपयोग करने के लिए चुनते हैं, तो सेटिंग्स अनुक्रमणिका 2 के 12 चक्र के लिए परिवर्तित किया जाना चाहिए ।

यह UMI-आधारित sequencing विधि sequencing त्रुटियों के लिए सही करने के लिए ऑप्टिमाइज़ किया गया है । यह पीसीआर jackpotting, जो सभी प्रवर्धन के लिए एक मुद्दा है आधारित विधि से निपटने में इष्टतम रहता है । हम ddPCR का उपयोग कर के बाद अनुक्रमण और पोस्ट bioinformatics सत्यापन के दौर प्रदर्शन किया, और हम शायद ही पीसीआर jackpotting के कारण किसी भी झूठी सकारात्मक का पता लगाने । बहरहाल, यह अनुशंसा की जाती है कि शोधकर्ताओं उच्च निष्ठा पोलीमरेज़ का उपयोग करने के लिए कम प्रवर्धन त्रुटियों को सुनिश्चित प्रयोगों आचरण ।

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

हम बच्चों के कैंसर विज्ञान समूह AAML1531 अध्ययन और रोगी नमूनों के रूप में उनके योगदान के लिए नर्सों के स्वास्थ्य अध्ययन में प्रतिभागियों को धन्यवाद । यह काम स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा वित्त पोषित किया गया (UM1 CA186107, RO1 CA49449 और RO1 CA149445), बच्चों की खोज वाशिंगटन विश्वविद्यालय के संस्थान और सेंट लुइस बच्चों के अस्पताल (MC-II-2015-461), और एली सेठ मैथ्यू ल्यूकेमिया फाउंडेशन.

Materials

Name Company Catalog Number Comments
Q5 High Fidelity Hot Start Master Mix New England BioLabs M0492S
Agencourt AMPure XP Beckman Coulter A63880
Qubit dsDNA HS Assay Kit Thermo Fisher Scientific Q32854
SYBR Safe DNA Gel Stain Thermo Fisher Scientific S33102
Truseq Custom Amplicon Index Kit Illumina FC-130-1003
UMI i5 adapter sequences Integrated DNA Technologies -
NEBNext Ultra End Repair/dA-Tailing Module New England BioLabs E7442S
NEBNext Ultra II Ligation Module New England BioLabs E7595S
QX200 ddPCR EvaGreen Supermix Bio-Rad 1864034
QX200 Droplet Generation Oil for EvaGreen Bio-Rad 1864005
QX200 Droplet Digital PCR System Bio-Rad 1864001
ddPCR 96-Well Plates Bio-Rad 12001925
DG8 Cartridges for QX200/QX100 Droplet Generator Bio-Rad 1864008
DG8 Gaskets for QX200/QX100 Droplet Generator Bio-Rad 1863009
Bioanalyzer Agilent Genomics G2939BA
TapeStation Agilent Genomics G2991AA
TruSight Myeloid Sequencing Panel Illumina FC-130-1010
Bowtie 2 Johns Hopkins University -
Customized QIAseq Targeted RNA Panel Qiagen -
Rneasy Plus Mini Kit (50) Qiagen 74134

DOWNLOAD MATERIALS LIST

References

  1. Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
  2. O'Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
  3. Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
  4. Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
  5. Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
  6. Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
  7. Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
  8. Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
  9. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
  10. Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
  11. Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
  12. Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
  13. Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
  14. Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
  15. Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
  16. Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
  17. Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Tags

आनुवंशिकी मुद्दा १३८ दुर्लभ घटना का पता लगाने त्रुटि-सही अनुक्रमण bioinformatics जीनोमिक्स जल्दी पता लगाने आणविक टैगिंग
त्रुटि-सही डीएनए और आरएनए अनुक्रमण का उपयोग कर दुर्लभ घटना का पता लगाने
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wong, W. H., Tong, R. S., Young, A.More

Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter