लंबे समय तक पढ़ा दृश्यों बहुत जटिल जीनोम की विधानसभा और संरचनात्मक परिवर्तन के लक्षण वर्णन की सुविधा । हम नैनोपोर आधारित अनुक्रमण प्लेटफार्मों द्वारा अल्ट्रा लंबे अनुक्रम उत्पन्न करने के लिए एक विधि का वर्णन । दृष्टिकोण एक अनुकूलित डीएनए निष्कर्षण के बाद संशोधित पुस्तकालय की तैयारी के सैकड़ों किलोबाइट उत्पंन करने के लिए मानव कोशिकाओं से मध्यम कवरेज के साथ पढ़ता है adopts ।
तीसरी पीढ़ी के एकल अणु डीएनए अनुक्रमण प्रौद्योगिकियों काफी लंबे समय तक पढ़ने की लंबाई है कि जटिल जीनोम और जटिल संरचनात्मक वेरिएंट के विश्लेषण के विधानसभा की सुविधा कर सकते है प्रदान करते हैं । नैनोपोर प्लेटफार्मों सीधे वर्तमान के माध्यम से डीएनए पारित द्वारा मध्यस्थता परिवर्तनों को मापने के द्वारा एकल अणु अनुक्रमण प्रदर्शन pores और किलोबाइट (केबी) के सैकड़ों उत्पंन कर सकते है ंयूनतम पूंजी लागत के साथ पढ़ता है । कई शोधकर्ताओं द्वारा इस मंच अपनाया गया है अनुप्रयोगों की एक किस्म के लिए । अब अनुक्रमण पढ़ने लंबाई को प्राप्त करने के ट्विटर अनुक्रमण प्लेटफार्मों के मूल्य का लाभ उठाने के लिए सबसे महत्वपूर्ण कारक है । अल्ट्रा लंबे पढ़ता उत्पन्न करने के लिए, विशेष विचार डीएनए टूटना से बचने और उत्पादक अनुक्रमण टेम्पलेट्स उत्पन्न करने के लिए दक्षता हासिल करने के लिए आवश्यक है । यहां, हम उच्च आणविक वजन (hmw) डीएनए निष्कर्षण सहित अल्ट्रा लंबे डीएनए अनुक्रमण का विस्तृत प्रोटोकॉल ताजा या जमे हुए कोशिकाओं से, यांत्रिक कर्तन या transposase विखंडन द्वारा पुस्तकालय निर्माण, और एक नैनोपोर डिवाइस पर अनुक्रमण प्रदान करते हैं । hmw डीएनए के 20-25 μg से, विधि यांत्रिक कर्तन और 90-100 kb transposase मध्यस्थता विखंडन के साथ पढ़ने की लंबाई के N50 के साथ 50-70 केबी की N50 पढ़ने की लंबाई को प्राप्त कर सकते हैं । प्रोटोकॉल को स्तनधारी कोशिकाओं से निकाले गए डीएनए पर लागू किया जा सकता है ताकि संरचनात्मक वेरिएंट और जीनोम असेंबली का पता लगाने के लिए पूरी जीनोम अनुक्रमण की जा सके । डीएनए निष्कर्षण और एंजाइमी प्रतिक्रियाओं पर अतिरिक्त सुधार आगे पढ़ने की लंबाई में वृद्धि और इसकी उपयोगिता का विस्तार होगा ।
पिछले एक दशक से अधिक, व्यापक समानांतर और अत्यधिक सटीक दूसरी पीढ़ी के उच्च थ्रौपुट अनुक्रमण प्रौद्योगिकियों जैव चिकित्सा खोज और तकनीकी नवाचार1,2,3के एक विस्फोट प्रेरित किया है । तकनीकी अग्रिमों के बावजूद, दूसरी पीढ़ी के प्लेटफार्मों द्वारा सृजित अल्प-पठन आंकड़े जटिल जीनोमिक क्षेत्रों के समाधान में अप्रभावी हैं और जीनोमिक संरचनात्मक वेरिएंट (SVs) का पता लगाने में सीमित हैं, जो मानव में महत्वपूर्ण भूमिकाएं निभाते हैं । विकास और रोग4,5. इसके अलावा, लघु पढ़ने के डेटा दोहराने भिंनता को हल करने में असमर्थ है और समझदार अगुणन प्रकार के आनुवंशिक वेरिएंट6के लिए अनुपयुक्त हैं ।
एकल-अणु अनुक्रमण में हाल की प्रगति काफी लंबे समय तक पढ़ने की लंबाई प्रदान करता है, जो7,8,9svs की पूर्ण स्पेक्ट्रम का पता लगाने की सुविधा कर सकते हैं, और जटिल के सटीक और पूर्ण विधानसभा प्रदान करता है माइक्रोबियल और स्तनधारी जीनोम6,10. ट्विटर मंच सीधे वर्तमान के माध्यम से डीएनए पारित द्वारा मध्यस्थता परिवर्तनों को मापने के द्वारा एकल अणु अनुक्रमण करता है pores11,12,13। किसी भी मौजूदा डीएनए अनुक्रमण रसायन विज्ञान के विपरीत, ट्विटर अनुक्रमण लंबे समय उत्पंन कर सकते है (किलोबाइट के हजारों दसियों) पोलीमरेज़ कैनेटीक्स या डीएनए नमूने के कृत्रिम प्रवर्धन पर भरोसा किए बिना रीयल-टाइम में पढ़ता है । इसलिए, ट्विटर लंबे समय से पढ़ें अनुक्रमण (nlr-seq) अल्ट्रा लंबे पढ़ने के लिए महान वादा रखती है लंबाई अच्छी तरह से परे १०० केबी, जो बहुत जीनोमिक और जैव चिकित्सा विश्लेषण14अग्रिम, कम जटिलता या दोहराने में विशेष रूप से होगा अमीर जीनोम के क्षेत्र15.
नैनोपोर अनुक्रमण की अनूठी विशेषता अपने लंबे समय एक सैद्धांतिक लंबाई सीमा के बिना पढ़ता उत्पंन करने की क्षमता है । इसलिए, पठन लंबाई डीएनए की भौतिक लंबाई पर निर्भर है जो सीधे डीएनए अखंडता और अनुक्रमण टेंपलेट गुणवत्ता से प्रभावित है । इसके अलावा, हेरफेर की सीमा पर और शामिल कदम की संख्या पर निर्भर करता है, जैसे पिख्ता बलों और निष्कर्षण की स्थिति, डीएनए की गुणवत्ता उच्च चर है । इसलिए, यह एक के लिए चुनौतीपूर्ण है लंबे समय तक सिर्फ मानक डीएनए निष्कर्षण प्रोटोकॉल और निर्माता की आपूर्ति की पुस्तकालय निर्माण विधियों आवेदन द्वारा पढ़ता है । इस अंत की ओर, हम एक मजबूत विधि को अल्ट्रा लंबे (किलोलोसेस के सैकड़ों) अनुक्रमण डेटा काटा सेल छर्रों से शुरू पढ़ने उत्पंन विकसित किया है । हमने डीएनए निष्कर्षण और पुस्तकालय तैयारी प्रक्रियाओं में कई सुधार अपनाए । हम प्रोटोकॉल को सुव्यवस्थित करने के लिए अनावश्यक प्रक्रियाओं है कि डीएनए क्षरण और नुकसान का कारण बाहर । इस प्रोटोकॉल उच्च आणविक वजन (hmw) डीएनए निष्कर्षण, अल्ट्रा लंबे डीएनए पुस्तकालय निर्माण, और एक नैनोपोर मंच पर अनुक्रमण से बना है । एक अच्छी तरह से प्रशिक्षित आणविक जीवविज्ञानी के लिए, यह आम तौर पर hmw डीएनए निष्कर्षण के पूरा होने के लिए सेल संचयन से 6 एच लेता है, ९० मिनट या 8 h कर्तन विधि के आधार पर पुस्तकालय निर्माण के लिए, और डीएनए अनुक्रमण के लिए एक आगे ४८ h करने के लिए । प्रोटोकॉल का उपयोग जीनोमिक्स समुदाय को सशक्त करने के लिए जीनोम जटिलता की हमारी समझ में सुधार होगा और मानव रोगों में जीनोम भिन्नता में नई अंतर्दृष्टि हासिल ।
सिद्धांत रूप में, ट्विटर अनुक्रमण करने के लिए १०० kb megabase उत्पंन करने में सक्षम है लंबाई में पढ़ता है11,12,13। चार प्रमुख कारकों अनुक्रमण भागो और डेटा की गुणवत्ता के प्रदर्शन को प्रभावित करेगा: 1) सक्रिय रंध्र संख्या और pores की गतिविधि; 2) मोटर प्रोटीन, जो नानोपोर के माध्यम से गुजर डीएनए की गति को नियंत्रित करता है; 3) डीएनए टेम्पलेट (लंबाई, शुद्धता, गुणवत्ता, द्रव्यमान); 4) अनुक्रमण अनुकूलक बंधाव दक्षता, जो इनपुट नमूना से useable डीएनए निर्धारित करता है । पहले दो कारकों प्रवाह सेल के संस्करण और अनुक्रमण किट निर्माता द्वारा प्रदान पर निर्भर करते हैं । दूसरे दो कारकों इस प्रोटोकॉल में महत्वपूर्ण कदम है (hmw डीएनए निष्कर्षण, कर्तन और ligation) ।
इस प्रोटोकॉल के लिए धैर्य और अभ्यास की आवश्यकता है । HMW डीएनए की गुणवत्ता अल्ट्रा लंबे डीएनए पुस्तकालयों के लिए महत्वपूर्ण है6। प्रोटोकॉल उच्च व्यवहार्यता (> 85% व्यवहार्य सेल पसंदीदा) के साथ एकत्र कोशिकाओं के साथ शुरू होता है, मृत कोशिकाओं से नीचा डीएनए सीमित । किसी भी कठोर प्रक्रिया जो डीएनए को नुकसान (जैसे, मजबूत परेशान, मिलाते हुए, भंवर, एकाधिक पिख्ता, दोहराया ठंड और गल) का परिचय हो सकता है से बचना चाहिए । प्रोटोकॉल के डिजाइन में, हम डीएनए निष्कर्षण की पूरी प्रक्रिया में पिख्ता चूकना । विस्तृत बोर युक्तियों का उपयोग करने की आवश्यकता है जब पाइपलाइन पुस्तकालय निर्माण और अनुक्रमण के दौरान यांत्रिक कर्तन के बाद आवश्यक है । के रूप में nanopores चैंबर बफर12में chemistries के प्रति संवेदनशील हैं, वहां के रूप में कुछ अवशिष्ट contaminants होना चाहिए (जैसे, डिटर्जेंट, surfactants, phenol, इथेनॉल, प्रोटीन rnas, आदि) के रूप में डीएनए में संभव है । लंबाई और उपज को ध्यान में रखते हुए, phenol निष्कर्षण विधि से पता चलता है सबसे अच्छा और सबसे reproducible कई अलग निष्कर्षण तरीकों का परीक्षण अब तक के साथ तुलना में परिणाम ।
लंबे समय तक पढ़ने के दृश्यों का उत्पादन करने के लिए इस प्रोटोकॉल की क्षमता के बावजूद, कई सीमाएं अभी भी बनी हुई हैं । सबसे पहले, इस प्रोटोकॉल के प्रकाशन के समय में उपलब्ध नैनोपोर अनुक्रमण उपकरण के आधार पर अनुकूलित किया गया था; इस प्रकार, यह चयनात्मक नैनोपोर आधारित अनुक्रमण रसायन विज्ञान तक ही सीमित है और लंबे समय से पढ़ने अनुक्रमण उपकरणों के अंय प्रकार में किया जब सबऑप्टिमल हो सकता है । दूसरा, परिणाम शुरू सामग्री (ऊतकों या कोशिकाओं) से निकाले गए डीएनए की गुणवत्ता पर अत्यधिक निर्भर है । यदि प्रारंभिक डीएनए पहले से ही नीचा या क्षतिग्रस्त है तो पठन लंबाई समझौता किया जाएगा । तीसरा, हालांकि कई QC कदम प्रोटोकॉल में डीएनए की गुणवत्ता की जांच करने के लिए शामिल कर रहे हैं, अंतिम उपज और पढ़ता की लंबाई प्रवाह कोशिका और ताकना गतिविधि है, जो नैनोपोर अनुक्रमण मंच के इस प्रारंभिक चरण में चर सकता है द्वारा प्रभावित किया जा सकता है विकास.
प्रोटोकॉल यहां वर्णित डीएनए निष्कर्षण के लिए मानव निलंबन सेल लाइन के नमूनों का उपयोग करता है । हम सुई shearing में गुजर बार अनुकूलित किया है, hmw डीएनए के transposase करने के लिए अनुपात और बंधाव समय वर्णित परिणामों के उत्पादन के लिए । प्रोटोकॉल को चार तरीकों से विस्तारित किया जा सकता है । सबसे पहले, उपयोगकर्ताओं को अंय सभ्य स्तनधारी कोशिकाओं के साथ और कोशिकाओं, ऊतकों, नैदानिक नमूनों, या अंय जीवों के विभिंन राशि के साथ शुरू कर सकते हैं । इसके अलावा lysis ऊष्मायन समय पर अनुकूलन, प्रतिक्रिया मात्रा और केंद्रापसारक की जरूरत होगी । दूसरा, यह अल्ट्रा के लिए लक्ष्य आकार की भविष्यवाणी करने के लिए कठिन है लंबे समय sequencing पढ़ें । यदि पठन लंबाई अपेक्षा से कम है, तो उपयोगकर्ता कर सकते है पासिंग समय में यांत्रिक shearing-आधारित पद्धति को समायोजित करें या transposase फ़्रेग्मेंटेशन-आधारित पद्धति में करने के लिए HMW डीएनए का अनुपात बदलें । क्लीनअप स्टेप के दौरान लंबे समय तक बाइंडिंग और वेफरेंस टाइम मददगार होते हैं क्योंकि एचएमडब्ल्यू डीएनए बेहद चिपचिपा होता है । तीसरा, अलग ट्विटर अनुक्रमण उपकरणों के साथ, एक मात्रा और डीएनए की मात्रा को समायोजित करने के लिए sequencer के मापदंड को पूरा कर सकते हैं. चौथा, केवल उन डीएनए अनुक्रमण एडाप्टर के लिए ligated अनुक्रम किया जाएगा । आगे बंधाव दक्षता में सुधार करने के लिए, एक एडाप्टर और बंधाव सांद्रता titrate करने का प्रयास कर सकते हैं । संशोधित बंधाव समय और आणविक भीड़ एजेंटों जैसे खूंटी18 भविष्य में लागू किया जा सकता है । अल्ट्रा लंबे डीएनए अनुक्रमण प्रोटोकॉल crispr19के साथ संयुक्त,20 लक्ष्य संवर्धन अनुक्रमण के लिए एक प्रभावी उपकरण की पेशकश कर सकते हैं ।
The authors have nothing to disclose.
लेखक पांडुलिपि पर अपनी टिप्पणी के लिए Y. Zhu धंयवाद । इस प्रकाशन में सूचित अनुसंधान आंशिक रूप से राष्ट्रीय कैंसर संस्थान के राष्ट्रीय स्वास्थ्य संस्थानों द्वारा पुरस्कार संख्या P30CA034196 के तहत समर्थन किया गया था । सामग्री पूरी तरह से लेखकों की जिंमेदारी है और जरूरी नहीं कि स्वास्थ्य के राष्ट्रीय संस्थानों के आधिकारिक विचारों का प्रतिनिधित्व करते हैं ।
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |