Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

पूरे जीनोम नैनोपोर अनुक्रमण को मान्य करना, एक उदाहरण के रूप में Usutu वायरस का उपयोग करना

Published: March 11, 2020 doi: 10.3791/60906

Summary

हमने पहले नैनोपोर अनुक्रमण मंच पर एम्प्लिस-आधारित पूरे जीनोम Usutu वायरस (USUV) अनुक्रमण के लिए एक प्रोटोकॉल मान्य किया था। यहां, हम अधिक विस्तार से उपयोग किए जाने वाले तरीकों का वर्णन करते हैं और नैनोपोर आर 10 प्रवाह सेल की त्रुटि दर निर्धारित करते हैं।

Abstract

पूरे जीनोम अनुक्रमण की विशेषता और वायरल प्रकोप का पता लगाने के लिए इस्तेमाल किया जा सकता है । नैनोपोर स्थित पूरे जीनोम अनुक्रमण प्रोटोकॉल कई अलग-अलग वायरस के लिए वर्णित किए गए हैं। ये दृष्टिकोण एक अतिव्यापी एम्प्लिस-आधारित दृष्टिकोण का उपयोग करते हैं जिसका उपयोग आनुवंशिक रूप से संबंधित वायरस के विशिष्ट वायरस या समूह को लक्षित करने के लिए किया जा सकता है। वायरस की उपस्थिति की पुष्टि के अलावा, अनुक्रमण जीनोमिक महामारी विज्ञान अध्ययन के लिए इस्तेमाल किया जा सकता है, वायरस को ट्रैक करने और मूल, जलाशयों और संचरण के तरीकों को जानने के लिए । ऐसे अनुप्रयोगों के लिए, उपयोग किए गए प्लेटफ़ॉर्म से जुड़े त्रुटि दर के संभावित प्रभावों को समझना महत्वपूर्ण है। नैदानिक और सार्वजनिक स्वास्थ्य सेटिंग्स में नियमित आवेदन की आवश्यकता है कि यह प्रोटोकॉल में हर महत्वपूर्ण परिवर्तन के साथ प्रलेखित है । इससे पहले, नैनोपोर अनुक्रमण मंच पर पूरे जीनोम Usutu वायरस अनुक्रमण के लिए एक प्रोटोकॉल को इलुमिना अनुक्रमण की सीधी तुलना करके मान्य (R9.4 फ्लोसेल) किया गया था। यहां, हम एक उदाहरण के रूप में R10 प्रवाह सेल और Illumina अनुक्रमण के बीच तुलना का उपयोग कर, आवश्यक पढ़कवरेज निर्धारित करने के लिए इस्तेमाल किया विधि का वर्णन ।

Introduction

तीसरी पीढ़ी के अनुक्रम प्रौद्योगिकियों में तेजी से विकास हमें वायरल प्रकोपों के दौरान वास्तविक समय अनुक्रमण के करीब की ओर आगे बढ़ने की अनुमति देता है । आनुवंशिक जानकारी की यह समय पर उपलब्धता वायरल रोगजनकों की उत्पत्ति और विकास को निर्धारित करने के लिए उपयोगी हो सकती है। अगली पीढ़ी के क्षेत्रों में सोने के मानक हालांकि अनुक्रमण, अभी भी दूसरी पीढ़ी के अनुक्रमक हैं । ये तकनीकें पायस पीसीआर या क्लोनल ब्रिज प्रवर्धन के दौरान क्लोनल प्रवर्धन जैसी विशिष्ट और समय लेने वाली तकनीकों पर भरोसा करती हैं। तीसरी पीढ़ी के अनुक्रमक सस्ते, हाथ से आयोजित होते हैं और सरलीकृत पुस्तकालय तैयार करने के तरीकों के साथ आते हैं। विशेष रूप से अनुक्रम डिवाइस के छोटे आकार और कम खरीद मूल्य यह तैनाती योग्य, क्षेत्रबद्ध अनुक्रमण के लिए एक दिलचस्प उंमीदवार बनाता है । उदाहरण के लिए सिएरा लियोन में इबोला वायरस फैलने के दौरान और ब्राजील में चल रहे आर्बोवायरस फैलने की जांचकेदौरान देखा जा सकता है 1 ,2,,3. हालांकि, रिपोर्ट की गई उच्च त्रुटि दर4 उन अनुप्रयोगों को सीमित कर सकती है जिनके लिए नैनोपोर अनुक्रमण का उपयोग किया जा सकता है।

नैनोपोर अनुक्रमण जल्दी विकसित हो रहा है। नए उत्पाद नियमित आधार पर बाजार में उपलब्ध हैं। उदाहरण के लिए इसके उदाहरण 1डी चुकता किट हैं जो डीएनए अणु की दोनों किस्में अनुक्रमण को सक्षम बनाता है, जिससे उक्त ठिकानों5 की सटीकता और R10 प्रवाह कोशिका का विकास बढ़ाया जाता है जो पोर6में दो अलग-अलग उदाहरणों पर वर्तमान में परिवर्तन को मापता है। इसके अलावा बेसकॉलिंग में सुधार जैसे बेहतर बायो-इन्फॉर्मेटिक टूल्स बेसकॉलिंग7की सटीकता में सुधार करेंगे । सबसे अधिक बार उपयोग किए जाने वाले बेसकॉलर में से एक, (उदाहरण के लिए, अल्बाकोर), 9 महीने की समय अवधि5में कम से कम 12 बार अपडेट किया गया है। हाल ही में निर्माता ने फ्लिप-फ्लॉप नामक एक उपन्यास बेसकॉलर भी जारी किया, जिसे डिफॉल्ट नैनोपोर सॉफ्टवेयर8में लागू किया गया है। एक साथ, इन सभी सुधारों से अधिक सटीक दृश्यों का नेतृत्व होगा और नैनोपोर सीक्वेंसर की त्रुटि दर में कमी आएगी।

Usutu वायरस (USUV) एक मच्छर जनित Arbovirus परिवार के Flaviviridae है और यह लगभग ११,००० न्यूक्लियोटाइड्स के एक सकारात्मक फंसे आरएनए जीनोम है । यूएसयूवी मुख्य रूप से महान ग्रे उल्लू और ब्लैकबर्ड्स9,10को प्रभावित करता है , हालांकि अन्य पक्षी प्रजातियां भी यूएसयूवी संक्रमण11के लिए अतिसंवेदनशील होती हैं । हाल ही में, यूएसयूवी की पहचान कृंतक और श्रे में भी की गई थी, हालांकि वायरस के संचरण में उनकी संभावित भूमिकाअज्ञात 12बनी हुई है। मनुष्यों में, रक्तदाताओं में स्पर्शोन्मुख संक्रमण13,,14,,15,,16 का वर्णन किया गया है जबकि यूएसयूवी संक्रमण ों को भी इंसेफेलाइटिस या मेनिंगो-इंसेफेलाइटिस17,,18से संबद्ध होने की सूचना मिली है । नीदरलैंड में, यूएसयूवी को पहली बार 201610 में जंगली पक्षियों में और 201814में स्पर्शोन्मुख रक्तदाताओं में पाया गया था। USUV के प्रारंभिक पता लगाने के बाद से, प्रकोप बाद के वर्षों के दौरान सूचित किया गया है और निगरानी, पूरे जीनोम अनुक्रमण सहित, वर्तमान में उभरने और एक पहले भोले आबादी में एक arbovirus के प्रसार की निगरानी के लिए चल रही है ।

इबोला वायरस, जीका वायरस और येलो फीवर वायरस3,,19,,20जैसे अन्य वायरसों के लिए जो बताया गया है, उसके समान हमने पूर्ण लंबाई USUV21को अनुक्रम करने के लिए एक प्राइमर सेट विकसित किया है । यह पॉलीमरेज चेन रिएक्शन (पीसीआर) -आधारित दृष्टिकोण लगभग 32 के सीटी मूल्य तक के नमूनों में मस्तिष्क के नमूनों की तरह अत्यधिक मेजबान-दूषित नमूना प्रकारों से पूर्ण लंबाई वाले यूएसयूवी जीनोम की वसूली के लिए अनुमति देता है। एम्प्लिस आधारित अनुक्रमण दृष्टिकोण के लाभ मेटाजेनोमिक अनुक्रमण और उच्च विशिष्टता की तुलना में एक उच्च संवेदनशीलता है। एक एम्प्लिकन आधारित दृष्टिकोण का उपयोग करने की सीमाएं हैं कि दृश्यों को सभी उपभेदों को फिटिंग करने वाले प्राइमर को डिजाइन करने के लिए समान होना चाहिए और प्राइमर्स वायरस विविधता के बारे में हमारे वर्तमान ज्ञान पर डिज़ाइन किए गए हैं।

तीसरी पीढ़ी अनुक्रमण में निरंतर विकास और सुधार को देखते हुए, नियमित आधार पर अनुक्रमक की त्रुटि दर का मूल्यांकन करने की आवश्यकता है। यहां, हम एक उदाहरण के रूप में यूएसयूवी का उपयोग करके इलुमिना अनुक्रमण के खिलाफ सीधे नैनोपोर के प्रदर्शन का मूल्यांकन करने के लिए एक विधि का वर्णन करते हैं। यह विधि नवीनतम R10 प्रवाह सेल के साथ उत्पन्न दृश्यों पर लागू होती है और फ्लिप-फ्लॉप बेसकॉलर के नवीनतम संस्करण के साथ बेसकॉलिंग की जाती है।

Protocol

नोट: उपयोग किए जाने वाले सॉफ़्टवेयर टूल की सूची: usearch v11.0.667; मांसपेशी v3.8.1551; पोरचॉप 0.2.4; कटअनुकूली 2.5; मिनीमैप2 2.16-r922; समटूल 1.9; ट्रिममोमैटिक 0.39; बीबीमैप 38.33; हुकुम v3.13.1; किमी-1.2.8

1. प्राइमर डिजाइन

  1. सार्वजनिक या निजी डेटा संग्रह से प्रासंगिक संदर्भ पूरे जीनोम दृश्यों का एक सेट डाउनलोड करने या पुनः प्राप्त करने के साथ शुरू करें। उदाहरण के लिए, एनसीबीआई डाटाबेस22से सभी पूर्ण लंबाई वाले यूएसयूवी जीनोम (टैक्सीडी64286) को पुनः प्राप्त करें। यूएसयूवी लगभग 11,000 न्यूक्लियोटाइड्स के जीनोम को एन्कोड करता है ताकि केवल 8,000-12,000 न्यूक्लियोटाइड्स की अनुक्रम लंबाई के साथ दृश्यों को पुनः प्राप्त किया जा सके। निम्नलिखित खोज प्रविष्टि का उपयोग करके ऐसा करें:
    - टैक्सीड64286 [जीव:नोएक्सपी] और 8000 [SLEN]: 12000 [SLEN]।
    1. भेजें पर क्लिक करें । पूरा रिकॉर्ड । फाइल, प्रारूप = FASTA का उपयोग करें और फ़ाइल बनाएं।
  2. संदर्भ दृश्यों के सेट का आकार घटाने के लिए, डेटासेट से 99% से अधिक न्यूक्लियोटाइड पहचान के साथ डुप्लिकेट दृश्यों या दृश्यों को हटा दें। यूसर्च23से क्लस्टर फास्ट ऑप्शन का उपयोग करके ऐसा करें। कमांड लाइन पर दर्ज करें:
    - usearch -cluster_fast All_USUV.fasta -id 0.99 -centroids All_USUV_dedup.fasta
  3. प्राइमर उत्पन्न करने के लिए, दृश्यों को गठबंधन करने की आवश्यकता है। यह मांसपेशियों24का उपयोग करके किया जाता है। कमांड लाइन पर दर्ज करें:
    - मांसपेशी में All_USUV_dedup.फास्टा-आउट All_USUV_dedup_aligned.फास्टा-लॉग log_muscle.txt
    नोट: विसंगतियों की जांच करने के लिए संरेखण का मैन्युअल रूप से निरीक्षण करना आवश्यक है। यदि आवश्यक हो तो इन्हें मैन्युअल रूप से ठीक किया जा सकता है और अधिकांश पूरे जीनोम दृश्यों की लंबाई के अनुसार सिरों को छंटनी की जा सकती है।
  4. प्राइमल का उपयोग प्राइमर का मसौदा चयन करने के लिए किया जाता है जिसका उपयोग19को पूर्ण लंबाई के एम्प्लिस के लिए किया जा सकता है । संरेखण को मौलिक वेबसाइट(http://primal.zibraproject.org/)पर अपलोड करें और पसंदीदा एम्प्लिस लंबाई का चयन करें और विभिन्न एम्प्लिस के बीच लंबाई को ओवरलैप करें। primal.zibraproject.org पर जाएं, योजनाका नाम भरें, गठबंधन फास्टा फ़ाइल अपलोड करें, एम्प्लीसन लंबाई का चयन करें, आकार ओवरलैप करें, और योजना उत्पन्न करें।
  5. उपलब्ध पूर्ण यूएसयूवी दृश्यों का पूरा सेट संरेखित करें (आकार या डिडुप्लिकेट सेट नहीं)। कमांड लाइन पर दर्ज करें:
    - मांसपेशी में All_USUV.fasta-बाहर All_USUV_aligned.fasta-लॉग log_muscle.txt
    नोट: पूर्ण संरेखण के खिलाफ उत्पन्न प्राइमर को मैप करें (डीडुप्लिकेट अलाइनमेंट का उपयोग न करें), मैन्युअल रूप से सही त्रुटियां और अधिकतम 5 अपक्षयी प्राइमर पदों को शामिल करें।

2. मल्टीप्लेक्स पीसीआर

  1. डिजाइन किए गए प्राइमर और नैनोपोर और इलुमिना सीक्वेंसिंग का इस्तेमाल करते हुए मल्टीप्लेक्स पीसीआर को अंजाम दें। यूएसयूवी के लिए मल्टीप्लेक्स पीसीआर को पिछले19,21के रूप में अंजाम दिया गया था ।
  2. फ्लिप-फ्लॉप संस्करण 3.0.6.6 +9999d81 के साथ बेसकॉलिंग करें।

3. नैनोपोर डेटा से आम सहमति दृश्यों उत्पन्न करने के लिए डेटा विश्लेषण

  1. एक नैनोपोर अनुक्रमण रन पर कई नमूनों को मल्टीप्लेक्स किया जा सकता है। सीक्वेंस रन करने के बाद नैनोपोर डेटा को डिमल्टीप्लेक्स करें । इसके लिए पोरचॉप25 का इस्तेमाल करें। संदूषण को रोकने और सटीकता बढ़ाने के लिए, require_two_barcodes ध्वज का उपयोग करें। कमांड लाइन पर दर्ज करें:
    - porechop -i Run_USUV.fastq-o Run_USUV_demultiplex--require_two_barcodes
  2. डिमल्टीप्लेक्सिंग के बाद, कटअनुकूली26का उपयोग करके प्राइमर दृश्यों (दोनों झुकाव में Primers_Usutu.फास्टा) फ़ाइल में इंगित करें। इसके अलावा, 75 न्यूक्लियोटाइड्स से कम लंबाई वाले दृश्यों को हटा दें। प्राइमर को हटाना होगा क्योंकि वे आम सहमति अनुक्रम में कृत्रिम पूर्वाग्रहों को लागू कर सकते हैं । कमांड लाइन पर दर्ज करें:
    - कटअपाप्ड -बी फ़ाइल:Primers_USUV.फास्टा-ओ BC01_trimmed.fastq BC01.fastq-m 75
  3. डिमल्टीप्लेक्स्ड सीक्वेंस पढ़ता है कि मिनीमैप22 27 का उपयोग करके अलग-अलग संदर्भ उपभेदों के पैनल के खिलाफ मैप किया जा सकता है और समटूल28का उपयोग करके सर्वसम्मति अनुक्रम उत्पन्न किया जा सकता है। नीचे दिए गए उदाहरण का पालन करें जो संदर्भ-आधारित संरेखण की प्रक्रिया और एक नमूने की आम सहमति अनुक्रम पीढ़ी को दिखाता है: BC01। कमांड लाइन पर दर्ज करें:
    - minimap2 -कुल्हाड़ी नक्शा-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam
    - समटूल सॉर्ट BC01.bam >BC01_sorted.bam
    - bcftools mpileup -Ou-f Random_Refs_USUV.fasta BC01_sorted.bam . bcftools कॉल-एमवी-आस्ट्रेलिया-o BC01.vcf.gz
    - bcftools सूचकांक BC01.vcf.gz
    - बिल्ली Random_Refs_USUV.फास्टा । bcftools आम सहमति BC01.vcf.gz > BC01_consensus.fasta
  4. संदर्भ-आधारित संरेखण के लिए यह आवश्यक है कि एक बारीकी से संबंधित संदर्भ अनुक्रम का उपयोग किया जाता है। इसलिए, निकटतम संदर्भ तनाव की पहचान करने के लिए उत्पन्न आम सहमति अनुक्रम के साथ ब्लास्टन खोज करें। उसके बाद, संदर्भ के रूप में निकटतम संदर्भ तनाव (चरण 3.3 और 3.4) के साथ संदर्भ-आधारित संरेखण दोहराएं। कमांड लाइन पर दर्ज करें:
    - minimap2 -कुल्हाड़ी नक्शा-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq >BC01_ref.bam
    - समटूल सॉर्ट BC01_ref.बाम एंड जीटी; BC01_sorted_ref.बाम
    - bcftools mpileup -Ou-f Ref_USUV_BC01.fasta BC01_sorted_ref.bam . bcftools कॉल-एमवी-आस्ट्रेलिया-o BC01_ref.vcf.gz
    - bcftools सूचकांक BC01_ref.vcf.gz
    - बिल्ली Ref_USUV_BC01.फास्टा । bcftools आम सहमति BC01_ref.vcf.gz > BC01_ref_consensus.fasta

4. इलुमिना डेटा का विश्लेषण

  1. अनुक्रम अनुक्रमण के बाद इन दृश्यों को स्वचालित रूप से डिमल्टीप्लेक्स किया जाता है। पढ़ता है गुणवत्ता ट्रिममोमैटिक29का उपयोग कर नियंत्रित किया जा सकता है । बनती-अंत Illumina दृश्यों के लिए, 33 के आमतौर पर इस्तेमाल किया कट-ऑफ औसत PHRED स्कोर और 75 की एक ंयूनतम पढ़ने की लंबाई का उपयोग करने के लिए सटीक, उच्च गुणवत्ता पढ़ता है मिलता है। कमांड लाइन पर दर्ज करें:
    - ट्रिममोमैटिक पे -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq अग्रणी: 3 पीछे: 3 SlidingWINDOW:3:15 MINLEN:75
  2. प्राइमर निकालें (दोनों झुकाव में फ़ाइल Primers_Usutu.fasta में इंगित), क्योंकि वे कृत्रिम पूर्वाग्रहों को पेश कर सकते हैं, cutadapt26का उपयोग कर । इसके अलावा, नीचे दिए गए आदेशों का उपयोग करके 75 न्यूक्लियोटाइड्स से कम लंबाई वाले दृश्यों को हटा दें। कमांड लाइन पर दर्ज करें:
    - cutadapt -b o 9_1P_trimmed.fastq-p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq-m 75
  3. डी नोवो विधानसभा से पहले, अनुक्रम पढ़ता है जीनोम भर में एक भी कवरेज के लिए सामान्यीकृत किया जा सकता है । यह आवश्यक है क्योंकि एसपीएडेस जैसे डी नोवो असेंबलर्स पढ़ने वाले अनुक्रम पढ़ता है तो पढ़े गए कवरेज को ध्यान में रखते हैं। सामान्य बीबीमैप पैकेज30से BBNorm का उपयोग कर 50 के एक पढ़कवरेज के लिए पढ़ता है . कमांड लाइन पर दर्ज करें:
    - bbmap/bbnorm.sh लक्ष्य = 50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq
  4. सामान्यीकृत पढ़ता है डी नोवो31SPAdes का उपयोग कर इकट्ठे हुए हैं । सभी अलग-अलग केमर्स (21, 33, 55, 77, 99 और 127) का उपयोग करके असेंबली के लिए डिफ़ॉल्ट सेटिंग्स का उपयोग किया जाता है। कमांड लाइन पर दर्ज करें:
    - spades.py -कश्मीर 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq
  5. नक्शा QC प्राप्त आम सहमति अनुक्रम के खिलाफ पढ़ता है minimap2 और जीनियस, Bioedit या Ugene जैसे कार्यक्रमों का उपयोग करने के लिए संरेखण क्यूरेट । कॉन्टिग की शुरुआत और अंत की जांच करना जरूरी है।
    1. संरेखित करें क्यूसी मिनीमैप 2 का उपयोग करके प्राप्त आम सहमति अनुक्रमण के खिलाफ पढ़ता है।
    2. जीनियस/बायोएडिट/यूजीन में अलाइनमेंट का आयात करें ।
    3. मैन्युअल रूप से निरीक्षण, सही और क्यूरेट विशेष रूप से शुरुआत और जीनोम के अंत।

5. सोने के मानक के रूप में Illumina डेटा का उपयोग कर नैनोपोर अनुक्रमण में त्रुटि प्रोफ़ाइल के लिए क्षतिपूर्ति करने के लिए आवश्यक पढ़ा कवरेज का निर्धारण

  1. इस मामले में 26 एम्प्लिस न हो करके एक एम्प्लिकन में मैपिंग का चयन करें। बाद में, मैप नैनोपोर मिनीमैप 2 का उपयोग करके इस एम्प्लिकन के खिलाफ पढ़ता है। एम्प्लिस 26 को केवल रीड्स मैपिंग का चयन करने और बाम फ़ाइल को फास्टक्यू में बदलने के लिए Samtools का उपयोग करें। कमांड लाइन पर दर्ज करें:
    - minimap2 -कुल्हाड़ी नक्शा-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam
    - समटूल व्यू -बी-एफ 4 BC01.bam >BC01_mapped.bam
    - समटूल बाम2एफक्यू BC01_mapped.बाम । सेक्क सीक्यू-->BC01_mapped.fastq
  2. उदाहरण के लिए बेतरतीब ढंग से चुनिंदा सबसेट 200 अनुक्रम एक हजार बार पढ़ता है। उदाहरण के लिए, इसे 10 में बदलने से 10 अनुक्रम के सबसेट में एक हजार गुना यादृच्छिक चयन होगा। स्क्रिप्ट को सप्लीमेंट्री फाइल 1के रूप में प्रदान किया गया है । कमांड लाइन पर दर्ज करें:
    - अजगर Random_selection.py
  3. सभी बेतरतीब ढंग से चयनित अनुक्रम पढ़ता है एम्प्लिकन 26 के लिए गठबंधन कर रहे हैं । अनुक्रम पढ़ता है नक्शा और तुरंत एक आम सहमति अनुक्रम उत्पन्न करने के लिए KMA३२ का उपयोग करें । -बीसीनैनो फ्लैग द्वारा इंगित नैनोपोर अनुक्रमण के लिए अनुकूलित सेटिंग्स का उपयोग करें। कमांड लाइन पर दर्ज करें:
    - केएमए इंडेक्स -i Amplicon26.fasta
    - random_sample में फ़ाइल के लिए *; क्या करें
    - नमूनाआईडी = $ {फ़ाइल%fastq}
    - केएमए -i ${sampleID}.fastq-o ${sampleID}-t_db Amplicon26.fasta-mem_mode-mp 5-mrs 0.0-bcNano
    - किया
  4. कमांड लाइन पर उत्पन्न आम सहमति दृश्यों का उपयोग कर निरीक्षण:
    - बिल्ली *.fsa > All_genomes.fsa
    - minimap2 -कुल्हाड़ी नक्शा-ont Amplicon26.fasta All_genomes.fsa >All_genomes.bam
    - समटूल सॉर्ट All_genomes.बाम एंड जीटी; All_genomes_sorted.बाम
    - समटूल आंकड़े All_genomes_sorted.बाम और gt; stats.txt
    1. त्रुटि दर #mismatches/ठिकानोंके शीर्षक त्रुटि दर के तहत आँकड़ों में प्रदर्शित किया जाता है मैप किया जाता है । इसे निम्नलिखित आदेश के साथ स्क्रीन पर प्रदर्शित करें:
      - ग्रेप ^एसएन आंकड़े.txt । कट-एफ 2-
    2. प्रति चक्र शीर्षक #Indelsके तहत अडेल की मात्रा प्रदर्शित की जाती है । इसे निम्नलिखित आदेश के साथ स्क्रीन पर प्रदर्शित करें:
      - ग्रेप ^आईसी आंकड़े.txt । कट-एफ 2-

Representative Results

हाल ही में, फ्लो सेल संस्करण (R10) का एक नया संस्करण जारी किया गया था और इलेक्ट्रॉनिक वर्तमान संकेत को डीएनए दृश्यों (तथाकथित फ्लिप-फ्लॉप बेसकॉलर) में बदलने के लिए उपयोग किए जाने वाले बेसकॉलर में सुधार की पेशकश की गई थी। इसलिए, हमने यूएसयूवी-पॉजिटिव उल्लू के मस्तिष्क के ऊतकों से यूएसयूवी को फिर से अनुक्रमित किया है जिसे पहले R9.4 प्रवाह कोशिका पर और एक इलुमिना मिसक्यू इंस्ट्रूमेंट21पर अनुक्रमित किया गया था। यहां, हमने इलुमिना अनुक्रमण की सीधी तुलना करके विश्वसनीय आम सहमति कॉलिंग के लिए आवश्यक रीड कवरेज निर्धारित करने के लिए उपयोग की जाने वाली विधि का वर्णन किया।

बेसकॉलर फ्लिप-फ्लॉप के संयोजन में नए प्रवाह सेल का उपयोग करते हुए हम बताते हैं कि 40x के एक पढ़ने के कवरेज के परिणामस्वरूप इलुमिना अनुक्रमण की तुलना में समान परिणाम होते हैं। 30x की एक रीड कवरेज 0.0002% की त्रुटि दर में परिणाम देती है जो हर 585,000 न्यूक्लियोटाइड्स अनुक्रमित में एक त्रुटि से मेल खाती है, जबकि 20x के एक पढ़े हुए कवरेज के परिणामस्वरूप हर 63,529 न्यूक्लियोटाइड्स अनुक्रमित में एक त्रुटि होती है। 10x के एक पढ़कवरेज हर ३,३१२ न्यूक्लियोटाइड्स अनुक्रमित में एक त्रुटि में परिणाम है, जिसका अर्थ है कि पूर्ण USUV जीनोम प्रति तीन न्यूक्लियोटाइड्स से अधिक गलत कहा जा रहा है । 30x से ऊपर एक पढ़ा कवरेज के साथ, कोई indels मनाया गया । 20x के एक पढ़कवरेज एक अडेल स्थिति का पता लगाने के परिणामस्वरूप जबकि 10x के एक पढ़ कवरेज 29 पदों में indels में हुई । टेबल 1में अलग-अलग रीड कवरेज कट-ऑफ का उपयोग करके त्रुटि दर का अवलोकन दिखाया गया है।

कवरेज त्रुटियों का चलना 1 त्रुटि दर पुनरावृत्ति 1 इंडेल्स: त्रुटियां पुनरावृत्ति 2 त्रुटि दर पुनरावृत्ति 2 इंडेल्स: त्रुटियों का चलना 3 त्रुटि दर पुनरावृत्ति 3 इंडेल्स:
10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7
20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0
30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0
40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0
50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0

तालिका 1: नैनोपोर अनुक्रमण की त्रुटि दर का अवलोकन। प्रत्येक पुनरावृत्ति एक हजार यादृच्छिक नमूनों का प्रतिनिधित्व करता है।

अनुपूरक फाइल 1: रैंडम सेलेक्शन। कृपया इस फ़ाइल को देखने के लिए यहां क्लिक करें (डाउनलोड करने के लिए सही क्लिक करें)।

Discussion

नैनोपोर अनुक्रमण लगातार विकसित हो रहा है और इसलिए त्रुटि दर की निगरानी के लिए तरीकों की आवश्यकता है। यहां, हम नैनोपोर सीक्वेंसर की त्रुटि दर की निगरानी के लिए एक कार्यप्रवाह का वर्णन करते हैं। यह एक नए प्रवाह सेल की रिहाई के बाद उपयोगी हो सकता है, या यदि बेसकॉलिंग की नई रिलीज जारी की जाती है। हालांकि, यह उन उपयोगकर्ताओं के लिए भी उपयोगी हो सकता है जो अपने स्वयं के अनुक्रमण प्रोटोकॉल को सेट-अप और मान्य करना चाहते हैं।

विभिन्न सॉफ्टवेयर और संरेखण उपकरण33अलग-अलग परिणाम दे सकते हैं। इस पांडुलिपि में, हमने स्वतंत्र रूप से उपलब्ध सॉफ्टवेयर पैकेजों का उपयोग करने का लक्ष्य दिया है जिनका आमतौर पर उपयोग किया जाता है, और जिनके पास स्पष्ट दस्तावेज हैं। कुछ मामलों में, वाणिज्यिक उपकरणों को वरीयता दी जा सकती है, जिसमें आम तौर पर अधिक उपयोगकर्ता के अनुकूल इंटरफेस होते हैं लेकिन इसके लिए भुगतान किया जाना चाहिए। भविष्य में, इस विधि को एक ही नमूने पर लागू किया जा सकता है यदि अनुक्रम प्रौद्योगिकी या बेसकॉलिंग सॉफ्टवेयर में बड़े संशोधनों को तरजीही रूप से पेश किया जाता है तो यह बेसकॉलर या फ्लोसेल के प्रत्येक अपडेट के बाद किया जाना चाहिए, हालांकि वर्तमान विकास की गति को देखते हुए यह भी प्रमुख अपडेट के बाद ही किया जा सकता है।

अनुक्रमण में त्रुटि दर में कमी से नमूनों की संख्या अधिक होने की अनुमति होती है। इस प्रकार, नैनोपोर अनुक्रमण नैदानिक परख के लिए पारंपरिक वास्तविक समय पीसीआरएस की जगह के करीब हो रही है, जो पहले से ही इंफ्लूएंजा वायरस निदान के लिए मामला है । इसके अलावा, त्रुटि दर में कमी से इस तकनीक अनुक्रमण की उपयोगिता बढ़ जाती है, उदाहरण के लिए मामूली वेरिएंट के निर्धारण के लिए और उच्च-थ्रूपुट निष्पक्ष मेटाजेनोमिक अनुक्रमण के लिए।

प्रोटोकॉल में एक महत्वपूर्ण कदम यह है कि करीबी, विश्वसनीय संदर्भ दृश्यों को उपलब्ध होने की आवश्यकता है। प्राइमर वायरस विविधता के बारे में वर्तमान ज्ञान पर आधारित हैं और हर बार एक समय में अपडेट करने की आवश्यकता हो सकती है। एक और महत्वपूर्ण बिंदु जब एक एम्प्लिकेट आधारित अनुक्रमण दृष्टिकोण की स्थापना प्राइमर एकाग्रता के संतुलन के लिए एम्प्लिकेट गहराई में एक भी संतुलन मिल रहा है । यह एक अनुक्रम रन पर अधिक नमूनों की मल्टीप्लेक्सिंग को सक्षम बनाता है और परिणामस्वरूप लागत में काफी कमी आती है।

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

इस काम को ग्रांट एग्रीमेंट नंबर 643476 (तुलना) के तहत यूरोपियन यूनियन के होराइजन २०२० रिसर्च एंड इनोवेशन प्रोग्राम से फंडिंग मिली है ।

Materials

Name Company Catalog Number Comments
Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

DOWNLOAD MATERIALS LIST

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. Nanopore Store, R10 flow cells. , https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019).
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. GitHub - nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads. , https://github.com/nanoporetech/flappie (2019).
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. GitHub - rrwick/Porechop: adapter trimmer for Oxford Nanopore reads. , https://github.com/rrwick/porechop (2018).
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. BBMap download | SourceForge.net. , https://sourceforge.net/projects/bbmap/ (2019).
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Tags

जेनेटिक्स इश्यू 157 नैनोपोर अनुक्रमण आर 10 फ्लोसेल यूएसयूवी आर्बोवायरस पूरे जीनोम अनुक्रमण
पूरे जीनोम नैनोपोर अनुक्रमण को मान्य करना, एक उदाहरण के रूप में Usutu वायरस का उपयोग करना
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Oude Munnink, B. B., Nieuwenhuijse,More

Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter