Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

जीनोमिक्स द्वारा उपंयास अनुक्रम डिस्कवरी

Published: January 25, 2019 doi: 10.3791/58877

Summary

इस प्रोटोकॉल के प्रयोजन के लिए अभिकलनी और बेंच अनुसंधान का एक संयोजन का उपयोग करने के लिए उपंयास दृश्यों कि आसानी से एक सह शुद्ध अनुक्रम, जो केवल आंशिक रूप से जाना जा सकता है से अलग नहीं किया जा सकता है खोजने के लिए है ।

Abstract

उपजीनोमिक्स किसी भी अनुसंधान में इस्तेमाल किया जा सकता है, जहां लक्ष्य एक जीन, प्रोटीन, या सामांय क्षेत्र है कि एक बड़ा जीनोमिक संदर्भ में एंबेडेड है के अनुक्रम की पहचान है । उपजीनोमिक्स एक शोधकर्ता व्यापक अनुक्रमण द्वारा ब्याज (टी) के एक लक्ष्य अनुक्रम को अलग करने के लिए सक्षम बनाता है और ज्ञात आनुवंशिक तत्वों (संदर्भ, आर) बाहर घटाकर । विधि mitochondria, chloroplasts, वायरस, या germline प्रतिबंधित गुणसूत्रों जैसे उपंयास दृश्यों की पहचान करने के लिए इस्तेमाल किया जा सकता है, और विशेष रूप से उपयोगी है जब टी आसानी से आर से अलग नहीं किया जा सकता है व्यापक जीनोमिक डेटा (आर + टी) के साथ शुरू, विधि एक संदर्भ अनुक्रम, या दृश्यों के खिलाफ बुनियादी स्थानीय संरेखण खोज उपकरण (ब्लास्ट) का उपयोग करता है, लक्ष्य (टी) पीछे छोड़कर मिलान ज्ञात दृश्यों (आर) को दूर करने के लिए । सबसे अच्छा काम करने के लिए घटाव के लिए, आर एक अपेक्षाकृत पूरा मसौदा है कि टी लापता है होना चाहिए । घटाव के बाद शेष अनुक्रम मात्रात्मक पोलीमरेज़ श्रृंखला प्रतिक्रिया (qPCR) के माध्यम से परीक्षण कर रहे हैं के बाद से, आर काम करने के लिए विधि के लिए पूरा होने की जरूरत नहीं है. यहां हम एक चक्र है कि जरूरत के रूप में दोहराया जा सकता है में प्रयोगात्मक कदम के साथ गणना कदम लिंक, क्रमिक रूप से कई संदर्भ दृश्यों को हटाने और टी के लिए खोज को परिष्कृत जीनोमिक्स का लाभ यह है कि एक पूरी तरह से उपंयास लक्ष्य अनुक्रम मामलों में भी पहचान की जा सकती है जिसमें शारीरिक शुद्धि मुश्किल, असंभव, या महंगा है । विधि की एक खामी घटाव और qPCR परीक्षण के लिए टी पॉजिटिव और नकारात्मक नमूने प्राप्त करने के लिए एक उपयुक्त संदर्भ पा रही है । हम ज़ेबरा फिंच के germline-प्रतिबंधित गुणसूत्र से पहले जीन की पहचान में विधि के हमारे कार्यांवयन का वर्णन । उस मामले में गणनात्मक फ़िल्टरिंग शामिल तीन संदर्भ (R), क्रमिक रूप से तीन चक्रों पर निकाल दिया: एक अपूर्ण जीनोमिक असेंबली, raw जीनोमिक डेटा, और transcriptomic डेटा ।

Introduction

इस विधि के प्रयोजन के लिए एक उपंयास लक्ष्य (टी) जीनोमिक अनुक्रम की पहचान है, या तो डीएनए या आरएनए, एक जीनोमिक संदर्भ से, या संदर्भ (R) (चित्रा 1) । अगर लक्ष्य को शारीरिक रूप से अलग नहीं किया जा सकता है, या ऐसा करना महंगा हो जाएगा तो विधि सबसे उपयोगी है । केवल कुछ जीवों घटाव के लिए पूरी तरह से जीनोम खत्म हो गया है, तो हमारे विधि का एक प्रमुख नवाचार गणना और बेंच तरीकों का संयोजन करने के लिए शोधकर्ताओं को सक्षम करने के लिए लक्ष्य अनुक्रम को अलग जब संदर्भ अपूर्ण है, या एक मसौदा एक गैर मॉडल जीव से जीनोम । एक चक्र के अंत में, qPCR परीक्षण और अधिक घटाव की जरूरत है कि क्या यह निर्धारित करने के लिए प्रयोग किया जाता है । एक सत्यापित उंमीदवार टी अनुक्रम qPCR द्वारा ज्ञात टी सकारात्मक नमूनों में सांख्यिकीय अधिक से अधिक पता लगाने दिखाएगा ।

विधि के अवतार नए जीवाणु दवा लक्ष्य है कि मेजबान homologs1,2,3,4 और संक्रमित मेजबान से उपंयास वायरस की पहचान नहीं है की खोज में लागू किया गया है 5,6. टी की पहचान के अलावा, विधि आर सुधार कर सकते हैं: हम हाल ही में ज़ेबरा फिंच संदर्भ जीनोम से ९३६ लापता जीन की पहचान और एक germline केवल गुणसूत्र (टी)7से एक नया जीन विधि का इस्तेमाल किया । उपजीनोमिक्स विशेष रूप से मूल्यवान है जब टी ज्ञात दृश्यों से अत्यंत अलग होने की संभावना है, या जब टी की पहचान मोटे तौर पर अपरिभाषित है, के रूप में ज़ेबरा फिंच germline-प्रतिबंधित गुणसूत्र7में ।

पहले टी के सकारात्मक पहचान की आवश्यकता नहीं द्वारा, जीनोमिक्स के एक महत्वपूर्ण लाभ यह है कि यह निष्पक्ष है । हाल ही में एक अध्ययन में, Readhead एट अल. चार मस्तिष्क क्षेत्रों में अल्जाइमर रोग और वायरल बहुतायत के बीच संबंधों की जांच की । वायरल पहचान के लिए, Readhead एट अल । ५१५ वायरस का एक डाटाबेस बनाया8, गंभीर रूप से वायरल एजेंटों सीमित है कि उनके अध्ययन की पहचान सकता है । उपजीनोमिक्स स्वस्थ और अल्जाइमर जीनोम की तुलना करने के लिए संभव उपंयास बीमारी से जुड़े वायरस को अलग करने के लिए इस्तेमाल किया जा सकता है, उनकी समानता के ज्ञात संक्रामक एजेंटों के लिए परवाह किए बिना । जबकि वहां रहे है २६३ मानव लक्ष्यीकरण वायरस, यह अनुमान लगाया गया है कि लगभग १,६७०,००० undiscover वायरल प्रजातियों में मौजूद है, 631000-827000 के साथ उनमें से एक क्षमता9मनुष्यों को संक्रमित करने के लिए ।

उपंयास वायरस का अलगाव एक क्षेत्र है जिसमें उपश्वसनी जीनोमिक्स विशेष रूप से प्रभावी है, लेकिन कुछ अध्ययनों से इस तरह के एक कड़े विधि की जरूरत नहीं हो सकती है । उदाहरण के लिए, उपंयास वायरस की पहचान अध्ययन निष्पक्ष उच्च प्रवाह अनुक्रमण रिवर्स प्रतिलेखन और वायरल अनुक्रम5 या वायरल न्यूक्लिक एसिड के संवर्धन के लिए BLASTx द्वारा पीछा करने के लिए निकालने और रिवर्स टाइप वायरल दृश्यों का इस्तेमाल किया है 6. इन अध्ययनों से नियोजित डी नोवो अनुक्रमण और विधानसभा, घटाव क्योंकि लक्ष्य अनुक्रम सकारात्मक विस्फोट के माध्यम से पहचाने गए थे नहीं किया गया था । यदि वायरस पूरी तरह से उपंयास और संबंधित नहीं थे (या दूर से संबंधित) अंय वायरस के लिए, असभ्य जीनोमिक्स एक उपयोगी तकनीक किया गया होता । जीनोमिक्स के लाभ यह है कि पूरी तरह से नए है कि अनुक्रम प्राप्त किया जा सकता है । अगर जीव के जीनोम का पता चल जाए तो वह किसी भी वायरल जुगाड़ को छोड़ने के लिए बाहर ही मुकर सकता है । उदाहरण के लिए, हमारे प्रकाशित अध्ययन में हम ज़ेबरा फिंच से एक उपंयास वायरल अनुक्रम पृथक जीनोमिक्स के माध्यम से अलग है, हालांकि यह हमारी मूल मंशा7नहीं था ।

जीनोमिक्स भी बैक्टीरियल वैक्सीन लक्ष्य की पहचान में उपयोगी साबित कर दिया है, एंटीबायोटिक प्रतिरोध में नाटकीय वृद्धि से प्रेरित1,2,3,4। को स्व-प्रतिरक्षित प्रतिक्रिया के जोखिम को कम करने के लिए, शोधकर्ताओं ने नीचे सीमित क्षमता वैक्सीन किसी भी प्रोटीन है कि मानव की मेजबानी में homologs है घटाकर द्वारा लक्ष्य । एक विशेष अध्ययन, Corynebacterium pseudotuberculosisको देख, कई जीवाणु जीनोम से हड्डीवाला मेजबान जीनोम के घटाव प्रदर्शन को सुनिश्चित करना है कि संभव दवा लक्ष्यों को प्रभावित नहीं होगा साइड इफेक्ट के लिए अग्रणी मेजबान में प्रोटीन 1. इन अध्ययनों के मूल कार्य प्रवाह को बैक्टीरियल proteome डाउनलोड करना, महत्वपूर्ण प्रोटीन का निर्धारण, निरर्थक प्रोटीन निकालना, BLASTp का उपयोग आवश्यक प्रोटीन को अलग करना, और मेजबान proteome के खिलाफ BLASTp मेजबान के साथ किसी भी प्रोटीन को दूर करने के लिए है homologs 1 , 2 , 3 , 4. इस मामले में, उपजीनोमिक्स सुनिश्चित करें कि टीके विकसित किसी भी बंद-लक्ष्य प्रभाव में मेजबान1,2,3,4नहीं होगा ।

हम एक germline-प्रतिबंधित गुणसूत्र (जीआरसी) (इस मामले में, टी), जो germlines में पाया जाता है लेकिन दोनों लिंगों के दैहिक ऊतक नहीं है पर पहले प्रोटीन कोडिंग जीन की पहचान करने के लिए जीनोमिक्स इस्तेमाल किया10। इस अध्ययन से पहले, केवल जीनोमिक जानकारी जीआरसी के बारे में जाना जाता था एक दोहराव क्षेत्र11था । डी नोवो विधानसभा अंडाशय से अनुक्रम आरएनए पर प्रदर्शन किया और वयस्क ज़ेबरा finches से ऊतकों (आर + टी) का परीक्षण किया गया. अनुक्रम की गणना उन्मूलन प्रकाशित दैहिक (स्नायु) जीनोम अनुक्रम (r1)12का उपयोग किया गया था, इसके रॉ (सैंज) डेटा (आर2) पढ़ें, और एक दैहिक (मस्तिष्क) transcriptome (r3)13. तीन संदर्भों के अनुक्रमिक उपयोग प्रत्येक चक्र के चरण 5 में qPCR परीक्षण द्वारा संचालित किया गया था (चित्रा 2), दिखा रहा है कि अतिरिक्त फ़िल्टरिंग की आवश्यकता थी । खोजा α-स्नैप जीन डीएनए और आरएनए से qPCR के माध्यम से पुष्टि की गई थी, और क्लोनिंग और अनुक्रमण । हम अपने उदाहरण में दिखाने के लिए कि इस विधि लचीला है: यह न्यूक्लिक एसिड (डीएनए बनाम आरएनए) मिलान पर निर्भर नहीं है और वह घटाव संदर्भ (आर) है कि विधानसभाओं या रॉ के शामिल है के साथ किया जा सकता है पढ़ता है ।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. De नोवो शुरू अनुक्रम इकट्ठा

नोट: किसी भी अगली पीढ़ी के अनुक्रम (NGS) डेटा का उपयोग किया जा सकता है, जब तक एक असेंबली उन डेटा से निर्मित किया जा सकता है । उपयुक्त इनपुट डेटा Illumina, PacBio, या ऑक्सफोर्ड ट्विटर एक फसता फ़ाइल में इकट्ठे पढ़ता शामिल है । ठोसता के लिए, इस खंड का वर्णन एक Illumina आधारित transcriptomic ज़ेबरा फिंच अध्ययन हम7प्रदर्शन के लिए विशिष्ट विधानसभा; लेकिन ध्यान रखें कि विशेष रूप से प्रोजेक्ट के अनुसार भिन्न होंगे । हमारे उदाहरण प्रोजेक्ट के लिए, raw डेटा एक MiSeq से व्युत्पंन किए गए थे और लगभग १०,०००,००० युग्मित पढ़ता प्रत्येक नमूने से प्राप्त किए गए थे ।

  1. Illumina एडेप्टर और कम गुणवत्ता वाले ठिकानों को हटाने के लिए Trimmomatic ०.३२14 का उपयोग करें । आदेश पंक्ति पर, दर्ज करें:
    जावा-जार trimmomatic-0.32. जार PE-phred33 आगे  fq gz उल्ट  fq  gz-baseout quality_and_adaptor_trimmed ILLUMINACLIP: TruSeq3-पे. एफए: 2:30:10 अग्रलेख: 3 ट्रेलिंग: 3 SLIDINGWINDOW: 4:20 MINLEN: 40
  2. नाशपाती का प्रयोग करें15 v. 0.9.6 उच्च गुणवत्ता बनाने के लिए मर्ज किए गए पढ़ता से trimmomatic आउटपुट युग्मित पढ़ता, डिफ़ॉल्ट पैरामीटर का उपयोग कर । आदेश पंक्ति पर, दर्ज करें:
    नाशपाती-च < quality_and_adaptor_trimmed_1P. fastq >-r < quality_and_adaptor_trimmed_2P. fastq >
  3. उपयोग साँप v. १.१16 त्रुटि-सही करने के लिए नाशपाती के माध्यम से उत्पादित पढ़ता है । 17में वर्णित चरण-दर-चरण प्रोटोकॉल का पालन करें ।
  4. सही दृश्यों को इकट्ठा करने के लिए डिफ़ॉल्ट मोड में ट्रिनिटी v. 2.4.018 का उपयोग करें । किनारा-विशिष्ट पुस्तकालयों के लिए, का उपयोग करें-SS_lib_type पैरामीटर । आउटपुट एक फसता फ़ाइल (your_assembly. फसता) है । आदेश पंक्ति पर, दर्ज करें:
    ट्रिनिटी--seqType fq--SS_lib_type FR – max_memory 10G – आउटपुट Trinity_output--वाम quality_and_adaptor_trimmed_forward_paired_reads. fq – right quality_and_adaptor_trimmed_reverse_paired_reads. fq – CPU 10
    नोट: आउटपुट एक नई निर्देशिका, Trinity_output में रखा जाएगा, और विधानसभा ' ट्रिनिटी. फसता ' जिसका नाम Your_assembly. फसता के रूप में बदला जा सकता है अगर वांछित किया जाएगा । अधिक जानकारी के लिए ट्रिनिटी वेबसाइट देखें: https://github.com/trinityrnaseq/trinityrnaseq/wiki/Running-Trinity ।

2. संदर्भ अनुक्रम के खिलाफ विधानसभा विस्फोट

नोट: जब संदर्भ असेंबली है या सैंज की तरह लंबा पढ़ता है, तो इस चरण का उपयोग करें; यदि यह raw Illumina reads से बना है, तो क्वेरी करने के लिए मैपिंग पढ़ता के लिए नीचे चरण 3 देखें । सभी विस्फोट चरणों संस्करण 2.2.29 के साथ पूरा किया गया + हालांकि आदेश किसी भी हाल ही में विस्फोट संस्करण पर काम करना चाहिए ।

  1. आदेश पंक्ति पर संदर्भ अनुक्रम (nucleotide_reference. फसता) का एक विस्फोट डेटाबेस बनाएं । कमांड लाइन में निंनलिखित दर्ज करें:
    makeblastdb-dbtype nucl-इन nucleotide_reference. फसता-बन्ना nucleotide_reference. db
  2. ब्लास्ट-क्वेरी असेंबली (चरण 1 में जनरेट किया गया) संदर्भ डेटाबेस से मेल खाती है । एक आउटपुट फ़ाइल प्राप्त करने के लिए, [-out BLAST_results. txt] का उपयोग करें और तालिका आउटपुट जनरेट करने के लिए (पायथन स्क्रिप्ट के साथ क्रमिक संसाधन चरणों के लिए आवश्यक), का उपयोग करें [-outfmt 6] । इन विकल्पों को किसी भी क्रम में संयुक्त किया जा सकता है, इसलिए एक उदाहरण पूरा आदेश है [blastn-क्वेरी your_assembly. फसता-db nucleotide_reference. db-out BLAST_results. txt-outfmt 6] । यदि कोई ई-मान सेटिंग वांछित है, तो एक उपयुक्त संख्या के साथ-evalue विकल्प का उपयोग करें, उदाहरण के लिए [-evalue 1e-6]. हालांकि ध्यान रखें कि उपevalue चक्र प्रभावी ढंग से औंधा में सेटिंग के रूप में चर्चा में वर्णित है ।
  3. वृद्धि हुई stringency के लिए, अनुवाद न्यूक्लियोटाइड विस्फोट (tBLASTn) के साथ विस्फोट क्वेरी के रूप में विधानसभा से प्रोटीन अनुक्रम का उपयोग करें, जो (न्यूक्लियोटाइड) डाटाबेस के 6 तरह अनुवाद करता है । इस विधि ज्यादातर गैर मॉडल प्रणालियों के लिए सिफारिश की है, अधूरा प्रोटीन एनोटेशन की समस्या से परहेज ।
    1. सुनिश्चित करें कि जीव का अध्ययन किया जा रहा है के लिए सही आनुवंशिक कोड चयनित है, का उपयोग कर-db_gencode विकल्प । क्वेरी के लिए प्रोटीन अनुक्रम प्राप्त करने के लिए, TransDecoder. LongOrfs आदेश (TransDecoder पैकेज v. 3.0.1) से इकट्ठे क्वेरी अनुक्रम से सबसे लंबे समय तक खुला पठन फ़्रेम की पहचान करने के लिए चलाएँ । आदेश है [TransDecoder. LongOrfs-t your_assembly. फसता]; उत्पादन निर्देशिका में रखा जाएगा ' टेप. transdecoder_dir ' कहा जाता है और एक longest_orfs. स्फूर्ति युक्त एक फ़ाइल your_assembly. फसता में प्रत्येक अनुक्रम से सबसे लंबे समय तक की भविष्यवाणी की प्रोटीन अनुक्रम शामिल होगा ।
    2. tBLASTn का उपयोग करने के लिए, आदेश चलाएँ [tBLASTn-क्वेरी longest_orfs. पेप-db nucleotide_reference. db-out BLAST_results. txt-outfmt 6]. यदि एक उच्च गुणवत्ता वाले प्रोटीन संदर्भ उपलब्ध है, tBLASTn के बजाय BLASTp के साथ प्रोटीन प्रोटीन मिलान का उपयोग करें ।
    3. प्रोटीन संदर्भ के एक विस्फोट डेटाबेस बनाओ [makeblastdb-dbtype prot-में protein_reference. फसता-out protein_reference. db] और फिर [blastp-क्वेरी longest_orfs. स्फूर्ति-db protein_reference. db-out BLAST_results. txt-outfmt 6] । बहाव प्रसंस्करण के लिए एक फ़ाइल के रूप में परिणाम को बचाने के लिए सुनिश्चित करें, और पायथन लिपियों उन्हें सही ढंग से पार्स कर सकते हैं सुनिश्चित करने के लिए तालिका (outfmt 6) का उपयोग करें ।

3. मानचित्र विधानसभा पर पढ़ता है

नोट: इस विधि का उपयोग किया जा सकता यदि संदर्भ dataset के होते है raw जीनोमिक पढ़ता, बजाय इकट्ठे अनुक्रम या सैंज अनुक्रम, जिसमें स्थिति का उपयोग करें विस्फोट (चरण २.१) ।

  1. BWA-मेम v. 0.7.1219 या bowtie220का उपयोग कर, डाउनलोड किए गए raw पढ़ता (raw_reads. fastq) क्वेरी असेंबली पर मैप करें । आउटपुट. sam स्वरूप होगा । आदेश निंनानुसार हैं: प्रथम अनुक्रमणिका असेंबली: [bwa अनुक्रमणिका your_assembly. फसता], और उसके बाद पढ़ता मैप [bwa मेम your_assembly. फसता raw_reads. fastq > मैप्ड. sam] । (नोट ' > ' प्रतीक यहां एक से अधिक चिह्न नहीं है; इसके बजाय यह आउटपुट फ़ाइल मैप. sam में जाने के लिए निर्देश देता है) ।

4. उपयोग अजगर स्क्रिप्ट किसी भी मिलान अनुक्रम को दूर करने के लिए

नोट: प्रदान की लिपियों अजगर २.७ के साथ काम करते हैं ।

  1. चरण 2 के बाद, आदेश का उपयोग करके उपजीवाणु अजगर स्क्रिप्ट का उपयोग करें [./Non-matching_sequences.py your_assembly. फसता BLAST_results. txt] । स्क्रिप्ट चलाने से पहले, सुनिश्चित करें कि ब्लास्ट आउटपुट फ़ाइल स्वरूप 6 (तालिका) में है । स्क्रिप्ट आउटपुट गैर-मिलान अनुक्रम फसता स्वरूप में your_assembly. fasta_non-matching_sequences_BLAST_results. txt. फसता नाम के साथ एक फ़ाइल और भी रिकॉर्ड के लिए मिलान अनुक्रम, your_assembly. fasta_matching_sequences_BLAST_ के रूप में होगा results. txt. फसता. गैर मिलान फ़ाइल सबसे महत्वपूर्ण हो जाएगा, परीक्षण के लिए संभावित टी अनुक्रम के एक स्रोत के रूप में और अधिक असभ्य जीनोमिक्स के चक्र ।
  2. चरण 3 के बाद, पायथन स्क्रिप्ट removeUnmapped.py ३.१ कदम से इनपुट के रूप में लेने के लिए चलाने के लिए, और किसी भी मिलान पढ़ता के बिना क्वेरी अनुक्रम के नाम की पहचान करता है और उन्हें एक नया पाठ फ़ाइल में सहेजता है । आदेश [./removeUnmapped.py मैप्ड. sam] का उपयोग करें और आउटपुट मैप किया जाएगा. sam_contigs_with_no_reads. txt । (कार्यक्रम एक slimmed-नीचे सैम फ़ाइल सभी बिना मैप किए गए पढ़ता के साथ उत्पंन होगा; इस फ़ाइल को इस प्रोटोकॉल के प्रयोजनों के लिए अनदेखा किया जा सकता है लेकिन अंय विश्लेषणों के लिए उपयोगी हो सकता है) ।
  3. पिछले कदम के उत्पादन के रूप में एक पाठ फ़ाइल में अनुक्रम नाम की एक सूची है मैप्ड. sam_contigs_with_no_reads. txt कहा जाता है, इन दृश्यों के साथ एक फसता फ़ाइल निकालने: [./getContig.py your_assembly. फसता. sam_contigs_with_no_reads. txt] । आउटपुट मैप्ड. sam_contigs_with_no_reads. txt. फसता नामक एक फ़ाइल होगी ।

5. अनुक्रम है कि रहता है के लिए डिजाइन प्राइमर

नोट: इस बिंदु पर एक फसता फ़ाइल युक्त उंमीदवार टी अनुक्रम है । यह खंड qPCR का वर्णन करता है कि क्या वे आर के पहले से अज्ञात क्षेत्रों से या टी से आते हैं । यदि चरण 4 में घटाव सभी दृश्यों को हटा दिया है, तो या तो प्रारंभिक विधानसभा टी शामिल करने में विफल रहा है, या घटाव भी कड़े हो सकता है ।

  1. का प्रयोग करें21 Geneious इष्टतम प्राइमर अनुक्रम मैंयुअल रूप से निर्धारित करने के लिए ।
    1. आगे प्राइमर के लिए 21-28 बीपी के एक उंमीदवार अनुक्रम पर प्रकाश डाला । किसी भी आधार के 4 या अधिक के रन से बचें । सभी basepairs के एक काफी समान संयोजन के साथ एक क्षेत्र को लक्षित करने के लिए प्रयास करें । एक एकल जी या 3 ' अंत में सी फायदेमंद है, प्राइमर लंगर मदद करते हैं ।
    2. स्क्रीन के दाहिने हाथ की ओर पर सांख्यिकी टैब पर क्लिक करें देखने के लिए कि अनुक्रम का अनुमान पिघलने तापमान (Tm) उंमीदवार क्षेत्र के रूप में उजागर किया है । 55-60 ° c के बीच एक पिघलने तापमान प्राप्त करने के लिए देखो, जबकि टाल दोहराने और जी के लंबे रन/
    3. कदम का पालन करें 5.1.1 । और 5.1.2 एक रिवर्स प्राइमर का चयन करने के लिए, 150-250 आधार जोड़े आगे प्राइमर के 3 ' स्थित है । जबकि प्राइमर लंबाई मैच की जरूरत नहीं है, की भविष्यवाणी की tm आगे प्राइमर के tm के रूप में संभव के रूप में बंद होना चाहिए । हो अनुक्रम पूरक रिवर्स यकीन है कि (यदि सही Geneious में क्लिक करते समय अनुक्रम पर प्रकाश डाला है यह एक मेनू विकल्प है) ।
  2. प्राइमर डिजाइन समारोह है, जो अनुक्रम खिड़की में शीर्ष उपकरण पट्टी में पाया जाता है का उपयोग करें ।
    1. प्राइमरी डिजाइन बटन पर क्लिक करें । क्षेत्र को लक्षित क्षेत्रके अंतर्गत बढ़ाना सम्मिलित करें.
    2. विशेषताओं टैब के अंतर्गत, इच्छित आकार डालें, तापमान पिघलने (Tm), और% GC (कदम 5.1.1 देखें.).
    3. प्राइमरों को जेनरेट करने के लिए ठीक क्लिक करें । एक कस्टम oligo सेवा के माध्यम से प्राइमरों के आदेश ।
  3. सत्यापन नियंत्रण डीएनए के साथ प्राइमर (दोनों टी और आर एंकोडिंग) को अनुकूलित Tm और विस्तार समय है । बैंड का आकार देखने के लिए नियमित Taq और जेल ट्रो का उपयोग करें, लेकिन ऑप्टिमाइज़ेशन चरण 6 में विधियों का पालन qPCR के साथ भी किया जा सकता है ।
    1. दोनों आगे और रिवर्स प्राइमरों की 10x कमजोर पड़ने बनाओ ताकि प्राइमरों 10 माइक्रोन की एकाग्रता है ।
    2. dNTP के ०.५ μL के एक पीसीआर मिश्रण का उपयोग करें, फॉरवर्ड प्राइमरी के ०.५ μL, रिवर्स प्राइमरी के ०.५ μL, ०.१ μL के Taq पोलीमरेज़, 2 μL के खाके, ०.७५ μL के मैग्नीशियम, २.५ μL के बफर, और १८.१५ μL के पानी की इतनी है कि वहां की एकाग्रता के साथ प्रति टेम्पलेट 25 μL है 5 एनजी/ μL.
    3. पीसीआर कार्यक्रम में अलग पिघलने तापमान पर प्राइमरों का परीक्षण । आम तौर पर इष्टतम प्रदर्शन है पिघला थोड़ा प्राइमरों की भविष्यवाणी Tm नीचे तापमान, लेकिन नहीं आमतौर पर ६० डिग्री सेल्सियस से ऊपर । इसके अलावा इस गाइड का उपयोग इष्टतम विस्तार बार के लिए परीक्षण: १००० bp प्रति 1 मिनट (इस प्रकार, आमतौर पर 10-30 सेकंड amplicon लंबाई पर निर्भर करता है) ।
    4. यह पुष्टि करने के लिए अंतिम-बिंदु जेल ट्रो निष्पादित करें कि प्राइमर अपेक्षित अनुक्रम बढ़ाना । 2% पर 6X ग्लिसरॉल डाई के 5 μL के साथ मिश्रित qPCR उत्पाद के 25 μL को चलाएं ताे agarose को 20 मिनट के लिए २०० वी पर जेल ।

6. शेष अनुक्रम का qPCR सत्यापन

नोट: यह चरण प्राइमरों मान्य और पीसीआर शर्तों चरण 5 में स्थापित की आवश्यकता है ।

  1. प्रत्येक टेम्पलेट को निम्न मिश्रण से तपसिल में चलाएँ; १२.५ μL के PowerSYBR ग्रीन मास्टर मिक्स, ०.५ μL की एकाग्रता के साथ फॉरवर्ड प्राइमरी के 10 माइक्रोन, ०.५ μL की एकाग्रता के साथ रिवर्स प्राइमरी के 10 माइक्रोन, १०.५ पानी की μL, और टेंपलेट डीएनए के 1 μL (2 के एक एकाग्रता पर एनजी/μL) , जिससे कि प्रत्येक कुआं में कुल मात्रा का 25 μL होता है ।
  2. सत्यापित तापमान और चरण 4 से विस्तार समय द्वारा सूचित एक qPCR प्रोग्राम चलाएँ । हम डिजाइन और एक दो चरण चक्र के साथ संगत होना करने के लिए सभी प्राइमरों मान्य, 10 मिनट के लिए ९५ ° c प्रारंभिक पिघल, तो ९५ ° c के ४० चक्र के लिए 30 एस और ६० ° c 1 मिनट के लिए. हालांकि, एक तीन चरण (पिघल-ऐनी-विस्तार) कार्यक्रम प्राइमरों के लिए और अधिक इष्टतम हो सकता है और यदि आवश्यक हो तो अनुकूलित किया जाना चाहिए । हम अनुशंसा करते है कि अंतिम denaturing curves उत्पंन होने में कम से पहले प्राइमरों qPCR में कार्यरत है एक एकल डीएनए उत्पाद के प्रवर्धन मांय हैं ।
  3. सीटी द्वारा actin (या किसी भी अन्य उपयुक्त ' आर ' नियंत्रण) के सापेक्ष qPCR/SYBR ग्रीन संकेतों को मापने. सभी मामलों के लिए औसत और मानक विचलन की गणना 2-(जीन सीटी-β-actin सीटी).
  4. वैकल्पिक qPCR द्वारा सही उत्पाद आकार का पता लगाने की पुष्टि करने के लिए एंड-पॉइंट जेल ट्रो निष्पादित करें । इधर, qPCR उत्पाद के 25 μL को 2% पर 6x ग्लिसरॉल डाई के 5 μL के साथ मिलाकर चलाते हैं ताे agarose को 20 मिनट के लिए २०० वी पर जेल ।

7. एक नए संदर्भ के साथ दोहराने के लिए नीचे डेटा तराशना ।

नोट: यदि चरण 6 पहचाने गए अनुक्रम T से मान्य है, तो सायकल यहाँ (2A) समाप्त करें । हालांकि, कई प्रकार के विचार चक्र की निरंतरता को प्रेरित कर सकते हैं, उदाहरण के लिए, यदि फ़ाइल में अनेक R अनुक्रम बने रहते है या यदि चरण 6 में qPCR द्वारा कोई भी उंमीदवार T अनुक्रम मांय नहीं किया गया था ।

  1. कोई नया संदर्भ प्राप्त करें । यह चरण चक्र की नई पुनरावृत्ति को सक्षम करता है और इसमें raw जीनोमिक डेटा, raw आरएनए-seq डेटा या अन्य असेंबल किए गए डेटासेट शामिल हो सकते हैं. संदर्भ डेटा के लिए बहुमूल्य संसाधन जैव प्रौद्योगिकी सूचना (https://www.ncbi.nlm.nih.gov/genome) जो दुकानों एफ़टीपी (ftp://ftp.ncbi.nlm.nih.gov/genomes/) के माध्यम से सुलभ जीनोम इकट्ठे के लिए राष्ट्रीय केंद्र में जीनोम डाटाबेस शामिल हैं, और जीन अभिव्यक्ति सर्वग्राही (https://www.ncbi.nlm.nih.gov/geo/) जहां रॉ अगली पीढ़ी के अनुक्रम पढ़ता जमा हो जाती है । जीनोम परियोजनाओं अंय परियोजना के माध्यम से अपने कच्चे अनुक्रम डेटा-संबंधित वेबसाइटों और डेटाबेस प्रदान कर सकते हैं ।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

ब्लास्ट चलाने के बाद, आउटपुट फ़ाइल डेटाबेस से मेल खाती क्वेरी से अनुक्रम की एक सूची होगा । पायथन घटाव के बाद, बेजोड़ दृश्यों की एक संख्या प्राप्त किया जाएगा, और qPCR द्वारा परीक्षण । इस के परिणाम, और अगले कदम, नीचे चर्चा कर रहे हैं ।

नकारात्मक परिणाम । दो संभावित नकारात्मक परिणाम है कि संदर्भ अनुक्रम को विस्फोट के बाद देखा जा सकता है । कोई विस्फोट परिणाम हो सकता है, जिसका अर्थ है कि कुल अनुक्रम संदर्भ के लिए कोई समान अनुक्रम नहीं है । यह नमूना अनुक्रम के लिए सही संदर्भ अनुक्रम का चयन करने में कोई त्रुटि हो सकती है । एक और संभावना है कि वहां शुरू विधानसभा में कोई अद्वितीय दृश्यों (सब कुछ दूर घटाया है), इसलिए कोई जीन ब्याज के अनुक्रम के लिए पाए जाते हैं । जांच जहां संदर्भ से आया है और यह सुनिश्चित करें कि यह क्वेरी असेंबली के रूप में एक ही ऊतक नहीं है ।

अभिकलनी फ़िल्टरिंग के बाद, qPCR एक नकारात्मक परिणाम प्राप्त कर सकते हैं, उदाहरण के लिए चित्रा 3ए, ३ बी, सी जिसमें पक्षी के ऊतकों में पता लगाने में कोई अंतर नहीं था देखते हैं । पैनलों सी के माध्यम से एक अलग घटाव चक्र है, जो अतिरिक्त कमी चक्र पुनरावृत्ति और विधि के विकास के लिए प्रेरित से प्रतिनिधि जीन है (चित्रा 2ए, बी1) ।

सकारात्मक परिणाम । एक सकारात्मक परिणाम--एक सच्चे लक्ष्य अनुक्रम की पहचान--की पुष्टि की है जब जीनोमिक डीएनए qPCR के ऊतकों में सांख्यिकीय से अधिक पता चलता है/संदर्भ (चित्रा 3डी) के सापेक्ष ब्याज की नमूना । इस मामले में उपतंत्र परियोजना पुरुष और महिला वयस्क ज़ेबरा फिंच के germline ऊतक से आरएनए sequencing के साथ शुरू किया, प्रत्येक सेक्स से १०,०००,००० पढ़ें जोड़े प्राप्त करने. संक्षिप्तता के लिए, हम अंडाशय अनुक्रम केवल, जिसमें १६७,९२९ टेप डी नोवो विधानसभा द्वारा प्राप्त किए गए प्रसंस्करण का वर्णन करेंगे । जीनोमिक्स विधि (BLASTn) के लिए किसी भी दृश्य है कि प्रकाशित दैहिक जीनोम12, जो ५९८ अद्वितीय प्रोटीन के लिए इसी ५,०६० टेप छोड़ मिलान को खत्म करने के लिए इस्तेमाल किया गया था, यह दर्शाता है कि टेप के कई कोडिंग थे । सैंज रॉ को विधानसभा उत्पंन करने के लिए इस्तेमाल किया पढ़ता था तो tBLASTn द्वारा घटाव के अगले स्तर के लिए इस्तेमाल किया, ७८ प्रोटीन उपज । एक अंतिम घटाव आरएनए-seq कच्चे श्रवण छोटि13है, जो आठ प्रोटीन छोड़ दिया से पढ़ता का उपयोग किया गया था । जब इन प्रोटीन NCBI nr विस्फोट के माध्यम से चला रहे थे, प्रोटीन के छह वायरल थे, एक पक्षियों में एक दोहराव क्षेत्र था, और पिछले एक α-तस्वीर है कि germline प्रतिबंधित है7 (चित्रा 2बी) था । इस प्रक्रिया के दौरान, ९३५ दैहिक जीन है कि पहले पूरे जीनोम एनोटेशन में शामिल नहीं थे की पहचान की गई; कई ऊतकों में वर्दी qPCR प्रवर्धन दिखाया (चित्रा 3ए, 2 बी, 4 सी) । α-स्नैप जीन germline qPCR का उपयोग कर प्रतिबंधित किया जा करने के लिए मान्य किया गया था, क्योंकि यह दैहिक ऊतक वृषण डीएनए के सापेक्ष में समाप्त हो गया था, जहां यह actin के बराबर स्तर पर मौजूद था (चित्रा 3डी).

क्या गलत जा सकता है । मुख्य समस्या यह है कि इस विधि का उपयोग करते समय दूर किया जाना चाहिए सुनिश्चित करना है कि उचित संदर्भ अनुक्रम का उपयोग किया जाता है । सबसे अच्छा संदर्भ अनुक्रम encapsulates, व्यापक अर्थों में, जीनोमिक जटिलता जिसमें ब्याज के अनुक्रम (T) एंबेडेड है । इसका अर्थ यह हो सकता है कि विभिन्न रूपों में अनुक्रम; transcriptome, विधानसभा, कच्चे डेटा, या एकाधिक अध्ययनों से डेटा संदर्भ के रूप में इस्तेमाल किया जा करने की आवश्यकता (चित्रा 1). ज़ेबरा फिंच अध्ययन में, हम आरएनए अनुक्रमण डेटा से प्राइमर विकसित; हालांकि, प्राइमर हमेशा के बीच या डीएनए में प्राइमर बंधन साइटों के भीतर introns की उपस्थिति के कारण काम नहीं किया । हम वृषण डीएनए, जो दोनों लक्ष्य (टी) और संदर्भ (आर) encodings से जीनोमिक डीएनए बंद पीसीआर द्वारा निर्धारित प्रत्येक प्राइमर का परीक्षण किया, यह एक उपयुक्त सकारात्मक नियंत्रण कर रही है । इस स्तर पर प्राइमर विफलता डिजाइन और नए प्राइमरों के परीक्षण आवश्यक जब तक एक उपयुक्त सेट की पहचान की है । पीसीआर के मानक नुकसान आधारित तरीके लागू होते हैं: प्रवर्धन शर्तों को अनुकूलित किया जाना चाहिए, प्रवर्धन विशिष्टता परीक्षण और/या क्लोनिंग द्वारा पुष्टि की है, और नहीं टेंपलेट नियंत्रण सभी प्रयोगों में शामिल किया जाना चाहिए । qPCR परख के बारे में अधिक जानकारी के लिए,22देखें ।

Figure 1
चित्रा 1 . उपतंत्रीय दृष्टिकोण से कुल जीनोमिक डेटा के केवल लक्ष्य अनुक्रम को पुनर्प्राप्त करने के लिए एकाधिक संदर्भ (R) निकाल iteratively सकते हैं । व्यक्तिगत प्रोजेक्ट्स का संदर्भ अनुक्रम ठीक इस तरह से ओवरलैप नहीं हो सकता है और आंकड़े पर संकेत नहीं datasets शामिल हो सकते हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 2
चित्र 2दृश्य विधियां। (क) उपश्वसनी चक्र योजनाबद्ध. चक्र के रूप में कई बार की जरूरत के रूप में दोहराया जा सकता है, हर बार अलग संदर्भ दृश्यों का उपयोग, सबसे अच्छा परिणाम प्राप्त करने के लिए । (ख) Biederman एट अल में किए गए कदमों के उपश्वसनी चक्र के विशिष्ट उदाहरण । 7, एक में के रूप में गिने कदम के साथ, और दिखाया प्रत्येक चरण में शेष दृश्यों की संख्या के साथ. कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Figure 3
चित्रा 3 . नकारात्मक और सकारात्मक परिणामों सहित qPCR परिणामों का उदाहरण डेटा. (क) जीनोमिक डीएनए qPCR के CHD8, एक नकारात्मक परिणाम । (ख) जीनोमिक डीएनए qPCR के DNMT1, एक नकारात्मक परिणाम । (ग) जीनोमिक डीएनए qPCR के CHD7, एक नकारात्मक परिणाम है । (घ) जीनोमिक डीएनए qPCR NAPAG, वृषण नमूनों में विशेष रूप से उपस्थिति की पुष्टि और जिगर और अंडाशय से actin, एक सकारात्मक परिणाम के सापेक्ष घट । सभी पैनलों औसत +/-तीन माप के मानक विचलन इंगित करते हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

जबकि असभ्य जीनोमिक्स शक्तिशाली है, यह एक कुकी कटर दृष्टिकोण नहीं है, कई महत्वपूर्ण कदम पर अनुकूलन की आवश्यकता है, और संदर्भ दृश्यों और परीक्षण नमूनों की सावधानी से चयन । यदि क्वेरी असेंबली खराब गुणवत्ता की है, तो फ़िल्टरिंग चरण केवल असेंबली कलाकृतियों को अलग कर सकते हैं । इसलिए, यह अच्छी तरह से विशिष्ट प्रोजेक्ट के लिए कोई उपयुक्त मांयता प्रोटोकॉल का उपयोग कर de नोवो असेंबली को मांय करने के लिए महत्वपूर्ण है । आरएनए-seq के लिए, दिशानिर्देश ट्रिनिटी वेबसाइट पर दिए गए हैं18 और डीएनए के लिए,23 REAPR तरह एक उपकरण का इस्तेमाल किया जा सकता है. एक और महत्वपूर्ण कदम जब विस्फोट का उपयोग कर उचित ई-मूल्य है, जो निर्धारित करेगा कि घटाव आराम से या कड़े हो जाएगा का चयन है । हालांकि, एक उलटा विधि में होती है: संदर्भ के लिए एक अधिक कड़े मैच वास्तव में एक कम-कड़े घटाव है, के रूप में गैर मिलान अनुक्रम घटाया नहीं हैं । इसलिए, एक बड़ा (कम कड़े) ई-मूल्य एक अधिक कठोर घटाव के लिए विस्फोट में इस्तेमाल किया जाना चाहिए । प्रोटोकॉल का अंतिम आवश्यक चरण संदर्भ चयन है । सबसे बड़ी दक्षता के लिए संदर्भ के रूप में संभव के रूप में पूरा किया जाना चाहिए; हालांकि, यह सही होने की जरूरत नहीं है क्योंकि qPCR परीक्षण पुष्टि करता है कि शेष अनुक्रम टी या आर से हैं, और चाहे और अधिक फ़िल्टरिंग आवश्यक है । प्रोटोकॉल के कार्यांवयन के दौरान, नए संदर्भ के लिए नीचे जीन सत्यापित किया जा करने के लिए नीचे संकीर्ण करने के लिए इस्तेमाल किया जा सकता है । हम ध्यान दें कि कभी-कभार मिलान विधि बदल सकते हैं: पिछले उपश्वसनी कदम हम एल्गोरिथ्म BWA इस्तेमाल के लिए कच्चे नक्शा क्वेरी दृश्यों पर पढ़ता है, और कस्टम पायथन लिपियों इस्तेमाल के लिए कोई मेल नहीं पढ़ता के साथ क्वेरी दृश्यों की पहचान (चित्रा 2बी) ।

इस विधि की सीमाएं एक संदर्भ अनुक्रम की उपलब्धता शामिल हैं । उदाहरण के लिए, मेयेर एट अल. एक नए hominin के mitochondrial जीनोम का मूल्यांकन किया; वे मानव और Denisovan जांच का इस्तेमाल किया mitochondrial डीएनए, जो अनुक्रम और एक मानव संदर्भ24के लिए मैप किया गया था पर कब्जा । इस मामले में, वहां रहे थे कोई मौजूदा परमाणु जीनोम संदर्भ डेटा है कि शोधकर्ताओं के खिलाफ mitochondrial जीनोम प्राप्त करने के लिए घटाया जा सकता है, necessitating पढ़ें मानचित्रण वैकल्पिक रणनीति24। उपंयास mitochondrion मानव mitochondrial संदर्भ के सापेक्ष के किसी भी बड़े पैमाने पर हट क्षेत्रों पढ़ा-मानचित्रण द्वारा खो जाएगा । जीनोमिक्स एक कम-पूर्वाग्रही दृष्टिकोण से पढ़ा-मानचित्रण प्रदान करता है, लेकिन हमेशा अनुसंधान प्रश्न के आधार पर लागू नहीं है, और इस मामले में प्राचीन डीएनए के निंन स्तर precluded de नोवो विधानसभा के लिए आवश्यक अनुक्रम कवरेज की तरह ( उपजीनोमिक्स के चरण 1) ।

शारीरिक शुद्धि जीनोमिक्स के लिए एक और वैकल्पिक विधि प्रदान करता है । डीएनए या आरएनए की शुद्धि अक्सर अनुक्रमण पूरे chloroplast और mitochondrial जीनोम में प्रयोग किया जाता है क्योंकि इन organellar जीनोम बहुत परमाणु जीनोम25,26,27,28की तुलना में छोटे हैं । मानव और अंय छोटे mitochondrial जीनोम25शुद्धि के बाद दो प्राइमरी सेट का उपयोग प्रवर्धन के माध्यम से अनुक्रमण के लिए अलग किया जा सकता है । हालांकि, जीनोमिक्स मामलों में mitochondrial जीनोम असामांय रूप से बड़े हैं, प्राइमर बाध्यकारी साइटों अलग है या पूर्ण जीनोम में परिणाम नहीं होगा के लिए सहायक हो सकता है । इसका एक उदाहरण ciliates में है, जिसमें बड़े, अलग, रेखीय mitochondrial जीनोम२९हैं. एक संदर्भ जीनोम के लिए मानचित्रण एक व्यवहार्य विकल्प प्रजातियों और homologs की कमी भर में उच्च विचलन के कारण ciliates के लिए भी30genuses भर में नहीं है । उपजीनोमिक्स का उपयोग करके, ciliate mitochondrial जीनोम अलग और विश्लेषण किया जा सकता है, जबकि जीनोम के लापता क्षेत्रों की क्षमता को कम करने । इसी तरह, जबकि एक de नोवो विधानसभा दृष्टिकोण Sitka सजाना chloroplast जीनोम विधानसभा में इस्तेमाल किया गया था, अंतर को सफेद सजाना, संभावित इन31साइटों पर पूर्वाग्रह शुरू करने के खिलाफ तुलनात्मक पढ़ा मानचित्रण शामिल थे ।

परियोजना पर निर्भर करता है, जीनोमिक्स समय और लागत लाभ शुद्धि या मानचित्रण दृष्टिकोण के सापेक्ष है, जबकि डिस्कवरी प्रक्रिया में कम पूर्वाग्रह की पेशकश कर सकते हैं । कुछ स्थितियों में, लक्ष्य अनुक्रम आसानी से अलग नहीं किया जा सकता क्योंकि यह पूरी तरह से अज्ञात है, सेल अस्तित्व (mitochondria), या बहुत बड़ा करने के लिए मानक जेल ट्रो द्वारा अलग करने के लिए महत्वपूर्ण है । आकार आधारित electrophoretic शुद्धि धीमी है और महत्वपूर्ण प्रारंभिक सामग्री की आवश्यकता है (जो महंगा हो सकता है), जबकि कई प्रयासों पर शर्तों के अनुकूलन । पल्स-फील्ड जेल ट्रो (PFGE) डीएनए टुकड़े के जुदाई 107 बीपी (10 एमबी) करने के लिए सक्षम बनाता है, लेकिन 2-3 दिन, सामग्री की बड़ी मात्रा में लेता है, और कई बार विशेष उपकरण है कि व्यावसायिक रूप से उपलब्ध नहीं है३२। Biederman एट अल.में, केवल अनुक्रम है कि germline से जाना जाता था प्रतिबंधित गुणसूत्र एक गैर कोडिंग दोहराने 7 था इस गुणसूत्र पक्षी में सबसे बड़ा है के रूप में,10लंबाई में १०० एमबी से अधिक, शुद्धि असंभव हो गया होता; इसलिए, असभ्य जीनोमिक्स क्या अंय तरीकों नहीं कर सकता था । जीनोमिक युग में यह अक्सर सस्ता है और तेजी से अब अनुक्रम, और कंप्यूटर द्वारा बाद में फिल्टर । पूरी तरह से उपंयास दृश्यों की खोज को सक्षम करने, जीनोमिक्स भी एक परिपूर्ण संदर्भ अनुक्रम के बिना उपंयास दृश्यों को अलग करने के लिए दृष्टिकोण का एक संयोजन का उपयोग करता है ।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों का खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

लेखक विभिंन चरणों में ज़ेबरा फिंच जीनोमिक्स परियोजना के साथ उनकी सहायता के लिए मिशेल Biederman, एलिसा Pedersen, और कॉलिन जे Saldanha स्वीकार करते हैं । हम कंप्यूटिंग क्लस्टर सिस्टम एडमिनिस्ट्रेशन और NIH ग्रांट 1K22CA184297 (टू J.R.B.) और NIH एनएस ०४२७६७ (सी. जे. एस.) के लिए एवगेनी Bisk भी स्वीकार करते हैं ।

Materials

Name Company Catalog Number Comments
Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

DOWNLOAD MATERIALS LIST

References

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer's Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics' GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).

Tags

आनुवंशिकी मुद्दा १४३ जीनोमिक घटाव qPCR ब्लास्ट पायथन पढ़ें मानचित्रण डी नोवो विधानसभा प्राइमर डिजाइन
जीनोमिक्स द्वारा उपंयास अनुक्रम डिस्कवरी
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Asalone, K. C., Nelson, M. M.,More

Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter