Summary
इस प्रोटोकॉल पूर्व mRNA 3 ' अंत प्रसंस्करण साइटों मानचित्रण के लिए एक विधि का वर्णन ।
Abstract
पिछले दशक में अध्ययन पूर्व mRNA दरार और polyadenylation प्रतिक्रियाओं के एक जटिल और गतिशील विविधता का पता चला है । mRNAs के साथ लंबे 3 ' unमराठीमध्ये क्षेत्रों (UTRs) विभेदित कोशिकाओं में उत्पन्न कर रहे हैं, जबकि proliferating कोशिकाओं को तरजीही छोटे 3 ' UTRs के साथ टेप व्यक्त. हम एक-seq प्रोटोकॉल का वर्णन, अब अपने दूसरे संस्करण है, जो polyadenylation साइटों जीनोम-चौड़ा नक्शा और पूर्व mRNA 3 ' अंत प्रसंस्करण के विनियमन अध्ययन के लिए विकसित किया गया था पर । इसके अलावा इस मौजूदा प्रोटोकॉल polyadenylate का लाभ लेता है (पाली (एक)) पूंछ है कि सबसे स्तनधारी mRNAs के लिए पूरी तरह से संसाधित mRNAs के लिए समृद्ध की उत्पत्ति के दौरान जोड़ रहे हैं । इसके चौथे स्थान पर deoxyuracil के साथ एक डीएनए अनुकूलक अनुक्रमण के लिए mRNA 3 ' अंत टुकड़े के सटीक प्रसंस्करण की अनुमति देता है । नहीं सेल संस्कृति और रात भर ligations सहित, प्रोटोकॉल के बारे में 8 घंटे के समय पर हाथ की आवश्यकता है । इसके साथ, व्युत्पन्न sequencing डेटा के विश्लेषण के लिए एक आसान करने के लिए उपयोग सॉफ्टवेयर पैकेज प्रदान की जाती है. A-seq2 और संबद्ध विश्लेषण सॉफ़्टवेयर पूर्व-mRNA 3 ' की मैपिंग के लिए एक कुशल और विश्वसनीय समाधान प्रदान करते हैं, जो 106 या कम कक्षों से शर्तों की एक विस्तृत श्रृंखला में समाप्त होता है ।
Introduction
कब्जा और mRNA 3 ' समाप्त होता है के अनुक्रमण mRNA प्रसंस्करण और जीन अभिव्यक्ति के ठहराव के अध्ययन की अनुमति देता है । उनके पॉली (क) मासा होने के कारण युकेरियोटिक mRNAs को मनका-मैटीरियल oligo-deoxythymidine (oligo (dT)) अणु के साथ कुल कोशिका lysates से कुशलतापूर्वक शुद्ध किया जा सकता है, जो सीडीएनए संश्लेषण को भी प्रधानमंत्री कर सकता है. हालांकि, इस approach में दो कमियां हैं । सबसे पहले, एक है कि टेप करने के लिए आंतरिक भी प्रधानमंत्री सीडीएनए संश्लेषण कर सकते हैं, नकली पाली (एक) साइटों में जिसके परिणामस्वरूप के हिस्सों । दूसरा, सजातीय पाली (एक) हिस्सों अनुक्रमण के लिए विशिष्ट चुनौतियों का एक तरफ, प्रतिलिपि पहचान के लिए जानकारीपूर्ण नहीं किया जा रहा से मुद्रा । इन सीमाओं को दरकिनार करने के लिए विभिन्न दृष्टिकोण प्रस्तावित किए गए हैं, जैसे पाली के माध्यम से रिवर्स प्रतिलेखन (क) RNase एच पाचन द्वारा पीछा पूंछ (3P-seq 1), एक कस्टम sequencing प्राइमर का उपयोग 20 Ts में समाप्त (2P-seq 2), के चयन एक घन5टी४५ प्राइमर RNase एच पाचन के द्वारा पीछा (3 ' 3पढ़ता है) के साथ ५० से अधिक न्यूक्लियोटाइड की पूंछ (एक) के साथ आरएनए टुकड़े, और एक oligo-डीटी प्राइमर है कि एक कांटा में 3 ' अनुकूलक (एक-seq 4) शामिल का उपयोग करें ।
हाल ही में विकसित एक-seq2 विधि 5 को पाली (a) के माध्यम से अनुक्रमण बाईपास और एक ही समय में dimers कि स्व द्वारा उत्पंन कर रहे है के अनुपात को कम करने के लिए करना है-बंधाव एडेप्टर, विशेष रूप से होने वाली जब दाढ़ एकाग्रता एडेप्टर संमिलित एकाग्रता को घटाया जाता है । इस समस्या को समाप्त किया जा सकता है जब दोनों एडेप्टर एक ही प्रकार के polynucleotide समाप्त होता है के रूप में एक-seq2 में, जहां 3 ' एडेप्टर आरएनए टुकड़े के 5 ' अंत करने के लिए ligated है और 5 ' एडाप्टर के लिए 5 ' समाप्त होता है के बाद रिवर्स प्रतिलेखन के बाद cDNAs । विधि हमारे पहले प्रस्तावित एक-seq-जिसमें अनुक्रमण 5 '-to-3 ' दिशा में किया गया था से अधिक सुविधाजनक है, जिससे ठीक से नियंत्रित आरएनए विखंडन की आवश्यकता-, जबकि पाली की एक उच्च सटीकता को बनाए रखने (ए) साइट पहचान । के आसपास ८०% अनुक्रम ठेठ नमूने में पढ़ता है जीनोम के लिए विशिष्ट नक्शा और २०,००० से अधिक की पहचान करने के लिए नेतृत्व (एक) साइट क्लस्टर, अधिक से अधिक ७०% जो व्याख्या 3 ' UTRs के साथ अतिव्यापी ।
संक्षेप में, एक-seq2 प्रोटोकॉल mRNA विखंडन और रिवर्स के बंधाव के साथ शुरू होता है, 3 आरएनए टुकड़े के 5 ' समाप्त होता है । पाली (ए) RNAs युक्त तो एक 25 न्यूक्लियोटाइड (nt) लंबे oligo (डीटी) प्राइमर है कि 3 ' अंत में एक लंगर न्यूक्लियोटाइड होता है के साथ लिखित रिवर्स हैं, 4 की स्थिति में एक dU और 5 ' अंत में एक बायोटिन, चुंबकीय streptavidin मोतियों को सीडीएनए के बंधन की अनुमति । के अधिकांश प्राइमर, बायोटिन सहित, ड्यू पर दरार द्वारा सीडीएनए से उपयोगकर्ता एंजाइम मिश्रण से हटा दिया जाता है, युक्त Uracil डीएनए glycosylase (UDG) और डीएनए glycosylase-lyase Endonuclease आठवीं । यह प्रतिक्रिया एक 5 ' एडाप्टर के बंधाव के लिए बरकरार समाप्त होता है, और तीन टीएस दरार के बाद छोड़ दिया पाली (ए) पूंछ के स्थान को चिह्नित करने के लिए रह जाता है । 5 ' और 3 ' एडेप्टर बंधाव प्राप्तकर्ता 5 ' समाप्त होता है के द्वारा अनुलग्न हैं, क्योंकि कोई एडेप्टर dimers उत्पन्न होते हैं । चार न्यूक्लियोटाइड यादृच्छिक-mers पढ़ता की शुरुआत में शुरू की अनुमति देता है राज्य के-the-कला अनुक्रमण उपकरणों पर क्लस्टर संकल्प और भी पता लगाने और पीसीआर प्रवर्धन कलाकृतियों को हटाने के लिए अद्वितीय आणविक पहचानकर्ता (UMI) के रूप में सेवा कर सकते हैं । UMI के आकार को और अधिक के रूप में अंय अध्ययन में किया 6वृद्धि हो सकती है । प्रोटोकॉल पढ़ता है कि mRNA 3 ' समाप्त होता है के लिए पूरक रिवर्स कर रहे हैं उत्पन्न करता है, सभी एक यादृच्छिक tetramer के साथ शुरू 3 टीएस द्वारा पीछा किया. पढ़ता है कि उनके 5 ' अंत में 3 नैदानिक टीएस है के प्रसंस्करण से पीसीआर प्रवर्धन कलाकृतियों के सुधार के साथ प्रारंभ होता है ूमिस का दोहन, 3 अनुकूलक दृश्यों को हटाने, और पूरक रिवर्स । पढ़ता है कि oligo से उत्पंन हो सकता है (डीटी) आंतरिक एक संपंन साइटों पर भड़काना भी गणना की पहचान कर रहे है और खारिज कर दिया । नकली साइटों को आम तौर पर 18 की कमी अच्छी तरह से एक विशेषता है और पाली (एक) संकेत है जो स्थित होना चाहिए ~ 21 न्यूक्लियोटाइड स्पष्ट दरार साइट 7के ऊपर) ।
प्रोटोकॉल के बारे में 8 एच हाथ समय पर की आवश्यकता है, गिनती सेल संस्कृति और रातोंरात ligations नहीं है । संबद्ध पठन विश्लेषण सॉफ़्टवेयर एक अत्यधिक सटीक पाली (a) साइट पहचान सक्षम करता है । पाली से (क) साइट पर 4 नमूनों के आधार पर बनाई गई समूहों आगे इस पांडुलिपि में प्रकाश डाला (नियंत्रण सिरना और si-HNRNPC-इलाज कोशिकाओं के दो जैविक प्रतिकृति) ८४% एक व्याख्या की जीन के साथ ओवरलैप, और इनमें से, ७५% एक 3 ' UTR के साथ ओवरलैप, और ८६% के साथ या तो एक 3 ' UTR या एक टर्मिनल एक्सॉन । पियरसन सहसंबंध गुणांक की अभिव्यक्ति का ' 3 की प्रतिकृति नमूने में समाप्त होता है ०.९२, और ०.९ से अधिक के मान सामांयतया विधि के साथ प्राप्त होते हैं । इस प्रकार, एक-seq2 एक सुविधाजनक तरीका है कि बहुत प्रतिलिपि परिणाम देता है ।
Protocol
- अपने प्रयोगात्मक डिजाइन के अनुसार कोशिकाओं को विकसित 6-well प्लेट्स करने के लिए ~ 1 x 10 6 कोशिकाओं प्रति अच्छी तरह से ८०% संगम पर ।
- विकास मध्यम निकालें और एक बार फॉस्फेट बफर खारा के साथ कोशिकाओं को धोने । सीधे प्लेट पर mRNA-आइसोलेशन किट से lysis बफर की 1 मिलीलीटर जोड़कर कोशिकाओं को लाइसे । एक 1 मिलीलीटर पिपेट टिप के साथ एक 15 मिलीलीटर प्लास्टिक ट्यूब में चिपचिपा lysate स्थानांतरण । पूरी तरह से प्लेट की सतह से सेल सामग्री को अलग करने के लिए एक रबर रंग का प्रयोग करें ।
- कतरनी एक 1 मिलीलीटर के साथ चिपचिपा डीएनए युक्त lysate एक 23 ग्राम hypodermic सुई से जुड़ी कई जोरदार ऊपर और नीचे आंदोलनों सवार जब तक lysate अब चिपचिपा है । नीचे के केंद्र के लिए सिरिंज सुई बिंदु ट्यूब से बाहर lysate बाहर निकालने से बचने के लिए.
- एक १.५ मिलीलीटर ट्यूब सिरिंज का उपयोग में lysate हस्तांतरण । स्पिन 5 मिनट पर २०,००० x g और 4 & #176; C मलबा हटाने के लिए । प्रोटोकॉल भर में डीएनए कम बांध १.५ मिलीलीटर शीशियों का उपयोग करें.
- जबकि केंद्रापसारक चल रहा है, धो ३०० & #181; reसस्पैंड oligo (dT) के 25 चुंबकीय मोतियों के साथ एक चुंबकीय रैक पर ५०० & #181; lysis बफर के एल । मिश्रण ट्यूबों रैक पर 2-3 बार । समाधान साफ़ होने के बाद बफ़र को निकालें । १.४ कदम से स्पष्ट supernatant लीजिए और मोतियों को जोड़ें । reसस्पेंड और 10 मिनट के लिए एक घूर्णन पहिया पर ट्यूबों जगह
- एक चुंबकीय रैक पर ट्यूबों जगह है । 2 मिनट के बाद स्पष्ट तरल निकालें । mRNA-आइसोलेशन किट से ०.८ मिलीलीटर बफर A जोड़ें । बारी ट्यूब द्वारा १८० & #176; रैक पर डिग्री, 2-3 बार । इस धुलाई कदम एक बार और बफर A. के साथ दोहराएं
- धो मोती 2 बार १.६ चरण में वर्णित के रूप में बफर बी की ०.८ मिलीलीटर के साथ ।
- को मोतियों से बंधे mRNA को elute, जोड़ ३३ & #181; L ज 2 हे और मोतियों को फिर से सस्पेंड कर दो. ७५ के लिए हीट & #176; सी के लिए 5 मिनट एक गर्म ब्लॉक पर । तुरंत 1 एस के लिए ट्यूबों स्पिन और उंहें चुंबकीय रैक पर जगह है । supernatant एक नई ट्यूब के लिए स्थानांतरण । नमूनों पर संग्रहित किया जा सकता है-८० & #176; C आगे जब तक उपयोग.
- Add ६६ & #181; l क्षार hydrolysis बफर को ३३ & #181; l mRNA (चरण १.८), मिश्रण और हीट के लिए ठीक 5 मिनट पर ९५ & #176; C पर एक हीटिंग ब्लॉक. तुरंत बर्फ पर चिल ट्यूबों.
- एक आरएनए सफाई किट के साथ आरएनए अलग.
नोट: खंड की पुष्टि करें; यह होना चाहिए १०० & #181; L.- Add ३५० & #181; किट से l RLT बफर और २५० & #181; l इथेनॉल । स्तंभ पर लोड और 30 एस के लिए स्पिन कमरे के तापमान (आरटी) में ८,००० x g पर । किट से ५०० & #181; L RPE बफर से धोएं । धो के साथ ५०० & #181; L ८०% इथेनॉल. २०,००० x जी पर 5 मिनट के लिए स्पिन कॉलम सूखी । जोड ३६ & #181; ल H 2 O को कॉलम और स्पिन के लिए 1 मिनट में २०,००० x g । कॉलम त्यागें और eluate को बचाएं.
- Add 5 & #181; l polynucleotide कळेनासे बफर, 5 & #181; l 10 mM एटीपी, 1 & #181; l ribonuclease अवरोधक, 1 & #181; l DNase व 2 & #181; l polynucleotide कळेनासे नमूनों और मशीन पर ३७ & #176; ग के लिए 30 min. वैकल्पिक रूप से तैयार मास्टर रिएक्शन प्रत्येक घटक के १.१ संस्करणों x n (n = नमूनों की संख्या) मिश्रण से प्रोटोकॉल भर में घोला जा सकता है.
- परिवर्तन बफर और अगले चरण में पाली (एक) को रोकने के लिए एक स्पिन-कॉलम पर एटीपी निकालें.
- स्पिन-कॉलम ७३५ x g पर 1 मिनट के लिए कॉलम नई १.५ मिलीलीटर शीशियों के लिए स्थानांतरण और स्तंभों पर कळेनासे प्रतिक्रियाओं लोड । ७३५ x पर कॉलम 2 मिनट स्पिन कॉलम त्यागें और बर्फ या स्टोर पर एकत्र प्रतिक्रियाओं के साथ ट्यूबों जगह-८० & #176; C.
- Add १३.५ & #181; l 5x केंद्रित पाली (क) पोलीमरेज़ प्रतिक्रिया बफर, २ & #181; l के 10 एमएम 3 & #39; dATP, 1 & #181; l RNase अवरोधक और 1 & #181; l पाली (क) पोलीमरेज़ से कदम 2.2.1 की प्रतिक्रिया. मिश्रण और स्पिन 1 एस के लिए ३७ & #176; C के लिए 30 min. Add ३२.५ & #181; L ज 2 हे प्रत्येक प्रतिक्रिया. चरण 1.10.1 के रूप में आरएनए शुद्ध । 14 & #181 के साथ आरएनए Elute; L ज 2 ओ.
- एक निर्वात संकेंद्रक में प्रतिक्रियाओं को 10 मिनट के लिए मात्रा को कम करने के लिए 6 & #181; l 3 & #181 जोड़ें; l 10x टी-4 आरएनए बंधाव बफर, 3 & #181; l 10 एमएम एटीपी , 15 & #181; L खूंटी & #173;-८०००, 1 & #181; l RNase अवरोधक, 1 & #181; l का ०.१ mM रिवर्स पूरक 3 & #39; एडेप्टर & #34; revRA3 & #34; (सामग्री की तालिका देखें) और 1 & #181; l उच्च एकाग्रता आरएनए ligase 1, mix.
- 24 & #176 पर प्रतिक्रियाओं के साथ आंतरायिक मिश्रण के साथ एक गर्म मिक्सर पर 16 ज के लिए सी १,००० rpm । Add ७० & #181; L ज 2 हे ते प्रत्येक रिएक्शन आणि मिक्स करा. चरण 1.10.1 के रूप में आरएनए शुद्ध । 14 & #181 के साथ आरएनए Elute; ल H 2 O. नमूनों पर संग्रहित किया जा सकता है-८० & #176; C इस बिंदु पर.
- वॉल्यूम को कम करने के लिए 3 मिनट के लिए एक वैक्यूम संकेंद्रक में eluates को जगह 11 & #181; l. स्थानांतरण प्रतिक्रियाओं को २०० & #181; l पीसीआर ट्यूबों. Add 1 & #181; L ०.०५ mM RT प्राइमरी & #34; Bio-dU-dT25 & #34;. ७० में 5 मिनट के लिए हीट & #176; सी एक पीसीआर साइकिल चालक में और 5 मिनट के लिए आर टी पर छोड़
- Add 1 & #181; l 10 mM dNTPs, 4 & #181; l 5x रिवर्स transcriptase बफर, 1 & #181; l ०.१ M डीटीटी, 1 & #181; l RNase अवरोधक, व 1 & #181; l उलट transcriptase. मिश्रण और 10 मिनट के लिए प्रतिक्रियाओं को गर्मी ५५ & #176; सी और 10 मिनट के लिए ८० & #176; सी एक पीसीआर साइकिल चालक में । बर्फ पर या पर रखें-८० & #176; ग लंबे समय तक भंडारण के लिए.
- प्लास्टिक १०० & #181; L Streptavidin-मोतियों को एक १.५ मिलीलीटर की शीशी में डालकर फिर से सस्पेंड ८०० & #181; एल बायोटिन बाध्यकारी बफर और एक चुंबकीय रैक पर जगह है । पलटन ट्यूबों 2-3 बार । बफ़र साफ़ करते समय निकालें । धुलाई कदम दोहराएं । २०० में मोतियों को फिर से सस्पेंड & #181; L बायोटिन बाइंडिंग बफ़र.
- मोती समाधान के लिए रिवर्स प्रतिलेखन प्रतिक्रिया जोड़ें और 4 & #176 पर 20 मिनट की मशीन एक घूर्णन पहिया पर सी; धोने के रूप में कदम ६.१ और 2x एक चुंबकीय रैक पर दस बफर के साथ के रूप में बायोटिन बाध्यकारी बफर के साथ 2x मोती । ५० में मोतियों का रिसस्पेंड & #181; l दस बफर, जोड़ 2 & #181; l Uracil डीएनए glycosylase एंजाइम मिक्स, और मशीनी 1 ज पर ३७ & #176; C एक मिक्सर में आंतरायिक मिश्रण के साथ.
- Add ५० & #181; l ज 2 O, 11 & #181; l के RNase H बफर व 1 & #181; l RNase h त प्रतिक्रियाओं को. ३७ पर मशीन & #176; सी के लिए 20 min. Place ट्यूबों एक चुंबकीय रैक पर और एक नई ट्यूब करने के लिए सट सीडीएनए युक्त तरल हस्तांतरण
- शुद्ध सट सीडीएनए.
- Add ५५० & #181; पीसीआर शोधन किट से बफर पीबी के दरार प्रतिक्रियाओं को एल । इसमें 10 & #181; 3 एम सोडियम एसीटेट की एल, पीएच ५.२ कम करने के लिए पीएच । प्रतिक्रियाओं को लोड पर मिनिमल रेफरेंस स्पिन कॉलम और स्पिन के लिए १७,००० x g पर 1 min.
- Add ७५० & #181; L बफर पे कॉलम और स्पिन के लिए १७,००० x g पर 1 min. प्रवाह के माध्यम से त्यागें । शुष्क करने के लिए 1 मिनट के लिए १७,००० x g पर कॉलम स्पिन । स्तंभों को एक १.५ मिलीलीटर की शीशी में स्थानांतरित करें, 16 & #181 जोड़ें; एल एच 2 ओ और स्पिन 1 मिनट के लिए १७,००० x g पर । 8 मिनट के लिए एक वैक्यूम संकेंद्रण में प्रतिक्रियाओं प्लेस 7 & के एक खंड के लिए ध्यान दें #181; L.
- के छोर, add 3 & #181; l 10x टी-4 आरएनए ligase 1 बफर, 3 & #181; l 10 एमएम एटीपी, 15 & #181; l खूंटी & #173;-८०००, 1 & #181; l ५० & #181; म & #34; revDA5 & #34; oligo , व 1 & #181; L उच्च एकाग्रता टी-4 आरएनए ligase 1. पर गर्मी म 24 & #176; ग के लिए 20 ज. Add ७० & #181; ल h 2 हे येक प्रतिक्रिया. नमूनों को इस बिंदु पर-20 & #176; C में संग्रहित किया जा सकता है ।
- एक पायलट प्रतिक्रिया में, घातीय चरण के भीतर पुस्तकालय प्रवर्धन तक पहुंचने के लिए पीसीआर चक्र की इष्टतम संख्या का निर्धारण ।
- प्लास्टिक 25 & #181; L डीएनए पोलीमरेज़ mix, 20 & #181; l बंधाव प्रतिक्रिया, 2 & #181; l ज 2 O, १.५ & #181; l 10 & #181; मी फॉरवर्ड पीसीआर प्राइमरी (RP1) और १.५ & #181; l 10 & #181; मी रिवर्स पीसीआर इंडेक्स प्राइमरी में २०० & #181; l पीसीआर ट्यूब.
- निंनलिखित कार्यक्रम के साथ साइकिल चलाना: 3 min ९५ & #176; सी, 20 एस के 20 चक्र के बाद ९८ & #176; ग, 20 s ६७ & #176; ग र 30 स s ७२ & #176; ग. कलेक्ट 7 & #181; L aliquots 6, 8, 10, 12, 14, 16 और 18 चक्र के बाद सीधे साइकिल चालक से । Add 1 & #181; L 10x लोडिंग बफर (५०% ग्लिसरॉल, ०.०५% xylene cyanol). नोट: बारकोड संयोजन जब मल्टीप्लेक्स का उपयोग कर अगर आपूर्तिकर्ता की सिफारिशों का पालन करें.
- एक 1 से युक्त 1x TBE बफर में 2% agarose जेल पर छोटे स्लॉट में अलग उत्पादों: 10, 00 फ्लोरोसेंट हरी डाई के कमजोर पड़ने ।
- लोड aliquots पर एक 2% agarose जेल और चलाने के लिए १०० वोल्ट पर जेल प्रलेखन प्रणाली पर पीसीआर उत्पादों के 15 min. visualize माइग्रेशन के लिए.
- पायलट प्रतिक्रिया के लिए इस्तेमाल के रूप में दो बार संस्करणों के साथ एक बड़े पैमाने पर पीसीआर प्रतिक्रिया के लिए पायलट प्रतिक्रिया में घातीय प्रवर्धन की शुरुआत में चक्र की संख्या का उपयोग करें (< सबल वर्ग = "xfig" > चित्रा २ ).
- बड़े पैमाने पर पीसीआर प्रतिक्रियाओं के लिए, ध्यान केंद्रित करने और एक पीसीआर शोधन किट के साथ पहले प्रतिक्रियाओं और नमक 1x TBE बफर में 2% agarose जैल पर वाइड स्लॉट पर उत्पादों को अलग ।
- 200-350 nt डीएनए उत्पादों से युक्त जेल स्लाइसें काट बाहर । 30 मिनट तक के लिए RT पर chaotropic बफर में जेल पिघला । एक जेल निष्कर्षण किट के साथ जेल स्लाइस से डीएनए निकालें । को आँच न ५० & #176; ग एक-अमीर डीएनए के बंधन में पूर्वाग्रह को रोकने के लिए < सुप वर्ग = "xref" > ९ .
- sequencing के लिए सबमिट करें ।
नोट: सामान्यतया, ५० चक्र एकल-पठन (SR50) पर्याप्त हैं (देखें, जैसे , https://www.illumina.com/technology/next-generation-sequencing.html के लिए).
- डाटा प्री-प्रोसेसिंग से पढ़ता है cDNAs
नोट: sequencing गहराई चलता है और, साधन के आधार पर के बीच भिन्न हो सकते हैं, एक नमूना से डेटा एकाधिक अनुक्रम फ़ाइलों पर विभाजित किया जा सकता है । यदि यह स्थिति है, तो निंन चरणों में उपयोग किया जाता है जो किसी एकल इनपुट फ़ाइल में एक नमूना के लिए संगत फ़ाइलों को श्रेणीबद्ध करें ।- फ़ाइल fastq से फसता स्वरूप में कनवर्ट करें ।
- निकालें एक सही संरचना के साथ पढ़ता है (5 पदों पर 3 thymidines, 6 और पढ़ने के 7).
नोट: एक पढ़ा है कि ऊपर वर्णित प्रयोगात्मक प्रोटोकॉल के अनुसार सही ढंग से तैयार की संरचना होनी चाहिए (से 5 & #39; अंत): 4-न्यूक्लियोटाइड बारकोड-3 thymidines-प्रतिलिपि के पूरक रिवर्स 3 & #39; समा. - अनुक्रम की विवरण पंक्ति में प्रारंभिक tetramer के बारे में जानकारी संग्रहीत है ।
नोट: tetramer एक अद्वितीय आणविक पहचानकर्ता (UMI) के रूप में कार्य करता है कि प्रवर्धन कलाकृतियों के सुधार की सुविधा के विश्लेषण में बाद में । - निकाल पहले सात न्यूक्लियोटाइड से पढ & #39; स 5 & #39; समा.
- एक ही डालने अनुक्रम और UMI. के साथ पढ़ता की केवल एक प्रतिलिपि रखकर प्रवर्धन कलाकृतियों के लिए सही
- 3 & #39 का भाग निकालें; एडेप्टर अनुक्रम से मेल खाता है और फिर रिवर्स अनुक्रम पूरक । केवल एक न्यूनतम लंबाई (डिफ़ॉल्ट: 15 nt) है पढ़ता के साथ आगे बढ़ें ।
नोट: मूल mRNA अंश की लंबाई और sequencing चक्रों की संख्या के आधार पर, 3 & #39; पठन के अंत में 3 & #39; एडेप्टर का भाग हो सकता है, जो इस चरण में निकाल दिया गया है.
- निकालें सभी पढ़ता है कि निंनलिखित मानदंडों को पूरा: अधिकतम 2 अज्ञात न्यूक्लियोटाइड (& #39; N & #39;), अधिकतम ८०% के रूप में, और पढ़ें एक नहीं के अंतिम न्यूक्लियोटाइड । इन पढ़ता विश्लेषण में उपयोग करने के लिए पर्याप्त गुणवत्ता का होना माना जाता है ।
- नक्शा एक उपकरण के साथ जीनोम के लिए पढ़ता है कि ब्याह के हैंडल पढ़ता है और BAM प्रारूप में एक आउटपुट फ़ाइल उत्पंन करता है ।
- यदि STAR का उपयोग किया जाता है, तो उस जीनोम के इंडेक्स के साथ एक फ़ाइल बनाएं जिसमें पढ़ता मैप किया जाना चाहिए । मानव जीनोम के लिए, इस कदम के लिए ३५ GB स्मृति (RAM) की आवश्यकता है ।
- नक्शे के जीनोम को पढ़ता है.
नोट: (STAR-विशिष्ट नोट्स) सॉफ्ट-कतरन अक्षम है ताकि 3 & #39 की मैपिंग को बाध्य किया जा सके; प्रत्येक पढ़ने के अंत के रूप में यह है न्यूक्लियोटाइड तुरंत दरार साइट के ऊपर ।
- BAM एक बिस्तर-फ़ाइल में कनवर्ट करें । यदि एक से अधिक स्थानों के लिए नक्शे पढ़ें, केवल सबसे कम दूरी संपादित करें के साथ उन रखें ।
नोट: एक विशिष्ट स्थान पर मैप की गई पढ़ने की प्रतिलिपि संख्या स्कोर के रूप में उपयोग किया जाता है । पढ़ता है कि कई स्थानों के लिए नक्शे आंशिक रूप से एक 1 के बराबर वजन के साथ प्रत्येक स्थान पर गिने जाते हैं/ - संक्षिप्त किसी संभावित sequencing त्रुटि के द्वारा भिंन पढ़ता है । यदि दो अलग पढ़ता एक ही स्थान के लिए नक्शा (मैपिंग की शुरुआत और अंत स्थिति समान हैं) और वे एक ही UMI साझा, उन्हें पीसीआर डुप्लिकेट के रूप में विचार और केवल एक रखना.
- अनुमान केलेली वैयक्तिक प्री-mRNA ३ & #39; end processing sites.
नोट: एक व्यक्ति पढ़ें एक 3 के लिए सबूत प्रदान करता है & #39; अंत जब उसके पिछले चार न्यूक्लियोटाइड त्रुटि के जीनोम के लिए मैप किए जाते हैं । जिस स्थिति को 3 & #39; पठन मानचित्रों के अंत को क्लीवेज साइट के रूप में संग्रहित किया जाता है । - का पता लगाने 3 & #39; अंत साइटों है कि आंतरिक भड़काना से उत्पंन हो सकता है । आंतरिक भड़काना विरूपण साक्ष्य के रूप में साइट को परिभाषित करें जब जीनोम में दरार साइट के 10 nt बहाव निंन मानदंडों में से एक को संतुष्ट: के रूप में छह से अधिक शामिल है, के रूप में लगातार छह शामिल हैं, या निंनलिखित tetramers में से एक के साथ शुरू होता है: AAAA, AGAA, AAGA, AAAG .
- अलग 3 & #39 के एक तालिका उत्पंन; बिस्तर प्रारूप में प्रसंस्करण साइटों को समाप्त ।
- स्वतंत्र रूप से विनियमित पाली (ए) साइट समूहों की पहचान ।
नोट: यहाँ बताए गए चरणों का पालन करें प्रक्रिया एक पूर्व प्रकाशन में प्रस्तुत किया गया था < सुप वर्ग = "xref" > ५ . व्यक्तिगत 3 & #39 एकत्रित कर- प्रारंभ करें; समाप्त प्रोसेसिंग साइटों है कि अध्ययन के सभी नमूनों में प्राप्त किया गया ।
- व्याख्या चचा पाली (क) संकेत < सुप वर्ग = "xref" > 7 के क्षेत्र में-६० से + 10 न्यूक्लियोटाइड के आसपास प्रत्येक व्यक्ति 3 & #39; अंत संसाधन साइट.
- की पहचान पाली (क) के रूप में प्रत्येक नमूने में पृष्ठभूमि के ऊपर व्यक्त की साइटों निंनानुसार है ।
- मौजूदा नमूना के भीतर उनके कच्चे अभिव्यक्ति के द्वारा साइटों को क्रमबद्ध करें । ऊपर से नीचे तक साइटों की सूची को पार, एक उच्च रैंक साइट के साथ कम क्रमित साइटों को जोड़ अगर वे जीनोम में एक पूर्वनिर्धारित दूरी के भीतर स्थित है (डिफ़ॉल्ट: 25 nt अप-या बहाव) उच्च रैंकिंग साइट से ।
नोट: सभी कम रैंकिंग एक उच्च रैंकिंग साइट के साथ जुड़े साइटों को परिभाषित एक क्लस्टर जिसका अभिव्यक्ति की संख्या है इन साइटों के सभी दस्तावेजीकरण पढ़ता है । - अभिव्यक्ति द्वारा इन क्लस्टर सॉर्ट करें और क्लस्टर्स की सूची को उच्चतम से सबसे कम व्यंजक में ट्रैवर्स, व्यंजक थ्रेशोल्ड c का निर्धारण, जिस पर एक पूर्वनिर्धारित थ्रेशोल्ड के नीचे एक व्याख्या पाली (a) संकेत के साथ क्लस्टर का प्रतिशत ( डिफ़ॉल्ट: ९०%).
- कटऑफ के नीचे किसी भी क्लस्टर से साइटें छोड़ें ।
- मौजूदा नमूना के भीतर उनके कच्चे अभिव्यक्ति के द्वारा साइटों को क्रमबद्ध करें । ऊपर से नीचे तक साइटों की सूची को पार, एक उच्च रैंक साइट के साथ कम क्रमित साइटों को जोड़ अगर वे जीनोम में एक पूर्वनिर्धारित दूरी के भीतर स्थित है (डिफ़ॉल्ट: 25 nt अप-या बहाव) उच्च रैंकिंग साइट से ।
- क्लस्टर बारीकी से स्पेसेड 3 & #39; अंत नमूनों में प्राप्त साइटें.
नोट: सॉर्ट 3 & #39; पहले नमूने की संख्या द्वारा और फिर सामान्यीकृत पठन गणना (प्रति दस लाख (RPM)) नमूनों में पढ़ता का योग द्वारा संसाधन साइटों को समाप्त । उच्च रैंक वाली साइट से उनकी दूरी किसी पूर्वनिर्धारित सीमा (डिफ़ॉल्ट: 12 nt) से बड़ी नहीं है, जब शीर्ष से नीचे तक की सूची को नीचे की ओर, उच्च-स्थान वाली साइटों से जोड़कर । जब भी कोई गठन 3 & #39; अंत साइट एक व्याख्या पाली (क) संकेत के साथ ओवरलैप या एक पाली (एक) संकेत सीधे बहाव है, इसी क्लस्टर आगे निरीक्षण के लिए आंतरिक भड़काना का पता लगाने के लिए चिह्नित है । - मर्ज पाली (A) साइट clusters.
नोट: जब एक क्लस्टर एक ख्यात आंतरिक भड़काना उंमीदवार के रूप में चिह्नित किया गया है, यह या तो एक बहाव क्लस्टर में विलय कर दिया है अगर दो समूहों को उनके पाली (एक) संकेतों को साझा या बनाए रखा है, तो क्लस्टर में सबसे अनुप्रवाह साइट एक पाली (एक) संकेत एक ंयूनतम पर स्थित है दूरी ऊपर (डिफ़ॉल्ट: 15 nt) । अंत में, बारीकी से रिक्ति क्लस्टर यदि मर्ज किए गए हैं: (i) वे एक ही पाली (A) संकेत (s) साझा, या (ii) परिणामी क्लस्टर की अवधि एक अधिकतम (डिफ़ॉल्ट: 25 nt) से अधिक नहीं है ।
सभी 3 & #39 से कुल सामान्यीकृत पढ़ें गिनती के साथ बिस्तर फ़ाइल स्वरूप में - स्टोर क्लस्टर; स्कोर के रूप में प्रत्येक क्लस्टर में अंत साइटों ।
Representative Results
पाली (ए)-आरएनए युक्त-कल्चरल कोशिकाओं से पृथक किया गया, क्षारीय hydrolysis द्वारा खंडित और cDNAs oligo (डीटी) प्राइमरों के साथ रिवर्स प्रतिलेखन द्वारा किए गए थे । परिणामस्वरूप सीडीएनए streptavidin मोतियों पर मैटीरियल था, dU uracil विशिष्ट उत्पाद शुल्क प्रतिक्रिया में सट गया था, एडेप्टर 5 ' और 3 ' के सिरों के लिए ligated थे सट टुकड़ा और आवेषण अनुक्रम किया गया था । आरेख 1 प्रयोग की ग्राफ़िकल बाह्यरेखा को दर्शाया गया है ।
हेला और HEK293 कोशिकाओं के लिए, 106 कोशिकाओं को प्रोटीन के विशाल बहुमत की प्रक्रिया के अंत में जीन कोडिंग के लिए पाली (क) साइटों की पहचान करने के लिए पर्याप्त थे । हालांकि, अन्य सेल प्रकार या ऊतकों के लिए यह पहचान पाली की संख्या में संतृप्ति परीक्षण करने के लिए आवश्यक हो सकता है (ए) साइटों की संख्या के रूप में प्रयोग बढ़ जाती है में इस्तेमाल किया. पायलट पीसीआर के प्रतिनिधि परिणाम चरण और sequencing से पहले नमूने के डीएनए टुकड़ा विश्लेषण के चित्रा 2में दिखाए जाते हैं ।
चित्रा 3 गणनात्मक विश्लेषण के पूर्व प्रसंस्करण कदम से पता चलता है, sequencer से प्राप्त fastq फ़ाइल से शुरू और गुणवत्ता की जांच की, अनुकूलक ट्रिम कर दिया है कि जीनोम के लिए मैप किया जा करने के लिए तैयार कर रहे हैं पढ़ता के साथ समाप्त. चित्रा 4 विश्लेषण कदम है कि एक विशेष नमूना में पहचान कर रहे हैं mRNA 3 ' अंत प्रसंस्करण साइटों की सूची के साथ इसी जीनोम और अंत करने के लिए पढ़ता के मानचित्रण के साथ शुरू से पता चलता है. जब कई नमूनों का विश्लेषण कर रहे हैं, अतिरिक्त कदम बाहर किया जाता है 3 ' अंत प्रसंस्करण साइटों है कि व्यक्तिगत नमूनों में पाया गया और नमूनों भर में उनकी बहुतायत रिपोर्ट से मेल करने के लिए । ये चरण चित्र 5में दिखाए जाते हैं ।
इस प्रकार, एक बार नमूनों अनुक्रम किया गया है, परिणामी sequencing पढ़ें फ़ाइलें (fastq प्रारूप में) के माध्यम से उपलब्ध प्रसंस्करण पाइपलाइन के विश्लेषण सीधा है । नमूने के बारे में जानकारी को कॉन्फ़िगरेशन फ़ाइल में जोड़ने के बाद, पाइपलाइन का निष्पादन आउटपुट फ़ाइलों के दो मुख्य प्रकार में परिणाम होगा: 1) बिस्तर-सभी 3 ' अंत प्रसंस्करण व्यक्तिगत नमूनों में पहचान की साइटों के साथ फ़ाइलें (उदा. नमूना 1.3 psites. noIP. bed. gz "), और 2) सभी पाली (ए) साइट क्लस्टर (क्लस्टर्स. विलय. बिस्तर) के साथ एक बिस्तर फ़ाइल अध्ययन के सभी नमूनों में । आउटपुट भी सभी के लिए जीनोम निर्देशांक शामिल है प्रत्येक व्यक्ति के नमूने से पढ़ता (उदा sample1 । STAR_out/संरेखित. sortedByCoord. out. bam ") जिसे बाद में IGV16जैसे जीनोम ब्राउज़र में देखा जा सकता है । पढ़ें प्रोफ़ाइल (ओं) के दृश्य निरीक्षण आम तौर पर पाली के वितरण की पहली झलक प्रदान करता है (a) जीनोम में साइटों और परिवर्तन है कि विशिष्ट perturbations है कि अध्ययन में किए गए थे पर होते हैं । उदाहरण के लिए, चित्रा 6 में HNRNPC प्रोटीन की दस्तक नीचे करने के लिए एक विशिष्ट जीन की प्रतिक्रिया दिखाया गया है ।
इन जीनोम-वाइड वितरण के सारांश भी प्रदान की जाती है (तालिका 1) । विशेष रूप से, "counts/annotation_overlap" निर्देशिका में आउटपुट फ़ाइलें (इनपुट के रूप में प्रदान की gtf फ़ाइल से) विशिष्ट व्याख्या सुविधाओं के साथ ओवरलैप साइटों के भिन्न होते हैं; व्याख्या कर रहे हैं: 3 ' UTR, टर्मिनल एक्सॉन, एक्सॉन, intron, intergenic) । अंत में, प्रत्येक नमूने के लिए, व्यक्तिगत संसाधन चरणों के परिणाम भी सहेजे जाते हैं (उदा. "sample1. समरी. tsv"). यह की संख्या शामिल हैं: रॉ प्रत्येक नमूने में पढ़ता है, कि 5 ' अंत की उंमीद की संरचना है पढ़ता है कि पूरा पीसीआर डुप्लिकेट टूट के बाद रहना, उच्च गुणवत्ता पढ़ता ९.२ कदम पर परिभाषित मानदंडों के अनुसार, पढ़ता है कि नक्शा विशिष्ट जीनोम के लिए (उन है कि sequencing त्रुटियों से परिणाम के बाद, चरण ९.५ देखें), बहु-मानचित्रण पढ़ता (उन है कि sequencing त्रुटियों के परिणामस्वरूप, चरण ९.५ देखें), रॉ (नहीं संकुल) 3 ' अंत प्रसंस्करण साइटों के बाद से गिर के बाद एक नमूना, कच्चे 3 ' अंत प्रसंस्करण साइटों संभावित आंतरिक भड़काना उंमीदवारों के बिना, अद्वितीय 3 ' अंत सभी नमूनों से आंतरिक कण्ठ उंमीदवारों के बिना प्रसंस्करण साइटों, और पाली के अंतिम सेट (एक) साइट समूहों ।
चित्र 1: A-seq2 प्रोटोकॉल का मुख्य चरण. व्यक्तिगत कदम आंकड़ा के बाईं ओर इंगित कर रहे हैं । सम्मिलित करें आरएनए अंशों को हरी रेखाओं के रूप में दर्शाया गया है जो रिवर्स प्रतिलेखन के बाद सीडीएनए के लिए लाल हो जाते हैं; एडाप्टर हल्के नीले या नारंगी रंग में हैं । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
चित्रा 2: पायलट पीसीआर और अंतिम उत्पाद प्रोफ़ाइल । (क) पीसीआर प्रतिक्रिया से Aliquots अलग चक्र पर एकत्र और 2% agarose जैल पर अलग किया गया । बाईं ओर संख्या डीएनए सीढ़ी में संबंधित बैंड के न्यूक्लियोटाइड में आकार का संकेत मिलता है । इस प्रयोग में 12 चक्र (*) बड़े पैमाने पर पीसीआर प्रतिक्रिया के लिए चुना गया था । (b) आकार चयन के बाद एक नमूने का उदाहरण एक टुकड़ा आकार विश्लेषक पर चलाने के आसपास २८० न्यूक्लियोटाइड के एक औसत आकार का खुलासा । बाईं [फू] के लिए संख्या सापेक्ष संकेत तीव्रता संकेत मिलता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
चित्र 3: अनुक्रमण के पूर्व-संसाधन की बाह्यरेखा पढ़ता है. अनुक्रमण साधन-संबद्ध सॉफ़्टवेयर द्वारा जनरेट किया गया है जो पढ़ता के साथ fastq फ़ाइलें संबंधित जीनोम के लिए मैप की जाएगी जो उच्च-गुणवत्ता पढ़ता की पहचान करने के लिए संसाधित किए जाते हैं । आंकड़ा पाइप लाइन में व्यक्तिगत चरणों के इनपुट/आउटपुट विनिर्देश दिखाता है, खंड में वर्णित प्रोटोकॉल के व्यक्तिगत चरणों के लिंक के साथ "डाटा प्रोसेसिंग" । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
चित्रा 4: अनुक्रम की रूपरेखा पढ़ें प्रसंस्करण, अलग 3 ' अंत प्रसंस्करण साइटों की पीढ़ी के जीनोम के लिए मानचित्रण के कदम से । आंकड़ा पाइप लाइन में व्यक्तिगत चरणों के इनपुट/आउटपुट विनिर्देश से पता चलता है, मैं के लिंक के साथअनुभाग "डेटा संसाधन" में वर्णित प्रोटोकॉल के ndividual चरण । मुख्य आउटपुट फ़ाइल उपयोगकर्ता के लिए वितरित किया जाता है जो बोल्ड में चिह्नित किया गया है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
चित्र 5: सह-विनियमित 3 ' अंत अनुक्रमण साइटों के समूहों उत्पन्न करने के लिए उठाए गए चरणों की रूपरेखा. आंकड़ा पाइप लाइन में व्यक्तिगत चरणों के इनपुट/आउटपुट विनिर्देश दिखाता है, खंड में वर्णित प्रोटोकॉल के व्यक्तिगत चरणों के लिंक के साथ "डाटा प्रोसेसिंग" । मुख्य आउटपुट फ़ाइल बोल्ड में चिह्नित किया गया है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
चित्रा 6:3 ' अंत प्रसंस्करण के प्रोफ़ाइल के उदाहरण के परिणाम NUP214 जीन के टर्मिनल एक्सॉन साथ पढ़ता है, IGV 16 जीनोम ब्राउज़र में दिखाया । एक-seq2 पढ़ता HEK २९३ कोशिकाओं के दो नमूनों से तैयार किया गया था, या तो एक नियंत्रण के साथ इलाज-सिरना या एक HNRNPC सिरना के साथ. पढ़ता है जो पाली (A) साइट्स विश्लेषण पाइपलाइन द्वारा व्याख्या थे जो IGV जीनोम ब्राउज़र के लिए इनपुट के रूप में उपयोग किया गया था BAM स्वरूप में सहेजे गए थे । 3 mRNA के लिए पढ़ें चोटियों मानचित्र के समाप्त होता है 3 ' समाप्त होता है कि Ensembl में व्याख्या कर रहे हैं. प्रोफाइल HNRNPC नॉक-डाउन पर लांग 3 ' UTR isoform की एक वृद्धि का उपयोग इंगित करता है । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।
si-नियंत्रण प्रतिकृति 1 | si-नियंत्रण प्रतिकृति 2 | |
आईडी: २९७६५ | आईडी: ३२६८२ | |
अपुष्ट पढ़ता है की संख्या | ४४२१०२५८ | ६८५७०६४० |
ट्रिमिंग और फ़िल्टरिंग के बाद मांय पढ़ता की संख्या | १४०२४५३८ | २१२११७९३ |
विशिष्ट मैपिंग पढ़ता की संख्या | ६९५३६७४ | १३९४६४३६ |
एकाधिक loci के लिए मैपिंग पढ़ता की संख्या | २०४०६४६ | २९२५८३९ |
व्यक्तिगत 3 ' अंत प्रसंस्करण साइटों की संख्या | ११०७४९३ | १७१०३५३ |
तालिका 1: विश्लेषण पाइपलाइन का उदाहरण आउटपुट. व्यक्तिगत चरणों में प्राप्त किए गए पढ़ता के सारांश.
Discussion
कोर और सहायक कारकों है कि पूर्व में शामिल है की भीड़-mRNA 3 ' अंत प्रसंस्करण एक तदनुसार जटिल polyadenylation परिदृश्य में परिलक्षित होता है । इसके अतिरिक्त, polyadenylation भी प्रतिलेखन और ब्याह जैसे अंय प्रक्रियाओं में परिवर्तन के लिए उत्तरदाई है । 3 ' अंत में पूर्व दरार साइटों mRNAs आम तौर पर विशेषता पाली के आधार पर पहचाने जाते हैं (एक) पूंछ कि 5 ' दरार उत्पादों के लिए जोड़ रहे हैं. अधिकांश तरीकों oligo (डीटी) चर लंबाई की प्राइमरों का उपयोग करें कि पाली के विशिष्ट रूपांतरण की अनुमति (एक)-एक रिवर्स प्रतिलेखन प्रतिक्रिया में cDNAs को mRNAs युक्त । इस दृष्टिकोण की एक आम समस्या एक-अमीर artifactual दरार साइटों में जिसके परिणामस्वरूप दृश्यों के लिए आंतरिक भड़काने है । दो तरीकों कि नमूना तैयारी के स्तर पर इस विरूपण साक्ष्य दरकिनार उद्देश्य प्रस्तावित किया गया है । 3P-seq विधि 1में, एडाप्टर विशेष रूप से पाली (एक) एक पट्टी आंशिक RNase T1 पाचन और टीटीपी के साथ ही deoxynucleotide के रूप में प्रतिक्रिया में रिवर्स प्रतिलेखन द्वारा पीछा oligo की मदद से पूंछ के छोर करने के लिए ligated हैं । परिणामस्वरूप पाली (ए)-पाली (डीटी) heteroduplexes तो RNase एच के साथ पचा रहे हैं और शेष आरएनए टुकड़े अलग-थलग हैं, एडाप्टर के लिए ligated, और अनुक्रम । एक सरल और सुरुचिपूर्ण विधि, 2P-seq, कि sequencing प्रतिक्रिया में शेष oligo (डीटी) खंड लंघन एक कस्टम अनुक्रमण प्राइमर का उपयोग करता है एक ही लेखक 2द्वारा सूचित किया गया था । एक संबंधित विधि में, 3 ' 3 पढ़ता है, 5 अमेरिका और ४५ टीएस के एक असामांय रूप से लंबे समय से, यह भी युक्त एक बायोटिन खंडित आरएनए के लिए annealed है, कड़े बहाकर द्वारा पीछा किया पाली के साथ आरएनए अणुओं के लिए चयन करने के लिए (एक) ५० से अधिक न्यूक्लियोटाइड की पूंछ । हालांकि 3 ' पढ़ता काफी आंतरिक भड़काना की आवृत्ति को कम कर देता है, यह पूरी तरह से इसे खत्म नहीं करता है 3. प्रत्यक्ष आरएनए अनुक्रमण के लिए प्रोटोकॉल भी प्रस्तावित किया गया है, लेकिन जिसके परिणामस्वरूप पढ़ता कम कर रहे हैं और त्रुटि की एक उच्च दर है और इस दृष्टिकोण आगे विकसित नहीं किया गया है 18,19,20. PolyA-Seq और व्यावसायिक क्वांट Seq प्रोटोकॉल oligo दूसरा किनारा संश्लेषण के लिए एक यादृच्छिक भड़काना कदम के साथ (डीटी) आधारित भड़काने के गठबंधन के लिए 20. टेंपलेट का उपयोग Moloney Murine ल्यूकेमिया वायरस (MMLV) के साथ रिवर्स प्रतिलेखन प्रतिक्रिया स्विच रिवर्स transcriptase एक ही कदम में लिंकर्स के साथ cDNAs की पीढ़ी की ओर जाता है और इस तरह कोई एडेप्टर dimers क़दम-Seq और सापळे तरीकों में दिखाई दे सकते हैं 21 , 22.
एक-seq2 विधि यहां प्रस्तुत एक biotinylated oligo (डीटी) प्राइमर के भीतर एक सट न्यूक्लियोटाइड (dU) के अपने उपयोग में बाहर खड़ा है । इस संशोधन oligo (डीटी) संकर, oligo के अधिकांश को हटाने के साथ polyadenylated लक्ष्यों को समृद्ध करने की उपयोगिता को जोड़ती है (डीटी)25 अनुक्रम अलग टुकड़े से पहले पुस्तकालयों तैयार है और तीन टीएस के संरक्षण, जो पाली (क) पूंछ की पूर्व उपस्थिति का संकेत देते हैं । इसके विपरीत, विधि है कि RNase एच का उपयोग करने के लिए (एक) आरएनए अणु बेतरतीब ढंग से कई के रूप में छोड़ से पाली को दूर करने के लिए । के बाद से एक-seq2, अनुक्रमण विरोधी भावना किस्में के 3 ' अंत से किया जाता है, दरार साइटों की भविष्यवाणी कर रहे है कच्चे अनुक्रम की शुरुआत में NNNNTTT आकृति के बाद स्थित होना पढ़ता है । यादृच्छिक tetramers न केवल आधार फोन पर भी पीसीआर प्रवर्धन कलाकृतियों के उंमूलन में अनुमति देने के लिए सेवा करते हैं । अब ूमिस को भी समाहित किया जा सकता है । आंतरिक भड़काने की संभावना एक-seq2 में रहता है और एक genomically इनकोडिंग, एक अमीर बहाव अनुक्रम और फिर 3 ' अंत समूहों है कि आंतरिक भड़काना द्वारा समझाया जा सकता है खारिज करके एक के साथ समाप्त होता है 3 खारिज करके अभिकलन, पहले संबोधित किया है ए-रिच पॉली (a) सिग्नल ही । पाली की हाल ही में एक विश्लेषण (ए) साइटों प्रोटोकॉल की एक बड़ी संख्या के द्वारा विशिष्ट आस्थगित इंगित करता है कि एक-seq2 के लिए अद्वितीय है साइटों की उंमीद न्यूक्लियोटाइड वितरण और जीन के भीतर स्थान, अंय 3 ' अंत अनुक्रमण प्रोटोकॉल के समान है ।
एक-seq2 में एक महत्वपूर्ण कदम polyadenylated आरएनए और राइबोसोमल RNAs और विभिन्न छोटे RNAs को हटाने का चयन है । यह सबसे आसानी से oligo (डीटी)25 चुंबकीय मोतियों के साथ एक mRNA-आइसोलेशन किट द्वारा किया जाता है । सिद्धांत रूप में, कुल आरएनए phenol युक्त समाधान भी उच्च गुणवत्ता आरएनए कि आगे mRNA-अलगाव किट या oligo (डीटी) agarose द्वारा चयन करने के लिए अधीन किया जा सकता है देता है । एक कदम है कि एक-seq2 में विविध किया जा सकता है क्षारीय hydrolysis जो छोटा किया जा सकता है या विभिन्न आकारों की आरएनए टुकड़े प्राप्त करने के लिए विस्तारित के साथ उपचार है । विचारणीय यह भी है कि पाली (क) पोलीमरेज़ द्वारा आरएनए अंशों के ३ ' dATP से ३ ' के अतिरिक्त रूप में दक्ष होता है. यहां वर्णित प्रोटोकॉल में, इस उपचार सभी आरएनए टुकड़े करने के लिए लागू किया जाता है, बंधाव प्रतिक्रिया के दौरान concatemerization से बचने के लिए । अंत में, हम ध्यान दें कि हालांकि आरएनए ligase 1 आम तौर पर एक आरएनए ligase के रूप में प्रयोग किया जाता है, यह भी कुशलतापूर्वक ligates एक असहाय डीएनए, के रूप में हम यहाँ किया है के लिए एक एडाप्टर ligate सीडीएनए अणुओं की 5 अंत करने के लिए.
इस प्रकार, एक-seq2 है एक कुशल और आसान करने के लिए पूर्व की पहचान के लिए प्रोटोकॉल को लागू करने-mRNA 3 ' अंत प्रसंस्करण साइटों । भविष्य के घटनाक्रम आगे प्रोटोकॉल की जटिलता को कम करने और आवश्यक सामग्री की राशि को शामिल कर सकते हैं । गणनात्मक डेटा विश्लेषण उपकरण के संबद्ध सेट आगे 3 ' अंत अनुक्रमण प्रोटोकॉल की एक विस्तृत श्रृंखला के साथ प्राप्त पढ़ता के सजातीय प्रसंस्करण सक्षम करें ।
Disclosures
लेखकों का खुलासा करने के लिए कुछ नहीं है ।
Acknowledgments
लेखक श्रीमती Béatrice Dimitriades सेल संस्कृति के साथ मदद के लिए धंयवाद । इस कार्य को स्विस राष्ट्रीय विज्ञान फाउंडेशन पलाश #31003A_170216 और 51NF40_141735 (NCCR आरएनए & #38; रोग) के सहयोग से किया गया ।
Materials
Name | Company | Catalog Number | Comments |
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAG TCCGA 3' |
|
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAG ATCGTGATGTGACTGGAGTTCCT TGGCACCCGAGAATTCCA 3' |
|
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTG CTCTTCCrGrAUrC-3' |
|
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCT CTTCCGATCTNNNN 3' |
|
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACA CGACGCTCTTCCGATCT -3' |
|
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |
References
- Jan, C. H., Friedman, R. C., Ruby, J. G., Bartel, D. P. Formation, regulation and evolution of Caenorhabditis elegans 3'UTRs. Nature. 469 (7328), 97-101 (2011).
- Spies, N., Burge, C. B., Bartel, D. P. 3' UTR-isoform choice has limited influence on the stability and translational efficiency of most mRNAs in mouse fibroblasts. Genome Res. 23 (12), 2078-2090 (2013).
- Hoque, M., Ji, Z., et al. Analysis of alternative cleavage and polyadenylation by 3' region extraction and deep sequencing. Nat. methods. 10 (2), 133-139 (2013).
- Martin, G., Gruber, A. R., Keller, W., Zavolan, M. Genome-wide analysis of pre-mRNA 3’ end processing reveals a decisive role of human cleavage factor I in the regulation of 3' UTR length. Cell Rep. 1 (6), 753-763 (2012).
- Gruber, A. R., Martin, G., et al. Global 3' UTR shortening has a limited effect on protein abundance in proliferating T cells. Nat. Commun. 5, 5465 (2014).
- Kivioja, T., Vähärautio, A., et al. Counting absolute numbers of molecules using unique molecular identifiers. Nat. methods. 9 (1), 72-74 (2011).
- Gruber, A. J., Schmidt, R., et al. A comprehensive analysis of 3' end sequencing data sets reveals novel polyadenylation signals and the repressive role of heterogeneous ribonucleoprotein C on cleavage and polyadenylation. Genome Res. 26 (8), 1145-1159 (2016).
- Lingner, J., Keller, W. 3'-end labeling of RNA with recombinant yeast poly(A) polymerase. Nucleic Acids Res. 21 (12), 2917-2920 (1993).
- Quail, M. A., Kozarewa, I., et al. A large genome center's improvements to the Illumina sequencing system. Nat. methods. 5 (12), 1005-1010 (2008).
- Rahmann, S. Snakemake--a scalable bioinformatics workflow engine. Bioinformatics. 28 (19), 2520-2522 (2012).
- Analytics, C. Anaconda Software Distribution. , Available from: https://continuum.io (2016).
- Lab, H. FASTX-Toolkit - Hannon Lab. , Available from: http://hannonlab.cshl.edu/fastx_toolkit/index.html (2017).
- Dobin, A., Davis, C. A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
- Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
- Li, H., Handsaker, B., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
- Robinson, J. T., Thorvaldsdóttir, H., et al. Integrative genomics viewer. Nat. Biotechnol. 29 (1), 24-26 (2011).
- Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26 (6), 841-842 (2010).
- Ozsolak, F., Platt, A. R., et al. Direct RNA sequencing. Nature. 461 (7265), 814-818 (2009).
- Yao, C., Biesinger, J., et al. Transcriptome-wide analyses of CstF64-RNA interactions in global regulation of mRNA alternative polyadenylation. Proc. Natl. Acad. Sci. U. S. A. 109 (46), 18773-18778 (2012).
- Lin, Y., Li, Z., et al. An in-depth map of polyadenylation sites in cancer. Nucleic Acids Res. 40 (17), 8460-8471 (2012).
- Shepard, P. J., Choi, E. -A., Lu, J., Flanagan, L. A., Hertel, K. J., Shi, Y. Complex and dynamic landscape of RNA polyadenylation revealed by PAS-Seq. RNA. 17 (4), 761-772 (2011).
- Fu, Y., Sun, Y., et al. Differential genome-wide profiling of tandem 3' UTRs among human breast cancer and normal cells by high-throughput sequencing. Genome Res. 21 (5), 741-747 (2011).