की transcriptomic विश्लेषण

Genetics

Your institution must subscribe to JoVE's Genetics section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

आकाशगंगा और डेविड लोकप्रिय टूल दिए गए जैव सूचना विज्ञान प्रशिक्षण के बिना जांचकर्ताओं का विश्लेषण और आरएनए Seq डेटा व्याख्या करने की अनुमति के रूप में उभरा है। सी.एलेगन्स शोधकर्ताओं आरएनए Seq प्रयोगों, पहुँच प्रदर्शन करने के लिए और आकाशगंगा का उपयोग कर डाटासेट संसाधित करने और डेविड का उपयोग कर जीन सूचियों से सार्थक जैविक जानकारी प्राप्त करने के लिए हम एक प्रोटोकॉल का वर्णन।

Cite this Article

Copy Citation | Download Citations

Amrit, F. R., Ghazi, A. Transcriptomic Analysis of C. elegans RNA Sequencing Data Through the Tuxedo Suite on the Galaxy Project. J. Vis. Exp. (122), e55473, doi:10.3791/55473 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

अगली पीढ़ी अनुक्रमण (NGS) प्रौद्योगिकियों जैविक जांच की प्रकृति में क्रांति ला दिया है। इनमें से शाही सेना अनुक्रमण (आरएनए Seq) जीन अभिव्यक्ति विश्लेषण और transcriptome मानचित्रण के लिए एक शक्तिशाली उपकरण के रूप में उभरा है। हालांकि, आरएनए Seq डेटासेट से निपटने परिष्कृत कम्प्यूटेशनल विशेषज्ञता की आवश्यकता और जीव विज्ञान शोधकर्ताओं के लिए निहित चुनौतियों बन गया है। इस टोंटी खुली पहुंच आकाशगंगा परियोजना है कि जैव सूचना विज्ञान कौशल के बिना उन आरएनए Seq डेटा का विश्लेषण करने की अनुमति देता है, और एनोटेशन, दृश्य, और एकीकृत डिस्कवरी (डेविड) के लिए डाटाबेस से कम किया गया है, एक जीन आंटलजी (GO) अवधि विश्लेषण सुइट है जो बड़े डेटा सेट से जैविक अर्थ निकाले जाते हैं। हालांकि, पहली बार के उपयोगकर्ताओं और जैव सूचना विज्ञान 'शौकीनों, इन प्लेटफार्मों के साथ स्वयं सीखने और परिचय के लिए समय लेने वाली और कठिनाई आ सकती है। हम कीड़ा शाही सेना को अलग करने के सी.एलेगन्स शोधकर्ताओं में मदद मिलेगी कि एक सीधा कार्यप्रवाह का वर्णन है, एक आरएनए-Seq प्रयोग का संचालनऔर आकाशगंगा और डेविड प्लेटफार्मों का उपयोग कर डेटा का विश्लेषण। यह प्रोटोकॉल हर कदम पर, कच्चे NGS डेटा, गुणवत्ता नियंत्रण की जाँच, संरेखण, और अंतर जीन अभिव्यक्ति विश्लेषण तक पहुँचने मानकों के साथ उपयोगकर्ता मार्गदर्शन के लिए विभिन्न आकाशगंगा मॉड्यूल का उपयोग कर एक जीन की सूची है कि के संवर्धन के लिए जांच की जा सकती है उत्पन्न करने के लिए के लिए चरणबद्ध निर्देश प्रदान करता है जीन वर्गों या जैविक प्रक्रियाओं डेविड का उपयोग कर। कुल मिलाकर, हम आशा करते हैं कि इस लेख के बारे में जानकारी प्रदान करेगा सी पहली बार के लिए शाही सेना Seq प्रयोगों के साथ ही बार-बार उन नमूनों की एक छोटी संख्या में चल रहे उपक्रम शोधकर्ताओं एलिगेंस करने के लिए।

Introduction

मानव जीनोम की पहली अनुक्रमण,, फ्रेड सेंगर के dideoxynucleotide-अनुक्रमण विधि का उपयोग किया 10 साल लग गए, और एक अनुमान के अनुसार अमेरिका में 3 अरब $ 1, 2 की लागत। हालांकि, अपनी स्थापना के बाद एक दशक से अधिक एक छोटे में, अगली पीढ़ी अनुक्रमण (NGS) प्रौद्योगिकी यह दो सप्ताह के भीतर पूरे मानव जीनोम अनुक्रम और यूएस $ 1,000 के लिए संभव बना दिया है। नई NGS उपकरणों कि की अनुमति लागत में अविश्वसनीय दक्षता के साथ बढ़ती अनुक्रमण-डेटा संग्रह की गति, तेज कटौती के साथ-साथ, अकल्पनीय मायनों में आधुनिक जीव विज्ञान क्रांति कर रहे हैं के रूप में जीनोम अनुक्रमण परियोजनाओं को तेजी से सामान्य हो रहे हैं। इसके अलावा, इन घटनाओं में इस तरह के शाही सेना अनुक्रमण (आरएनए Seq), जीनोम चौड़ा epigenetic संशोधनों के अध्ययन, डीएनए प्रोटीन अन्योन्य क्रिया के माध्यम से जीन अभिव्यक्ति विश्लेषण के रूप में कई अन्य क्षेत्रों में प्रगति जस्ती है, और मानव मेजबान में माइक्रोबियल विविधता के लिए स्क्रीनिंग। NGS आधारित शाही सेना सेविशेष रूप से क्ष यह संभव व्यापक सटीकता और संवेदनशीलता के साथ नक्शा transcriptomes की पहचान करने और करने के लिए बनाया गया है, और अभिव्यक्ति की रूपरेखा के लिए पसंद की विधि के रूप में माइक्रोएरे प्रौद्योगिकी ले लिया है। माइक्रोएरे प्रौद्योगिकी बड़े पैमाने पर इस्तेमाल किया गया है, यह इस तरह के पार संकरण और अभिव्यक्ति में परिवर्तन की प्रतिबंधित सीमा कि मज़बूती से मापा जा सकता है के रूप में अन्य कमियां ज्ञात जीनोमिक जानकारी के साथ पहले से मौजूद सरणियों, और पर अपनी निर्भरता द्वारा सीमित है। शाही सेना seq, दूसरे हाथ पर, अपने स्पष्ट डीएनए मैपिंग प्रकृति के कारण, जबकि कम पृष्ठभूमि शोर उत्पादन दोनों ज्ञात और अज्ञात टेप पता लगाने के लिए इस्तेमाल किया जा सकता। शाही सेना Seq, कई आनुवंशिक ऐसे खमीर के रूप में मॉडल जीवों द्वारा की पेशकश उपकरणों के साथ मिलकर, मक्खियों, कीड़े, मछली और चूहों, कई महत्वपूर्ण हाल के जैव चिकित्सा खोजों के लिए नींव के रूप में सेवा की है। हालांकि, महत्वपूर्ण चुनौतियों रहने कि व्यापक वैज्ञानिक समुदाय के लिए दुर्गम NGS बनाने के भंडारण की सीमाओं, प्रसंस्करण, और सभी के अधिकांश, मीटर सहित, अनुक्रमण डेटा की बड़ी मात्रा का eaningful जैव सूचना विज्ञान विश्लेषण।

अनुक्रमण प्रौद्योगिकियों और घातीय डेटा संचय में तेजी से प्रगति कम्प्यूटेशनल प्लेटफार्मों कि शोधकर्ताओं का उपयोग का विश्लेषण करने और इस जानकारी को समझने के लिए अनुमति देगा की काफी जरूरत पैदा की है। प्रारंभिक सिस्टम भारी कंप्यूटर प्रोग्रामिंग ज्ञान पर निर्भर करती थीं, जबकि इस तरह के एन सी बी आई के रूप में जीनोम ब्राउज़रों कि नान प्रोग्रामर्स पहुँच सकते हैं और डेटा की कल्पना परिष्कृत विश्लेषण की अनुमति नहीं था की अनुमति दी। वेब आधारित, खुले पहुँच मंच, आकाशगंगा ( https://galaxyproject.org/ ), इस शून्य भरा है और एक मूल्यवान पाइपलाइन कि NGS डेटा की प्रक्रिया और एक स्पेक्ट्रम के प्रदर्शन करने के लिए सक्षम बनाता है शोधकर्ताओं साबित हो गया है सरल करने के लिए जटिल जैव सूचना विज्ञान विश्लेषण करती है। गैलेक्सी शुरू में स्थापित किया गया था, और बनाए रखा है, एंटोन Nekrutenko (पेन स्टेट यूनिवर्सिटी) और जेम्स टेलर की प्रयोगशालाओं द्वारा (जॉन्स हॉपकिन्स विश्वविद्यालय)च "> 3। आकाशगंगा यह सब एक आरएनए-Seq अध्ययन में शामिल चरणों सहित असंख्य जैव सूचना विज्ञान की जरूरत है, के लिए एक 'वन-स्टॉप शॉप' बनाने कम्प्यूटेशनल कार्यों की एक विस्तृत श्रृंखला प्रदान करता है। या तो अपने सर्वर पर या डाटा प्रोसेसिंग प्रदर्शन करने के लिए उन Itallows स्थानीय स्तर पर अपने स्वयं मशीनों पर। डाटा और workflows reproduced जा सकता है और साझा की है। ऑनलाइन ट्यूटोरियल, सहायता अनुभाग, और एक विकि-पेज ( https://wiki.galaxyproject.org/Support ) आकाशगंगा परियोजना के लिए समर्पित लगातार समर्थन प्रदान करते हैं। हालांकि, पहली बार के उपयोगकर्ताओं के लिए, विशेष रूप से कोई जैव सूचना विज्ञान प्रशिक्षण के साथ उन लोगों, पाइपलाइन कठिन दिखाई दे सकता है और स्वयं सीखने और परिचय की प्रक्रिया समय लग सकता है। इसके अलावा, जैविक प्रणाली का अध्ययन किया, और प्रयोग और तरीकों की बारीकियों का इस्तेमाल किया, प्रभाव कई कदम पर विश्लेषणात्मक निर्णय है, और इन शिक्षा के बिना नेविगेट करने के लिए मुश्किल हो सकता है।

कुल मिलाकर आर.एन. ए-Seq आकाशगंगा कार्यप्रवाह, डेटा अपलोड और गुणवत्ता टक्सेडो सुइट 4, 5, 6, 7, 8, 9, जो शाही सेना Seq डेटा विश्लेषण 10 के विभिन्न चरणों के लिए आवश्यक विभिन्न उपकरणों का एक सामूहिक है का उपयोग कर विश्लेषण के बाद जांच के होते हैं 11, 12, 13, 14। एक ठेठ आरएनए Seq प्रयोग प्रयोगात्मक हिस्सा (नमूना तैयार करने, mRNA अलगाव और सीडीएनए पुस्तकालय तैयारी) के होते हैं, NGS और जैव सूचना विज्ञान डेटा विश्लेषण। इन वर्गों, और कदम आकाशगंगा पाइपलाइन में शामिल का अवलोकन, चित्र 1 में दिखाया गया है।

3fig1.jpg "/>
चित्र 1: एक आरएनए-Seq कार्यप्रवाह का अवलोकन। दो कीड़ा उपभेदों (ए और बी, नारंगी और हरे रंग लाइनों और तीर, क्रमशः) के जीन अभिव्यक्ति प्रोफाइल की तुलना करने के एक आरएनए-Seq प्रयोग में शामिल प्रयोगात्मक और कम्प्यूटेशनल चरणों का चित्रण। आकाशगंगा का उपयोग के विभिन्न मॉड्यूल हमारे प्रोटोकॉल में इसी कदम लाल रंग में संकेत दिया साथ बक्से में दिखाए जाते हैं। विभिन्न कार्यों के आउटपुट नीले रंग में दिखाया फ़ाइल स्वरूपों के साथ भूरे रंग में लिखे गए हैं। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

टक्सेडो सूट में पहला उपकरण एक संरेखण कार्यक्रम 'Tophat' कहा जाता है। यह टूट जाती है NGS इनपुट छोटे टुकड़ों में पढ़ता है और फिर उन्हें एक संदर्भ जीनोम को मैप करता है। यह दो चरण की प्रक्रिया सुनिश्चित करता है कि intronic क्षेत्रों जिसका संरेखण अन्यथा di हो सकता फैले पढ़ताsrupted या चूक के लिए जिम्मेदार है और मैप की जाती हैं। इस कवरेज बढ़ जाती है और उपन्यास जोड़ जंक्शनों की पहचान की सुविधा। Tophat उत्पादन दो फ़ाइलों, एक बिस्तर फ़ाइल (जोड़ जंक्शनों कि जीनोमिक स्थान शामिल हैं के बारे में जानकारी के साथ) और एक BAM फ़ाइल (प्रत्येक को पढ़ने की मैपिंग विवरण के साथ) के रूप में रिपोर्ट किया गया है। इसके बाद, BAM फ़ाइल 'कफ़लिंक' नामक टक्सेडो सुइट में बाद में उपकरण का उपयोग कर प्रत्येक नमूने के अलग-अलग टेप की बहुतायत अनुमान लगाने के लिए एक संदर्भ के जीनोम के खिलाफ गठबंधन है। पूर्ण लंबाई प्रतिलेख टुकड़े या 'transfrags' है कि हर जीन के लिए इनपुट डेटा में हर संभव जोड़ वेरिएंट अवधि रिपोर्ट करने के लिए संरेखण को स्कैन करके कफ़लिंक कार्य करता है। इस आधार पर, यह एक प्रत्येक नमूने के लिए अनुक्रम किया जा रहा है (सभी हर जीन के लिए जीन प्रति उत्पन्न टेप की विधानसभा) 'transcriptome' उत्पन्न करता है। इन कफ़लिंक विधानसभाओं तो ध्वस्त हो गई या फिर साथ-साथ एक साथ विलय कर रहे हैंसम्मेलन जीनोम नीचे की ओर अंतर विश्लेषण अगले उपकरण, 'Cuffmerge' का उपयोग कर के लिए एक एकल एनोटेशन फ़ाइल का उत्पादन करने के लिए। अंत में, अंतिम Cuffmerge आउटपुट फ़ाइल (चित्रा 1) के नमूने में से प्रत्येक के Tophat आउटपुट की तुलना द्वारा नमूने के बीच 'Cuffdiff' उपकरण उपायों अंतर जीन अभिव्यक्ति। कफ़लिंक का उपयोग करता FPKM / RPKM (टुकड़े / प्रति kilobase लाख मैप की प्रति प्रतिलेख के पढ़ने पढ़ता है) मान प्रतिलेख प्रचुरता रिपोर्ट करने के लिए। ये मान गहराई के लिए कच्चे NGS डेटा को सामान्य प्रतिबिंबित और जीन लंबाई (जीन, अलग-अलग लंबाई है तो मायने रखता स्तर की तुलना करने के लिए एक जीन की लंबाई के लिए सामान्यीकृत किया जाना है (औसत संख्या एक नमूना है कि संदर्भ जीनोम को संरेखित से पढ़ता की) जीन के बीच)। FPKM और RPKM अनिवार्य है, जबकि, FPKM के लिए प्रयोग किया जाता है RPKM के साथ एक ही एकल अंत शाही सेना Seq जहां हर पढ़ा एक भी टुकड़ा से मेल खाती है के लिए इस्तेमाल किया जा रहा हैंबनती अंत शाही सेना Seq, यह तथ्य दो पढ़ता है कि एक ही टुकड़ा के अनुरूप कर सकते हैं के लिए खातों के रूप में। अंत में, इन विश्लेषण के परिणाम जीन भिन्न शर्तों और / या उपभेदों का परीक्षण के बीच व्यक्त की एक सूची है।

एक सफल गैलेक्सी रन पूरा हो गया है और एक 'जीन सूची' उत्पन्न हो जाने के बाद, अगला तार्किक कदम डेटासेट से सार्थक ज्ञान निकालना का विश्लेषण करती है और अधिक जैव सूचना विज्ञान की आवश्यकता है। कई सॉफ्टवेयर संकुल इस जरूरत को पूरा करने के, इस तरह के डेविड 15 (एनोटेशन, दृश्य और एकीकृत खोज के लिए डाटाबेस) के रूप में सार्वजनिक रूप से उपलब्ध वेब आधारित कम्प्यूटेशनल संकुल सहित उभरा है। डेविड अपनी एकीकृत जैविक नॉलेजबेस पर अपलोड जीन सूची की तुलना और जैविक जीन सूची से संबद्ध एनोटेशन खुलासा द्वारा उच्च प्रवाह क्षमता के अध्ययन से बड़े जीन सूची में जैविक अर्थ बताए की सुविधा। इस संवर्धन विश्लेषण, यानी, द्वारा पीछा किया जाता आईडीई के लिए परीक्षणntify यदि कोई जैविक प्रक्रिया या जीन वर्ग सांख्यिकीय रूप से महत्वपूर्ण ढंग से जीन सूची (सूचियों) में overrepresented है। यह एक विस्तृत, एकीकृत ज्ञान आधार और शक्तिशाली विश्लेषणात्मक एल्गोरिदम कि शोधकर्ताओं जैविक भीतर समृद्ध विषयों का पता लगाने के लिए सक्षम का एक संयोजन की वजह से एक लोकप्रिय विकल्प बन गया है जीनोमिक्स व्युत्पन्न 'गुणसूत्र सूचियों' 10, 16। अतिरिक्त लाभ किसी भी अनुक्रमण मंच और एक अत्यंत उपयोगकर्ता के अनुकूल इंटरफेस पर बनाया जीन सूचियों पर कार्रवाई करने की क्षमता शामिल है।

निमेटोड Caenorhabditis एलिगेंस एक आनुवंशिक मॉडल प्रणाली, अच्छी तरह से इस तरह के छोटे आकार, पारदर्शी शरीर, सरल शरीर की योजना, संस्कृति में आसानी और आनुवंशिक और आणविक विच्छेदन के लिए महान ज़िम्मा के रूप में अपनी कई फायदे के लिए जाना जाता है। कीड़े एक, छोटे सरल और अच्छी तरह से एनोटेट जीनोम कि ज्ञात मानव homologs 17 के साथ 40% संरक्षित जीन पर निर्भर शामिल है। दरअसल, सी एलिगेंसपहले metazoan जिसका जीनोम पूरी तरह से 18 अनुक्रम था और पहली प्रजाति जहां शाही सेना Seq एक जीव की transcriptome 19, 20 मैप करने के लिए इस्तेमाल किया गया था से एक था। प्रारंभिक कीड़ा पढ़ाई उच्च throughput शाही सेना पर कब्जा, पुस्तकालय तैयारी और अनुक्रमण के साथ ही जैव सूचना विज्ञान पाइपलाइनों के लिए विभिन्न तरीकों कि प्रौद्योगिकी 21, 22 की उन्नति के लिए योगदान दिया साथ शामिल प्रयोग। हाल के वर्षों में, कीड़े में शाही सेना Seq आधारित प्रयोग आम हो गया है। लेकिन, पारंपरिक वर्म जीव के लिए चुनौतियों आरएनए Seq डेटा के कम्प्यूटेशनल विश्लेषण से उत्पन्न तकनीक का अधिक से अधिक और बेहतर उपयोग के लिए एक प्रमुख बाधा बने हुए हैं।

इस अनुच्छेद में, हम आकाशगंगा प्लेटफॉर्म का इस्तेमाल सी.एलेगन्स से उत्पन्न उच्च throughput आरएनए Seq डेटा का विश्लेषण करने के लिए एक प्रोटोकॉल का वर्णन। कई पहली बार और छोटे एससीए के लिएle उपयोगकर्ताओं, सबसे अधिक लागत प्रभावी और सरल तरीके से एक आरएनए-Seq प्रयोग शुरू करने के लिए प्रयोगशाला में शाही सेना को अलग करने और अनुक्रमण सीडीएनए पुस्तकालयों की तैयारी और NGS खुद के लिए एक वाणिज्यिक (या इन-हाउस) NGS सुविधा का उपयोग करने के लिए है। इसलिए, हम पहले अलगाव में शामिल चरणों विस्तृत, सी की मात्रा और गुणवत्ता मूल्यांकन आरएनए Seq के लिए शाही सेना के नमूने एलिगेंस। इसके बाद, हम NGS डेटा के विश्लेषण के लिए गैलेक्सी इंटरफ़ेस का उपयोग कर, बाद अनुक्रमण गुणवत्ता नियंत्रण संरेखण, विधानसभा, और जीन अभिव्यक्ति के अंतर मात्रा के बाद जांच के लिए परीक्षण के साथ शुरुआत के लिए कदम दर कदम निर्देश प्रदान करते हैं। इसके अलावा, हम डेविड का उपयोग कर जैविक संवर्धन के अध्ययन के लिए आकाशगंगा से उत्पन्न जीन सूचियों की जांच करने के लिए निर्देशों को शामिल किया है। कार्यप्रवाह में एक अंतिम कदम के रूप में, हम इस तरह के अनुक्रम पढ़ें आर्काइव (एसआरए) एन सी बी आई पर (के रूप में सार्वजनिक सर्वर पर शाही सेना Seq डेटा अपलोड करने के लिए निर्देश प्रदान करते हैं http: // www.ncbi.nlm.nih.gov/sra) यह स्वतंत्र रूप से वैज्ञानिक समुदाय के लिए सुलभ बनाने के लिए। कुल मिलाकर, हम आशा करते हैं कि इस लेख के लिए पहली बार शाही सेना Seq प्रयोगों के साथ ही बार-बार उन नमूनों की एक छोटी संख्या में चल रहे उपक्रम कीड़ा जीव के लिए व्यापक और पर्याप्त जानकारी प्रदान करेगा।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. आरएनए अलगाव

  1. एहतियाती उपाय
    1. वर्तमान में किसी भी RNases को खत्म करने की एक वाणिज्यिक रूप से उपलब्ध RNase स्प्रे का उपयोग कर पूरे काम कर सतह, उपकरणों और pipettes नीचे साफ कर लें।
    2. हर समय दस्ताने पहनें, उन्हें नियमित रूप से प्रोटोकॉल के विभिन्न चरणों के दौरान ताजा लोगों के साथ बदल रहा है।
    3. केवल फिल्टर युक्तियों का उपयोग करें और के रूप में ज्यादा संभव के रूप में बर्फ पर सभी नमूनों रखने आरएनए गिरावट से बचने के लिए।
      नोट: आदेश NGS प्लेटफार्मों से सबसे अच्छा डेटा प्राप्त करने के अलावा, यह उच्च गुणवत्ता वाले शाही सेना के साथ शुरू करने के लिए महत्वपूर्ण है। शाही सेना अलगाव और तैयारी के तरीकों नमूना मूल, अनुक्रमण और अन्वेषक वरीयता की विधि के आधार पर भिन्न। कई व्यावसायिक रूप से उपलब्ध किट इस उद्देश्य के लिए इस्तेमाल किया जा सकता या आरएनए भी शाही सेना निकासी का एक मानक फिनोल-क्लोरोफॉर्म विधि का उपयोग कर अलग किया जा सकता। या तो कार्यप्रणाली के साथ, एहतियाती ऊपर सूचीबद्ध उपायों प्रदूषण और OBT कम करने के लिए इस प्रक्रिया के दौरान पालन किया जाना चाहिएऐन प्राचीन शाही सेना के नमूने हैं।
  2. फसल काटने वाले कीड़े
    1. तनाव प्रति 1,000-1,500 उम्र से मिलान सी.एलेगन्स वयस्क कीड़े प्राप्त करने के लिए हाइपोक्लोराइट विरंजन उपचार 23 से कीड़ा आबादी सिंक्रनाइज़ करें।
    2. कीड़े से 30 रों के लिए एक मेज शीर्ष अपकेंद्रित्र पर 325 XG पर M9 बफर समाधान और स्पिन का उपयोग कर प्लेटें धो लें। M9 बफर कीड़े की एक गोली पीछे छोड़कर बाहर Aspirate। जीवाणु भार को खत्म करने की यह प्रक्रिया दोहराएं कम से कम तीन बार।
    3. कीड़ा ऊतकों को बाधित करने के: कीड़ा गोली करने के लिए, lysis बफर के (एक वाणिज्यिक किट का उपयोग करता है, तो) Trizol ~ 500 μL या जोड़ने (क्लोरोफॉर्म निष्कर्षण 1.3.3 में वर्णित किया जाता है, तो फिनोल फिनोल और guanidine आइसोथियोसाइनेट की एक मोनो phasic समाधान) , RNases को निष्क्रिय और न्यूक्लिक एसिड को स्थिर।
      नोट: प्रोटोकॉल फ़्लैश तरल -80 डिग्री सेल्सियस पर भंडारण के बाद नाइट्रोजन में नमूने ठंड से यहां रुका हुआ जा सकता है।
  3. शाही सेना अलगाव
  4. 20 रों के चक्र में 45% आयाम पर Sonicate कीड़ा नमूने हैं। 'ऑन' और 40 रों। 'बंद' (तनाव प्रति 8-12 चक्र)। हर समय बर्फ पर नमूने रखें।
    नोट: सुनिश्चित करें कि sonicator जांच बफर में डूब जाता है और भर में एक निरंतर स्तर पर रखा गया है। नमूने के frothing से बचें और नमूने के बीच में अच्छी तरह से जांच को साफ। Sonication चक्र इस्तेमाल किया sonicator के प्रकार के आधार पर भिन्न हो सकते। कि sonication की स्थिति पहले एक प्रयोग शुरू करने से पहले एक परीक्षण के नमूने पर अनुकूलित कर रहे हैं यह सिफारिश की है।
  5. एक व्यावसायिक रूप से उपलब्ध किट का उपयोग करते हैं, तो निर्धारित प्रोटोकॉल के अनुसार शाही सेना अलगाव के साथ आगे बढ़ना। एक फिनोल-क्लोरोफॉर्म विधि का उपयोग कर शाही सेना अलगाव के लिए, निम्न चरणों का पालन।
  6. अपकेंद्रित्र 10 मिनट के लिए 16,000 XG पर नमूने sonicated। 4 डिग्री सेल्सियस पर
  7. एक 1.5 एमएल RNase मुक्त microfuge ट्यूब में सतह पर तैरनेवाला स्थानांतरण और (वें शाही सेना / डीएनए अलगाव अभिकर्मक की मात्रा 1/5) क्लोरोफॉर्म के 100 μL जोड़ें।
    सावधान: क्लोरोफॉर्म विषैला होता है। जोखिम को कम करने और साँस लेना से बचने के लिए, एक रासायनिक हुड में काम करते हैं जब इस पदार्थ से निपटने।
  8. 60 रों - 30 के लिए अच्छी तरह से नमूने भंवर। और नमूने 3 मिनट के लिए कमरे के तापमान पर बैठते हैं।
  9. 15 मिनट के लिए 11,750 XG पर अपकेंद्रित्र। 4 डिग्री सेल्सियस पर। एक नया RNase मुक्त microfuge ट्यूब देखभाल करने के लिए एक ही शीर्ष जलीय परत स्थानांतरण डीएनए युक्त सफेद इंटरफ़ेस निकालना नहीं। दोहराएँ 1.3.6 के माध्यम से 1.3.4 कदम दूर है।
  10. 250 μL 2-propanol की (जलीय चरण या 1/2 आरएनए / डीएनए अलगाव अभिकर्मक मात्रा का 70%) जोड़ें और ट्यूब मिश्रण करने को उलटने के। ट्यूब 10 मिनट के लिए कमरे के तापमान पर बैठने या -80 डिग्री सेल्सियस पर रात भर छोड़ दें करते हैं।
  11. 10 मिनट के लिए 11,750 XG पर अपकेंद्रित्र नमूने हैं। 4 डिग्री सेल्सियस पर। सतह पर तैरनेवाला छानना बहुत सावधानी से, ट्यूब के नीचे कुछ μL पीछे छोड़ ताकि गोली परेशान नहीं कर रहा है।
  12. 75% इथेनॉल के 500 μL (RNase मुक्त पानी का उपयोग किया जाता है) के साथ गोली धो लें और 5 मिनट के लिए 16,000 XG पर नीचे स्पिन। एटी 4 डिग्री सेल्सियस।
  13. गोली को परेशान किए बिना जितना संभव हो उतना सतह पर तैरनेवाला निकालें। एयर कुछ मिनट के लिए एक हुड में गोली सूखी।
  14. RNase मुक्त पानी के 30 μL जोड़ें और 10 मिनट के लिए हीटिंग द्वारा शाही सेना गोली भंग मदद करते हैं। 60 डिग्री सेल्सियस पर।
  15. शाही सेना की गुणवत्ता और मात्रा एक bioanalyzer का उपयोग कर की जाँच करें।
    नोट: Bioanalyzer शाही सेना की गुणवत्ता का एक उपाय के रूप में एक अनुसंधान एनए मैं ntegrity एन भूरा रंग (Rin) उत्पन्न करता है। कम से कम 8 का एक RIN आरएनए Seq नमूने के लिए सीमा की सिफारिश की (उच्च बेहतर है) है। शाही सेना की मात्रा और गुणवत्ता भी spectrophotometrically जाँच की जा सकती है लेकिन यह भी शाही सेना अखंडता के विज़ुअल आकलन द्वारा पालन किया जाना चाहिए। ऐसा करने के लिए, 28s और 18s राइबोसोमल आरएनए बैंड में से उपयुक्त जुदाई प्राप्त करने के लिए काफी लंबे समय से एक 1.2% agarose जेल पर नमूने चलाते हैं। दो अलग-अलग बैंड (18s rRNA के लिए 1.75 केबी और सी.एलेगन्स के मामले में 28S rRNA के लिए 3.5 केबी) की उपस्थिति शाही सेना गुणवत्ता का एक स्वीकार्य उपाय है।
  16. का प्रयोग करें ~ 100 एनजी / μL आरएनए शि कोअनुक्रमण पुस्तकालयों की तैयारी के लिए विक्रेता / NGS सुविधा के लिए पी।
    नोट: शाही सेना के नमूने अनुक्रमण सेवा प्रदाता के लिए सूखी बर्फ पर भेज दिया जाना चाहिए। अधिकांश प्रदाता पुस्तकालय तैयारी से पहले एक स्वतंत्र शाही सेना गुणवत्ता नियंत्रण परीक्षण।

2. आरएनए Seq डेटा विश्लेषण

  1. कच्चे अनुक्रमण डेटा के डाउनलोड
    1. संकुचित कच्चे fastq अनुक्रमण एक "फ़ाइल स्थानांतरण प्रोटोकॉल" (एफटीपी) का उपयोग कर NGS प्रदाता से fastq.gz प्रारूप में इनकोडिंग डेटा डाउनलोड करें।

चित्र 2
चित्र 2: आकाशगंगा उपयोगकर्ता इंटरफ़ेस पैनल और कुंजी आरएनए Seq कार्य के लेआउट। पेज की मुख्य विशेषताएं विस्तार किया है और प्रकाश डाला है। (ए) पर प्रकाश डाला गया वेबपेज शीर्षक में 'डेटा का विश्लेषण' समारोह का उपयोग करने के लिए इस्तेमाल (बी) 'प्रगति बार' है कि आपरेशन द्वारा उपयोग आकाशगंगा सर्वर पर जगह इंगित करता है। (सी) 'उपकरण धारा' है कि सभी उपकरण है कि आकाशगंगा इंटरफेस पर चलाया जा सकता है सूचीबद्ध करता है। (डी) 'NGS: शाही सेना विश्लेषण' से पता चलता आरएनए Seq विश्लेषण के लिए इस्तेमाल किया उपकरण अनुभाग। (ई) 'इतिहास' पैनल है कि सभी आकाशगंगा का उपयोग कर उत्पन्न फ़ाइलों को सूचीबद्ध करता है दर्शाया गया है। (एफ) संवाद बॉक्स खुल जाता है कि जब इतिहास अनुभाग में किसी भी फाइल पर क्लिक का एक उदाहरण दिखाता। भीतर (एफ), नीले बॉक्स प्रतीक है कि देखने के लिए इस्तेमाल किया जा सकता, editthe विशेषताओं पर प्रकाश डाला गया या डाटासेट हटाने के लिए, बैंगनी बॉक्स प्रतीक है कि 'संपादित करें' डाटासेट टैग या एनोटेशन इस्तेमाल किया जा सकता पर प्रकाश डाला गया है, और, लाल बॉक्स माउस को इंगित करता है डेटा डाउनलोड करने के लिए, कार्य की विवरण देखें प्रदर्शन किया या ऑपरेशन को पुनः चलाएं। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

  1. आकाशगंगा के साथ प्रारंभ करना
    नोट: आकाशगंगा एक नि: शुल्क सार्वजनिक सर्वर एक वेब आधारित बादल का उपयोग और मुक्त सीमित भंडारण उपलब्ध कराने के प्लेटफॉर्म का इस्तेमाल करने पर चलाया जा सकता। यह भी डाउनलोड किया है और उपयोगकर्ता की मशीन या कम्प्यूटेशनल समूहों संस्थानों लेकिन स्थानीय प्रसंस्करण द्वारा की मेजबानी पर स्थानीय रूप से चलाया जा सकता है, डेटा भंडारण सीमा और उपयोगकर्ता मशीनों के प्रसंस्करण शक्ति सीमा की शर्त हो सकती है। डाउनलोड और स्थापना पर विवरण में पहुँचा जा सकता है https://wiki.galaxyproject.org/Admin/GetGalaxy । इस प्रोटोकॉल में हम आकाशगंगा पाइप लाइन के वेब आधारित उपयोग का वर्णन।
    1. पर उपयोगकर्ता की मशीन, पहुँच आकाशगंगा पर डाउनलोड करने और NGS डेटा भंडारण के बादlaxy.org/ "लक्ष्य =" _blank "> https://usegalaxy.org/।
    2. पेज, लॉगिन के शीर्षक में 'उपयोगकर्ता' पर क्लिक करके एक उपयोगकर्ता खाते रजिस्टर और यूजर इंटरफेस पैनल से परिचित हो लें द्वारा शुरू करते हैं।
      नोट: यह अनुशंसित है पहली बार उपयोगकर्ताओं के यहाँ प्रारंभ करें 'मुखपृष्ठ पर प्रदान किए ट्यूटोरियल आकाशगंगा के बुनियादी सेट अप से परिचित करने के लिए उपयोग है कि ( https://github.com/nekrut/galaxy/wiki/Galaxy101-1 ) ।
    3. 'विश्लेषण होम दृश्य' जो भी आकाशगंगा पर स्टार्टअप स्क्रीन है तक पहुँचने के लिए शीर्ष लेख पैनल में पर 'का विश्लेषण करें डाटा' (चित्रा 2 ए) पर क्लिक करें।
      ध्यान दें: हैडर भी अन्य लिंक जिसका विवरण उन्हें उस पर माउस होवर करके देखा जा सकता घरों। शीर्ष लेख के ऊपरी दाहिने कोने में एक प्रगति बार है कि कार्यों (चित्रा 2 बी) के लिए उपयोग अंतरिक्ष पर नजर रखता है है।
    4. सीपर चाटना 'NGS: शाही सेना विश्लेषण' बाएं पैनल (चित्रा 2C) पर स्थित 'उपकरण मेनू' में काम सभी शाही सेना seq डेटा विश्लेषण के लिए आवश्यक उपकरणों का उपयोग करने की।
      नोट: 'उपकरण मेनू' सभी कार्यों कि आकाशगंगा प्रस्तावों कैटलॉग। यह मेनू कार्यों पर और किसी भी एक वह सब कार्य को पूरा करने के लिए आवश्यक उपकरणों की एक सूची खुल जाएगा पर क्लिक के आधार पर बांट रही है।
    5. सही (चित्रा 2 ई) पर 'इतिहास' पैनल के शीर्ष पर गियर आइकन पर क्लिक करके नए विश्लेषण इतिहास बनाएँ। चुनें पॉप-अप मेनू से विकल्प 'नई बनाएँ'। इस 'इतिहास' विश्लेषण की पहचान के लिए एक उपयुक्त नाम दें।
      नोट: 'इतिहास' पैनल सभी सभी उत्पादन फ़ाइलों को आकाशगंगा पर चल रहे कार्यों के द्वारा उत्पन्न कर रहे हैं और साथ ही विश्लेषण के लिए अपलोड की गई फ़ाइलों को दर्शाता है। इस पैनल में एक फ़ाइल नाम पर क्लिक किया जाता काम के बारे में विस्तृत जानकारी के साथ एक संवाद बॉक्स खुल जाता हैऔर डाटासेट (चित्रा 2F) का एक टुकड़ा। इस बॉक्स में प्रतीक 'दृश्य' के लिए उपयोगकर्ता को सक्षम, 'विशेषताओं को संपादित' या 'नष्ट' डाटासेट (चित्रा 2F, नीले रंग में हाइलाइट)। साथ ही, उपयोगकर्ता कर सकते हैं भी 'संपादन' डाटासेट टैग या एनोटेशन (चित्रा 2F, बैंगनी में प्रकाश डाला), 'डाउनलोड' डेटा, कार्य की 'विवरण देखें', 'फिर से दौड़ना' कार्य या यहाँ तक कि 'कल्पना' इस से डाटासेट संवाद बॉक्स (चित्रा 2F, लाल रंग में हाइलाइट)।
    6. कच्चे fastq फ़ाइलों को अपलोड करने के लिए 'ToolsMenu' में 'डेटा प्राप्त' के अंतर्गत 'फ़ाइल अपलोड करें' समारोह पर क्लिक करें।
      नोट: इस या किसी अन्य उपकरण पर क्लिक करने से बीच 'विश्लेषण इंटरफेस' पैनल में ऑपरेशन का एक संक्षिप्त विवरण, और परीक्षण ही, को खोलता है। यह पैनल एक साथ लेसबाएं पैनल और सही 'इतिहास' पैनल से 'इनपुट फ़ाइलें' (चित्रा 2 ई) से 'उपकरण'। इधर, 'इतिहास' से इनपुट फ़ाइलों का चयन किया जाता और अन्य पैरामीटर दिए गए कार्य को चलाने के लिए परिभाषित किया। हर परीक्षण से परिणामी उत्पादन डाटासेट 'इतिहास' में वापस आ गया सहेजा गया है। 'विश्लेषण इंटरफेस "पैनल में परीक्षण के साथ सभी मापदंडों सभी आउटपुट फाइलों उपकरण द्वारा उत्पन्न की एक विस्तृत सूची के साथ-साथ किसी दिए गए उपकरण को चलाने के लिए उपलब्ध के लिए स्पष्टीकरण शामिल हैं।
    7. बाद काम 'विश्लेषण इंटरफेस' में खुलता है, 'स्थानीय फ़ाइल चुनें' पर क्लिक करें या (तेज अपलोड) 'एफ़टीपी फ़ाइल चुनें', अनुक्रमण फ़ाइलें फ़ोल्डर में नेविगेट और उचित डाटासेट अपलोड करने की का चयन करें।
    8. अपलोड की गई फ़ाइल प्रकार (डिफ़ॉल्ट सेटिंग) 'का स्वत: पता' के लिए आकाशगंगा की अनुमति दें। चुनें 'सी एलजीनोम के लिए पुल डाउन मेनू में Egans '।
    9. 'प्रारंभ करें' पर क्लिक करें डेटा अपलोड आरंभ करने के लिए। एक बार जब फ़ाइल को अपलोड किया जाता है, यह 'इतिहास' पैनल में सहेज लिया जाएगा और वहां से पहुँचा जा सकता है।
    10. कई अनुक्रमण डेटा फ़ाइलों को एक भी नमूने के लिए उत्पादन किया जाता है, तो उन्हें 'जुटना' उपकरण का उपयोग गठबंधन। ऐसा करने के लिए, 'उपकरण मेनू' में 'टेक्स्ट में फेरबदल' विकल्प को खोलने के।
    11. 'जुटना' टूल पर क्लिक करें, फ़ाइलें 'विश्लेषण इंटरफेस' के बीच में ड्रॉप-डाउन बॉक्स से संयुक्त और 'निष्पादित करें' पर क्लिक करें करने की आवश्यकता है चुनें।
      नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों fastq प्रारूप में उत्पन्न कर रहे हैं। मानचित्रण कार्यक्रम fastq फ़ाइल और जब कि सीमा समाप्त होने पर एक नया fastq फ़ाइल शेष दृश्यों के लिए उत्पन्न होता है प्रति 16,000,000 दृश्यों की एक सीमा होती है। '; जुटना 'उपकरण डेटासेट गठबंधन करने के लिए इस तरह के मामलों में की जरूरत है।
    12. नीचे पाया 'fastq groomer' उपकरण का उपयोग करके गैलेक्सी आरएनए Seq विश्लेषण के लिए आवश्यक fastqsanger प्रारूप पर अपलोड fastq प्रारूप फ़ाइलें कन्वर्ट 'NGS: क्यूसी और हेरफेर' अनुभाग (पूरक फ़ाइल देखें)।
    13. विकल्प 'दूल्हा के लिए फ़ाइल' के तहत उचित fastq डाटासेट चुनें और डिफ़ॉल्ट पैरामीटर का उपयोग कर उपकरण चलाएँ।
      नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों fastqsanger प्रारूप में उत्पन्न कर रहे हैं।
  2. fastqsanger डेटा गुणवत्ता नियंत्रण टेस्ट
    1. ': क्यूसी और हेरफेर NGS' 'उपकरण' मेनू में नीचे स्थित 'FastQC' उपकरण का उपयोग कर पढ़ता अपलोड fastqsanger की गुणवत्ता की जाँच करें।
    2. 'शोर के लिए ड्रॉप डाउन मेनू से तैयार fastqsanger डेटा फ़ाइल चुनेंटी वर्तमान पुस्तकालय 'से डेटा पढ़ने और डिफ़ॉल्ट पैरामीटर का उपयोग कर उपकरण चलाएँ।
      ध्यान दें: पढ़ता की गुणवत्ता और किसी भी अनुकूलक दृश्यों की उपस्थिति पर विशेष ध्यान दें। एडेप्टर आमतौर पर NGS प्रदाताओं द्वारा पोस्ट आरएनए Seq डाटा प्रोसेसिंग के हिस्से के रूप निकाल दिए जाते हैं लेकिन कुछ मामलों में, पीछे छोड़ दिया जा सकता है। गुणवत्ता मानकों का स्पष्टीकरण के लिए के लिए जाना http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
    3. NGS प्रदाता से संपर्क करें और अगर एडाप्टर मौजूद हैं, उन लोगों से 'क्लिप' उपकरण का उपयोग ट्रिम 'NGS: क्यूसी और हेरफेर' कार्य मेनू।
      नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों कच्चे txt प्रारूप में और साथ ही एचटीएमएल किसी भी वेब ब्राउज़र पर खोला जा सकता है कि में उत्पन्न कर रहे हैं।
  3. टक्सेडो सुइट के साथ डेटा विश्लेषण
    1. लंबा टोप
      1. के नवीनतम संस्करण को डाउनलोड करें fasta और GTF (जीन स्थानांतरण स्वरूप) फ़ाइल अपलोड करें से फाइल '2.2.6 में वर्णित है।
      2. खोलें 'NGS: शाही सेना विश्लेषण' अनुभाग और मैप करने के लिए अनुक्रमण डाउनलोड किया संदर्भ जीनोम को पढ़ता है 'Tophat' उपकरण पर क्लिक करें।
      3. सवाल का ड्रॉपडाउन सूची से उपयुक्त उत्तर का चयन करें 'इस एकल-अंत या बनती अंत डेटा है?'
      4. उचित fastq फ़ाइल चुनें।
      5. का चयन अगले ड्रॉपडाउन मेनू में 'इतिहास से एक जीनोम का उपयोग करें' और संदर्भ जीनोम कदम 2.4.1.1 में डाउनलोड करें चुनें।
      6. अन्य पैरामीटर के लिए 'डिफ़ॉल्ट' का चयन करें और 'निष्पादित करें' पर क्लिक करें।
        नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फाइलों के अलावा, 'स्वीकृत हिट्स' फ़ाइल बाद के चरणों के लिए प्रयोग किया जाता है।
    2. कफ़लिंक और Cuffmerge
      1. चुनें 'गिरफ्तारNGS लिंक 'में उपकरण': टेप इकट्ठा करने के लिए शाही सेना विश्लेषण 'अनुभाग, उनकी बहुतायत और अंतर अभिव्यक्ति के लिए परीक्षण का अनुमान है।
      2. पहले ड्रॉपडाउन मेनू में, मैप किए गए 'स्वीकृत हिट (BAM प्रारूप)' फ़ाइल Tophat विश्लेषण से प्राप्त चुनें।
      3. दूसरा ड्रॉपडाउन मेनू में, GTF कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल के संदर्भ में व्याख्या की स्थापना की।
      4. 'पूर्वाग्रह सुधार प्रदर्शन' विकल्प के लिए 'हाँ' चुनें और अन्य सभी मापदंडों के लिए डिफ़ॉल्ट सेटिंग का उपयोग काम चलाते हैं।
        नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फाइलों के अलावा, 'स्वीकृत नकल' फ़ाइल बाद के चरणों के लिए प्रयोग किया जाता है।
      5. में ओपन 'Cuffmerge' उपकरण 'NGS: शाही सेना विश्लेषण' 'एसेंबल किया प्रतिलेख' का उत्पादन करने के लिए सभी आरएनए Seq नमूने विलय करने के लिए।
        नोट: उपकरण स्वयं भरता है और सूचियों में पहले बॉक्स सभी कफ़लिंक द्वारा उत्पादित फ़ाइलों।
      6. जांच की सभी उपभेदों / स्थिति, एक ही तनाव / हालत के जैविक प्रतिकृति (जैविक प्रतिकृति के लिए चर्चा देखें) सहित के लिए 'एसेंबल किया प्रतिलेख' फ़ाइल का चयन करें।
      7. 'उपयोग संदर्भ एनोटेशन' के लिए 'हां' का चयन करें और GTF कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल का चयन करें।
      8. निम्नलिखित बॉक्स में, फिर से 'का प्रयोग करें सेक्ेनस दाटा' विकल्प के लिए 'हां' का चयन करें और पूरे जीनोम fasta कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल का चयन करें।
      9. डिफ़ॉल्ट के रूप में अन्य पैरामीटर रखते हुए, 'निष्पादित करें' पर क्लिक करें।
        नोट: Cuffmerge एक भी GTF आउटपुट फ़ाइल उत्पन्न करता है।
    3. Cuffdiff
      1. में 'Cuffdiff' उपकरण पर नेविगेट करें 'NGS: शाही सेना विश्लेषण' अनुभाग। 'नकल' मेनू में, Cuffmerge से मर्ज किए गए आउटपुट फ़ाइल का चयन करें।
      2. लेबलस्थिति 1 और 2 दो उपभेदों / हालत नाम के साथ।
        ध्यान दें: Cuffdiff दो से अधिक उपभेदों या शर्तों के साथ-साथ समय बेशक प्रयोगों के बीच तुलना कर सकते हैं। सीधे शब्दों में आवश्यकतानुसार प्रत्येक नए उपभेदों / हालत जोड़ने के लिए 'नई शर्तों जोड़ें' विकल्प का उपयोग करें।
      3. प्रत्येक तनाव / हालत, 'प्रतिकृति' का चयन अलग-अलग 'स्वीकार किए जाते हैं हिट्स' Tophat से उत्पादन फ़ाइलें जो कि तनाव / हालत के विभिन्न जैविक प्रतिकृति के अनुरूप के तहत के लिए। 'Cmd' कुंजी दबाए रखें, Macintosh कंप्यूटर 'Ctrl' कुंजी का उपयोग कर, और, अगर एक पीसी का उपयोग कर, एकाधिक फ़ाइलों का चयन करने के लिए है।
      4. डिफ़ॉल्ट पैरामीटर के रूप में अन्य सभी विकल्पों को छोड़ दें। काम चलाने के लिए 'निष्पादित करें' पर क्लिक करें।
        नोट: Cuffdiff आरएनए Seq विश्लेषण के अंतिम रीडआउट के रूप में एक तालिका प्रारूप में कई उत्पादन फ़ाइलें उत्पन्न करता है। ये (टेप, जीन के लिए FPKM ट्रैकिंग के साथ फ़ाइलों संयुक्त शामिल) एक जीन पहचान साझा करने टेप, प्राथमिक टेप और कोडिंग दृश्यों के FPKM मूल्यों। उत्पन्न सभी डेटा फ़ाइलों को किसी भी स्प्रेडशीट अनुप्रयोग पर देखा जा सकता है और इस तरह के जीन नाम, ठिकाना रूप में इसी तरह गुण होते हैं, उपभेदों / स्थिति के बीच तुलना, पी मूल्य और q मान सहित पर परिवर्तन (log2 पैमाने में) और साथ ही सांख्यिकीय आंकड़ों गुना। इन फ़ाइलों में डेटा मतभेद के सांख्यिकीय महत्व के आधार पर या जीन अभिव्यक्ति में परिवर्तन गुना (परिमाण और परिवर्तन की दिशा, उर्ध्वप्रवाह में के रूप में या डाउन- विनियमित जीन) क्रमबद्ध किया जा सके और उपयोगकर्ताओं की आवश्यकताओं के अनुसार चालाकी से। विभिन्न जीन पहचानकर्ता के बीच रूपांतरण की जरूरत है (जैसे, Wormbase जीन आईडी बनाम cosmid संख्या), Biomart (पर उपलब्ध उपकरणों http://www.biomart.org/ ) उपयोग किया जा सकता।

3. जीन आंटलजी (GO) टर्म विश्लेषण डेविड का उपयोग कर

  1. वेबसाइट ज से पहुंच डेविडttps: //david.ncifcrf.gov/। वेबपेज के शीर्षक में 'प्रारंभ विश्लेषण' पर क्लिक करें। में 'चरण 1', कॉपी और पेस्ट बॉक्स ए में आकाशगंगा से प्राप्त जीन की सूची 'चरण 2' का चयन करें 'Wormbase जीन आईडी' में इनपुट जीन के लिए पहचानकर्ता के रूप में।
    नोट: डेविड सबसे सार्वजनिक रूप से उपलब्ध एनोटेशन श्रेणियों पहचानता है, इसलिए अन्य जीन पहचानकर्ता (जैसे Entrez जीन आईडी या जीन प्रतीक के रूप में) का भी इस्तेमाल किया जा सकता है।
  2. 'चरण 3' में, 'जीन सूची' (जीन का विश्लेषण किया जाए) के तहत 'सूची प्रकार' चुनते हैं और फिर 'सबमिट सूची' आइकन पर क्लिक करें।
    नोट: 'विश्लेषण जादूगर', सभी हाइपरलिंक डेविड उपकरण है कि अपलोड जीन सूची पर चलाया जा सकता है (चित्रा 3) सूची खुल जाएगा। उपयोगकर्ता की आवश्यकता के अनुसार प्रासंगिक इसी मॉड्यूल का उपयोग करने के लिए इन लिंक पर क्लिक करें। उपकरण दिए गए कार्य के लिए उपयुक्त की पहचान करने के लिए, पर क्लिक करें 'कौन सा डेविड उपकरणों का उपयोग करने? 'लिंक पर ; विश्लेषण जादूगर 'पृष्ठ। शीर्षक में 'प्रारंभ विश्लेषण' लिंक पर क्लिक करें विश्लेषण के दौरान किसी भी बिंदु पर 'विश्लेषण जादूगर' के मुख पृष्ठ पर वापस जाने के लिए।

चित्र तीन
चित्र 3: डेविड विश्लेषण जादूगर वेबपेज और ऑपरेशन आउटपुट के उदाहरण के लेआउट। 'विश्लेषण जादूगर' वेब उपयोगकर्ता इंटरफ़ेस विभिन्न मापदंडों के आधार संवर्धन के लिए अपलोड की गई जीन सूची का विश्लेषण करने के लिए इस्तेमाल उपकरण सूचीबद्ध करता है। इन उपकरणों पर क्लिक करने से एक नया वेब पेज में विश्लेषण डेटा की रिपोर्ट। 'जीन कार्यात्मक वर्गीकरण', 'कार्यात्मक एनोटेशन चार्ट' और 'कार्यात्मक एनोटेशन क्लस्टरिंग' से उत्पन्न सारणीबद्ध रिपोर्टों के उदाहरण के रूप में सन्निवेश वाली (तीर) दिखाए जाते हैं।> यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

  1. कार्यात्मक एनोटेशन टूल 1: कार्यात्मक एनोटेशन क्लस्टरिंग
    1. सारांश पृष्ठ पर जाने के लिए 'कार्यात्मक एनोटेशन क्लस्टरिंग' मॉड्यूल पर क्लिक करें। डिफ़ॉल्ट एनोटेशन श्रेणियों रखें और ऐसी ही कोई टिप्पणी उनके संवर्धन स्कोर की श्रेणी में रखा शर्तों के समूहों उत्पन्न करने के लिए 'कार्यात्मक एनोटेशन क्लस्टरिंग' पर क्लिक करें।
    2. प्रत्येक शब्द का हाइपरलिंक नाम पर क्लिक करें यह और 'आर टी' (संबंधित शब्दों) इसी तरह की अन्य श्रेणी से संबंधित शब्दों को सूचीबद्ध करने के बारे में विवरण को पढ़ने के लिए।
    3. एक शब्द है और लाल 'जी' सब एक क्लस्टर के भीतर सभी शर्तों के साथ जुड़े जीन सूची के साथ जुड़े जीन सूची बैंगनी पट्टी पर क्लिक करें।
    4. सभी जीन और एक क्लस्टर में पदों की एक दो आयामी दृश्य देखने के लिए हरे रंग के आइकन पर क्लिक करें।
      नोट: पिछले तीन स्तंभों की सूची प्रत्येक के लिए विश्लेषणात्मक और सांख्यिकीय परिणामअवधि। इस के लिए परिणाम और अन्य सभी एनालिटिक्स 'फ़ाइल डाउनलोड' लिंक पर क्लिक करके एक .txt प्रारूप में डाउनलोड किया जा सकता है।
  2. कार्यात्मक एनोटेशन टूल 2: कार्यात्मक एनोटेशन चार्ट
    1. सारांश पृष्ठ पर लौटें और काफी overrepresented जैविक शर्तों (जैसे प्रतिलेखन कारक गतिविधि या काइनेज गतिविधि) जीन सूची से संबद्ध पहचान करने के लिए 'कार्यात्मक एनोटेशन चार्ट' पर क्लिक करें।
    2. अवधि नाम पर क्लिक करें अधिक विस्तृत जानकारी और 'आर टी' (संबंधित शब्दों) अन्य संबंधित शब्दों की सूची को पाने के लिए।
    3. व्यक्तिगत श्रेणी इसी के सभी संबद्ध जीन सूची बैंगनी पट्टी पर क्लिक करें।
      ध्यान दें: अंतिम दो कॉलम प्रत्येक श्रेणी के लिए सूची सांख्यिकीय परीक्षण 'का परिणाम है।
  3. कार्यात्मक एनोटेशन उपकरण 3: कार्यात्मक एनोटेशन टेबल
    1. सारांश पृष्ठ पर लौटें और 'कार्यात्मक पर क्लिक करेंएनएएल एनोटेशन टेबल 'सब किसी भी सांख्यिकीय गणनाओं के बिना एक सूची पर जीन के साथ जुड़े एनोटेशन की एक सूची देखने के लिए।
      ध्यान दें: यह उपकरण एक सूची के जीन-दर-जीन विश्लेषण के लिए उपयोगी हो सकता है या विशिष्ट, अत्यधिक दिलचस्प जीन को देखने के लिए।
  4. जीन कार्यात्मक वर्गीकरण उपकरण
    1. 'विश्लेषण जादूगर' के लिए वापस जाएँ और उनके 'संवर्धन स्कोर', सूची में जीन समूह के समग्र संवर्धन का एक उपाय के अनुसार के रूप में स्थान जीन की कार्यात्मक रूप से संबंधित समूहों में इनपुट जीन सूची अलग करने के लिए 'जीन कार्यात्मक वर्गीकरण' मॉड्यूल पर क्लिक करें।
    2. जीन समूह के कार्यात्मक संबंधित जीन प्रकट करने के लिए अधिक विस्तृत जानकारी और 'आरजी' प्राप्त करने के लिए अवधि नाम पर क्लिक करें
    3. जुड़े जीव विज्ञान और सभी जीनों और पदों की एक दो आयामी दृश्य देखने के लिए हरे रंग के आइकन सूची लाल 'टी' (शब्द रिपोर्ट) पर क्लिक करें।
  5. जीन-नामबैच व्यूअर
    1. 'विश्लेषण जादूगर' के लिए वापस जाएँ और उनके इसी जीन नाम में 'Wormbase जीन आईडी' का अनुवाद करने में 'जीन-नाम बैच व्यूअर' पर क्लिक करें। (WBGene00022855 = tcer -1)।
    2. अधिक जीन-विशिष्ट जानकारी प्राप्त करने के लिए जीन नाम पर क्लिक करें।
    3. 'आरजी' पर क्लिक करें (संबंधित जीन) प्रत्येक जीन के बगल में जीन प्रकट करने के लिए लिंक कार्यात्मक हित के जीन से संबंधित होने की भविष्यवाणी की।

एन सी बी आई अनुक्रम पढ़ें आर्काइव पर 4. अपलोड हो रहा है कच्चे डेटा (एसआरए)

  1. साइन में एसआरए वेबपेज तक पहुँचने के एन सी बी आई 'क्लिक करने के लिए या एक नया खाता रजिस्टर।
  2. 'Bioproject' पर क्लिक करें।
  3. 'का उपयोग Bioproject' बाईं तरफ के शीर्षक के अंतर्गत 'प्रस्तुत' पर क्लिक करें।
  4. विकल्प 'नई प्रस्तुत' का चयन करें। सबमिटर का ब्यौरा अपडेट। शेष सात टैब के माध्यम से जारी रखें, प्रयोग और डेटा के विवरण में भरने अपलोड किया जा रहा। 'सबमिट' क्लिक जब पूरा किया।
    नोट: पांचवें 'Biosample' टैब में, 'Biosample' खाली के लिए स्लॉट छोड़ दें।
  5. 'मेरे सबमिशन' लिंक पर क्लिक करके प्राप्त होने वाले पृष्ठ ताज़ा करें। सबमिट किए गए डेटा एक नियत प्रस्तुत नंबर, संक्षिप्त विवरण और अपलोड स्थिति के साथ सूचीबद्ध किया जाएगा।
  6. इस पेज के शीर्ष पर 'Biosample' पर क्लिक करें, 'एक नया प्रस्तुत करने शुरू' बॉक्स में और एक 'नया प्रस्तुत' पैदा करते हैं। प्रत्येक नमूने के लिए अलग से प्रस्तुतियाँ जमा करें।
  7. 4.4 में 'Bioproject' के साथ मामले में, सबमिटर के विवरण को अद्यतन और टैब प्रत्येक टैब के विवरण में भरने के बाकी के माध्यम से जारी है। एक बार जब समीक्षा पूरी कर ली और क्लिक 'सबमिट'।
  8. पर नेविगेट करें http: //www.ncbi.nlm.nih.gov / एसआरए अंतिम 'अनुक्रम पढ़ें आर्काइव (एसआरए)' प्रस्तुत बनाने के लिए।
  9. के तहत 'प्रारंभ करना' 'एसआरए के लिए लॉग इन' पर क्लिक करें।
  10. अगले पृष्ठ पर 'एन सी बी आई पीडीए' लिंक पर क्लिक करें। एक 'अद्यतन प्राथमिकताएं' लिंक खुल जाएगा। फ़ॉर्म को पूरा करें और क्लिक 'प्राथमिकताएं सहेजें'।
  11. वाले पृष्ठ पर, 'नया बनाएँ प्रस्तुत' लिंक पर क्लिक करें। 'उपनाम' के तहत एक उपयुक्त नाम दर्ज करें और 'सहेजें' पर क्लिक करें। प्रस्तुत आईडी और अन्य विवरण के साथ एक मेज बनाया जाएगा।
  12. पर 'नया प्रयोग' पर क्लिक करें और प्रत्येक 'BioSample' के लिए रजिस्टर कम से कम एक अद्वितीय अनुक्रमण पुस्तकालय।
  13. यह निर्दिष्ट और लिंक 'BioProject' पहले बनाया था और 'BioSample' प्रस्तुत पहचान पत्र। ए 'नया प्रयोग' बनाया जाएगा।
  14. पृष्ठ के तल पर 'नई भागो' पर क्लिक करेंबाद एसआरए प्रयोग किया जाता और डेटा फ़ाइलों को इससे जुड़े होने की जरूरत है कि पहचान की गई है।
  15. प्रत्येक डेटा फ़ाइल का MD5 योग की गणना करें। किसी Macintosh टर्मिनल पर ऐसा करने के लिए आवेदन / उपयोगिताओं / टर्मिनल पर जाएँ। टर्मिनल में, 'md5 (उद्धरणों के बिना) में टाइप फिर एक रिक्ति। खींचें और फ़ाइलों खोजक से टर्मिनल में अपलोड की गई और 'Enter' क्लिक करने की जरूरत है ड्रॉप।
  16. टर्मिनल अल्फानुमेरिक MD5 योग वापस आ जाएगी। फ़ाइल अपलोड करने के लिए प्रस्तुत करने की प्रक्रिया के हिस्से के रूप में इस डालें। FTP का उपयोग करके फ़ाइलों को अपलोड करने यूज़रनेम और पासवर्ड प्रणाली द्वारा प्रदान का उपयोग करें।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

सी.एलेगन्स में, germline स्टेम सेल (GSCs) उम्र फैली हुई है, के उन्मूलन तनाव लचीलापन बढ़ाता है, और शरीर में वसा 24, 28 उठ। GSCs न लगना, या तो लेजर पृथक से या इस तरह के जीएलपी -1 के रूप में म्यूटेशन के कारण पैदा हुए, प्रतिलेखन के एक नेटवर्क के कारकों 29 के सक्रियण के माध्यम से जीवन काल विस्तार का कारण बनता है। एक ऐसा ही पहलू, TCER -1, मानव प्रतिलेखन बढ़ाव और स्प्लिसिंग कारक, TCERG1 30 कीड़ा homolog encodes। निम्नलिखित प्रतिनिधि परिणाम दर्शाते हैं कि कैसे आरएनए Seq जीन जिसका अभिव्यक्ति TCER -1 / TCERG1 से ठीक किया जाता है हमारे हाल ही में प्रकाशित एक अध्ययन 31 में germline हानि निम्नलिखित की पहचान के लिए इस्तेमाल किया गया था। की transcriptomes उम्र से मिलान, दिन जीएलपी -1 और tcer -1 के 2 वयस्क; जीएलपी -1 उत्परिवर्ती तुलना में किया गया था। प्रत्येक तनाव के लिए, mRNA दो जैविक प्रतिकृति से पृथक किया गयाट (चार नमूने पूरी तरह से) प्रोटोकॉल में खंड 1. शाही सेना के नमूने वर्णित का उपयोग कर एक व्यावसायिक सेवा प्रदाता है कि चार नमूनों से सीडीएनए पुस्तकालयों तैयार और 50 बीपी एकल अंत अनुक्रमण प्रदर्शन के लिए भेज दिया गया था। खंड 2.1 में वर्णित के रूप में कच्चे NGS डेटा डाउनलोड किया गया था।

पोस्ट अनुक्रमण डेटा मूल्यांकन

तालिका 1 परीक्षण के परिणाम का एक संकलन के कच्चे अनुक्रमण पढ़ता गुणवत्ता का आकलन है। 'FASTQ' गुणवत्ता की जांच विश्लेषण पर प्रकाश डाला गया कोई 'खराब गुणवत्ता' के साथ पठित दृश्यों की संख्या 48-49% जीसी सामग्री और एक निरंतर अनुक्रम 51 बीपी के पढ़ लंबाई के साथ पढ़ता है। यह कदम भी इस तरह के Kmer सामग्री के रूप में कई अन्य सुविधाओं के लिए अनुक्रमण डेटा की जाँच करता है और सामूहिक रूप से कुल 11 परीक्षण से बना है। सी.एलेगन्स जीनोम ~ 100 MBP है। अनुक्रमण की संख्या के आधार पर प्रत्येक नमूने कि जीनोम को मैप किया, जी से पढ़ताenome कवरेज (अंतिम स्तंभ) लैंडर / वाटरमैन समीकरण 'सी = एल.एन. / जी', जिसमें, सी कवरेज के लिए खड़ा है का उपयोग कर अनुमान लगाया गया था, जी अगुणित जीनोम लंबाई है, एल पढ़ने लंबाई है और एन पढ़ता की संख्या है। हम सभी चरणों के लिए डिफ़ॉल्ट पैरामीटर का उपयोग किया और 48 प्राप्त - सभी नमूनों में 49% जीसी सामग्री। देखा जा सकता है, जीनोम कवरेज के नमूनों में 11x को 9x के बीच था।

TCER -1 की पहचान / TCERG-1-विनियमित आकाशगंगा पर विभेदक जीन एक्सप्रेशन विश्लेषण द्वारा जीन

2.2 2.4 करने के लिए वर्गों में विस्तृत चरणों के माध्यम से, आकाशगंगा पाइपलाइन 3 जीन भिन्न जीएलपी -1 और tcer -1 के बीच व्यक्त की एक सूची प्राप्त करने के लिए इस्तेमाल किया गया, जीएलपी -1 उत्परिवर्ती। गैलेक्सी प्रत्येक तनाव के लिए दो प्रतिकृति से NGS डेटा गठबंधन करने के लिए हमें सक्षम है और अंतर विश्लेषण सारणीबद्ध फ़ाइलें उत्पन्न करने के लिए किया जीनोम विस्तृत अभिव्यक्ति जनसंपर्क पर प्रकाश डालाofile। परिमाण और कम से कम 0.05 की पी मूल्य में कम से कम एक गुना परिवर्तन की एक सीमा का उपयोग करना, 835 जीन है कि भिन्न दो उपभेदों के बीच व्यक्त किया गया की एक सूची 31 जनरेट किया गया था। विनियमित (476 नीचे जीन जिसका प्रतिलेखन जीएलपी -1 उत्परिवर्ती (359 उत्तर प्रदेश जीन जिसका प्रतिलेखन संभावना से बढ़ जाती है TCER -1 / TCERG1) या; सूची जीनों की अभिव्यक्ति tcer -1 में नीचे-विनियमित किया गया था कि क्या के आधार पर विभाजित किया गया था संभावना TCER -1 / TCERG1 द्वारा दमित है) जीएलपी -1 (चित्रा 4) की तुलना में।

चित्रा 4
चित्र 4: आकाशगंगा (ए) और डेविड (बी) के परिणाम का विश्लेषण करती है: जर्मलाइन कम सी में TCER -1 / TCERG1 विनियमित जीन की पहचान का उपयोग कर शाही सेना Seq म्यूटेंट एलिगेंस। (ए) की तुलना आरएनए Seq डेटा की विभेदक जीन अभिव्यक्ति विश्लेषणजीएलपी -1 और tcer -1 के transcriptomes; जीएलपी -1 835 जीनों की कुल, जिनमें से 359 TCER -1 / TCERG1 (उत्तर प्रदेश) द्वारा विनियमित किया जा रहा के रूप में पहचान की गई और 476 के रूप में TCER -1 द्वारा नीचे विनियमित झुकेंगे / TCERG1 (नीचे)। (बी) TCER -1 / TCERG1 डेविड का उपयोग कर लक्ष्य के रूप में पहचान की जीन की 'कार्यात्मक एनोटेशन क्लस्टरिंग' विश्लेषण के परिणाम। दोनों विनियमित (उत्तर प्रदेश) और नीचे विनियमित (नीचे) TCER -1 / TCERG1 लक्ष्यों की वर्गों के लिए जैविक प्रक्रियाओं का प्रतिशत संवर्धन। ग्राफिक यहाँ दिखाया गया है समृद्ध जीन समूह (X- अक्ष) और उनके संबंधित प्रतिशत संवर्धन (Y- अक्ष) डेविड विश्लेषण के उत्पादन के रूप में प्राप्त की साजिश रचने के द्वारा प्राप्त की है। अमृत एट अल से संशोधित चित्रा। 31 और अनुमति के साथ reproduced। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

TCER -1 / TCERG1 लक्ष्यों में समृद्ध जीन वर्गों के एक सिंहावलोकन प्राप्त करने के लिए, हम डेविड का उपयोग कर जीन सत्तामीमांसा (GO) अवधि विश्लेषण किया। TCER -1 / उत्तर प्रदेश TCERG1 विनियमित और नीचे जीन सूचियों डेविड पर स्वतंत्र रूप से अपलोड की गई और खंड में वर्णित के रूप में 3. छोटे जीन और कोशिकीय प्रक्रियाओं TCER -1 / TCERG1 पहले 30 द्वारा लक्षित के बारे में जाना जाता था विश्लेषण किया गया है, तो हम डेविड पाया विश्लेषण विशेष रूप से खुलासा और सहायक हो। उत्तर प्रदेश जीन की कार्यात्मक एनोटेशन विश्लेषण> 1.3 के संवर्धन स्कोर, उच्चतम साइटोक्रोम P450 एंजाइम-एन्कोडिंग जीन और जीनोबायोटिक प्रतिक्रिया जीन, लिपिड संशोधनों में फंसाया जीन द्वारा पीछा सहित के साथ पांच एनोटेशन क्लस्टर का पता चला। यह है कि पहचान समूहों समान molecula का श्रेय जीन कार्यात्मक वर्गीकरण विश्लेषण के परिणामों से प्रबलित किया गया थामहत्वपूर्ण संवर्धन स्कोर के साथ आर गतिविधियों। स्प्रेडशीट का उपयोग करना, पहचान समूहों उनके संबंधित संवर्धन स्कोर (चित्रा 4) के खिलाफ प्लॉट किए जाते थे। हमारे पिछले डेटा सुझाव दिया है कि TCER -1 / TCERG1 संरक्षित दीर्घायु प्रतिलेखन कारक, DAF -16 / FOXO3A साथ कार्य किया, GSC कम वयस्कों 30 दीर्घायु को बढ़ावा देने के। DAF -16 / FOXO3A, बारी में, हाल के अध्ययनों से 27, 32, 33 में लिपिड चयापचय modulating में फंसाया गया है। इस सबूत, और डेविड में संभावित TCER -1 / TCERG1 लक्ष्य के रूप में लिपिड चयापचय जीन और रास्ते की पहचान के आधार पर विश्लेषण करती है, हम विस्तृत यंत्रवत अध्ययनों के लिए शाही सेना Seq अध्ययन में पहचान की वसा चयापचय जीन पर जोर दिया। इस नेतृत्व, और बाद में आणविक, आनुवंशिक जैव रासायनिक, और कार्यात्मक प्रयोग के माध्यम से के बाद, हम दिखा दिया कि TCER -1 DAF -16 / FOXO3A के साथ / TCERG1 coordinately enhanदोनों लिपिड अपचयी और germline नुकसान 31 के जवाब में उपचय प्रक्रियाओं ced। इसी तरह, नीचे के कार्यात्मक एनोटेशन क्लस्टरिंग TCER -1 / TCERG1 cytoskeletal काम करता है, विकास, प्रजनन और उम्र बढ़ने के सकारात्मक नियमन के लिए समृद्ध एनोटेशन क्लस्टर पहचान लक्ष्य (चित्रा 4)। इन टिप्पणियों, और हमारे समर्थन प्रयोगात्मक सबूत बताते हैं कि germline नुकसान पर, TCER -1 / TCERG1 भी दैहिक कोशिकाओं में वृद्धि और प्रजनन शरीर क्रिया विज्ञान के साथ ही विरोधी दीर्घायु जीन 31 की अभिव्यक्ति represses।

नमूना कुल दृश्यों लंबाई % जीसी कुल पढ़ता है (आकाशगंगा) मैप किए गए रीड के लिए (आकाशगंगा) जीनोम कवरेज
जीएलपी -1 4000000 51 49 20700539 ~ 16,000,000 11x
जीएलपी -1; tcer -1 4000000 51 49 18055444 ~ 13,000,000 9x
जीएलपी -1 4000000 51 48 18947463 ~ 14,000,000 10x
जीएलपी -1; tcer -1 4000000 51 48 13829643 ~ 10,000,000 7x

तालिका 1: शाही सेना Seq नमूना विवरण। कच्चे डेटा विशेषताओं के संकलन का मूल्यांकन के बाद अनुक्रमण अनुक्रमण रन की सफलता की पुष्टि करने के लिए। प्रतिनिधि प्रयोग से अनुक्रमण डेटा, दो जैविक शर्तों के होते हैं एक नियंत्रण तनाव (जीएलपी -1 (tcer -1, जीएलपी -1) दो जैविक प्रत्येक के लिए अनुक्रम प्रतिकृति के साथ। 49% जीसी सामग्री और 51bp की एक निरंतर अनुक्रम पढ़ लंबाई - 'FastQC' गुणवत्ता की जांच विश्लेषण नहीं "खराब गुणवत्ता" पढ़ता है, 48 के साथ पठित दृश्यों की संख्या पर प्रकाश डाला गया। संशोधित और अमृत एट अल से अनुमति के साथ reproduced। 31।

पूरक फ़ाइल: संक्षिप्त में कमान श्रृंखला उपकरणों के लिए शाही सेना Seq डेटा विश्लेषण के लिए गैलेक्सी पाइप लाइन पर चलते हैं। इस फाइल को डाउनलोड करने के लिए यहां क्लिक करें।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

आधुनिक जीव विज्ञान में आकाशगंगा अनुक्रमण मंच का महत्व

आकाशगंगा परियोजना की प्रक्रिया और एक तेज और कुशल तरीके से उच्च throughput अनुक्रमण डेटा का विश्लेषण करने जैव सूचना विज्ञान प्रशिक्षण के बिना जीव की मदद करने में महत्वपूर्ण भूमिका निभाई हो गया है। एक बार एक अत्यंत कठिन कार्य माना जाता है, इस सार्वजनिक रूप से उपलब्ध मंच जटिल जैव सूचना विज्ञान एल्गोरिदम चल NGS डेटा एक, सरल, विश्वसनीय, और आसान प्रक्रिया का विश्लेषण करने के लिए बनाया गया है। इसके अलावा जैव सूचना विज्ञान उपकरण की एक विस्तृत श्रृंखला की मेजबानी से, आकाशगंगा के लिए सफलता की कुंजी भी अपने यूजर इंटरफेस की सादगी है कि एक सहज और निर्बाध ढंग से जटिल अनुक्रमण विश्लेषण के विभिन्न पहलुओं को एक साथ लेस है। इन सुविधाओं के कारण, आकाशगंगा पाइपलाइन जीव के बीच व्यापक उपयोग हासिल कर ली है, सी.एलेगन्स शोधकर्ताओं भी शामिल है। शाही सेना Seq विश्लेषण पाइपलाइन के साथ उपयोगकर्ता परिचित के अलावा, आकाशगंगा भी नींव रखना बुनियादी जीव समझ के लिए मदद करता हैडेटा विश्लेषण की अवधारणा और इसमें शामिल उपकरण को समझते हैं। यह ज्ञान उपयोगकर्ता primes आगे शायद इस तरह के 'आर' और 'अजगर' के रूप में और अधिक जटिल जैव सूचना विज्ञान प्लेटफार्मों आगे बढ़ाने के लिए। आकाशगंगा के अलावा, अन्य उपकरण और संकुल व्यावसायिक रूप से और खुला स्रोत समाधान है, जो शाही सेना Seq विश्लेषण के लिए इस्तेमाल किया जा सकता के रूप में उपलब्ध हैं। वाणिज्यिक विकल्प स्टैंड-अलोन अक्सर कर रहे हैं सॉफ्टवेयर संकुल है कि उपयोगकर्ता के अनुकूल हैं, लेकिन अलग-अलग शोधकर्ताओं NGS अक्सर उपयोग नहीं करते के लिए महंगा हो सकता है। वैकल्पिक रूप से, इस तरह के BioWadrobe 34 के रूप में खुला स्रोत प्लेटफार्मों और ArrayExpressHTS 35 कमांड लाइन और चल स्क्रिप्ट, जो गैर bioinformaticians के लिए महत्वपूर्ण चुनौतियां खड़ी की कार्यसाधक ज्ञान की आवश्यकता है। इसलिए, आकाशगंगा एक लोकप्रिय और अत्यावश्यक संसाधन बनी हुई है।

प्रोटोकॉल के भीतर महत्वपूर्ण चरणों

आकाशगंगा और डेविड की सरल फायदे होते हुए भी, एक सफल आरएनए Seq प्रयोग अभी भीसावधान डिजाइन और प्रयोगात्मक कदम के निष्पादन पर मौलिक रूप से निर्भर करता है। उदाहरण के लिए, यह आरएनए Seq द्वारा दो उपभेदों की तुलना से पहले आनुवंशिक एकरूपता सुनिश्चित करने के लिए है, और निर्धारित करने के लिए अगर वहाँ विकास दर में अंतर कर रहे हैं महत्वपूर्ण है। उम्र से मिलान उपभेदों से अलग शाही सेना के साथ-साथ महत्वपूर्ण है। इसी तरह, एक ही तनाव के भीतर जीन अभिव्यक्ति की परिवर्तनशीलता के लिए खाते, यह महत्वपूर्ण प्रत्येक तनाव के दो या अधिक 'जैविक प्रतिकृति' चलाने के लिए है। यह अनिवार्य रूप से बढ़ रही है और तनाव के कारण कटाई कीड़े, कम से कम twoindependent प्रयोगों में अनुक्रम किया जा रहा है, हालांकि तीन जैविक प्रतिकृति की सिफारिश की मानक है का मतलब है। गैलेक्सी कई जैविक प्रतिकृति से डेटा को एकीकृत इतना है कि उपभेदों के बीच सूचना दी जीन अभिव्यक्ति मतभेद बस 'के भीतर नमूना' परिवर्तनशीलता का एक परिणाम नहीं हैं।

एक महत्वपूर्ण डिजाइन निर्णय एकल अंत बनाम बनती अंत अनुक्रमण के उपयोग के बारे में है। साथ मेंएकल अंत अनुक्रमण, प्रत्येक खंड अनुक्रम है uni-दिशात्मक तो प्रक्रिया, तेजी से होता है सस्ता और ट्रांस्क्रिप्शनल रूपरेखा के लिए उपयुक्त है। बनती अंत अनुक्रमण में, एक बार टुकड़ा एक छोर से दूसरे करने के लिए अनुक्रम है, अनुक्रमण के दूसरे दौर के विपरीत दिशा में फिर से शुरू किया गया है। यह अधिक गहराई से डेटा और जीनोम के अतिरिक्त स्थिति की जानकारी प्रदान करता है, तो नए सिरे से जीनोम समूह, नए एसएनपी पहचान के लिए और epigenetic संशोधनों, विलोपन, सम्मिलन, और व्युत्क्रम की पहचान करने के लिए अधिक उपयुक्त है। इसी तरह, की कुल संख्या पढ़ता है और जीनोम पर्याप्त अंतर अभिव्यक्ति के अध्ययन के लिए आवश्यक कवरेज की सीमा संदर्भ निर्भर है। इस तरह के जीवाणु और कवक के रूप में छोटे जीनोम,, के लिए ~ 5 लाख पढ़ता पर्याप्त,, कीड़े में है, जबकि और मक्खियों ~ 10 लाख पढ़ता पर्याप्त कवरेज प्रदान करते हैं। इस तरह के चूहों और मनुष्य के रूप में बड़े जीनोम के साथ जीवों के लिए, 15-25 दस लाख पढ़ता आवश्यक सीमा है। इसके अलावा, पढ़ने संख्या और कवरेज के लिए, यह भी इम्प हैortant संदर्भ जीनोम को संरेखित कि NGS के सबसे पढ़ता है। के <70% पढ़ता एक संरेखण गरीब NGS या दूषित पदार्थ की उपस्थिति का संकेत है। कुल मिलाकर, सी के लिए शाही सेना Seq पढ़ाई एलिगेंस, तीन जैविक प्रतिकृति 50 बीपी यूनिडायरेक्शनल अनुक्रमण में ~ 10-15 मिलियन पढ़ता है जिसके परिणामस्वरूप और ~ प्रत्येक नमूने के लिए 5-10X जीनोम कवरेज का एक आदर्श उद्देश्य है साथ अनुक्रम।

आकाशगंगा का उपयोग कर में आसानी के बावजूद, कुछ बिंदुओं के लिए एक चिकनी और गड़बड़ मुक्त डेटा विश्लेषण अनुभव प्रदान करने के याद करने के लिए कर रहे हैं। उद्देश्य और उपयोग किए गए विभिन्न उपकरण के कामकाज की एक बुनियादी समझ है करने के लिए उपयोगकर्ता यह आवश्यक है। प्रत्येक आकाशगंगा उपकरण मापदंडों का चयन की आवश्यकता है और उपकरण को समझने के उपयोगकर्ता प्रयोग की आवश्यकता के आधार पर सेटिंग को अनुकूलित में मदद मिलेगी। गैलेक्सी सहायता पृष्ठों हर पैरामीटर समझाने और यह अनुशंसित है कि उपयोगकर्ता इन विवरणों का अवलोकन परीक्षण चर पर फैसला करने के लिए।

जीन सूची प्राप्त पीost आरएनए Seq विश्लेषण जब तक यह डेविड का उपयोग कर जैविक रूप से प्रासंगिक डेटा के लिए खनन किया जाता है केवल जीन की एक सूची है। यह एक महत्वपूर्ण व्यायाम है कि जैविक प्रक्रिया आधारित परिणामों में अलग-अलग जीन आधारित डेटा परिवर्तित करता है। शाही सेना Seq जीन सूची विभिन्न एनालिटिक्स डेविड प्रदान करता है का उपयोग कर तलाश इसलिए प्रोटोकॉल का एक अभिन्न और महत्वपूर्ण हिस्सा है।

संशोधन, समस्या निवारण और सीमाएं

NGS डेटा विश्लेषण के साथ एक आम गड़बड़ कार्य या परीक्षण है कि असफल, विशेष रूप से गुणवत्ता नियंत्रण चरणों में है। परीक्षण है कि FastQC एक नमूना पर चलता है की, कुछ ऊपर आ सकता है के रूप में विफल रहा है। बहरहाल, यह अनिवार्य रूप से नमूना fastq गुणवत्ता मानकों को पूरा नहीं करता है मतलब यह नहीं है। असफलता एक वैकल्पिक व्याख्या है कि ध्यान से पता लगाया जाना चाहिए हो सकता था।

उदाहरण के लिए, यदि 'प्रति आधार अनुक्रम सामग्री' परीक्षण में विफल रहता है (सुझाव दे जो 10% से अधिक अंतर नहीं हैकिसी भी स्थिति में अड्डों), oligodt पुस्तकालय तैयारी के लिए विधि की जाँच करें। पिछले काम से पता चला है Illumina NGS पुस्तकालयों परीक्षण विफल नमूना के कारण कुछ ठिकानों के लिए एक पूर्वाग्रह है करने के लिए अनुक्रम की जा रही 13 वीं आधार के लिए एक प्रवृत्ति हो सकती है। इसी तरह, 'Kmer सामग्री' परीक्षण की विफलता कभी कभी यादृच्छिक प्राइमरों की एक अधूरी नमूने के कारण तथ्य यह है कि यादृच्छिक भड़काना से प्राप्त पुस्तकालयों लगभग हमेशा शुरू में Kmer पूर्वाग्रह दिखाई देगा के लिए जिम्मेदार ठहराया जा सकता है। इसलिए, यह प्रयोग के भाग्य का निर्धारण करने से पहले इन और विश्लेषण पाइप लाइन में अन्य बाधाओं पर विचार करने के लिए महत्वपूर्ण है।

एक अन्य महत्वपूर्ण विशेषता यह है कि शाही सेना Seq डेटा विश्लेषण को प्रभावित कर सकते तेजी से और घातीय प्रगति कि NGS तरीकों और विश्लेषणात्मक सॉफ्टवेयर में घटित हो रहा है। आदर्श रूप में, एक एक समान जीन सूची दो पाइपलाइनों या एक ही पाइप के दो संस्करणों पर एक नमूना NGS डेटा का विश्लेषण करने से परिणाम की उम्मीदलाइन। हालांकि, जबकि लगातार सुधार एल्गोरिदम आरएनए Seq विश्लेषण में aberrations कम कर रहे हैं और अधिक सटीकता के जीन सूचियों का निर्माण, यह अक्सर असमानता की ओर जाता है। उदाहरण के लिए, एक ही टूलसेट के एक पुराने बनाम नए संस्करण का उपयोग काफी अलग जीन सूचियों का उत्पादन हो सकता एक नमूना NGS डेटा का विश्लेषण। एक मामूली भिन्नता उम्मीद है, लेकिन उन के बारे में पता भी कई विसंगतियां भी डिजाइन या प्रयोग के प्रदर्शन में कमजोरी को प्रतिबिंबित करता हो सकता है कि होना चाहिए।

सामूहिक रूप से, आकाशगंगा परियोजना और डेविड विश्लेषणात्मक उपकरणों रास्ता NGS डेटा जैविक रूप से प्रासंगिक जानकारी निकालने के लिए इस्तेमाल किया जा सकता बदल दिया है। यह वैज्ञानिक समुदाय के लिए स्वतंत्रता और जांच की पूरी तरह से नए स्तर पर खोला गया है, सी.एलेगन्स शोधकर्ताओं भी शामिल है। उदाहरण के लिए, अनुक्रमण के लगातार कम करने लागत बेहतर और तेज अनुक्रमण प्रौद्योगिकी के साथ मिलकर एक कीड़े के स्तर पर transcriptomics के युग में कायम कर रहे हैं,व्यक्तिगत कीड़ा ऊतकों और यहां तक ​​कि कुछ गिने-चुने कीड़ा कोशिकाओं। इन प्रयासों NGS डेटा में नाटकीय वृद्धि उत्पन्न किया जा रहा शामिल है। इस कार्यप्रवाह के विश्लेषणात्मक अंत के साथ बने रहना एक चुनौती होगी, लेकिन इसकी बहुमुखी प्रतिभा के कारण, आकाशगंगा सी.एलेगन्स में एकल कक्ष स्तर पर शाही सेना Seq के लिए पूरे जीव transcriptomics से संक्रमण को सशक्त बनाने में महत्वपूर्ण भूमिका निभाई होने की संभावना है। ज्ञान में जिसके परिणामस्वरूप अग्रिम मौलिक जीव विज्ञान में असाधारण अंतर्दृष्टि प्रदान की संभावना है।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासे के लिए कुछ भी नहीं है।

Acknowledgments

लेखकों प्रयोगशालाओं, समूहों और व्यक्तियों, जो आकाशगंगा और डेविड का विकास किया है, और इस तरह के वैज्ञानिक समुदाय के लिए NGS व्यापक रूप से सुलभ बना दिया करने के लिए अपने आभार व्यक्त करना चाहते हैं। मदद और सलाह हमारे जैव सूचना विज्ञान प्रशिक्षण के दौरान पिट्सबर्ग विश्वविद्यालय में उनके सहयोगियों द्वारा प्रदान की स्वीकार किया है। इस काम के पुरस्कार (एजी-NS-0879-12) और राष्ट्रीय स्वास्थ्य संस्थान एजी के लिए (R01AG051659) से अनुदान एजिंग में एक एलिसन मेडिकल फाउंडेशन नई विद्वान द्वारा समर्थित किया गया।

Materials

Name Company Catalog Number Comments
RNase spray  Fisher Scientific 21-402-178
Trizol  Ambion 15596026
Sonicator Sonics Vibra Cell  VCX130
Centrifuge  Eppendorf 5415C
chloroform  Sigma Aldrich 288306
2-propanol  Fisher Scientific A416P-4
Ethanol Decon Labs 2705HC
RNase-free water  Fisher Scientific BP561-1
Bioanalyzer  Agilent G2940CA
Mac/PC

DOWNLOAD MATERIALS LIST

References

  1. Venter, J. C., et al. The sequence of the human genome. Science. 291, (5507), 1304-1351 (2001).
  2. Lander, E. S., et al. Initial sequencing and analysis of the human genome. Nature. 409, (6822), 860-921 (2001).
  3. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic Acids Res. 44, (W1), W3-W10 (2016).
  4. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, (9), 1105-1111 (2009).
  5. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol. 28, (5), 511-515 (2010).
  6. Roberts, A., Trapnell, C., Donaghey, J., Rinn, J. L., Pachter, L. Improving RNA-Seq expression estimates by correcting for fragment bias. Genome Biol. 12, (3), R22 (2011).
  7. Roberts, A., Pimentel, H., Trapnell, C., Pachter, L. Identification of novel transcripts in annotated genomes using RNA-Seq. Bioinformatics. 27, (17), 2325-2329 (2011).
  8. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat Protoc. 7, (3), 562-578 (2012).
  9. Trapnell, C., et al. Differential analysis of gene regulation at transcript resolution with RNA-seq. Nat Biotechnol. 31, (1), 46-53 (2013).
  10. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc. 4, (1), 44-57 (2009).
  11. Giardine, B., et al. Galaxy: a platform for interactive large-scale genome analysis. Genome Res. 15, (10), 1451-1455 (2005).
  12. Han, Y., Gao, S., Muegge, K., Zhang, W., Zhou, B. Advanced Applications of RNA Sequencing and Challenges. Bioinform Biol Insights. 9, (1), 29-46 (2015).
  13. Mardis, E. R. Next-generation sequencing platforms. Annu Rev Anal Chem (Palo Alto Calif). 6, 287-303 (2013).
  14. Yang, I. S., Kim, S. Analysis of Whole Transcriptome Sequencing Data: Workflow and Software. Genomics Inform. 13, (4), 119-125 (2015).
  15. Khatri, P., Draghici, S. Ontological analysis of gene expression data: current tools, limitations, and open problems. Bioinformatics. 21, (18), 3587-3595 (2005).
  16. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Res. 37, (1), 1-13 (2009).
  17. Shaye, D. D., Greenwald, I. OrthoList: a compendium of C. elegans genes with human orthologs. PLoS One. 6, (5), e20085 (2011).
  18. Consortium, C. eS. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 282, (5396), 2012-2018 (1998).
  19. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC Genomics. 11, 383 (2010).
  20. Mortazavi, A., et al. Scaffolding a Caenorhabditis nematode genome with RNA-seq. Genome Res. 20, (12), 1740-1747 (2010).
  21. Bohnert, R., Ratsch, G. rQuant.web: a tool for RNA-Seq-based transcript quantitation. Nucleic Acids Res. 38, Web Server issue W348-W351 (2010).
  22. Lamm, A. T., Stadler, M. R., Zhang, H., Gent, J. I., Fire, A. Z. Multimodal RNA-seq using single-strand, double-strand, and CircLigase-based capture yields a refined and extended description of the C. elegans transcriptome. Genome Res. 21, (2), 265-275 (2011).
  23. Amrit, F. R., Ratnappan, R., Keith, S. A., Ghazi, A. The C. elegans lifespan assay toolkit. Methods. 68, (3), 465-475 (2014).
  24. Hsin, H., Kenyon, C. Signals from the reproductive system regulate the lifespan of C. elegans. Nature. 399, (6734), 362-366 (1999).
  25. Alper, S., et al. The Caenorhabditis elegans germ line regulates distinct signaling pathways to control lifespan and innate immunity. J Biol Chem. 285, (3), 1822-1828 (2010).
  26. Steinbaugh, M. J., et al. Lipid-mediated regulation of SKN-1/Nrf in response to germ cell absence. Elife. 4, (2015).
  27. Lapierre, L. R., Gelino, S., Melendez, A., Hansen, M. Autophagy and lipid metabolism coordinately modulate life span in germline-less. C. elegans. Curr Biol. 21, (18), 1507-1514 (2011).
  28. Rourke, E. J., Soukas, A. A., Carr, C. E., Ruvkun, G. C. elegans major fats are stored in vesicles distinct from lysosome-related organelles. Cell Metab. 10, (5), 430-435 (2009).
  29. Ghazi, A. Transcriptional networks that mediate signals from reproductive tissues to influence lifespan. Genesis. 51, (1), 1-15 (2013).
  30. Ghazi, A., Henis-Korenblit, S., Kenyon, C. A transcription elongation factor that links signals from the reproductive system to lifespan extension in Caenorhabditis elegans. PLoS Genet. 5, (9), e1000639 (2009).
  31. Amrit, F. R., et al. DAF-16 and TCER-1 Facilitate Adaptation to Germline Loss by Restoring Lipid Homeostasis and Repressing Reproductive Physiology in C. elegans. PLoS Genet. 12, (2), e1005788 (2016).
  32. Wang, M. C., O'Rourke, E. J., Ruvkun, G. Fat metabolism links germline stem cells and longevity in C. elegans. Science. 322, (5903), 957-960 (2008).
  33. McCormick, M., Chen, K., Ramaswamy, P., Kenyon, C. New genes that extend Caenorhabditis elegans' lifespan in response to reproductive signals. Aging Cell. 11, (2), 192-202 (2012).
  34. Kartashov, A. V., Barski, A. BioWardrobe: an integrated platform for analysis of epigenomics and transcriptomics data. Genome Biol. 16, 158 (2015).
  35. Goncalves, A., Tikhonov, A., Brazma, A., Kapushesky, M. A pipeline for RNA-seq data processing and quality assessment. Bioinformatics. 27, (6), 867-869 (2011).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics