Genetics

की transcriptomic विश्लेषण Published: April 8, 2017 doi: 10.3791/55473

DOI

Automatic Translation

English (Original)
العربية (Arabic)
中文 (Chinese)
dansk (Danish)
Nederlands (Dutch)
français (French)
Deutsch (German)
עברית (Hebrew)
हिंदी (Hindi)
italiano (Italian)
日本語 (Japanese)
한국어 (Korean)
norsk (Norwegian)
português (Portugese)
русский (Russian)
español (Spanish)
svenska (Swedish)
Türkçe (Turkish)

Francis R. G. Amrit¹, Arjumand Ghazi¹

¹Department of Pediatrics, University of Pittsburgh School of Medicine, Children's Hospital of Pittsburgh

Summary

आकाशगंगा और डेविड लोकप्रिय टूल दिए गए जैव सूचना विज्ञान प्रशिक्षण के बिना जांचकर्ताओं का विश्लेषण और आरएनए Seq डेटा व्याख्या करने की अनुमति के रूप में उभरा है। सी.एलेगन्स शोधकर्ताओं आरएनए Seq प्रयोगों, पहुँच प्रदर्शन करने के लिए और आकाशगंगा का उपयोग कर डाटासेट संसाधित करने और डेविड का उपयोग कर जीन सूचियों से सार्थक जैविक जानकारी प्राप्त करने के लिए हम एक प्रोटोकॉल का वर्णन।

Abstract

अगली पीढ़ी अनुक्रमण (NGS) प्रौद्योगिकियों जैविक जांच की प्रकृति में क्रांति ला दिया है। इनमें से शाही सेना अनुक्रमण (आरएनए Seq) जीन अभिव्यक्ति विश्लेषण और transcriptome मानचित्रण के लिए एक शक्तिशाली उपकरण के रूप में उभरा है। हालांकि, आरएनए Seq डेटासेट से निपटने परिष्कृत कम्प्यूटेशनल विशेषज्ञता की आवश्यकता और जीव विज्ञान शोधकर्ताओं के लिए निहित चुनौतियों बन गया है। इस टोंटी खुली पहुंच आकाशगंगा परियोजना है कि जैव सूचना विज्ञान कौशल के बिना उन आरएनए Seq डेटा का विश्लेषण करने की अनुमति देता है, और एनोटेशन, दृश्य, और एकीकृत डिस्कवरी (डेविड) के लिए डाटाबेस से कम किया गया है, एक जीन आंटलजी (GO) अवधि विश्लेषण सुइट है जो बड़े डेटा सेट से जैविक अर्थ निकाले जाते हैं। हालांकि, पहली बार के उपयोगकर्ताओं और जैव सूचना विज्ञान 'शौकीनों, इन प्लेटफार्मों के साथ स्वयं सीखने और परिचय के लिए समय लेने वाली और कठिनाई आ सकती है। हम कीड़ा शाही सेना को अलग करने के सी.एलेगन्स शोधकर्ताओं में मदद मिलेगी कि एक सीधा कार्यप्रवाह का वर्णन है, एक आरएनए-Seq प्रयोग का संचालनऔर आकाशगंगा और डेविड प्लेटफार्मों का उपयोग कर डेटा का विश्लेषण। यह प्रोटोकॉल हर कदम पर, कच्चे NGS डेटा, गुणवत्ता नियंत्रण की जाँच, संरेखण, और अंतर जीन अभिव्यक्ति विश्लेषण तक पहुँचने मानकों के साथ उपयोगकर्ता मार्गदर्शन के लिए विभिन्न आकाशगंगा मॉड्यूल का उपयोग कर एक जीन की सूची है कि के संवर्धन के लिए जांच की जा सकती है उत्पन्न करने के लिए के लिए चरणबद्ध निर्देश प्रदान करता है जीन वर्गों या जैविक प्रक्रियाओं डेविड का उपयोग कर। कुल मिलाकर, हम आशा करते हैं कि इस लेख के बारे में जानकारी प्रदान करेगा सी पहली बार के लिए शाही सेना Seq प्रयोगों के साथ ही बार-बार उन नमूनों की एक छोटी संख्या में चल रहे उपक्रम शोधकर्ताओं एलिगेंस करने के लिए।

Introduction

मानव जीनोम की पहली अनुक्रमण,, फ्रेड सेंगर के dideoxynucleotide-अनुक्रमण विधि का उपयोग किया 10 साल लग गए, और एक अनुमान के अनुसार अमेरिका में 3 अरब $ ^{^1,} ² की लागत। हालांकि, अपनी स्थापना के बाद एक दशक से अधिक एक छोटे में, अगली पीढ़ी अनुक्रमण (NGS) प्रौद्योगिकी यह दो सप्ताह के भीतर पूरे मानव जीनोम अनुक्रम और यूएस $ 1,000 के लिए संभव बना दिया है। नई NGS उपकरणों कि की अनुमति लागत में अविश्वसनीय दक्षता के साथ बढ़ती अनुक्रमण-डेटा संग्रह की गति, तेज कटौती के साथ-साथ, अकल्पनीय मायनों में आधुनिक जीव विज्ञान क्रांति कर रहे हैं के रूप में जीनोम अनुक्रमण परियोजनाओं को तेजी से सामान्य हो रहे हैं। इसके अलावा, इन घटनाओं में इस तरह के शाही सेना अनुक्रमण (आरएनए Seq), जीनोम चौड़ा epigenetic संशोधनों के अध्ययन, डीएनए प्रोटीन अन्योन्य क्रिया के माध्यम से जीन अभिव्यक्ति विश्लेषण के रूप में कई अन्य क्षेत्रों में प्रगति जस्ती है, और मानव मेजबान में माइक्रोबियल विविधता के लिए स्क्रीनिंग। NGS आधारित शाही सेना सेविशेष रूप से क्ष यह संभव व्यापक सटीकता और संवेदनशीलता के साथ नक्शा transcriptomes की पहचान करने और करने के लिए बनाया गया है, और अभिव्यक्ति की रूपरेखा के लिए पसंद की विधि के रूप में माइक्रोएरे प्रौद्योगिकी ले लिया है। माइक्रोएरे प्रौद्योगिकी बड़े पैमाने पर इस्तेमाल किया गया है, यह इस तरह के पार संकरण और अभिव्यक्ति में परिवर्तन की प्रतिबंधित सीमा कि मज़बूती से मापा जा सकता है के रूप में अन्य कमियां ज्ञात जीनोमिक जानकारी के साथ पहले से मौजूद सरणियों, और पर अपनी निर्भरता द्वारा सीमित है। शाही सेना seq, दूसरे हाथ पर, अपने स्पष्ट डीएनए मैपिंग प्रकृति के कारण, जबकि कम पृष्ठभूमि शोर उत्पादन दोनों ज्ञात और अज्ञात टेप पता लगाने के लिए इस्तेमाल किया जा सकता। शाही सेना Seq, कई आनुवंशिक ऐसे खमीर के रूप में मॉडल जीवों द्वारा की पेशकश उपकरणों के साथ मिलकर, मक्खियों, कीड़े, मछली और चूहों, कई महत्वपूर्ण हाल के जैव चिकित्सा खोजों के लिए नींव के रूप में सेवा की है। हालांकि, महत्वपूर्ण चुनौतियों रहने कि व्यापक वैज्ञानिक समुदाय के लिए दुर्गम NGS बनाने के भंडारण की सीमाओं, प्रसंस्करण, और सभी के अधिकांश, मीटर सहित, अनुक्रमण डेटा की बड़ी मात्रा का eaningful जैव सूचना विज्ञान विश्लेषण।

अनुक्रमण प्रौद्योगिकियों और घातीय डेटा संचय में तेजी से प्रगति कम्प्यूटेशनल प्लेटफार्मों कि शोधकर्ताओं का उपयोग का विश्लेषण करने और इस जानकारी को समझने के लिए अनुमति देगा की काफी जरूरत पैदा की है। प्रारंभिक सिस्टम भारी कंप्यूटर प्रोग्रामिंग ज्ञान पर निर्भर करती थीं, जबकि इस तरह के एन सी बी आई के रूप में जीनोम ब्राउज़रों कि नान प्रोग्रामर्स पहुँच सकते हैं और डेटा की कल्पना परिष्कृत विश्लेषण की अनुमति नहीं था की अनुमति दी। वेब आधारित, खुले पहुँच मंच, आकाशगंगा ( https://galaxyproject.org/ ), इस शून्य भरा है और एक मूल्यवान पाइपलाइन कि NGS डेटा की प्रक्रिया और एक स्पेक्ट्रम के प्रदर्शन करने के लिए सक्षम बनाता है शोधकर्ताओं साबित हो गया है सरल करने के लिए जटिल जैव सूचना विज्ञान विश्लेषण करती है। गैलेक्सी शुरू में स्थापित किया गया था, और बनाए रखा है, एंटोन Nekrutenko (पेन स्टेट यूनिवर्सिटी) और जेम्स टेलर की प्रयोगशालाओं द्वारा (जॉन्स हॉपकिन्स विश्वविद्यालय)च "> 3। आकाशगंगा यह सब एक आरएनए-Seq अध्ययन में शामिल चरणों सहित असंख्य जैव सूचना विज्ञान की जरूरत है, के लिए एक 'वन-स्टॉप शॉप' बनाने कम्प्यूटेशनल कार्यों की एक विस्तृत श्रृंखला प्रदान करता है। या तो अपने सर्वर पर या डाटा प्रोसेसिंग प्रदर्शन करने के लिए उन Itallows स्थानीय स्तर पर अपने स्वयं मशीनों पर। डाटा और workflows reproduced जा सकता है और साझा की है। ऑनलाइन ट्यूटोरियल, सहायता अनुभाग, और एक विकि-पेज ( https://wiki.galaxyproject.org/Support ) आकाशगंगा परियोजना के लिए समर्पित लगातार समर्थन प्रदान करते हैं। हालांकि, पहली बार के उपयोगकर्ताओं के लिए, विशेष रूप से कोई जैव सूचना विज्ञान प्रशिक्षण के साथ उन लोगों, पाइपलाइन कठिन दिखाई दे सकता है और स्वयं सीखने और परिचय की प्रक्रिया समय लग सकता है। इसके अलावा, जैविक प्रणाली का अध्ययन किया, और प्रयोग और तरीकों की बारीकियों का इस्तेमाल किया, प्रभाव कई कदम पर विश्लेषणात्मक निर्णय है, और इन शिक्षा के बिना नेविगेट करने के लिए मुश्किल हो सकता है।

कुल मिलाकर आर.एन. ए-Seq आकाशगंगा ^{कार्यप्रवाह,} डेटा अपलोड और गुणवत्ता टक्सेडो सुइट ^{^4,} ^{^5,} ^{^6,} ^{^7,} ^{^8,} ^9, जो शाही सेना Seq डेटा विश्लेषण ¹⁰ के विभिन्न चरणों के लिए आवश्यक विभिन्न उपकरणों का एक सामूहिक है का उपयोग कर विश्लेषण के बाद जांच के होते हैं ^{^11,} ^{^12,} ^{^13,} ^14। एक ठेठ आरएनए Seq प्रयोग प्रयोगात्मक हिस्सा (नमूना तैयार करने, mRNA अलगाव और सीडीएनए पुस्तकालय तैयारी) के होते हैं, NGS और जैव सूचना विज्ञान डेटा विश्लेषण। इन वर्गों, और कदम आकाशगंगा पाइपलाइन में शामिल का अवलोकन, चित्र 1 में दिखाया गया है।

3fig1.jpg "/>
चित्र 1: एक आरएनए-Seq कार्यप्रवाह का अवलोकन। दो कीड़ा उपभेदों (ए और बी, नारंगी और हरे रंग लाइनों और तीर, क्रमशः) के जीन अभिव्यक्ति प्रोफाइल की तुलना करने के एक आरएनए-Seq प्रयोग में शामिल प्रयोगात्मक और कम्प्यूटेशनल चरणों का चित्रण। आकाशगंगा का उपयोग के विभिन्न मॉड्यूल हमारे प्रोटोकॉल में इसी कदम लाल रंग में संकेत दिया साथ बक्से में दिखाए जाते हैं। विभिन्न कार्यों के आउटपुट नीले रंग में दिखाया फ़ाइल स्वरूपों के साथ भूरे रंग में लिखे गए हैं। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

टक्सेडो सूट में पहला उपकरण एक संरेखण कार्यक्रम 'Tophat' कहा जाता है। यह टूट जाती है NGS इनपुट छोटे टुकड़ों में पढ़ता है और फिर उन्हें एक संदर्भ जीनोम को मैप करता है। यह दो चरण की प्रक्रिया सुनिश्चित करता है कि intronic क्षेत्रों जिसका संरेखण अन्यथा di हो सकता फैले पढ़ताsrupted या चूक के लिए जिम्मेदार है और मैप की जाती हैं। इस कवरेज बढ़ जाती है और उपन्यास जोड़ जंक्शनों की पहचान की सुविधा। Tophat उत्पादन दो फ़ाइलों, एक बिस्तर फ़ाइल (जोड़ जंक्शनों कि जीनोमिक स्थान शामिल हैं के बारे में जानकारी के साथ) और एक BAM फ़ाइल (प्रत्येक को पढ़ने की मैपिंग विवरण के साथ) के रूप में रिपोर्ट किया गया है। इसके बाद, BAM फ़ाइल 'कफ़लिंक' नामक टक्सेडो सुइट में बाद में उपकरण का उपयोग कर प्रत्येक नमूने के अलग-अलग टेप की बहुतायत अनुमान लगाने के लिए एक संदर्भ के जीनोम के खिलाफ गठबंधन है। पूर्ण लंबाई प्रतिलेख टुकड़े या 'transfrags' है कि हर जीन के लिए इनपुट डेटा में हर संभव जोड़ वेरिएंट अवधि रिपोर्ट करने के लिए संरेखण को स्कैन करके कफ़लिंक कार्य करता है। इस आधार पर, यह एक प्रत्येक नमूने के लिए अनुक्रम किया जा रहा है (सभी हर जीन के लिए जीन प्रति उत्पन्न टेप की विधानसभा) 'transcriptome' उत्पन्न करता है। इन कफ़लिंक विधानसभाओं तो ध्वस्त हो गई या फिर साथ-साथ एक साथ विलय कर रहे हैंसम्मेलन जीनोम नीचे की ओर अंतर विश्लेषण अगले उपकरण, 'Cuffmerge' का उपयोग कर के लिए एक एकल एनोटेशन फ़ाइल का उत्पादन करने के लिए। अंत में, अंतिम Cuffmerge आउटपुट फ़ाइल (चित्रा 1) के नमूने में से प्रत्येक के Tophat आउटपुट की तुलना द्वारा नमूने के बीच 'Cuffdiff' उपकरण उपायों अंतर जीन अभिव्यक्ति। कफ़लिंक का उपयोग करता FPKM / RPKM (टुकड़े / प्रति kilobase लाख मैप की प्रति प्रतिलेख के पढ़ने पढ़ता है) मान प्रतिलेख प्रचुरता रिपोर्ट करने के लिए। ये मान गहराई के लिए कच्चे NGS डेटा को सामान्य प्रतिबिंबित और जीन लंबाई (जीन, अलग-अलग लंबाई है तो मायने रखता स्तर की तुलना करने के लिए एक जीन की लंबाई के लिए सामान्यीकृत किया जाना है (औसत संख्या एक नमूना है कि संदर्भ जीनोम को संरेखित से पढ़ता की) जीन के बीच)। FPKM और RPKM अनिवार्य है, जबकि, FPKM के लिए प्रयोग किया जाता है RPKM के साथ एक ही एकल अंत शाही सेना Seq जहां हर पढ़ा एक भी टुकड़ा से मेल खाती है के लिए इस्तेमाल किया जा रहा हैंबनती अंत शाही सेना Seq, यह तथ्य दो पढ़ता है कि एक ही टुकड़ा के अनुरूप कर सकते हैं के लिए खातों के रूप में। अंत में, इन विश्लेषण के परिणाम जीन भिन्न शर्तों और / या उपभेदों का परीक्षण के बीच व्यक्त की एक सूची है।

एक सफल गैलेक्सी रन पूरा हो गया है और एक 'जीन सूची' उत्पन्न हो जाने के बाद, अगला तार्किक कदम डेटासेट से सार्थक ज्ञान निकालना का विश्लेषण करती है और अधिक जैव सूचना विज्ञान की आवश्यकता है। कई सॉफ्टवेयर संकुल इस जरूरत को पूरा करने के, इस तरह के डेविड ¹⁵ (एनोटेशन, दृश्य और एकीकृत खोज के लिए डाटाबेस) के रूप में सार्वजनिक रूप से उपलब्ध वेब आधारित कम्प्यूटेशनल संकुल सहित उभरा है। डेविड अपनी एकीकृत जैविक नॉलेजबेस पर अपलोड जीन सूची की तुलना और जैविक जीन सूची से संबद्ध एनोटेशन खुलासा द्वारा उच्च प्रवाह क्षमता के अध्ययन से बड़े जीन सूची में जैविक अर्थ बताए की सुविधा। इस संवर्धन विश्लेषण, यानी, द्वारा पीछा किया जाता आईडीई के लिए परीक्षणntify यदि कोई जैविक प्रक्रिया या जीन वर्ग सांख्यिकीय रूप से महत्वपूर्ण ढंग से जीन सूची (सूचियों) में overrepresented है। यह एक विस्तृत, एकीकृत ज्ञान आधार और शक्तिशाली विश्लेषणात्मक एल्गोरिदम कि शोधकर्ताओं जैविक भीतर समृद्ध विषयों का पता लगाने के लिए सक्षम का एक संयोजन की वजह से एक लोकप्रिय विकल्प बन गया है जीनोमिक्स व्युत्पन्न 'गुणसूत्र सूचियों' ^{^10,} ^16। अतिरिक्त लाभ किसी भी अनुक्रमण मंच और एक अत्यंत उपयोगकर्ता के अनुकूल इंटरफेस पर बनाया जीन सूचियों पर कार्रवाई करने की क्षमता शामिल है।

निमेटोड Caenorhabditis एलिगेंस एक आनुवंशिक मॉडल प्रणाली, अच्छी तरह से इस तरह के छोटे आकार, पारदर्शी शरीर, सरल शरीर की योजना, संस्कृति में आसानी और आनुवंशिक और आणविक विच्छेदन के लिए महान ज़िम्मा के रूप में अपनी कई फायदे के लिए जाना जाता है। कीड़े एक, छोटे सरल और अच्छी तरह से एनोटेट जीनोम कि ज्ञात मानव homologs ¹⁷ के साथ 40% संरक्षित जीन पर निर्भर शामिल है। दरअसल, सी एलिगेंसपहले metazoan जिसका जीनोम पूरी तरह से ¹⁸ अनुक्रम था और पहली प्रजाति जहां शाही सेना Seq एक जीव की transcriptome ^{^19,} ²⁰ मैप करने के लिए इस्तेमाल किया गया था से एक था। प्रारंभिक कीड़ा पढ़ाई उच्च throughput शाही सेना पर कब्जा, पुस्तकालय तैयारी और अनुक्रमण के साथ ही जैव सूचना विज्ञान पाइपलाइनों के लिए विभिन्न तरीकों कि प्रौद्योगिकी ^{^21,} ²² की उन्नति के लिए योगदान दिया साथ शामिल प्रयोग। हाल के वर्षों में, कीड़े में शाही सेना Seq आधारित प्रयोग आम हो गया है। लेकिन, पारंपरिक वर्म जीव के लिए चुनौतियों आरएनए Seq डेटा के कम्प्यूटेशनल विश्लेषण से उत्पन्न तकनीक का अधिक से अधिक और बेहतर उपयोग के लिए एक प्रमुख बाधा बने हुए हैं।

इस अनुच्छेद में, हम आकाशगंगा प्लेटफॉर्म का इस्तेमाल सी.एलेगन्स से उत्पन्न उच्च throughput आरएनए Seq डेटा का विश्लेषण करने के लिए एक प्रोटोकॉल का वर्णन। कई पहली बार और छोटे एससीए के लिएle उपयोगकर्ताओं, सबसे अधिक लागत प्रभावी और सरल तरीके से एक आरएनए-Seq प्रयोग शुरू करने के लिए प्रयोगशाला में शाही सेना को अलग करने और अनुक्रमण सीडीएनए पुस्तकालयों की तैयारी और NGS खुद के लिए एक वाणिज्यिक (या इन-हाउस) NGS सुविधा का उपयोग करने के लिए है। इसलिए, हम पहले अलगाव में शामिल चरणों विस्तृत, सी की मात्रा और गुणवत्ता मूल्यांकन आरएनए Seq के लिए शाही सेना के नमूने एलिगेंस। इसके बाद, हम NGS डेटा के विश्लेषण के लिए गैलेक्सी इंटरफ़ेस का उपयोग कर, बाद अनुक्रमण गुणवत्ता नियंत्रण संरेखण, विधानसभा, और जीन अभिव्यक्ति के अंतर मात्रा के बाद जांच के लिए परीक्षण के साथ शुरुआत के लिए कदम दर कदम निर्देश प्रदान करते हैं। इसके अलावा, हम डेविड का उपयोग कर जैविक संवर्धन के अध्ययन के लिए आकाशगंगा से उत्पन्न जीन सूचियों की जांच करने के लिए निर्देशों को शामिल किया है। कार्यप्रवाह में एक अंतिम कदम के रूप में, हम इस तरह के अनुक्रम पढ़ें आर्काइव (एसआरए) एन सी बी आई पर (के रूप में सार्वजनिक सर्वर पर शाही सेना Seq डेटा अपलोड करने के लिए निर्देश प्रदान करते हैं http: // www.ncbi.nlm.nih.gov/sra) यह स्वतंत्र रूप से वैज्ञानिक समुदाय के लिए सुलभ बनाने के लिए। कुल मिलाकर, हम आशा करते हैं कि इस लेख के लिए पहली बार शाही सेना Seq प्रयोगों के साथ ही बार-बार उन नमूनों की एक छोटी संख्या में चल रहे उपक्रम कीड़ा जीव के लिए व्यापक और पर्याप्त जानकारी प्रदान करेगा।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. आरएनए अलगाव

एहतियाती उपाय
1. वर्तमान में किसी भी RNases को खत्म करने की एक वाणिज्यिक रूप से उपलब्ध RNase स्प्रे का उपयोग कर पूरे काम कर सतह, उपकरणों और pipettes नीचे साफ कर लें।
2. हर समय दस्ताने पहनें, उन्हें नियमित रूप से प्रोटोकॉल के विभिन्न चरणों के दौरान ताजा लोगों के साथ बदल रहा है।
3. केवल फिल्टर युक्तियों का उपयोग करें और के रूप में ज्यादा संभव के रूप में बर्फ पर सभी नमूनों रखने आरएनए गिरावट से बचने के लिए।
  नोट: आदेश NGS प्लेटफार्मों से सबसे अच्छा डेटा प्राप्त करने के अलावा, यह उच्च गुणवत्ता वाले शाही सेना के साथ शुरू करने के लिए महत्वपूर्ण है। शाही सेना अलगाव और तैयारी के तरीकों नमूना मूल, अनुक्रमण और अन्वेषक वरीयता की विधि के आधार पर भिन्न। कई व्यावसायिक रूप से उपलब्ध किट इस उद्देश्य के लिए इस्तेमाल किया जा सकता या आरएनए भी शाही सेना निकासी का एक मानक फिनोल-क्लोरोफॉर्म विधि का उपयोग कर अलग किया जा सकता। या तो कार्यप्रणाली के साथ, एहतियाती ऊपर सूचीबद्ध उपायों प्रदूषण और OBT कम करने के लिए इस प्रक्रिया के दौरान पालन किया जाना चाहिएऐन प्राचीन शाही सेना के नमूने हैं।
फसल काटने वाले कीड़े
1. तनाव प्रति 1,000-1,500 उम्र से मिलान सी.एलेगन्स वयस्क कीड़े प्राप्त करने के लिए हाइपोक्लोराइट विरंजन उपचार ²³ से कीड़ा आबादी सिंक्रनाइज़ करें।
2. कीड़े से 30 रों के लिए एक मेज शीर्ष अपकेंद्रित्र पर 325 XG पर M9 बफर समाधान और स्पिन का उपयोग कर प्लेटें धो लें। M9 बफर कीड़े की एक गोली पीछे छोड़कर बाहर Aspirate। जीवाणु भार को खत्म करने की यह प्रक्रिया दोहराएं कम से कम तीन बार।
3. कीड़ा ऊतकों को बाधित करने के: कीड़ा गोली करने के लिए, lysis बफर के (एक वाणिज्यिक किट का उपयोग करता है, तो) Trizol ~ 500 μL या जोड़ने (क्लोरोफॉर्म निष्कर्षण 1.3.3 में वर्णित किया जाता है, तो फिनोल फिनोल और guanidine आइसोथियोसाइनेट की एक मोनो phasic समाधान) , RNases को निष्क्रिय और न्यूक्लिक एसिड को स्थिर।
  नोट: प्रोटोकॉल फ़्लैश तरल -80 डिग्री सेल्सियस पर भंडारण के बाद नाइट्रोजन में नमूने ठंड से यहां रुका हुआ जा सकता है।
शाही सेना अलगाव
20 रों के चक्र में 45% आयाम पर Sonicate कीड़ा नमूने हैं। 'ऑन' और 40 रों। 'बंद' (तनाव प्रति 8-12 चक्र)। हर समय बर्फ पर नमूने रखें।
नोट: सुनिश्चित करें कि sonicator जांच बफर में डूब जाता है और भर में एक निरंतर स्तर पर रखा गया है। नमूने के frothing से बचें और नमूने के बीच में अच्छी तरह से जांच को साफ। Sonication चक्र इस्तेमाल किया sonicator के प्रकार के आधार पर भिन्न हो सकते। कि sonication की स्थिति पहले एक प्रयोग शुरू करने से पहले एक परीक्षण के नमूने पर अनुकूलित कर रहे हैं यह सिफारिश की है।
एक व्यावसायिक रूप से उपलब्ध किट का उपयोग करते हैं, तो निर्धारित प्रोटोकॉल के अनुसार शाही सेना अलगाव के साथ आगे बढ़ना। एक फिनोल-क्लोरोफॉर्म विधि का उपयोग कर शाही सेना अलगाव के लिए, निम्न चरणों का पालन।
अपकेंद्रित्र 10 मिनट के लिए 16,000 XG पर नमूने sonicated। 4 डिग्री सेल्सियस पर
एक 1.5 एमएल RNase मुक्त microfuge ट्यूब में सतह पर तैरनेवाला स्थानांतरण और ^(वें शाही सेना / डीएनए अलगाव अभिकर्मक की मात्रा 1/5) क्लोरोफॉर्म के 100 μL जोड़ें।
सावधान: क्लोरोफॉर्म विषैला होता है। जोखिम को कम करने और साँस लेना से बचने के लिए, एक रासायनिक हुड में काम करते हैं जब इस पदार्थ से निपटने।
60 रों - 30 के लिए अच्छी तरह से नमूने भंवर। और नमूने 3 मिनट के लिए कमरे के तापमान पर बैठते हैं।
15 मिनट के लिए 11,750 XG पर अपकेंद्रित्र। 4 डिग्री सेल्सियस पर। एक नया RNase मुक्त microfuge ट्यूब देखभाल करने के लिए एक ही शीर्ष जलीय परत स्थानांतरण डीएनए युक्त सफेद इंटरफ़ेस निकालना नहीं। दोहराएँ 1.3.6 के माध्यम से 1.3.4 कदम दूर है।
250 μL 2-propanol की (जलीय चरण या 1/2 आरएनए / डीएनए अलगाव अभिकर्मक मात्रा का 70%) जोड़ें और ट्यूब मिश्रण करने को उलटने के। ट्यूब 10 मिनट के लिए कमरे के तापमान पर बैठने या -80 डिग्री सेल्सियस पर रात भर छोड़ दें करते हैं।
10 मिनट के लिए 11,750 XG पर अपकेंद्रित्र नमूने हैं। 4 डिग्री सेल्सियस पर। सतह पर तैरनेवाला छानना बहुत सावधानी से, ट्यूब के नीचे कुछ μL पीछे छोड़ ताकि गोली परेशान नहीं कर रहा है।
75% इथेनॉल के 500 μL (RNase मुक्त पानी का उपयोग किया जाता है) के साथ गोली धो लें और 5 मिनट के लिए 16,000 XG पर नीचे स्पिन। एटी 4 डिग्री सेल्सियस।
गोली को परेशान किए बिना जितना संभव हो उतना सतह पर तैरनेवाला निकालें। एयर कुछ मिनट के लिए एक हुड में गोली सूखी।
RNase मुक्त पानी के 30 μL जोड़ें और 10 मिनट के लिए हीटिंग द्वारा शाही सेना गोली भंग मदद करते हैं। 60 डिग्री सेल्सियस पर।
शाही सेना की गुणवत्ता और मात्रा एक bioanalyzer का उपयोग कर की जाँच करें।
नोट: Bioanalyzer शाही सेना की गुणवत्ता का एक उपाय के रूप में एक अनुसंधान एनए मैं ntegrity एन भूरा रंग (Rin) उत्पन्न करता है। कम से कम 8 का एक RIN आरएनए Seq नमूने के लिए सीमा की सिफारिश की (उच्च बेहतर है) है। शाही सेना की मात्रा और गुणवत्ता भी spectrophotometrically जाँच की जा सकती है लेकिन यह भी शाही सेना अखंडता के विज़ुअल आकलन द्वारा पालन किया जाना चाहिए। ऐसा करने के लिए, 28s और 18s राइबोसोमल आरएनए बैंड में से उपयुक्त जुदाई प्राप्त करने के लिए काफी लंबे समय से एक 1.2% agarose जेल पर नमूने चलाते हैं। दो अलग-अलग बैंड (18s rRNA के लिए 1.75 केबी और सी.एलेगन्स के मामले में 28S rRNA के लिए 3.5 केबी) की उपस्थिति शाही सेना गुणवत्ता का एक स्वीकार्य उपाय है।
का प्रयोग करें ~ 100 एनजी / μL आरएनए शि कोअनुक्रमण पुस्तकालयों की तैयारी के लिए विक्रेता / NGS सुविधा के लिए पी।
नोट: शाही सेना के नमूने अनुक्रमण सेवा प्रदाता के लिए सूखी बर्फ पर भेज दिया जाना चाहिए। अधिकांश प्रदाता पुस्तकालय तैयारी से पहले एक स्वतंत्र शाही सेना गुणवत्ता नियंत्रण परीक्षण।

2. आरएनए Seq डेटा विश्लेषण

कच्चे अनुक्रमण डेटा के डाउनलोड
1. संकुचित कच्चे fastq अनुक्रमण एक "फ़ाइल स्थानांतरण प्रोटोकॉल" (एफटीपी) का उपयोग कर NGS प्रदाता से fastq.gz प्रारूप में इनकोडिंग डेटा डाउनलोड करें।

चित्र 2: आकाशगंगा उपयोगकर्ता इंटरफ़ेस पैनल और कुंजी आरएनए Seq कार्य के लेआउट। पेज की मुख्य विशेषताएं विस्तार किया है और प्रकाश डाला है। (ए) पर प्रकाश डाला गया वेबपेज शीर्षक में 'डेटा का विश्लेषण' समारोह का उपयोग करने के लिए इस्तेमाल (बी) 'प्रगति बार' है कि आपरेशन द्वारा उपयोग आकाशगंगा सर्वर पर जगह इंगित करता है। (सी) 'उपकरण धारा' है कि सभी उपकरण है कि आकाशगंगा इंटरफेस पर चलाया जा सकता है सूचीबद्ध करता है। (डी) 'NGS: शाही सेना विश्लेषण' से पता चलता आरएनए Seq विश्लेषण के लिए इस्तेमाल किया उपकरण अनुभाग। (ई) 'इतिहास' पैनल है कि सभी आकाशगंगा का उपयोग कर उत्पन्न फ़ाइलों को सूचीबद्ध करता है दर्शाया गया है। (एफ) संवाद बॉक्स खुल जाता है कि जब इतिहास अनुभाग में किसी भी फाइल पर क्लिक का एक उदाहरण दिखाता। भीतर (एफ), नीले बॉक्स प्रतीक है कि देखने के लिए इस्तेमाल किया जा सकता, editthe विशेषताओं पर प्रकाश डाला गया या डाटासेट हटाने के लिए, बैंगनी बॉक्स प्रतीक है कि 'संपादित करें' डाटासेट टैग या एनोटेशन इस्तेमाल किया जा सकता पर प्रकाश डाला गया है, और, लाल बॉक्स माउस को इंगित करता है डेटा डाउनलोड करने के लिए, कार्य की विवरण देखें प्रदर्शन किया या ऑपरेशन को पुनः चलाएं। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

आकाशगंगा के साथ प्रारंभ करना
नोट: आकाशगंगा एक नि: शुल्क सार्वजनिक सर्वर एक वेब आधारित बादल का उपयोग और मुक्त सीमित भंडारण उपलब्ध कराने के प्लेटफॉर्म का इस्तेमाल करने पर चलाया जा सकता। यह भी डाउनलोड किया है और उपयोगकर्ता की मशीन या कम्प्यूटेशनल समूहों संस्थानों लेकिन स्थानीय प्रसंस्करण द्वारा की मेजबानी पर स्थानीय रूप से चलाया जा सकता है, डेटा भंडारण सीमा और उपयोगकर्ता मशीनों के प्रसंस्करण शक्ति सीमा की शर्त हो सकती है। डाउनलोड और स्थापना पर विवरण में पहुँचा जा सकता है https://wiki.galaxyproject.org/Admin/GetGalaxy । इस प्रोटोकॉल में हम आकाशगंगा पाइप लाइन के वेब आधारित उपयोग का वर्णन।
1. पर उपयोगकर्ता की मशीन, पहुँच आकाशगंगा पर डाउनलोड करने और NGS डेटा भंडारण के बादlaxy.org/ "लक्ष्य =" _blank "> https://usegalaxy.org/।
2. पेज, लॉगिन के शीर्षक में 'उपयोगकर्ता' पर क्लिक करके एक उपयोगकर्ता खाते रजिस्टर और यूजर इंटरफेस पैनल से परिचित हो लें द्वारा शुरू करते हैं।
  नोट: यह अनुशंसित है पहली बार उपयोगकर्ताओं के यहाँ प्रारंभ करें 'मुखपृष्ठ पर प्रदान किए ट्यूटोरियल आकाशगंगा के बुनियादी सेट अप से परिचित करने के लिए उपयोग है कि ( https://github.com/nekrut/galaxy/wiki/Galaxy101-1 ) ।
3. 'विश्लेषण होम दृश्य' जो भी आकाशगंगा पर स्टार्टअप स्क्रीन है तक पहुँचने के लिए शीर्ष लेख पैनल में पर 'का विश्लेषण करें डाटा' (चित्रा 2 ए) पर क्लिक करें।
  ध्यान दें: हैडर भी अन्य लिंक जिसका विवरण उन्हें उस पर माउस होवर करके देखा जा सकता घरों। शीर्ष लेख के ऊपरी दाहिने कोने में एक प्रगति बार है कि कार्यों (चित्रा 2 बी) के लिए उपयोग अंतरिक्ष पर नजर रखता है है।
4. सीपर चाटना 'NGS: शाही सेना विश्लेषण' बाएं पैनल (चित्रा 2C) पर स्थित 'उपकरण मेनू' में काम सभी शाही सेना seq डेटा विश्लेषण के लिए आवश्यक उपकरणों का उपयोग करने की।
  नोट: 'उपकरण मेनू' सभी कार्यों कि आकाशगंगा प्रस्तावों कैटलॉग। यह मेनू कार्यों पर और किसी भी एक वह सब कार्य को पूरा करने के लिए आवश्यक उपकरणों की एक सूची खुल जाएगा पर क्लिक के आधार पर बांट रही है।
5. सही (चित्रा 2 ई) पर 'इतिहास' पैनल के शीर्ष पर गियर आइकन पर क्लिक करके नए विश्लेषण इतिहास बनाएँ। चुनें पॉप-अप मेनू से विकल्प 'नई बनाएँ'। इस 'इतिहास' विश्लेषण की पहचान के लिए एक उपयुक्त नाम दें।
  नोट: 'इतिहास' पैनल सभी सभी उत्पादन फ़ाइलों को आकाशगंगा पर चल रहे कार्यों के द्वारा उत्पन्न कर रहे हैं और साथ ही विश्लेषण के लिए अपलोड की गई फ़ाइलों को दर्शाता है। इस पैनल में एक फ़ाइल नाम पर क्लिक किया जाता काम के बारे में विस्तृत जानकारी के साथ एक संवाद बॉक्स खुल जाता हैऔर डाटासेट (चित्रा 2F) का एक टुकड़ा। इस बॉक्स में प्रतीक 'दृश्य' के लिए उपयोगकर्ता को सक्षम, 'विशेषताओं को संपादित' या 'नष्ट' डाटासेट (चित्रा 2F, नीले रंग में हाइलाइट)। साथ ही, उपयोगकर्ता कर सकते हैं भी 'संपादन' डाटासेट टैग या एनोटेशन (चित्रा 2F, बैंगनी में प्रकाश डाला), 'डाउनलोड' डेटा, कार्य की 'विवरण देखें', 'फिर से दौड़ना' कार्य या यहाँ तक कि 'कल्पना' इस से डाटासेट संवाद बॉक्स (चित्रा 2F, लाल रंग में हाइलाइट)।
6. कच्चे fastq फ़ाइलों को अपलोड करने के लिए 'ToolsMenu' में 'डेटा प्राप्त' के अंतर्गत 'फ़ाइल अपलोड करें' समारोह पर क्लिक करें।
  नोट: इस या किसी अन्य उपकरण पर क्लिक करने से बीच 'विश्लेषण इंटरफेस' पैनल में ऑपरेशन का एक संक्षिप्त विवरण, और परीक्षण ही, को खोलता है। यह पैनल एक साथ लेसबाएं पैनल और सही 'इतिहास' पैनल से 'इनपुट फ़ाइलें' (चित्रा 2 ई) से 'उपकरण'। इधर, 'इतिहास' से इनपुट फ़ाइलों का चयन किया जाता और अन्य पैरामीटर दिए गए कार्य को चलाने के लिए परिभाषित किया। हर परीक्षण से परिणामी उत्पादन डाटासेट 'इतिहास' में वापस आ गया सहेजा गया है। 'विश्लेषण इंटरफेस "पैनल में परीक्षण के साथ सभी मापदंडों सभी आउटपुट फाइलों उपकरण द्वारा उत्पन्न की एक विस्तृत सूची के साथ-साथ किसी दिए गए उपकरण को चलाने के लिए उपलब्ध के लिए स्पष्टीकरण शामिल हैं।
7. बाद काम 'विश्लेषण इंटरफेस' में खुलता है, 'स्थानीय फ़ाइल चुनें' पर क्लिक करें या (तेज अपलोड) 'एफ़टीपी फ़ाइल चुनें', अनुक्रमण फ़ाइलें फ़ोल्डर में नेविगेट और उचित डाटासेट अपलोड करने की का चयन करें।
8. अपलोड की गई फ़ाइल प्रकार (डिफ़ॉल्ट सेटिंग) 'का स्वत: पता' के लिए आकाशगंगा की अनुमति दें। चुनें 'सी एलजीनोम के लिए पुल डाउन मेनू में Egans '।
9. 'प्रारंभ करें' पर क्लिक करें डेटा अपलोड आरंभ करने के लिए। एक बार जब फ़ाइल को अपलोड किया जाता है, यह 'इतिहास' पैनल में सहेज लिया जाएगा और वहां से पहुँचा जा सकता है।
10. कई अनुक्रमण डेटा फ़ाइलों को एक भी नमूने के लिए उत्पादन किया जाता है, तो उन्हें 'जुटना' उपकरण का उपयोग गठबंधन। ऐसा करने के लिए, 'उपकरण मेनू' में 'टेक्स्ट में फेरबदल' विकल्प को खोलने के।
11. 'जुटना' टूल पर क्लिक करें, फ़ाइलें 'विश्लेषण इंटरफेस' के बीच में ड्रॉप-डाउन बॉक्स से संयुक्त और 'निष्पादित करें' पर क्लिक करें करने की आवश्यकता है चुनें।
  नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों fastq प्रारूप में उत्पन्न कर रहे हैं। मानचित्रण कार्यक्रम fastq फ़ाइल और जब कि सीमा समाप्त होने पर एक नया fastq फ़ाइल शेष दृश्यों के लिए उत्पन्न होता है प्रति 16,000,000 दृश्यों की एक सीमा होती है। '; जुटना 'उपकरण डेटासेट गठबंधन करने के लिए इस तरह के मामलों में की जरूरत है।
12. नीचे पाया 'fastq groomer' उपकरण का उपयोग करके गैलेक्सी आरएनए Seq विश्लेषण के लिए आवश्यक fastqsanger प्रारूप पर अपलोड fastq प्रारूप फ़ाइलें कन्वर्ट 'NGS: क्यूसी और हेरफेर' अनुभाग (पूरक फ़ाइल देखें)।
13. विकल्प 'दूल्हा के लिए फ़ाइल' के तहत उचित fastq डाटासेट चुनें और डिफ़ॉल्ट पैरामीटर का उपयोग कर उपकरण चलाएँ।
  नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों fastqsanger प्रारूप में उत्पन्न कर रहे हैं।
fastqsanger डेटा गुणवत्ता नियंत्रण टेस्ट
1. ': क्यूसी और हेरफेर NGS' 'उपकरण' मेनू में नीचे स्थित 'FastQC' उपकरण का उपयोग कर पढ़ता अपलोड fastqsanger की गुणवत्ता की जाँच करें।
2. 'शोर के लिए ड्रॉप डाउन मेनू से तैयार fastqsanger डेटा फ़ाइल चुनेंटी वर्तमान पुस्तकालय 'से डेटा पढ़ने और डिफ़ॉल्ट पैरामीटर का उपयोग कर उपकरण चलाएँ।
  ध्यान दें: पढ़ता की गुणवत्ता और किसी भी अनुकूलक दृश्यों की उपस्थिति पर विशेष ध्यान दें। एडेप्टर आमतौर पर NGS प्रदाताओं द्वारा पोस्ट आरएनए Seq डाटा प्रोसेसिंग के हिस्से के रूप निकाल दिए जाते हैं लेकिन कुछ मामलों में, पीछे छोड़ दिया जा सकता है। गुणवत्ता मानकों का स्पष्टीकरण के लिए के लिए जाना http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ ।
3. NGS प्रदाता से संपर्क करें और अगर एडाप्टर मौजूद हैं, उन लोगों से 'क्लिप' उपकरण का उपयोग ट्रिम 'NGS: क्यूसी और हेरफेर' कार्य मेनू।
  नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फ़ाइलों कच्चे txt प्रारूप में और साथ ही एचटीएमएल किसी भी वेब ब्राउज़र पर खोला जा सकता है कि में उत्पन्न कर रहे हैं।
टक्सेडो सुइट के साथ डेटा विश्लेषण
1. लंबा टोप
  1. के नवीनतम संस्करण को डाउनलोड करें fasta और GTF (जीन स्थानांतरण स्वरूप) फ़ाइल अपलोड करें से फाइल '2.2.6 में वर्णित है।
  2. खोलें 'NGS: शाही सेना विश्लेषण' अनुभाग और मैप करने के लिए अनुक्रमण डाउनलोड किया संदर्भ जीनोम को पढ़ता है 'Tophat' उपकरण पर क्लिक करें।
  3. सवाल का ड्रॉपडाउन सूची से उपयुक्त उत्तर का चयन करें 'इस एकल-अंत या बनती अंत डेटा है?'
  4. उचित fastq फ़ाइल चुनें।
  5. का चयन अगले ड्रॉपडाउन मेनू में 'इतिहास से एक जीनोम का उपयोग करें' और संदर्भ जीनोम कदम 2.4.1.1 में डाउनलोड करें चुनें।
  6. अन्य पैरामीटर के लिए 'डिफ़ॉल्ट' का चयन करें और 'निष्पादित करें' पर क्लिक करें।
    नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फाइलों के अलावा, 'स्वीकृत हिट्स' फ़ाइल बाद के चरणों के लिए प्रयोग किया जाता है।
2. कफ़लिंक और Cuffmerge
  1. चुनें 'गिरफ्तारNGS लिंक 'में उपकरण': टेप इकट्ठा करने के लिए शाही सेना विश्लेषण 'अनुभाग, उनकी बहुतायत और अंतर अभिव्यक्ति के लिए परीक्षण का अनुमान है।
  2. पहले ड्रॉपडाउन मेनू में, मैप किए गए 'स्वीकृत हिट (BAM प्रारूप)' फ़ाइल Tophat विश्लेषण से प्राप्त चुनें।
  3. दूसरा ड्रॉपडाउन मेनू में, GTF कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल के संदर्भ में व्याख्या की स्थापना की।
  4. 'पूर्वाग्रह सुधार प्रदर्शन' विकल्प के लिए 'हाँ' चुनें और अन्य सभी मापदंडों के लिए डिफ़ॉल्ट सेटिंग का उपयोग काम चलाते हैं।
    नोट: इस कार्य का उपयोग कर उत्पादन किया आउटपुट फाइलों के अलावा, 'स्वीकृत नकल' फ़ाइल बाद के चरणों के लिए प्रयोग किया जाता है।
  5. में ओपन 'Cuffmerge' उपकरण 'NGS: शाही सेना विश्लेषण' 'एसेंबल किया प्रतिलेख' का उत्पादन करने के लिए सभी आरएनए Seq नमूने विलय करने के लिए।
    नोट: उपकरण स्वयं भरता है और सूचियों में पहले बॉक्स सभी कफ़लिंक द्वारा उत्पादित फ़ाइलों।
  6. जांच की सभी उपभेदों / स्थिति, एक ही तनाव / हालत के जैविक प्रतिकृति (जैविक प्रतिकृति के लिए चर्चा देखें) सहित के लिए 'एसेंबल किया प्रतिलेख' फ़ाइल का चयन करें।
  7. 'उपयोग संदर्भ एनोटेशन' के लिए 'हां' का चयन करें और GTF कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल का चयन करें।
  8. निम्नलिखित बॉक्स में, फिर से 'का प्रयोग करें सेक्ेनस दाटा' विकल्प के लिए 'हां' का चयन करें और पूरे जीनोम fasta कदम 2.4.1.1 में डाउनलोड की गई फ़ाइल का चयन करें।
  9. डिफ़ॉल्ट के रूप में अन्य पैरामीटर रखते हुए, 'निष्पादित करें' पर क्लिक करें।
    नोट: Cuffmerge एक भी GTF आउटपुट फ़ाइल उत्पन्न करता है।
3. Cuffdiff
  1. में 'Cuffdiff' उपकरण पर नेविगेट करें 'NGS: शाही सेना विश्लेषण' अनुभाग। 'नकल' मेनू में, Cuffmerge से मर्ज किए गए आउटपुट फ़ाइल का चयन करें।
  2. लेबलस्थिति 1 और 2 दो उपभेदों / हालत नाम के साथ।
    ध्यान दें: Cuffdiff दो से अधिक उपभेदों या शर्तों के साथ-साथ समय बेशक प्रयोगों के बीच तुलना कर सकते हैं। सीधे शब्दों में आवश्यकतानुसार प्रत्येक नए उपभेदों / हालत जोड़ने के लिए 'नई शर्तों जोड़ें' विकल्प का उपयोग करें।
  3. प्रत्येक तनाव / हालत, 'प्रतिकृति' का चयन अलग-अलग 'स्वीकार किए जाते हैं हिट्स' Tophat से उत्पादन फ़ाइलें जो कि तनाव / हालत के विभिन्न जैविक प्रतिकृति के अनुरूप के तहत के लिए। 'Cmd' कुंजी दबाए रखें, Macintosh कंप्यूटर 'Ctrl' कुंजी का उपयोग कर, और, अगर एक पीसी का उपयोग कर, एकाधिक फ़ाइलों का चयन करने के लिए है।
  4. डिफ़ॉल्ट पैरामीटर के रूप में अन्य सभी विकल्पों को छोड़ दें। काम चलाने के लिए 'निष्पादित करें' पर क्लिक करें।
    नोट: Cuffdiff आरएनए Seq विश्लेषण के अंतिम रीडआउट के रूप में एक तालिका प्रारूप में कई उत्पादन फ़ाइलें उत्पन्न करता है। ये (टेप, जीन के लिए FPKM ट्रैकिंग के साथ फ़ाइलों संयुक्त शामिल) एक जीन पहचान साझा करने टेप, प्राथमिक टेप और कोडिंग दृश्यों के FPKM मूल्यों। उत्पन्न सभी डेटा फ़ाइलों को किसी भी स्प्रेडशीट अनुप्रयोग पर देखा जा सकता है और इस तरह के जीन नाम, ठिकाना रूप में इसी तरह गुण होते हैं, उपभेदों / स्थिति के बीच तुलना, पी मूल्य और q मान सहित पर परिवर्तन (log2 पैमाने में) और साथ ही सांख्यिकीय आंकड़ों गुना। इन फ़ाइलों में डेटा मतभेद के सांख्यिकीय महत्व के आधार पर या जीन अभिव्यक्ति में परिवर्तन गुना (परिमाण और परिवर्तन की दिशा, उर्ध्वप्रवाह में के रूप में या डाउन- विनियमित जीन) क्रमबद्ध किया जा सके और उपयोगकर्ताओं की आवश्यकताओं के अनुसार चालाकी से। विभिन्न जीन पहचानकर्ता के बीच रूपांतरण की जरूरत है (जैसे, Wormbase जीन आईडी बनाम cosmid संख्या), Biomart (पर उपलब्ध उपकरणों http://www.biomart.org/ ) उपयोग किया जा सकता।

3. जीन आंटलजी (GO) टर्म विश्लेषण डेविड का उपयोग कर

वेबसाइट ज से पहुंच डेविडttps: //david.ncifcrf.gov/। वेबपेज के शीर्षक में 'प्रारंभ विश्लेषण' पर क्लिक करें। में 'चरण 1', कॉपी और पेस्ट बॉक्स ए में आकाशगंगा से प्राप्त जीन की सूची 'चरण 2' का चयन करें 'Wormbase जीन आईडी' में इनपुट जीन के लिए पहचानकर्ता के रूप में।
नोट: डेविड सबसे सार्वजनिक रूप से उपलब्ध एनोटेशन श्रेणियों पहचानता है, इसलिए अन्य जीन पहचानकर्ता (जैसे Entrez जीन आईडी या जीन प्रतीक के रूप में) का भी इस्तेमाल किया जा सकता है।
'चरण 3' में, 'जीन सूची' (जीन का विश्लेषण किया जाए) के तहत 'सूची प्रकार' चुनते हैं और फिर 'सबमिट सूची' आइकन पर क्लिक करें।
नोट: 'विश्लेषण जादूगर', सभी हाइपरलिंक डेविड उपकरण है कि अपलोड जीन सूची पर चलाया जा सकता है (चित्रा 3) सूची खुल जाएगा। उपयोगकर्ता की आवश्यकता के अनुसार प्रासंगिक इसी मॉड्यूल का उपयोग करने के लिए इन लिंक पर क्लिक करें। उपकरण दिए गए कार्य के लिए उपयुक्त की पहचान करने के लिए, पर क्लिक करें 'कौन सा डेविड उपकरणों का उपयोग करने? 'लिंक पर ; विश्लेषण जादूगर 'पृष्ठ। शीर्षक में 'प्रारंभ विश्लेषण' लिंक पर क्लिक करें विश्लेषण के दौरान किसी भी बिंदु पर 'विश्लेषण जादूगर' के मुख पृष्ठ पर वापस जाने के लिए।

चित्र तीन
चित्र 3: डेविड विश्लेषण जादूगर वेबपेज और ऑपरेशन आउटपुट के उदाहरण के लेआउट। 'विश्लेषण जादूगर' वेब उपयोगकर्ता इंटरफ़ेस विभिन्न मापदंडों के आधार संवर्धन के लिए अपलोड की गई जीन सूची का विश्लेषण करने के लिए इस्तेमाल उपकरण सूचीबद्ध करता है। इन उपकरणों पर क्लिक करने से एक नया वेब पेज में विश्लेषण डेटा की रिपोर्ट। 'जीन कार्यात्मक वर्गीकरण', 'कार्यात्मक एनोटेशन चार्ट' और 'कार्यात्मक एनोटेशन क्लस्टरिंग' से उत्पन्न सारणीबद्ध रिपोर्टों के उदाहरण के रूप में सन्निवेश वाली (तीर) दिखाए जाते हैं।> यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

कार्यात्मक एनोटेशन टूल 1: कार्यात्मक एनोटेशन क्लस्टरिंग
1. सारांश पृष्ठ पर जाने के लिए 'कार्यात्मक एनोटेशन क्लस्टरिंग' मॉड्यूल पर क्लिक करें। डिफ़ॉल्ट एनोटेशन श्रेणियों रखें और ऐसी ही कोई टिप्पणी उनके संवर्धन स्कोर की श्रेणी में रखा शर्तों के समूहों उत्पन्न करने के लिए 'कार्यात्मक एनोटेशन क्लस्टरिंग' पर क्लिक करें।
2. प्रत्येक शब्द का हाइपरलिंक नाम पर क्लिक करें यह और 'आर टी' (संबंधित शब्दों) इसी तरह की अन्य श्रेणी से संबंधित शब्दों को सूचीबद्ध करने के बारे में विवरण को पढ़ने के लिए।
3. एक शब्द है और लाल 'जी' सब एक क्लस्टर के भीतर सभी शर्तों के साथ जुड़े जीन सूची के साथ जुड़े जीन सूची बैंगनी पट्टी पर क्लिक करें।
4. सभी जीन और एक क्लस्टर में पदों की एक दो आयामी दृश्य देखने के लिए हरे रंग के आइकन पर क्लिक करें।
  नोट: पिछले तीन स्तंभों की सूची प्रत्येक के लिए विश्लेषणात्मक और सांख्यिकीय परिणामअवधि। इस के लिए परिणाम और अन्य सभी एनालिटिक्स 'फ़ाइल डाउनलोड' लिंक पर क्लिक करके एक .txt प्रारूप में डाउनलोड किया जा सकता है।
कार्यात्मक एनोटेशन टूल 2: कार्यात्मक एनोटेशन चार्ट
1. सारांश पृष्ठ पर लौटें और काफी overrepresented जैविक शर्तों (जैसे प्रतिलेखन कारक गतिविधि या काइनेज गतिविधि) जीन सूची से संबद्ध पहचान करने के लिए 'कार्यात्मक एनोटेशन चार्ट' पर क्लिक करें।
2. अवधि नाम पर क्लिक करें अधिक विस्तृत जानकारी और 'आर टी' (संबंधित शब्दों) अन्य संबंधित शब्दों की सूची को पाने के लिए।
3. व्यक्तिगत श्रेणी इसी के सभी संबद्ध जीन सूची बैंगनी पट्टी पर क्लिक करें।
  ध्यान दें: अंतिम दो कॉलम प्रत्येक श्रेणी के लिए सूची सांख्यिकीय परीक्षण 'का परिणाम है।
कार्यात्मक एनोटेशन उपकरण 3: कार्यात्मक एनोटेशन टेबल
1. सारांश पृष्ठ पर लौटें और 'कार्यात्मक पर क्लिक करेंएनएएल एनोटेशन टेबल 'सब किसी भी सांख्यिकीय गणनाओं के बिना एक सूची पर जीन के साथ जुड़े एनोटेशन की एक सूची देखने के लिए।
  ध्यान दें: यह उपकरण एक सूची के जीन-दर-जीन विश्लेषण के लिए उपयोगी हो सकता है या विशिष्ट, अत्यधिक दिलचस्प जीन को देखने के लिए।
जीन कार्यात्मक वर्गीकरण उपकरण
1. 'विश्लेषण जादूगर' के लिए वापस जाएँ और उनके 'संवर्धन स्कोर', सूची में जीन समूह के समग्र संवर्धन का एक उपाय के अनुसार के रूप में स्थान जीन की कार्यात्मक रूप से संबंधित समूहों में इनपुट जीन सूची अलग करने के लिए 'जीन कार्यात्मक वर्गीकरण' मॉड्यूल पर क्लिक करें।
2. जीन समूह के कार्यात्मक संबंधित जीन प्रकट करने के लिए अधिक विस्तृत जानकारी और 'आरजी' प्राप्त करने के लिए अवधि नाम पर क्लिक करें
3. जुड़े जीव विज्ञान और सभी जीनों और पदों की एक दो आयामी दृश्य देखने के लिए हरे रंग के आइकन सूची लाल 'टी' (शब्द रिपोर्ट) पर क्लिक करें।
जीन-नामबैच व्यूअर
1. 'विश्लेषण जादूगर' के लिए वापस जाएँ और उनके इसी जीन नाम में 'Wormbase जीन आईडी' का अनुवाद करने में 'जीन-नाम बैच व्यूअर' पर क्लिक करें। (WBGene00022855 = tcer -1)।
2. अधिक जीन-विशिष्ट जानकारी प्राप्त करने के लिए जीन नाम पर क्लिक करें।
3. 'आरजी' पर क्लिक करें (संबंधित जीन) प्रत्येक जीन के बगल में जीन प्रकट करने के लिए लिंक कार्यात्मक हित के जीन से संबंधित होने की भविष्यवाणी की।

एन सी बी आई अनुक्रम पढ़ें आर्काइव पर 4. अपलोड हो रहा है कच्चे डेटा (एसआरए)

साइन में एसआरए वेबपेज तक पहुँचने के एन सी बी आई 'क्लिक करने के लिए या एक नया खाता रजिस्टर।
'Bioproject' पर क्लिक करें।
'का उपयोग Bioproject' बाईं तरफ के शीर्षक के अंतर्गत 'प्रस्तुत' पर क्लिक करें।
विकल्प 'नई प्रस्तुत' का चयन करें। सबमिटर का ब्यौरा अपडेट। शेष सात टैब के माध्यम से जारी रखें, प्रयोग और डेटा के विवरण में भरने अपलोड किया जा रहा। 'सबमिट' क्लिक जब पूरा किया।
नोट: पांचवें 'Biosample' टैब में, 'Biosample' खाली के लिए स्लॉट छोड़ दें।
'मेरे सबमिशन' लिंक पर क्लिक करके प्राप्त होने वाले पृष्ठ ताज़ा करें। सबमिट किए गए डेटा एक नियत प्रस्तुत नंबर, संक्षिप्त विवरण और अपलोड स्थिति के साथ सूचीबद्ध किया जाएगा।
इस पेज के शीर्ष पर 'Biosample' पर क्लिक करें, 'एक नया प्रस्तुत करने शुरू' बॉक्स में और एक 'नया प्रस्तुत' पैदा करते हैं। प्रत्येक नमूने के लिए अलग से प्रस्तुतियाँ जमा करें।
4.4 में 'Bioproject' के साथ मामले में, सबमिटर के विवरण को अद्यतन और टैब प्रत्येक टैब के विवरण में भरने के बाकी के माध्यम से जारी है। एक बार जब समीक्षा पूरी कर ली और क्लिक 'सबमिट'।
पर नेविगेट करें http: //www.ncbi.nlm.nih.gov / एसआरए अंतिम 'अनुक्रम पढ़ें आर्काइव (एसआरए)' प्रस्तुत बनाने के लिए।
के तहत 'प्रारंभ करना' 'एसआरए के लिए लॉग इन' पर क्लिक करें।
अगले पृष्ठ पर 'एन सी बी आई पीडीए' लिंक पर क्लिक करें। एक 'अद्यतन प्राथमिकताएं' लिंक खुल जाएगा। फ़ॉर्म को पूरा करें और क्लिक 'प्राथमिकताएं सहेजें'।
वाले पृष्ठ पर, 'नया बनाएँ प्रस्तुत' लिंक पर क्लिक करें। 'उपनाम' के तहत एक उपयुक्त नाम दर्ज करें और 'सहेजें' पर क्लिक करें। प्रस्तुत आईडी और अन्य विवरण के साथ एक मेज बनाया जाएगा।
पर 'नया प्रयोग' पर क्लिक करें और प्रत्येक 'BioSample' के लिए रजिस्टर कम से कम एक अद्वितीय अनुक्रमण पुस्तकालय।
यह निर्दिष्ट और लिंक 'BioProject' पहले बनाया था और 'BioSample' प्रस्तुत पहचान पत्र। ए 'नया प्रयोग' बनाया जाएगा।
पृष्ठ के तल पर 'नई भागो' पर क्लिक करेंबाद एसआरए प्रयोग किया जाता और डेटा फ़ाइलों को इससे जुड़े होने की जरूरत है कि पहचान की गई है।
प्रत्येक डेटा फ़ाइल का MD5 योग की गणना करें। किसी Macintosh टर्मिनल पर ऐसा करने के लिए आवेदन / उपयोगिताओं / टर्मिनल पर जाएँ। टर्मिनल में, 'md5 (उद्धरणों के बिना) में टाइप फिर एक रिक्ति। खींचें और फ़ाइलों खोजक से टर्मिनल में अपलोड की गई और 'Enter' क्लिक करने की जरूरत है ड्रॉप।
टर्मिनल अल्फानुमेरिक MD5 योग वापस आ जाएगी। फ़ाइल अपलोड करने के लिए प्रस्तुत करने की प्रक्रिया के हिस्से के रूप में इस डालें। FTP का उपयोग करके फ़ाइलों को अपलोड करने यूज़रनेम और पासवर्ड प्रणाली द्वारा प्रदान का उपयोग करें।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

सी.एलेगन्स में, germline स्टेम सेल (GSCs) उम्र फैली हुई है, के उन्मूलन तनाव लचीलापन बढ़ाता है, और शरीर में वसा ^{^24,} ²⁸ उठ। GSCs न लगना, या तो लेजर पृथक से या इस तरह के जीएलपी -1 के रूप में म्यूटेशन के कारण पैदा हुए, प्रतिलेखन के एक नेटवर्क के कारकों ²⁹ के सक्रियण के माध्यम से जीवन काल विस्तार का कारण बनता है। एक ऐसा ही पहलू, TCER -1, मानव प्रतिलेखन बढ़ाव और स्प्लिसिंग कारक, TCERG1 ³⁰ कीड़ा homolog encodes। निम्नलिखित प्रतिनिधि परिणाम दर्शाते हैं कि कैसे आरएनए Seq जीन जिसका अभिव्यक्ति TCER -1 / TCERG1 से ठीक किया जाता है हमारे हाल ही में प्रकाशित एक अध्ययन ³¹ में germline हानि निम्नलिखित की पहचान के लिए इस्तेमाल किया गया था। की transcriptomes उम्र से मिलान, दिन जीएलपी -1 और tcer -1 के 2 वयस्क; जीएलपी -1 उत्परिवर्ती तुलना में किया गया था। प्रत्येक तनाव के लिए, mRNA दो जैविक प्रतिकृति से पृथक किया गयाट (चार नमूने पूरी तरह से) प्रोटोकॉल में खंड 1. शाही सेना के नमूने वर्णित का उपयोग कर एक व्यावसायिक सेवा प्रदाता है कि चार नमूनों से सीडीएनए पुस्तकालयों तैयार और 50 बीपी एकल अंत अनुक्रमण प्रदर्शन के लिए भेज दिया गया था। खंड 2.1 में वर्णित के रूप में कच्चे NGS डेटा डाउनलोड किया गया था।

पोस्ट अनुक्रमण डेटा मूल्यांकन

तालिका 1 परीक्षण के परिणाम का एक संकलन के कच्चे अनुक्रमण पढ़ता गुणवत्ता का आकलन है। 'FASTQ' गुणवत्ता की जांच विश्लेषण पर प्रकाश डाला गया कोई 'खराब गुणवत्ता' के साथ पठित दृश्यों की संख्या 48-49% जीसी सामग्री और एक निरंतर अनुक्रम 51 बीपी के पढ़ लंबाई के साथ पढ़ता है। यह कदम भी इस तरह के Kmer सामग्री के रूप में कई अन्य सुविधाओं के लिए अनुक्रमण डेटा की जाँच करता है और सामूहिक रूप से कुल 11 परीक्षण से बना है। सी.एलेगन्स जीनोम ~ 100 MBP है। अनुक्रमण की संख्या के आधार पर प्रत्येक नमूने कि जीनोम को मैप किया, जी से पढ़ताenome कवरेज (अंतिम स्तंभ) लैंडर / वाटरमैन समीकरण 'सी = एल.एन. / जी', जिसमें, सी कवरेज के लिए खड़ा है का उपयोग कर अनुमान लगाया गया था, जी अगुणित जीनोम लंबाई है, एल पढ़ने लंबाई है और एन पढ़ता की संख्या है। हम सभी चरणों के लिए डिफ़ॉल्ट पैरामीटर का उपयोग किया और 48 प्राप्त - सभी नमूनों में 49% जीसी सामग्री। देखा जा सकता है, जीनोम कवरेज के नमूनों में 11x को 9x के बीच था।

TCER -1 की पहचान / TCERG-1-विनियमित आकाशगंगा पर विभेदक जीन एक्सप्रेशन विश्लेषण द्वारा जीन

2.2 2.4 करने के लिए वर्गों में विस्तृत चरणों के माध्यम से, आकाशगंगा पाइपलाइन ³ जीन भिन्न जीएलपी -1 और tcer -1 के बीच व्यक्त की एक सूची प्राप्त करने के लिए इस्तेमाल किया गया, जीएलपी -1 उत्परिवर्ती। गैलेक्सी प्रत्येक तनाव के लिए दो प्रतिकृति से NGS डेटा गठबंधन करने के लिए हमें सक्षम है और अंतर विश्लेषण सारणीबद्ध फ़ाइलें उत्पन्न करने के लिए किया जीनोम विस्तृत अभिव्यक्ति जनसंपर्क पर प्रकाश डालाofile। परिमाण और कम से कम 0.05 की पी मूल्य में कम से कम एक गुना परिवर्तन की एक सीमा का उपयोग करना, 835 जीन है कि भिन्न दो उपभेदों के बीच व्यक्त किया गया की एक सूची ³¹ जनरेट किया गया था। विनियमित (476 नीचे जीन जिसका प्रतिलेखन जीएलपी -1 उत्परिवर्ती (359 उत्तर प्रदेश जीन जिसका प्रतिलेखन संभावना से बढ़ जाती है TCER -1 / TCERG1) या; सूची जीनों की अभिव्यक्ति tcer -1 में नीचे-विनियमित किया गया था कि क्या के आधार पर विभाजित किया गया था संभावना TCER -1 / TCERG1 द्वारा दमित है) जीएलपी -1 (चित्रा 4) की तुलना में।

चित्रा 4
चित्र 4: आकाशगंगा (ए) और डेविड (बी) के परिणाम का विश्लेषण करती है: जर्मलाइन कम सी में TCER -1 / TCERG1 विनियमित जीन की पहचान का उपयोग कर शाही सेना Seq म्यूटेंट एलिगेंस। (ए) की तुलना आरएनए Seq डेटा की विभेदक जीन अभिव्यक्ति विश्लेषणजीएलपी -1 और tcer -1 के transcriptomes; जीएलपी -1 835 जीनों की कुल, जिनमें से 359 TCER -1 / TCERG1 (उत्तर प्रदेश) द्वारा विनियमित किया जा रहा के रूप में पहचान की गई और 476 के रूप में TCER -1 द्वारा नीचे विनियमित झुकेंगे / TCERG1 (नीचे)। (बी) TCER -1 / TCERG1 डेविड का उपयोग कर लक्ष्य के रूप में पहचान की जीन की 'कार्यात्मक एनोटेशन क्लस्टरिंग' विश्लेषण के परिणाम। दोनों विनियमित (उत्तर प्रदेश) और नीचे विनियमित (नीचे) TCER -1 / TCERG1 लक्ष्यों की वर्गों के लिए जैविक प्रक्रियाओं का प्रतिशत संवर्धन। ग्राफिक यहाँ दिखाया गया है समृद्ध जीन समूह (X- अक्ष) और उनके संबंधित प्रतिशत संवर्धन (Y- अक्ष) डेविड विश्लेषण के उत्पादन के रूप में प्राप्त की साजिश रचने के द्वारा प्राप्त की है। अमृत एट अल से संशोधित चित्रा। ³¹ और अनुमति के साथ reproduced। यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें।

TCER -1 / TCERG1 लक्ष्यों में समृद्ध जीन वर्गों के एक सिंहावलोकन प्राप्त करने के लिए, हम डेविड का उपयोग कर जीन सत्तामीमांसा (GO) अवधि विश्लेषण किया। TCER -1 / उत्तर प्रदेश TCERG1 विनियमित और नीचे जीन सूचियों डेविड पर स्वतंत्र रूप से अपलोड की गई और खंड में वर्णित के रूप में 3. छोटे जीन और कोशिकीय प्रक्रियाओं TCER -1 / TCERG1 पहले ³⁰ द्वारा लक्षित के बारे में जाना जाता था विश्लेषण किया गया है, तो हम डेविड पाया विश्लेषण विशेष रूप से खुलासा और सहायक हो। उत्तर प्रदेश जीन की कार्यात्मक एनोटेशन विश्लेषण> 1.3 के संवर्धन स्कोर, उच्चतम साइटोक्रोम P450 एंजाइम-एन्कोडिंग जीन और जीनोबायोटिक प्रतिक्रिया जीन, लिपिड संशोधनों में फंसाया जीन द्वारा पीछा सहित के साथ पांच एनोटेशन क्लस्टर का पता चला। यह है कि पहचान समूहों समान molecula का श्रेय जीन कार्यात्मक वर्गीकरण विश्लेषण के परिणामों से प्रबलित किया गया थामहत्वपूर्ण संवर्धन स्कोर के साथ आर गतिविधियों। स्प्रेडशीट का उपयोग करना, पहचान समूहों उनके संबंधित संवर्धन स्कोर (चित्रा 4) के खिलाफ प्लॉट किए जाते थे। हमारे पिछले डेटा सुझाव दिया है कि TCER -1 / TCERG1 संरक्षित दीर्घायु प्रतिलेखन कारक, DAF -16 / FOXO3A साथ कार्य किया, GSC कम वयस्कों ³⁰ दीर्घायु को बढ़ावा देने के। DAF -16 / FOXO3A, बारी में, हाल के अध्ययनों से ^{^27,} ^{^32,} ³³ में लिपिड चयापचय modulating में फंसाया गया है। इस सबूत, और डेविड में संभावित TCER -1 / TCERG1 लक्ष्य के रूप में लिपिड चयापचय जीन और रास्ते की पहचान के आधार पर विश्लेषण करती है, हम विस्तृत यंत्रवत अध्ययनों के लिए शाही सेना Seq अध्ययन में पहचान की वसा चयापचय जीन पर जोर दिया। इस नेतृत्व, और बाद में आणविक, आनुवंशिक जैव रासायनिक, और कार्यात्मक प्रयोग के माध्यम से के बाद, हम दिखा दिया कि TCER -1 DAF -16 / FOXO3A के साथ / TCERG1 coordinately enhanदोनों लिपिड अपचयी और germline नुकसान ³¹ के जवाब में उपचय प्रक्रियाओं ced। इसी तरह, नीचे के कार्यात्मक एनोटेशन क्लस्टरिंग TCER -1 / TCERG1 cytoskeletal काम करता है, विकास, प्रजनन और उम्र बढ़ने के सकारात्मक नियमन के लिए समृद्ध एनोटेशन क्लस्टर पहचान लक्ष्य (चित्रा 4)। इन टिप्पणियों, और हमारे समर्थन प्रयोगात्मक सबूत बताते हैं कि germline नुकसान पर, TCER -1 / TCERG1 भी दैहिक कोशिकाओं में वृद्धि और प्रजनन शरीर क्रिया विज्ञान के साथ ही विरोधी दीर्घायु जीन ³¹ की अभिव्यक्ति represses।

नमूना	कुल दृश्यों	लंबाई	% जीसी	कुल पढ़ता है (आकाशगंगा)	मैप किए गए रीड के लिए (आकाशगंगा)	जीनोम कवरेज
जीएलपी -1	4000000	51	49	20700539	~ 16,000,000	11x
जीएलपी -1; tcer -1	4000000	51	49	18055444	~ 13,000,000	9x
जीएलपी -1	4000000	51	48	18947463	~ 14,000,000	10x
जीएलपी -1; tcer -1	4000000	51	48	13829643	~ 10,000,000	7x

तालिका 1: शाही सेना Seq नमूना विवरण। कच्चे डेटा विशेषताओं के संकलन का मूल्यांकन के बाद अनुक्रमण अनुक्रमण रन की सफलता की पुष्टि करने के लिए। प्रतिनिधि प्रयोग से अनुक्रमण डेटा, दो जैविक शर्तों के होते हैं एक नियंत्रण तनाव (जीएलपी -1 (tcer -1, जीएलपी -1) दो जैविक प्रत्येक के लिए अनुक्रम प्रतिकृति के साथ। 49% जीसी सामग्री और 51bp की एक निरंतर अनुक्रम पढ़ लंबाई - 'FastQC' गुणवत्ता की जांच विश्लेषण नहीं "खराब गुणवत्ता" पढ़ता है, 48 के साथ पठित दृश्यों की संख्या पर प्रकाश डाला गया। संशोधित और अमृत एट अल से अनुमति के साथ reproduced। ^31।

पूरक फ़ाइल: संक्षिप्त में कमान श्रृंखला उपकरणों के लिए शाही सेना Seq डेटा विश्लेषण के लिए गैलेक्सी पाइप लाइन पर चलते हैं। इस फाइल को डाउनलोड करने के लिए यहां क्लिक करें।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

आधुनिक जीव विज्ञान में आकाशगंगा अनुक्रमण मंच का महत्व

आकाशगंगा परियोजना की प्रक्रिया और एक तेज और कुशल तरीके से उच्च throughput अनुक्रमण डेटा का विश्लेषण करने जैव सूचना विज्ञान प्रशिक्षण के बिना जीव की मदद करने में महत्वपूर्ण भूमिका निभाई हो गया है। एक बार एक अत्यंत कठिन कार्य माना जाता है, इस सार्वजनिक रूप से उपलब्ध मंच जटिल जैव सूचना विज्ञान एल्गोरिदम चल NGS डेटा एक, सरल, विश्वसनीय, और आसान प्रक्रिया का विश्लेषण करने के लिए बनाया गया है। इसके अलावा जैव सूचना विज्ञान उपकरण की एक विस्तृत श्रृंखला की मेजबानी से, आकाशगंगा के लिए सफलता की कुंजी भी अपने यूजर इंटरफेस की सादगी है कि एक सहज और निर्बाध ढंग से जटिल अनुक्रमण विश्लेषण के विभिन्न पहलुओं को एक साथ लेस है। इन सुविधाओं के कारण, आकाशगंगा पाइपलाइन जीव के बीच व्यापक उपयोग हासिल कर ली है, सी.एलेगन्स शोधकर्ताओं भी शामिल है। शाही सेना Seq विश्लेषण पाइपलाइन के साथ उपयोगकर्ता परिचित के अलावा, आकाशगंगा भी नींव रखना बुनियादी जीव समझ के लिए मदद करता हैडेटा विश्लेषण की अवधारणा और इसमें शामिल उपकरण को समझते हैं। यह ज्ञान उपयोगकर्ता primes आगे शायद इस तरह के 'आर' और 'अजगर' के रूप में और अधिक जटिल जैव सूचना विज्ञान प्लेटफार्मों आगे बढ़ाने के लिए। आकाशगंगा के अलावा, अन्य उपकरण और संकुल व्यावसायिक रूप से और खुला स्रोत समाधान है, जो शाही सेना Seq विश्लेषण के लिए इस्तेमाल किया जा सकता के रूप में उपलब्ध हैं। वाणिज्यिक विकल्प स्टैंड-अलोन अक्सर कर रहे हैं सॉफ्टवेयर संकुल है कि उपयोगकर्ता के अनुकूल हैं, लेकिन अलग-अलग शोधकर्ताओं NGS अक्सर उपयोग नहीं करते के लिए महंगा हो सकता है। वैकल्पिक रूप से, इस तरह के BioWadrobe ³⁴ के रूप में खुला स्रोत प्लेटफार्मों और ArrayExpressHTS ³⁵ कमांड लाइन और चल स्क्रिप्ट, जो गैर bioinformaticians के लिए महत्वपूर्ण चुनौतियां खड़ी की कार्यसाधक ज्ञान की आवश्यकता है। इसलिए, आकाशगंगा एक लोकप्रिय और अत्यावश्यक संसाधन बनी हुई है।

प्रोटोकॉल के भीतर महत्वपूर्ण चरणों

आकाशगंगा और डेविड की सरल फायदे होते हुए भी, एक सफल आरएनए Seq प्रयोग अभी भीसावधान डिजाइन और प्रयोगात्मक कदम के निष्पादन पर मौलिक रूप से निर्भर करता है। उदाहरण के लिए, यह आरएनए Seq द्वारा दो उपभेदों की तुलना से पहले आनुवंशिक एकरूपता सुनिश्चित करने के लिए है, और निर्धारित करने के लिए अगर वहाँ विकास दर में अंतर कर रहे हैं महत्वपूर्ण है। उम्र से मिलान उपभेदों से अलग शाही सेना के साथ-साथ महत्वपूर्ण है। इसी तरह, एक ही तनाव के भीतर जीन अभिव्यक्ति की परिवर्तनशीलता के लिए खाते, यह महत्वपूर्ण प्रत्येक तनाव के दो या अधिक 'जैविक प्रतिकृति' चलाने के लिए है। यह अनिवार्य रूप से बढ़ रही है और तनाव के कारण कटाई कीड़े, कम से कम twoindependent प्रयोगों में अनुक्रम किया जा रहा है, हालांकि तीन जैविक प्रतिकृति की सिफारिश की मानक है का मतलब है। गैलेक्सी कई जैविक प्रतिकृति से डेटा को एकीकृत इतना है कि उपभेदों के बीच सूचना दी जीन अभिव्यक्ति मतभेद बस 'के भीतर नमूना' परिवर्तनशीलता का एक परिणाम नहीं हैं।

एक महत्वपूर्ण डिजाइन निर्णय एकल अंत बनाम बनती अंत अनुक्रमण के उपयोग के बारे में है। साथ मेंएकल अंत अनुक्रमण, प्रत्येक खंड अनुक्रम है uni-दिशात्मक तो प्रक्रिया, तेजी से होता है सस्ता और ट्रांस्क्रिप्शनल रूपरेखा के लिए उपयुक्त है। बनती अंत अनुक्रमण में, एक बार टुकड़ा एक छोर से दूसरे करने के लिए अनुक्रम है, अनुक्रमण के दूसरे दौर के विपरीत दिशा में फिर से शुरू किया गया है। यह अधिक गहराई से डेटा और जीनोम के अतिरिक्त स्थिति की जानकारी प्रदान करता है, तो नए सिरे से जीनोम समूह, नए एसएनपी पहचान के लिए और epigenetic संशोधनों, विलोपन, सम्मिलन, और व्युत्क्रम की पहचान करने के लिए अधिक उपयुक्त है। इसी तरह, की कुल संख्या पढ़ता है और जीनोम पर्याप्त अंतर अभिव्यक्ति के अध्ययन के लिए आवश्यक कवरेज की सीमा संदर्भ निर्भर है। इस तरह के जीवाणु और कवक के रूप में छोटे जीनोम,, के लिए ~ 5 लाख पढ़ता पर्याप्त,, कीड़े में है, जबकि और मक्खियों ~ 10 लाख पढ़ता पर्याप्त कवरेज प्रदान करते हैं। इस तरह के चूहों और मनुष्य के रूप में बड़े जीनोम के साथ जीवों के लिए, 15-25 दस लाख पढ़ता आवश्यक सीमा है। इसके अलावा, पढ़ने संख्या और कवरेज के लिए, यह भी इम्प हैortant संदर्भ जीनोम को संरेखित कि NGS के सबसे पढ़ता है। के <70% पढ़ता एक संरेखण गरीब NGS या दूषित पदार्थ की उपस्थिति का संकेत है। कुल मिलाकर, सी के लिए शाही सेना Seq पढ़ाई एलिगेंस, तीन जैविक प्रतिकृति 50 बीपी यूनिडायरेक्शनल अनुक्रमण में ~ 10-15 मिलियन पढ़ता है जिसके परिणामस्वरूप और ~ प्रत्येक नमूने के लिए 5-10X जीनोम कवरेज का एक आदर्श उद्देश्य है साथ अनुक्रम।

आकाशगंगा का उपयोग कर में आसानी के बावजूद, कुछ बिंदुओं के लिए एक चिकनी और गड़बड़ मुक्त डेटा विश्लेषण अनुभव प्रदान करने के याद करने के लिए कर रहे हैं। उद्देश्य और उपयोग किए गए विभिन्न उपकरण के कामकाज की एक बुनियादी समझ है करने के लिए उपयोगकर्ता यह आवश्यक है। प्रत्येक आकाशगंगा उपकरण मापदंडों का चयन की आवश्यकता है और उपकरण को समझने के उपयोगकर्ता प्रयोग की आवश्यकता के आधार पर सेटिंग को अनुकूलित में मदद मिलेगी। गैलेक्सी सहायता पृष्ठों हर पैरामीटर समझाने और यह अनुशंसित है कि उपयोगकर्ता इन विवरणों का अवलोकन परीक्षण चर पर फैसला करने के लिए।

जीन सूची प्राप्त पीost आरएनए Seq विश्लेषण जब तक यह डेविड का उपयोग कर जैविक रूप से प्रासंगिक डेटा के लिए खनन किया जाता है केवल जीन की एक सूची है। यह एक महत्वपूर्ण व्यायाम है कि जैविक प्रक्रिया आधारित परिणामों में अलग-अलग जीन आधारित डेटा परिवर्तित करता है। शाही सेना Seq जीन सूची विभिन्न एनालिटिक्स डेविड प्रदान करता है का उपयोग कर तलाश इसलिए प्रोटोकॉल का एक अभिन्न और महत्वपूर्ण हिस्सा है।

संशोधन, समस्या निवारण और सीमाएं

NGS डेटा विश्लेषण के साथ एक आम गड़बड़ कार्य या परीक्षण है कि असफल, विशेष रूप से गुणवत्ता नियंत्रण चरणों में है। परीक्षण है कि FastQC एक नमूना पर चलता है की, कुछ ऊपर आ सकता है के रूप में विफल रहा है। बहरहाल, यह अनिवार्य रूप से नमूना fastq गुणवत्ता मानकों को पूरा नहीं करता है मतलब यह नहीं है। असफलता एक वैकल्पिक व्याख्या है कि ध्यान से पता लगाया जाना चाहिए हो सकता था।

उदाहरण के लिए, यदि 'प्रति आधार अनुक्रम सामग्री' परीक्षण में विफल रहता है (सुझाव दे जो 10% से अधिक अंतर नहीं हैकिसी भी स्थिति में अड्डों), oligodt पुस्तकालय तैयारी के लिए विधि की जाँच करें। पिछले काम से पता चला है Illumina NGS पुस्तकालयों परीक्षण विफल नमूना के कारण कुछ ठिकानों के लिए एक पूर्वाग्रह है करने के लिए अनुक्रम की जा रही 13 ^वीं आधार के लिए एक प्रवृत्ति हो सकती है। इसी तरह, 'Kmer सामग्री' परीक्षण की विफलता कभी कभी यादृच्छिक प्राइमरों की एक अधूरी नमूने के कारण तथ्य यह है कि यादृच्छिक भड़काना से प्राप्त पुस्तकालयों लगभग हमेशा शुरू में Kmer पूर्वाग्रह दिखाई देगा के लिए जिम्मेदार ठहराया जा सकता है। इसलिए, यह प्रयोग के भाग्य का निर्धारण करने से पहले इन और विश्लेषण पाइप लाइन में अन्य बाधाओं पर विचार करने के लिए महत्वपूर्ण है।

एक अन्य महत्वपूर्ण विशेषता यह है कि शाही सेना Seq डेटा विश्लेषण को प्रभावित कर सकते तेजी से और घातीय प्रगति कि NGS तरीकों और विश्लेषणात्मक सॉफ्टवेयर में घटित हो रहा है। आदर्श रूप में, एक एक समान जीन सूची दो पाइपलाइनों या एक ही पाइप के दो संस्करणों पर एक नमूना NGS डेटा का विश्लेषण करने से परिणाम की उम्मीदलाइन। हालांकि, जबकि लगातार सुधार एल्गोरिदम आरएनए Seq विश्लेषण में aberrations कम कर रहे हैं और अधिक सटीकता के जीन सूचियों का निर्माण, यह अक्सर असमानता की ओर जाता है। उदाहरण के लिए, एक ही टूलसेट के एक पुराने बनाम नए संस्करण का उपयोग काफी अलग जीन सूचियों का उत्पादन हो सकता एक नमूना NGS डेटा का विश्लेषण। एक मामूली भिन्नता उम्मीद है, लेकिन उन के बारे में पता भी कई विसंगतियां भी डिजाइन या प्रयोग के प्रदर्शन में कमजोरी को प्रतिबिंबित करता हो सकता है कि होना चाहिए।

सामूहिक रूप से, आकाशगंगा परियोजना और डेविड विश्लेषणात्मक उपकरणों रास्ता NGS डेटा जैविक रूप से प्रासंगिक जानकारी निकालने के लिए इस्तेमाल किया जा सकता बदल दिया है। यह वैज्ञानिक समुदाय के लिए स्वतंत्रता और जांच की पूरी तरह से नए स्तर पर खोला गया है, सी.एलेगन्स शोधकर्ताओं भी शामिल है। उदाहरण के लिए, अनुक्रमण के लगातार कम करने लागत बेहतर और तेज अनुक्रमण प्रौद्योगिकी के साथ मिलकर एक कीड़े के स्तर पर transcriptomics के युग में कायम कर रहे हैं,व्यक्तिगत कीड़ा ऊतकों और यहां तक कि कुछ गिने-चुने कीड़ा कोशिकाओं। इन प्रयासों NGS डेटा में नाटकीय वृद्धि उत्पन्न किया जा रहा शामिल है। इस कार्यप्रवाह के विश्लेषणात्मक अंत के साथ बने रहना एक चुनौती होगी, लेकिन इसकी बहुमुखी प्रतिभा के कारण, आकाशगंगा सी.एलेगन्स में एकल कक्ष स्तर पर शाही सेना Seq के लिए पूरे जीव transcriptomics से संक्रमण को सशक्त बनाने में महत्वपूर्ण भूमिका निभाई होने की संभावना है। ज्ञान में जिसके परिणामस्वरूप अग्रिम मौलिक जीव विज्ञान में असाधारण अंतर्दृष्टि प्रदान की संभावना है।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासे के लिए कुछ भी नहीं है।

Acknowledgments

लेखकों प्रयोगशालाओं, समूहों और व्यक्तियों, जो आकाशगंगा और डेविड का विकास किया है, और इस तरह के वैज्ञानिक समुदाय के लिए NGS व्यापक रूप से सुलभ बना दिया करने के लिए अपने आभार व्यक्त करना चाहते हैं। मदद और सलाह हमारे जैव सूचना विज्ञान प्रशिक्षण के दौरान पिट्सबर्ग विश्वविद्यालय में उनके सहयोगियों द्वारा प्रदान की स्वीकार किया है। इस काम के पुरस्कार (एजी-NS-0879-12) और राष्ट्रीय स्वास्थ्य संस्थान एजी के लिए (R01AG051659) से अनुदान एजिंग में एक एलिसन मेडिकल फाउंडेशन नई विद्वान द्वारा समर्थित किया गया।

Materials

Name	Company	Catalog Number	Comments
RNase spray	Fisher Scientific	21-402-178
Trizol	Ambion	15596026
Sonicator	Sonics Vibra Cell	VCX130
Centrifuge	Eppendorf	5415C
chloroform	Sigma Aldrich	288306
2-propanol	Fisher Scientific	A416P-4
Ethanol	Decon Labs	2705HC
RNase-free water	Fisher Scientific	BP561-1
Bioanalyzer	Agilent	G2940CA
Mac/PC