This protocol outlines a comparative de novo transcriptome assembly and annotation workflow for novice bioinformaticians. The workflow is available for free entirely through CyVerse and connected by the Data Store. Command line and graphical user interfaces are used, but all code needed is available to copy and paste.
यह वर्कफ़्लो नौसिख शोधकर्ताओं को क्वाड कंप्यूटिंग जैसे उन्नत कॉन्टैक्टेशनल संसाधनों का लाभ उठाने की अनुमति देता है जो कि जोड़ीदार तुलनात्मक ट्रांस्क्रिप्टमिक्स को संचालित करता है। यह जीव वैज्ञानिकों के लिए डेटा वैज्ञानिक कम्प्यूटेशनल कौशल विकसित करने के लिए प्राइमर के रूप में भी कार्य करता है, उदाहरण के लिए बड़े डेटा सेटों के बिश कमांड, विज़ुअलाइज़ेशन और प्रबंधन करना। सभी कमांड लाइन कोड और प्रत्येक आदेश या चरण के आगे स्पष्टीकरण विकी ( https://wiki.cyverse.org/wiki/x/dgGtAQ ) पर पाए जा सकते हैं। डिस्कवरी पर्यावरण और वायुमंडल प्लेटफार्मों को एक साथ CyVerse डेटा स्टोर के माध्यम से जुड़ा हुआ है। जैसे, प्रारंभिक कच्चे अनुक्रमण डेटा अपलोड करने के बाद, इंटरनेट कनेक्शन पर बड़ी डेटा फ़ाइलों को स्थानांतरित करने की आवश्यकता नहीं है, विश्लेषण करने के लिए आवश्यक समय की मात्रा को कम करके। यह प्रोटोकॉल केवल दो प्रयोगात्मक उपचार या शर्तों का विश्लेषण करने के लिए डिज़ाइन किया गया है। अंतर जीन अभिव्यक्ति विश्लेषण thr आयोजित किया जाता हैOugh pairwise comparisons, और कई कारकों का परीक्षण करने के लिए उपयुक्त नहीं होगा। यह वर्कफ़्लो स्वचालित रूप से स्वचालित होने के बजाय मैन्युअल रूप से तैयार किया गया है। प्रत्येक चरण को उपयोगकर्ता द्वारा निष्पादित और जांच करनी होगी, डेटा और विश्लेषणात्मक आउटपुट की बेहतर समझ प्राप्त करने और उपयोगकर्ता के लिए बेहतर परिणाम। एक बार पूरा होने पर, यह प्रोटोकॉल पहले से इकट्ठा किए जाने वाले संदर्भ जीनोम (जो आम तौर पर underserved जीव में उपलब्ध नहीं हैं) को नज़र रखने के बिना underserved (गैर-मॉडल) जीवों के लिए नव- इकट्ठे ट्रांसस्क्रिप्टम (एस) का उत्पादन करेगा। इन दो नवप्रत्यक्षोक्तियों का प्रयोग दो प्रयोगात्मक परिस्थितियों के बीच भिन्न-भिन्न जीन की जांच के लिए जोड़ीदार विभेदक जीन अभिव्यक्ति विश्लेषण में किया जाता है। विभेदित व्यक्त किए गए जीन तब आनुवंशिक प्रतिक्रियाओं को समझने के लिए कार्यात्मक रूप से एनोटेट किया जाता है प्रायोगिक स्थितियों के लिए है। कुल मिलाकर, इस प्रोटोकॉल से प्राप्त आंकड़ों का प्रयोग अंडरस्वाइड जीवों के जैविक प्रतिक्रियाओं के बारे में परिकल्पनाओं के परीक्षण के लिए किया जाता है।
होमो सेपियंस और ड्रोसोफिला मेलानोगास्टर , मस्सिकुलस और दानियो रेरिओ जैसे कई प्रमुख मॉडल प्रजातियों की प्रजातियां वर्तमान और पिछले कार्यात्मक जीनोमिक्स कामों का प्रतिनिधित्व करती हैं। हालांकि, उच्च-थ्रूपुट अनुक्रमण तकनीक की तेज़ी से कम लागत गैर-मॉडल ( उर्फ "उपेक्षित" या "निहित") पशु प्रजातियों 1 में कार्यात्मक जीनोमिक्स के लिए अवसर प्रदान कर रही है। जीनोमिक्स में यह एक महत्वपूर्ण बदलाव है क्योंकि गैर-मॉडल जीव अक्सर आर्थिक रूप से प्रासंगिक प्रजातियों ( जैसे कस्तूरी, चिंराट, केकड़े) का प्रतिनिधित्व करते हैं और मॉडल प्रजातियों में पाए गए लोगों के दायरे के बाहर उपन्यास फेनोटाइप और जैविक प्रणालियों की जांच के अवसर प्रदान करते हैं।
हालांकि अन्तर्निर्मित जीव अद्वितीय जैविक प्रणालियों की जांच के लिए एक आकर्षक अवसर प्रदान करते हैं, फिर भी कई चुनौतियों का सामना करने वाले शोधकर्ताओं को विशेष रूप से जैव-सूचनात्मक विश्लेषण के दौरान कुछ केसे चुनौतियां बड़े डेटा सेटों को संसाधित करने के लिए जन्मजात हैं, जबकि अन्य आनुवांशिक संसाधनों की कमी से उत्पन्न होती हैं, जो रेखांकित जीवों में काम करने वाले शोधकर्ताओं के लिए उपलब्ध हैं जैसे संदर्भ जीनोम, जीव विशिष्ट विशिष्टताएं, आदि । न्यूक्लिक एसिड अलगाव की चुनौतियों और अनुक्रमण अक्सर नियमित होते हैं आंकड़ों के विश्लेषण के साथ तुलना में, और जैसा कि जैवइन्फॉर्मेटिक विश्लेषण आमतौर पर अनुक्रमण परियोजनाओं 2 की सबसे दुर्लभ लागत साबित होता है। उदाहरण के लिए, एक बुनियादी अगली पीढ़ी के अनुक्रमण में बायोइनफॉर्मेटिक विश्लेषण में निम्न चरणों का समावेश हो सकता है: कच्चे अनुक्रमण की पढ़ाई और छानने की गुणवत्ता, छोटे से विधानसभाएं बड़े निकटवर्ती टुकड़ों में पढ़ती हैं, और जैविक समझ हासिल करने के लिए अन्य प्रणालियों के लिए एनोटेशन और / या तुलना करती हैं। प्रतीत होता है कि सरलता से, इस उदाहरण के वर्कफ़्लो में प्रयोगशाला-बेंच कंप्यूटर के दायरे से परे विशेष ज्ञान और कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, जो इसे गैर वैज्ञानिकों के अध्ययन के कई वैज्ञानिकों की पहुंच से बाहर रखती है,मॉडल जीव
इंटेट चुनौतियां अवसंरचना-या ज्ञान-आधारित हो सकती हैं एक क्लासिक बुनियादी ढांचा चुनौती औपचारिक कम्प्यूटेशनल संसाधनों तक पहुंच है। उदाहरण के लिए, विधानसभा और एनोटेशन कम्प्यूटेशनल गहन एल्गोरिदम पर भरोसा करते हैं जिसके लिए शक्तिशाली कंप्यूटर या कंप्यूटर क्लस्टर की आवश्यकता होती है, जिसमें बड़ी मात्रा में रैम (256 जीबी -1 टीबी) और चलाने के लिए कई प्रोसेसर / कोर होते हैं। दुर्भाग्य से, कई शोधकर्ताओं के पास या तो ऐसे कंप्यूटिंग संसाधनों तक पहुंच नहीं है या इन प्रणालियों के साथ बातचीत करने के लिए आवश्यक ज्ञान नहीं है। अन्य शोधकर्ताओं का अपने विश्वविद्यालयों या संस्थानों के माध्यम से उच्च-प्रदर्शन कंप्यूटिंग समूहों तक पहुंच हो सकती है, लेकिन इन संसाधनों तक पहुंच सीमित हो सकती है और कभी-कभी प्रति घंटे के प्रभार में परिणाम होते हैं, अर्थात वास्तविक समय की घड़ी की संख्या से गुणा सीपीयू प्रोसेसर की संख्या घंटे "जो कि प्रोसेसर चल रहे हैं अमेरिकी राष्ट्रीय विज्ञान फाउंडेशन द्वारा वित्त पोषित एक साइबर इंफ्रास्ट्रक्चर सिस्टम का लाभ उठानासिवर्स 3 के रूप में, जो शोधकर्ताओं के लिए संसाधनों की गणना करने के लिए मुफ्त पहुंच प्रदान करता है, संयुक्त राज्य अमेरिका और दुनिया भर में, बुनियादी ढांचा चुनौतियों को कम करने में मदद कर सकता है, जैसा कि यहां दिखाया जाएगा।
एक विशिष्ट ज्ञान-आधारित चुनौती का एक उदाहरण संपूर्ण विश्लेषण के लिए आवश्यक सॉफ़्टवेयर को समझना है। एक अनुक्रमण-आधारित परियोजना को प्रभावी ढंग से संचालित करने के लिए, शोधकर्ताओं को उन सॉफ़्टवेयर टूल के असंख्य से परिचित होने की आवश्यकता होती है जो कि जैवइन्फॉर्मेटिक विश्लेषण के लिए विकसित किए गए हैं। सीखना प्रत्येक पैकेज अपने दाहिनी ओर मुश्किल होता है, लेकिन तथ्य यह है कि संकुल को लगातार अपग्रेड किया जा रहा है, पुन: प्रसारित किया जाता है, नए वर्कफ़्लो में एक साथ रखा जाता है और कभी-कभी नए लाइसेंस के तहत उपयोग के लिए प्रतिबंधित हो जाता है। इसके अलावा, इन उपकरणों के इनपुट और आउटपुट को जोड़ने से कभी-कभी डेटा प्रकार को बदलने के लिए उन्हें संगठित करने की आवश्यकता होती है, वर्कफ़्लो के लिए एक अन्य उपकरण जोड़ना। अंत में, यह जानना भी मुश्किल है कि कौन सा सॉफ़्टवेयर पैकेज 'वें' हैई सबसे अच्छा 'एक विश्लेषण के लिए, और विशेष रूप से प्रयोगात्मक शर्तों के लिए सबसे अच्छा सॉफ्टवेयर की पहचान अक्सर सूक्ष्म अंतर की बात है कुछ मामलों में, सॉफ्टवेयर की उपयोगी समीक्षा उपलब्ध है, लेकिन नए अपडेट और सॉफ़्टवेयर विकल्पों की निरंतर जारी होने के कारण ये तेजी से समय से बाहर निकले हैं।
शोधकर्ताओं के लिए underserved जीवों की जांच, इन प्राकृतिक चुनौतियों एक उपन्यास जीव में डेटा का विश्लेषण से जुड़े चुनौतियों के अलावा आते हैं। जीन एनोटेशन के दौरान इन अंडरर्ज्ड जीव-विशिष्ट चुनौतियों का सबसे अच्छा उदाहरण दिया गया है। उदाहरण के लिए, underserved जीवों के पास अक्सर निकट से संबंधित मॉडल जीव नहीं होता है जो कि जीन की रचना और कार्य ( जैसे समुद्री समुद्री ग्रहण और ड्रोसोफिला ) की पहचान करने के लिए उचित रूप से उपयोग किया जा सकता है। कई जैवइन्फोर्मेटिक टूल को संरचनात्मक रूपांकनों की पहचान करने के लिए "प्रशिक्षण" की आवश्यकता होती है, जिसका उपयोग जीन फ़ंक्शन की पहचान करने के लिए किया जा सकता है। हालांकि, प्रशिक्षण डेटा आम तौर पर केवल आधुनिक के लिए उपलब्ध हैएल जीवों, और प्रशिक्षण छिपी मार्कव मॉडल (एचएमएम) जीवविज्ञान के दायरे से बाहर है, और यहां तक कि कई जैव-सूचनाकारी भी हैं। अंत में, भले ही एनोटेशन मॉडल जीवों से डेटा का उपयोग कर ले जाया जा सकता है, मॉडल जीवों से संबंधित कुछ जीन ऑटॉजोलिस तब नहीं समझते हैं जब जीवों और प्राकृतिक इतिहास के जीव विज्ञान के बारे में माना जाता है ( उदाहरण के लिए , ड्रोसोफिला से झींगा से सूचना स्थानांतरित )
इन चुनौतियों का सामना करते हुए, जैव-विज्ञान संबंधी संसाधनों को विकसित करने की जरूरत है, जो शोधकर्ताओं द्वारा विशेष रूप से मन में निहित जीवों पर नए विश्लेषण का आयोजन करते हैं। कार्यात्मक जीनोमिक्स अनुक्रमण परियोजनाओं के अगले कई वर्षों से मॉडल और अंडरबाउंड जीवों ( https://genome10k.soe.ucsc.edu/ ) के बीच की खाई को बंद करने में मदद मिलेगी, लेकिन कई उपकरण हैं जिन्हें चुनौतियों का सामना करने के लिए विकसित करने की आवश्यकता होगी ऊपर विचार किया साइवेर्स आई के पारिस्थितिक तंत्र बनाने के लिए समर्पित है Iमौजूदा साइबर इंफ्रास्ट्रक्चर और तीसरे पक्ष के अनुप्रयोगों को डेटा प्रबंधन, जैवइन्फॉर्मेटिक विश्लेषण उपकरण और जीवन वैज्ञानिकों के लिए डेटा विज़ुअलाइज़ेशन देने के लिए लिंक करके नॉर्टरफाइबिलिटी। इंटरऑपरेबिलिटी स्केलेबल कंप्यूटिंग संसाधनों को प्रदान करके जैवइन्फोर्मैटिक अनुप्रयोगों और प्लेटफॉर्म के बीच संक्रमण को आसान बनाने में मदद करता है, और फाइल प्रारूप रूपांतरण को सीमित कर रहा है और प्लेटफॉर्म्स के बीच स्थानांतरित डेटा की मात्रा। साइवरर्स डिस्कवरी एन्वायरनमेंट (डीई 4 , एटमॉसमियर 5 , और डाटा स्टोर 3) सहित कई प्लेटफार्मों की पेशकश करता है। डीई वेब-आधारित है और इसमें कई आम जैव सूचना विज्ञान विश्लेषणात्मक उपकरण हैं जो उपयोगकर्ता के अनुकूल पॉइंट-एंड-क्लिक स्वरूपों (जिसे "ऐप "), और डाटा स्टोर के लिए ग्राफिकल यूजर इंटरफेस (जीयूआई) है जहां बड़े डेटा सेट ( यानी कच्चे अनुक्रमणों को पढ़ने, इकट्ठे हुए जीनोम) को संग्रहित और प्रबंधित किया जाता है। वातावरण एक क्लाउड कंप्यूटिंग सेवा है जो शोधकर्ताओं के लिए लचीलापन बढ़ाता हैआभासी मशीन कम्प्यूटेशनल संसाधनों का उपयोग करते हुए, जिसमें पूर्व-स्थापित बायोइन्फॉर्मेटिक्स टूल की एक विस्तृत श्रृंखला है इन दोनों प्लेटफार्मों को डेटा स्टोर से लिंक किया गया है, और इन्हें वर्कफ़्लो बनाने के लिए एक साथ उपयोग किया जा सकता है जैसे कि यहां वर्णित है। यह रिपोर्ट डीओवो ट्रांस्क्रिप्टम असेंबली और अंतर जीन अभिव्यक्ति विश्लेषण वर्कफ़्लोज़ पर केंद्रित करती है, और इसके आगे जैवइन्फॉर्मेटिक विश्लेषण के विकास और संचालन के साथ जुड़े कुछ बेहतरीन अभ्यासों को संबोधित करती है। साइवरर्स ( http://www.cyverse.org/about ) के विस्तृत मिशन की विस्तृत व्याख्या और विस्तृत मंच विवरण ( http://www.cyverse.org/learning-center ) सार्वजनिक रूप से उपलब्ध हैं यहां वर्णित सभी विश्लेषण डिस्कवरी पर्यावरण 4 (डीई) और वायुमंडल 5 का उपयोग करते हैं , और उन्हें सभी कम्प्यूटेशनल स्तरों के शोधकर्ताओं के लिए सुलभ बनाने के तरीके में प्रस्तुत किया जाता है। डी वर्कफ़्लो और एटॉमोस्पलंबे समय तक उद्भव, पुन: प्रयोज्यता और प्रजननशीलता सुनिश्चित करने के लिए यूआरएल का इस्तेमाल करते हुए पूर्व छवियों को सीधे संदर्भित किया जा सकता है।
प्रोटोकॉल में पांच महत्वपूर्ण कदम हैं जो प्रत्येक मुख्य प्रोजेक्ट फ़ोल्डर ( आंकड़े 1 और 2 ) के अंदर स्वयं के अलग फ़ोल्डर बनाएंगे। सभी प्राथमिक कच्चे अनुक्रमण आंकड़े पवित्र हैं: इसे अपलोड किया जाना चाहिए और "1_Raw_Sequence" नामक पहला फ़ोल्डर में रखा जाना चाहिए और किसी भी तरह से परिवर्तित नहीं किया जाना चाहिए। डेटा को तीन तरीकों से एक में अपलोड किया जा सकता है डे इंटरफ़ेस फ़ाइलों को सीधे अपलोड करने के लिए इस्तेमाल किया जा सकता है यह डेटा अपलोड करने का सबसे आसान तरीका है, लेकिन हस्तांतरण के लिए सबसे लंबा समय लगेगा। साइबरडॉक के पास एक ग्राफिकल इंटरफ़ेस है और उपयोगकर्ताओं को डे से स्थानांतरित करने के लिए फ़ाइलों को खींचने और छोड़ने की अनुमति देता है। ICommands एक कमांड लाइन टूल है जिसे डेटा स्टोर से डेटा में स्थानांतरित करने और डेटा सेट्स प्रबंधित करने के लिए इस्तेमाल किया जा सकता है, और डेटा फ़ाइलों को स्थानांतरित करने का सबसे तेज़ तरीका है डेटा स्टोर में मौजूद सभी डेटा अन्य साइवरर्स उपयोगकर्ताओं (https://wiki.cyverse.org/wiki/display/DEmanual/Sharing+Data+Files+and+Folders+Via+the+Discove) के साथ साझा किए जा सकते हैंRy + पर्यावरण), एक जनरेटेड यूआरएल (https://wiki.cyverse.org/wiki/display/DEmanual/Sharing+Data+Files+Via+Public+Links) के माध्यम से सार्वजनिक किया गया, या सार्वजनिक रूप से और गुमनाम रूप से होस्ट किया जा सकता है ( कोई उपयोगकर्ता आवश्यक नहीं है) उपलब्ध समुदाय डेटा (http://data.iplantcollaborative.org; http://mirrors.cyverse.org)। उस फ़ोल्डर के अंदर, कच्चे अनुक्रम पढ़ा जाता है, फास्टक्यूसी (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc/) के साथ विश्लेषण किया जाता है ताकि उच्च गुणवत्ता वाले पढ़ने के लिए पढ़ने के लिए कैसे ट्रिम और फ़िल्टर किया जा सके। ट्रिमिंग और गुणवत्ता फ़िल्टरिंग के बाद फास्टक्यूसी आउटपुट की तुलना करने के लिए यह उपयोगी है कि क्या पढ़ने की गुणवत्ता बदल गई है यह निर्धारित करने के लिए कि उसे खोए बिना सूचना ( चित्रा 3 ) प्राप्त हुई है। ध्यान दें कि फास्टक्यूसी के एक्स-एक्स रेखीय नहीं है, बल्कि कई आउटपुट ग्राफों के लिए भी लगाया जाता है, जिससे परिणामों के गलत व्याख्या हो सकती है। ट्रिम और फ़िल्टर्ड पढ़ा जाता है तो वायुमंडल क्लाउड कंप्यूटिंग आवृत्ति का उपयोग करते हुए डे नवो ट्रांसस्क्रिप्टम इकट्ठा करने के लिए उपयोग किया जाता है। इसक्लाउड कंप्यूटर स्थानीय कंप्यूटर स्क्रीन, कुंजीपटल, और माउस का उपयोग करता है, लेकिन इसका स्वयं का सॉफ्टवेयर (ट्रिनिटी एंड टिनोटेट) और हार्डवेयर स्थापित है। क्लाउड कंप्यूटर उदाहरण पर चलने वाले कार्यक्रम किसी भी तरह से स्थानीय कंप्यूटर को प्रभावित नहीं करेंगे। डी न्यू विधानसभा और डाउनस्ट्रीम एनोटेशन इस वर्कफ़्लो में सबसे लंबे समय तक चलने वाले सबसे बड़े चरण होंगे। इसलिए, वे सामान्य प्रयोगशाला से साझा कंप्यूटर की समस्याओं से बचने के लिए वायुमंडल पर पूरा कर लेते हैं जो पावर आउटेज जैसी विश्लेषण में बाधा डालती हैं, रात के बाद स्वत: अपडेट के बाद पुनरारंभ होते हैं, या अन्य उपयोगकर्ताओं द्वारा की गई दुर्घटनाएं त्रिनोटेट एनोटेशन में ब्लेस्ट +8, एचएमएमईआर 9 , टीएमएचएमएम 10 और पीएफएएम 11 का इस्तेमाल होता है । एनोटेशन का अंतिम आउटपुट एक SQLite डेटाबेस और .xls फ़ाइल है। आउटपुट का उपयोग CyVerse के बाहर डाउनस्ट्रीम विश्लेषण प्लेटफार्मों में किया जा सकता है जैसे KEGG 12 , 13
यह वर्कफ़्लोडे और वायुमंडल में उपयोग करने के लिए तैयार है यह प्रत्येक विश्लेषण पैकेज को स्थापित करने, कॉन्फ़िगर करने, और समस्या निवारण के लिए समय व्यतीत करने की आवश्यकता को समाप्त करता है और प्रत्येक उपकरण की आवश्यकता होती है सभी निर्भरता। यह शोधकर्ताओं का विश्लेषण करती है, व्यर्थ प्रयास को कम करता है, और कई वैज्ञानिकों के लिए प्रवेश की बाधा को कम करता है। यह वर्कफ़्लो विशेष रूप से एकल या युग्मित-अंत को इलुमिना अनुक्रमण प्लैटफॉर्म से पढ़ता है, लेकिन अन्य प्रकार की अनुक्रमण तकनीकों को संभालने के लिए डे और वायुमंडल में कई उपकरण मौजूद हैं। इस वर्कफ़्लो में उपकरण किसी भी प्रकार की आने वाली अनुक्रमण तकनीक को नियंत्रित करने के लिए इसी वैकल्पिक टूल से आसानी से बदल सकते हैं। यह विश्लेषण उपकरणों या नए उपकरणों के नए संस्करणों के बारे में भी सच है
यह वर्कफ़्लो विशेष रूप से एक समय में केवल कुछ ट्रांसक्रिप्टोम को इकट्ठा करने, उनकी तुलना करने और एनोटेट करने के लिए डिज़ाइन किया गया है। इसलिए, तुलनात्मक जनसंख्या आनुवंशिकी के लिए कई ट्रांस्क्रिप्टमों को इकट्ठा करने के लिए उपयोगकर्ताओं को समय लगता है। विश्लेषणनिकट भविष्य में जनसंख्या आनुवांशिकी उपयोगकर्ताओं के लिए पाइपलाइन उपलब्ध होगी और पाइप लाइन के लिए लिंक विकी पृष्ठ (https://wiki.cyverse.org/wiki/x/dgGtAQ) पर पाए जा सकते हैं। अंतर जीन अभिव्यक्ति विश्लेषण चरण प्रतिकृति को संभाल सकता है, लेकिन यह एक pairwise तुलना है और सटीक रूप से कई कारकों का आकलन नहीं करेगा ( उदाहरण के लिए , समय के साथ भिन्न स्थितियों में, दो से अधिक उपचार) संदर्भ जीनोम के साथ जीवों के लिए स्वचालित वर्कफ़्लोज़ मौजूद हैं ( जैसे , TRAPLINE 14 )। जबकि स्वचालित वर्कफ़्लोज़ novices के लिए उपयोग करने में सबसे आसान हैं, डे नॉवो असेंबलियों को यहां दिए गए प्रत्येक चरण के मूल्यांकन और विचार की आवश्यकता होती है। इसके अतिरिक्त, उपयोगकर्ताओं को स्वचालित पाइपलाइनों का उपयोग करने की आवश्यकता होती है, क्योंकि वे निर्माण की जाती हैं, और इसलिए उपयोगकर्ताओं की बदलती मांगों को पूरा करने के लिए स्वाभाविक रूप से लचीला नहीं हैं।
इस प्रोटोकॉल के अधिकांश के रूप में इंटरनेट पर किया जाता है, उपयोगकर्ताओं को अपने ब्राउज़र सेटिंग्स के साथ परेशानियों का अनुभव हो सकता है। पहले तो,पॉप-अप ब्लॉकर्स विंडोज़ को बिल्कुल भी खोलने से रोक सकते हैं, या जब तक ब्राउज़र में साइवरर्स को अनुमति नहीं दी जाती है, तब तक विंडोज़ को खोलने से रोकता है। वायुमंडल दूरस्थ डेस्कटॉप तक पहुंचने के लिए VNC का उपयोग करता है, लेकिन अन्य सॉफ़्टवेयर का उपयोग किया जा सकता है यह संपूर्ण प्रोटोकॉल फ़ायरफ़ॉक्स संस्करण 45.0.2 में आयोजित किया गया था और सभी लोकप्रिय इंटरनेट ब्राउज़र के साथ काम करना चाहिए, लेकिन कुछ विसंगतियां दिखाई दे सकती हैं। ट्रिनिटी नए संस्करणों (https://github.com/trinityrnaseq/trinityrnaseq/wiki) के रिलीज के रूप में कार्यप्रवाह को अपडेट किया जाएगा। कार्यप्रवाह के बारे में नवीनतम संस्करण और अप-टू-डेट जानकारी विकी ट्यूटोरियल पृष्ठ पर मिल सकती हैं ( तालिका 1 , https://wiki.cyverse.org/wiki/x/dgGtAQ)। प्रयोक्ता सीधे समर्थन से संपर्क कर सकते हैं या कार्यप्रवाह के साथ किसी भी समस्या का निवारण करने के लिए पूछ CyVerse (ask.cyverse.org/) पर प्रश्न पोस्ट कर सकते हैं।
इस प्रोटोकॉल के प्रत्येक चरण को पूरा करने के लिए DE में कई ऐप्स मौजूद हैं। उदाहरण के लिए, उपयोगकर्ता त्रिशूल के बजाय स्कीथ (https://github.com/najoshi/sickle) को चलाने की इच्छा रख सकते हैं15 डीईएसईएक 17 , 18 के बजाय एडीआरआर 16 को ट्रिम करने या चलाने के लिए हालांकि इस पांडुलिपि के दायरे से बाहर, डे ऐप उपयोगकर्ताओं द्वारा कॉपी, संपादित और जारी किए जा सकते हैं (https://wiki.cyverse.org/wiki/display/DEmanual/Creating ,+Copying,+and+Editing+DE+ ऐप्स) या नए ऐप्स उपयोगकर्ताओं द्वारा जोड़ सकते हैं (https://wiki.cyverse.org/wiki/display/DEmanual/Dockerizing+your+Tools+for+the+CyVerse+Discovery+Environment)। वायुमंडल की छवियों को नए या संशोधित वर्कफ़्लोज़ बनाने के लिए संशोधित और संशोधित किया जा सकता है जो उपयोगकर्ताओं की आवश्यकताओं को अधिक विशिष्ट रूप से मेल खाती हैं (https://wiki.cyverse.org/wiki/x/TwHX)। यह काम डेटा को स्थानांतरित करने और विश्लेषकों को निष्पादित करने के लिए कमांड लाइन का उपयोग करने के लिए एक परिचय के रूप में कार्य करता है। उपयोगकर्ता अधिक उन्नत कमांड लाइन संसाधनों जैसे कि Cyverse अनुप्रयोग प्रोग्रामिंग इंटरफेस (एपीआई) (http://www.cyverse.org/science-apis) का उपयोग करने पर विचार कर सकते हैं, या स्वयं के डीई ऐप को डिज़ाइन कर सकते हैं, जिसे ज्ञान की आवश्यकता होती हैकैसे के बारे में विश्लेषण उपकरण कमांड लाइन पर चलाया जाता है (https://wiki.cyverse.org/wiki/display/DEmanual/Creating+a+New+App+Interface)।
The authors have nothing to disclose.
The authors would like to acknowledge funding from USDA-NIFA grant 2013-00984, NSF grant IOS – 1339156, IOS – 1444490, and CyVerse (NSF: DBI – 1265383).
Trimmomatic v0.33 | USADELLAB.org | https://github.com/timflutre/trimmomatic | https://de.iplantcollaborative.org/de/?type=apps&app-id=9c2a30dc-028d-11e6-a915-ab4311791e69 |
Sickle | Joshi and Fass | https://github.com/najoshi/sickle | https://de.iplantcollaborative.org/de/?type=apps&app-id=68b278f8-d4d6-414d-9a64-b685a7714f7c |
Trinity | Broad Institute and Hebrew University of Jersalem | https://github.com/trinityrnaseq/trinityrnaseq/wiki | https://atmo.iplantcollaborative.org/application/images/1261 |
rnaQUAST v1.2.0 | Algorithmic Biology Lab, St. Petersburg Academic University of the Russian Academy of Sciences | http://spades.bioinf.spbau.ru/rnaquast/release1.2.0/manual.html | https://de.iplantcollaborative.org /de/?type=apps&app- id=980dd11a-1666-11e6-9122- 930ba8f23352 |
Transdecoder | Broad Institute and Commonwealth Scientific and Industrial Research Organisation | https://transdecoder.github.io | https://de.iplantcollaborative.org/de/?type=apps&app-id=5a0ba87e-b0fa-4994-92a2-0d48ee881179 |
EdgeR | Robinson et al. 2010. | https://bioconductor.org/packages/release/bioc/vignettes/edgeR/inst/doc/edgeR.pdf | https://de.iplantcollaborative.org/de/?type=apps&app-id=5aa9e294-6f95-42f9-98e9-c9c96b44f499 |
Trinotate | Broad Institute and Hebrew University of Jersalem | https://trinotate.github.io/ | https://atmo.iplantcollaborative.org/application/images/1261 |