Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

पौधों में माइक्रोआरएनए ट्रांसक्रिप्टोम का सटीक और कुशलता पूर्वक विश्लेषण करने के लिए एक बायोइन्फॉर्मेटिक्स पाइपलाइन

Published: January 21, 2020 doi: 10.3791/59864
* These authors contributed equally

Summary

अद्यतन संयंत्र मिरना मानदंड और एक ओवरहाल ्ड एल्गोरिदम के साथ एक बायोइन्फॉर्मेटिक्स पाइपलाइन, अर्थात् एमआईआरदीप-पी 2 (एमआईआरपी2), पौधों में माइक्रोआरएनए ट्रांसक्रिप्टोम का सही और कुशलता से विश्लेषण कर सकती है, विशेष रूप से जटिल और बड़े जीनोम वाली प्रजातियों के लिए।

Abstract

माइक्रोआरएनए (एमआईआरएनए) 20 से 24-न्यूक्लियोटाइड (एनटी) एंडोजेनस स्मॉल आरएनए (एसआरएनसीए) बड़े पैमाने पर पौधों और जानवरों में मौजूद होते हैं जो पोस्ट-ट्रांसक्रिप्शनल स्तर पर जीन अभिव्यक्ति को विनियमित करने में शक्तिशाली भूमिका निभाते हैं। अगली पीढ़ी अनुक्रमण (एनजीएस) विधियों द्वारा srna पुस्तकालयों अनुक्रमण व्यापक रूप से पिछले दशक में miRNA टेपोम की पहचान करने और विश्लेषण करने के लिए नियोजित किया गया है, जिसके परिणामस्वरूप मिरना खोज की तेजी से वृद्धि हुई है । हालांकि, अनुक्रमित एसआरएनए पुस्तकालयों की बढ़ती गहराई के साथ-साथ पौधों के जीनोम के आकार और जटिलता के कारण पौधे मिरना एनोटेशन में दो प्रमुख चुनौतियां उत्पन्न होती हैं। सबसे पहले, एसआरए के कई अन्य प्रकार, विशेष रूप से, एसआरएएन पुस्तकालयों से कम हस्तक्षेप करने वाले आरएनए (सिनास) को कई कम्प्यूटेशनल टूल द्वारा गलत तरीके से miRNAs के रूप में एनोटेट किया जाता है। दूसरा, यह बड़े और जटिल जीनोम के साथ पौधों की प्रजातियों में मिरना ट्रांसक्रिप्टोम का विश्लेषण करने के लिए एक अत्यंत समय लेने वाली प्रक्रिया बन जाती है। इन चुनौतियों से उबरने के लिए, हमने हाल ही में एक नई फ़िल्टरिंग रणनीति को नियोजित करके, स्कोरिंग एल्गोरिदम की ओवरहालिंग और नए अद्यतन संयंत्र मिरना को शामिल करके एमआईआरदीप-पी (मिरना ट्रांसक्रिप्टोम विश्लेषण के लिए एक लोकप्रिय उपकरण) को एमआईआरदीप-पी (मिरना ट्रांसक्रिप्टोम विश्लेषण के लिए एक लोकप्रिय उपकरण) को अपग्रेड किया एनोटेशन मापदंड। हमने अरबीडोप्सिस, चावल, टमाटर, मक्का और गेहूं सहित जीनोमिक जटिलता बढ़ाने के साथ पांच प्रतिनिधि पौधों में अनुक्रमित एसआरएनए आबादी के खिलाफ miRDP2 का परीक्षण किया । परिणामों से संकेत मिलता है कि miRDP2 ने इन कार्यों को बहुत उच्च दक्षता के साथ संसाधित किया। इसके अलावा, miRDP2 ने संवेदनशीलता और सटीकता के बारे में अन्य भविष्यवाणी उपकरणों को बेहतर प्रदर्शन किया। एक साथ लिया, हमारे परिणाम संयंत्र miRNA टेपोम का विश्लेषण करने के लिए एक तेज और सटीक उपकरण के रूप में miRDP2 प्रदर्शित करते हैं, इसलिए समुदाय को पौधों में बेहतर एनोटेट miRNAs की मदद करने में एक उपयोगी उपकरण।

Introduction

जीव विज्ञान में पिछले दो दशकों में सबसे रोमांचक खोजों में से एक जीनोम1के विविध कार्यों को विनियमित करने में एसआरएनए प्रजातियों की वृद्धि की भूमिका है । विशेष रूप से, miRNAs यूकेरियोट्स में 20 से 24-एनटी एसआरएनए का एक महत्वपूर्ण वर्ग है, और मुख्य रूप से जीवन चक्र विकास चरणों के साथ-साथ प्रोत्साहन और तनाव प्रतिक्रियाओंमें 2,3के रूप में प्रमुख जीन नियामकों के रूप में पोस्ट-ट्रांसक्रिप्शनल स्तर पर कार्य करता है। पौधों में, miRNAs प्रि-मिरना सजाने वाले प्राथमिक प्रतिलिपियों से उत्पन्न होता है, जो आम तौर पर आरएनए पॉलीमरेज II द्वारा व्यक्तिगत प्रतिलेखन इकाइयों4,5के रूप में लिखित होते हैं। विकासवादी रूप से संरक्षित सेलुलर मशीनरी (जानवरों में ड्रोशा रनासे III, पौधों में डीआईईआर की तरह), पीआरआई-मिरना को तत्काल मिरना अग्रदूत, प्री-मिर्ना में उत्पादित किया जाता है, जिसमें इंट्रा-मॉलिक्यूलर स्टेम-लूप संरचनाओं6,7बनाने वाले दृश्य होते हैं। इसके बाद प्री-मिनास को डबल-फंसे इंटरमीडिएट में संसाधित किया जाता है, अर्थात् मिरना डुप्लेक्स, जिसमें कार्यात्मक स्ट्रैंड, परिपक्व मिरना और कम बार-बार कार्यात्मक साथी, मिरना *2,8शामिल हैं। आरएनए-प्रेरित चुप्पी परिसर (आरआईएससी) में लोड होने के बाद, परिपक्व miRNAs अनुक्रम पूरकता के आधार पर अपने एमआरएनए लक्ष्यों को पहचान सकता है, जिसके परिणामस्वरूप एक नकारात्मक नियामक कार्य2,8हो सकता है। miRNAs या तो उनके लक्ष्य टेप अस्थिर या लक्ष्य अनुवाद को रोकने सकता है लेकिन पूर्व तरीकेसे8,9पौधों में प्रभुत्व है .

सूत्रकृमि कैनोरहाब्डिटिस एलिगेंस10,11में पहली मिरना की आकस्मिक खोज के बाद से, विशेष रूप से एनजीएस विधि की उपलब्धता के बाद, मिरना पहचान और इसके कार्यात्मक विश्लेषण के लिए बहुत शोध किया गया है। एनजीएस विधि के व्यापक अनुप्रयोग ने कम्प्यूटेशनल उपकरणों के उपयोग को बहुत बढ़ावा दिया है जिन्हें मिरना की अनूठी विशेषता पर कब्जा करने के लिए डिज़ाइन किया गया था, जैसे अग्रदूतों की स्टेम-लूप संरचना और अनुक्रम के उनके तरजीही संचय परिपक्व मिरना और मिरना * पर पढ़ता है। नतीजतन, शोधकर्ताओं ने विविध प्रजातियों में miRNAs की पहचान करने में उल्लेखनीय सफलता हासिल की है । पहले वर्णित संभावना मॉडल12के आधार पर, हमने एमआईआरदीप-पी13विकसित किया, जो एनजीएस डेटा से पौधे के एमआईआरएनए की खोज के लिए पहला कम्प्यूटेशनल उपकरण था। मिरदीप-पी विशेष रूप से अधिक चर अग्रदूत लंबाई और बड़े पैरालॉगस परिवारों13,14,15विशेषता डिकोडिंग संयंत्र miRNAs की चुनौतियों को जीतने के उद्देश्य से किया गया था . इसकी रिहाई के बाद, इस कार्यक्रम को हजारों बार डाउनलोड किया गया है और 40 से अधिक पौधों की प्रजातियों16में मिरना ट्रांसक्रिप्टोम को एनोटेट करने के लिए उपयोग किया जाता है। एमआईआरदीप-पी जैसे एनजीएस-आधारित उपकरणों द्वारा चालित, सार्वजनिक मिरना भंडार एमआईआरबेस17में पंजीकृत एमआईआरएनए की संख्या में नाटकीय वृद्धि हुई है, जहां 200818में केवल ~ 500 मिरना आइटम (रिलीज 2.0) की तुलना में 38,000 से अधिक मिरना आइटम वर्तमान में होस्ट किए गए हैं (रिलीज 22.1)।

हालांकि, संयंत्र मिरना एनोटेशन से दो नई चुनौतियां पैदा हुई हैं । सबसे पहले, झूठे-सकारात्मक के उच्च अनुपात ने निम्नलिखित कारणों से पौधे मिरना एनोटेशन16,19 की गुणवत्ता को भारी प्रभावित किया है: 1) एनजीएस एसआरएनए पुस्तकालयों से एंडोजेनस शॉर्ट इंटरफैंटिंग आरएनए (siRNAs) की बाढ़ गलती से एक कठोर मिरना एनोटेशन मानदंडों की कमी के कारण मिना के रूप में एनोटेट की गई थी; 2) एक प्राथमिकताओं miRNA जानकारी के बिना प्रजातियों के लिए, झूठी सकारात्मक NGS डेटा के आधार पर भविष्यवाणी को खत्म करने के लिए मुश्किल हैं । एक उदाहरण के रूप में miRBase का उपयोग करना, टेलर एट अल20 सार्वजनिक भंडार 21 (रिलीज21) में संयंत्र miRNA प्रविष्टियों के एक तिहाई पाया सबूत का समर्थन करने के लिए ठोस कमी रह गई थी और यहां तक कि संयंत्र miRNA परिवारों के तीन चौथाई संदिग्ध थे । दूसरा, यह बड़े और जटिल जीनोम16के साथ संयंत्र miRNAs की भविष्यवाणी के लिए एक अत्यंत समय लेने वाली प्रक्रिया बन जाता है । इन चुनौतियों से उबरने के लिए, हमने एक नई फ़िल्टरिंग रणनीति जोड़कर, स्कोरिंग एल्गोरिदम की ओवरहालिंग और संयंत्र मिरना एनोटेशन के लिए नए मानदंडों को एकीकृत करके एमआईआरदीप-पी को अपडेट किया, और नया संस्करण miRDP2 जारी किया। इसके अलावा, हमने धीरे-धीरे जीनोम आकार बढ़ाने के साथ एनजीएस एसआरएनए डेटासेट का उपयोग करके miRDP2 का परीक्षण किया: अरबीडोप्सिस, चावल, टमाटर, मक्का और गेहूं। अन्य पांच व्यापक रूप से उपयोग किए जाने वाले उपकरणों और इसके पुराने संस्करण की तुलना में, miRDP2 ने इन एसआरएनए डेटा को पार्स किया और बेहतर सटीकता और संवेदनशीलता के साथ तेजी से मिरना ट्रांसक्रिप्टोम का विश्लेषण किया।

miRDP2 पैकेज की सामग्री
miRDP2 पैकेज में छह प्रलेखित पर्ल स्क्रिप्ट शामिल हैं जिन्हें तैयार बैश स्क्रिप्ट द्वारा क्रमिक रूप से चलाया जाना चाहिए। छह लिपियों में से तीन(convert_bowtie_to_blast.pl, filter_alignments.pl,और excise_candidate.pl)एमआईआरदीप-पी से विरासत में मिली हैं । अन्य लिपियों को मूल संस्करण से संशोधित किया जाता है। छह लिपियों के कार्यनिम्नलिखित में वर्णित हैं:

preprocess_reads.pl फिल्टर इनपुट पढ़ता है, पढ़ता है कि बहुत लंबे या बहुत कम कर रहे है (<19 nt या >25 nt), और Rfam ncRNA दृश्यों के साथ सहसंबद्ध पढ़ता है, साथ ही साथ RPM के साथ पढ़ता है (प्रति मिलियन प्रति पढ़ता है) 5 से भी कम है । स्क्रिप्ट तो पुनः प्राप्त ज्ञात miRNA परिपक्व दृश्यों से सहसंबद्ध पढ़ता है । इनपुट फाइलें फास्टा/FASTQ प्रारूप में मूल पढ़ता है और miRNA और NCRNA दृश्यों के लिए मैपिंग पढ़ता है के bowtie2 उत्पादन कर रहे हैं ।

आरपीएम की गणना का फार्मूला निम्नलिखित के रूप में है:

Equation 1

convert_bowtie_to_blast.pl ब्लास्ट-पार्स्ड फॉर्मेट में बोटाई फॉर्मेट को बदलता है । ब्लास्ट-पार्स्ड फॉर्मेट एक कस्टम टैबुलर अलग प्रारूप है जो मानक एनसीबीआई ब्लासआउटपुट प्रारूप से प्राप्त होता है।

filter_alignments.pl गहरी अनुक्रमण के संरेखण को फ़िल्टर करता है जो जीनोम में पढ़ता है। यह आंशिक संरेखण के साथ-साथ बहु-गठबंधन रीड (उपयोगकर्ता-निर्दिष्ट आवृत्ति कटऑफ) को फ़िल्टर करता है। मूल इनपुट ब्लास्ट-पार्स्ड फॉर्मेट में फाइल है ।

excise_candidate.pl दिशानिर्देशों के रूप में गठबंधन पढ़ता है का उपयोग करके एक संदर्भ अनुक्रम से संभावित अग्रदूत दृश्यों में कटौती करता है। मूल इनपुट ब्लास्ट-पार्स्ड फॉर्मेट में एक फाइल और फास्टा फाइल है । आउटपुट फास्टा प्रारूप में सभी संभावित अग्रदूत दृश्य हैं।

mod-miRDP.pl दो इनपुट फाइल, सिग्नेचर फाइल और स्ट्रक्चर फाइल की जरूरत है, जिसे प्लांट स्पेसिफिक पैरामीटर्स के साथ स्कोरिंग सिस्टम को बदलकर कोर एमआईआरदीप-पी एल्गोरिदम से संशोधित किया जाता है । इनपुट फाइलडॉट-ब्रैकेट अग्रदूत संरचना फ़ाइल हैं और वितरण हस्ताक्षर फ़ाइल पढ़ता है।

मॉड-rm_redundant_meet_plant.पीएल को तीन इनपुट फाइलों की आवश्यकता है: mod-miRDP.pl द्वारा उत्पन्न chromosome_length, अग्रदूत और original_prediction। यह दो आउटपुट फाइलें उत्पन्न करता है, गैर-बेमानी भविष्यवाणी की गई फ़ाइल और नए अद्यतन संयंत्र मिरना मानदंडों द्वारा फ़िल्टर की गई फाइल की भविष्यवाणी की गई है। आउटपुट फ़ाइल के प्रारूप पर विवरण धारा 1.4 में वर्णित है।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. स्थापना और परीक्षण

  1. आवश्यक निर्भरता डाउनलोड करें: बोटाई222 और आरएनएफोल्ड23. संकलित पैकेजों की सिफारिश की जाती है।
    1. अपने घर साइट(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)से एक पढ़ा मानचित्रण उपकरण, Bowtie2 डाउनलोड करें ।
    2. http://www.tbi.univie.ac.at/~ivo/RNA/से आरएनए माध्यमिक संरचना की भविष्यवाणी करने के लिए उपयोग किए जाने वाले वियना पैकेज का एक उपकरण RNAfold डाउनलोड करें।
    3. miRDP2 स्थापित करने से पहले, सुनिश्चित करें कि इन दो निर्भरताओं को सही ढंग से स्थापित किया गया है, और इन दो निर्भरताओं के लिए एक सही रास्ता निर्धारित करने के लिए बैश पर्यावरण फ़ाइल (जैसे, .bashrc) को अनुकूलित करें।
      नोट: बोटाई24 जैसे अन्य मानचित्रण उपकरण भी miRDP2 के लिए उपयुक्त हैं; या तो बोटाई या बोटाई2 का उपयोग संस्करण 1.1.3 के बाद किया जा सकता है।
  2. miRDP2 पैकेज डाउनलोड करने के लिए, https://sourceforge.net/projects/mirdp2/files/latest_version/ में जाएं और टारबॉल फ़ाइलें लाएं।
  3. miRDP2 स्थापित करने से पहले, सुनिश्चित करें कि पर्ल पथ में है। miRDP2 स्थापित करने के लिए, डाउनलोड किए गए टार्बॉल फ़ाइल की सभी सामग्री को एक फ़ोल्डर (कमांड लाइनों में 1.4.2) में निकालें, और फिर फ़ोल्डर पथ को पथ में सेट करें।
    नोट: miRDP2 चलाने के लिए कम से कम 8 जीबी रैम और 100 जीबी स्टोरेज वाला कंप्यूटर या कंप्यूटिंग नोड की सिफारिश की जाती है।
  4. MiRDP2 पाइपलाइन का परीक्षण करें।
    1. यह परीक्षण करने के लिए कि क्या miRDP2 सही ढंग से स्थापित किया गया है, परीक्षण डेटा और https://sourceforge.net/projects/mirdp2/files/TestData/में पाए जाने वाले अपेक्षित आउटपुट का उपयोग करें। परीक्षण डेटा में एक स्वरूपित जीएसएम अनुक्रमण फ़ाइल और एक अरबीडोप्सिस थैलियाना जीनोम फ़ाइल होती है।
    2. सभी डाउनलोड की गई फ़ाइलों को वर्तमान कार्य निर्देशिका में ले जाएं:
      एमवी miRDP2-v *.tar.gz TestData.tar.gz ncRNA_rfam.tar.gz
      सीडी
    3. संकुचित टारबॉल फ़ाइलों को निकालें:
      टार -xvzf miRDP2-v *.tar.gz
      टार -xvzf TestData.tar.gz
      टार -xvzf ncRNA_rfam.tar.gz
    4. अरबीडोप्सिस जीनोम संदर्भ सूचकांक का निर्माण:
      बोटाई2-बिल्ड-एफ./टेस्टडेटा/TAIR10_genome.एफए./टेस्टडेटा/TAIR10_genome
    5. एनसीआरएनए संदर्भ सूचकांक बनाएं:
      बोटाई2-बिल्ड-एफ./ncRNA_rfam.एफए ./1.1.3/स्क्रिप्ट/इंडेक्स/rfam_index
    6. miRDP2 पाइपलाइन चलाएं:
      बैश ./1.1.3/miRDP2-v1.1.3_pipeline.bash-g.testData/TAIR10_genome.fa-i./TestData/TAIR 10_genome-f./TestData/GSM2094927.fa-o ।
      नोट: उपयोग किए जाने वाले लिनक्स कमांड बोल्ड और इटैलिक फोंट में हैं, जिसमें इटैलिक्स में कमांड लाइन विकल्प हैं। * miRDP2 के संस्करण को इंगित करता है (वर्तमान संस्करण 1.1.3 है)। Bowtie2-निर्माण कमान लगभग 10 मिनट लग जाना चाहिए, और miRDP2 पाइपलाइन कई मिनट के भीतर खत्म कर देना चाहिए

2. उपन्यास miRNAs की पहचान

  1. पाइपलाइन चलाने से पहले, सुनिश्चित करें कि इनपुट पढ़ता उचित प्रारूप में पूर्वसंसाधित कर रहे हैं ।
    नोट: miRDP2 का नया संस्करण 1.1.3 मूल FASTQ प्रारूप फ़ाइलों को इनपुट के रूप में स्वीकार कर सकता है, हालांकि प्रारूपण पढ़ता है की प्रक्रिया पिछले संस्करणों की तरह की जाती है।
    1. सबसे पहले, डीप अनुक्रमण पढ़ता है (यदि वर्तमान) के 5 ' और 3 ' सिरों से एडाप्टर हटा दें ।
    2. दूसरा, गहरी अनुक्रमण पार्स FASTA प्रारूप में पढ़ता है ।
    3. तीसरा, अतिरेक को हटा दें जैसे कि समान अनुक्रम के साथ पढ़ता है, एक एकल और अद्वितीय FASTA प्रविष्टि के साथ प्रतिनिधित्व कर रहे हैं।
    4. अंत में, सुनिश्चित करें कि FASTA पहचानकर्ताओं के सभी अद्वितीय हैं । प्रत्येक अनुक्रम पहचानकर्ता को '_x' और एक पूर्णांक के साथ समाप्त होना चाहिए, जो गहरे अनुक्रम डेटासेट में प्राप्त सटीक अनुक्रम की प्रतिलिपि संख्या का संकेत देता है। अद्वितीय फास्टा पहचानकर्ता सुनिश्चित करने का एक तरीका आईडी में एक रनिंग नंबर शामिल करना है। संदर्भ के लिए, परीक्षण डेटा(https://sourceforge.net/projects/mirdp2/files/TestData/)में फ़ाइल GSM2094927.fa देखें।
    5. सही ढंग से स्वरूपित पढ़ता है के उदाहरण के लिए निम्नलिखित देखें:

      और read0_x29909
      TTTGGATTGAGAGAGCTCTA
      >read1_x36974
      टीटीसीसीसीएसीटीसीटीसीटीजीजीजी
      और read2_x32635
      टीटीसीसीसीएसीटीसीटीसीटीजीसीटीसीटीसीटीटीसीटीटीटीटी
  2. संदर्भ सूचकांक बनाएं।
    1. जीनोम संदर्भ के लिए, समय बचाने के लिए, यदि ब्याज की प्रजातियों के जीनोम दृश्यों को अनुक्रमित किया गया है तो iGenomes वेबसाइट(https://support.illumina.com/sequencing/sequencing_software/igenome.html)से Bowtie2 सूचकांक फ़ाइलों को डाउनलोड करें। अन्यथा, उपयोगकर्ता संदर्भ दृश्यों को इंडेक्स करते हैं और परियोजना समाप्त होने तक इंडेक्स फ़ाइल को थोड़ी देर के लिए रखते हैं क्योंकि जीनोम अनुक्रम को फिर से अनुक्रमित करने की आवश्यकता हो सकती है। जीनोम संदर्भ को कैसे इंडेक्स करें, इस बारे में विवरण बोटाई2 मैनुअल(http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml)में शामिल हैं।
    2. अन्य गैर-कोडिंग आरएनए टुकड़ों से शोर दृश्यों को फ़िल्टर करने के लिए एक और गैर-मिरना एनसीआरएनए सूचकांक की भी आवश्यकता है। फाइल आरआरएम से मुख्य एनसीआरएनए दृश्यों का संग्रह है, जिसमें आरएनए, टीआरएनए, एसआरआरएनए और स्नोआरएनए शामिल हैं। इस सूचकांक को बनाने के लिए, कृपया भाग 1.4 का उल्लेख करें, क्योंकि सूचकांक को सही ढंग से रखा जाना चाहिए और नामित किया जाना चाहिए, यानी और एलटी;miRDP2_version>/script/index/rfam_index।
  3. miRDP2 चलाएं।
    1. गहरे अनुक्रमण डेटा से नए miRNAs का पता लगाने के लिए miRDP2 का उपयोग करने के लिए, विश्लेषण पाइपलाइन शुरू करने के लिए पैकेज में बैश स्क्रिप्ट चलाएं (एक उदाहरण चरण 1.4 में पाया जा सकता है):
      /miRDP2-v*.*_pipeline.bash-g -i & path_to_index/index_prefix>-f -o&output_folder>
      जहां * पाइपलाइन बैश स्क्रिप्ट के संस्करण को इंगित करता है। तीन पैरामीटर हैं जिन्हें संशोधित किया जा सकता है: 1) पढ़ने वाले विभिन्न स्थानों की संख्या को मैप किया जा सकता है, 2) बोटाई2 चलाने के लिए बेमेल संख्या, और 3) आरपीएम की दहलीज (प्रति मिलियन पढ़ता है)। इन्हें क्रमशः -एल, -एम और -आर विकल्पों का उपयोग करके संशोधित करें। एक विस्तृत विवरण धारा 3.1 में है।
  4. miRDP2 आउटपुट की जांच करें।
    1. ध्यान दें कि आउटपुट फ़ोल्डर स्वचालित रूप से के तहत उत्पन्न हो जाएगा, और नाम '-15-0-10'; अंतिम 3 नंबर क्रमशः मापदंडों 1, 2 और 3 के लिए मूल्यों (इस मामले में डिफ़ॉल्ट) इंगित करते हैं। फाइल & seq_file_name>_filter_P_prediction में नए अपडेटेड प्लांट मिरना एनोटेशन मापदंड को संतुष्ट करने वाले अंतिम भविष्यवाणी किए गए एमआईआरएनए की जानकारी है । आउटपुट फ़ाइल के प्रारूप पर विवरण भाग 1.4 में वर्णित हैं।

3. miRDP2 का उपयोग कर संशोधन और सावधानी

  1. पैरामीटर जिन्हें संशोधित किया जा सकता है
    1. पढ़ने वाले कितने स्थानों (पैरामीटर 1) के लिए मैप किया जा सकता है, इसकी सीमा निर्धारित करने के लिए '-एल' विकल्प का उपयोग करें। बहुत सारी साइटों के लिए मैपिंग पढ़ें संभवतः दोहराने दृश्यों के साथ जुड़े रहे हैं, और miRNAs की संभावना नहीं है । डिफ़ॉल्ट सेटिंग 15 है। विशिष्ट प्रजातियों के लिए, यदि कई सदस्यों के साथ मिरना परिवार हैं, तो जीनोम परिदृश्य के अनुकूल होने के लिए पहले पैरामीटर को मैन्युअल रूप से बढ़ाया जा सकता है।
    2. बोटाई (पैरामीटर 2) के लिए अनुमति दिए गए बेमेल सेट करने के लिए '-एम' विकल्प का उपयोग करें। डिफ़ॉल्ट सेटिंग 0 है।
    3. परिपक्व miRNAs (पैरामीटर 3) के लिए संभावित रूप से पढ़ता है के लिए दहलीज निर्धारित करने के लिए '-आर' विकल्प का उपयोग करें। समय की खपत और झूठे सकारात्मक को कम करने के लिए, फिल्टर आरपीएम द्वारा पढ़ता है । केवल एक निश्चित आरपीएम सीमा से अधिक पढ़ता है पृष्ठभूमि शोर के बजाय miRNAs के परिपक्व दृश्यों का प्रतिनिधित्व कर सकते हैं, और आगे विश्लेषण के लिए रखा जाएगा । डिफॉल्ट सेटिंग 10 आरपीएम है।
    4. ध्यान दें कि इन मापदंडों को बदलने से संभावित रूप से प्रदर्शन और समय की खपत प्रभावित हो सकती है। सामान्य तौर पर, पैरामीटर 1 और 2 की वृद्धि और पैरामीटर 3 की कमी कम कठोर परिणाम उत्पन्न करेगी और लंबे समय तक चलने का समय और इसके विपरीत।
  2. अतिरेक और मिरना *
    1. ध्यान दें कि एमआईआरडीपी 2 से आउटपुट एमआईआरएनए ज्ञात एमआईआरएनए से अलग हो सकता है। हमने पाया कि यह मुख्य रूप से दो कारणों में से एक के कारण है: परिपक्व miRNAs की विषमता या मिरना और मिरना * की सापेक्ष बहुतायत। हमने पाया कि यह अग्रदूतों के इष्टतम लंबाई चयन और ज्ञात मिरना जीन की प्रोफाइलिंग को प्रभावित नहीं करता है।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

मिरना एनोटेशन पाइपलाइन, miRDP2, यहां वर्णित 5 पौधों की प्रजातियों से 10 सार्वजनिक एसआरएनए-सीक्यू पुस्तकालयों पर लागू होती है, जिसमें धीरे-धीरे बढ़ी हुई जीनोम लंबाई होती है, जिसमें अरबीडोप्सिस थैलियाना, ओरीज़ा सतिवा (चावल), सोलनम लाइकोपीर्सिकम (टमाटर), ज़ी मेस (मक्का) और ट्राइटिकम एस्टिवम (गेहूं)(चित्रा 1ए)शामिल हैं। कुल मिलाकर, प्रत्येक प्रजाति के लिए, विभिन्न ऊतकों से 2 प्रतिनिधि एसआरएनए पुस्तकालय (अद्वितीय पढ़ता है, प्रोटोकॉल अनुभाग में विवरण में ढह गया) और उनके अनुक्रमित जीनोम दृश्यों को दो इनपुट(तालिका 1)के रूप में संसाधित किया जाता है। तुलना करने के लिए पांच मिरना कम्प्यूटेशनल भविष्यवाणी उपकरण (एमआईआरदीप-पी13,एमआईआरप्लांट25,एमआईआर-प्रीएफईआर26,मिरा27,मिरेना28)का चयन किया गया था।

रनिंग टाइम टेस्ट
miRDP2 और अन्य पांच उपकरणों के रनटाइम और प्रदर्शन की तुलना करने के लिए, हमने सेंट ओएस रिलीज 6.5 सिस्टम के साथ क्लस्टर सर्वर में पांच उपकरण (miRDP2, miRDeep-P, miR-PREFeR, MIRA और miReNA) स्थापित किए हैं। इन कार्यक्रमों को एक ही इनपुट फ़ाइलों, हार्डवेयर और संसाधन (अनुपूरक फ़ाइल 1में विवरण) के साथ चलाया गया था । विशेष रूप से, एमआईआरप्लांट जावा में लिखे गए जीयूआई से नियंत्रित होता है और सर्वर पर चलने में सक्षम नहीं था। इसके बजाय, हमने विंडोज 10 के साथ पीसी पर एमआईआरप्लांट का परीक्षण किया, जबकि हमने इस पीसी (पूरक फ़ाइल 1में विवरण) पर miRDP2 और miRDeep-P का परीक्षण भी किया है।

अरबीडोप्सिस थैलियाना, ओरियाज़ा सतिवाऔर सोलनम लाइकोपेरियमके रूप में छोटी जीनोम प्रजातियों के लिए, सभी कार्यक्रम ठीक से दौड़े। हालांकि, बड़े जीनोम प्रजातियों जैसे ज़ी मेस और ट्राइटिकम एस्टिवम (एमआईआरए के लिए सोलनम लाइकोपर्ज़ियम सहित) के लिए, कुछ कार्यक्रमों ने सभी कंप्यूटिंग संसाधनों को समाप्त कर दिया और आधे रास्ते में टूट गए। उदाहरण के लिए, मिरेना, मिरा और एमआईआर-प्रीएफईआर परिणाम उत्पन्न करने में विफल रहे, शायद बड़ी सैम फ़ाइलों या मध्यवर्ती फ़ाइलों से निपटने के दौरान स्मृति की कमी के कारण। विशेष रूप से, miRPlant अस्थायी फ़ाइलों ने बहुत अधिक स्थान का सेवन किया, और बड़े जीनोम प्रजातियों से निपटने के दौरान परिणाम पीसी पर चलने में सक्षम नहीं था। miRDP2 ने इन भविष्यवाणी प्रक्रियाओं को बहुत कम समय में समाप्त किया, मिनट से घंटों(चित्रा 1बी)। इस प्रकार, इसके पुराने संस्करण और अन्य उपकरणों की तुलना में, miRDP2 के रनिंग टाइम को स्पष्ट रूप से छोटा कर दिया गया था।

संवेदनशीलता और सटीकता परीक्षण
चूंकि अरबीडोप्सिस में miRNAs का गहन तालीम से अध्ययन किया जाता है, इसलिए हमने miRDP2 का मूल्यांकन करने के लिए एमआईआरबेस21 (रिलीज 22.1) में अरबीडोप्सिस में ज्ञात miRNAs का उपयोग किया, और अन्य उपकरणों के साथ तुलना की। जैसा कि पहले19,26की रिपोर्ट की गई है, निम्नलिखित सूत्र संवेदनशीलता और सटीकता की गणना करने के लिए नियोजित हैं:

Equation 2

Equation 3

ज्ञात मिर्ना उन एमआईआरबेस में एनोटेट हैं। एक मिरना को व्यक्त किया गया है यदि परिपक्व दृश्यों में 5 से अधिक आरपीएम हैं, और 75% परिपक्व और स्टार मिरना दृश्यों के लिए मैप किए गए अग्रदूत पर पढ़ता है। परीक्षण करने के लिए अरबीडोप्सिस(टेबल 1)से दो अनुक्रमित एसआरएनए पुस्तकालयों का उपयोग किया गया था। miRDP2(चित्रा 1सी, डी)ने अन्य उपकरणों की तुलना में संवेदनशीलता और सटीकता दोनों में बेहतर प्रदर्शन किया।

एक साथ लिया, इन परिणामों को प्रदर्शित करता है कि miRDP2 पौधों में miRNA प्रतिलेखन का विश्लेषण करने के लिए एक तेज और सटीक उपकरण है ।

Figure 1
चित्रा 1: miRDP2 का प्रदर्शन। (A) अरबीडोप्सिस थैलियाना (अथ), ओरियाज़ा सतीवा (ओसा), सोलनम लाइकोपर्शीकम (Sly), ज़ी मई (Zma), ट्राइटिकम एस्टिवम (टीएई)का जीनोम आकार (जीबी में) । (बी-डी) miRDP2 और अन्य पांच उपकरणों की रनटाइम, संवेदनशीलता और सटीकता की तुलना। प्रत्येक उपकरण के अनुरूप दो बिंदुओं से संकेत मिलता है कि प्रत्येक उपकरण द्वारा दो परीक्षण किए गए थे। इस आंकड़े को कुआंग एट अल16से अनुकूलित किया गया है । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

प्रजातियां (एबीबी) जीनोम संस्करण एसआरएनए पुस्तकालय
लाइब्रेरी आईडी फाइल आकार कुल पढ़ता है अद्वितीय पढ़ता है ऊतक
अरबीडोप्सिस थालियाना (एथ) वर्जन 10 GSM2094927 24.9 एमबी 40.5 M 9.7 M वयस्क पत्ती
GSM24122287 29.5 एमबी 45.1 M 11.1 M पत्ता
ओरियाज़ा सतीवा (ओसा) संस्करण 7 GSM2883136 44.2 एमबी 54.9 M 16.3 M अंकुर
जीएसएम3030848 34.7 एमबी 49.1 M 13.0 M फ्लैगलीफ
सोलनम लाइकोपीर्सिकम (Sly) संस्करण 3 जीएसएम1213985 205.4 एमबी 161.5 M 58.0 M पत्ता
जीएसएम1976413 118.5 एमबी 139.3 M 46.2 M जड़
ज़ीका मेस (Zma) संस्करण 4 जीएसएम 1277437 158.4 एमबी 266.1 M 60.5 M अंकुर
जीएसएम1428531 144.1 एमबी 172.5 M 56.3 M बीज
ट्राइटिकम एस्टिवम (टीएई) आईडब्ल्यूजीएससी 1 जीएसएम1294660 76.1 एमबी 59.2 M 29.6 M गोली मार
जीएसएम1294661 113.6 एमबी 84.0 M 44.0 M पत्ता

तालिका 1: जीनोम और एसआरएनए पुस्तकालयों का उपयोग miRDP2 और अन्य उपकरणों के परीक्षण के लिए किया जाता है। इस तालिका को कुआंग एट अल16से अनुकूलित किया गया है ।

अनुपूरक फ़ाइल 1: रनटाइम, संवेदनशीलता और miRDP2 और अन्य पांच उपकरणों की सटीकता की तुलना। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

अनुपूरक फ़ाइल 2: छोरों में विभाजित संरचना के साथ प्रामाणिक एमआईआरएनए के उदाहरण। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

अनुपूरक फाइल 3: 23-एनटी और 24-एनटी मिरना के लिए संयंत्र मिरना एनोटेशन और मानदंडों के लिए अद्यतन मानदंड। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

अनुपूरक फाइल 4: miRDP2 के कार्यप्रवाह का आरेख । कृपया इस फ़ाइल को डाउनलोड करने के लिए यहां क्लिक करें।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

एनजीएस के आगमन के साथ,29,30विभिन्न प्रजातियों में एसआरएनए अनुक्रमण डेटा की बढ़ती मात्रा से बड़ी संख्या में मिरना लोकी की पहचान की गई है। केंद्रीकृत सामुदायिक डेटाबेस एमआईआरबेस21में, जमा किए गए मिरना आइटम पिछले दशक में लगभग 100 गुना बढ़ गए हैं। हालांकि, जानवरों में miRNAs की तुलना में, पौधे के एमआईआरएनए में कई अनूठी विशेषताएं हैं जो पहचान/एनोटेशन को और अधिक जटिल बनाती हैं13,14

सबसे पहले, पौधे के अग्रदूत लंबी और संरचना(अनुपूरक फाइल 2)16में अधिक परिवर्तनशील होते हैं । 70-90 एनटी के आसपास पशु मिरना अग्रदूत की अपेक्षाकृत समान लंबाई की तरह नहीं, पौधे के अग्रदूतकी की लंबाई कई गुना बदलती है और कई सौ एनट्स13,31तक पहुंच सकती है। यह अंतर मिरना अग्रदूतों की माध्यमिक संरचना की भविष्यवाणी करते समय बहुत अनिश्चितता का परिचय देता है, भले ही अग्रदूत लंबाई की कटऑफ आमतौर पर मनमाने ढंग से सेट की जाती है जैसे कि 300 एनटी19 से अधिक नहीं (यह पैरामीटर miRDP2 में एम्बेडेड था, और miRDP2 के अनुभवी उपयोगकर्ता इसे खुद से समायोजित कर सकते हैं)। इसके अलावा, संरक्षित पौधे मिरना परिवारों में अधिक सदस्य होते हैं, और इन सदस्यों की लंबाई में भिन्नता भी अक्सर महत्वपूर्ण होती है13। यही कारण है कि miRDP2 में पैरामीटर -एल है, जो सदस्य आकार में संभावित सबसे बड़े मिरना परिवारों को इंगित करता है। एक साथ, पौधे मिरना अग्रदूत की विषमता उनके सटीक एनोटेशन के लिए कई कठिनाइयों को उठाती है।

दूसरा, शोर या झूठी सकारात्मक siRNAs द्वारा शुरू की को खत्म करने के लिए मुश्किल है । miRNAs के साथ, गैर सरकारी संगठनों के तरीकों को भी अनुक्रमित एसआरएनए पुस्तकालयों में siRNAs की बाढ़ का उत्पादन । भले ही सिनास को उनके बायोजेनेसिस द्वारा मिरनासे से अलग किया जा सकता है और32,33कार्य ों को कार्य करता है, लेकिन डेटा और खनन उपकरणों को अनुक्रमित करने के आधार पर उन्हें अलग करना बेहद मुश्किल है। कई शोधकर्ताओं द्वारा तर्क दिए गए एमआईआरबेस जैसे सार्वजनिक डेटाबेस में बड़ी संख्या में झूठे-सकारात्मक सिनास से तेजी से खराब हो गए हैं, जिन्हें गलत तरीके से miRNAs20,31के रूप में एनोटेट किया गया है। इस प्रकार, नए अद्यतन मानदंड25 (अनुपूरक फ़ाइल 3)जैसे संयंत्र मिरना एनोटेशन के लिए मानदंडों के एक नए और सख्त सेट के साथ परिष्कृत उपकरण मिरना एनोटेशन पाइपलाइन/प्रक्रिया में अत्यधिक वांछित हैं ।

पिछले लेकिन कम नहीं, sRNA पुस्तकालयों पार्सिंग के लिए कम्प्यूटेशनल समय तेजी से वृद्धि हुई है जब एक ही विधि एक छोटे आकार जीनोम प्रजातियों से एक बड़े आकार के एक में प्रत्यारोपित किया जाता है । मिर्नकेशनल उपकरण जैसे मिरदीप-पी13 और एमआईआर-प्रीएफईआर26,एसआरएनए के हस्ताक्षर वितरण को कैप्चर और मात्रा बद्ध करके मिरना अग्रदूत ों के साथ पढ़ता है, दो लोकप्रिय तरीके बन गए हैं और व्यापक रूप से मिरना को एनोटेट करने के लिए उपयोग किए जाते हैं। मानचित्रण रणनीति, अग्रदूत उम्मीदवारों को उत्तेजित करने की प्रक्रिया और बाद में माध्यमिक संरचना भविष्यवाणी काफी कंप्यूटिंग समय16की मांग करती है । जब इन उपकरणों को अरबीडोप्सिस जैसे छोटे आकार के जीनोम से मक्का जैसे बड़े लोगों के लिए डेटा पार्स करने के लिए नियोजित किया जाता है, तो डेटा प्रसंस्करण का समय घंटों से दिनों तक बढ़ जाता है, यहां तक कि सप्ताह(चित्रा 1 B),जिसके परिणामस्वरूप प्रक्रिया का लगातार पतन होता है। पूर्वगामी सीमाओं पर एक नवाचार इस प्रकार तत्काल जरूरत है ।

हमारा नया miRDP216 कार्यक्रम, miRDeep-P13से अद्यतन, ऊपर उल्लिखित चुनौतियों से उबरने के लिए डिज़ाइन किया गया है(अनुपूरक फ़ाइल 4)। इस कार्यक्रम में, हमने एक नई फ़िल्टरिंग रणनीति बनाई, स्कोरिंग एल्गोरिदम को अनुकूलित किया, और नए अपडेटकिए गए पौधे मिरना एनोटेशन मानदंडों को शामिल किया। इन नई सुविधाओं के परिणामस्वरूप, जीनोम आकार बढ़ाने के साथ पांच पौधों की प्रजातियों से दस एसआरएनए पुस्तकालयों का उपयोग करके परीक्षण किए जाने पर रनिंग टाइम को स्पष्ट रूप से छोटा कर दिया गया था। इसके अतिरिक्त, अन्य उपकरणों की तुलना में, miRDP2 ने संवेदनशीलता और सटीकता(चित्रा 1)दोनों में बेहतर प्रदर्शन प्रदर्शित किया। एक साथ लिया, इन परिणामों को प्रदर्शित करता है कि miRDP2 पौधों में miRNA टेपोम का विश्लेषण करने के लिए एक तेज और सटीक उपकरण है।

यह आगाह किया जाना चाहिए कि मिरना विशेषताओं पर वर्तमान समझ किसी भी कम्प्यूटेशनल उपकरणों के प्रदर्शन को सीमित कर सकती है। यहां तक कि नए अद्यतन मिरना एनोटेशन मानदंड अच्छी तरह से अध्ययन किए गए उदाहरणों के सीमित सेट पर आधारित हैं। परिणाम रहित जानकारी इस प्रकार केवल अनुभवजन्य है। वास्तव में, मिरना की अनूठी विशेषताओं को विभिन्न पौधों की प्रजातियों यावंश3 में मौजूद दिखाया गया है । इसके अलावा, मिरना/मिरना * डुप्लेक्स के अपस्ट्रीम और डाउनस्ट्रीम क्षेत्रों की संरचनाओं जैसी विशेषताएं भी मिरना बायोजेनेसिस34,35में महत्वपूर्ण भूमिकाएं निभाती हैं, जिन्हें वर्तमान एनोटेशन टूल में ध्यान में नहीं रखा जाता है। अधिक पौधों की प्रजातियों में अच्छी तरह से अध्ययन किए गए उदाहरणों के संचय के साथ, यह संभावना है कि भविष्य में और भी उन्नत एनोटेशन उपकरण विकसित किए जाते हैं जो अधिक सूक्ष्म भेदों को पकड़ सकते हैं और वर्तमान तरीकों की तुलना में उच्च स्तर की सटीकता के साथ miRNAs को वर्गीकृत कर सकते हैं। एक आशाजनक नया मिरना एनोटेशन दिशा मशीन लर्निंग दृष्टिकोण36 को शामिल करना है क्योंकि प्रशिक्षण डेटासेट और एनोटेशन मानदंडों की गुणवत्ता लगातार विकसित होती है।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

इस काम को बीजिंग कृषि और वानिकी विज्ञान अकादमी (KJCX201917, KJCX20180425, और KJCX20180204) द्वारा चीन के XY और राष्ट्रीय प्राकृतिक विज्ञान फाउंडेशन (31621001) को एलएल के लिए समर्थन दिया गया है ।

Materials

Name Company Catalog Number Comments
Computer/computing node N/A N/A Perl is required; at least 8 GB RAM and 100 GB storage are recommended

DOWNLOAD MATERIALS LIST

References

  1. Ghildiyal, M., Zamore, P. D. Small silencing RNAs: an expanding universe. Nature Reviews Genetics. 10 (2), 94-108 (2009).
  2. Bartel, D. P. MicroRNAs: target recognition and regulatory functions. Cell. 136 (2), 215-233 (2009).
  3. Moran, Y., Agron, M., Praher, D., Technau, U. The evolutionary origin of plant and animal microRNAs. Nature Ecology Evolution. 1 (3), 27 (2017).
  4. Xie, Z., et al. Expression of Arabidopsis MIRNA genes. Plant Physiology. 138 (4), 2145-2154 (2005).
  5. Zhao, X., Zhang, H., Li, L. Identification and analysis of the proximal promoters of microRNA genes in Arabidopsis. Genomics. 101 (3), 187-194 (2013).
  6. Bologna, N. G., Mateos, J. L., Bresso, E. G., Palatnik, J. F. A loop-to-base processing mechanism underlies the biogenesis of plant microRNAs miR319 and miR159. EMBO JOURNAL. 28 (23), 3646-3656 (2009).
  7. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  8. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  9. Iwakawa, H. O., Tomari, Y. The Functions of MicroRNAs: mRNA Decay and Translational Repression. Trends in Cell Biology. 25 (11), 651-665 (2015).
  10. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  11. Wightman, B., Ha, I., Ruvkun, G. Posttranscriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C. elegans. Cell. 75 (5), 855-862 (1993).
  12. Friedlander, M. R., et al. Discovering microRNAs from deep sequencing data using miRDeep. Nature Biotechnology. 26 (4), 407-415 (2008).
  13. Yang, X., Li, L. miRDeep-P: a computational tool for analyzing the microRNA transcriptome in plants. Bioinformatics. 27 (18), 2614-2615 (2011).
  14. Meyers, B. C., et al. Criteria for annotation of plant MicroRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  15. Yang, X., Zhang, H., Li, L. Global analysis of gene-level microRNA expression in Arabidopsis using deep sequencing data. Genomics. 98 (1), 40-46 (2011).
  16. Kuang, Z., Wang, Y., Li, L., Yang, X. miRDeep-P2: accurate and fast analysis of the microRNA transcriptome in plants. Bioinformatics. , (2018).
  17. Kozomara, A., Birgaoanu, M., Griffiths-Jones, S. miRBase: from microRNA sequences to function. Nucleic Acids Research. 47 (1), 155-162 (2019).
  18. Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36, Database issue 154-158 (2008).
  19. Axtell, M. J., Meyers, B. C. Revisiting Criteria for Plant MicroRNA Annotation in the Era of Big Data. Plant Cell. 30 (2), 272-284 (2018).
  20. Taylor, R. S., Tarver, J. E., Hiscock, S. J., Donoghue, P. C. Evolutionary history of plant microRNAs. Trends in Plant Science. 19 (3), 175-182 (2014).
  21. Kozomara, A., Griffiths-Jones, S. miRBase: annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, Database issue 68-73 (2014).
  22. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9 (4), 357-359 (2012).
  23. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6, 26 (2011).
  24. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology. 10 (3), 25 (2009).
  25. An, J., Lai, J., Sajjanhar, A., Lehman, M. L., Nelson, C. C. miRPlant: an integrated tool for identification of plant miRNA from RNA sequencing data. BMC Bioinformatics. 15, 275 (2014).
  26. Lei, J., Sun, Y. miR-PREFeR: an accurate, fast and easy-to-use plant miRNA prediction tool using small RNA-Seq data. Bioinformatics. 30 (19), 2837-2839 (2014).
  27. Evers, M., Huttner, M., Dueck, A., Meister, G., Engelmann, J. C. miRA: adaptable novel miRNA identification in plants using small RNA sequencing data. BMC Bioinformatics. 16, 370 (2015).
  28. Mathelier, A., Carbone, A. MIReNA: finding microRNAs with high accuracy and no learning at genome scale and from deep sequencing data. Bioinformatics. 26 (18), 2226-2234 (2010).
  29. Zhu, Q. H., et al. A diverse set of microRNAs and microRNA-like small RNAs in developing rice grains. Genome Research. 18 (9), 1456-1465 (2008).
  30. Fahlgren, N., et al. MicroRNA gene evolution in Arabidopsis lyrata and Arabidopsis thaliana. Plant Cell. 22 (4), 1074-1089 (2010).
  31. Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).
  32. Blevins, T., et al. Identification of Pol IV and RDR2-dependent precursors of 24 nt siRNAs guiding de novo DNA methylation in Arabidopsis. Elife. 4, 09591 (2015).
  33. Zhai, J., et al. A One Precursor One siRNA Model for Pol IV-Dependent siRNA Biogenesis. Cell. 163 (2), 445-455 (2015).
  34. Werner, S., Wollmann, H., Schneeberger, K., Weigel, D. Structure determinants for accurate processing of miR172a in Arabidopsis thaliana. Current Biology. 20 (1), 42-48 (2010).
  35. Mateos, J. L., Bologna, N. G., Chorostecki, U., Palatnik, J. F. Identification of microRNA processing determinants by random mutagenesis of Arabidopsis MIR172a precursor. Current Biology. 20 (1), 49-54 (2010).
  36. Vitsios, D. M., et al. Mirnovo: genome-free prediction of microRNAs from small RNA sequencing data and single-cells using decision forests. Nucleic Acids Research. 45 (21), 177 (2017).

Tags

जेनेटिक्स इश्यू 155 माइक्रोआरएनए (मिरना) प्लांट एसआरएनए-सीक्यू मिरदीप-पी 2 (miRDP2) नेक्स्ट जेनरेशन सीक्वेंसिंग प्लांट मिरना मापदंड मिरदीप-पी (एमआईआरडीपी)
पौधों में माइक्रोआरएनए ट्रांसक्रिप्टोम का सटीक और कुशलता पूर्वक विश्लेषण करने के लिए एक बायोइन्फॉर्मेटिक्स पाइपलाइन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, Y., Kuang, Z., Li, L., Yang,More

Wang, Y., Kuang, Z., Li, L., Yang, X. A Bioinformatics Pipeline to Accurately and Efficiently Analyze the MicroRNA Transcriptomes in Plants. J. Vis. Exp. (155), e59864, doi:10.3791/59864 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter