Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: een one-stop-shop voor miRNA-annotatie van planten

Published: May 1, 2021 doi: 10.3791/62430

Summary

Hierin presenteren we een nieuwe en volledig geautomatiseerde miRNA-pijplijn, mirMachine die 1) bekende en nieuwe miRNA's nauwkeuriger kan identificeren en 2) volledig geautomatiseerd en vrij beschikbaar is. Gebruikers kunnen nu een kort indieningsscript uitvoeren om de volledig geautomatiseerde mirMachine-pijplijn uit te voeren.

Abstract

Van verschillende soorten niet-coderende RNA's zijn microRNA's (miRNA's) het afgelopen decennium aantoonbaar in de schijnwerpers geweest. Als post-transcriptionele regulatoren van genexpressie spelen miRNA's een sleutelrol in verschillende cellulaire routes, waaronder zowel ontwikkeling als reactie op a / biotische stress, zoals droogte en ziekten. Het hebben van hoogwaardige referentiegenoomsequenties maakte identificatie en annotatie van miRNA's in verschillende plantensoorten mogelijk, waar miRNA-sequenties sterk geconserveerd zijn. Aangezien computationele miRNA-identificatie- en annotatieprocessen meestal foutgevoelige processen zijn, verhogen op homologie gebaseerde voorspellingen de voorspellingsnauwkeurigheid. We hebben de miRNA-annotatiepijplijn, SUmir, in het afgelopen decennium ontwikkeld en verbeterd, die sindsdien voor verschillende plantengenomen is gebruikt.

Deze studie presenteert een volledig geautomatiseerde, nieuwe miRNA-pijplijn, mirMachine (miRNA Machine), door (i) een extra filterstap toe te voegen aan de secundaire structuurvoorspellingen, (ii) deze volledig geautomatiseerd te maken en (iii) nieuwe opties te introduceren om bekend miRNA te voorspellen op basis van homologie of nieuwe miRNA's op basis van kleine RNA-sequencing-reads met behulp van de vorige pijplijn. De nieuwe miRNA-pijplijn, mirMachine, werd getest met behulp van The Arabidopsis Information Resource, TAIR10, release van het Arabidopsis-genoom en het International Wheat Genome Sequencing Consortium (IWGSC) tarwereferentiegenoom v2.

Introduction

Vooruitgang in sequencingtechnologieën van de volgende generatie heeft het begrip van RNA-structuren en regulerende elementen verbreed, waardoor functioneel belangrijke niet-coderende RNA's (ncRNA's) zijn onthuld. Onder verschillende soorten ncRNA's vormen microRNA's (miRNA's) een fundamentele regelgevende klasse van kleine RNA's met een lengte tussen 19 en 24 nucleotiden in planten 1,2. Sinds de ontdekking van het eerste miRNA in de nematode Caenorhabditis elegans3 zijn de aanwezigheid en de functies van miRNA's uitgebreid bestudeerd in dierlijke en plantaardige genomen en 4,5,6. miRNA's functioneren door mRNA's te richten op splitsing of translationele repressie7. Accumulerend bewijs heeft ook aangetoond dat miRNA's betrokken zijn bij een breed scala aan biologische processen in planten, waaronder groei en ontwikkeling8, zelfbiogenese9 en verschillende biotische en abiotische stressreacties10.

In fabrieken worden miRNA's in eerste instantie verwerkt uit lange primaire transcripties die pri-miRNA's11 worden genoemd. Deze pri-miRNA's gegenereerd door RNA polymerase II in de kern zijn lange transcripten die een onvolmaakte terugvouwstructuur vormen12. De pri-miRNA's ondergaan later een splitsingsproces om endogene enkelstrengs (ss) haarspeldbochtenvoorlopers van miRNA's te produceren die pre-miRNA's11 worden genoemd. Het pre-miRNA vormt een haarspeldachtige structuur waarin een enkele streng zich vouwt tot een dubbelstrengsstructuur om een miRNA-duplex (miRNA/miRNA*)13 te verwijderen. Dicer-achtig eiwit snijdt beide strengen van de miRNA/miRNA* duplex, waardoor 2-nucleotide 3'-overhangen14,15 overblijft. De miRNA-duplex wordt gemethyleerd in de kern, wat het 3'-uiteinde van het miRNA beschermt tegen afbraak en uridyleringsactiviteit16,17. Een helicase lost de gemethyleerde miRNA-duplex na export af en stelt het volwassen miRNA bloot aan het RNA-geïnduceerde silencing complex (RISC) in het cytosol18. Eén streng van de duplex is volwassen miRNA opgenomen in RISC, terwijl de andere streng, miRNA*, wordt afgebroken. Het miRNA-RISC-complex bindt aan de doelsequentie, wat leidt tot mRNA-afbraak in geval van volledige complementariteit of translationele repressie in geval van gedeeltelijke complementariteit13.

Op basis van de expressie- en biogenesekenmerken zijn richtlijnen voor miRNA-annotatie beschreven15,19. Met de gedefinieerde richtlijnen ontwikkelden Lucas en Budak de SUmir-pijplijn om een homologie uit te voeren op basis van silico miRNA-identificatie in planten9. De SUmir-pijplijn bestond uit twee scripts: SUmirFind en SUmirFold. SUmirFind voert gelijkeniszoekopdrachten uit met bekende miRNA-datasets via national center for biotechnology information (NCBI) Basic Local Alignment Search tool (BLAST) screening met aangepaste parameters om hits met slechts 2 of minder mismatches op te nemen en om bias naar kortere hits (blastn-short -ungapped -penalty -1 -reward 1) te voorkomen. SUmirFold evalueert de secundaire structuur van de vermeende miRNA-sequenties van BLAST20-resultaten met behulp van UNAfold21. SUmirFold onderscheidt miRNA's van kleine storende RNA's door de identificatie van de kenmerken van de haarspeldstructuur. Bovendien onderscheidt het miRNA's van andere ssRNA's zoals tRNA en rRNA door de parameters, de minimale energie-index > 0,67 en het GC-gehalte van 24-71%. Deze pijplijn is onlangs bijgewerkt door twee extra stappen toe te voegen om (i) de gevoeligheid te verhogen, (ii) de annotatienauwkeurigheid te verhogen en (iii) de genomische verdeling van de voorspelde miRNA-genente bieden 22. Gezien de hoge conservering van plant miRNA-sequenties23, was deze pijplijn oorspronkelijk ontworpen voor homologie-gebaseerde miRNA-voorspelling. Nieuwe miRNA's konden echter niet nauwkeurig worden geïdentificeerd met deze bioinformatica-analyse, omdat het sterk afhankelijk was van sequentiebehoud van miRNA's tussen nauw verwante soorten.

Dit artikel presenteert een nieuwe en volledig geautomatiseerde miRNA-pijplijn, mirMachine die 1) bekende en nieuwe miRNA's nauwkeuriger kan identificeren (de pijplijn maakt nu bijvoorbeeld gebruik van op sRNA-seq gebaseerde nieuwe miRNA-voorspellingen en op homologie gebaseerde miRNA-identificatie) en 2) is volledig geautomatiseerd en vrij beschikbaar. De outputs omvatten ook de genomische verdelingen van de voorspelde miRNA's. mirMachine werd getest op zowel homologie-gebaseerde als sRNA-seq-gebaseerde voorspellingen in tarwe en Arabidopsis genomen. Hoewel unafold in eerste instantie werd uitgebracht als vrije software, werd het in het laatste decennium een commerciële software. Met deze upgrade is de secundaire structuurvoorspellingstool overgeschakeld van UNAfold naar RNAfold, zodat mirMachine vrij beschikbaar kan zijn. Gebruikers kunnen nu een kort indieningsscript uitvoeren om de volledig geautomatiseerde mirMachine-pijplijn uit te voeren (voorbeelden worden gegeven op https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Software afhankelijkheden en installatie

  1. Installeer softwareafhankelijkheden vanaf hun thuissite of met behulp van conda.
    1. Download en installeer Perl, als het nog niet is geïnstalleerd, vanaf de thuissite (https://www.perl.org/get.html).
      OPMERKING: De weergegeven resultaten werden voorspeld met Perl v5.32.0.
    2. Download Blast+, een uitlijningsprogramma, van de thuissite (https://www.ncbi.nlm.nih.gov/books/NBK279671/) als uitvoerbaar bestand en als broncode.
      OPMERKING: De weergegeven resultaten werden voorspeld met de BLAST 2.6.0+.
    3. Installeer het voorgecompileerde pakket van RNAfold vanaf https://www.tbi.univie.ac.at/RNA/.
    4. U kunt deze software ook installeren met behulp van de volgende conda: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. De mirMachine setup en testen

  1. Download de nieuwste versie van de mirMachine scripts en het mirMachine submission script van GitHub, https://github.com/hbusra/mirMachine.git, en stel vervolgens het scripts pad in het PATH.
  2. Gebruik de testgegevens die op de GitHub worden verstrekt om ervoor te zorgen dat de mirMachine samen met al zijn afhankelijkheden correct zijn gedownload.
  3. Voer de mirMachine uit op de onderstaande testgegevens.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    OPMERKING: Stel de optie -n in op 10 omdat de testgegevens slechts één chromosoom van het tarwegenoom bevatten. Bij standaardwaarden is de optie -n ingesteld op 20.
  4. Beheer de haarspeldbochten.tbl.out.tbl-uitvoerbestanden voor de voorspelde volwassen miRNA's, hun voorspelde voorlopers en hun locaties op de chromosomen.
  5. Controleer de logbestanden op de programma-uitvoer en waarschuwingen.

3. Homologie-gebaseerde miRNA-identificatie

  1. Voer de mirMachine uit met behulp van het onderstaande bash-script:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Controleer de voorspelde miRNA's. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.tbl.out.tbl voor de voorspelde miRNA's. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.fsa voor de pre-miRNA FASTA-sequenties. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.log voor het haarspeldlogboekbestand.

4. Nieuwe miRNA-identificatie

  1. Verwerk de sRNA-seq FASTQ-bestanden voor in het juiste FASTA-formaat. Trim adapters indien nodig. Knip geen leeswaarden van lage kwaliteit bij; verwijder ze in plaats daarvan. Verwijder reads die N. bevatten Converteer het FASTQ-bestand naar het FASTA-bestand ($input_file).
  2. Voer de mirMachine uit met behulp van het onderstaande bash-script.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    OPMERKING: $mismatches is ingesteld op 0 voor op sRNA-seq gebaseerde voorspellingen.
  3. Controleer de voorspelde miRNA's. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.tbl.out.tbl voor de voorspelde miRNA's. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.fsa voor de pre-miRNA FASTA-sequenties. Zoek het uitvoerbestand met de naam $input_file.results.tbl.hairpins.log voor het haarspeldlogboekbestand.

5. Parameters vooraf

OPMERKING: De standaardwaarden zijn gedefinieerd voor alle parameters, behalve het genoombestand en het invoermiRNA-bestand.

  1. Stel de optie -db in op een blast-database om de gebouwreferentiedatabase in de pijplijn over te slaan.
  2. Stel de optie -m in op het aantal toegestane niet-overeenkomende items.
    OPMERKING: Bij standaardwaarden is de optie -m ingesteld op 1 voor op homologie gebaseerde voorspellingen en 0 voor de op sRNA-seq gebaseerde voorspellingen.
  3. Stel de -n in op het aantal hits dat moet worden geëlimineerd na uitlijning (standaard op 20). Verander dit op basis van de soort.
  4. Gebruik de -long om de secundaire structuren voor de verdachtenlijst te beoordelen.
  5. Gebruik de -s om de nieuwe miRNA-voorspelling te activeren op basis van sRNA-seq-gegevens.
  6. Stel de optie -lmax in op de maximale lengte van de sRNA-seq-reads die in de screening moeten worden opgenomen.
  7. Stel de optie -lmax in op de minimale lengte van de sRNA-seq-reads die in de screening moeten worden opgenomen.
  8. Gebruik de optie -rpm om de rpm-drempel (Reads Per Million) in te stellen.
    OPMERKING: Voor geavanceerde parameters zoals de lengte van pri-miRNA's / pre-miRNA's, worden ervaren gebruikers aangemoedigd om de scripts aan te passen voor hun onderzoek van belang. Bovendien, als de gebruikers van plan zijn om sommige stappen over te slaan of liever gewijzigde uitvoer te gebruiken, kan het indieningsscript worden gewijzigd door eenvoudig # toe te voegen aan het begin van de regels om die regels over te slaan.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

De hierboven beschreven miRNA-pijplijn, mirMachine, werd toegepast op de testgegevens voor de snelle evaluatie van de prestaties van de pijplijn. Alleen de zeer betrouwbare plant-miRNA's afgezet bij miRBase v22.1 werden gescreend op het chromosoom 5A van IWGSC tarwe RefSeq genoom v224. mirMachine_find leverde 312 hits op voor de niet-overgrote lijst van 189 high-confidence miRNA's met een maximum van 1 toegestane mismatch (tabel 1). mirMachine_fold 49 van hen geclassificeerd als vermeende miRNA's, afhankelijk van de evaluatie van de secundaire structuur. De hoogst vertegenwoordigde groep miRNA's was miR9666 met een totaal van 18 geïdentificeerde miRNA's (figuur 1). Sommige miRNA's deelden hetzelfde volwassen miRNA, maar verwerkten uit een andere pre-miRNA-sequentie. Deze miRNA's werden hernoemd door de miRNA-familienaam gevolgd door een uniek nummer, bijvoorbeeld miR156-5p-1 en miR156-5p-2. Onder de 49 vermeende miRNA's werden 20 niet-redundante volwassen miRNA-sequenties geïdentificeerd. Sommige miRNA's kunnen worden getranscribeerd vanaf meer dan één locus, wat resulteert in een hoger aantal vertegenwoordigde miRNA's. In de testgegevens werd miR9666-3p-5 twee keer weergegeven: één op de zintuigstreng (op 602887137) en de andere op de antisense-streng (op 542053079). Alle locaties worden in de GitHub weergegeven onder het TestData-uitvoerbestand met de naam mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

Expressiebewijs in één plantengenoom is voldoende, gezien de conservering van miRNA's in planten; een zeer betrouwbare miRNA-dataset biedt echter slechts een beperkte hoeveelheid gegevens. Daarom heeft het de voorkeur van de gebruiker om de zeer betrouwbare en/of experimenteel gevalideerde miRNA's als referentiedataset te gebruiken en de expressievalidatiestap over te slaan, of om alle miRNA's van planten te gebruiken die beschikbaar zijn als referentiedataset en daarna naar het expressiebewijs te zoeken. Hier, omdat de zeer betrouwbare miRNA's werden gebruikt als de referentieset, die experimenteel was gevalideerd in een van de plantengenomen, werd de expressievalidatiestap overgeslagen voor de testgegevens.

mirMachine werd gebenchmarkt met behulp van monocote en tweezaadlobbige planten, waaronder Arabidopsis thaliana (Arabidopsis, TAIR10 release) en Triticum aestivum (tarwe, IWGSC RefSeq v2). De prestaties van de homologie-gebaseerde en de sRNA-seq-gebaseerde voorspellingen werden geëvalueerd en de resultaten werden vergeleken met de miRDP225, een op NGS gebaseerde miRNA-voorspellingstool. Homologie-gebaseerde voorspellingen werden uitgevoerd met behulp van de niet-redundante lijst van plant volwassen miRNA-sequenties afgezet op de miRbase v2226. op sRNA-seq gebaseerde voorspellingen werden uitgevoerd met behulp van de openbaar beschikbare datasets; GSM2094927 voor Arabidopsis en GSM1294661 voor de tarwe. Naast ruwe resultaten werden de op homologie gebaseerde voorspellingen gefilterd op het expressiebewijs van volwassen miRNA- en miRNA-stersequenties met behulp van dezelfde sRNA-seq-datasets.

Figuur 2 toont de prestaties van elk gereedschap en de mirMachine-instellingen op de twee soorten. De gevoeligheid werd berekend als het totale aantal geïdentificeerde bekende miRNA's gedeeld door het totale aantal geïdentificeerde miRNA's. De resultaten toonden aan dat mirMachine beter presteerde dan miRDP2 in termen van gevoeligheid en de echte positieve voorspellingen in de Arabidopsis-gegevens . Voor de tarwegegevens leverde de op homologie gebaseerde voorspelling van mirMachine, ondersteund door expressiebewijs, een betere gevoeligheid op dan miRDP2. Voor beide genomen voorspelde miRDP2 een hoger aantal echte positieven in vergelijking met mirMachine sRNA-seq en homologie-gebaseerde voorspellingen met expressiebewijs. Opgemerkt moet worden dat miRDP2 de expressiedrempel (RPM, leest per miljoen) verlaagt van 10 naar 1 voor de voorspelling van bekende miRNA's, wat resulteert in hogere echte positieve voorspellingen. Over het algemeen kan de mirMachine worden gebruikt voor de identificatie van zowel nieuwe als bekende miRNA's. Een voordeel van de mirMachine is het vermogen om genoombrede distributie van de vermeende miRNA's te voorspellen zonder een beperking van specifieke weefsels en aandoeningen. Ten slotte is de mirMachine gebruiksvriendelijk en biedt het flexibiliteit om parameters zoals het aantal hits, mismatches, lengte van miRNA's en RPM's aan te passen voor specifieke onderzoeksdoeleinden. Alles bij elkaar biedt de mirMachine nauwkeurige voorspellingen voor de vermeende miRNA's in de transcriptomen en het genoom van de planten.

Figure 1
Figuur 1: De verdeling van miRNA-families geïdentificeerd uit het chromosoom 5A van het IWGSC tarwereferentiegenoom v2. Gegevenslabels tonen de miRNA-familie en het aantal miRNA's dat tot elke miRNA-familie behoort. Afkortingen: miRNA = microRNA; IWGSC = International Wheat Genome Sequencing Consortium. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 2
Figuur 2: Prestatiebeoordeling van de mirMachine. Vergelijkingen van de gevoeligheid en het totale aantal voorspelde bekende miRNA's (echte positieven) worden getoond voor de mirMachine met homologie-gebaseerde en sRNA-seq-gebaseerde voorspellingen en de miRDP2-software. Afkorting: miRNA = microRNA. Klik hier om een grotere versie van deze figuur te bekijken.

Genoom Genoomgrootte Referentie miRNA dataset mirMachine_find hits mirMAchine_fold hits Aantal miRNA-families
Testgegevens ~0,7 Gb 189 312 49 9
Chr5A

Tabel 1: Statistieken van de mirMachine. De testgegevens zijn afkomstig van het chromosoom 5A van het IWGSC tarwereferentiegenoom v2. Afkortingen: miRNA = microRNA; IWGSC = International Wheat Genome Sequencing Consortium.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Onze miRNA-pijplijn, SUmir, is het afgelopen decennium gebruikt voor de identificatie van veel miRNA's van planten. Hier ontwikkelden we een nieuwe, volledig geautomatiseerde en vrij beschikbare miRNA-identificatie- en annotatiepijplijn, mirMachine. Bovendien waren een aantal miRNA-identificatiepijplijnen, waaronder, maar niet beperkt tot de vorige pijplijn, afhankelijk van UNAfold-software21, die in de loop van de tijd een commerciële software werd, hoewel deze ooit vrij beschikbaar was. Deze nieuwe en volledig geautomatiseerde mirMachine is niet langer afhankelijk van de UNAfold; in plaats daarvan wordt de vrij beschikbare RNAfold uit het ViennaRNA-pakket27 gebruikt voor secundaire structuurvoorspelling. Bovendien werden alle scripts voor de mirMachine verzameld in een bash-script met instelbare parameters om van mirMachine een volledig geautomatiseerde en vrij beschikbare miRNA-voorspellings- en annotatietool te maken.

De mirMachine profiteerde van de eigenschappen van plant miRNA's en hun biogenese. In tegenstelling tot dierlijke pre-miRNA's zijn plant pre-miRNA's variabel in lengte en structurele kenmerken15. Daarom is een criterium vastgesteld voor de identificatie van miRNA's van planten, afhankelijk van de kenmerken van de miRNA's en hun biogenese15. Er werd geen cut-off ingesteld voor de pre-miRNA-lengte, omdat de lengte van plant pre-miRNA's opmerkelijk kan variëren en honderden nucleotiden lang kan zijn. In plaats daarvan werd de pri-miRNA-structuurvouwing, die beperkt was tot ~ 700 bp in lengte, voor het eerst geëvalueerd. Later werd de pre-miRNA-sequentie voorspeld op basis van de kandidaat-pri-miRNA-sequenties en geëvalueerd voor de juiste vouwstatistieken.

Veel plantengenomen, vooral agronomisch belangrijke granen zoals tarwe en gerst, bezitten zeer repetitieve genomen 28,29,30. Afgezien van het hoge herhalingsgehalte, wordt polyploïdie waargenomen in sommige van deze planten24, wat extra complexiteit introduceert voor de in silico-identificatie en karakterisering van de miRNA-structuren. De herhalingen zijn een belangrijke bron voor de productie van siRNA's31, die in hun volwassen vormen op miRNA's lijken; ze verschillen echter in biogenese en functie32,33. Het is uiterst moeilijk om siRNA's van de kandidaat-miRNA-lijsten te verwijderen. In feite is gemeld dat de meest gebruikte miRNA-database, de miRBase26, grote aantallen siRNA's bevat die ten onrechte zijn geannoteerd als miRNA's 34,35. Op basis van de verschillen in hun biogenese filtert de mirMachine de kleine RNA's die een perfect paar vormen met de antisense-streng als siRNA's en plaatst die sequenties in de verdachte tabel. Bovendien heeft de mirMachine de optie -n, die het maximale aantal hits definieert om de kandidaat-RNA's als siRNA's te filteren.

Expressiebewijs is vereist om alle miRNA's te valideren die in silico zijn voorspeld. Aangezien miRNA's sterk geconserveerd zijn onder plantengenomen, zou expressiebewijs in een van de plantengenomen voldoende moeten zijn om de validiteit van het voorspelde miRNA te bevestigen. Het gebruik van zeer betrouwbare, volwassen miRNA-sequenties in het initiële screeningproces heeft het voordeel dat het expressiebewijs levert voor alle voorspelde miRNA's; de korte lijst van initiële miRNA-datasets beperkt echter de voorspelling van een uitgebreide set miRNA's in een genoom. Als alternatief kan een volledige set miRNA's van planten die in de miRBase-database zijn gedeponeerd, worden gebruikt als een eerste dataset in plaats van te filteren op miRNA's met een hoge betrouwbaarheid. Gebruikers wordt geadviseerd om te zoeken naar expressiebewijs door middel van uitgedrukte sequentietags, miRNA-microarrays of kleine RNA-sequencinggegevens voor ten minste één van de plantengenomen als er geen expressiegegevens beschikbaar zijn voor de soort van belang.

Homologie-gebaseerde miRNA-voorspellingen kunnen helpen bij het ophelderen van genoombrede distributie van de bekende familie van miRNA's. Deze miRNA's komen waarschijnlijk tot expressie in bepaalde weefsels en aandoeningen. Een nadeel van op homologie gebaseerde voorspellingen is het gebrek aan vermogen om nieuwe miRNA-families te identificeren. Daarentegen kunnen op sRNA-seq gebaseerde voorspellingen nieuwe miRNA's identificeren met een duur van een hoog aantal valse positieven. Daarom is de keuze van de beste aanpak aan de gebruikers en het onderzoek van belang. De hier gepresenteerde mirMachine kan helpen bij het identificeren van de miRNA's op basis van homologie aan bekende miRNA's of sRNA-sequencing.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biologie Nummer 171
mirMachine: een one-stop-shop voor miRNA-annotatie van planten
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter