Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: En one-Stop Shop for Plant miRNA-merknad

Published: May 1, 2021 doi: 10.3791/62430

Summary

Her presenterer vi en ny og helautomatisk miRNA-pipeline, mirMachine som 1) kan identifisere kjente og nye miRNA-er mer nøyaktig og 2) er helautomatisert og fritt tilgjengelig. Brukere kan nå kjøre et kort innsendingsskript for å kjøre det helautomatiske mirMachine-datasamlebåndet.

Abstract

Av forskjellige typer ikke-kodende RNA har mikroRNA (miRNA) uten tvil vært i søkelyset det siste tiåret. Som posttranskripsjonelle regulatorer av genuttrykk spiller miRNA nøkkelroller i ulike cellulære veier, inkludert både utvikling og respons på a / biotisk stress, som tørke og sykdommer. Å ha referansegenomsekvenser av høy kvalitet muliggjorde identifisering og annotering av miRNA i flere plantearter, hvor miRNA-sekvenser er svært bevart. Siden beregningsmessige miRNA-identifikasjons- og merknadsprosesser for det meste er feilutsatte prosesser, øker homologibaserte spådommer prediksjonsnøyaktigheten. Vi utviklet og har forbedret miRNA-merknadsrørledningen, SUmir, i det siste tiåret, som har blitt brukt til flere plantegenomer siden den gang.

Denne studien presenterer en helautomatisk, ny miRNA-rørledning, mirMachine (miRNA Machine), ved å (i) legge til et ekstra filtreringstrinn på de sekundære strukturforutsigelsene, (ii) gjøre den helautomatisert, og (iii) introdusere nye alternativer for å forutsi enten kjent miRNA basert på homologi eller nye miRNA-er basert på små RNA-sekvenseringsavlesninger ved hjelp av forrige rørledning. Den nye miRNA-rørledningen, mirMachine, ble testet ved hjelp av Arabidopsis Information Resource, TAIR10, frigjøring av Arabidopsis-genomet og International Wheat Genome Sequencing Consortium (IWGSC) hvetereferansegenom v2.

Introduction

Fremskritt i neste generasjons sekvenseringsteknologier har utvidet forståelsen av RNA-strukturer og regulatoriske elementer, og avslører funksjonelt viktige ikke-kodende RNA (ncRNA). Blant forskjellige typer ncRNA utgjør mikroRNA (miRNA) en grunnleggende regulatorisk klasse av små RNA med en lengde mellom 19 og 24 nukleotider i planter 1,2. Siden oppdagelsen av det første miRNA i nematoden Caenorhabditis elegans3, har tilstedeværelsen og funksjonene til miRNA blitt studert grundig i dyre- og plantegenomer samt 4,5,6. miRNA fungerer ved å målrette mRNA for spalting eller translasjonell undertrykkelse7. Akkumulerende bevis har også vist at miRNA er involvert i et bredt spekter av biologiske prosesser i planter, inkludert vekst og utvikling8, selvbiogenese9 og flere biotiske og abiotiske stressresponser10.

I planter behandles miRNA først fra lange primære transkripsjoner kalt pri-miRNA11. Disse pri-miRNA-ene generert av RNA-polymerase II inne i kjernen er lange transkripsjoner som danner en ufullkommen fold-back-struktur12. Pri-miRNA-ene gjennomgår senere en spaltningsprosess for å produsere endogene enkeltstrengede (ss) hårnålsforløpere til miRNA kalt pre-miRNA11. Pre-miRNA danner en hårnålslignende struktur hvor en enkelt streng brettes inn i en dobbeltstrenget struktur for å excise en miRNA duplex (miRNA / miRNA *) 13. Dicer-lignende protein kutter begge trådene i miRNA / miRNA * dupleks, og etterlater 2-nukleotid 3'-overheng14,15. MiRNA-duplekset metyleres inne i kjernen, som beskytter 3'-enden av miRNA mot nedbrytning og uridyleringsaktivitet16,17. En helicase slapper av den metylerte miRNA-dupleksen etter eksport og eksponerer det modne miRNA for det RNA-induserte deaktiveringskomplekset (RISC) i cytosolen18. En tråd av duplekset er modent miRNA innlemmet i RISC , mens den andre strengen, miRNA *, nedbrytes. MiRNA-RISC-komplekset binder seg til målsekvensen som fører til enten mRNA-nedbrytning ved full komplementaritet eller translasjonsundertrykkelse ved delvis komplementaritet13.

Basert på ekspresjons- og biogenesefunksjonene er retningslinjer for miRNA-merknad beskrevet15,19. Med de definerte retningslinjene utviklet Lucas og Budak SUmir-rørledningen for å utføre en homologibasert i silico miRNA-identifikasjon i anlegg9. SUmir-rørledningen var sammensatt av to skript: SUmirFind og SUmirFold. SUmirFind utfører likhetssøk mot kjente miRNA-datasett gjennom National Center for Biotechnology Information (NCBI) Basic Local Alignment Search tool (BLAST) screening med modifiserte parametere for å inkludere treff med bare 2 eller færre misforhold og for å unngå skjevhet mot kortere treff (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold evaluerer den sekundære strukturen til de antatte miRNA-sekvensene fra BLAST20-resultatene ved bruk av UNAfold21. SUmirFold skiller miRNA fra små forstyrrende RNA ved å identifisere egenskapene til hårnålsstrukturen. Videre skiller den miRNA fra andre ssRNA som tRNA og rRNA ved parametrene, minimum fold energiindeks > 0,67 og GC innhold på 24-71%. Denne rørledningen har nylig blitt oppdatert ved å legge til to ekstra trinn for å (i) øke følsomheten, (ii) øke merknadsnøyaktigheten og (iii) gi genomisk fordeling av de forutsagte miRNA-genene22. Gitt den høye bevaringen av plante miRNA-sekvenser23, ble denne rørledningen opprinnelig designet for homologibasert miRNA-prediksjon. Nye miRNA kunne imidlertid ikke identifiseres nøyaktig med denne bioinformatikkanalysen, da den i stor grad stolte på sekvensbevaring av miRNA mellom nært beslektede arter.

Dette papiret presenterer en ny og helautomatisk miRNA-rørledning, mirMachine som 1) kan identifisere kjente og nye miRNA-er mer nøyaktig (for eksempel bruker rørledningen nå sRNA-seq-baserte nye miRNA-spådommer samt homologibasert miRNA-identifikasjon) og 2) er fullt automatisert og fritt tilgjengelig. Utgangene har også inkludert de genomiske fordelingene av de forutsagte miRNA-ene. mirMachine ble testet for både homologibaserte og sRNA-seq-baserte prediksjoner i hvete- og Arabidopsis-genomer . Selv om UNAfold opprinnelig ble utgitt som fri programvare, ble den en kommersiell programvare i det siste tiåret. Med denne oppgraderingen ble det sekundære strukturprediksjonsverktøyet byttet fra UNAfold til RNAfold slik at mirMachine kan være fritt tilgjengelig. Brukere kan nå kjøre et kort innsendingsskript for å kjøre det helautomatiske mirMachine-datasamlebåndet (eksempler finnes på https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Programvareavhengigheter og installasjon

  1. Installer programvareavhengigheter fra hjemmesiden eller ved hjelp av conda.
    1. Last ned og installer Perl, hvis den ikke allerede er installert, fra hjemmesiden (https://www.perl.org/get.html).
      MERK: Representerte resultater ble spådd med Perl v5.32.0.
    2. Last ned Blast ned Blast+, et justeringsprogram, fra hjemmesiden (https://www.ncbi.nlm.nih.gov/books/NBK279671/) som kjørbar fil og som kildekode.
      MERK: Representerte resultater ble spådd ved hjelp av BLAST 2.6.0+.
    3. Installer forhåndskompilert pakke med RNAfold fra https://www.tbi.univie.ac.at/RNA/.
    4. Alternativt kan du installere disse programvarene ved hjelp av følgende conda: i) conda install -c bioconda blast; ii) conda installere -c bioconda viennarna.

2. Oppsett og testing av mirMachine

  1. Last ned den nyeste versjonen av mirMachine-skriptene og mirMachine-innsendingsskriptet fra GitHub, https://github.com/hbusra/mirMachine.git, og angi deretter skriptbanen i PATHen.
  2. Bruk testdataene som er oppgitt på GitHub for å sikre at mirMachine sammen med alle avhengighetene er lastet ned riktig.
  3. Kjør mirMachine på testdataene vist nedenfor.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    MERK: Sett -n-alternativet til 10, da testdataene bare inneholder ett kromosom av hvetegenomet. Som standard er alternativet -n satt til 20.
  4. Kontroller utdatafilene hairpins.tbl.out.tbl for de forutsagte modne miRNA-ene, deres forventede forløpere og deres plassering på kromosomene.
  5. Sjekk loggfilene for programutganger og advarsler.

3. Homologibasert miRNA-identifikasjon

  1. Kjør mirMachine ved hjelp av bash-skriptet vist nedenfor:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Sjekk de forutsagte miRNA-ene. Finn utdatafilen $input_file.results.tbl.hairpins.tbl.out.tbl for de forutsagte miRNA-ene. Finn utdatafilen $input_file.results.tbl.hairpins.fsa for pre-miRNA FASTA-sekvensene. Finn utdatafilen $input_file.results.tbl.hairpins.log for hårnålsloggfilen.

4. Ny miRNA-identifikasjon

  1. Forbehandle sRNA-seq FASTQ-filene til riktig FASTA-format. Trim adaptere om nødvendig. Ikke trim leser av lav kvalitet; fjern dem i stedet. Fjern avlesninger som inneholder N. Konverter FASTQ-filen til FASTA-fil ($input_file).
  2. Kjør mirMachine ved hjelp av bash-skriptet vist nedenfor.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    MERK: $mismatches ble satt til 0 for sRNA-seq-baserte spådommer.
  3. Sjekk de forutsagte miRNA-ene. Finn utdatafilen $input_file.results.tbl.hairpins.tbl.out.tbl for de forutsagte miRNA-ene. Finn utdatafilen $input_file.results.tbl.hairpins.fsa for pre-miRNA FASTA-sekvensene. Finn utdatafilen $input_file.results.tbl.hairpins.log for hårnålsloggfilen.

5. Advance parametere

MERK: Standardinnstillingene er definert for alle parametrene bortsett fra genomfilen og den inngående miRNA-filen.

  1. Sett alternativet -db til en blastdatabase for å hoppe over bygningens referansedatabase i pipelinen.
  2. Sett - m-alternativet til antall tillatte uoverensstemmelser.
    MERK: Ved standard ble - m-alternativet satt til 1 for homologibaserte prediksjoner og 0 for sRNA-seq-baserte prediksjoner.
  3. Sett -n til antall treff for å eliminere etter justering (standard til 20). Endre dette basert på arten.
  4. Bruk -long for å vurdere sekundærstrukturene for listen over mistenkte.
  5. Bruk - s for å aktivere den nye miRNA-prediksjonen basert på sRNA-seq-data.
  6. Sett - lmax-alternativet til den maksimale lengden på sRNA-seq-avlesningene som skal inkluderes i screeningen.
  7. Sett - lmax-alternativet til minimumslengden på sRNA-seq-avlesningene som skal inkluderes i screeningen.
  8. Bruk -rpm-alternativet for å angi terskelen for lesing per million (RPM).
    MERK: For avanserte parametere som lengden på pri-miRNA / pre-miRNA, oppfordres erfarne brukere til å endre skriptene for deres forskning av interesse. I tillegg, hvis brukerne har tenkt å hoppe over noen trinn eller foretrekker å bruke modifiserte utdata, kan innsendingsskriptet endres ved ganske enkelt å legge til # i begynnelsen av linjene for å hoppe over disse linjene.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

MiRNA-rørledningen, mirMachine, beskrevet ovenfor, ble brukt på testdataene for rask evaluering av rørledningens ytelse. Bare høykonfidensplanten miRNA deponert ved miRBase v22.1 ble screenet mot kromosom 5A av IWGSC-hvete RefSeq-genomet v224. mirMachine_find returnerte 312 treff for den ikke-overflødige listen over 189 miRNA med høy tillit med maksimalt 1 mismatch tillatt (tabell 1). mirMachine_fold klassifiserte 49 av dem som antatte miRNA avhengig av sekundærstrukturevalueringen. Den høyest representerte gruppen av miRNA var miR9666 med totalt 18 miRNA identifisert (figur 1). Noen miRNA delte det samme modne miRNA, men behandlet fra en annen pre-miRNA-sekvens. Disse miRNA-ene ble omdøpt av miRNA-familienavnet etterfulgt av et unikt nummer, for eksempel miR156-5p-1 og miR156-5p-2. Blant de 49 antatte miRNA-ene ble 20 ikke-redundante modne miRNA-sekvenser identifisert. Noen miRNA kan transkriberes fra mer enn ett lokus, noe som resulterer i et høyere antall miRNA representert. I testdataene var miR9666-3p-5 representert to ganger: en på sansestrengen (ved 602887137) og den andre på antisense-strengen (ved 542053079). Alle plasseringer er angitt i GitHub under TestData-utdatafilen med navnet mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

Uttrykksbevis i ett plantegenom er tilstrekkelig, gitt bevaring av miRNA i planter; Et miRNA-datasett med høy konfidens gir imidlertid bare en begrenset mengde data. Derfor er det brukerens preferanse å bruke høykonfidens- og/eller eksperimentelt validerte miRNA-er som referansedatasett og hoppe over uttrykksvalideringstrinnet, eller å bruke alle plante-miRNA-er som er tilgjengelige som referansedatasett og se etter uttrykksbeviset etterpå. Her, da miRNA-ene med høy konfidens ble brukt som referansesett, som hadde blitt validert eksperimentelt i et av plantegenomene, ble ekspresjonsvalideringstrinnet hoppet over for testdataene.

mirMachine ble benchmarked ved hjelp av monocot og dicot planter inkludert Arabidopsis thaliana (Arabidopsis, TAIR10 utgivelse) og Triticum aestivum (hvete, IWGSC RefSeq v2). Ytelsen til de homologibaserte og sRNA-seq-baserte prediksjonene ble evaluert, og resultatene ble sammenlignet med miRDP225, et NGS-basert miRNA-prediksjonsverktøy. Homologibaserte prediksjoner ble utført ved hjelp av den ikke-overflødige listen over plantemodne miRNA-sekvenser deponert ved miRbase v2226. sRNA-seq-baserte prediksjoner ble utført ved hjelp av de offentlig tilgjengelige datasettene; GSM2094927 for Arabidopsis og GSM1294661 for hveten. I tillegg til rå resultater ble de homologibaserte prediksjonene filtrert for uttrykksbevis for modne miRNA- og miRNA-stjernesekvenser ved bruk av de samme sRNA-seq-datasettene.

Figur 2 viser ytelsen til hvert verktøy og mirMachine-innstillingene på de to artene. Sensitivitet ble beregnet som det totale antall kjente miRNA identifisert dividert med totalt antall miRNA identifisert. Resultatene viste at mirMachine overgikk miRDP2 når det gjelder følsomhet og de sanne positive spådommene i Arabidopsis-dataene . For hvetedataene ga mirMachine homologibasert prediksjon, støttet av uttrykksbevis, bedre følsomhet enn miRDP2. For begge genomene spådde miRDP2 høyere antall sanne positive sammenlignet med mirMachine sRNA-seq og homologibaserte spådommer med uttrykksbevis. Det skal bemerkes at miRDP2 senker uttrykksterskelen (RPM, leser per million) fra 10 til 1 for prediksjon av kjente miRNA, noe som resulterer i høyere sanne positive spådommer. Generelt kan mirMachine brukes til identifisering av både nye og kjente miRNA. En fordel med mirMachine er dens evne til å forutsi genom-bred distribusjon av de antatte miRNA-ene uten begrensning av spesifikke vev og forhold. Endelig er mirMachine brukervennlig og gir fleksibilitet til å justere parametere som antall treff, mismatches, lengde på miRNA og RPM for spesifikke forskningsformål. Samlet gir mirMachine nøyaktige spådommer for de antatte miRNA-ene i transkriptomene og genomene til plantene.

Figure 1
Figur 1: Fordelingen av miRNA-familier identifisert fra kromosom 5A i IWGSC-hvetereferansegenomet v2. Dataetiketter viser miRNA-familien og antall miRNA-er som tilhører hver miRNA-familie. Forkortelser: miRNA = microRNA; IWGSC = Internasjonalt konsortium for sekvensering av hvetegenom. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Ytelsesvurdering av mirMachine. Sammenligninger av sensitiviteten og det totale antallet kjente miRNA-er som er spådd (sanne positive) vises for mirMachine med homologibaserte og sRNA-seq-baserte prediksjoner og miRDP2-programvaren. Forkortelse: miRNA = microRNA. Vennligst klikk her for å se en større versjon av denne figuren.

Genom Genom størrelse Referanse miRNA datasett mirMachine_find treff mirMAchine_fold treff # av miRNA-familier
Test data ~ 0,7 GB 189 312 49 9
Chr5A

Tabell 1: Statistikk over mirMachine. Testdata er fra kromosom 5A av IWGSC hvetereferansegenom v2. Forkortelser: miRNA = microRNA; IWGSC = Internasjonalt konsortium for sekvensering av hvetegenom.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Vår miRNA-rørledning, SUmir, har blitt brukt til identifisering av mange plante-miRNA det siste tiåret. Her utviklet vi en ny, helautomatisk og fritt tilgjengelig miRNA-identifikasjons- og merknadsrørledning, mirMachine. Videre var en rekke miRNA-identifikasjonsrørledninger, inkludert, men ikke begrenset til den forrige rørledningen, avhengig av UNAfold-programvare21, som ble en kommersiell programvare over tid, men en gang var fritt tilgjengelig. Denne nye og helautomatiske mirMachine er ikke lenger avhengig av UNAfold; i stedet brukes den fritt tilgjengelige RNAfold fra ViennaRNA-pakken27 til sekundær strukturprediksjon. I tillegg ble alle skript for mirMachine samlet i et bash-skript med justerbare parametere for å gjøre mirMachine til et helautomatisk og fritt tilgjengelig miRNA-prediksjons- og merknadsverktøy.

MirMachine dro nytte av egenskapene til plante miRNA og deres biogenese. I motsetning til dyr pre-miRNA, er plante pre-miRNA variabel i lengde og strukturelle egenskaper15. Følgelig er det satt et kriterium for identifisering av plante-miRNA avhengig av egenskapene til miRNA og deres biogenese15. Ingen avskjæring ble satt for pre-miRNA-lengden, da lengden på plantens pre-miRNA kan variere bemerkelsesverdig og kan være hundrevis av nukleotider lange. I stedet ble pri-miRNA-strukturfolding, som var begrenset til ~ 700 bp i lengde, først evaluert. Senere ble pre-miRNA-sekvensen spådd fra kandidatens pri-miRNA-sekvenser og evaluert for riktig foldestatistikk.

Mange plantegenomer, spesielt agronomisk viktige korn som hvete og bygg, har svært repeterende genomer28,29,30. Annet enn det høye repetisjonsinnholdet, observeres polyploidi i noen av disse plantene24, og introduserer ytterligere kompleksiteter til in silico-identifikasjon og karakterisering av miRNA-strukturene. Gjentakelsene er en viktig kilde for produksjonen av siRNA31, som ligner miRNA i sine modne former; Imidlertid er de forskjellige i biogenese og funksjon32,33. Det er ekstremt vanskelig å eliminere siRNA fra kandidatens miRNA-lister. Faktisk har den mest brukte miRNA-databasen, miRBase26, blitt rapportert å inneholde et stort antall siRNA kommentert falskt som miRNA34,35. Basert på forskjellene i deres biogenese, filtrerer mirMachine de små RNA-ene som danner et perfekt par med antisense-strengen som siRNA og plasserer disse sekvensene i den mistenkte tabellen. I tillegg har mirMachine -n-alternativet, som definerer maksimalt antall treff for å filtrere kandidat-RNA-ene som siRNA-er.

Uttrykksbevis er nødvendig for å validere alle miRNA-ene som er spådd i silico. Siden miRNA er svært konservert blant plantegenomer, bør ekspresjonsbevis i et av plantegenomene være tilstrekkelig til å bekrefte gyldigheten av det forutsagte miRNA. Bruken av modne miRNA-sekvenser med høy tillit i den første screeningsprosessen har fordelen av å gi uttrykksbevis for alle de forutsagte miRNA-ene; Den korte listen over innledende miRNA-datasett begrenser imidlertid prediksjonen av et omfattende sett med miRNA i et genom. Alternativt kan et komplett sett med plante-miRNA deponert i miRBase-databasen brukes som et innledende datasett i stedet for filtrering for miRNA med høy konfidens. Brukere anbefales å se etter uttrykksbevis gjennom uttrykte sekvenskoder, miRNA-mikromatriser eller små RNA-sekvenseringsdata for minst ett av plantegenomene hvis noen uttrykksdata ikke er tilgjengelige for arten av interesse.

Homologibaserte miRNA-prediksjoner kan bidra til å belyse genom-bred distribusjon av den kjente familien av miRNA. Disse miRNAene vil sannsynligvis bli uttrykt i visse vev og forhold. En ulempe med homologibaserte spådommer er mangelen på evne til å identifisere nye miRNA-familier. I motsetning til dette kan sRNA-seq-baserte spådommer identifisere nye miRNA-er med en kostnad på et høyt antall falske positiver. Derfor er valget av den beste tilnærmingen opp til brukerne og forskningen av interesse. MirMachine som presenteres her kan bidra til identifisering av miRNA basert på enten homologi til kjente miRNA eller sRNA-sekvensering.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biologi utgave 171
mirMachine: En one-Stop Shop for Plant miRNA-merknad
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter