Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: En one-stop-shop för växt-miRNA-anteckning

Published: May 1, 2021 doi: 10.3791/62430

Summary

Häri presenterar vi en ny och helautomatisk miRNA-pipeline, mirMachine som 1) kan identifiera kända och nya miRNA mer exakt och 2) är helt automatiserad och fritt tillgänglig. Användare kan nu köra ett kort överföringsskript för att köra den helautomatiska mirMachine-pipelinen.

Abstract

Av olika typer av icke-kodande RNA har mikroRNA (miRNA) utan tvekan varit i rampljuset under det senaste decenniet. Som post-transkriptionella regulatorer av genuttryck spelar miRNA nyckelroller i olika cellulära vägar, inklusive både utveckling och svar på a / biotisk stress, såsom torka och sjukdomar. Att ha högkvalitativa referensgenomsekvenser möjliggjorde identifiering och annotering av miRNA i flera växtarter, där miRNA-sekvenser är mycket bevarade. Eftersom beräknings-miRNA-identifierings- och annoteringsprocesser mestadels är felbenägna processer, ökar homologibaserade förutsägelser förutsägelsenoggrannheten. Vi utvecklade och har förbättrat miRNA-annoteringspipelinen, SUmir, under det senaste decenniet, som har använts för flera växtgenom sedan dess.

Denna studie presenterar en helt automatiserad, ny miRNA-pipeline, mirMachine (miRNA Machine), genom att (i) lägga till ytterligare ett filtreringssteg på de sekundära strukturförutsägelserna, (ii) göra den helt automatiserad och (iii) introducera nya alternativ för att förutsäga antingen känt miRNA baserat på homologi eller nya miRNA baserat på små RNA-sekvenseringsläsningar med den tidigare pipelinen. Den nya miRNA-pipelinen, mirMachine, testades med hjälp av Arabidopsis Information Resource, TAIR10, frisättning av Arabidopsis-genomet och International Wheat Genome Sequencing Consortium (IWGSC) vetereferensgenom v2.

Introduction

Framsteg inom nästa generations sekvenseringsteknik har breddat förståelsen för RNA-strukturer och reglerande element och avslöjat funktionellt viktiga icke-kodande RNA (ncRNA). Bland olika typer av ncRNA utgör mikroRNA (miRNA) en grundläggande regleringsklass av små RNA med en längd mellan 19 och 24 nukleotider i växter 1,2. Sedan upptäckten av det första miRNA i nematoden Caenorhabditis elegans3 har närvaron och funktionerna hos miRNA studerats omfattande i djur- och växtgenom samt 4,5,6. miRNA fungerar genom att rikta in sig på mRNA för klyvning eller translationellt förtryck7. Ackumulerande bevis har också visat att miRNA är involverade i ett brett spektrum av biologiska processer i växter inklusive tillväxt och utveckling8, självbiogenes9 och flera biotiska och abiotiska stressreaktioner10.

I växter bearbetas miRNA initialt från långa primära transkript som kallas pri-miRNA11. Dessa pri-miRNA som genereras av RNA-polymeras II inuti kärnan är långa transkript som bildar en ofullkomlig vikningsstruktur12. Pri-miRNA genomgår senare en klyvningsprocess för att producera endogena enkelsträngade (ss) hårnålsprekursorer av miRNA som kallas pre-miRNA11. Pre-miRNA bildar en hårnålsliknande struktur där en enda sträng viks in i en dubbelsträngad struktur för att skära ut en miRNA-duplex (miRNA / miRNA *)13. Dicer-liknande protein skär båda strängarna i miRNA / miRNA * duplex och lämnar 2-nukleotid 3'-överhäng14,15. MiRNA-duplexen metyleras inuti kärnan, vilket skyddar 3'-änden av miRNA från nedbrytning och uridyleringsaktivitet16,17. Ett helicase varvar ner den metylerade miRNA-duplexen efter export och utsätter det mogna miRNA för det RNA-inducerade tystnadskomplexet (RISC) i cytosolen18. En sträng i duplexen är moget miRNA införlivat i RISC , medan den andra strängen, miRNA *, bryts ned. MiRNA-RISC-komplexet binder till målsekvensen vilket leder till antingen mRNA-nedbrytning vid full komplementaritet eller translationell repression vid partiell komplementaritet13.

Baserat på uttrycks- och biogenesfunktionerna har riktlinjer för miRNA-annotering beskrivits15,19. Med de definierade riktlinjerna utvecklade Lucas och Budak SUmir-rörledningen för att utföra en homologibaserad in silico miRNA-identifiering i växter9. SUmir-pipelinen bestod av två skript: SUmirFind och SUmirFold. SUmirFind utför likhetssökningar mot kända miRNA-dataset genom National Center for Biotechnology Information (NCBI) Basic Local Alignment Search tool (BLAST) screening med modifierade parametrar för att inkludera träffar med endast 2 eller färre felmatchningar och för att undvika partiskhet mot kortare träffar (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold utvärderar den sekundära strukturen för de förmodade miRNA-sekvenserna från BLAST20-resultat med hjälp av UNAfold21. SUmirFold skiljer miRNA från små störande RNA genom identifiering av egenskaperna hos hårnålsstrukturen. Dessutom skiljer det miRNA från andra ssRNA såsom tRNA och rRNA med parametrarna, minsta viktenergiindex > 0,67 och GC-innehåll på 24-71%. Denna pipeline har nyligen uppdaterats genom att lägga till ytterligare två steg för att (i) öka känsligheten, (ii) öka annoteringsnoggrannheten och (iii) tillhandahålla genomisk fördelning av de förutsagda miRNA-generna22. Med tanke på det höga bevarandet av växt-miRNA-sekvenser23 var denna pipeline ursprungligen utformad för homologibaserad miRNA-förutsägelse. Nya miRNA kunde dock inte identifieras exakt med denna bioinformatiska analys eftersom den starkt förlitade sig på sekvensbevarande av miRNA mellan närbesläktade arter.

Detta dokument presenterar en ny och helautomatisk miRNA-pipeline, mirMachine som 1) kan identifiera kända och nya miRNA mer exakt (till exempel använder rörledningen nu sRNA-seq-baserade nya miRNA-förutsägelser samt homologibaserad miRNA-identifiering) och 2) är helt automatiserad och fritt tillgänglig. Resultaten har också inkluderat de genomiska fördelningarna av de förutsagda miRNA: erna. mirMachine testades för både homologibaserade och sRNA-seq-baserade förutsägelser i vete- och Arabidopsis-genom . Även om UNAfold ursprungligen släpptes som fri programvara, blev UNAfold en kommersiell programvara under det senaste decenniet. Med denna uppgradering byttes det sekundära strukturförutsägelseverktyget från UNAfold till RNAfold så att mirMachine kan vara fritt tillgängligt. Användare kan nu köra ett kort överföringsskript för att köra den helautomatiska mirMachine-pipelinen (exempel finns på https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Programvaruberoenden och installation

  1. Installera programvaruberoenden från deras hemsida eller med conda.
    1. Ladda ner och installera Perl, om det inte redan är installerat, från dess hemsida (https://www.perl.org/get.html).
      Representerade resultat förutspåddes med Perl v5.32.0.
    2. Ladda ner Blast+, ett justeringsprogram, från dess hemsida (https://www.ncbi.nlm.nih.gov/books/NBK279671/) som körbar och som källkod.
      OBS: Representerade resultat förutspåddes med BLAST 2.6.0+.
    3. Installera förkompilerat paket med RNAfold från https://www.tbi.univie.ac.at/RNA/.
    4. Alternativt kan du installera dessa programvaror med följande conda: i) conda install -c bioconda blast; ii) Conda installera -c Bioconda Viennarna.

2. MirMachine installation och testning

  1. Ladda ned den senaste versionen av mirMachine-skripten och mirMachine-överföringsskriptet från GitHub, https://github.com/hbusra/mirMachine.git och ange sedan skriptsökvägen till PATH.
  2. Använd testdata som tillhandahålls på GitHub för att se till att mirMachine tillsammans med alla dess beroenden har laddats ned korrekt.
  3. Kör mirMachine på testdata som visas nedan.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    OBS: Ställ in alternativet -n på 10 eftersom testdata endast innehåller en kromosom av vetegenomet. Som standard är alternativet -n inställt på 20.
  4. Kontrollera hårnålarna.tbl.out.tbl-utdatafilerna för de förutsagda mogna miRNA: erna, deras förutsagda föregångare och deras platser på kromosomerna.
  5. Kontrollera loggfilerna för programutdata och varningar.

3. Homologibaserad miRNA-identifiering

  1. Kör mirMachine med bash-skriptet som visas nedan:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Kontrollera de förutsagda miRNA: erna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.tbl.out.tbl för de förutsagda miRNA:erna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.fsa för pre-miRNA FASTA-sekvenserna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.log för hårnålsloggfilen.

4. Identifiering av nytt miRNA

  1. Förbearbeta sRNA-seq FASTQ-filerna till rätt FASTA-format. Trimma adaptrar om det behövs. Trimma inte läsningar av låg kvalitet; ta istället bort dem. Ta bort läsningar som innehåller N. Konvertera FASTQ-filen till FASTA-fil ($input_file).
  2. Kör mirMachine med bash-skriptet som visas nedan.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    OBS: $mismatches var inställd på 0 för sRNA-seq-baserade förutsägelser.
  3. Kontrollera de förutsagda miRNA: erna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.tbl.out.tbl för de förutsagda miRNA:erna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.fsa för pre-miRNA FASTA-sekvenserna. Hitta utdatafilen med namnet $input_file.results.tbl.hairpins.log för hårnålsloggfilen.

5. Avancerade parametrar

Standardvärdena definieras för alla parametrar utom genomfilen och den inmatade miRNA-filen.

  1. Ange alternativet -db till en blast-databas för att hoppa över byggnadsreferensdatabasen i pipelinen.
  2. Ställ in alternativet -m på antalet tillåtna matchningsfel.
    Som standard var alternativet - m inställt på 1 för homologibaserade förutsägelser och 0 för de sRNA-seq-baserade förutsägelserna.
  3. Ställ in -n på antalet träffar som ska elimineras efter justering (standard till 20). Ändra detta baserat på arten.
  4. Använd -long för att bedöma de sekundära strukturerna för listan över misstänkta.
  5. Använd -s för att aktivera den nya miRNA-förutsägelsen baserat på sRNA-seq-data .
  6. Ställ in alternativet - lmax på den maximala längden på de sRNA-seq-läsningar som ska inkluderas i screeningen.
  7. Ställ in alternativet - lmax på den minsta längden på de sRNA-seq-läsningar som ska inkluderas i screeningen.
  8. Använd alternativet -rpm för att ange tröskelvärdet för läsningar per miljon (RPM).
    OBS: För avancerade parametrar som längden på pri-miRNA / pre-miRNA uppmuntras erfarna användare att ändra skripten för sin forskning av intresse. Dessutom, om användarna tänker hoppa över några steg eller föredrar att använda modifierade utdata, kan överföringsskriptet ändras genom att helt enkelt lägga till # i början av raderna för att hoppa över dessa rader.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

MiRNA-rörledningen, mirMachine, som beskrivs ovan applicerades på testdata för snabb utvärdering av rörledningens prestanda. Endast de högkonfidensväxt-miRNA som deponerades vid miRBase v22.1 screenades mot kromosomen 5A av IWGSC-vete RefSeq-genomet v224. mirMachine_find returnerade 312 träffar för den icke-redundanta listan med 189 miRNA med hög konfidens med högst 1 felaktig matchning tillåten (tabell 1). mirMachine_fold klassificerade 49 av dem som förmodade miRNA beroende på sekundärstrukturutvärderingen. Den högst representerade gruppen av miRNA var miR9666 med totalt 18 miRNA identifierade (figur 1). Vissa miRNA delade samma mogna miRNA, men bearbetades från en annan pre-miRNA-sekvens. Dessa miRNA döptes om av miRNA-familjenamnet följt av ett unikt nummer, t.ex. miR156-5p-1 och miR156-5p-2. Bland de 49 förmodade miRNA identifierades 20 icke-redundanta mogna miRNA-sekvenser. Vissa miRNA kan transkriberas från mer än ett locus vilket resulterar i ett högre antal representerade miRNA. I testdata representerades miR9666-3p-5 två gånger: en på sinnessträngen (vid 602887137) och den andra på antisense-strängen (vid 542053079). Alla platser finns i GitHub under TestData-utdatafilen med namnet mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

Uttrycksbevis i ett växtgenom är tillräckligt, med tanke på bevarandet av miRNA i växter; En miRNA-datauppsättning med hög konfidens ger dock endast en begränsad mängd data. Därför är det användarens preferens att använda miRNA med hög konfidens och/eller experimentellt validerade som referensdatauppsättning och hoppa över uttrycksvalideringssteget, eller att använda alla växt-miRNA som är tillgängliga som referensdataset och leta efter uttrycksbevisen efteråt. Här, när miRNA med hög konfidens användes som referensuppsättning, som hade validerats experimentellt i ett av växtgenomen, hoppades uttrycksvalideringssteget över för testdata.

mirMachine jämfördes med monocot och dicot växter inklusive Arabidopsis thaliana (Arabidopsis, TAIR10 release) och Triticum aestivum (vete, IWGSC RefSeq v2). Prestandan hos de homologibaserade och sRNA-seq-baserade förutsägelserna utvärderades och resultaten jämfördes med miRDP225, ett NGS-baserat miRNA-prediktionsverktyg. Homologibaserade förutsägelser utfördes med hjälp av den icke-redundanta listan över växtmogna miRNA-sekvenser deponerade vid miRbase v2226. sRNA-seq-baserade förutsägelser utfördes med hjälp av de offentligt tillgängliga datamängderna; GSM2094927 för Arabidopsis och GSM1294661 för vetet. Förutom råresultat filtrerades de homologibaserade förutsägelserna för uttrycksbevis för mogna miRNA- och miRNA-stjärnsekvenser med samma sRNA-seq-dataset.

Figur 2 visar prestanda för varje verktyg och mirMachine-inställningarna för de två arterna. Känsligheten beräknades som det totala antalet kända miRNA som identifierats dividerat med det totala antalet identifierade miRNA. Resultaten visade att mirMachine överträffade miRDP2 när det gäller känslighet och de sanna positiva förutsägelserna i Arabidopsis-data . För vetedata gav mirMachine homologibaserad förutsägelse, med stöd av uttrycksbevis, bättre känslighet än miRDP2. För båda genomerna förutspådde miRDP2 högre antal sanna positiva jämfört med mirMachine sRNA-seq och homologibaserade förutsägelser med uttrycksbevis. Det bör noteras att miRDP2 sänker uttryckströskeln (RPM, läser per miljon) från 10 till 1 för förutsägelse av kända miRNA, vilket resulterar i högre sanna positiva förutsägelser. I allmänhet kan mirMachine användas för identifiering av både nya och kända miRNA. En fördel med mirMachine är dess förmåga att förutsäga genomomfattande fördelning av de förmodade miRNA utan begränsning av specifika vävnader och förhållanden. Slutligen är mirMachine användarvänlig och ger flexibilitet att justera parametrar som antal träffar, felmatchningar, längd på miRNA och RPM för specifika forskningsändamål. Sammantaget ger mirMachine exakta förutsägelser för de förmodade miRNA i transkriptomerna och växternas genom.

Figure 1
Figur 1: Fördelningen av miRNA-familjer identifierade från kromosomen 5A i IWGSC-vetereferensgenomet v2. Dataetiketter visar miRNA-familjen och antalet miRNA som tillhör varje miRNA-familj. Förkortningar: miRNA = mikroRNA; IWGSC = International Wheat Genome Sequencing Consortium. Klicka här för att se en större version av denna siffra.

Figure 2
Figur 2: Prestandabedömning av mirMachine. Jämförelser av känsligheten och det totala antalet kända miRNA som förutsagts (sanna positiva) visas för mirMachine med homologibaserade och sRNA-seq-baserade förutsägelser och miRDP2-programvaran. Förkortning: miRNA = mikroRNA. Klicka här för att se en större version av denna siffra.

Genom Genomets storlek Referera till miRNA-dataset mirMachine_find träffar mirMAchine_fold träffar # av miRNA -familjer
Testdata ~0,7 GB 189 312 49 9
Chr5A

Tabell 1: Statistik för mirMachine. Testdata kommer från kromosom 5A i IWGSC:s vetereferensgenom v2. Förkortningar: miRNA = mikroRNA; IWGSC = International Wheat Genome Sequencing Consortium.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Vår miRNA-pipeline, SUmir, har använts för identifiering av många växt-miRNA under det senaste decenniet. Här utvecklade vi en ny, helt automatiserad och fritt tillgänglig miRNA-identifierings- och annoteringspipeline, mirMachine. Dessutom var ett antal miRNA-identifieringsrörledningar inklusive, men inte begränsat till den tidigare rörledningen, beroende av UNAfold-programvara21, som med tiden blev en kommersiell programvara, även om den en gång var fritt tillgänglig. Denna nya och helautomatiska mirMachine är inte längre beroende av UNAfold; istället används den fritt tillgängliga RNAfold från ViennaRNA-paketet27 för sekundär strukturförutsägelse. Dessutom samlades alla skript för mirMachine i ett bash-skript med justerbara parametrar för att göra mirMachine till ett helautomatiskt och fritt tillgängligt miRNA-förutsägelse- och anteckningsverktyg.

MirMachine gynnades av egenskaperna hos växt-miRNA och deras biogenes. I motsats till djurpre-miRNA är växtpre-miRNA varierande i längd och strukturella egenskaper15. Följaktligen har ett kriterium fastställts för identifiering av växt-miRNA beroende på egenskaperna hos miRNA och deras biogenes15. Ingen cut-off sattes för pre-miRNA-längden eftersom längden på växtens pre-miRNA kan variera anmärkningsvärt och kan vara hundratals nukleotider långa. Istället utvärderades först pri-miRNA-strukturveckning, som var begränsad till ~ 700 bp i längd. Senare förutspåddes pre-miRNA-sekvensen från kandidaten pri-miRNA-sekvenser och utvärderades för korrekt vikningsstatistik.

Många växtgenom, särskilt agronomiskt viktiga spannmål som vete och korn, har mycket repetitiva genom28,29,30. Förutom det höga upprepningsinnehållet observeras polyploidi i några av dessa växter24, vilket introducerar ytterligare komplexiteter till in silico-identifieringen och karakteriseringen av miRNA-strukturerna. Upprepningarna är en viktig källa för produktion av siRNA31, som liknar miRNA i sina mogna former; de skiljer sig dock åt i biogenes och funktion32,33. Det är extremt svårt att eliminera siRNA från kandidatens miRNA-listor. Faktum är att den mest använda miRNA-databasen, miRBase26, har rapporterats innehålla ett stort antal siRNA som antecknats falskt som miRNA34,35. Baserat på skillnaderna i deras biogenes filtrerar mirMachine de små RNA som bildar ett perfekt par med antisense-strängen som siRNA och placerar dessa sekvenser i den misstänkta tabellen. Dessutom har mirMachine alternativet -n, som definierar det maximala antalet träffar för att filtrera kandidat-RNA som siRNA.

Uttrycksbevis krävs för att validera alla miRNA som förutsagts i silico. Eftersom miRNA är mycket bevarade bland växtgenom, bör uttrycksbevis i ett av växtgenomen vara tillräckliga för att bekräfta giltigheten av det förutsagda miRNA. Användningen av högkonfidens, mogna miRNA-sekvenser i den initiala screeningprocessen har fördelen att den ger uttrycksbevis för alla förutsagda miRNA; Den korta listan över initiala miRNA-dataset begränsar dock förutsägelsen av en omfattande uppsättning miRNA i ett genom. Alternativt kan en fullständig uppsättning växt-miRNA som deponeras i miRBase-databasen användas som en första datauppsättning i stället för att filtrera efter miRNA med hög konfidens. Användare rekommenderas att leta efter uttrycksbevis genom uttryckta sekvenstaggar, miRNA-mikroarrayer eller små RNA-sekvenseringsdata för minst ett av växtgenomen om några uttrycksdata inte är tillgängliga för arten av intresse.

Homologibaserade miRNA-förutsägelser kan hjälpa till att belysa genomomfattande fördelning av den kända familjen miRNA. Dessa miRNA kommer sannolikt att uttryckas i vissa vävnader och tillstånd. En nackdel med homologibaserade förutsägelser är bristen på förmåga att identifiera nya miRNA-familjer. Däremot kan sRNA-seq-baserade förutsägelser identifiera nya miRNA med en kostnad för ett stort antal falska positiva resultat. Därför är valet av det bästa tillvägagångssättet upp till användarna och forskningen av intresse. MirMachine som presenteras här kan hjälpa till att identifiera miRNA baserat på antingen homologi till kända miRNA eller sRNA-sekvensering.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biologi utgåva 171
mirMachine: En one-stop-shop för växt-miRNA-anteckning
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter