Summary

mirMachine: Una ventanilla única para la anotación de miARN de plantas

Published: May 01, 2021
doi:

Summary

Aquí, presentamos una nueva y totalmente automatizada tubería de miARN, mirMachine que 1) puede identificar miARN conocidos y novedosos con mayor precisión y 2) está totalmente automatizada y disponible gratuitamente. Los usuarios ahora pueden ejecutar un breve script de envío para ejecutar la canalización mirMachine totalmente automatizada.

Abstract

De los diferentes tipos de ARN no codificantes, los microARN (miARN) han estado en el centro de atención durante la última década. Como reguladores post-transcripcionales de la expresión génica, los miRNAs juegan un papel clave en varias vías celulares, incluyendo tanto el desarrollo como la respuesta al estrés biótico, como la sequía y las enfermedades. Tener secuencias genómicas de referencia de alta calidad permitió la identificación y anotación de miARN en varias especies de plantas, donde las secuencias de miARN están altamente conservadas. Como los procesos computacionales de identificación y anotación de miARN son en su mayoría procesos propensos a errores, las predicciones basadas en homología aumentan la precisión de la predicción. Desarrollamos y hemos mejorado la línea de anotación de miARN, SUmir, en la última década, que se ha utilizado para varios genomas de plantas desde entonces.

Este estudio presenta una nueva tubería de miARN totalmente automatizada, mirMachine (miRNA Machine), (i) agregando un paso de filtrado adicional en las predicciones de la estructura secundaria, (ii) haciéndolo completamente automatizado, y (iii) introduciendo nuevas opciones para predecir miARN conocidos basados en homología o nuevos miARN basados en pequeñas lecturas de secuenciación de ARN utilizando la tubería anterior. La nueva tubería de miARN, mirMachine, se probó utilizando The Arabidopsis Information Resource, TAIR10, liberación del genoma de Arabidopsis y el genoma de referencia de trigo v2 del Consorcio Internacional de Secuenciación del Genoma del Genoma del Trigo (IWGSC).

Introduction

Los avances en las tecnologías de secuenciación de próxima generación han ampliado la comprensión de las estructuras de ARN y los elementos reguladores, revelando ARN no codificantes (ncRNA) funcionalmente importantes. Entre los diferentes tipos de ncRNAs, los microRNAs (miRNAs) constituyen una clase reguladora fundamental de pequeños RNAs con una longitud entre 19 y 24 nucleótidos en plantas 1,2. Desde el descubrimiento del primer miARN en el nematodo Caenorhabditis elegans3, la presencia y las funciones de los miARN se han estudiado ampliamente en genomas animales y vegetales, así comoen 4,5,6. Los miARN funcionan dirigiéndose a los ARNm para la escisión o la represión traslacional7. La evidencia acumulada también ha demostrado que los miARN están involucrados en una amplia gama de procesos biológicos en las plantas, incluyendo el crecimiento y el desarrollo8, la autobiogénesis9 y varias respuestas de estrés biótico y abiótico10.

En las plantas, los miARN se procesan inicialmente a partir de transcripciones primarias largas llamadas pri-miARN11. Estos pri-miRNAs generados por la ARN polimerasa II dentro del núcleo son transcripciones largas que forman una estructura imperfecta de pliegue hacia atrás12. Los pri-miRNAs luego se someten a un proceso de escisión para producir precursores endógenos de horquilla monocatenaria (ss) de miRNAs llamados pre-miRNAs11. El pre-miARN forma una estructura similar a una horquilla en la que una sola hebra se pliega en una estructura de doble cadena para extirpar un miARN dúplex (miARN / miARN *)13. La proteína tipo Dicer corta ambas hebras del dúplex miRNA/miRNA*, dejando voladizos de 2-nucleótidos 3′-14,15. El miARN dúplex está metilado dentro del núcleo, lo que protege el extremo 3′ del miARN de la degradación y la actividad de uridilación16,17. Una helicasa desenrolla el miARN dúplex metilado después de la exportación y expone el miARN maduro al complejo de silenciamiento inducido por ARN (RISC) en el citosol18. Una hebra del dúplex es miARN maduro incorporado en RISC, mientras que la otra hebra, miARN*, se degrada. El complejo miRNA-RISC se une a la secuencia diana, lo que conduce a la degradación del ARNm en caso de complementariedad completa o a la represión traslacional en caso de complementariedad parcial13.

Con base en las características de expresión y biogénesis, se han descrito directrices para la anotación de miARN15,19. Con las directrices definidas, Lucas y Budak desarrollaron el pipeline SUmir para realizar una identificación in silico de miRNA basada en homología en plantas9. La canalización de SUmir estaba compuesta por dos scripts: SUmirFind y SUmirFold. SUmirFind realiza búsquedas de similitud contra conjuntos de datos de miARN conocidos a través de la herramienta de búsqueda básica de alineación local (BLAST) del Centro Nacional de Información Biotecnológica (NCBI) con parámetros modificados para incluir aciertos con solo 2 o menos desajustes y para evitar el sesgo hacia golpes más cortos (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold evalúa la estructura secundaria de las supuestas secuencias de miARN a partir de los resultados de BLAST20 utilizando UNAfold21. SUmirFold diferencia los miRNAs de los pequeños RNAs interferentes mediante la identificación de las características de la estructura de horquilla. Además, diferencia los miRNAs de otros ssRNAs como tRNA y rRNA por los parámetros, el índice mínimo de energía de pliegue > 0.67 y el contenido de GC de 24-71%. Esta tubería se ha actualizado recientemente agregando dos pasos adicionales para (i) aumentar la sensibilidad, (ii) aumentar la precisión de la anotación y (iii) proporcionar la distribución genómica de los genes de miARN predichos22. Dada la alta conservación de las secuencias de miARN de plantas23, esta tubería fue diseñada originalmente para la predicción de miARN basada en homología. Sin embargo, los nuevos miARN no pudieron identificarse con precisión con este análisis bioinformático, ya que dependía en gran medida de la conservación de secuencias de miARN entre especies estrechamente relacionadas.

Este documento presenta una nueva y totalmente automatizada tubería de miARN, mirMachine que 1) puede identificar miARN conocidos y nuevos con mayor precisión (por ejemplo, la tubería ahora utiliza predicciones novedosas de miARN basadas en sRNA-seq, así como la identificación de miARN basada en homología) y 2) está totalmente automatizado y disponible gratuitamente. Los resultados también han incluido las distribuciones genómicas de los miRNAs predichos. mirMachine se probó para predicciones basadas en homología y basadas en sRNA-seq en genomas de trigo y Arabidopsis . Aunque inicialmente se lanzó como software libre, UNAfold se convirtió en un software comercial en la última década. Con esta actualización, la herramienta de predicción de estructura secundaria se cambió de UNAfold a RNAfold para que mirMachine pueda estar disponible gratuitamente. Los usuarios ahora pueden ejecutar un script de envío corto para ejecutar la canalización mirMachine totalmente automatizada (se proporcionan ejemplos en https://github.com/hbusra/mirMachine.git).

Protocol

1. Dependencias e instalación de software Instale dependencias de software desde su sitio de inicio o usando conda.Descargue e instale Perl, si aún no está instalado, desde su sitio de inicio (https://www.perl.org/get.html).NOTA: Los resultados representados se predijeron utilizando Perl v5.32.0. Descargue Blast+, un programa de alineación, desde su sitio principal (https://www.ncbi.nlm.nih.gov/books/NBK279671/) como ejecutable y como código fuente.NOTA: Los resultados representa…

Representative Results

La tubería de miARN, mirMachine, descrita anteriormente se aplicó a los datos de prueba para la evaluación rápida del rendimiento de la tubería. Solo los miARN vegetales de alta confianza depositados en miRBasa v22.1 se examinaron contra el cromosoma 5A del genoma RefSeq v224 del trigo IWGSC. mirMachine_find devolvió 312 aciertos para la lista no redundante de 189 miARN de alta confianza con un máximo de 1 desajuste permitido (Tabla 1). mirMachine_fold clasificado 49 de ell…

Discussion

Nuestra línea de miARN, SUmir, se ha utilizado para la identificación de muchos miARN de plantas durante la última década. Aquí, desarrollamos una nueva tubería de identificación y anotación de miARN totalmente automatizada y disponible gratuitamente, mirMachine. Además, varias tuberías de identificación de miARN, incluida, entre otras, la tubería anterior, dependían del software UNAfold21, que se convirtió en un software comercial con el tiempo, aunque una vez estuvo disponible grat…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Play Video

Cite This Article
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video