Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine : un guichet unique pour l’annotation des miARN végétaux

Published: May 1, 2021 doi: 10.3791/62430

Summary

Ici, nous présentons un nouveau pipeline de miARN entièrement automatisé, mirMachine qui 1) peut identifier les miARN connus et nouveaux avec plus de précision et 2) est entièrement automatisé et disponible gratuitement. Les utilisateurs peuvent désormais exécuter un court script de soumission pour exécuter le pipeline mirMachine entièrement automatisé.

Abstract

Parmi les différents types d’ARN non codants, les microARN (miARN) ont sans doute été sous les projecteurs au cours de la dernière décennie. En tant que régulateurs post-transcriptionnels de l’expression génique, les miARN jouent un rôle clé dans diverses voies cellulaires, y compris le développement et la réponse au stress a/biotique, comme la sécheresse et les maladies. Le fait de disposer de séquences génomiques de référence de haute qualité a permis l’identification et l’annotation de miARN chez plusieurs espèces végétales, où les séquences de miARN sont hautement conservées. Comme les processus computationnels d’identification et d’annotation des miARN sont principalement des processus sujets aux erreurs, les prédictions basées sur l’homologie augmentent la précision de la prédiction. Nous avons développé et amélioré le pipeline d’annotation de miARN, SUmir, au cours de la dernière décennie, qui a été utilisé pour plusieurs génomes de plantes depuis lors.

Cette étude présente un nouveau pipeline de miARN entièrement automatisé, mirMachine (miRNA Machine), en (i) ajoutant une étape de filtrage supplémentaire sur les prédictions de structure secondaire, (ii) le rendant entièrement automatisé, et (iii) introduisant de nouvelles options pour prédire soit des miARN connus basés sur l’homologie, soit de nouveaux miARN basés sur de petites lectures de séquençage d’ARN utilisant le pipeline précédent. Le nouveau pipeline de miARN, mirMachine, a été testé à l’aide de la ressource d’information Arabidopsis, TAIR10, de la publication du génome d’Arabidopsis et du génome de référence du blé v2 de l’International Wheat Genome Sequencing Consortium (IWGSC).

Introduction

Les progrès des technologies de séquençage de nouvelle génération ont élargi la compréhension des structures d’ARN et des éléments régulateurs, révélant des ARN non codants (ARNnc) importants sur le plan fonctionnel. Parmi les différents types d’ARNnc, les microARN (miARN) constituent une classe régulatrice fondamentale de petits ARN d’une longueur comprise entre 19 et 24 nucléotides chez lesplantes1,2. Depuis la découverte du premier miARN chez le nématode Caenorhabditis elegans3, la présence et les fonctions des miARN ont été largement étudiées dans les génomes animaux et végétaux ainsi que 4,5,6. Les miARN fonctionnent en ciblant les ARNm pour le clivage ou la répression translationnelle7. L’accumulation de preuves a également montré que les miARN sont impliqués dans un large éventail de processus biologiques chez les plantes, y compris la croissance et le développement8, l’auto-biogenèse9 et plusieurs réponses biotiques et abiotiques au stress10.

Chez les plantes, les miARN sont initialement traités à partir de longs transcrits primaires appelés pri-miARN11. Ces pri-miARN générés par l’ARN polymérase II à l’intérieur du noyau sont de longs transcrits formant une structure repliéeimparfaite 12. Les pri-miARN subissent plus tard un processus de clivage pour produire des précurseurs endogènes en épingle à cheveux simple brin (ss) des miARN appelés pré-miARN11. Le pré-miARN forme une structure en forme d’épingle à cheveux dans laquelle un seul brin se replie en une structure double brin pour exciser un miARN duplex (miARN/miARN*)13. La protéine de type dicer coupe les deux brins du duplex miARN/miARN*, laissant 2-nucléotide 3'-surplomb14,15. Le miARN duplex est méthylé à l’intérieur du noyau, ce qui protège l’extrémité 3' du miARN de la dégradation et de l’activité d’uridylation16,17. Une hélicase déroule le miARN méthylé duplex après l’exportation et expose le miARN mature au complexe de silençage induit par l’ARN (RISC) dans le cytosol18. Un brin du duplex est un miARN mature incorporé dans RISC, tandis que l’autre brin, miARN*, est dégradé. Le complexe miARN-RISC se lie à la séquence cible conduisant soit à la dégradation de l’ARNm en cas de complémentarité complète, soit à la répression translationnelle en cas de complémentarité partielle13.

Sur la base des caractéristiques d’expression et de biogenèse, des lignes directrices pour l’annotation des miARN ont été décrites15,19. Avec les lignes directrices définies, Lucas et Budak ont développé le pipeline SUmir pour effectuer une identification in silico miARN basée sur l’homologie dans les plantes9. Le pipeline SUmir était composé de deux scripts : SUmirFind et SUmirFold. SUmirFind effectue des recherches de similarité par rapport à des ensembles de données de miARN connus grâce au criblage de l’outil de recherche d’alignement local de base (BLAST) du National Center for Biotechnology Information (NCBI) avec des paramètres modifiés pour inclure les résultats avec seulement 2 discordances ou moins et pour éviter les biais vers des résultats plus courts (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold évalue la structure secondaire des séquences de miARN putatives à partir des résultats BLAST20 en utilisant UNAfold21. SUmirFold différencie les miARN des petits ARN interférents par l’identification des caractéristiques de la structure en épingle à cheveux. De plus, il différencie les miARN des autres ARNsr tels que l’ARNt et l’ARNr par les paramètres, l’indice d’énergie de pliage minimum > 0,67 et la teneur en GC de 24-71%. Ce pipeline a été récemment mis à jour en ajoutant deux étapes supplémentaires pour (i) augmenter la sensibilité, (ii) augmenter la précision de l’annotation et (iii) fournir la distribution génomique des gènes miARN prédits22. Compte tenu de la conservation élevée des séquences de miARN des plantes23, ce pipeline a été conçu à l’origine pour la prédiction des miARN basée sur l’homologie. Les nouveaux miARN, cependant, n’ont pas pu être identifiés avec précision avec cette analyse bioinformatique, car elle reposait fortement sur la conservation des séquences de miARN entre des espèces étroitement apparentées.

Cet article présente un nouveau pipeline de miARN entièrement automatisé, mirMachine, qui 1) peut identifier plus précisément les miARN connus et nouveaux (par exemple, le pipeline utilise maintenant de nouvelles prédictions de miARN basées sur le séquençage d’ARNS ainsi que l’identification de miARN basée sur l’homologie) et 2) est entièrement automatisé et disponible gratuitement. Les résultats ont également inclus les distributions génomiques des miARN prédits. mirMachine a été testé pour les prédictions basées sur l’homologie et sur le séquençage de l’ARNs dans les génomes du blé et d’Arabidopsis . Bien qu’initialement publié en tant que logiciel libre, UNAfold est devenu un logiciel commercial au cours de la dernière décennie. Avec cette mise à niveau, l’outil de prédiction de structure secondaire est passé de UNAfold à RNAfold afin que mirMachine puisse être disponible gratuitement. Les utilisateurs peuvent désormais exécuter un court script de soumission pour exécuter le pipeline mirMachine entièrement automatisé (des exemples sont fournis à https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Dépendances et installation du logiciel

  1. Installez les dépendances logicielles à partir de leur site d’origine ou à l’aide de conda.
    1. Téléchargez et installez Perl, s’il n’est pas déjà installé, à partir de son site d’accueil (https://www.perl.org/get.html).
      REMARQUE : Les résultats représentés ont été prédits à l’aide de Perl v5.32.0.
    2. Téléchargez Blast+, un programme d’alignement, depuis son site d’accueil (https://www.ncbi.nlm.nih.gov/books/NBK279671/) en tant qu’exécutable et en code source.
      REMARQUE : Les résultats représentés ont été prédits à l’aide de BLAST 2.6.0+.
    3. Installez le paquet précompilé de RNAfold à partir de https://www.tbi.univie.ac.at/RNA/.
    4. Vous pouvez également installer ces logiciels à l’aide de la commande suivante : i) conda install -c bioconda blast; ii) Conda install -c bioconda viennarna.

2. La configuration et les tests de mirMachine

  1. Téléchargez la dernière version des scripts mirMachine et du script de soumission mirMachine à partir de GitHub, https://github.com/hbusra/mirMachine.git, puis définissez le chemin d’accès des scripts dans le PATH.
  2. Utilisez les données de test fournies sur GitHub pour vous assurer que mirMachine et toutes ses dépendances ont été téléchargées correctement.
  3. Exécutez mirMachine sur les données de test indiquées ci-dessous.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    REMARQUE: Définissez l’option -n sur 10 car les données de test ne contiennent qu’un seul chromosome du génome du blé. Par défaut, l’option -n est définie sur 20.
  4. Contrôlez les fichiers de sortie hairpins.tbl.out.tbl pour les miARN matures prédits, leurs précurseurs prédits et leurs emplacements sur les chromosomes.
  5. Vérifiez les fichiers journaux pour les sorties du programme et les avertissements.

3. Identification des miARN basée sur l’homologie

  1. Exécutez mirMachine à l’aide du script bash illustré ci-dessous :
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Vérifiez les miARN prévus. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.tbl.out.tbl pour les miARN prévus. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.fsa pour les séquences FASTA pré-miARN. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.log pour le fichier journal de l’épingle à cheveux.

4. Nouvelle identification des miARN

  1. Prétraitez les fichiers FASTQ sRNA-seq au format FASTA approprié. Coupez les adaptateurs si nécessaire. Ne coupez pas les lectures de mauvaise qualité; Au lieu de cela, supprimez-les. Supprimer les lectures contenant N. Convertissez le fichier FASTQ en fichier FASTA ($input_file).
  2. Exécutez mirMachine à l’aide du script bash illustré ci-dessous.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    REMARQUE: $mismatches a été réglé sur 0 pour les prédictions basées sur le sRNA-seq.
  3. Vérifiez les miARN prévus. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.tbl.out.tbl pour les miARN prévus. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.fsa pour les séquences FASTA pré-miARN. Recherchez le fichier de sortie nommé $input_file.results.tbl.hairpins.log pour le fichier journal de l’épingle à cheveux.

5. Paramètres avancés

Remarque : Les valeurs par défaut sont définies pour tous les paramètres à l’exception du fichier de génome et du fichier miARN d’entrée.

  1. Définissez l’option -db sur une base de données blast pour ignorer la base de données de référence de construction dans le pipeline.
  2. Définissez l’option -m sur le nombre de non-concordances autorisées.
    REMARQUE: Par défaut, l’option - m a été définie sur 1 pour les prédictions basées sur l’homologie et 0 pour les prédictions basées sur le sRNA-seq.
  3. Définissez le -n sur le nombre d’accès à éliminer après l’alignement (20 par défaut). Changez cela en fonction de l’espèce.
  4. Utilisez le -long pour évaluer les structures secondaires de la liste des suspects.
  5. Utilisez le - s pour activer la nouvelle prédiction de miARN basée sur les données de sRNA-seq.
  6. Définissez l’option - lmax sur la longueur maximale des lectures sRNA-seq à inclure dans le dépistage.
  7. Définissez l’option - lmax sur la longueur minimale des lectures sRNA-seq à inclure dans le dépistage.
  8. Utilisez l’option -rpm pour définir le seuil de lectures par million (RPM).
    REMARQUE: Pour les paramètres avancés tels que la longueur des pri-miARN / pré-miARN, les utilisateurs expérimentés sont encouragés à modifier les scripts pour leur recherche d’intérêt. De plus, si les utilisateurs ont l’intention de sauter certaines étapes ou préfèrent utiliser des sorties modifiées, le script de soumission peut être modifié en ajoutant simplement # au début des lignes pour sauter ces lignes.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Le pipeline miARN, mirMachine, décrit ci-dessus a été appliqué aux données de test pour l’évaluation rapide de la performance du pipeline. Seuls les miARN végétaux à haut niveau de confiance déposés à la miRBase v22.1 ont été examinés sur le chromosome 5A du génome RefSeq v224 du blé IWGSC. mirMachine_find a renvoyé 312 occurrences pour la liste non redondante de 189 miARN de confiance élevé avec un maximum de 1 incompatibilité autorisée (tableau 1). mirMachine_fold classé 49 d’entre eux comme miARN putatifs en fonction de l’évaluation de la structure secondaire. Le groupe de miARN le plus représenté était miR9666 avec un total de 18 miARN identifiés (Figure 1). Certains miARN partageaient le même miARN mature, mais traités à partir d’une séquence pré-miARN différente. Ces miARN ont été renommés par le nom de famille miARN suivi d’un numéro unique, par exemple, miR156-5p-1 et miR156-5p-2. Parmi les 49 miARN putatifs, 20 séquences de miARN matures non redondantes ont été identifiées. Certains miARN peuvent être transcrits à partir de plus d’un locus, ce qui entraîne un nombre plus élevé de miARN représentés. Dans les données d’essai, miR9666-3p-5 a été représenté deux fois: l’un sur le brin de sens (au 602887137) et l’autre sur le brin antisens (au 542053079). Tous les emplacements sont fournis dans le GitHub sous le fichier de sortie TestData nommé mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

Les preuves d’expression dans un génome végétal sont suffisantes, compte tenu de la conservation des miARN dans les plantes; cependant, un ensemble de données miARN à haut niveau de confiance ne fournit qu’une quantité limitée de données. Par conséquent, l’utilisateur préfère utiliser les miARN à haut niveau de confiance et/ou validés expérimentalement comme ensemble de données de référence et sauter l’étape de validation de l’expression, ou utiliser tous les miARN végétaux disponibles comme ensemble de données de référence et rechercher la preuve d’expression par la suite. Ici, comme les miARN à haut niveau de confiance ont été utilisés comme ensemble de référence, qui avait été validé expérimentalement dans l’un des génomes des plantes, l’étape de validation de l’expression a été ignorée pour les données de test.

mirMachine a été étalonné à l’aide de plantes monocotylédones et dicotylédones, notamment Arabidopsis thaliana (Arabidopsis, libération de TAIR10) et Triticum aestivum (blé, IWGSC RefSeq v2). La performance des prédictions basées sur l’homologie et sur le sRNA-seq a été évaluée, et les résultats ont été comparés avec le miRDP225, un outil de prédiction de miARN basé sur NGS. Des prédictions basées sur l’homologie ont été exécutées en utilisant la liste non redondante des séquences de miARN matures des plantes déposées à la miRbase v2226. Des prédictions basées sur le séquençage de l’ARNs ont été exécutées à l’aide des ensembles de données accessibles au public; GSM2094927 pour Arabidopsis et GSM1294661 pour le blé. En plus des résultats bruts, les prédictions basées sur l’homologie ont été filtrées pour la preuve d’expression de miARN mature et de séquences d’étoiles miARN en utilisant les mêmes ensembles de données sRNA-seq.

La figure 2 montre les performances de chaque outil et les réglages mirMachine sur les deux espèces. La sensibilité a été calculée comme le nombre total de miARN connus identifiés divisé par le nombre total de miARN identifiés. Les résultats ont montré que mirMachine surpassait miRDP2 en termes de sensibilité et de véritables prédictions positives dans les données d’Arabidopsis . Pour les données sur le blé, la prédiction basée sur l’homologie mirMachine, étayée par des preuves d’expression, a fourni une meilleure sensibilité que miRDP2. Pour les deux génomes, miRDP2 a prédit un nombre plus élevé de vrais positifs par rapport au séquençage de l’ARNsRN mirMachine et aux prédictions basées sur l’homologie avec des preuves d’expression. Il convient de noter que miRDP2 abaisse le seuil d’expression (RPM, lectures par million) de 10 à 1 pour la prédiction des miARN connus, ce qui entraîne des prédictions positives réelles plus élevées. En général, la mirMachine peut être utilisée pour l’identification de miARN nouveaux et connus. L’un des avantages de la mirMachine est sa capacité à prédire la distribution à l’échelle du génome des miARN putatifs sans limitation de tissus et de conditions spécifiques. Enfin, la mirMachine est conviviale et offre la flexibilité nécessaire pour ajuster des paramètres tels que le nombre de résultats, les incompatibilités, la longueur des miARN et les RPM à des fins de recherche spécifiques. Pris ensemble, le mirMachine fournit des prédictions précises pour les miARN putatifs dans les transcriptomes et les génomes des plantes.

Figure 1
Figure 1 : Distribution des familles de miARN identifiées à partir du chromosome 5A du génome de référence du blé v2 de l’IWGSC. Les étiquettes de données montrent la famille de miARN et le nombre de miARN appartenant à chaque famille de miARN. Abréviations : miARN = microARN ; IWGSC = International Wheat Genome Sequencing Consortium. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 2
Figure 2 : Évaluation des performances de la mirMachine. Des comparaisons de la sensibilité et du nombre total de miARN connus prédits (vrais positifs) sont présentées pour la mirMachine avec des prédictions basées sur l’homologie et le séquençage de l’ARNs et le logiciel miRDP2. Abréviation : miARN = microARN. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Génome Taille du génome Ensemble de données de miARN de référence mirMachine_find hits mirMAchine_fold hits # de familles de miARN
Données d’essai ~0,7 Go 189 312 49 9
Chr5A

Tableau 1 : Statistiques de la mirMachine. Les données d’essai proviennent du chromosome 5A du génome de référence v2 du blé de l’IWGSC. Abréviations : miARN = microARN ; IWGSC = International Wheat Genome Sequencing Consortium.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Notre pipeline de miARN, SUmir, a été utilisé pour l’identification de nombreux miARN végétaux au cours de la dernière décennie. Ici, nous avons développé un nouveau pipeline d’identification et d’annotation de miARN entièrement automatisé et disponible gratuitement, mirMachine. En outre, un certain nombre de pipelines d’identification de miARN, y compris, mais sans s’y limiter, le pipeline précédent, dépendaient du logiciel UNAfold21, qui est devenu un logiciel commercial au fil du temps, bien qu’il ait été une fois disponible gratuitement. Cette nouvelle mirMachine entièrement automatisée ne dépend plus de l’UNAfold ; au lieu de cela, le RNAfold disponible gratuitement du paquetViennaRNA 27 est utilisé pour la prédiction de la structure secondaire. De plus, tous les scripts de la mirMachine ont été rassemblés dans un script bash avec des paramètres réglables pour faire de mirMachine un outil de prédiction et d’annotation de miARN entièrement automatisé et disponible gratuitement.

La mirMachine a bénéficié des caractéristiques des miARN végétaux et de leur biogenèse. Contrairement aux pré-miARN animaux, les pré-miARN végétaux ont une longueur et des caractéristiques structurellesvariables 15. En conséquence, un critère a été fixé pour l’identification des miARN végétaux en fonction des caractéristiques des miARN et de leur biogenèse15. Aucune limite n’a été fixée pour la longueur du pré-miARN car la longueur des pré-miARN des plantes peut varier considérablement et pourrait être longue de centaines de nucléotides. Au lieu de cela, le repliement de la structure pri-miARN, qui était limité à ~700 pb de longueur, a d’abord été évalué. Plus tard, la séquence pré-miARN a été prédite à partir des séquences pri-miARN candidates et évaluée pour des statistiques de repliement appropriées.

De nombreux génomes végétaux, en particulier les céréales importantes sur le plan agronomique telles que le blé et l’orge, possèdent des génomes très répétitifs28,29,30. Outre la forte teneur en répétition, la polyploïdie est observée dans certaines de ces plantes24, introduisant des complexités supplémentaires à l’identification in silico et à la caractérisation des structures des miARN. Les répétitions sont une source majeure pour la production de siRNAs31, qui ressemblent aux miARN dans leurs formes matures; Cependant, ils diffèrent par leur biogenèse et leur fonction32,33. Il est extrêmement difficile d’éliminer les siARN des listes de miARN candidats. En fait, la base de données de miARN la plus utilisée, la miRBase26, contient un grand nombre de siRNA annotés faussement comme miARN34,35. Sur la base des différences dans leur biogenèse, la mirMachine filtre les petits ARN qui forment une paire parfaite avec le brin antisens en tant que siRNA et place ces séquences dans la table suspecte. De plus, la mirMachine a l’option -n, qui définit le nombre maximum de hits pour filtrer les ARN candidats en siRNA.

Des preuves d’expression sont nécessaires pour valider tous les miARN prédits in silico. Comme les miARN sont hautement conservés parmi les génomes des plantes, les preuves d’expression dans l’un des génomes des plantes devraient être suffisantes pour confirmer la validité des miARN prédits. L’utilisation de séquences de miARN matures à haut niveau de confiance dans le processus de criblage initial présente l’avantage de fournir des preuves d’expression pour tous les miARN prédits; cependant, la courte liste de l’ensemble de données miARN initial limite la prédiction d’un ensemble complet de miARN dans un génome. Alternativement, un ensemble complet de miARN végétaux déposés dans la base de données miRBase peut être utilisé comme ensemble de données initial au lieu de filtrer les miARN à haut niveau de confiance. Il est conseillé aux utilisateurs de rechercher des preuves d’expression au moyen d’étiquettes de séquence exprimées, de puces à miARN ou de petites données de séquençage d’ARN pour au moins un des génomes des plantes si des données d’expression ne sont pas disponibles pour l’espèce d’intérêt.

Les prédictions de miARN basées sur l’homologie peuvent aider à élucider la distribution à l’échelle du génome de la famille connue de miARN. Ces miARN sont susceptibles d’être exprimés dans certains tissus et conditions. Un inconvénient des prédictions basées sur l’homologie est le manque de capacité à identifier de nouvelles familles de miARN. En revanche, les prédictions basées sur le séquençage de l’ARNs pourraient identifier de nouveaux miARN avec un coût élevé d’un nombre élevé de faux positifs. Par conséquent, le choix de la meilleure approche appartient aux utilisateurs et à la recherche d’intérêt. La mirMachine présentée ici peut aider à identifier les miARN en fonction de l’homologie avec les miARN connus ou du séquençage des ARNs.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biologie numéro 171
mirMachine : un guichet unique pour l’annotation des miARN végétaux
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter