Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: Um balcão único para anotação de miRNA de planta

Published: May 1, 2021 doi: 10.3791/62430

Summary

Aqui, apresentamos um novo e totalmente automatizado pipeline de miRNA, mirMachine, que 1) pode identificar miRNAs conhecidos e novos com mais precisão e 2) é totalmente automatizado e disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado.

Abstract

De diferentes tipos de RNAs não codificantes, os microRNAs (miRNAs) têm estado indiscutivelmente no centro das atenções na última década. Como reguladores pós-transcricionais da expressão gênica, os miRNAs desempenham papéis-chave em várias vias celulares, incluindo o desenvolvimento e a resposta ao estresse a/biótico, como seca e doenças. Ter sequências genômicas de referência de alta qualidade permitiu a identificação e anotação de miRNAs em várias espécies de plantas, onde as sequências de miRNA são altamente conservadas. Como os processos computacionais de identificação e anotação de miRNA são principalmente processos propensos a erros, as previsões baseadas em homologia aumentam a precisão da previsão. Desenvolvemos e melhoramos o pipeline de anotação de miRNA, SUmir, na última década, que tem sido usado para vários genomas de plantas desde então.

Este estudo apresenta um novo pipeline de miRNA totalmente automatizado, mirMachine (Máquina de miRNA), (i) adicionando uma etapa de filtragem adicional nas previsões da estrutura secundária, (ii) tornando-o totalmente automatizado e (iii) introduzindo novas opções para prever miRNA conhecido com base em homologia ou novos miRNAs baseados em pequenas leituras de sequenciamento de RNA usando o pipeline anterior. O novo pipeline de miRNA, mirMachine, foi testado usando o Arabidopsis Information Resource, TAIR10, liberação do genoma Arabidopsis e o genoma de referência de trigo v2 do International Wheat Genome Sequencing Consortium (IWGSC).

Introduction

Os avanços nas tecnologias de sequenciamento de próxima geração ampliaram a compreensão das estruturas de RNA e dos elementos regulatórios, revelando RNAs não codificantes (ncRNAs) funcionalmente importantes. Dentre os diferentes tipos de ncRNAs, os microRNAs (miRNAs) constituem uma classe reguladora fundamental de pequenos RNAs com comprimento entre 19 e 24 nucleotídeos em plantas 1,2. Desde a descoberta do primeiro miRNA no nematoide Caenorhabditis elegans3, a presença e as funções dos miRNAs têm sido amplamente estudadas em genomas animais e vegetais, bem como4,5,6. Os miRNAs funcionam visando os mRNAs para clivagem ou repressão translacional7. Evidências acumuladas também mostraram que os miRNAs estão envolvidos em uma ampla gama de processos biológicos em plantas, incluindo crescimento e desenvolvimento8, autobiogênese9 e várias respostas bióticas e abióticas ao estresse10.

Em plantas, os miRNAs são inicialmente processados a partir de longos transcritos primários chamados pri-miRNAs11. Esses pri-miRNAs gerados pela RNA polimerase II dentro do núcleo são transcritos longos formando uma estrutura fold-back imperfeita12. Os pri-miRNAs mais tarde passam por um processo de clivagem para produzir precursores endógenos de fita simples (ss) de miRNAs chamados pré-miRNAs11. O pré-miRNA forma uma estrutura semelhante a um grampo de cabelo em que uma fita simples se dobra em uma estrutura de fita dupla para extirpar um duplex de miRNA (miRNA/miRNA*)13. A proteína tipo dícero corta ambas as cadeias do duplex miRNA/miRNA*, deixando 2-nucleotídeos 3'-saliências14,15. O duplex de miRNA é metilado no interior do núcleo, o que protege a extremidade 3' do miRNA da degradação e da atividade de uridilação16,17. Uma helicase desenrola o duplex de miRNA metilado após a exportação e expõe o miRNA maduro ao complexo silenciador induzido por RNA (RISC) no citosol18. Uma fita do duplex é o miRNA maduro incorporado ao RISC, enquanto a outra fita, o miRNA*, é degradada. O complexo miRNA-RISC liga-se à sequência alvo, levando à degradação do mRNA em caso de complementaridade total ou à repressão translacional em caso de complementaridade parcial13.

Com base nas características de expressão e biogênese, diretrizes para anotação de miRNA têm sido descritas15,19. Com as diretrizes definidas, Lucas e Budak desenvolveram o pipeline SUmir para realizar uma identificação de miRNA in silico baseada em homologia em plantas9. O pipeline da SUmir era composto por dois scripts: SUmirFind e SUmirFold. O SUmirFind realiza pesquisas de similaridade em conjuntos de dados de miRNA conhecidos por meio da triagem da ferramenta de pesquisa de alinhamento local básico (BLAST) do National Center for Biotechnology Information (NCBI) com parâmetros modificados para incluir acertos com apenas 2 ou menos incompatibilidades e evitar viés para acertos mais curtos (blastn-short -ungapped -penalty -1 -reward 1). O SUmirFold avalia a estrutura secundária das supostas sequências de miRNA a partir dos resultados do BLAST20 usando o UNAfold21. O SUmirFold diferencia os miRNAs de pequenos RNAs interferentes pela identificação das características da estrutura do hairpin. Além disso, diferencia os miRNAs de outros ssRNAs, como tRNA e rRNA, pelos parâmetros, índice mínimo de energia de dobra > 0,67 e conteúdo de GC de 24-71%. Este pipeline foi recentemente atualizado adicionando duas etapas adicionais para (i) aumentar a sensibilidade, (ii) aumentar a precisão da anotação e (iii) fornecer distribuição genômica dos genes de miRNA previstos22. Dada a alta conservação das sequências de miRNA23 das plantas, este pipeline foi originalmente projetado para a previsão de miRNA baseada em homologia. Novos miRNAs, no entanto, não puderam ser identificados com precisão com esta análise de bioinformática, pois dependiam fortemente da conservação de sequências de miRNAs entre espécies intimamente relacionadas.

Este artigo apresenta um novo e totalmente automatizado pipeline de miRNA, mirMachine que 1) pode identificar miRNAs conhecidos e novos com mais precisão (por exemplo, o pipeline agora usa novas previsões de miRNA baseadas em sRNA-seq, bem como identificação de miRNA baseada em homologia) e 2) é totalmente automatizado e disponível gratuitamente. Os resultados também incluíram as distribuições genômicas dos miRNAs previstos. O mirMachine foi testado para previsões baseadas em homologia e sRNA-seq em genomas de trigo e Arabidopsis . Embora inicialmente lançado como software livre, UNAfold tornou-se um software comercial na última década. Com esta atualização, a ferramenta de previsão de estrutura secundária foi trocada de UNAfold para RNAfold para que o mirMachine possa estar disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado (exemplos são fornecidos em https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Dependências e instalação de software

  1. Instale dependências de software de seu site doméstico ou usando conda.
    1. Baixe e instale o Perl, se ainda não estiver instalado, a partir de seu site inicial (https://www.perl.org/get.html).
      NOTA: Os resultados representados foram preditos usando Perl v5.32.0.
    2. Baixe o Blast+, um programa de alinhamento, de seu site (https://www.ncbi.nlm.nih.gov/books/NBK279671/) como executável e como código-fonte.
      NOTA: Os resultados representados foram preditos utilizando o BLAST 2.6.0+.
    3. Instale o pacote pré-compilado do RNAfold a partir do https://www.tbi.univie.ac.at/RNA/.
    4. Alternativamente, instale esses softwares usando o seguinte conda: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. A configuração e o teste do mirMachine

  1. Baixe a versão mais recente dos scripts mirMachine e do script de envio mirMachine do GitHub, https://github.com/hbusra/mirMachine.git e, em seguida, defina o caminho dos scripts para o PATH.
  2. Use os dados de teste fornecidos no GitHub para garantir que o mirMachine, juntamente com todas as suas dependências, tenha sido baixado corretamente.
  3. Execute o mirMachine nos dados de teste mostrados abaixo.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    NOTA: Defina a opção -n como 10, pois os dados de teste contêm apenas um cromossomo do genoma do trigo. Nos padrões, a opção -n é definida como 20.
  4. Controle os arquivos de saída hairpins.tbl.out.tbl para os miRNAs maduros previstos, seus precursores previstos e suas localizações nos cromossomos.
  5. Verifique os arquivos de log para as saídas e avisos do programa.

3. Identificação de miRNA baseada em homologia

  1. Execute o mirMachine usando o script bash mostrado abaixo:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Verifique os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.tbl.out.tbl para os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.fsa para as sequências FASTA pré-miRNA. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.log para o arquivo de log hairpin.

4. Nova identificação de miRNA

  1. Pré-processe os arquivos FASTQ sRNA-seq no formato FASTA adequado. Corte os adaptadores, se necessário. Não corte leituras de baixa qualidade; em vez disso, remova-os. Remova as leituras que contêm N. Converta o arquivo FASTQ em arquivo FASTA ($input_file).
  2. Execute o mirMachine usando o script bash mostrado abaixo.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    NOTA: $mismatches foi definido como 0 para previsões baseadas em sRNA-seq.
  3. Verifique os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.tbl.out.tbl para os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.fsa para as sequências FASTA pré-miRNA. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.log para o arquivo de log hairpin.

5. Parâmetros de avanço

NOTA: Os padrões são definidos para todos os parâmetros, exceto para o arquivo de genoma e o arquivo de miRNA de entrada.

  1. Defina a opção -db como um banco de dados de explosão para ignorar o banco de dados de referência de construção dentro do pipeline.
  2. Defina a opção -m para o número de incompatibilidades permitidas.
    NOTA: Nos padrões, a opção -m foi definida como 1 para previsões baseadas em homologia e 0 para as previsões baseadas em sRNA-seq.
  3. Defina o -n para o número de acertos a serem eliminados após o alinhamento (padrão para 20). Mude isso com base na espécie.
  4. Use o -long para avaliar as estruturas secundárias da lista de suspeitos.
  5. Use o -s para ativar a nova previsão de miRNA com base em dados de sRNA-seq .
  6. Defina a opção - lmax para o comprimento máximo das leituras de sRNA-seq a serem incluídas na triagem.
  7. Defina a opção - lmax para o comprimento mínimo das leituras de sRNA-seq a serem incluídas na triagem.
  8. Use a opção -rpm para definir o limite de leituras por milhão (RPM).
    NOTA: Para parâmetros avançados, como o comprimento dos pri-miRNAs/pré-miRNAs, os usuários experientes são encorajados a modificar os scripts para suas pesquisas de interesse. Além disso, se os usuários pretendem pular algumas etapas ou preferem usar saídas modificadas, o script de envio pode ser modificado simplesmente adicionando # no início das linhas para pular essas linhas.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

O pipeline de miRNA, mirMachine, descrito acima foi aplicado aos dados de teste para a rápida avaliação do desempenho do pipeline. Apenas os miRNAs vegetais de alta confiança depositados na miRBase v22.1 foram rastreados contra o cromossomo 5A do genoma RefSeq de trigo IWGSC v224. mirMachine_find retornou 312 acertos para a lista não redundante de 189 miRNAs de alta confiança com um máximo de 1 incompatibilidade permitida (Tabela 1). mirMachine_fold classificaram 49 deles como supostos miRNAs, dependendo da avaliação da estrutura secundária. O grupo de miRNAs mais bem representado foi o miR9666, com um total de 18 miRNAs identificados (Figura 1). Alguns miRNAs compartilhavam o mesmo miRNA maduro, mas processados a partir de uma sequência diferente de pré-miRNA. Esses miRNAs foram renomeados pelo nome de família miRNA seguido por um número único, por exemplo, miR156-5p-1 e miR156-5p-2. Entre os 49 supostos miRNAs, 20 sequências de miRNA maduro não redundantes foram identificadas. Alguns miRNAs podem ser transcritos de mais de um locus, resultando em um maior número de miRNAs representados. Nos dados do teste, o miR9666-3p-5 foi representado duas vezes: uma na cadeia do sentido (na 602887137) e outra na vertente antisense (na 542053079). Todos os locais são fornecidos no GitHub sob o arquivo de saída TestData chamado mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

A evidência de expressão em um genoma vegetal é suficiente, dada a conservação de miRNAs em plantas; no entanto, um conjunto de dados de miRNA de alta confiança fornece apenas uma quantidade limitada de dados. Portanto, é preferência do usuário usar os miRNAs de alta confiança e/ou validados experimentalmente como o conjunto de dados de referência e pular a etapa de validação da expressão, ou usar todos os miRNAs de plantas disponíveis como o conjunto de dados de referência e procurar a evidência da expressão posteriormente. Aqui, como os miRNAs de alta confiança foram usados como o conjunto de referência, que havia sido validado experimentalmente em um dos genomas da planta, a etapa de validação da expressão foi ignorada para os dados do teste.

O mirMachine foi aferido usando plantas de monocotiledôneas e dicotiledôneas, incluindo Arabidopsis thaliana (Arabidopsis, liberação TAIR10) e Triticum aestivum (trigo, IWGSC RefSeq v2). O desempenho das predições baseadas em homologia e sRNA-seq foi avaliado, e os resultados foram comparados com o miRDP225, uma ferramenta de predição de miRNA baseada em NGS. As previsões baseadas em homologia foram executadas usando a lista não redundante de sequências de miRNA maduro de plantas depositadas na miRbase v2226. as previsões baseadas em sRNA-seq foram executadas usando os conjuntos de dados disponíveis publicamente; GSM2094927 para Arabidopsis e GSM1294661 para o trigo. Além dos resultados brutos, as previsões baseadas em homologia foram filtradas para a evidência de expressão de sequências estelares maduras de miRNA e miRNA usando os mesmos conjuntos de dados sRNA-seq.

A Figura 2 mostra o desempenho de cada ferramenta e as configurações do mirMachine nas duas espécies. A sensibilidade foi calculada como o número total de miRNAs conhecidos identificados dividido pelo número total de miRNAs identificados. Os resultados mostraram que o mirMachine superou o miRDP2 em termos de sensibilidade e as previsões positivas verdadeiras nos dados da Arabidopsis . Para os dados de trigo, a predição baseada em homologia mirMachine, apoiada por evidências de expressão, forneceu melhor sensibilidade do que o miRDP2. Para ambos os genomas, o miRDP2 previu maior número de verdadeiros positivos em comparação com as previsões baseadas em mirMachine sRNA-seq e homologia com evidências de expressão. Deve-se notar que o miRDP2 reduz o limiar de expressão (RPM, leituras por milhão) de 10 para 1 para a previsão de miRNAs conhecidos, resultando em previsões positivas verdadeiras mais altas. Em geral, o mirMachine pode ser usado para a identificação de miRNAs novos e conhecidos. Uma vantagem do mirMachine é a sua capacidade de prever a distribuição genômica dos supostos miRNAs sem uma limitação de tecidos e condições específicas. Finalmente, o mirMachine é fácil de usar e fornece flexibilidade para ajustar parâmetros como número de acertos, incompatibilidades, comprimento de miRNAs e RPMs para fins de pesquisa específicos. Tomados em conjunto, o mirMachine fornece previsões precisas para os supostos miRNAs nos transcriptomas e nos genomas das plantas.

Figure 1
Figura 1: A distribuição das famílias de miRNA identificadas a partir do cromossomo 5A do genoma de referência do trigo IWGSC v2. Os rótulos de dados mostram a família de miRNA e o número de miRNAs pertencentes a cada família de miRNA. Abreviaturas: miRNA = microRNA; IWGSC = Consórcio Internacional de Sequenciamento do Genoma do Trigo. Por favor, clique aqui para ver uma versão maior desta figura.

Figure 2
Figura 2: Avaliação de desempenho da mirMachine. Comparações da sensibilidade e do número total de miRNAs conhecidos previstos (verdadeiros positivos) são mostradas para o mirMachine com previsões baseadas em homologia e sRNA-seq e o software miRDP2. Abreviação: miRNA = microRNA. Por favor, clique aqui para ver uma versão maior desta figura.

Genoma Tamanho do genoma Conjunto de dados de miRNA de referência mirMachine_find acertos mirMAchine_fold acertos Nº de famílias de miRNA
Dados de teste ~0,7 Gb 189 312 49 9
Chr5A

Tabela 1: Estatísticas do mirMachine. Os dados de teste são do cromossomo 5A do genoma de referência do trigo IWGSC v2. Abreviaturas: miRNA = microRNA; IWGSC = Consórcio Internacional de Sequenciamento do Genoma do Trigo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Nosso pipeline de miRNA, SUmir, tem sido usado para a identificação de muitos miRNAs de plantas na última década. Aqui, desenvolvemos um novo pipeline de identificação e anotação de miRNA totalmente automatizado e disponível gratuitamente, o mirMachine. Além disso, vários pipelines de identificação de miRNA, incluindo, mas não se limitando ao pipeline anterior, dependiam do software UNAfold21, que se tornou um software comercial ao longo do tempo, embora uma vez estivesse disponível gratuitamente. Esta nova e totalmente automatizada mirMachine não depende mais do UNAfold; em vez disso, o RNAfold disponível gratuitamente do pacote ViennaRNA27 é usado para previsão de estrutura secundária. Além disso, todos os scripts para o mirMachine foram reunidos em um script bash com parâmetros ajustáveis para tornar o mirMachine uma ferramenta de previsão e anotação de miRNA totalmente automatizada e disponível gratuitamente.

A mirMachine se beneficiou das características dos miRNAs de plantas e sua biogênese. Ao contrário dos pré-miRNAs animais, os pré-miRNAs vegetais são variáveis em comprimento e características estruturais15. Consequentemente, um critério foi estabelecido para a identificação de miRNAs de plantas, dependendo das características dos miRNAs e sua biogênese15. Nenhum ponto de corte foi definido para o comprimento pré-miRNA, pois o comprimento dos pré-miRNAs da planta pode variar notavelmente e pode ter centenas de nucleotídeos de comprimento. Em vez disso, o dobramento da estrutura do pri-miRNA, que foi limitado a ~ 700 pb de comprimento, foi avaliado pela primeira vez. Posteriormente, a sequência pré-miRNA foi predita a partir das sequências candidatas de pri-miRNA e avaliada quanto a estatísticas de dobramento adequadas.

Muitos genomas de plantas, especialmente cereais de importância agronômica, como trigo e cevada, possuem genomas altamente repetitivos28,29,30. Além do alto teor de repetição, a poliploidia é observada em algumas dessas plantas24, introduzindo complexidades adicionais à identificação in silico e caracterização das estruturas de miRNA. As repetições são uma importante fonte para a produção de siRNAs31, que se assemelham a miRNAs em suas formas maduras; no entanto, diferem em biogênese e função32,33. É extremamente difícil eliminar os siRNAs das listas de miRNA candidatos. De fato, o banco de dados de miRNA mais utilizado, o miRBase26, tem sido relatado como contendo um grande número de siRNAs anotados falsamente como miRNAs34,35. Com base nas diferenças em sua biogênese, o mirMachine filtra os pequenos RNAs que formam um par perfeito com a fita antisense como siRNAs e coloca essas sequências na tabela suspeita. Além disso, o mirMachine tem a opção -n, que define o número máximo de acertos para filtrar os RNAs candidatos como siRNAs.

Evidências de expressão são necessárias para validar todos os miRNAs previstos in silico. Como os miRNAs são altamente conservados entre os genomas das plantas, a evidência de expressão em um dos genomas da planta deve ser suficiente para confirmar a validade do miRNA previsto. O uso de sequências de miRNA maduras de alta confiança no processo de triagem inicial tem a vantagem de fornecer evidências de expressão para todos os miRNAs previstos; no entanto, a pequena lista de dados iniciais de miRNA limita a previsão de um conjunto abrangente de miRNAs em um genoma. Alternativamente, um conjunto completo de miRNAs de plantas depositados no banco de dados miRBase pode ser usado como um conjunto de dados inicial em vez de filtrar por miRNAs de alta confiança. Os usuários são aconselhados a procurar evidências de expressão por meio de tags de sequência expressas, microarrays de miRNA ou pequenos dados de sequenciamento de RNA para pelo menos um dos genomas da planta, se não houver dados de expressão disponíveis para as espécies de interesse.

As previsões de miRNA baseadas em homologia podem ajudar a elucidar a distribuição genômica ampla da família conhecida de miRNAs. É provável que estes miARNs sejam expressos em determinados tecidos e condições. Uma desvantagem das previsões baseadas em homologia é a falta de capacidade de identificar novas famílias de miRNA. Em contraste, as previsões baseadas em sRNA-seq poderiam identificar novos miRNAs com um custo de um alto número de falsos positivos. Portanto, a escolha da melhor abordagem cabe aos usuários e à pesquisa de interesse. O mirMachine apresentado aqui pode ajudar na identificação dos miRNAs com base na homologia de miRNAs conhecidos ou no sequenciamento de sRNA.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biologia Edição 171
mirMachine: Um balcão único para anotação de miRNA de planta
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter