Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: Универсальный магазин для аннотации miRNA растений

Published: May 1, 2021 doi: 10.3791/62430

Summary

Здесь мы представляем новый и полностью автоматизированный конвейер miRNA, mirMachine, который 1) может более точно идентифицировать известные и новые miRNAs и 2) полностью автоматизирован и находится в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine.

Abstract

Из различных типов некодирующих РНК микроРНК (миРНК), возможно, были в центре внимания в течение последнего десятилетия. Как посттранскрипционные регуляторы экспрессии генов, миРНК играют ключевую роль в различных клеточных путях, включая как развитие, так и реакцию на а/биотический стресс, такой как засуха и болезни. Наличие высококачественных эталонных последовательностей генома позволило идентифицировать и аннотировать миРНК у нескольких видов растений, где последовательности миРНК сильно сохраняются. Поскольку вычислительная идентификация миРНК и процессы аннотации в основном подвержены ошибкам, прогнозы на основе гомологии повышают точность прогнозирования. За последнее десятилетие мы разработали и улучшили конвейер аннотаций miRNA, SUmir, который с тех пор использовался для нескольких геномов растений.

В этом исследовании представлен полностью автоматизированный новый конвейер миРНК, mirMachine (miRNA Machine), путем (i) добавления дополнительного этапа фильтрации для предсказаний вторичной структуры, (ii) обеспечения его полной автоматизации и (iii) введения новых вариантов прогнозирования либо известной миРНК на основе гомологии, либо новых миРНК на основе чтения секвенирования малых РНК с использованием предыдущего конвейера. Новый трубопровод miRNA, mirMachine, был протестирован с использованием информационного ресурса Arabidopsis, TAIR10, выпуска генома Arabidopsis и Эталонного генома пшеницы Международного консорциума по секвенированию генома пшеницы (IWGSC) v2.

Introduction

Достижения в технологиях секвенирования следующего поколения расширили понимание структур РНК и регуляторных элементов, выявив функционально важные некодирующие РНК (ncRNAs). Среди различных типов нРНК микроРНК (миРНК) составляют фундаментальный регуляторный класс малых РНК длиной от 19 до 24 нуклеотидов в растениях 1,2. С момента открытия первой миРНК у нематоды Caenorhabditis elegans3 наличие и функции миРНК были широко изучены в геномах животных и растений, а также 4,5,6. миРНК функционируют, нацеливаясь на мРНК для расщепления или трансляционного подавления7. Накопленные данные также показали, что миРНК участвуют в широком спектре биологических процессов у растений, включая рост и развитие8, самобиогенез9 и несколько биотических и абиотических стрессовых реакций10.

В растениях миРНК первоначально обрабатываются из длинных первичных транскриптов, называемых примиРНК11. Эти примиРНК, генерируемые РНК-полимеразой II внутри ядра, представляют собой длинные транскрипты, образующие несовершенную складчатую структуру12. При-миРНК позже подвергаются процессу расщепления с целью получения эндогенных одноцепочечных (ss) шпильк-предшественников миРНК, называемых премиРНК11. ПремиРНК образует шпилькообразную структуру, в которой одна прядь складывается в двухцепочечную структуру для иссечения дуплекса миРНК (миРНК/миРНК*)13. Дицероподобный белок разрезает обе нити дуплекса миРНК/миРНК*, оставляя 2-нуклеотидные 3'-навесы14,15. Дуплекс миРНК метилируется внутри ядра, что защищает 3'-конец миРНК от деградации и активности уридилирования16,17. Геликаза раскручивает дуплекс метилированной миРНК после экспорта и подвергает зрелую миРНК воздействию РНК-индуцированного комплекса глушения (RISC) в цитозоле18. Одна нить дуплекса представляет собой зрелую миРНК, включенную в RISC, тогда как другая цепь, miRNA*, деградирует. Комплекс miRNA-RISC связывается с целевой последовательностью, что приводит либо к деградации мРНК в случае полной комплементарности, либо к трансляционному подавлению в случае частичной комплементарности13.

Основываясь на особенностях экспрессии и биогенеза, были описаны рекомендации по аннотации миРНК15,19. С определенными руководящими принципами Лукас и Будак разработали конвейер SUmir для выполнения идентификации гомологии in silico miRNA в растениях9. Конвейер SUmir состоял из двух сценариев: SUmirFind и SUmirFold. SUmirFind выполняет поиск по сходству с известными наборами данных miRNA с помощью базового инструмента поиска локального выравнивания (BLAST) Национального центра биотехнологической информации (NCBI) с измененными параметрами, чтобы включить попадания только с 2 или менее несоответствиями и избежать смещения в сторону более коротких попаданий (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold оценивает вторичную структуру предполагаемых последовательностей миРНК из результатов BLAST20 с использованием UNAfold21. SUmirFold дифференцирует микроРНК от малых интерферирующих РНК путем идентификации характеристик структуры шпильки. Более того, он дифференцирует миРНК от других ssRNAs, таких как тРНК и рРНК, по параметрам, минимальному энергетическому индексу складки > 0,67 и содержанию ГК 24-71%. Этот конвейер был недавно обновлен путем добавления двух дополнительных шагов для (i) повышения чувствительности, (ii) повышения точности аннотаций и (iii) обеспечения геномного распределения прогнозируемых генов miRNA22. Учитывая высокую сохранность последовательностей миРНК растений23, этот конвейер был первоначально разработан для прогнозирования миРНК на основе гомологии. Новые микроРНК, однако, не могут быть точно идентифицированы с помощью этого биоинформатического анализа, поскольку он в значительной степени зависит от сохранения последовательности микроРНК между близкородственными видами.

В этой статье представлен новый и полностью автоматизированный конвейер миРНК, mirMachine, который 1) может более точно идентифицировать известные и новые миРНК (например, конвейер теперь использует новые прогнозы миРНК на основе sRNA-seq, а также идентификацию miRNA на основе гомологии) и 2) полностью автоматизирован и находится в свободном доступе. Результаты также включали геномные распределения прогнозируемых миРНК. mirMachine был протестирован как на основе гомологии, так и на основе sRNA-seq предсказаний в геномах пшеницы и арабидопсиса . Хотя первоначально UNAfold был выпущен как свободное программное обеспечение, в последнее десятилетие он стал коммерческим программным обеспечением. С этим обновлением инструмент прогнозирования вторичной структуры был переключен с UNAfold на RNAfold, так что mirMachine может быть в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine (примеры приведены в https://github.com/hbusra/mirMachine.git).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Программные зависимости и установка

  1. Установите программные зависимости со своего домашнего сайта или с помощью conda.
    1. Загрузите и установите Perl, если он еще не установлен, с его домашнего сайта (https://www.perl.org/get.html).
      ПРИМЕЧАНИЕ: Представленные результаты были предсказаны с использованием Perl v5.32.0.
    2. Загрузите Blast+, программу выравнивания, со своего домашнего сайта (https://www.ncbi.nlm.nih.gov/books/NBK279671/) в качестве исполняемого файла и исходного кода.
      ПРИМЕЧАНИЕ: Представленные результаты были предсказаны с использованием BLAST 2.6.0+.
    3. Установите предварительно скомпилированный пакет RNAfold из https://www.tbi.univie.ac.at/RNA/.
    4. В качестве альтернативы, установите эти программы, используя следующую conda: i) conda install -c bioconda blast; ii) conda install -c биоконда viennarna.

2. Настройка и тестирование mirMachine

  1. Загрузите последнюю версию скриптов mirMachine и сценария отправки mirMachine с GitHub, https://github.com/hbusra/mirMachine.git, а затем задайте путь к скриптам в PATH.
  2. Используйте тестовые данные, предоставленные на GitHub, чтобы убедиться, что mirMachine вместе со всеми его зависимостями были загружены правильно.
  3. Запустите mirMachine на тестовых данных, показанных ниже.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    ПРИМЕЧАНИЕ: Установите для параметра -n значение 10, так как данные теста содержат только одну хромосому генома пшеницы. По умолчанию параметр -n имеет значение 20.
  4. Контролируйте выходные файлы hairpins.tbl.out.tbl для прогнозируемых зрелых микроРНК, их прогнозируемых предшественников и их расположения на хромосомах.
  5. Проверьте файлы журнала на наличие выходных данных и предупреждений программы.

3. Идентификация миРНК на основе гомологии

  1. Запустите mirMachine с помощью bash-скрипта, показанного ниже:
    bash mirMachine_submit.sh -f $genome_файл -i $input_файл -m $mismatches -n $number_хитов
  2. Проверьте прогнозируемые микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.tbl.out.tbl для прогнозируемых микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.fsa для последовательностей ПРЕМИРНК FASTA. Найдите выходной файл с именем $input_file.results.tbl.hairpins.log для файла журнала шпилек.

4. Новая идентификация миРНК

  1. Препроцессируйте файлы sRNA-seq FASTQ в соответствующий формат FASTA. При необходимости обрежьте адаптеры. Не обрезайте некачественные показания; вместо этого удалите их. Удалите чтение, содержащее N. Конвертируйте файл FASTQ в файл FASTA ($input_файл).
  2. Запустите mirMachine с помощью bash-скрипта, показанного ниже.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    ПРИМЕЧАНИЕ: $mismatches было установлено значение 0 для прогнозов на основе sRNA-seq.
  3. Проверьте прогнозируемые микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.tbl.out.tbl для прогнозируемых miRNAs. Найдите выходной файл с именем $input_file.results.tbl.hairpins.fsa для последовательностей FASTA пре-miRNA. Найдите выходной файл с именем $input_file.results.tbl.hairpins.log для файла журнала шпилек.

5. Предварительные параметры

ПРИМЕЧАНИЕ: Значения по умолчанию определены для всех параметров, за исключением файла генома и входного файла miRNA.

  1. Установите для параметра -db значение базы данных blast, чтобы пропустить базу данных ссылок на построение в конвейере.
  2. Установите для параметра -m допустимое количество несоответствий.
    ПРИМЕЧАНИЕ: По умолчанию параметр -m был установлен равным 1 для предсказаний на основе гомологий и 0 для предсказаний на основе sRNA-seq.
  3. Установите для параметра -n количество обращений, которое необходимо устранить после выравнивания (по умолчанию равно 20). Измените это в зависимости от вида.
  4. Используйте -long для оценки вторичных структур для списка подозреваемых.
  5. Используйте -s для активации нового предсказания miRNA на основе данных sRNA-seq.
  6. Установите параметр -lmax на максимальную длину считывания sRNA-seq для включения в скрининг.
  7. Установите параметр -lmax на минимальную длину считывания sRNA-seq для включения в скрининг.
  8. Параметр -rpm используется для установки порогового значения чтения на миллион (RPM).
    ПРИМЕЧАНИЕ: Для расширенных параметров, таких как длина pri-miRNAs /pre-miRNAs, опытным пользователям рекомендуется изменять скрипты для интересующих их исследований. Кроме того, если пользователи намерены пропустить некоторые шаги или предпочитают использовать измененные выходные данные, сценарий отправки можно изменить, просто добавив # в начале строк, чтобы пропустить эти строки.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Трубопровод miRNA, mirMachine, описанный выше, был применен к тестовым данным для быстрой оценки производительности конвейера. Только высоконадежные растительные миРНК, депонированные в miRBase v22.1, были проверены на хромосому 5A генома IWGSC пшеницы RefSeq v224. mirMachine_find вернул 312 попаданий в список неизбыточных веществ из 189 микроРНК с высокой степенью достоверности с максимально допустимым несоответствием 1 (таблица 1). mirMachine_fold классифицировал 49 из них как предполагаемые микроРНК в зависимости от оценки вторичной структуры. Самой высокой представленной группой миРНК была miR9666 с идентифицированными в общей сложности 18 миРНК (рисунок 1). Некоторые миРНК имеют одну и ту же зрелую миРНК, но обработаны из другой последовательности премиРНК. Эти миРНК были переименованы по фамилии миРНК, за которой последовал уникальный номер, например, miR156-5p-1 и miR156-5p-2. Среди 49 предполагаемых миРНК было идентифицировано 20 неизбыточных зрелых последовательностей миРНК. Некоторые микроРНК могут быть транскрибированы из более чем одного локуса, что приводит к большему количеству представленных микроРНК. В тестовых данных miR9666-3p-5 был представлен дважды: один на чувственной нити (при 602887137), а другой на антисмысловой нити (при 542053079). Все расположения предоставляются на GitHub в выходном файле TestData с именем mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

Доказательств экспрессии в одном геноме растения достаточно, учитывая сохранение миРНК в растениях; однако набор данных miRNA с высокой степенью достоверности предоставляет только ограниченный объем данных. Поэтому пользователь предпочитает использовать высоконадежные и/или экспериментально проверенные миРНК в качестве эталонного набора данных и пропустить этап проверки выражений или использовать все доступные миРНК растений в качестве эталонного набора данных и впоследствии искать доказательства выражений. Здесь, поскольку в качестве эталонного набора использовались миРНК с высокой степенью достоверности, которые были экспериментально проверены в одном из геномов растений, этап проверки экспрессии был пропущен для тестовых данных.

mirMachine был протестирован с использованием монокотных и двудольных растений, включая Arabidopsis thaliana (Arabidopsis, выпуск TAIR10) и Triticum aestivum (пшеница, IWGSC RefSeq v2). Была оценена производительность предсказаний на основе гомологий и sRNA-seq, и результаты сравнивались с miRDP225, инструментом прогнозирования miRNA на основе NGS. Прогнозы на основе гомологии были выполнены с использованием неизбыточного списка зрелых последовательностей миРНК растений, депонированных в базе miRbase v2226. прогнозы на основе sRNA-seq выполнялись с использованием общедоступных наборов данных; GSM2094927 для арабидопсиса и GSM1294661 для пшеницы. В дополнение к необработанным результатам, предсказания, основанные на гомологии, были отфильтрованы для получения доказательств экспрессии зрелых последовательностей звезд миРНК и миРНК с использованием одних и тех же наборов данных sRNA-seq.

На рисунке 2 показана производительность каждого инструмента и настройки mirMachine для двух видов. Чувствительность рассчитывалась как общее количество идентифицированных известных миРНК, деленное на общее число идентифицированных миРНК. Результаты показали, что mirMachine превзошел miRDP2 с точки зрения чувствительности и истинных положительных прогнозов в данных Arabidopsis . Для данных о пшенице предсказание на основе гомологии mirMachine, подкрепленное доказательствами экспрессии, обеспечило лучшую чувствительность, чем miRDP2. Для обоих геномов miRDP2 предсказал большее количество истинных положительных результатов по сравнению с mirMachine sRNA-seq и предсказаниями на основе гомологии с доказательствами экспрессии. Следует отметить, что miRDP2 снижает порог выражения (RPM, считывает на миллион) с 10 до 1 для прогнозирования известных miRNAs, что приводит к более высоким истинным положительным предсказаниям. В целом, mirMachine может быть использован для идентификации как новых, так и известных микроРНК. Одним из преимуществ mirMachine является его способность предсказывать распространение предполагаемых микроРНК по всему геному без ограничения конкретных тканей и условий. Наконец, mirMachine удобен для пользователя и обеспечивает гибкость для настройки таких параметров, как количество попаданий, несоответствий, длина микроРНК и RPM для конкретных исследовательских целей. Взятые вместе, mirMachine предоставляет точные прогнозы для предполагаемых миРНК в транскриптомах и геномах растений.

Figure 1
Рисунок 1: Распределение семейств миРНК, идентифицированных из хромосомы 5А эталонного генома пшеницы IWGSC v2. Метки данных показывают семейство миРНК и количество миРНК, принадлежащих к каждому семейству миРНК. Сокращения: miRNA = микроРНК; IWGSC = Международный консорциум по секвенированию генома пшеницы. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Оценка производительности машины mirMachine. Сравнение чувствительности и общего количества предсказанных известных микроРНК (истинных положительных) показано для mirMachine с предсказаниями на основе гомологии и sRNA-seq и программным обеспечением miRDP2. Аббревиатура: miRNA = микроРНК. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Геном Размер генома Справочный набор данных miRNA mirMachine_find хиты mirMAchine_fold хиты количество семейств миРНК
Тестовые данные ~0,7 Гб 189 312 49 9
Хр5А

Таблица 1: Статистика mirMachine. Данные теста взяты из хромосомы 5A эталонного генома пшеницы IWGSC v2. Сокращения: miRNA = микроРНК; IWGSC = Международный консорциум по секвенированию генома пшеницы.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Наш конвейер миРНК, SUmir, использовался для идентификации многих растительных миРНК в течение последнего десятилетия. Здесь мы разработали новый, полностью автоматизированный и свободно доступный конвейер идентификации и аннотации miRNA, mirMachine. Кроме того, ряд конвейеров идентификации miRNA, включая, но не ограничиваясь предыдущим конвейером, зависели от программного обеспечения UNAfold21, которое со временем стало коммерческим программным обеспечением, хотя когда-то было свободно доступным. Эта новая и полностью автоматизированная машина mirMachin больше не зависит от UNAfold; вместо этого свободно доступный RNAfold из пакета27 ViennaRNA используется для прогнозирования вторичной структуры. Кроме того, все скрипты для mirMachine были собраны в bash-скрипт с настраиваемыми параметрами, чтобы сделать mirMachine полностью автоматизированным и свободно доступным инструментом прогнозирования и аннотации miRNA.

MirMachine извлекла выгоду из характеристик растительных микроРНК и их биогенеза. В отличие от премимиРНК животных, премирнковые препараты растений различаются по длине и структурным особенностям15. Следовательно, был установлен критерий идентификации миРНК растений в зависимости от характеристик миРНК и их биогенеза15. Для длины премиРНК не было установлено никакого отсечения, поскольку длина растительных премирнкальных РНК может значительно варьироваться и может составлять сотни нуклеотидов. Вместо этого сначала оценивалось сворачивание структуры примиРНК, которое было ограничено ~ 700 bp в длину. Позже последовательность премиРНК была предсказана из последовательностей при-миРНК-кандидата и оценена для правильной статистики сворачивания.

Многие геномы растений, особенно агрономически важные зерновые, такие как пшеница и ячмень, обладают очень повторяющимися геномами 28,29,30. Помимо высокого содержания повторов, полиплоидия наблюдается у некоторых из этих растений24, что вносит дополнительные сложности в идентификацию in silico и характеристику структур miRNA. Повторы являются основным источником продукции siRNAs31, которые напоминают miRNAs в их зрелых формах; однако они различаются по биогенезу и функции32,33. Чрезвычайно трудно исключить siRNAs из списков кандидатов miRNA. Фактически, наиболее широко используемая база данных miRNA, miRBase26, как сообщается, содержит большое количество siRNAs, аннотированных ложно как miRNAs 34,35. Основываясь на различиях в их биогенезе, mirMachine фильтрует небольшие РНК, которые образуют идеальную пару с антисмысловой нитью, как siRNAs и помещает эти последовательности в подозрительную таблицу. Кроме того, mirMachine имеет опцию -n, которая определяет максимальное количество обращений для фильтрации РНК-кандидатов как siRNAs.

Доказательства экспрессии необходимы для проверки всех микроРНК, предсказанных in silico. Поскольку миРНК высоко сохраняются среди геномов растений, доказательств экспрессии в одном из геномов растений должно быть достаточно для подтверждения достоверности предсказанной миРНК. Использование высоконадежных, зрелых последовательностей миРНК в начальном процессе скрининга имеет то преимущество, что обеспечивает доказательства экспрессии для всех прогнозируемых миРНК; однако краткий список исходного набора данных миРНК ограничивает прогнозирование всеобъемлющего набора миРНК в геноме. В качестве альтернативы, полный набор растительных микроРНК, депонированных в базе данных miRBase, может использоваться в качестве начального набора данных вместо фильтрации для высоконадежных микроРНК. Пользователям рекомендуется искать доказательства экспрессии с помощью выраженных меток последовательностей, микрочипов миРНК или небольших данных секвенирования РНК по крайней мере для одного из геномов растений, если какие-либо данные экспрессии недоступны для интересующих видов.

Гомологические прогнозы миРНК могут помочь прояснить распространение известного семейства миРНК в масштабах всего генома. Эти микроРНК, вероятно, экспрессируются в определенных тканях и состояниях. Недостатком предсказаний, основанных на гомологии, является отсутствие способности идентифицировать новые семейства миРНК. Напротив, прогнозы на основе sRNA-seq могут идентифицировать новые микроРНК со стоимостью большого количества ложных срабатываний. Поэтому выбор наилучшего подхода зависит от пользователей и исследования, представляющих интерес. Представленная здесь машина mirMachine может помочь идентифицировать миРНК на основе либо гомологии известных миРНК, либо секвенирования сРНК.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Биология выпуск 171
mirMachine: Универсальный магазин для аннотации miRNA растений
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter