Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

In Silico Идентификация и характеристика цирковых РНК во время взаимодействий хозяина и патогена

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Представленный здесь протокол объясняет полный конвейер in silico , необходимый для прогнозирования и функциональной характеристики цирковых РНК на основе данных транскриптома секвенирования РНК, изучающих взаимодействия хозяина и патогена.

Abstract

Кольцевые РНК (цирковые РНК) представляют собой класс некодирующих РНК, которые образуются путем обратного сплайсинга. Эти циркулярные РНК преимущественно изучаются на предмет их роли в качестве регуляторов различных биологических процессов. Примечательно, что новые данные демонстрируют, что цирковые РНК хозяина могут дифференциально экспрессироваться (ДЭ) при инфицировании патогенами (например, гриппом и коронавирусами), что свидетельствует о роли циркРНК в регуляции врожденных иммунных реакций хозяина. Однако исследования роли цирковых РНК во время патогенных инфекций ограничены знаниями и навыками, необходимыми для проведения необходимого биоинформатического анализа для идентификации цирковых РНК DE по данным секвенирования РНК (RNA-seq). Биоинформационное прогнозирование и идентификация циркулярных РНК имеет решающее значение перед любой проверкой и функциональными исследованиями с использованием дорогостоящих и трудоемких методов мокрой лаборатории. Для решения этой проблемы в данной рукописи приведен пошаговый протокол in silico предсказания и характеристики цирковых РНК с использованием данных RNA-seq. Протокол можно разделить на четыре этапа: 1) Прогнозирование и количественное определение циркулярных РНК DE с помощью конвейера CIRIquant; 2) Аннотация через circBase и характеристика цирковых РНК DE; 3) Прогнозирование взаимодействия CircRNA-miRNA через конвейер Circr; 4) анализ функционального обогащения родительских генов циркРНК с использованием Gene Ontology (GO) и Kyoto Encyclopedia of Genes and Genomes (KEGG). Этот конвейер будет полезен для проведения будущих исследований in vitro и in vivo для дальнейшего раскрытия роли цирковых РНК во взаимодействиях хозяина и патогена.

Introduction

Взаимодействия хозяина и патогена представляют собой сложное взаимодействие между патогенами и организмами-хозяевами, которое запускает врожденные иммунные реакции хозяев, которые в конечном итоге приводят к удалению вторгшихся патогенов 1,2. Во время патогенных инфекций регулируется множество иммунных генов хозяина, чтобы ингибировать репликацию и высвобождение патогенов. Например, общие интерферон-стимулированные гены (ISG), регулируемые патогенными инфекциями, включают ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I и OASL 3,4. Помимо генов, кодирующих белок, исследования также показали, что некодирующие РНК, такие как длинные некодирующие РНК (днРНК), микроРНК (миРНК) и кольцевые РНК (циркРНК), также играют роль и регулируются одновременно во время патогенных инфекций 5,6,7. В отличие от генов, кодирующих белки, которые в основном кодируют белки как функциональные молекулы, известно, что некодирующие РНК (нРНК) функционируют как регуляторы генов на транскрипционном и посттранскрипционном уровнях. Однако исследования, включающие участие некодирующих РНК, особенно цирковых РНК, в регуляции иммунных генов хозяев, не очень хорошо представлены по сравнению с генами, кодирующими белок.

Цирковые РНК широко характеризуются своей ковалентно замкнутой непрерывной петлевой структурой, которая генерируется с помощью неканонического процесса сплайсинга, называемого обратным сплайсингом8. Процесс обратного сплайсинга, в отличие от процесса сплайсинга родственных линейных РНК, включает лигирование нижестоящего донорного сайта с вышестоящим акцепторным сайтом, образуя структуру круглой формы. В настоящее время предложены три различных механизма обратного сплайсинга для биогенеза циркРНК. Это опосредованная РНК связывающим белком (RBP)циркуляция 9,10, циркуляция, управляемая спариванием интронов, 11 и циркуляция, управляемая лариатом12,13,14. Учитывая, что цирковые РНК соединены встык в кольцевую структуру, они, как правило, естественным образом устойчивы к нормальному расщеплению экзонуклеазы и, таким образом, считаются более стабильными, чем их линейные аналоги15. Другая общая характеристика, проявляемая циркРНК, включает специфическую для клеток или тканей экспрессию у хозяев16.

Как следует из их уникальной структуры и клеточной или тканеспецифической экспрессии, было обнаружено, что циркРНК играют важные биологические функции в клетках. На сегодняшний день одной из основных функций цирковых РНК является их роль в качестве губок микроРНК (миРНК)17,18. Эта регуляторная роль цирковых РНК происходит за счет комплементарного связывания нуклеотидов циркРНК с затравочной областью микроРНК. Такое взаимодействие circRNA-miRNA ингибирует нормальные регуляторные функции микроРНК на мРНК-мишенях, тем самым регулируя экспрессию генов 19,20. Кроме того, известно также, что цирковые РНК регулируют экспрессию генов, взаимодействуя с РНК-связывающими белками (RBP) и образуя РНК-белковые комплексы21. Хотя цирковые РНК классифицируются как некодирующие РНК, есть также доказательства того, что цирковые РНК могут выступать в качестве шаблонов для трансляции белка22,23,24.

Недавно было продемонстрировано, что цирковые РНК играют ключевую роль в регулировании взаимодействий хозяина и патогена, особенно между хозяевами и вирусами. Как правило, предполагается, что циркРНК хозяина помогают регулировать иммунные реакции хозяина для устранения вторгшихся патогенов. Примером циркулярной РНК, способствующей иммунному ответу хозяина, является circRNA_0082633, о чем сообщают Guo et al.25. Эта циркулярная РНК усиливает передачу сигналов интерферона I типа (ИФН) в клетках A549, что помогает подавить репликацию вируса гриппа25. Кроме того, Qu et al. также сообщили об интронной циркулярной РНК человека, называемой циркулярной РНК AIVR, которая способствует иммунитету, регулируя экспрессию CREB-связывающего белка (CREBBP), сигнального преобразователя ИФН-β26,27. Тем не менее, циркулярные РНК, которые, как известно, способствуют патогенезу заболевания при заражении, также существуют. Например, Yu et al. недавно сообщили о роли, которую играет циркулярная РНК, сплайсированная из домена цинкового пальца GATA, содержащего ген 2A (circGATAD2A), в стимулировании репликации вируса H1N1 посредством ингибирования аутофагии клетки-хозяина28.

Для эффективного изучения цирковых РНК обычно реализуется полногеномный алгоритм прогнозирования циркулярных РНК с последующей характеристикой in silico предсказанных кандидатов на циркРНК до того, как можно будет провести какие-либо функциональные исследования. Такой биоинформатический подход к прогнозированию и характеристике цирковых РНК является менее дорогостоящим и более эффективным по времени. Это помогает уточнить количество кандидатов, подлежащих функциональному изучению, и потенциально может привести к новым выводам. Здесь мы предоставляем подробный биоинформатический протокол для идентификации, характеристики и функциональной аннотации circRNA in silico во время взаимодействия хозяина и патогена. Протокол включает идентификацию и количественное определение цирковых РНК из наборов данных секвенирования РНК, аннотацию через circBase и характеристику кандидатов на цирковые РНК с точки зрения типов цирковых РНК, количества перекрывающихся генов и прогнозируемых взаимодействий циркРНК-миРНК. Это исследование также обеспечивает функциональную аннотацию родительских генов циркРНК с помощью онтологии генов (GO) и анализа обогащения Киотской энциклопедии генов и геномов (KEGG).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

В этом протоколе из базы данных Gene Expression Omnibus (GEO) были загружены и использованы деидентифицированные наборы данных библиотеки РНК-секвенирования РНК (рРНК), подготовленные из инфицированных вирусом гриппа А клеток макрофагов человека. Весь конвейер биоинформатики от прогнозирования до функциональной характеристики циркулярных РНК кратко представлен на рисунке 1. Каждая часть конвейера более подробно описана в разделах ниже.

1. Подготовка, загрузка и настройка перед анализом данных

ПРИМЕЧАНИЕ: Все программные пакеты, используемые в этом исследовании, являются бесплатными и с открытым исходным кодом.

  1. Загрузка необходимых инструментов на платформе Linux
    1. Загрузите и установите необходимое программное обеспечение и инструменты, перечисленные в таблице материалов , на высокопроизводительный компьютер Linux, следуя инструкциям, предоставленным разработчиком.
      ПРИМЕЧАНИЕ: Большинство инструментов и программного обеспечения имеют свои собственные онлайн-страницы GitHub или документацию, содержащую инструкции по установке и использованию их инструментов (см. Таблицу материалов).
    2. Загрузите нужные наборы данных RNA-seq для обнаружения и анализа circRNA с веб-сайтов архива последовательностей (например, European Nucleotides Archive и Gene Expression Omnibus).
    3. Загрузите эталонный геном (геномы) (формат FASTA) и файлы аннотаций (формат GTF/GFF3), совместимые с хостом, из которого был подготовлен набор данных RNA-seq. Файлы эталонных геномов и аннотаций хостов обычно можно найти в онлайн-браузерах генома, таких как Национальный центр биотехнологической информации (NCBI), Калифорнийский университет в Санта-Крус (UCSC) и веб-сайты Ensembl.
  2. Проверка качества РНК-секвенирования
    1. Введите файлы FASTQ в программу FASTQC, чтобы определить качество последовательностей РНК. Если качество файлов FASTQ низкое (например, 29,30.

2. Прогнозирование и анализ дифференциальной экспрессии цирковых РНК с использованием CIRIquant

ПРИМЕЧАНИЕ: Более подробное руководство по установке и выполнению анализа дифференциальных выражений можно найти в разделе о доступности кода документаCIRIquant 31. Дополнительные данные также включают некоторые из основных команд, используемых в этом протоколе.

  1. Прогнозы циркРНК
    1. Сначала проиндексируйте эталонный геном хозяина с помощью элайнеров BWA и HISAT2. Затем на терминале Linux выполните команды bwa index 32 и hisat2-build33 в каталоге эталонного генома хоста, чтобы проиндексировать его.
    2. Затем подготовьте конфигурационный файл YML, содержащий имя файла, путь к инструментам (BWA, HISAT2, stringtie34, samtools35), путь к загруженным справочным файлам (файлы FASTA ссылочного генома хоста, файлы аннотаций) и путь к индексным файлам из шага 2.1.1.
    3. Запустите инструмент CIRIquant из терминала, используя параметры по умолчанию или вручную. Пользователь может указать тип библиотеки (цепочечный или нецепочечный) данных RNA-seq при выполнении инструмента CIRIquant.
      ПРИМЕЧАНИЕ: Тип библиотеки данных RNA-seq можно определить, зная тип используемого набора для подготовки библиотеки. Если идентификация набора для подготовки библиотеки неизвестна, для определения многоцепочечности данных РНК-секвенирования можно использовать биоинформатический пакет управления РНК-секвенированием под названием RSeQC36 .
  2. Анализ дифференциальных выражений
    ПРИМЕЧАНИЕ: Пакет CIRIquant включает в себя prep_CIRIquant, prepDE.py и CIRI_DE_replicate; Поэтому для этих трех инструментов не требуется никаких дополнительных загрузок.
    1. Подготовьте текстовый файл (LST) со списком данных, содержащим следующее:
      1-й столбец: идентификаторы данных RNA-seq, используемых на шаге 2.1.3
      2-й столбец: путь к файлам GTF, выведенным CIRIquant
      3-й столбец: группировка данных RNA-seq, независимо от того, является ли это контрольной или обработанной группой.
    2. В качестве примера см. таблицу 1 ниже.
      ПРИМЕЧАНИЕ: Нет необходимости вставлять заголовки, так как они предназначены только для справки.
    3. На терминале Linux запустите prep_CIRIquant с текстовым файлом (.lst), подготовленным на шаге 2.2.1 в качестве входных данных. При запуске будет сформирован список файлов: library_info.csv, circRNA_info.csv, circRNA_bsj.csv и circRNA_ratio.csv.
    4. Подготовьте второй текстовый файл со списком данных, содержащим идентификаторы RNA-seq и путь к их соответствующим выходным данным StringTie. Макет файла должен быть похож на текстовый файл на шаге 2.2.1 без столбца группировки.
    5. Запустите prepDE.py с текстовым файлом, подготовленным на шаге 2.2.4, в качестве входных данных для создания матричных файлов подсчета генов.
    6. Выполните CIRI_DE_replicate с файлами library_info.csv и circRNA_bsj.csv из шага 2.2.3 и gene_count_matrix.csv из шага 2.2.5 в качестве входных данных для вывода окончательного файла circRNA_de.tsv.
  3. Фильтрация цирковых РНК DE
    1. Используйте R (в компьютерном терминале или RStudio) или любое программное обеспечение для работы с электронными таблицами (например, Microsoft Excel), чтобы открыть файл circRNA_de.tsv , сгенерированный на шаге 2.2.6, для фильтрации и определения количества дифференциально экспрессируемых (DE) циркулярных РНК.
    2. Фильтруйте циркулярные РНК DE в соответствии с критериями LogFC > |2| и FDR < 0,05.
    3. Создайте файл с именем DE_circRNAs.txt для хранения информации о циркулярных РНК DE.

3. Характеристика и аннотация предсказанных ДЭ циркРНК

  1. Статус аннотации цирковых РНК DE
    1. Загрузите файл с именем DE_circRNAs.txt в RStudio, который состоит из списка циркулярных РНК DE, отфильтрованных из шага 2.3.3. Включите другую информацию, такую как положения генома (Chr, Start, End), ориентацию цепи (+ или -), название гена и тип циркулярной РНК. Прежде чем продолжить, преобразуйте начальные координаты генома циркРНК из CIRIquant в 0, вычитая 1 пару оснований.
      ПРИМЕЧАНИЕ: Другая информация, указанная выше, может быть получена из файлов GTF, выведенных CIRIquant (дополнительный файл 1).
    2. Определите статус аннотации предсказанных цирковых РНК DE, загрузив библиотеку, содержащую геномные позиции депонированных циркРНК в базе данных circRNA (например, circBase).
      ПРИМЕЧАНИЕ: Перед сравнением убедитесь, что версия генома, используемая для прогнозирования цирковых РНК, идентична библиотеке базы данных цирковых РНК. Файл данных circBase, используемый здесь, находится в свободном доступе в папке диска, предоставленной в Github (https://github.com/bicciatolab/Circr)37.
    3. После того, как оба файла из шагов 3.1.1 и 3.1.2 будут подготовлены, запустите сценарий R, приведенный в дополнительном файле 1. Хромосомные местоположения циркулярных РНК DE запрашиваются в библиотеке перед присвоением статуса «Аннотированный» или «Неаннотированный».
  2. Характеристика цирковых РНК DE
    1. Используйте R и другое программное обеспечение для работы с электронными таблицами, чтобы суммировать количество цирковых РНК в соответствии с типами цирковых РНК (т. е. экзон, интрон, интергенный и антисмысловый) и количество генов, через которые охватываются цирковые РНК (1 или >1) (дополнительный файл 1).ПРИМЕЧАНИЕ: CIRIquant может обнаруживать только четыре типа цирковых РНК (экзон, интрон, интергенный и антисмысловый). Экзон-интронные циркРНК, также известные как ElciRNA, не могут быть обнаружены CIRIquant.

4. Прогнозирование взаимодействия circRNA-miRNA с помощью Circr

ПРИМЕЧАНИЕ: Более подробное руководство по установке и использованию Circr для анализа взаимодействия circRNA-miRNA можно найти по адресу: https://github.com/bicciatolab/Circr37.

  1. Подготовка файлов
    1. Распакуйте и извлеките содержимое файла Circr.zip после его загрузки со страницы Circr GitHub с помощью соответствующего программного обеспечения, такого как «WinRar» или «7-zip», в новый каталог, где будет проводиться анализ.
    2. Установите необходимые программные приложения (miRanda, RNAhybrid, Pybedtools и samtools) перед проведением анализа circRNA-miRNA.
    3. Справочные геномы и файлы аннотаций для нескольких интересующих организмов, файл координат рРНК, проверенный файл взаимодействия микроРНК и файлы circRNA circBase предоставляются автором Circr на странице Github (https://github.com/bicciatolab/Circr)37. Нажав на вспомогательные файлы в папке диска, выберите папку для интересующего организма, папку miRNA и текстовый файл circBase и загрузите его.
    4. После загрузки необходимых файлов на шаге 4.1.3 создайте новый каталог с именем support_files в каталоге, указанном на шаге 4.1.1. Затем распакуйте и извлеките содержимое в каталог support_files .
    5. Проиндексируйте файл эталонного генома интересующего организма с помощью команды samtools faidx (дополнительный файл 1).
    6. Подготовьте входной файл, состоящий из координат интересующих DE circRNA, в файле BED с разделителями-табуляциями, как показано в таблице 2.
      ПРИМЕЧАНИЕ: Поскольку цирковые РНК, предсказанные CIRIquant, не основаны на 0, необходимо вычесть 1.н. в начальной координате (как указано в шаге 3.1.1), прежде чем преобразовывать их в формат BED. Заголовки, показанные в таблице 2 , приведены только для справки и не нужны в файлах BED.
    7. На этом этапе убедитесь, что ожидаемая структура дерева папок для анализа Circr соответствует рисунку 2.
  2. Запуск Circr.py
    1. Выполните Circr.py с помощью Python 3 и в качестве аргументов укажите входной файл circRNA, геном FASTA интересующего организма, версию генома выбранного организма, количество потоков и имя выходного файла в командной строке.
    2. Если интересующий организм не указан в папке диска, указанной на шаге 4.1.3, или если пользователь предпочитает иметь пользовательский набор файлов для выполнения анализа, при выполнении Circr.py необходимо включить дополнительные команды, указывающие местоположение этих файлов.
    3. После завершения анализа Circr программа выводит файл взаимодействия circRNA-miRNA в формате csv.
    4. Отфильтруйте результаты взаимодействия circRNA-miRNA в соответствии с предпочтениями пользователя. Для этого исследования прогнозы фильтруются с помощью Rstudio в соответствии с приведенными ниже критериями:
      -Обнаружено всеми тремя программными инструментами
      -Два или более сайтов привязки, о которых сообщают как Targetscan, так и miRanda.
      -Идентифицирован в столбцах «AGO» или «проверено»
      -Отфильтровать отсутствие взаимодействий с начальными областями
    5. Запишите цирковые РНК, которые передают отфильтрованные условия из шага 4.2.3, в новый текстовый файл с именем circRNA_miRNA.txt. Такая фильтрация может повысить достоверность предсказанных взаимодействий.

5. Построение сети цеРНК

ПРИМЕЧАНИЕ: Подробное руководство по использованию Cytoscape можно найти по адресу: http://manual.cytoscape.org/en/stable/ и https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Скачивание и подготовка
    1. Загрузите последнюю версию Cytoscape38 с: https://cytoscape.org/download.html.
    2. Запустите мастер установки, загруженный на шаге 5.1.1, и выберите расположение файла для программного обеспечения Cytoscape.
    3. Подготовьте файл с разделителями-табуляциями, содержащий интересующие циркРНК и их миРНК-мишень. Первый столбец состоит из названия циркРНК; во втором столбце указывается тип РНК из первого столбца; третий столбец – мишень-миРНК; а в четвертом столбце указан тип РНК из третьего столбца. Пример файла приведен в таблице 3.
  2. Построение карты сети цеРНК
    1. Откройте программное обеспечение Cytoscape, установленное на шаге 5.1.2.
    2. В Cytoscape перейдите в раздел «Файл» > «Импорт > сеть из файла». Выберите файл, подготовленный на шаге 5.1.3.
    3. На новой вкладке выберите первый и второй столбцы как «Исходный узел» и «Атрибут исходного узла», а третий и четвертый столбцы — «Целевой узел» и «Атрибут целевого узла» соответственно. Нажмите OK, и сеть появится в правом верхнем углу Cytoscape.
    4. Чтобы изменить визуальный стиль сети, нажмите кнопку «Стиль » в левой части Cytoscape.
    5. Нажмите стрелку справа от параметра «Цвет заливки». Выберите « Тип » для столбца и «Дискретное сопоставление» для типа сопоставления . Затем выберите желаемый цвет для каждого из типов РНК.
    6. После изменения цвета измените форму узлов, перейдя в раздел «Форма » и выполнив шаг 5.2.5.

6. Анализ функционального обогащения

  1. Анализ генной онтологии (GO) и Киотской энциклопедии генов и геномов (KEGG) для родительского гена циркРНК
    1. Убедитесь, что clusterProfiler 39,40 и org. Hs.eg.db В Rstudio установлен 41 пакет. Орг. Пакет Hs.eg.db41 - это полногеномный пакет аннотаций только для людей. Если интересующим организмом является другой вид, обратитесь к: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Импортируйте информацию о DE_circRNA из шага 2.3.1 в рабочую область Rstudio.
    3. Используйте родительский ген цирковых РНК, представленных в этом файле, для анализа обогащения на следующих этапах. Однако, если пользователь хочет преобразовать символ гена в другие форматы, такие как Entrez ID, используйте такую функцию, как «bitr».
    4. Используя идентификатор гена в качестве входных данных, запустите анализ обогащения GO с помощью функции enrichGO в пакете clusterProfiler39,40 с параметрами по умолчанию.
    5. Используя идентификатор гена в качестве входных данных, запустите анализ обогащения KEGG с помощью функции enrichKEGG в пакете clusterProfiler39,40, используя параметры по умолчанию.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Протокол, перечисленный в предыдущем разделе, был изменен и настроен в соответствии с системой ОС Linux. Основная причина заключается в том, что большинство библиотек модулей и пакетов, участвующих в анализе circRNA, могут работать только на платформе Linux. В этом анализе деидентифицированные наборы данных библиотеки RNA-seq с обедненной рибосомной РНК (рРНК), подготовленные из инфицированных вирусом гриппа А клеток макрофагов человека, были загружены из базы данных42 GEO и использованы для получения репрезентативных результатов.

Прогнозирование и количественное определение циркРНК
В этом анализе наборы данных библиотеки РНК-секвенирования рибосомной РНК (рРНК), подготовленные из инфицированных вирусом гриппа А клеток макрофагов человека, использовались для обнаружения циркулярной РНК и функционального анализа. Как указано в разделе протокола, CIRIquant использовался для идентификации и проведения DE-анализа идентифицированных circRNA с использованием наборов данных библиотеки RNA-seq в качестве входных данных. Используемые справочные файлы основаны на последней версии генома человека (hg38). В таблице 4 приведен пример итоговых результатов анализа CIRIquant. Идентификация и фильтрация циркулярных РНК DE из выходных данных CIRIquant выполнялись с помощью простых скриптов RStudio (дополнительный файл 1). Цирковые РНК классифицируются как ДЭ только в том случае, если значение коэффициента ложного обнаружения (FDR) составляет <0,05, а изменение log fold (LogFC) >|2|. В таблице 5 показано общее количество обнаруженных цирковых РНК и ДЭ. Всего было обнаружено 35 846 цирковых РНК, из которых 306 были DE. Циркулярные РНК DE, обнаруженные в этом выходе, полностью повышаются (LogFC > 2), и ни одна из них не подавляется (LogFC < 2).

Аннотация и характеристика цирковых РНК DE
Статус аннотации цирковых РНК DE
Идентифицированные циркРНК DE были перепроверены с установленной базой данных цирковых РНК, circBase. Однако, поскольку координаты циркРНК, депонированные в circBase, основаны на предыдущей версии генома человека (hg19), координаты циркулярной РНК из circBase должны быть преобразованы в текущую версию генома человека (hg38) для перекрестной проверки в этом исследовании. Кроме того, начальная координата должна быть преобразована в 0 из выходных данных CIRIquant на основе 1. Преобразованные в версию hg38 координаты circRNA circBase предоставляются в папке диска на Github (https://github.com/bicciatolab/Circr)37. Затем скрипты Rstudio (дополнительный файл 1) использовались для присвоения статуса аннотации цирковых РНК в новом столбце кадра данных. В таблице 6 приведен пример цирковых РНК со статусом аннотации.

Характеристика цирковых РНК DE
Эта часть была полностью выполнена с помощью скриптов R в программном обеспечении RStudio. Скрипты R упрощают аналитические процессы, и требуются только базовые знания.

Типы циркРНК
На этом этапе цирковые РНК DE были охарактеризованы их типами цирковых РНК (антисмысловые, экзонические, межгенные и интронные) в зависимости от их геномных позиций. В таблице 7 ниже показана процентная разбивка различных типов цирковых РНК, охватываемых идентифицированными цирковыми РНК DE. Из общего числа 306 цирковых РНК DE 263 циркРНК (85,95%) были идентифицированы как экзонные циркРНК, что является наиболее распространенным типом циркРНК. Интронные цирковые РНК являются вторым наиболее идентифицируемым типом цирковых РНК, включающим 17 цирковых РНК DE, что составляет до 5,56% от общего количества циркРНК DE. Далее следуют межгенные циркРНК (16 ДЭ-циркРНК ~5,23%) и антисмысловые РНК (10 ДЭ-циркРНК ~3,27%).

Количество генов, охватываемых на циркулярную РНК
ЦиркРНК, идентифицированные CIRIquant, могут перекрываться по ряду генов. На сегодняшний день большинство исследований сосредоточено на цирковых РНК, которые охватывают один ген. Следовательно, в этом протоколе кандидаты на цирковые РНК, охватывающие более одного гена, исключаются из последующего анализа. В таблице 8 ниже описано количество и процент циркулярных РНК DE, охватывающих один и более одного гена. В этой таблице исключаются межгенные циркРНК (16 ДЭ циркРНК), поскольку они не перекрывают ни одного гена хозяина, в то время как остальные типы цирковых РНК (290 ДЭ циркРНК) подвергаются этому анализу. Из 290 цирковых РНК DE большинство цирковых РНК DE (261 цирковая РНК ~ 90%) охватывают только один ген, в то время как остальные 29 цирковых РНК (~ 10%) охватывают более одного гена.

Построение сети цеРНК
Сеть цеРНК обычно рисуется для визуализации взаимодействия циркулярных РНК-миРНК после того, как она была предсказана. На рисунке 3 ниже в качестве репрезентативного результата была выбрана только одна цирковая РНК DE, которая является hsa_DE_58 циркРНК. Основываясь на предсказаниях Circr, hsa_DE_58 может губить до девяти различных микроРНК. Эти девять микроРНК идентифицируются после фильтрации по строгим критериям.

Анализ функционального обогащения
GO и KEGG анализ родительских генов цирковой РНК
На рисунке 4 ниже показан пузырьковый график функционального обогащения родительских генов DE circRNA с помощью анализа GO. По сути, анализ GO направлен на то, чтобы разгадать биологические процессы, клеточные местоположения и молекулярные функции, которые обогащаются или изменяются в изучаемом состоянии, в данном случае в зараженном вирусом образце. Обогащение считается статистически значимым и наносится на пузырьковую диаграмму только в том случае, если p-значение < 0,01. Как показано на рисунке 4, три основных обогащения для биологических процессов (BP) включают биогенез рибонуклеопротеинового комплекса, реакцию на вирус и регуляцию ответа на биотический стимул, в то время как для молекулярных функций (MF) статистически обогащена только каталитическая активность, действующая на РНК и связывание одноцепочечной РНК. С другой стороны, только ретромерный комплекс статистически обогащен клеточными компонентами (КК).

На рисунке 5 показан анализ обогащения KEGG родительских генов DE circRNA на пузырьковом графике. Подобно анализу обогащения GO, обогащение KEGG считается статистически значимым и наносится на пузырьковый график только в том случае, если p-значение < 0,01. В этом случае были обогащены только два термина KEGG, а именно пути жизненного цикла гриппа А и вируса (ВИЧ-1).

Figure 1
Рисунок 1: Конвейер для прогнозирования и функциональной характеристики цирковых РНК. Конвейер показывает простой обзор ключевых шагов от начала до конца, включая установку необходимых программных пакетов, прогнозирование и количественную оценку экспрессии циркулярных РНК, построение сети цеРНК и выполнение функционального обогащения родительского гена циркРНК. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Древовидная структура папок для Circr. Эта древовидная структура папок должна быть установлена перед запуском программного обеспечения Circr, чтобы обнаружить необходимые файлы для анализа. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 3
Рисунок 3: Сеть цеРНК, состоящая из взаимодействия циркРНК-миРНК. Синяя овальная форма представляет собой циркулярную РНК, а оранжевые треугольники представляют микроРНК. Сплошные линии, соединяющие циркулярную РНК с микроРНК, описывают потенциальную функцию губки микроРНК hsa_DE_58 циркРНК. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 4
Рисунок 4: Пузырьковый график анализа обогащения GO родительских генов DE circRNA. GeneRatio по оси x — это количество генов во входном списке, связанном с данным термином GO, делящее общее количество входных генов. Размер точки на графике представлен значением count, которое представляет собой количество генов во входном списке, связанных с данным термином GO. Чем больше размер точек, тем больше количество входных генов, связанных с термином. Кроме того, точки на графике имеют цветовую кодировку на основе p-значения. P-значение рассчитывается путем сравнения наблюдаемой частоты термина аннотации с частотой, ожидаемой случайно. Отдельные термины считаются обогащенными сверх порогового значения (p-значение < 0,01). Цветовой градиент p-значения в диапазоне от синего до красного указывает на возрастающее обогащение терминов. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 5
Рисунок 5: Анализ обогащения KEGG родительских генов DE circRNA. GeneRatio по оси x - это количество генов во входном списке, связанное с данным термином KEGG, делящим общее количество входных генов. Размер точки на графике представлен значением count, которое представляет собой количество генов во входном списке, связанных с данным термином KEGG. Чем больше размер точек, тем больше количество входных генов, связанных с термином. Кроме того, точки на графике имеют цветовую кодировку на основе p-значения. P-значение рассчитывается путем сравнения наблюдаемой частоты термина аннотации с частотой, ожидаемой случайно. Отдельные члены считаются обогащенными сверх порогового значения (p-значение < 0,01). Цветовой градиент p-значения в диапазоне от синего до красного указывает на увеличение обогащения слагаемых. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Пример имени Путь к выходному GTF-файлу CIRIquant Группировка
Управление 1 /path/to/CIRIquant/ctrl1.gtf C
Управление 2 /path/to/CIRIquant/ctrl2.gtf C
Зараженные 1 /path/to/CIRIquant/infect1.gtf T
Зараженные 2 /path/to/CIRIquant/infect2.gtf T

Таблица 1: Подготовка файла .lst CIRIquant. Конечные пути контрольного и обработанного образцов из выходных данных CIRIquant записываются в текстовый файл для сравнения экспрессий циркулярной РНК между двумя типами образцов.

Chr Начало Конец Имя . Прядь
ХР2 137428930 137433876 hsa_circ_000076 . -
ХР2 154705868 154706632 hsa_circ_000105 . -
ХР2 159104273 159106793 hsa_circ_000118 . -
ХР2 159215701 159226125 hsa_circ_000119 . -
ХР4 39980067 39980129 hsa_circ_002584 . -

Таблица 2: Пример файла BED для Circr. Шесть столбцов (Chr, Start, End, Name, Gene и Strand), связанных с circRNA, необходимы для создания файла BED.

circRNA_name Тип miRNA_name Тип
DE_circRNA_1 circRNA miR-001 микроРНК
DE_circRNA_1 circRNA miR-002 микроРНК
DE_circRNA_2 circRNA miR-003 микроРНК
DE_circRNA_2 circRNA miR-004 микроРНК

Таблица 3: Входной файл Cytoscape. Четыре столбца (circRNA_name, Тип, miRNA_name и Тип) должны быть записаны в текстовый файл.

ЦиркРНК logFC logCPM ЛР Значение ДЕ Рузвельт
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00Э-42 1 1.08Э-37
CHR16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
CHR14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Таблица 4: Часть окончательного выходного (.csv) файла CIRIquant. CIRIquant предоставляет такую информацию, как LogFC, количество журналов на миллион (LogCPM), логистическая регрессия (LR), p-значение, дифференциальное выражение и FDR.

Результаты CIRIquant
Итог ДЕ Вверх Вниз
35846 306 306 0

Таблица 5: Сводная информация о количестве идентифицированных общих и дифференциально экспрессируемых (ДЭ) циркулярных РНК. Всего обнаружено 35 846 цирковых РНК, из которых 306 являются цирковыми РНК DE. Все 306 циркулярных РНК DE повышаются (ни одна из них не подавляется) в обработанных образцах по сравнению с контрольными образцами.

Custom_Name Annotation_Status
hsa_DE_22 Без аннотации
hsa_DE_2 Аннотированный
hsa_DE_58 Без аннотации
hsa_DE_3 Аннотированный

Таблица 6: Таблица пользовательских названий circRNA со статусом аннотации. Цирковые РНК запрашиваются в базе данных известных депонированных циркРНК (circBase). Если циркулярная РНК присутствует в базе данных, она помечается как аннотированная, в то время как отсутствие циркулярной РНК помечается как неаннотированная.

Тип циркРНК Частота Процент
Антисмысл 10 3.27%
экзон 263 85.95%
Межгенный 16 5.23%
Интрон 17 5.56%

Таблица 7: Идентифицированные типы циркулярных РНК. Цирковые РНК могут быть дополнительно классифицированы на различные типы цирковых РНК в зависимости от их области последовательности, а именно: экзонные, интронные, антисмысловые и интергенные.

Количество родительских генов Частота Процент
1 261 90%
> 1 29 10%

Таблица 8: Процент циркулярных РНК с разным количеством охватываемых генов. Цирковые РНК обычно кодируются из экзонов одного гена, но цирковые РНК, охватывающие более одного гена, также могут быть обнаружены CIRIquant.

Дополнительный файл 1: Скрипты, используемые в протоколе. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Чтобы проиллюстрировать полезность этого протокола, в качестве примера использовали РНК-секвенирование из инфицированных вирусом гриппа А клеток макрофагов человека. Были исследованы циркРНК, функционирующие как потенциальные губки микроРНК во взаимодействиях хозяин-патоген, и их функциональное обогащение GO и KEGG внутри хозяина. Несмотря на то, что в Интернете доступно множество инструментов circRNA, каждый из них представляет собой отдельный пакет, который не взаимодействует друг с другом. Здесь мы собрали несколько инструментов, необходимых для прогнозирования и количественного определения цирковой РНК, функционального обогащения циркРНК, прогнозирования взаимодействия циркРНК-миРНК и построения сети цеРНК. Этот оптимизированный протокол экономит время и может применяться к клиническим образцам для обнаружения кандидатов на очерк-РНК с диагностическими и прогностическими значениями.

По сути, мы использовали CIRIquant31, инструмент количественного определения цирковой РНК, предварительно упакованный с CIRI2, который может обнаруживать и проводить анализ DE цирковых РНК. Цирковые РНК DE фильтруются на основе порогового значения LogFC > |2| и FDR < 0,05, что помогает исключить потенциальные ложные срабатывания при последующем анализе. Характеристика циркулярных РНК DE с точки зрения статуса аннотации, типов циркулярных РНК и количества охватываемых генов помогает в категоризации и дальнейшей фильтрации кандидатов в циркРНК. Впоследствии Circr37, инструмент прогнозирования очерковой РНК-миРНК, используется для прогнозирования потенциальных кандидатов на спонгирование микроРНК. После предсказания потенциальных микроРНК в качестве мишеней циркРНК рисуется сеть цеРНК. Наконец, основываясь на родительских генах цирковых РНК, пакет39 R clusterProfiler используется для функциональной аннотации с помощью анализа обогащения путей GO и KEGG. Результаты GO и KEGG могут помочь разгадать биологические механизмы, на которые влияют цирковые РНК.

На сегодняшний день разработано несколько различных инструментов прогнозирования циркулярных РНК, включая CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 и UROBORUS 47. В исследовании, проведенном Hansen et al., сообщается, что CIRI2 обладает высокой общей эффективностью. Это один из немногих инструментов обнаружения циркулярных РНК, который может хорошо функционировать с точки зрения прогнозирования de novo и снижения ложноположительной идентификации48. Поэтому в этом исследовании использовался CIRIquant, который использует CIRI2 для обнаружения и количественного определения цирковой РНК. CIRIquant использовался для подсчета считываний обратного сплайс-соединения (BSJ), и данные подсчета были нормализованы к чтениям, сопоставленным с родственными линейными РНК, транскрибируемыми из одних и тех же локусов генов. Это позволяет количественно определять циркулярные РНК в образце. Чтобы определить дифференциальную экспрессию циркулярных РНК в экспериментальных условиях, CIRIquant реализовал обобщенную линейную модель в edgeR49 для анализа DE, а тест точного соотношения скорости был использован в качестве статистического теста для определения значимости разницы в соотношении переходов циркулярных РНК. Хотя другие инструменты количественного определения циркулярных РНК, такие как CIRCexplorer3-CLEAR50, можно использовать для количественной оценки уровня экспрессии цирковых РНК, этот инструмент позволяет количественно определять циркулярную РНК только в образце, поскольку он подсчитывает показания BSJ в образце и нормализует данные подсчета по сравнению с родственными линейными подсчетами РНК из того же образца. CIRCexplorer3-CLEAR не может сравнивать экспрессии циркулярных РНК в экспериментальных условиях. Кроме того, в CIRCexplorer3-CLEAR не реализован инструмент статистического анализа для поддержки количественного уровня выражения. Несмотря на то, что инструментом прогнозирования циркулярных РНК по умолчанию, реализованным в CIRIquant, является CIRI2, результаты прогнозирования с помощью других инструментов, таких как find_circ и CIRCexplorer2, также могут быть использованы для количественной оценки и анализаDE 31. В этом протоколе для прогнозирования использовался только один инструмент прогнозирования циркулярной РНК (CIRI2), который все еще может давать ложноположительные кандидаты на циркулярную РНК. Чтобы уменьшить количество ложноположительных результатов, можно комбинировать другие инструменты прогнозирования циркулярных РНК для анализа и выбирать общие циркулярные РНК, обнаруженные среди различных инструментов прогнозирования циркулярных РНК48,51. Для дальнейшего улучшения обнаружения циркулярных РНК идеально использовать наборы данных секвенирования РНК, которые обеднены рРНК и подвергнуты предварительной обработке РНКазой R.

В зависимости от цели исследования, de novo и аннотированные DE circRNA могут быть идентифицированы отдельно на основе базы данных circBase52. Однако цирковые РНК, охватывающие более одного гена, часто требуют ручного исследования в UCSC или любом другом браузере генома для определения подлинности цирковых РНК и устранения ложных срабатываний. Тем не менее, недавно также сообщалось о циркулярных РНК, которые охватывают более одного гена, таких как циркРНК, полученные из генов слияния53,54.

Circr работает, комбинируя три различных алгоритма прогнозирования микроРНК-мРНК, а именно TargetScan55, miRanda 56 и RNAhybrid57 для прогнозирования сайтов связывания окрестных РНК-миРНК. Кроме того, алгоритм также включает информацию о пиках AGO и ранее проверенных взаимодействиях в анализе circRNA-miRNA. Здесь были применены строгие критерии фильтрации, позволяющие получить более надежное предсказание циркулярной РНК-миРНК, что еще больше снизило количество ложноположительных результатов. Однако строгость этого шага фильтрации может быть установлена выше или ниже в зависимости от предпочтений пользователя.

ClusterProfiler — это хорошо документированный пакет R, который может функционально аннотировать наборы генов в различных организмах. Помимо функций в пакете R clusterProfiler, упомянутых в этом протоколе (enrichGO и enrichKEGG), которые используют анализ избыточного представления, можно использовать и другие функции, такие как gseGO и gseKEGG . Если clusterProfiler не является подходящим выбором для рабочего процесса, существуют также другие инструменты и пакеты, такие как «AllEnricher»58 или инструменты на основе веб-сайтов, такие как «Metascape»59 , которые могут функционально аннотировать набор генов. Наконец, хотя приведенный выше конвейер помогает в прогнозировании потенциальных циркулярных РНК и их функциональных аннотаций, для получения убедительных доказательств потребуется проверка в мокрой лаборатории.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам раскрывать нечего.

Acknowledgments

Автор хотел бы поблагодарить Тан Ке Эн и доктора Кэмерона Брэкена за их критическую рецензию на эту рукопись. Эта работа была поддержана грантами Схемы грантов на фундаментальные исследования (FRGS/1/2020/SKK0/UM/02/15) и Исследовательского гранта Университета Малайи (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Ретракция выпуск 188 кольцевая РНК циркулярная РНК взаимодействие хозяина и патогена
<em>In Silico</em> Идентификация и характеристика цирковых РНК во время взаимодействий хозяина и патогена
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter