Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

In Silico Identificación y caracterización de circRNAs durante las interacciones huésped-patógeno

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

El protocolo presentado aquí explica la tubería in silico completa necesaria para predecir y caracterizar funcionalmente circRNAs a partir de datos de transcriptoma de secuenciación de ARN que estudian las interacciones huésped-patógeno.

Abstract

Los ARN circulares (circRNAs) son una clase de RNAs no codificantes que se forman a través del retroempalme. Estos circRNAs se estudian predominantemente por su papel como reguladores de diversos procesos biológicos. En particular, la evidencia emergente demuestra que los circRNAs del huésped pueden expresarse diferencialmente (DE) tras la infección con patógenos (por ejemplo, influenza y coronavirus), lo que sugiere un papel para los circRNAs en la regulación de las respuestas inmunes innatas del huésped. Sin embargo, las investigaciones sobre el papel de los circRNAs durante las infecciones patogénicas están limitadas por el conocimiento y las habilidades necesarias para llevar a cabo el análisis bioinformático necesario para identificar los circRNAs DE a partir de datos de secuenciación de RNA (RNA-seq). La predicción bioinformática y la identificación de circRNAs es crucial antes de cualquier verificación, y estudios funcionales que utilizan técnicas de laboratorio húmedo costosas y que requieren mucho tiempo. Para resolver este problema, en este manuscrito se proporciona un protocolo paso a paso de predicción in silico y caracterización de circRNAs utilizando datos RNA-seq. El protocolo se puede dividir en cuatro pasos: 1) Predicción y cuantificación de circRNAs de DE a través del pipeline CIRIquant; 2) Anotación vía circBase y caracterización de circRNAs DE; 3) Predicción de la interacción CircRNA-miRNA a través de la tubería Circr; 4) análisis de enriquecimiento funcional de genes parentales circRNA utilizando Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG). Esta tubería será útil para impulsar futuras investigaciones in vitro e in vivo para desentrañar aún más el papel de los circRNAs en las interacciones huésped-patógeno.

Introduction

Las interacciones huésped-patógeno representan una interacción compleja entre los patógenos y los organismos huéspedes, lo que desencadena las respuestas inmunes innatas de los huéspedes que eventualmente resultan en la eliminación de patógenos invasores 1,2. Durante las infecciones patógenas, una multitud de genes inmunes del huésped se regula para inhibir la replicación y liberación de patógenos. Por ejemplo, los genes comunes estimulados por interferón (ISG) regulados por infecciones patógenas incluyen ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I y OASL 3,4. Además de los genes codificadores de proteínas, los estudios también han informado que los ARN no codificantes, como los ARN largos no codificantes (lncRNAs), los microARN (miRNAs) y los RNAs circulares (circRNAs) también juegan un papel y están regulados simultáneamente durante las infecciones patogénicas 5,6,7. A diferencia de los genes codificadores de proteínas que codifican principalmente proteínas como moléculas funcionales, se sabe que los ARN no codificantes (ncRNA) funcionan como reguladores de genes a nivel transcripcional y posttranscripcional. Sin embargo, los estudios que involucran la participación de ARN no codificantes, particularmente circRNAs, en la regulación de los genes inmunes de los huéspedes no están bien informados en comparación con los genes codificadores de proteínas.

Los CircRNAs se caracterizan ampliamente por su estructura de bucle continuo covalentemente cerrado, que se genera a través de un proceso de empalme no canónico llamado retroempalme8. El proceso de empalme posterior, a diferencia del proceso de empalme de ARN lineales afines, implica la ligadura del sitio donante aguas abajo al sitio aceptor aguas arriba, formando una estructura de forma circular. Actualmente, se han propuesto tres mecanismos diferentes de empalme posterior para la biogénesis de circRNAs. Estos son la circularización mediada por proteína de unión al ARN (RBP) 9,10, la circularización impulsada por el emparejamiento intrón 11 y la circularización impulsada por lariat12,13,14. Dado que los circRNAs están conectados de extremo a extremo en una estructura circular, tienden a ser naturalmente resistentes a las digestiones normales de exonucleasas y, por lo tanto, se consideran más estables que sus contrapartes lineales15. Otra característica común exhibida por circRNAs incluye la expresión específica del tipo de célula o tejido en los huéspedes16.

Como lo implica su estructura única y la expresión específica de células o tejidos, se ha descubierto que los circRNAs desempeñan importantes funciones biológicas en las células. Hasta la fecha, una de las funciones prominentes de los circRNAs es su papel como esponjas de microRNA (miRNA)17,18. Este papel regulador de los circRNAs ocurre a través de la unión complementaria de los nucleótidos circRNA con la región semilla de los miRNAs. Tal interacción circRNA-miRNA inhibe las funciones reguladoras normales de los miRNAs en los mRNAs diana, regulando así la expresión de genes19,20. Además, también se sabe que los circRNAs regulan la expresión génica interactuando con proteínas de unión a ARN (RBP) y formando complejos ARN-proteína21. Aunque los circRNAs se clasifican como RNAs no codificantes, también hay evidencia de que los circRNAs pueden actuar como plantillas para la traducción de proteínas22,23,24.

Recientemente, se ha demostrado que los circRNAs desempeñan un papel fundamental en la regulación de las interacciones huésped-patógeno, particularmente entre los huéspedes y los virus. En general, se supone que los circRNAs del huésped ayudan a regular las respuestas inmunes del huésped para eliminar los patógenos invasores. Un ejemplo de circRNA que promueve las respuestas inmunes del huésped es circRNA_0082633, reportado por Guo et al.25. Este circRNA mejora la señalización del interferón tipo I (IFN) dentro de las células A549, lo que ayuda a suprimir la replicación del virus de la influenza25. Además, Qu et al. también reportaron un circRNA intrónico humano, llamado circRNA AIVR, que promueve la inmunidad al regular la expresión de la proteína de unión a CREB (CREBBP), un transductor de señal de IFN-β26,27. Sin embargo, también existen circRNAs que se sabe que promueven la patogénesis de la enfermedad tras la infección. Por ejemplo, Yu et al. informaron recientemente el papel desempeñado por un circRNA empalmado del dominio del dedo de zinc GATA que contiene el gen 2A (circGATAD2A) en la promoción de la replicación del virus H1N1 a través de la inhibición de la autofagia de la célula huésped28.

Para estudiar eficazmente los circRNAs, generalmente se implementa un algoritmo de predicción de circRNA de todo el genoma, seguido de una caracterización in silico de los candidatos de circRNA predichos antes de que se puedan llevar a cabo estudios funcionales. Tal enfoque bioinformático para predecir y caracterizar circRNAs es menos costoso y más eficiente en el tiempo. Ayuda a refinar el número de candidatos a estudiar funcionalmente y podría conducir a nuevos hallazgos. Aquí, proporcionamos un protocolo detallado basado en bioinformática para la identificación, caracterización y anotación funcional in silico de circRNAs durante las interacciones huésped-patógeno. El protocolo incluye la identificación y cuantificación de circRNAs a partir de conjuntos de datos de secuenciación de RNA, anotación a través de circBase y la caracterización de los candidatos circRNA en términos de tipos de circRNA, número de genes superpuestos e interacciones circRNA-miRNA previstas. Este estudio también proporciona la anotación funcional de los genes parentales circRNA a través de Gene Ontology (GO) y el análisis de enriquecimiento de la Enciclopedia de Genes y Genomas de Kyoto (KEGG).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

En este protocolo, se descargaron y utilizaron conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A y se utilizaron de la base de datos Gene Expression Omnibus (GEO). Toda la línea de bioinformática desde la predicción hasta la caracterización funcional de circRNAs se resume en la Figura 1. Cada parte de la tubería se explica con más detalle en las secciones siguientes.

1. Preparación, descarga y configuración antes del análisis de datos

NOTA: Todos los paquetes de software utilizados en este estudio son gratuitos y de código abierto.

  1. Descarga de las herramientas necesarias en la plataforma Linux
    1. Descargue e instale el software y las herramientas necesarias que se enumeran en la Tabla de materiales en una computadora Linux de alto rendimiento siguiendo las instrucciones proporcionadas por el desarrollador.
      NOTA: La mayoría de las herramientas y el software tienen sus propias páginas de GitHub en línea o documentación que contiene instrucciones sobre cómo instalar y usar sus herramientas (consulte la Tabla de materiales).
    2. Descargue los conjuntos de datos de RNA-seq deseados para la detección y el análisis de circRNA de los sitios web de archivos de secuencias (por ejemplo, European Nucleotides Archive y Gene Expression Omnibus).
    3. Descargue los genomas de referencia (formato FASTA) y los archivos de anotación (formato GTF/GFF3), compatibles con el host a partir del cual se preparó el conjunto de datos RNA-seq. Los genomas de referencia del host y los archivos de anotación generalmente se encuentran en navegadores de genomas en línea, como el Centro Nacional de Información Biotecnológica (NCBI), la Universidad de California Santa Cruz (UCSC) y los sitios web de Ensembl.
  2. Control de calidad de RNA-seq
    1. Introduzca los archivos FASTQ en el programa FASTQC para determinar la calidad de las secuencias de ARN. Si la calidad de los archivos FASTQ es baja (por ejemplo, 29,30.

2. Predicción y análisis de expresión diferencial de circRNAs utilizando CIRIquant

NOTA: Se puede encontrar un manual más detallado sobre la instalación y realización del análisis de expresiones diferenciales en la sección de disponibilidad de código del documento31 de CIRIquant. Los datos suplementarios también incluyen algunos de los comandos básicos utilizados en este protocolo.

  1. Predicciones de CircRNA
    1. Indexar primero el genoma de referencia del huésped utilizando alineadores BWA y HISAT2. Luego, en un terminal Linux, ejecute los comandos bwa index 32 y hisat2-build33 en el directorio del genoma de referencia del host para indexarlo.
    2. A continuación, prepare un archivo de configuración YML que contenga el nombre del archivo, la ruta de acceso de las herramientas (BWA, HISAT2, stringtie34, samtools35), la ruta a los archivos de referencia descargados (archivos FASTA del genoma de referencia del host, archivos de anotación) y la ruta a los archivos de índice desde el paso 2.1.1.
    3. Ejecute la herramienta CIRIquant desde el terminal utilizando los parámetros predeterminados o manuales. El usuario puede especificar el tipo de biblioteca (trenzada o no trenzada) de los datos RNA-seq al ejecutar la herramienta CIRIquant.
      NOTA: El tipo de biblioteca de los datos RNA-seq se puede determinar conociendo el tipo de kit de preparación de biblioteca utilizado. Si se desconoce la identidad del kit de preparación de la biblioteca, se puede usar un paquete bioinformático de control de RNA-seq llamado RSeQC36 para determinar el varado de los datos de RNA-seq.
  2. Análisis de expresiones diferenciales
    NOTA: El paquete CIRIquant incluye prep_CIRIquant, prepDE.py y CIRI_DE_replicate; Por lo tanto, no se necesitan descargas adicionales para estas tres herramientas.
    1. Prepare un archivo de texto (.lst) con una lista de datos que contenga lo siguiente:
      columna: ID de los datos RNA-seq utilizados en el paso 2.1.3
      columna: ruta a los archivos GTF generados por CIRIquant
      columna: agrupación de los datos RNA-seq, ya sea un grupo control o tratado.
    2. Para ver un ejemplo, consulte la Tabla 1 a continuación.
      NOTA: No es necesario poner los encabezados ya que son solo para referencia.
    3. En el terminal Linux, ejecute prep_CIRIquant con el archivo de texto (.lst) preparado en el paso 2.2.1 como entrada. La ejecución generará una lista de archivos: library_info.csv, circRNA_info.csv, circRNA_bsj.csv y circRNA_ratio.csv.
    4. Prepare un segundo archivo de texto con una lista de datos que contengan los ID de RNA-seq y la ruta a su respectiva salida StringTie. El diseño del archivo debe ser similar al archivo de texto del paso 2.2.1 sin la columna de agrupación.
    5. Ejecute prepDE.py con el archivo de texto preparado en el paso 2.2.4 como entrada para generar los archivos de matriz de recuento de genes.
    6. Ejecute CIRI_DE_replicate con los archivos library_info.csv y circRNA_bsj.csv del paso 2.2.3 y el archivo gene_count_matrix.csv del paso 2.2.5 como entradas para generar el archivo circRNA_de.tsv final.
  3. Filtrado de circRNAs de DE
    1. Utilice R (en el terminal de la computadora o RStudio) o cualquier software de hoja de cálculo (por ejemplo, Microsoft Excel) para abrir el archivo circRNA_de.tsv generado en el paso 2.2.6 para filtrar y determinar el número de circRNAs expresados diferencialmente (DE).
    2. Filtrar los circRNAs DE según los criterios LogFC > |2| y FDR < 0,05.
    3. Cree un archivo denominado DE_circRNAs.txt para almacenar la información de los circRNAs DE.

3. Caracterización y anotación de circRNAs DE predichos

  1. Estado de anotación de circRNAs DE
    1. Cargue el archivo denominado DE_circRNAs.txt en RStudio , que consiste en la lista de circRNAs DE filtrados desde el paso 2.3.3. Incluya otra información, como las posiciones genómicas (Chr, Start, End), las orientaciones de la cadena (+ o -), el nombre del gen y el tipo de circRNA. Antes de continuar, convierta las coordenadas genómicas de inicio de circRNA de CIRIquant a 0-based restando 1 par de bases.
      NOTA: El resto de la información indicada anteriormente puede obtenerse de los archivos GTF generados por CIRIquant (Archivo complementario 1).
    2. Determine el estado de anotación de los circRNAs DE predichos descargando una biblioteca que contenga las posiciones genómicas de la base de datos circRNA-database (por ejemplo, circBase) depositados circRNAs.
      NOTA: Asegúrese de que la versión del genoma utilizada para predecir los circRNAs es idéntica a la biblioteca de base de datos circRNA antes de hacer la comparación. El archivo de datos circBase utilizado aquí está disponible gratuitamente en la carpeta de la unidad proporcionada en Github (https://github.com/bicciatolab/Circr)37.
    3. Una vez preparados los archivos del paso 3.1.1 y del paso 3.1.2, ejecute el script R que figura en el archivo complementario 1. Las ubicaciones cromosómicas de los circRNAs DE se consultan a la biblioteca antes de asignar el estado Anotado o No anotado.
  2. Caracterización de circRNAs de DE
    1. Use R y otro software de hoja de cálculo para resumir el número de circRNAs de acuerdo con los tipos de circRNA (es decir, exón, intrón, intergénico y antisentido) y el número de genes que abarcan los circRNAs (1 o >1) (Archivo complementario 1).NOTA: CIRIquant sólo puede detectar cuatro tipos de circRNAs (exón, intrón, intergénico y antisentido). Los circRNAs exón-intrón, también conocidos como ElciRNAs, no pueden ser detectados por CIRIquant.

4. Predicción de la interacción circRNA-miRNA usando Circr

NOTA: Un manual más detallado sobre cómo instalar y usar Circr para el análisis de interacción circRNA-miRNA se puede encontrar en: https://github.com/bicciatolab/Circr37.

  1. Preparación de expedientes
    1. Descomprima y extraiga el contenido del archivo Circr.zip después de descargarlo de la página de Circr GitHub utilizando el software relevante como "WinRar" o "7-zip" en un nuevo directorio donde se realizará el análisis.
    2. Instale las aplicaciones de software necesarias (miRanda, RNAhybrid, Pybedtools y samtools) antes de realizar el análisis circRNA-miRNA.
    3. Los genomas de referencia y los archivos de anotación para varios organismos de interés, el archivo de coordenadas de ARNr, el archivo de interacción de miARN validado y los archivos circARN de circBase son proporcionados por el autor de Circr en la página de Github (https://github.com/bicciatolab/Circr)37. Al hacer clic en los archivos de soporte en la carpeta de la unidad, seleccione la carpeta para el organismo de interés, la carpeta de miRNA y el archivo de texto circBase y descárguelo.
    4. Después de descargar los archivos necesarios en el paso 4.1.3, cree un nuevo directorio denominado support_files en el directorio mencionado en el paso 4.1.1. Luego, descomprima y extraiga el contenido en el directorio support_files .
    5. Indexar el archivo genómico de referencia del organismo de interés utilizando el comando samtools faidx (Archivo complementario 1).
    6. Prepare un archivo de entrada que consista en las coordenadas de los circRNAs DE de interés en un archivo BED delimitado por tabulaciones, como se muestra en la Tabla 2.
      NOTA: Debido a que los circRNAs predichos por CIRIquant no están basados en 0, es necesario menos 1 pb en la coordenada inicial (como se mencionó en el paso 3.1.1) antes de convertirlos al formato BED. Los encabezados que se muestran en la Tabla 2 son solo para referencia y no son necesarios en los archivos BED.
    7. En este punto, asegúrese de que la estructura de árbol de carpetas esperada para el análisis Circr sea como en la figura 2.
  2. Ejecución Circr.py
    1. Ejecute Circr.py usando Python 3 y, como argumentos, especifique el archivo de entrada circRNA, el genoma FASTA del organismo de interés, la versión del genoma del organismo seleccionado, el número de subprocesos y el nombre del archivo de salida en la línea de comandos.
    2. Si el organismo de interés no se proporciona en la carpeta de la unidad enumerada en el paso 4.1.3 o si el usuario prefiere tener un conjunto personalizado de archivos para ejecutar el análisis, se deben incluir comandos adicionales que especifiquen la ubicación de estos archivos al ejecutar Circr.py.
    3. Una vez completado el análisis Circr, el programa genera un archivo de interacción circRNA-miRNA en formato csv.
    4. Filtre los resultados de la interacción circRNA-miRNA de acuerdo con la preferencia específica del usuario. Para este estudio, las predicciones se filtran utilizando Rstudio de acuerdo con los siguientes criterios:
      -Detectado por las tres herramientas de software
      -Dos o más sitios de enlace reportados por Targetscan y miRanda
      -Identificado en las columnas "AGO" o "validado"
      -Filtrar las interacciones de la región de la semilla
    5. Escriba los circRNAs que pasan las condiciones filtradas del paso 4.2.3 en un nuevo archivo de texto denominado circRNA_miRNA.txt. Tal filtrado puede aumentar la confianza de las interacciones predichas.

5. Construcción de la red de ceRNA

NOTA: Un manual detallado sobre cómo usar Cytoscape se puede encontrar en: http://manual.cytoscape.org/en/stable/ y https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Descarga y preparación
    1. Descargue la última versión de Cytoscape38 desde: https://cytoscape.org/download.html.
    2. Ejecute el asistente de instalación descargado en el paso 5.1.1 y seleccione la ubicación del archivo para el software Cytoscape.
    3. Prepare un archivo delimitado por tabuladores que contenga los circRNAs de interés y su miRNA diana. La primera columna consiste en el nombre circRNA; la segunda columna especifica el tipo de ARN de la primera columna; la tercera columna es el miARN objetivo; y la cuarta columna especifica el tipo de ARN de la tercera columna. En la tabla 3 se muestra un ejemplo del archivo.
  2. Construyendo el mapa de red de ceRNA
    1. Abra el software Cytoscape instalado en el paso 5.1.2.
    2. En Cytoscape, navegue hasta Archivo > Importar > red desde archivo. Seleccione el archivo que se ha preparado en el paso 5.1.3.
    3. En la nueva pestaña, seleccione la primera y segunda columna como "Nodo de origen" y "Atributo de nodo de origen", mientras que seleccione la tercera y cuarta columna como "Nodo de destino" y "Atributo de nodo de destino" respectivamente. Haga clic en Aceptar y la red aparecerá en la parte superior derecha de Cytoscape.
    4. Para cambiar el estilo visual de la red, presione el botón Estilo en el lado izquierdo de Cytoscape.
    5. Presione la flecha en el lado derecho de Color de relleno. Elija Tipo para la columna y Asignación discreta para el tipo de asignación. Luego, seleccione el color deseado para cada uno de los tipos de ARN.
    6. Después de cambiar el color, cambie la forma de los nodos navegando a Forma y siguiendo el paso 5.2.5.

6. Análisis de enriquecimiento funcional

  1. Análisis de Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG) para el gen parental de los circRNAs
    1. Asegúrese de que clusterProfiler 39,40 y org. Hs.eg.db se han instalado 41 paquetes en Rstudio. La org. El paquete Hs.eg.db41 es un paquete de anotaciones de todo el genoma solo para humanos. Si el organismo de interés es otra especie, refiérase: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importe la información DE_circRNA del paso 2.3.1 en el espacio de trabajo de Rstudio.
    3. Utilice el gen parental de los circRNAs proporcionados en este archivo para el análisis de enriquecimiento en los próximos pasos. Sin embargo, si el usuario desea convertir el símbolo del gen a otros formatos, como el ID de entrez, utilice una función como "bitr".
    4. Utilizando el identificador genético como entrada, ejecute el análisis de enriquecimiento de GO utilizando la función enrichGO dentro del paquete clusterProfiler39,40 utilizando parámetros predeterminados.
    5. Utilizando el identificador genético como entrada, ejecute el análisis de enriquecimiento KEGG utilizando la función enrichKEGG dentro del paquete clusterProfiler39,40 utilizando los parámetros predeterminados.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

El protocolo alistado en la sección anterior se modificó y configuró para adaptarse al sistema operativo Linux. La razón principal es que la mayoría de las bibliotecas de módulos y paquetes involucrados en el análisis de circRNAs solo pueden funcionar en la plataforma Linux. En este análisis, los conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A se descargaron de la base de datos GEO42 y se utilizaron para generar los resultados representativos.

Predicción y cuantificación de CircRNA
En este análisis, se utilizaron conjuntos de datos de la biblioteca de ARN-seq sin ARN ribosómico (ARNr) preparados a partir de las células de macrófagos humanos infectados con el virus de la influenza A para llevar a cabo la detección de circRNA y el análisis funcional. Como se especificó en la sección de protocolo, CIRIquant se utilizó para identificar y llevar a cabo el análisis de DE de circRNAs identificados utilizando los conjuntos de datos de la biblioteca RNA-seq como entrada. Los archivos de referencia utilizados se basan en la última versión del genoma humano (hg38). La Tabla 4 muestra un ejemplo del resultado final del análisis CIRIquant. La identificación y el filtrado de circRNAs DE a partir de la salida CIRIquant se ejecutaron a través de scripts RStudio simples (Archivo Suplementario 1). Los CircRNAs solo se clasifican como DE cuando el valor de la tasa de descubrimiento falso (FDR) es <0.05 y el cambio de pliegue logarítmico (LogFC) >|2|. La Tabla 5 muestra el número total de circRNAs y DE circRNAs detectados. Se detectaron un total de 35.846 circRNAs, de los cuales 306 fueron DE. Los circRNAs DE detectados en esta salida están completamente regulados al alza (LogFC > 2), y ninguno está regulado a la baja (LogFC < 2).

Anotación y caracterización de circRNAs de DE
Estado de anotación de circRNAs DE
Los circRNAs DE identificados se cotejaron con una base de datos de circRNA establecida, circBase. Sin embargo, dado que las coordenadas circRNA depositadas en circBase se basan en una versión previa del genoma humano (hg19), las coordenadas circRNA de circBase deben convertirse a la versión actual del genoma humano (hg38) para la verificación cruzada en este estudio. Además, la coordenada inicial debe convertirse a 0 desde la salida basada en 1 de CIRIquant. Las coordenadas circRNA convertidas en versión hg38 de circBase se proporcionan en una carpeta de unidad en Github (https://github.com/bicciatolab/Circr)37. Luego, se utilizaron los scripts Rstudio (Archivo Suplementario 1) para asignar el estado de anotación de circRNAs en una nueva columna de marco de datos. La Tabla 6 muestra un ejemplo de circRNAs con el estado de anotación.

Caracterización de circRNAs de DE
Esta parte se ejecutó completamente a través de scripts R en el software RStudio. Los scripts de R facilitan los procesos analíticos, y solo se requieren conocimientos básicos.

Tipos de CircRNA
En este paso, los circRNAs DE se caracterizaron por sus tipos de circRNA (Antisense, Exonic, Intergenic e Intronic) en función de sus posiciones genómicas. La Tabla 7 a continuación muestra el desglose porcentual de los diferentes tipos de circRNA abarcados por los circRNAs DE identificados. Del total de 306 circRNAs DE, 263 circRNAs (85,95%) fueron identificados como circRNAs exónicos, que es el tipo de circRNA más abundante identificado. Los circRNAs intrónicos vienen como el segundo tipo de circRNA más identificado que comprende 17 circRNAs DE, lo que representa hasta el 5,56% del total de circRNAs DE. Esto es seguido por circRNAs intergénicos (16 circRNAs DE ~5.23%) y circRNAs antisentido (10 circRNAs DE ~3.27%).

Número de genes distribuidos por circRNA
Los CircRNAs identificados por CIRIquant pueden superponerse a través de varios genes. Hasta la fecha, la mayoría de los estudios se centran en circRNAs que abarcan un gen. Por lo tanto, en este protocolo, los candidatos circRNA que abarcan más de un gen se excluyen del análisis posterior. La Tabla 8 a continuación describe el número y porcentaje de circRNAs DE que abarcan uno y más de un gen. En esta tabla, se excluyen los circRNAs intergénicos (16 circRNAs DE) ya que no se superponen a ningún gen huésped, mientras que el resto de los tipos de circRNAs (290 circRNAs DE) se someten a este análisis. De los 290 circRNAs DE, la mayoría de los circRNAs DE (261 circRNAs ~90%) abarcan solo un gen, mientras que los 29 circRNAs restantes (~10%) abarcan más de un gen.

Construcción de la red de ceRNA
Una red de ceRNA generalmente se dibuja para visualizar las interacciones circRNA-miRNA después de que se haya predicho. En la Figura 3 a continuación, solo se eligió un circARN DE como resultado representativo, que es el hsa_DE_58 circRNA. Según las predicciones de Circr, hsa_DE_58 puede esponjar hasta nueve miRNAs diferentes. Estos nueve miARN se identifican después de filtrar a través de criterios estrictos.

Análisis de enriquecimiento funcional
Análisis GO y KEGG de los genes parentales circRNA
La Figura 4 a continuación muestra un gráfico de burbujas del enriquecimiento funcional de los genes parentales DE circRNA a través del análisis GO. Fundamentalmente, el análisis GO tiene como objetivo desentrañar los procesos biológicos, las ubicaciones celulares y las funciones moleculares que se enriquecen o impactan en la condición estudiada, en este caso, la muestra infectada por el virus. El enriquecimiento se considera estadísticamente significativo y se representa en el gráfico de burbujas solo si el valor p es < 0,01. Como se muestra en la Figura 4, los tres enriquecimientos principales para los procesos biológicos (BP) incluyen la biogénesis del complejo ribonucleoproteico, la respuesta al virus y la regulación de la respuesta a un estímulo biótico, mientras que para las funciones moleculares (MF) solo se enriquece estadísticamente la actividad catalítica que actúa sobre el ARN y la unión al ARN monocatenario. Por otro lado, solo el complejo retromémero está estadísticamente enriquecido para los componentes celulares (CC).

La Figura 5 muestra el análisis de enriquecimiento KEGG de los genes parentales DE circRNA en un diagrama de burbujas. Similar al análisis de enriquecimiento GO, el enriquecimiento KEGG solo se considera estadísticamente significativo y se representa en un gráfico de burbujas si el valor p es < 0.01. Solo dos términos KEGG se enriquecieron en este caso, que son las vías de la influenza A y el ciclo de vida viral (VIH-1).

Figure 1
Figura 1: El pipeline para la predicción y caracterización funcional de circRNAs. La canalización muestra una visión general simple de los pasos clave de principio a fin que involucran la instalación de los paquetes de software necesarios, la predicción y cuantificación de la expresión de circRNA, la construcción de la red de ceRNA y la realización del enriquecimiento funcional del gen parental circRNA. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2: Estructura del árbol de carpetas para Circr. Esta estructura de árbol de carpetas debe establecerse antes de ejecutar el software Circr para detectar los archivos necesarios para el análisis. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: red de ceRNA que consiste en la interacción circRNA-miRNA. La forma ovalada azul representa el circRNA, mientras que los triángulos naranjas representan los miRNAs. Las líneas continuas que conectan el circRNA con los miRNAs describen la potencial función de esponja de miRNA del circRNA hsa_DE_58. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: Gráfico de burbujas del análisis de enriquecimiento de GO de los genes parentales DE circRNA. GeneRatio en el eje x es el número de genes en la lista de entrada asociada con el término GO dado dividiendo el número total de genes de entrada. El tamaño del punto en la gráfica está representado por el valor de recuento, que es el número de genes en la lista de entrada asociada con el término GO dado. Cuanto mayor sea el tamaño de los puntos, mayor será el número de genes de entrada asociados con el término. Además, los puntos en la gráfica están codificados por colores en función del valor p. El valor p se calcula comparando la frecuencia observada de un término de anotación con la frecuencia esperada por casualidad. Los términos individuales se consideran enriquecidos más allá de un valor de corte (valor p < 0,01). El gradiente de color del valor p que va del azul al rojo indica un aumento del enriquecimiento de los términos. Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5: Análisis de enriquecimiento KEGG de genes parentales DE circRNA. GeneRatio en el eje x es el número de genes en la lista de entrada asociada con el término KEGG dado dividiendo el número total de genes de entrada. El tamaño del punto en la gráfica está representado por el valor de conteo, que es el número de genes en la lista de entrada asociada con el término KEGG dado. Cuanto mayor sea el tamaño de los puntos, mayor será el número de genes de entrada asociados con el término. Además, los puntos en la gráfica están codificados por colores en función del valor p. El valor p se calcula comparando la frecuencia observada de un término de anotación con la frecuencia esperada por casualidad. Los términos individuales se consideran enriquecidos más allá de un valor de corte (valor p < 0,01). El gradiente de color del valor p que va del azul al rojo indica un aumento del enriquecimiento de los términos. Haga clic aquí para ver una versión más grande de esta figura.

Nombre de la muestra Ruta al archivo GTF de salida de CIRIquant Agrupación
Control 1 /path/to/CIRIquant/ctrl1.gtf C
Control 2 /path/to/CIRIquant/ctrl2.gtf C
Infectado 1 /path/to/CIRIquant/infect1.gtf T
Infectado 2 /path/to/CIRIquant/infect2.gtf T

Tabla 1: La preparación del archivo .lst de CIRIquant. Las rutas de destino del control y las muestras tratadas de la salida CIRIquant se escriben en un archivo de texto para comparar las expresiones de circRNA entre los dos tipos de muestras.

Chr Empezar Fin Nombre . Hebra
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

Tabla 2: Ejemplo de archivo BED para Circr. Se requieren seis columnas (Chr, Start, End, Name, Gene y Strand) asociadas con los circRNAs para generar el archivo BED.

circRNA_name Tipo miRNA_name Tipo
DE_circRNA_1 circRNA miR-001 Mirna
DE_circRNA_1 circRNA miR-002 Mirna
DE_circRNA_2 circRNA miR-003 Mirna
DE_circRNA_2 circRNA miR-004 Mirna

Tabla 3: Archivo de entrada de Cytoscape. Se requieren cuatro columnas (circRNA_name, Tipo, miRNA_name y Tipo) para escribirse en un archivo de texto.

CircRNA logFC logCPM LR Pvalue DE FDR
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
Chr16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
chr14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tabla 4: Parte del archivo de salida final (.csv) de CIRIquant. CIRIquant ofrece información como el LogFC, recuentos logarítmicos por millón (LogCPM), regresión logística (LR), valor p, expresión diferencial y FDR.

Resultados CIRIquant
Total DE Hacia arriba Abajo
35846 306 306 0

Tabla 5: Un resumen del número de circRNAs totales y expresados diferencialmente (DE) identificados. Se detectan un total de 35.846 circRNAs, siendo 306 circRNAs DE. Todos los 306 circRNAs de DE están regulados al alza (sin que ninguno esté regulado a la baja) en las muestras tratadas en comparación con las muestras de control.

Custom_Name Annotation_Status
hsa_DE_22 Sin anotaciones
hsa_DE_2 Anotado
hsa_DE_58 Sin anotaciones
hsa_DE_3 Anotado

Tabla 6: Tabla de nombres personalizados de circRNA con estado de anotación. Los circRNAs se consultan en una base de datos de circRNAs depositados conocidos (circBase). Si el circRNA está presente dentro de la base de datos, se etiqueta para ser anotado, mientras que la ausencia del circRNA se etiqueta como no anotado.

Tipo de CircRNA Freq Porcentaje
antisentido 10 3.27%
exón 263 85.95%
intergénico 16 5.23%
intrón 17 5.56%

Tabla 7: Tipos de circRNAs identificados. Los circRNAs se pueden clasificar en diferentes tipos de circRNAs en función de su región de secuencia, a saber, exónica, intrónica, antisentido e intergénica.

Número de genes parentales Freq Porcentaje
1 261 90%
> 1 29 10%

Tabla 8: Porcentaje de circRNAs con el diferente número de genes abarcados. Los circRNAs se codifican comúnmente a partir de exones de un gen, pero los circRNAs que abarcan más de un gen también pueden ser detectados por CIRIquant.

Archivo complementario 1: Scripts utilizados en el protocolo. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Para ilustrar la utilidad de este protocolo, se utilizó como ejemplo el RNA-seq de células macrófagas humanas infectadas con el virus de la influenza A. Se investigaron los circRNAs que funcionan como posibles esponjas de miRNA en las interacciones huésped-patógeno y su enriquecimiento funcional GO y KEGG dentro de un huésped. Aunque hay una variedad de herramientas de circRNA disponibles en línea, cada una de ellas es un paquete independiente que no interactúa entre sí. Aquí, reunimos algunas de las herramientas que se requieren para la predicción y cuantificación de circRNA, el enriquecimiento funcional de circRNA, la predicción de la interacción circRNA-miRNA y la construcción de redes de ceRNA. Este protocolo simplificado ahorra tiempo y se puede aplicar a muestras clínicas para detectar candidatos de circRNA con valores diagnósticos y pronósticos.

Esencialmente, empleamos CIRIquant31, una herramienta de cuantificación de circRNA preempaquetada con CIRI2, que puede detectar y llevar a cabo el análisis de DE de circRNAs. Los circRNAs DE se filtran en función de un valor de corte de LogFC > |2| y FDR < 0,05, que ayuda a eliminar posibles falsos positivos en los análisis posteriores. La caracterización de los circRNAs DE en términos de estado de anotación, tipos de circRNA y el número de genes abarcados ayudan a categorizar y filtrar aún más los candidatos de circRNA. Posteriormente, Circr37, una herramienta de predicción de circRNA-miRNA, se utiliza para predecir posibles candidatos a esponja de miRNA. Después de predecir los miRNAs potenciales como dianas de los circRNAs, se dibuja una red de ceRNA. Finalmente, basado en los genes parentales de circRNAs, el paquete R clusterProfiler39 se utiliza para la anotación funcional a través del análisis de enriquecimiento de la vía GO y KEGG. Los resultados de GO y KEGG pueden ayudar a desentrañar los mecanismos biológicos influenciados por los circRNAs.

Hasta la fecha, se han desarrollado varias herramientas diferentes de predicción de circRNA, incluyendo CIRI243, CIRCexplorer2 44, find_circ 45, MapSplice 46 y UROBORUS 47. En un estudio realizado por Hansen et al., se informa que CIRI2 tiene un alto rendimiento general. Es una de las pocas herramientas de detección de circRNA que puede funcionar bien en términos de predicción de novo y reducción de la identificación de falsos positivos48. Por lo tanto, CIRIquant, que utiliza CIRI2 para la detección y cuantificación de circRNA, se utilizó en este estudio. CIRIquant se utilizó para contar las lecturas de la unión de empalme posterior (BSJ), y los datos de recuento se normalizaron a las lecturas mapeadas a ARN lineales afines transcritos a partir de los mismos loci de genes. Esto permite la cuantificación de circRNAs en una muestra. Para determinar la expresión diferencial de circRNAs en condiciones experimentales, CIRIquant implementó un modelo lineal generalizado en edgeR49 para el análisis DE, y la prueba exacta de la relación de velocidad se utilizó como una prueba estadística para determinar la importancia de la diferencia en la relación de unión circRNA. Aunque otras herramientas de cuantificación de circRNA como CIRCexplorer3-CLEAR50 se pueden usar para cuantificar el nivel de expresión de circRNAs, esta herramienta solo permite la cuantificación de circRNA en una muestra, ya que cuenta las lecturas BSJ en una muestra y normaliza los datos de recuento contra los recuentos de ARN lineal afín de la misma muestra. CIRCexplorer3-CLEAR no puede comparar expresiones de circRNA en condiciones experimentales. Además, no se implementa ninguna herramienta de análisis estadístico en CIRCexplorer3-CLEAR para apoyar el nivel de expresión cuantificado. Aunque la herramienta de predicción circRNA por defecto implementada dentro de CIRIquant es CIRI2, los resultados de predicción de otras herramientas como find_circ y CIRCexplorer2 también pueden ser utilizados para la cuantificación y el análisis DE31. En este protocolo, solo se utilizó una herramienta de predicción de circRNA (CIRI2) para la predicción, que aún podría producir candidatos de circRNA falsos positivos. Para reducir los falsos positivos, se pueden combinar otras herramientas de predicción de circRNA para el análisis y seleccionar circRNAs comunes detectados entre las diferentes herramientas de predicción de circRNA48,51. Para mejorar aún más la detección de circRNA, es ideal utilizar conjuntos de datos de secuenciación de ARN que estén agotados en ARNr y sometidos a un pretratamiento con RNasa R.

Dependiendo del objetivo del estudio, los circRNAs DE de novo y anotados pueden identificarse por separado sobre la base de datos circBase52. Sin embargo, los circRNAs que abarcan más de un gen a menudo requieren un examen manual en UCSC o cualquier otro navegador del genoma para determinar la autenticidad de los circRNAs y eliminar los falsos positivos. No obstante, los circRNAs que abarcan más de un gen, como los circRNAs derivados de genes de fusión, también han sido reportados recientemente53,54.

Circr funciona combinando tres algoritmos diferentes de predicción de miARN-ARNm, a saber, TargetScan55, miRanda 56 y ARNhybrid57 para predecir los sitios de unión circRNA-miRNA. Además de eso, el algoritmo también incorpora información de picos de AGO e interacciones previamente validadas en el análisis circRNA-miRNA. Aquí, se aplicaron criterios de filtrado estrictos para permitir obtener una predicción más confiable de circRNA-miRNA, reduciendo así aún más los falsos positivos. Sin embargo, la rigurosidad de este paso de filtrado podría establecerse más alta o más baja según las preferencias del usuario.

ClusterProfiler es un paquete R bien documentado que puede anotar funcionalmente conjuntos de genes en diversos organismos. Además de las funciones dentro del paquete R clusterProfiler mencionadas en este protocolo (enrichGO y enrichKEGG), que utilizan el análisis de sobrerrepresentación, también hay otras funciones como gseGO y gseKEGG que se pueden usar. Si clusterProfiler no es una opción adecuada para el flujo de trabajo, también hay otras herramientas y paquetes como "AllEnricher"58 o las herramientas basadas en sitios web como "Metascape"59 que pueden anotar funcionalmente un conjunto de genes. Por último, aunque la tubería proporcionada anteriormente ayuda a predecir posibles circRNAs y sus anotaciones funcionales, se necesitará una verificación de laboratorio húmedo para proporcionar evidencia sólida.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

El autor desea agradecer a Tan Ke En y al Dr. Cameron Bracken por su revisión crítica de este manuscrito. Este trabajo fue apoyado por subvenciones del Plan de Becas de Investigación Fundamental (FRGS / 1/2020 / SKK0 / UM / 02/15) y la Beca de Investigación de Alto Impacto de la Universidad de Malaya (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Retracción Número 188 ARN circular circRNA interacción huésped-patógeno
<em>In Silico</em> Identificación y caracterización de circRNAs durante las interacciones huésped-patógeno
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter