Biology

Em Silico Identificação e caracterização de circRNAs durante interações patógeno-hospedeiro

Published: October 21, 2022 doi: 10.3791/64565

Mathanakumara Ealam Selvan*¹, Kai Shen Lim*¹, Chee How Teo², Yat-Yuen Lim¹

¹Institute of Biological Sciences, Faculty of Science, Universiti Malaya, ²Centre for Research in Biotechnology for Agriculture (CEBAR), Universiti Malaya

* These authors contributed equally

Summary

O protocolo apresentado aqui explica o pipeline in silico completo necessário para prever e caracterizar funcionalmente circRNAs a partir de dados de transcriptoma de sequenciamento de RNA estudando interações patógeno-hospedeiro.

Abstract

RNAs circulares (circRNAs) são uma classe de RNAs não-codificantes que são formados via back-splicing. Estes circRNAs são predominantemente estudados por seus papéis como reguladores de vários processos biológicos. Notavelmente, evidências emergentes demonstram que circRNAs do hospedeiro podem ser diferencialmente expressos (DE) após a infecção por patógenos (por exemplo, influenza e coronavírus), sugerindo um papel para circRNAs na regulação das respostas imunes inatas do hospedeiro. No entanto, as investigações sobre o papel dos circRNAs durante infecções patogênicas são limitadas pelo conhecimento e habilidades necessárias para realizar a análise bioinformática necessária para identificar circRNAs DE a partir de dados de sequenciamento de RNA (RNA-seq). A predição bioinformática e a identificação de circRNAs são cruciais antes de qualquer verificação, e estudos funcionais usando técnicas de laboratório úmido caras e demoradas. Para resolver essa questão, um protocolo passo-a-passo de predição e caracterização in silico de circRNAs usando dados de RNA-seq é fornecido neste manuscrito. O protocolo pode ser dividido em quatro etapas: 1) Predição e quantificação de circRNAs DE via pipeline CIRIquant; 2) Anotação via circBase e caracterização de circRNAs DE; 3) Predição da interação CircRNA-miRNA através do pipeline Circr; 4) análise de enriquecimento funcional de genes parentais de circRNA usando Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG). Este pipeline será útil na condução de futuras pesquisas in vitro e in vivo para desvendar ainda mais o papel dos circRNAs nas interações patógeno-hospedeiro.

Introduction

As interações patógeno-hospedeiro representam uma complexa interação entre os patógenos e os organismos hospedeiros, que desencadeia as respostas imunes inatas dos hospedeiros que, eventualmente, resultam na remoção de patógenos invasores ^1,2. Durante infecções patogênicas, uma infinidade de genes imunes do hospedeiro é regulada para inibir a replicação e liberação de patógenos. Por exemplo, genes comuns estimulados por interferon (ISGs) regulados sobre infecções patogênicas incluem ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL ^3,4. Além dos genes codificadores de proteínas, estudos também relataram que RNAs não codificantes, como RNAs longos não codificadores (lncRNAs), microRNAs (miRNAs) e circulares (circRNAs), também desempenham um papel e são regulados concomitantemente durante infecções patogênicas ^5,6,7. Em contraste com os genes codificadores de proteínas que codificam principalmente proteínas como moléculas funcionais, RNAs não-codificantes (ncRNAs) são conhecidos por funcionar como reguladores de genes em níveis transcricionais e pós-transcricionais. No entanto, estudos envolvendo a participação de RNAs não-codificantes, particularmente circRNAs, na regulação dos genes imunes dos hospedeiros não são bem relatados em comparação com os genes codificadores de proteínas.

Os circRNAs são amplamente caracterizados por sua estrutura de loop contínuo covalentemente fechado, que é gerado através de um processo de splicing não-canônico chamado back-splicing⁸. O processo de back-splicing, ao contrário do processo de splicing de RNAs lineares cognatos, envolve a ligadura do sítio doador a jusante ao sítio receptor a montante, formando uma estrutura de forma circular. Atualmente, três diferentes mecanismos de back-splicing para a biogênese de circRNAs têm sido propostos. Estas são a circularização mediada por RNA binding protein (RBP) 9,10, a circularização conduzida por intron-pairing 11 e a circularização conduzida por lariat^12,13,14. Dado que os circRNAs estão conectados de ponta a ponta em uma estrutura circular, eles tendem a ser naturalmente resistentes às digestãos normais de exonucleases e, portanto, são considerados mais estáveis do que seus equivalentes lineares¹⁵. Outra característica comum exibida pelos circRNAs inclui a expressão específica do tipo celular ou tecidual em hospedeiros¹⁶.

Como implicado por sua estrutura única e expressão célula ou tecido-específica, circRNAs foram descobertos para desempenhar funções biológicas importantes nas células. Até o momento, uma das funções proeminentes dos circRNAs é seu papel como esponjas de microRNA (miRNA)^17,18. Este papel regulatório dos circRNAs ocorre através da ligação complementar dos nucleotídeos do circRNA com a região da semente dos miRNAs. Esta interação circRNA-miRNA inibe as funções regulatórias normais dos miRNAs sobre os RNAm-alvo, regulando assim a expressão de genes ^19,20. Além disso, circRNAs também são conhecidos por regular a expressão gênica interagindo com proteínas ligadoras de RNA (RBPs) e formando complexos RNA-proteína²¹. Embora os circRNAs sejam classificados como RNAs não codificantes, também há evidências de que os circRNAs podem atuar como moldes para a tradução de^{proteínas22,23,24}.

Recentemente, foi demonstrado que os circRNAs desempenham papéis fundamentais na regulação das interações patógeno-hospedeiro, particularmente entre os hospedeiros e os vírus. Geralmente, acredita-se que os circRNAs do hospedeiro auxiliem na regulação das respostas imunes do hospedeiro para eliminar os patógenos invasores. Um exemplo de circRNA que promove respostas imunes do hospedeiro é circRNA_0082633, relatado por Guo et ^al.25. Esse circRNA aumenta a sinalização do interferon tipo I (IFN) dentro das células A549, o que ajuda a suprimir a replicação do vírus influenza²⁵. Além disso, Qu e col. também relataram um circRNA intrônico humano, denominado circRNA AIVR, que promove imunidade regulando a expressão da proteína ligadora de CREB (CREBBP), um transdutor de sinal de IFN-β^26,27. No entanto, circRNAs que são conhecidos por promover a patogênese da doença após a infecção também existem. Por exemplo, Yu e col. relataram recentemente o papel desempenhado por um circRNA emendado do domínio dedo de zinco GATA contendo o gene 2A (circGATAD2A) na promoção da replicação do vírus H1N1 através da inibição da autofagia da célula hospedeira²⁸.

Para estudar efetivamente circRNAs, um algoritmo de predição de circRNA genômico é geralmente implementado, seguido por uma caracterização in silico dos candidatos a circRNA previstos antes que qualquer estudo funcional possa ser realizado. Tal abordagem de bioinformática para prever e caracterizar circRNAs é menos dispendiosa e mais eficiente em termos de tempo. Isso ajuda a refinar o número de candidatos a serem estudados funcionalmente e pode potencialmente levar a novas descobertas. Aqui, nós fornecemos um protocolo detalhado baseado em bioinformática para a identificação, caracterização e anotação funcional in silico de circRNAs durante as interações patógeno-hospedeiro. O protocolo inclui a identificação e quantificação de circRNAs a partir de conjuntos de dados de sequenciamento de RNA, anotação via circBase e a caracterização dos candidatos de circRNA em termos de tipos de circRNA, número de genes sobrepostos e interações circRNA-miRNA previstas. Este estudo também fornece a anotação funcional dos genes parentais do circRNA através da análise de enriquecimento da Gene Ontology (GO) e da Enciclopédia de Genes e Genomas de Kyoto (KEGG).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Neste protocolo, conjuntos de dados da biblioteca RNA-seq depletada de RNA-rribossomal desidentificados preparados a partir de células de macrófagos humanos infectadas pelo vírus influenza A foram baixados e usados do banco de dados Gene Expression Omnibus (GEO). Todo o pipeline de bioinformática, desde a predição até a caracterização funcional dos circRNAs, está resumido na Figura 1. Cada parte do gasoduto é explicada mais detalhadamente nas seções abaixo.

1. Preparação, download e configuração antes da análise dos dados

NOTA: Todos os pacotes de software utilizados neste estudo são gratuitos e de código aberto.

Baixando as ferramentas necessárias na plataforma Linux
1. Baixe e instale o software e as ferramentas necessárias listados na Tabela de Materiais em um computador Linux de alto desempenho usando as instruções fornecidas pelo desenvolvedor.
  NOTA: A maioria das ferramentas e software tem suas próprias páginas online do GitHub ou documentação contendo instruções sobre como instalar e usar suas ferramentas (consulte a Tabela de Materiais).
2. Faça o download dos conjuntos de dados RNA-seq desejados para detecção e análise de circRNA em sites de arquivos de sequências (por exemplo, European Nucleotides Archive e Gene Expression Omnibus).
3. Faça o download do(s) genoma(s) de referência (formato FASTA) e dos arquivos de anotação (formato GTF/GFF3), compatíveis com o hospedeiro a partir do qual o conjunto de dados RNA-seq foi preparado. Genoma(s) de referência do hospedeiro e arquivos de anotação são geralmente encontrados em navegadores de genoma on-line, como o National Center for Biotechnology Information (NCBI), a Universidade da Califórnia em Santa Cruz (UCSC) e os sites do Ensembl.
Verificação da qualidade do RNA-seq
1. Insira os arquivos FASTQ no programa FASTQC para determinar a qualidade das sequências de RNA. Se a qualidade dos arquivos FASTQ for baixa (por exemplo, 29,30.

2. Predição e análise de expressão diferencial de circRNAs utilizando CIRIquant

NOTA: Um manual mais detalhado sobre como instalar e executar a análise de expressão diferencial pode ser encontrado na seção de disponibilidade de código do documento CIRIquant³¹. Os dados complementares também incluem alguns dos comandos básicos usados neste protocolo.

Previsões de CircRNA
1. Indexe o genoma de referência do hospedeiro primeiro usando alinhadores BWA e HISAT2. Em seguida, em um terminal Linux, execute os comandos bwa index 32 e hisat2-build³³ no diretório do genoma de referência do host para indexá-lo.
2. Em seguida, prepare um arquivo de configuração YML contendo o nome do arquivo, o caminho das ferramentas (BWA, HISAT2, stringtie³⁴, samtools³⁵), o caminho para os arquivos de referência baixados (arquivos FASTA do genoma de referência do host, arquivos de anotação) e o caminho para os arquivos de índice da etapa 2.1.1.
3. Execute a ferramenta CIRIquant a partir do terminal usando os parâmetros padrão ou manuais. O usuário pode especificar o tipo de biblioteca (encalhada ou não encalhada) dos dados RNA-seq ao executar a ferramenta CIRIquant.
  NOTA: O tipo de biblioteca dos dados RNA-seq pode ser determinado conhecendo o tipo de kit de preparação de biblioteca usado. Se a identidade do kit de preparação da biblioteca for desconhecida, um pacote de bioinformática de controle de RNA-seq chamado RSeQC³⁶ pode ser usado para determinar o encalhe de dados de RNA-seq.
Análise de expressão diferencial
NOTA: O pacote CIRIquant inclui prep_CIRIquant, prepDE.py e CIRI_DE_replicate; portanto, nenhum download adicional é necessário para essas três ferramentas.
1. Prepare um arquivo de texto (.lst) com uma lista de dados contendo o seguinte:
  1ª coluna: IDs dos dados RNA-seq utilizados na etapa 2.1.3
  2ª coluna: caminho para os arquivos GTF gerados pelo CIRIquant
  3ª coluna: agrupamento dos dados de RNA-seq, se é um grupo controle ou tratado.
2. Para obter um exemplo, consulte a Tabela 1 abaixo.
  NOTA: Não é necessário colocar os cabeçalhos, pois eles são apenas para referência.
3. No terminal Linux, execute prep_CIRIquant com o arquivo de texto (.lst) preparado na etapa 2.2.1 como uma entrada. A execução gerará uma lista de arquivos: library_info.csv, circRNA_info.csv, circRNA_bsj.csv e circRNA_ratio.csv.
4. Prepare um segundo arquivo de texto com uma lista de dados contendo os IDs RNA-seq e o caminho para sua respectiva saída StringTie. O layout do arquivo deve ser semelhante ao arquivo de texto na etapa 2.2.1 sem a coluna de agrupamento.
5. Execute prepDE.py com o arquivo de texto preparado na etapa 2.2.4 como uma entrada para gerar os arquivos de matriz de contagem de genes.
6. Execute CIRI_DE_replicate com os arquivos library_info.csv e circRNA_bsj.csv da etapa 2.2.3 e o arquivo gene_count_matrix.csv da etapa 2.2.5 como entradas para gerar o arquivo circRNA_de.tsv final.
Filtragem de circRNAs DE
1. Use R (no terminal do computador ou RStudio) ou qualquer software de planilha (por exemplo, Microsoft Excel) para abrir o arquivo circRNA_de.tsv gerado a partir da etapa 2.2.6 para filtrar e determinar o número de circRNAs diferencialmente expressos (DE).
2. Filtrar os circRNAs DE de acordo com os critérios LogFC > |2| e FDR < 0,05.
3. Crie um arquivo chamado DE_circRNAs.txt para armazenar as informações de circRNAs DE.

3. Caracterização e anotação de circRNAs DE previstos

Status de anotação de circRNAs DE
1. Carregue o arquivo chamado DE_circRNAs.txt no RStudio , que consiste na lista de circRNAs DE filtrados da etapa 2.3.3. Inclua outras informações, como as posições genômicas (Chr, Start, End), orientações de fita (+ ou -), nome do gene e tipo de circRNA. Antes de prosseguir, converta as coordenadas iniciais genômicas do circRNA de CIRIquant para 0-based subtraindo 1 par de bases.
  NOTA: As outras informações indicadas acima podem ser obtidas a partir dos arquivos GTF gerados pelo CIRIquant (Arquivo Suplementar 1).
2. Determine o status de anotação dos circRNAs DE previstos baixando uma biblioteca contendo as posições genômicas do circRNA-banco de dados (por exemplo, circBase) depositado circRNAs.
  NOTA: Certifique-se de que a versão do genoma usada para prever os circRNAs é idêntica à biblioteca de banco de dados circRNA antes de fazer a comparação. O arquivo de dados circBase usado aqui está disponível gratuitamente na pasta da unidade fornecida no Github (https://github.com/bicciatolab/Circr)³⁷.
3. Depois que os arquivos da etapa 3.1.1 e da etapa 3.1.2 estiverem preparados, execute o script R fornecido no Arquivo Suplementar 1. Os locais cromossômicos dos circRNAs DE são consultados na biblioteca antes de atribuir o status Anotado ou Não Anotado.
Caracterização de circRNAs DE
1. Use R e outros softwares de planilha para resumir o número de circRNAs de acordo com os tipos de circRNA (ou seja, éxon, intron, intergênico e antisense) e o número de genes que os circRNAs abrangem (1 ou >1) (Arquivo Suplementar 1).NOTA: CIRIquant só pode detectar quatro tipos de circRNAs (éxon, intron, intergênico e antisense). Os circRNAs exon-íntron, também conhecidos como ElciRNAs, não podem ser detectados pelo CIRIquant.

4. Predição da interação circRNA-miRNA usando Circr

NOTA: Um manual mais detalhado sobre como instalar e usar o Circr para a análise da interação circRNA-miRNA pode ser encontrado em: https://github.com/bicciatolab/Circr³⁷.

Preparação de arquivos
1. Descompacte e extraia o conteúdo do arquivo Circr.zip depois de baixá-lo da página do Circr GitHub usando o software relevante, como "WinRar" ou "7-zip" em um novo diretório onde a análise será conduzida.
2. Instale os aplicativos de software de pré-requisito (miRanda, RNAhybrid, Pybedtools e samtools) antes de realizar a análise circRNA-miRNA.
3. Genomas de referência e arquivos de anotação para vários organismos de interesse, arquivo de coordenadas de rRNA, arquivo de interação de miRNA validado e arquivos circBase circRNA são fornecidos pelo autor do Circr na página do Github (https://github.com/bicciatolab/Circr)³⁷. Ao clicar nos arquivos de suporte na pasta da unidade, selecione a pasta do organismo de interesse, a pasta miRNA e o arquivo de texto circBase e faça o download.
4. Depois de baixar os arquivos necessários na etapa 4.1.3, crie um novo diretório chamado support_files no diretório mencionado na etapa 4.1.1. Em seguida, descompacte e extraia o conteúdo no diretório support_files .
5. Indexar o arquivo genômico de referência do organismo de interesse usando o comando samtools faidx (Arquivo Suplementar 1).
6. Prepare um arquivo de entrada que consista nas coordenadas dos circRNAs DE de interesse em um arquivo BED delimitado por tabulações, conforme mostrado na Tabela 2.
  NOTA: Como os circRNAs previstos pelo CIRIquant não são baseados em 0, é necessário menos 1 pb na coordenada inicial (conforme mencionado na etapa 3.1.1) antes de convertê-los para o formato BED. Os cabeçalhos mostrados na Tabela 2 são apenas para referência e não são necessários nos arquivos BED.
7. Neste ponto, verifique se a estrutura de árvore de pastas esperada para a análise do Circr é como na Figura 2.
Executando Circr.py
1. Execute Circr.py usando Python 3 e, como argumentos, especifique o arquivo de entrada circRNA, o genoma FASTA do organismo de interesse, a versão do genoma do organismo selecionado, o número de threads e o nome do arquivo de saída na linha de comando.
2. Se o organismo de interesse não for fornecido na pasta da unidade listada na etapa 4.1.3 ou se o usuário preferir ter um conjunto personalizado de arquivos para executar a análise, comandos adicionais especificando o local desses arquivos precisam ser incluídos ao executar Circr.py.
3. Após a conclusão da análise do Circr, o programa emite um arquivo de interação circRNA-miRNA no formato csv.
4. Filtrar os resultados da interação circRNA-miRNA de acordo com a preferência específica do usuário. Para este estudo, as previsões são filtradas usando o Rstudio de acordo com os critérios abaixo:
  -Detectado por todas as três ferramentas de software
  -Dois ou mais sites de ligação reportados pelo Targetscan e pelo miRanda
  -Identificado nas colunas "AGO" ou "validado"
  -Filtre nenhuma interação da região da semente
5. Escreva os circRNAs que passam as condições filtradas da etapa 4.2.3 em um novo arquivo de texto chamado circRNA_miRNA.txt. Essa filtragem pode aumentar a confiança das interações previstas.

5. Construção da rede de ceRNA

NOTA: Um manual detalhado sobre como usar o Cytoscape pode ser encontrado em: http://manual.cytoscape.org/en/stable/ e https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

Download e preparação
1. Baixe a última versão do Cytoscape³⁸ em: https://cytoscape.org/download.html.
2. Execute o assistente do instalador baixado na etapa 5.1.1 e selecione o local do arquivo para o software Cytoscape.
3. Prepare um arquivo delimitado por tabulações contendo os circRNAs de interesse e seus miRNAs alvo. A primeira coluna consiste no nome circRNA; a segunda coluna especifica o tipo de ARN da primeira coluna; a terceira coluna é o miRNA alvo; e a quarta coluna especifica o tipo de RNA da terceira coluna. Um exemplo do arquivo é mostrado na Tabela 3.
Construindo o mapa da rede ceRNA
1. Abra o software Cytoscape instalado na etapa 5.1.2.
2. No Cytoscape, navegue até Arquivo > Importar > rede do arquivo. Selecione o arquivo que foi preparado na etapa 5.1.3.
3. Na nova guia, selecione a primeira e a segunda coluna como "Nó de origem" e "Atributo do nó de origem", enquanto selecione a terceira e a quarta coluna como "Nó de destino" e "Atributo de nó de destino", respectivamente. Clique em OK e a rede aparecerá no lado superior direito do Cytoscape.
4. Para alterar o estilo visual da rede, pressione o botão Estilo no lado esquerdo do Cytoscape.
5. Pressione a seta no lado direito de Cor de preenchimento. Escolha Tipo para a coluna e Mapeamento discreto para o tipo de mapeamento. Em seguida, selecione a cor desejada para cada um dos tipos de RNA.
6. Depois de alterar a cor, altere a forma dos nós navegando até Forma e seguindo a etapa 5.2.5.

6. Análise do enriquecimento funcional

Análise de Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG) para o gene parental dos circRNAs
1. Certifique-se do clusterProfiler ^39,40 e org. Hs.eg.db⁴¹ pacotes foram instalados no Rstudio. A organização. Hs.eg.db^{pacote 41} é um pacote de anotação de genoma apenas para humanos. Se o organismo de interesse for outra espécie, consulte: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
2. Importe as informações DE_circRNA da etapa 2.3.1 para o espaço de trabalho do Rstudio.
3. Use o gene parental dos circRNAs fornecidos neste arquivo para análise de enriquecimento nas próximas etapas. No entanto, se o usuário deseja converter o símbolo do gene para outros formatos, como o ID de Entrez, use uma função como "bitr".
4. Usando o ID do gene como entrada, execute a análise de enriquecimento GO usando a função enrichGO dentro do pacote clusterProfiler^39,40 usando parâmetros padrão.
5. Usando o ID do gene como entrada, execute a análise de enriquecimento KEGG usando a função enrichKEGG dentro do pacote clusterProfiler^39,40 usando os parâmetros padrão.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

O protocolo alistado na seção anterior foi modificado e configurado para se adequar ao sistema operacional Linux. A principal razão é que a maioria das bibliotecas de módulos e pacotes envolvidos na análise de circRNAs só podem funcionar na plataforma Linux. Nesta análise, conjuntos de dados da biblioteca RNA-seq depletada de RNA-seq de RNA ribossomal não identificados, preparados a partir de células de macrófagos humanos infectadas pelo vírus Influenza A, foram baixados do banco de dados GEO⁴² e usados para gerar os resultados representativos.

Predição e quantificação de circRNA
Nesta análise, conjuntos de dados da biblioteca RNA-seq depletada de RNA-rRNA ribossomal preparados a partir de células de macrófagos humanos infectadas pelo vírus Influenza A foram usados para realizar a detecção de circRNA e análise funcional. Conforme especificado na seção de protocolo, CIRIquant foi usado para identificar e realizar a análise de DE de circRNAs identificados usando os conjuntos de dados da biblioteca RNA-seq como entrada. Os arquivos de referência usados são baseados na versão mais recente do genoma humano (hg38). A Tabela 4 mostra um exemplo do resultado final da análise CIRIquant. A identificação e filtragem dos circRNAs DE da saída do CIRIquant foram executadas através de scripts RStudio simples (Arquivo Suplementar 1). Os circRNAs só são classificados como DE quando o valor da taxa de falsa-descoberta (FDR) é <0,05 e a mudança de dobra logarítmica (LogFC) >|2|. A Tabela 5 mostra o número total de circRNAs e circRNAs DE detectados. Um total de 35.846 circRNAs foram detectados, sendo 306 DE. Os circRNAs DE detectados nesta saída são inteiramente upregulated (LogFC > 2), e nenhum downregulated (LogFC < 2).

Anotação e caracterização de circRNAs DE
Status de anotação de circRNAs DE
Os circRNAs DE identificados foram cruzados com um banco de dados de circRNA estabelecido, circBase. No entanto, como as coordenadas de circRNA depositadas no circBase são baseadas em uma versão anterior do genoma humano (hg19), as coordenadas de circRNA do circBase devem ser convertidas para a versão atual do genoma humano (hg38) para verificação cruzada neste estudo. Além disso, a coordenada inicial deve ser convertida em 0-based a partir da saída baseada em 1 do CIRIquant. As coordenadas circRNA convertidas na versão hg38 do circBase são fornecidas em uma pasta de unidade no Github (https://github.com/bicciatolab/Circr)³⁷. Em seguida, os scripts Rstudio (Arquivo Suplementar 1) foram usados para atribuir o status de anotação de circRNAs em uma nova coluna de quadro de dados. A Tabela 6 mostra um exemplo de circRNAs com o status de anotação.

Caracterização de circRNAs DE
Esta parte foi inteiramente executada através de scripts R no software RStudio. Os scripts R facilitam os processos analíticos, e apenas o conhecimento básico é necessário.

Tipos de circRNA
Nesta etapa, os circRNAs DE foram caracterizados por seus tipos de circRNA (Antisense, Exonic, Intergênico e Intronic) com base em suas posições genômicas. A Tabela 7 abaixo mostra a decomposição percentual dos diferentes tipos de circRNA englobados pelos circRNAs DE identificados. Do total de 306 circRNAs DE, 263 circRNAs (85,95%) foram identificados como circRNAs exônicos, que é o tipo de circRNA mais abundante identificado. Os circRNAs intrônicos aparecem como o segundo tipo de circRNA mais identificado, compreendendo 17 circRNAs DE, perfazendo até 5,56% do total de circRNAs DE. Isto é seguido por circRNAs intergênicos (16 circRNAs DE ~5,23%) e circRNAs antisenso (10 circRNAs DE ~3,27%).

Número de genes por circRNA
Os circRNAs identificados pelo CIRIquant podem sobrepor-se a vários genes. Até o momento, a maioria dos estudos está focada em circRNAs que abrangem um gene. Assim, neste protocolo, os candidatos a circRNA abrangendo mais de um gene são excluídos da análise a jusante. A Tabela 8 abaixo descreve o número e a porcentagem de circRNAs DE abrangendo um e mais de um gene. Nesta tabela, os circRNAs intergênicos (16 circRNAs DE) são excluídos por não se sobreporem a nenhum gene hospedeiro, enquanto os demais tipos de circRNA (290 circRNAs DE) são submetidos a essa análise. Dos 290 circRNAs DE, a maioria dos circRNAs DE (261 circRNAs ~90%) abrangem apenas um gene, enquanto os 29 circRNAs restantes (~10%) abrangem mais de um gene.

Construção da rede de ceRNA
Uma rede de ceRNA é geralmente desenhada para visualizar as interações circRNA-miRNA depois de prevista. Na Figura 3 abaixo, apenas um circRNA DE foi escolhido como resultado representativo, que é o circRNA hsa_DE_58. Com base nas previsões do Circr, hsa_DE_58 pode esponjar até nove miRNAs diferentes. Estes nove miRNAs são identificados após filtragem através de critérios rigorosos.

Análise de enriquecimento funcional
Análise GO e KEGG dos genes parentais do circRNA
A Figura 4 abaixo mostra um gráfico de bolhas do enriquecimento funcional de genes parentais do circRNA DE através da análise GO. Fundamentalmente, a análise de GO visa desvendar os processos biológicos, localizações celulares e funções moleculares que são enriquecidos ou impactados na condição estudada, no caso, a amostra infectada pelo vírus. O enriquecimento é considerado estatisticamente significativo e plotado no gráfico de bolhas somente se o valor de p for < 0,01. Como mostrado na Figura 4, os três principais enriquecimentos para os processos biológicos (PB) incluem a biogênese do complexo ribonucleoproteico, a resposta ao vírus e a regulação da resposta a um estímulo biótico, enquanto para as funções moleculares (MF) apenas a atividade catalítica atuando no RNA e a ligação do RNA de fita simples são estatisticamente enriquecidas. Por outro lado, apenas o complexo retromérico é estatisticamente enriquecido para os componentes celulares (CC).

A Figura 5 mostra a análise de enriquecimento de KEGG dos genes parentais do circRNA DE em um gráfico de bolhas. Semelhante à análise de enriquecimento GO, o enriquecimento de KEGG só é considerado estatisticamente significativo e plotado em um gráfico de bolhas se o valor de p for < 0,01. Apenas dois termos KEGG foram enriquecidos neste caso, que são as vias Influenza A e ciclo de vida viral (HIV-1).

Figura 1: Pipeline para predição e caracterização funcional de circRNAs. O pipeline mostra uma visão geral simples das principais etapas do início ao fim, envolvendo a instalação dos pacotes de software necessários, prevendo e quantificando a expressão de circRNA, a construção da rede de ceRNA e a realização do enriquecimento funcional do gene parental de circRNA. Clique aqui para ver uma versão maior desta figura.

Figura 2: Estrutura da árvore de pastas do Circr. Essa estrutura de árvore de pastas precisa ser estabelecida antes da execução do software Circr para detectar os arquivos necessários para a análise. Clique aqui para ver uma versão maior desta figura.

Figura 3: Rede de ceRNA constituída pela interação circRNA-miRNA. A forma oval azul representa o circRNA, enquanto os triângulos laranjas representam os miRNAs. As linhas sólidas que ligam o circRNA aos miRNAs descrevem a potencial função de esponja de miRNA do circRNA hsa_DE_58. Clique aqui para ver uma versão maior desta figura.

Figura 4: Gráfico de bolhas da análise de enriquecimento de GO de genes parentais de circRNA DE. GeneRatio no eixo x é o número de genes na lista de entrada associada ao termo GO dado dividindo o número total de genes de entrada. O tamanho do ponto no gráfico é representado pelo valor de contagem, que é o número de genes na lista de entrada associados ao termo GO dado. Quanto maior o tamanho dos pontos, maior o número de genes de entrada associados ao termo. Além disso, os pontos no gráfico são codificados por cores com base no valor de p. O valor de p é calculado comparando-se a frequência observada de um termo de anotação com a frequência esperada ao acaso. Os termos individuais são considerados enriquecidos além de um valor de corte (p-valor < 0,01). O gradiente de cores do valor de p variando de azul a vermelho indica enriquecimento crescente dos termos. Clique aqui para ver uma versão maior desta figura.

Figura 5: Análise de enriquecimento de KEGG de genes parentais de circRNA DE. GeneRatio no eixo x é o número de genes na lista de entrada associada ao termo KEGG dado dividindo o número total de genes de entrada. O tamanho do ponto no gráfico é representado pelo valor de contagem, que é o número de genes na lista de entrada associados ao termo KEGG dado. Quanto maior o tamanho dos pontos, maior o número de genes de entrada associados ao termo. Além disso, os pontos no gráfico são codificados por cores com base no valor de p. O valor de p é calculado comparando-se a frequência observada de um termo de anotação com a frequência esperada ao acaso. Os termos individuais são considerados enriquecidos além de um valor de corte (p-valor < 0,01). O gradiente de cores do valor de p variando de azul a vermelho indica enriquecimento crescente dos termos. Clique aqui para ver uma versão maior desta figura.

Nome do exemplo	Caminho para o arquivo GTF de saída CIRIquant	Agrupamento
Controle 1	/caminho/para/CIRIquant/ctrl1.gtf	C
Controle 2	/caminho/para/CIRIquant/ctrl2.gtf	C
Infectado 1	/caminho/para/CIRIquant/infect1.gtf	T
Infectados 2	/caminho/para/CIRIquant/infect2.gtf	T

Tabela 1: A preparação do arquivo .lst do CIRIquant. Os caminhos de destino das amostras de controle e tratadas da saída CIRIquant são gravados em um arquivo de texto para comparar as expressões de circRNA entre os dois tipos de amostras.

Chr	Começar	Fim	Nome	.	Praia
chr2	137428930	137433876	hsa_circ_000076	.	-
chr2	154705868	154706632	hsa_circ_000105	.	-
chr2	159104273	159106793	hsa_circ_000118	.	-
chr2	159215701	159226125	hsa_circ_000119	.	-
chr4	39980067	39980129	hsa_circ_002584	.	-

Tabela 2: Exemplo de arquivo BED para Circr. Seis colunas (Chr, Start, End, Name, Gene e Strand) associadas aos circRNAs são necessárias para gerar o arquivo BED.

circRNA_name	Tipo	miRNA_name	Tipo
DE_circRNA_1	circRNA	miR-001	Mirna
DE_circRNA_1	circRNA	miR-002	Mirna
DE_circRNA_2	circRNA	miR-003	Mirna
DE_circRNA_2	circRNA	miR-004	Mirna

Tabela 3: Arquivo de entrada do Cytoscape. Quatro colunas (circRNA_name, Tipo, miRNA_name e Tipo) são necessárias para serem gravadas em um arquivo de texto.

CircRNA	logFC	logCPM	LR	Valor de p	DE	FDR
chr4:17595410\|17598558	8.167934481	-0.039318634	185.5341965	3.00E-42	1	1,08E-37
chr16:18834892\|18850467	-3.955083482	-4.397235736	2.982607619	0.08416358	0	0.282478158
chr14:73198031\|73211942	2.493964729	-4.448176684	2.736442046	0.09808293	0	0.282478158

Tabela 4: Parte do arquivo de saída final (.csv) do CIRIquant. O CIRIquant fornece informações como o LogFC, contagens de log por milhão (LogCPM), regressão logística (LR), valor de p, expressão diferencial e FDR.

Resultados do CIRIquant
Total	DE	Em cima	Abaixo
35846	306	306	0

Tabela 5: Resumo do número de circRNAs totais e diferencialmente expressos (DE) identificados. Um total de 35.846 circRNAs são detectados, sendo 306 circRNAs DE. Todos os 306 circRNAs DE são upregulated (sem nenhum ser downregulated) nas amostras tratadas quando comparadas às amostras controle.

Custom_Name	Annotation_Status
hsa_DE_22	Não Anotado
hsa_DE_2	Anotado
hsa_DE_58	Não Anotado
hsa_DE_3	Anotado

Tabela 6: Tabela de nomes de circRNA personalizados com status de anotação. Os circRNAs são consultados em um banco de dados de circRNAs depositados conhecidos (circBase). Se o circRNA está presente no banco de dados, ele é marcado para ser anotado, enquanto a ausência do circRNA é rotulada como não anotada.

Tipo de CircRNA	Freq	Porcentagem
antisenso	10	3.27%
exão	263	85.95%
intergênico	16	5.23%
íntron	17	5.56%

Tabela 7: Tipos de circRNAs identificados. Os circRNAs podem ser categorizados em diferentes tipos de circRNAs com base em sua região de sequência, a saber, exônica, intrônica, antisenso e intergênica.

Número de Genes Parentais	Freq	Porcentagem
1	261	90%
> 1	29	10%

Tabela 8: Porcentagem de circRNAs com o número diferente de genes abrangidos. CircRNAs são comumente codificados a partir de exons de um gene, mas circRNAs abrangendo mais de um gene também podem ser detectados pelo CIRIquant.

Arquivo Suplementar 1: Scripts usados no protocolo. Clique aqui para baixar este arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Para ilustrar a utilidade deste protocolo, RNA-seq de células de macrófagos humanos infectadas pelo vírus influenza A foi usado como exemplo. CircRNAs funcionando como potenciais esponjas de miRNA em interações patógeno-hospedeiro e seu enriquecimento funcional GO e KEGG dentro de um hospedeiro foram investigados. Embora haja uma variedade de ferramentas circRNA disponíveis on-line, cada uma delas é um pacote autônomo que não interage entre si. Aqui, reunimos algumas das ferramentas necessárias para predição e quantificação de circRNA, enriquecimento funcional de circRNA, predição da interação circRNA-miRNA e construção de redes de ceRNA. Este protocolo simplificado economiza tempo e pode ser aplicado a amostras clínicas para detectar candidatos a circRNA com valores diagnósticos e prognósticos.

Essencialmente, empregamos o CIRIquant³¹, uma ferramenta de quantificação de circRNA pré-empacotada com CIRI2, que pode detectar e realizar análises de DE de circRNAs. Os circRNAs DE são filtrados com base em um valor de corte de LogFC > |2| e FDR < 0,05, que ajuda a eliminar potenciais falsos positivos em análises a jusante. A caracterização dos circRNAs DE em termos de status de anotação, tipos de circRNA e número de genes utilizados auxilia na categorização e posterior filtragem de candidatos a circRNA. Posteriormente, o Circr³⁷, uma ferramenta de predição de circRNA-miRNA, é usado para prever potenciais candidatos a esponja de miRNA. Depois de prever potenciais miRNAs como alvos de circRNAs, uma rede de ceRNA é desenhada. Finalmente, com base nos genes parentais de circRNAs, o pacote R clusterProfiler³⁹ é usado para anotação funcional através da análise de enriquecimento das vias GO e KEGG. Os resultados de GO e KEGG podem ajudar a desvendar os mecanismos biológicos influenciados pelos circRNAs.

Até o momento, várias ferramentas diferentes de predição de circRNA foram desenvolvidas, incluindo CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 e UROBORUS ⁴⁷. Em um estudo conduzido por Hansen et al., CIRI2 é relatado para ter um alto desempenho global. Está entre as poucas ferramentas de detecção de circRNA que podem funcionar bem em termos de predição de novo e redução da identificação de falsos positivos⁴⁸. O CIRIquant, que utiliza o CIRI2 para detecção e quantificação de circRNA, foi utilizado neste estudo. O CIRIquant foi utilizado para contar as leituras da junção de emenda posterior (BSJ), e os dados de contagem foram normalizados para as leituras mapeadas para cognato de RNAs lineares transcritos dos mesmos loci gênicos. Isso permite a quantificação de circRNAs em uma amostra. Para determinar a expressão diferencial de circRNAs através das condições experimentais, o CIRIquant implementou um modelo linear generalizado na borda⁴⁹ para análise de DE, e o teste de razão de taxa exata foi usado como um teste estatístico para determinar a significância da diferença na razão de junção do circRNA. Embora outras ferramentas de quantificação de circRNA, como o CIRCexplorer3-CLEAR⁵⁰, possam ser usadas para quantificar o nível de expressão de circRNAs, essa ferramenta só permite a quantificação de circRNA em uma amostra, pois conta as leituras BSJ em uma amostra e normaliza os dados de contagem contra as contagens de RNA linear cognato da mesma amostra. O CIRCexplorer3-CLEAR não pode comparar as expressões de circRNA em condições experimentais. Além disso, nenhuma ferramenta de análise estatística é implementada no CIRCexplorer3-CLEAR para suportar o nível de expressão quantificada. Embora a ferramenta padrão de predição de circRNA implementada no CIRIquant seja o CIRI2, os resultados de predição de outras ferramentas como find_circ e CIRCexplorer2 também podem ser utilizados para a quantificação e análise de DE³¹. Neste protocolo, apenas uma ferramenta de predição de circRNA (CIRI2) foi usada para predição, o que ainda pode produzir candidatos de circRNA falso-positivos. Para reduzir os falsos positivos, pode-se combinar outras ferramentas de predição de circRNA para análise e selecionar circRNAs comuns detectados entre as diferentes ferramentas de predição de circRNA^48,51. Para melhorar ainda mais a detecção de circRNA, é ideal usar conjuntos de dados de sequenciamento de RNA que são ambos esgotados de rRNA e submetidos ao pré-tratamento de RNase R.

Dependendo do objetivo do estudo, circRNAs de novo e DE anotados podem ser identificados separadamente com base no banco de dados circBase⁵². No entanto, circRNAs abrangendo mais de um gene geralmente requerem exame manual no UCSC ou em qualquer outro navegador do genoma para determinar a autenticidade dos circRNAs e eliminar falsos positivos. No entanto, circRNAs que abrangem mais de um gene, como circRNAs derivados de genes de fusão, também foram relatados^{recentemente53,54}.

Circr funciona combinando três algoritmos diferentes de previsão de miRNA-mRNA, a saber, TargetScan⁵⁵, miRanda 56 e RNAhybrid⁵⁷ para prever os sítios de ligação circRNA-miRNA. Além disso, o algoritmo também incorpora informações de picos de AGO e interações previamente validadas na análise circRNA-miRNA. Aqui, critérios rigorosos de filtragem foram aplicados para permitir uma predição mais confiável de circRNA-miRNA, reduzindo ainda mais os falsos positivos. No entanto, o rigor dessa etapa de filtragem pode ser definido para mais ou para menos, dependendo da preferência do usuário.

ClusterProfiler é um pacote R bem documentado que pode anotar funcionalmente conjuntos de genes em diversos organismos. Além das funções dentro do pacote R clusterProfiler mencionadas neste protocolo (enrichGO e enrichKEGG), que utilizam análise de sobre-representação, existem também outras funções como gseGO e gseKEGG que podem ser usadas. Se clusterProfiler não é uma escolha adequada para o fluxo de trabalho, existem também outras ferramentas e pacotes, como o "AllEnricher"⁵⁸ ou as ferramentas baseadas em sites, como o "Metascape"⁵⁹, que podem anotar funcionalmente um conjunto de genes. Por fim, embora o pipeline fornecido acima ajude a prever potenciais circRNAs e suas anotações funcionais, a verificação em laboratório úmido será necessária para fornecer evidências sólidas.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada a revelar.

Acknowledgments

O autor gostaria de agradecer a Tan Ke En e ao Dr. Cameron Bracken pela revisão crítica deste manuscrito. Este trabalho foi apoiado por bolsas do Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name	Company	Catalog Number	Comments
Bedtools	GitHub	https://github.com/arq5x/bedtools2/	Referring to section 4.1.2. Needed for Circr.
BWA	Burrows-Wheeler Aligner	http://bio-bwa.sourceforge.net/	Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr	GitHub	https://github.com/bicciatolab/Circr	Referring to section 4. Use to predict the miRNA binding sites
CIRIquant	GitHub	https://github.com/bioinfo-biols/CIRIquant	Referring to section 2.1.3. To predict circRNAs
Clusterprofiler	GitHub	https://github.com/YuLab-SMU/clusterProfiler	Referring to section 7. For GO and KEGG functional enrichment
CPU	Intel	Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)	Specifications used to run this entire protocol.
Cytoscape	Cytoscape	https://cytoscape.org/download.html	Referring to section 5.2. Needed to plot ceRNA network
FastQC	Babraham Bioinformatics	https://www.bioinformatics.babraham.ac.uk/projects/fastqc/	Referring to section 1.2.1. Quality checking on Fastq files
HISAT2		http://daehwankimlab.github.io/hisat2/	Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux	Ubuntu 20.04.5 LTS (Focal Fossa)	https://releases.ubuntu.com/focal/	Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda		http://www.microrna.org/microrna/getDownloads.do	Referring to section 4.1.2. Needed for Circr
Pybedtools	pybedtools 0.8.2	https://pypi.org/project/pybedtools/	Needed for BED file genomic manipulation
Python	Python 2.7 and 3.6 or abover	https://www.python.org/downloads/	To run necessary library modules
R	The Comprehensive R Archive Network	https://cran.r-project.org/	To manipulate dataframes
RNAhybrid	BiBiServ	https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid	Referring to section 4.1.2. Needed for Circr
RStudio	RStudio	https://www.rstudio.com/	A workspace to run R
samtools	SAMtools	http://www.htslib.org/	Referring to section 2.1.2. Needed to run CIRIquant
StringTie	Johns Hopkins University: Center for Computational Biology	http://ccb.jhu.edu/software/stringtie/index.shtml	Referring to section 2.1.2. Needed to run CIRIquant
TargetScan	GitHub	https://github.com/nsoranzo/targetscan	Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Biology

Em Silico Identificação e caracterização de circRNAs durante interações patógeno-hospedeiro

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.