Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

In Silico Identificatie en karakterisering van circRNA's tijdens gastheer-pathogeen interacties

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Het hier ingediende protocol verklaart de volledige in silico-pijplijn die nodig is om circRNA's te voorspellen en functioneel te karakteriseren uit RNA-sequencing transcriptoomgegevens die gastheer-pathogeeninteracties bestuderen.

Abstract

Circulaire RNA's (circRNA's) zijn een klasse van niet-coderende RNA's die worden gevormd via back-splicing. Deze circRNA's worden voornamelijk bestudeerd voor hun rol als regulatoren van verschillende biologische processen. Met name opkomend bewijs toont aan dat gastheer circRNA's differentieel tot expressie kunnen worden gebracht (DE) bij infectie met pathogenen (bijv. Influenza en coronavirussen), wat een rol suggereert voor circRNA's bij het reguleren van aangeboren immuunresponsen van de gastheer. Onderzoek naar de rol van circRNA's tijdens pathogene infecties wordt echter beperkt door de kennis en vaardigheden die nodig zijn om de noodzakelijke bioinformatische analyse uit te voeren om DE-circRNA's te identificeren uit RNA-sequencing (RNA-seq) -gegevens. Bioinformatica voorspelling en identificatie van circRNA's is cruciaal voor elke verificatie, en functionele studies met behulp van kostbare en tijdrovende wet-lab technieken. Om dit probleem op te lossen, wordt in dit manuscript een stapsgewijs protocol van in silico-voorspelling en karakterisering van circRNA's met behulp van RNA-seq-gegevens verstrekt. Het protocol kan worden onderverdeeld in vier stappen: 1) Voorspelling en kwantificering van DE-circRNA's via de CIRIquant-pijplijn; 2) Annotatie via circBase en karakterisering van DE circRNA's; 3) CircRNA-miRNA interactie voorspelling via Circr pijplijn; 4) functionele verrijkingsanalyse van circRNA-oudergenen met behulp van Gene Ontology (GO) en Kyoto Encyclopedia of Genes and Genomes (KEGG). Deze pijplijn zal nuttig zijn bij het stimuleren van toekomstig in vitro en in vivo onderzoek om de rol van circRNA's in gastheer-pathogeen interacties verder te ontrafelen.

Introduction

Gastheer-pathogeen interacties vertegenwoordigen een complex samenspel tussen de pathogenen en gastheerorganismen, dat de aangeboren immuunresponsen van de gastheren veroorzaakt die uiteindelijk resulteren in de verwijdering van binnendringende pathogenen 1,2. Tijdens pathogene infecties wordt een groot aantal immuungenen van de gastheer gereguleerd om de replicatie en afgifte van pathogenen te remmen. Gemeenschappelijke interferon-gestimuleerde genen (ISG's) gereguleerd op pathogene infecties omvatten bijvoorbeeld ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I en OASL 3,4. Naast eiwitcoderende genen hebben studies ook gemeld dat niet-coderende RNA's zoals lange niet-coderende RNA's (lncRNA's), microRNA's (miRNA's) en circulaire RNA's (circRNA's) ook een rol spelen en gelijktijdig worden gereguleerd tijdens pathogene infecties 5,6,7. In tegenstelling tot eiwitcoderende genen die voornamelijk coderen voor eiwitten als functionele moleculen, is het bekend dat niet-coderende RNA's (ncRNA's) functioneren als regulatoren van genen op transcriptionele en post-transcriptionele niveaus. Studies met de deelname van niet-coderende RNA's, met name circRNA's, bij het reguleren van de immuungenen van de gastheren zijn echter niet goed gerapporteerd in vergelijking met de eiwitcoderende genen.

CircRNA's worden op grote schaal gekenmerkt door hun covalent gesloten continue lusstructuur, die wordt gegenereerd door een niet-canoniek splicingproces dat back-splicing8 wordt genoemd. Het proces van back-splicing, in tegenstelling tot het splicingproces van verwante lineaire RNA's, omvat de ligatie van de downstream donorplaats naar de upstream acceptorplaats, waardoor een cirkelvormige structuur wordt gevormd. Momenteel zijn drie verschillende back-splicing mechanismen voor de biogenese van circRNA's voorgesteld. Dit zijn RNA binding protein (RBP) gemedieerde circularisatie9,10, intron-pairing-gedreven circularisatie 11 en lariat-gedreven circularisatie12,13,14. Aangezien circRNA's end-to-end verbonden zijn in een cirkelvormige structuur, hebben ze de neiging om van nature resistent te zijn tegen normale exonuclease-verteringen en worden ze daarom als stabieler beschouwd dan hun lineaire tegenhangers15. Een ander gemeenschappelijk kenmerk van circRNA's omvat de cel- of weefseltypespecifieke expressie in gastheren16.

Zoals geïmpliceerd door hun unieke structuur en cel- of weefselspecifieke expressie, is ontdekt dat circRNA's belangrijke biologische functies in cellen spelen. Tot op heden is een van de prominente functies van circRNA's hun rol als microRNA (miRNA) sponzen17,18. Deze regulerende rol van circRNA's vindt plaats door de complementaire binding van circRNA-nucleotiden met het zaadgebied van miRNA's. Een dergelijke circRNA-miRNA-interactie remt de normale regulerende functies van de miRNA's op doel-mRNA's, waardoor de expressie van genenwordt gereguleerd 19,20. Bovendien is ook bekend dat circRNA's genexpressie reguleren door interactie met RNA-bindende eiwitten (RBP's) en het vormen van RNA-eiwitcomplexen21. Hoewel circRNA's worden geclassificeerd als niet-coderende RNA's, zijn er ook aanwijzingen dat circRNA's kunnen fungeren als sjablonen voor eiwittranslatie22,23,24.

Onlangs is aangetoond dat circRNA's een cruciale rol spelen bij het reguleren van de gastheer-pathogeen interacties, met name tussen de gastheren en virussen. Over het algemeen wordt aangenomen dat gastheercircRNA's helpen bij het reguleren van de immuunresponsen van de gastheer om de binnendringende pathogenen te elimineren. Een voorbeeld van circRNA dat immuunresponsen van de gastheer bevordert, is circRNA_0082633, gerapporteerd door Guo et al.25. Dit circRNA verbetert type I interferon (IFN) signalering in A549-cellen, wat helpt om influenzavirusreplicatiete onderdrukken 25. Bovendien rapporteerden Qu et al. ook een humaan intronisch circRNA, circRNA AIVR genaamd, dat de immuniteit bevordert door de expressie van CREB-bindend eiwit (CREBBP), een signaaltransducer van IFN-β26,27, te reguleren. Er bestaan echter ook circRNA's waarvan bekend is dat ze de pathogenese van ziekte bij infectie bevorderen. Yu et al. rapporteerden bijvoorbeeld onlangs de rol die een circRNA uit het GATA-zinkvingerdomein met het 2A-gen (circGATAD2A) speelt bij het bevorderen van de replicatie van het H1N1-virus door de remming van autofagie van de gastheercel28.

Om circRNA's effectief te bestuderen, wordt meestal een genoombreed circRNA-voorspellingsalgoritme geïmplementeerd, gevolgd door een in silico-karakterisering van de voorspelde circRNA-kandidaten voordat functionele studies kunnen worden uitgevoerd. Een dergelijke bioinformatica-benadering om circRNA's te voorspellen en te karakteriseren is minder kostbaar en tijdsefficiënter. Het helpt om het aantal kandidaten dat functioneel moet worden bestudeerd te verfijnen en kan mogelijk leiden tot nieuwe bevindingen. Hier bieden we een gedetailleerd op bioinformatica gebaseerd protocol voor de in silico-identificatie , karakterisering en functionele annotatie van circRNA's tijdens de gastheer-pathogeen interacties. Het protocol omvat de identificatie en kwantificering van circRNA's uit RNA-sequencing datasets, annotatie via circBase en de karakterisering van de circRNA-kandidaten in termen van circRNA-typen, aantal overlappende genen en voorspelde circRNA-miRNA-interacties. Deze studie biedt ook de functionele annotatie van de circRNA-oudergenen via Gene Ontology (GO) en de Kyoto Encyclopedia of Genes and Genomes (KEGG) verrijkingsanalyse.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

In dit protocol werden gedeïdentificeerde ribosomale RNA (rRNA)-uitgeputte RNA-seq bibliotheek datasets bereid uit de influenza A virus-geïnfecteerde menselijke macrofaagcellen gedownload en gebruikt uit de Gene Expression Omnibus (GEO) database. De volledige bioinformatica-pijplijn van voorspelling tot functionele karakterisering van circRNA's is samengevat in figuur 1. Elk deel van de pijplijn wordt verder uitgelegd in de onderstaande secties.

1. Voorbereiding, download en setup vóór gegevensanalyse

OPMERKING: Alle softwarepakketten die in dit onderzoek worden gebruikt, zijn gratis en open-source.

  1. De vereiste tools downloaden op het Linux-platform
    1. Download en installeer de vereiste software en hulpprogramma's die worden vermeld in de materiaaltabel op een krachtige Linux-computer aan de hand van de instructies van de ontwikkelaar.
      OPMERKING: De meeste tools en software hebben hun eigen online GitHub-pagina's of documentatie met instructies voor het installeren en gebruiken van hun tools (raadpleeg de Materiaaltabel).
    2. Download de gewenste RNA-seq datasets voor circRNA detectie en analyse van sequence archive websites (bijv. European Nucleotides Archive en Gene Expression Omnibus).
    3. Download de referentiegenoom(s) (FASTA-indeling) en annotatiebestanden (GTF/GFF3-indeling), compatibel met de host waaruit de RNA-seq-dataset is samengesteld. Hostreferentiegenoom (en) en annotatiebestanden zijn meestal te vinden op online genoombrowsers zoals het National Center for Biotechnology Information (NCBI), de University of California Santa Cruz (UCSC) en de Ensembl-websites.
  2. Kwaliteitscontrole van RNA-seq
    1. Voer de FASTQ-bestanden in het FASTQC-programma in om de kwaliteit van RNA-sequenties te bepalen. Als de kwaliteit van de FASTQ-bestanden laag is (bijv. 29,30.

2. Voorspelling en differentiële expressieanalyse van circRNA's met behulp van CIRIquant

OPMERKING: Een meer gedetailleerde handleiding voor het installeren en uitvoeren van differentiële expressieanalyse is te vinden in de sectie codebeschikbaarheid van het CIRIquant-artikel31. De aanvullende gegevens omvatten ook enkele van de basiscommando's die in dit protocol worden gebruikt.

  1. CircRNA voorspellingen
    1. Indexeer eerst het referentiegenoom van de gastheer met behulp van BWA- en HISAT2-aligners. Voer vervolgens op een Linux-terminal de opdrachten bwa index 32 en hisat2-build33 uit in de map van het referentiegenoom van de host om het te indexeren.
    2. Bereid vervolgens een YML-configuratiebestand voor met de naam van het bestand, het pad van tools (BWA, HISAT2, stringtie34, samtools35), het pad naar de gedownloade referentiebestanden (FASTA-bestanden van het referentiegenoom van de host, annotatiebestanden) en het pad naar de indexbestanden uit stap 2.1.1.
    3. Voer de CIRIquant-tool uit vanaf de terminal met behulp van de standaard- of handmatige parameters. De gebruiker kan het bibliotheektype (gestrand of niet-gestrand) van de RNA-seq-gegevens opgeven bij het uitvoeren van de CIRIquant-tool.
      OPMERKING: Het bibliotheektype van de RNA-seq-gegevens kan worden bepaald door het type bibliotheekvoorbereidingskit te kennen dat wordt gebruikt. Als de identiteit van de bibliotheekvoorbereidingskit onbekend is, kan een RNA-seq-controlebio-informaticapakket genaamd RSeQC36 worden gebruikt om de gestrandheid van RNA-seq-gegevens te bepalen.
  2. Differentiële expressieanalyse
    OPMERKING: CIRIquant-pakket bevat prep_CIRIquant, prepDE.py en CIRI_DE_replicate; Daarom zijn er geen extra downloads nodig voor deze drie tools.
    1. Bereid een tekstbestand (.lst) voor met een lijst met gegevens die het volgende bevatten:
      1ekolom : ID's van de RNA-seq-gegevens die in stap 2.1.3 zijn gebruikt
      2e kolom: pad naar de GTF-bestanden die door CIRIquant zijn uitgevoerd
      3e kolom: groepering van de RNA-seq data, of het nu een controle of behandelde groep is.
    2. Zie tabel 1 hieronder voor een voorbeeld.
      OPMERKING: Het is niet nodig om de kopteksten in te voeren, omdat ze alleen ter referentie zijn.
    3. Voer op de Linux-terminal prep_CIRIquant uit met het tekstbestand (.lst) dat is voorbereid in stap 2.2.1 als invoer. De run genereert een lijst met bestanden: library_info.csv, circRNA_info.csv, circRNA_bsj.csv en circRNA_ratio.csv.
    4. Bereid een tweede tekstbestand voor met een lijst met gegevens die de RNA-seq-ID's en het pad naar hun respectieve StringTie-uitvoer bevatten. De bestandslay-out moet vergelijkbaar zijn met het tekstbestand in stap 2.2.1 zonder de kolom groeperen.
    5. Voer prepDE.py uit met het tekstbestand dat is voorbereid in stap 2.2.4 als invoer om de matrixbestanden voor het aantal genen te genereren.
    6. Voer CIRI_DE_replicate uit met de library_info.csv - en circRNA_bsj.csv-bestanden uit stap 2.2.3 en het gene_count_matrix.csv-bestand uit stap 2.2.5 als invoer om het uiteindelijke circRNA_de.tsv-bestand uit te voeren.
  3. Filteren van DE-circRNA's
    1. Gebruik R (in de computerterminal of RStudio) of een spreadsheetsoftware (bijvoorbeeld Microsoft Excel) om het circRNA_de.tsv-bestand te openen dat is gegenereerd uit stap 2.2.6 om het aantal differentieel uitgedrukte (DE) circRNA's te filteren en te bepalen.
    2. Filter de DE-circRNA's volgens de criteria LogFC > |2| en FDR < 0,05.
    3. Maak een bestand met de naam DE_circRNAs.txt om de informatie van DE-circRNA's op te slaan.

3. Karakterisering en annotatie van voorspelde DE-circRNA's

  1. Annotatiestatus van DE-circRNA's
    1. Laad het bestand met de naam DE_circRNAs.txt in RStudio , dat bestaat uit de lijst met DE-circRNA's die zijn gefilterd uit stap 2.3.3. Neem andere informatie op, zoals de genomische posities (Chr, Start, End), strengoriëntaties (+ of -), gennaam en circRNA-type. Voordat u verder gaat, converteert u de circRNA genomische startcoördinaten van CIRIquant naar 0-gebaseerd door 1 basenpaar af te trekken.
      OPMERKING: De andere hierboven vermelde informatie kan worden verkregen uit de GTF-bestanden die zijn uitgevoerd door CIRIquant (Aanvullend Bestand 1).
    2. Bepaal de annotatiestatus van de voorspelde DE-circRNA's door een bibliotheek te downloaden met de genomische posities van de circRNA-database (bijv. circBase) gedeponeerde circRNA's.
      OPMERKING: Zorg ervoor dat de genoomversie die wordt gebruikt om de circRNA's te voorspellen identiek is aan de circRNA-databasebibliotheek voordat u de vergelijking maakt. Het circBase-gegevensbestand dat hier wordt gebruikt, is vrij beschikbaar in de schijfmap in Github (https://github.com/bicciatolab/Circr)37.
    3. Zodra beide bestanden uit stap 3.1.1 en stap 3.1.2 zijn voorbereid, voert u het R-script uit dat wordt gegeven in Aanvullend bestand 1. Chromosomale locaties van DE-circRNA's worden opgevraagd bij de bibliotheek voordat de status Geannoteerd of Niet-geannoteerd wordt toegewezen.
  2. Karakterisering van DE-circRNA's
    1. Gebruik R en andere spreadsheetsoftware om het aantal circRNA's samen te vatten volgens de circRNA-typen (d.w.z. exon, intron, intergeen en antisense) en het aantal genen dat de circRNA's overspannen (1 of >1) (aanvullend bestand 1).OPMERKING: CIRIquant kan slechts vier soorten circRNA's detecteren (exon, intron, intergeen en antisense). Exon-intron circRNA's, ook bekend als ElciRNA's, kunnen niet worden gedetecteerd door CIRIquant.

4. Het voorspellen van de circRNA-miRNA interactie met behulp van Circr

OPMERKING: Een meer gedetailleerde handleiding over het installeren en gebruiken van Circr voor de circRNA-miRNA-interactieanalyse is te vinden op: https://github.com/bicciatolab/Circr37.

  1. Voorbereiding van dossiers
    1. Pak de inhoud van het Circr.zip-bestand uit en pak het uit nadat u het hebt gedownload van de Circr GitHub-pagina met behulp van de relevante software zoals "WinRar" of "7-zip" in een nieuwe map waar de analyse zal worden uitgevoerd.
    2. Installeer de vereiste softwaretoepassingen (miRanda, RNAhybrid, Pybedtools en samtools) voordat u de circRNA-miRNA-analyse uitvoert.
    3. Referentiegenomen en annotatiebestanden voor verschillende organismen van belang, rRNA-coördinatenbestand, gevalideerd miRNA-interactiebestand en circRNA-bestanden circRNA-bestanden worden geleverd door de Circr-auteur op de Github-pagina (https://github.com/bicciatolab/Circr)37. Nadat u op de ondersteuningsbestanden in de stationsmap hebt geklikt, selecteert u de map voor het gewenste organisme, de miRNA-map en het circBase-tekstbestand en downloadt u deze.
    4. Na het downloaden van de benodigde bestanden in stap 4.1.3, maakt u een nieuwe map met de naam support_files in de map die wordt vermeld in stap 4.1.1. Pak vervolgens de inhoud uit en pak deze uit in de map support_files .
    5. Indexeer het referentiegenoombestand van het organisme van belang met behulp van het samtools faidx-commando (aanvullend bestand 1).
    6. Bereid een invoerbestand voor dat bestaat uit de coördinaten van DE-circRNA's van belang in een door tabs gescheiden BED-bestand, zoals weergegeven in tabel 2.
      OPMERKING: Omdat circRNA's voorspeld door CIRIquant niet op 0 zijn gebaseerd, is het noodzakelijk om min 1 bp te zijn op de begincoördinaat (zoals vermeld in stap 3.1.1) voordat ze worden geconverteerd naar het BED-formaat. De headers in tabel 2 zijn slechts ter referentie en zijn niet nodig in de BED-bestanden.
    7. Zorg er op dit punt voor dat de verwachte mapstructuur voor Circr-analyse is zoals in figuur 2.
  2. Hardlopen Circr.py
    1. Voer Circr.py uit met Python 3 en geef als argumenten het circRNA-invoerbestand, het FASTA-genoom van het gewenste organisme, de genoomversie van het geselecteerde organisme, het aantal threads en de naam van het uitvoerbestand op de opdrachtregel op.
    2. Als het organisme van belang niet is opgenomen in de stationsmap die wordt vermeld in stap 4.1.3 of als de gebruiker liever een aangepaste set bestanden heeft om de analyse uit te voeren, moeten aanvullende opdrachten die de locatie van deze bestanden specificeren, worden opgenomen bij het uitvoeren van Circr.py.
    3. Nadat de Circr-analyse is voltooid, voert het programma een circRNA-miRNA-interactiebestand uit in het csv-formaat.
    4. Filter de circRNA-miRNA interactieresultaten op basis van de gebruikersspecifieke voorkeur. Voor deze studie worden de voorspellingen gefilterd met behulp van Rstudio volgens de onderstaande criteria:
      -Gedetecteerd door alle drie de softwaretools
      -Twee of meer bindingssites gerapporteerd door zowel Targetscan als miRanda
      -Geïdentificeerd in de kolommen "AGO" of "gevalideerd"
      -Filter geen interacties tussen zaadregio's uit
    5. Schrijf de circRNA's die de gefilterde voorwaarden uit stap 4.2.3 doorgeven naar een nieuw tekstbestand met de naam circRNA_miRNA.txt. Een dergelijke filtering kan het vertrouwen van de voorspelde interacties vergroten.

5. Aanleg van het ceRNA-netwerk

OPMERKING: Een gedetailleerde handleiding voor het gebruik van Cytoscape is te vinden op: http://manual.cytoscape.org/en/stable/ en https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Download en voorbereiding
    1. Download de nieuwste versie van Cytoscape38 van: https://cytoscape.org/download.html.
    2. Voer de installatiewizard uit die is gedownload in stap 5.1.1 en selecteer de bestandslocatie voor de Cytoscape-software.
    3. Bereid een door tabs gescheiden bestand voor met de circRNA's van belang en hun doel-miRNA. De eerste kolom bestaat uit de circRNA-naam; de tweede kolom specificeert het type RNA uit de eerste kolom; de derde kolom is het doel-miRNA; en de vierde kolom specificeert het type RNA uit de derde kolom. Een voorbeeld van het bestand is weergegeven in tabel 3.
  2. Het construeren van de ceRNA-netwerkkaart
    1. Open de Cytoscape-software die is geïnstalleerd in stap 5.1.2.
    2. Navigeer in Cytoscape naar Bestand > Importeer > netwerk uit Bestand. Selecteer het bestand dat is voorbereid in stap 5.1.3.
    3. Selecteer in het nieuwe tabblad de eerste en tweede kolom als "Bronknooppunt" en "Bronknooppuntkenmerk" terwijl u de derde en vierde kolom selecteert als respectievelijk "Doelknooppunt" en "Doelknooppuntkenmerk". Klik op OK en het netwerk verschijnt rechtsboven in Cytoscape.
    4. Om de visuele stijl van het netwerk te wijzigen, drukt u op de knop Stijl aan de linkerkant van Cytoscape.
    5. Druk op de pijl aan de rechterkant van Vulkleur. Kies Type voor de kolom en Discrete toewijzing voor het toewijzingstype. Selecteer vervolgens de gewenste kleur voor elk van de RNA-typen.
    6. Nadat u de kleur hebt gewijzigd, wijzigt u de vorm van de knooppunten door naar Vorm te gaan en stap 5.2.5 te volgen.

6. Functionele verrijkingsanalyse

  1. Gene Ontology (GO) en Kyoto Encyclopedia of Genes and Genomes (KEGG) analyse voor het oudergen van de circRNA's
    1. Zorg ervoor dat de clusterProfiler 39,40 en org. Hs.eg.db41 pakketten zijn geïnstalleerd in Rstudio. De organisatie. Hs.eg.db41-pakket is een genoombreed annotatiepakket alleen voor mensen. Als het organisme van belang een andere soort is, raadpleegt u: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importeer de DE_circRNA informatie uit stap 2.3.1 in de Rstudio-werkruimte.
    3. Gebruik het oudergen van de circRNA's in dit bestand voor verrijkingsanalyse in de komende stappen. Als de gebruiker het gensymbool echter wil converteren naar andere formaten, zoals de Entrez-ID, gebruik dan een functie zoals "bitr".
    4. Door de gen-ID als invoer te gebruiken, voert u de GO-verrijkingsanalyse uit met behulp van de enrichGO-functie in het clusterProfiler 39,40-pakket met behulp van standaardparameters.
    5. Door de gen-ID als invoer te gebruiken, voert u de KEGG-verrijkingsanalyse uit met behulp van de enrichKEGG-functie binnen het clusterProfiler 39,40-pakket met behulp van de standaardparameters.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Het protocol dat in de vorige sectie is ingeschakeld, is aangepast en geconfigureerd voor het Linux OS-systeem. De belangrijkste reden is dat de meeste modulebibliotheken en pakketten die betrokken zijn bij de analyse van circRNA's alleen op het Linux-platform kunnen werken. In deze analyse werden gedeïdentificeerde ribosomale RNA (rRNA)-uitgeputte RNA-seq bibliotheekdatasets bereid uit de influenza A-virus-geïnfecteerde menselijke macrofaagcellen gedownload uit de GEO-database42 en gebruikt om de representatieve resultaten te genereren.

CircRNA voorspelling en kwantificering
In deze analyse werden ribosomale RNA (rRNA)-uitgeputte RNA-seq bibliotheek datasets bereid uit het Influenza A-virus geïnfecteerde menselijke macrofaagcellen gebruikt om circRNA-detectie en functionele analyse uit te voeren. Zoals gespecificeerd in de protocolsectie, werd CIRIquant gebruikt om DE-analyse van geïdentificeerde circRNA's te identificeren en uit te voeren met behulp van de RNA-seq-bibliotheekdatasets als invoer. De gebruikte referentiebestanden zijn gebaseerd op de nieuwste versie van het menselijk genoom (hg38). Tabel 4 toont een voorbeeld van de uiteindelijke output van de CIRIquant-analyse. De identificatie en filtering van DE-circRNA's uit CIRIquant-uitvoer werden uitgevoerd via eenvoudige RStudio-scripts (Aanvullend Bestand 1). CircRNA's worden alleen geclassificeerd als DE waarde voor false discovery rate (FDR) <0,05 en log fold change (LogFC) >|2|. Tabel 5 toont het totale aantal gedetecteerde circRNA's en DE-circRNA's. In totaal werden 35.846 circRNA's gedetecteerd, waarvan 306 DE. De DE-circRNA's die in deze uitgang worden gedetecteerd, zijn volledig geupreguleerd (LogFC > 2), waarbij geen enkele wordt gedownreguleerd (LogFC < 2).

Annotatie en karakterisering van DE-circRNA's
Annotatiestatus van DE-circRNA's
De geïdentificeerde circRNA's werden gecontroleerd met een gevestigde circRNA-database, circBase. Aangezien de circRNA-coördinaten die in circBase zijn gedeponeerd echter gebaseerd zijn op een eerdere versie van het menselijk genoom (hg19), moeten de circRNA-coördinaten van circBase worden geconverteerd naar de huidige versie van het menselijk genoom (hg38) voor kruiscontrole in deze studie. Bovendien moet de startcoördinaat worden geconverteerd naar 0-gebaseerd van de 1-gebaseerde uitgang van CIRIquant. De hg38-versie geconverteerde circRNA-coördinaten van circBase zijn opgenomen in een schijfmap in Github (https://github.com/bicciatolab/Circr)37. Vervolgens werden de Rstudio-scripts (Aanvullend bestand 1) gebruikt om de annotatiestatus van circRNA's in een nieuwe gegevensframekolom toe te wijzen. Tabel 6 toont een voorbeeld van circRNA's met de annotatiestatus.

Karakterisering van DE-circRNA's
Dit deel werd volledig uitgevoerd via R-scripts in de RStudio-software. R-scripts vergemakkelijken de analytische processen en alleen basiskennis is vereist.

CircRNA-typen
In deze stap werden DE-circRNA's gekenmerkt door hun circRNA-typen (Antisense, Exonic, Intergenic en Intronic) op basis van hun genomische posities. Tabel 7 hieronder toont de procentuele uitsplitsing van de verschillende circRNA-typen die door de geïdentificeerde DE-circRNA's worden omvat. Van de in totaal 306 DE-circRNA's werden 263 circRNA's (85,95%) geïdentificeerd als exonische circRNA's, het meest voorkomende circRNA-type dat is geïdentificeerd. Intronic circRNA's komen binnen als het tweede meest geïdentificeerde circRNA-type bestaande uit 17 DE-circRNA's, goed voor 5,56% van de totale DE-circRNA's. Dit wordt gevolgd door intergene circRNA's (16 DE circRNA's ~5,23%) en antisense circRNA's (10 DE circRNA's ~3,27%).

Aantal genen per circRNA
CircRNA's geïdentificeerd door CIRIquant kunnen overlappen tussen een aantal genen. Tot op heden zijn de meeste studies gericht op circRNA's die één gen omvatten. Daarom worden in dit protocol de circRNA-kandidaten die meer dan één gen omvatten, uitgesloten van de downstream-analyse. Tabel 8 hieronder beschrijft het aantal en het percentage DE-circRNA's dat één en meer dan één gen omvat. In deze tabel worden intergene circRNA's (16 DE-circRNA's) uitgesloten omdat ze geen gastheergenen overlappen, terwijl de rest van de circRNA-typen (290 DE-circRNA's) aan deze analyse worden onderworpen. Van de 290 DE-circRNA's omvat de meerderheid van de DE-circRNA's (261 circRNA's ~ 90%) slechts één gen, terwijl de resterende 29 circRNA's (~ 10%) meer dan één gen omvatten.

Aanleg van het ceRNA-netwerk
Een ceRNA-netwerk wordt meestal getekend om de circRNA-miRNA-interacties te visualiseren nadat het is voorspeld. In figuur 3 hieronder werd slechts één DE-circRNA gekozen als representatief resultaat, namelijk het hsa_DE_58 circRNA. Op basis van Circr-voorspellingen kunnen hsa_DE_58 tot negen verschillende miRNA's sponzen. Deze negen miRNA's worden geïdentificeerd na filtering door strenge criteria.

Functionele verrijkingsanalyse
GO- en KEGG-analyse van de circRNA-oudergenen
Figuur 4 hieronder toont een bellenplot van de functionele verrijking van DE circRNA oudergenen door middel van de GO-analyse. Fundamenteel is de GO-analyse gericht op het ontrafelen van de biologische processen, cellulaire locaties en moleculaire functies die worden verrijkt of beïnvloed in de bestudeerde aandoening, in dit geval het met virus geïnfecteerde monster. De verrijking wordt als statistisch significant beschouwd en alleen op de bubbelplot uitgezet als de p-waarde < 0,01 is. Zoals weergegeven in figuur 4, omvatten de top drie verrijkingen voor de biologische processen (BP) de ribonucleoproteïne complexe biogenese, de respons op virus en de regulatie van de respons op een biotische stimulus, terwijl voor de moleculaire functies (MF) alleen de katalytische activiteit die inwerkt op RNA en enkelstrengs RNA-binding statistisch verrijkt zijn. Aan de andere kant is alleen het retromeercomplex statistisch verrijkt voor de cellulaire componenten (CC).

Figuur 5 toont de KEGG-verrijkingsanalyse van de DE-circRNA-oudergenen in een bubbelplot. Net als bij de GO-verrijkingsanalyse wordt KEGG-verrijking alleen als statistisch significant beschouwd en uitgezet op een bubbelplot als de p-waarde < 0,01 is. Slechts twee KEGG-termen werden in dit geval verrijkt, namelijk de Influenza A- en virale levenscyclusroutes (HIV-1).

Figure 1
Figuur 1: De pijplijn voor de voorspelling en functionele karakterisering van circRNA's. De pijplijn toont een eenvoudig overzicht van de belangrijkste stappen van begin tot eind, waaronder de installatie van de benodigde softwarepakketten, het voorspellen en kwantificeren van de circRNA-expressie, de constructie van het ceRNA-netwerk en het uitvoeren van de functionele verrijking van het circRNA-oudergen. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 2
Figuur 2: Mappenstructuur voor Circr. Deze mapstructuur moet worden vastgesteld voordat de Circr-software wordt uitgevoerd om de vereiste bestanden voor de analyse te detecteren. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 3
Figuur 3: ceRNA-netwerk bestaande uit de circRNA-miRNA-interactie. De blauwe ovale vorm vertegenwoordigt het circRNA, terwijl de oranje driehoeken de miRNA's vertegenwoordigen. De ononderbroken lijnen die het circRNA verbinden met miRNA's beschrijven de potentiële miRNA-sponsfunctie van de hsa_DE_58 circRNA. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 4
Figuur 4: Bubble plot of GO enrichment analysis of DE circRNA parental genes. GeneRatio op de x-as is het aantal genen in de invoerlijst dat is gekoppeld aan de gegeven GO-term die het totale aantal invoergenen deelt. De puntgrootte in de grafiek wordt weergegeven door de telwaarde, het aantal genen in de invoerlijst dat is gekoppeld aan de gegeven GO-term. Hoe groter de grootte van de stippen, hoe groter het aantal inputgenen dat aan de term is gekoppeld. Bovendien zijn de stippen in de plot kleurgecodeerd op basis van de p-waarde. De P-waarde wordt berekend door de waargenomen frequentie van een annotatieterm te vergelijken met de frequentie die bij toeval wordt verwacht. De afzonderlijke termen worden beschouwd als verrijkt boven een afkapwaarde (p-waarde < 0,01). Het kleurverloop van de p-waarde variërend van blauw tot rood duidt op toenemende verrijking van de termen. Klik hier om een grotere versie van deze figuur te bekijken.

Figure 5
Figuur 5: KEGG verrijkingsanalyse van DE circRNA oudergenen. GeneRatio op de x-as is het aantal genen in de invoerlijst dat is gekoppeld aan de gegeven KEGG-term die het totale aantal invoergenen deelt. De puntgrootte in de plot wordt weergegeven door de telwaarde, het aantal genen in de invoerlijst dat is gekoppeld aan de gegeven KEGG-term. Hoe groter de grootte van de stippen, hoe groter het aantal inputgenen dat aan de term is gekoppeld. Bovendien zijn de stippen in de plot kleurgecodeerd op basis van de p-waarde. De P-waarde wordt berekend door de waargenomen frequentie van een annotatieterm te vergelijken met de frequentie die bij toeval wordt verwacht. Individuele termen worden beschouwd als verrijkt boven een afkapwaarde (p-waarde < 0,01). Het kleurverloop van de p-waarde variërend van blauw tot rood duidt op toenemende verrijking van termen. Klik hier om een grotere versie van deze figuur te bekijken.

Naam van het voorbeeld Pad naar CIRIquant-uitvoer GTF-bestand Groepering
Controle 1 /pad/naar/CIRIquant/ctrl1.gtf C
Controle 2 /pad/naar/CIRIquant/ctrl2.gtf C
Geïnfecteerd 1 /pad/naar/CIRIquant/infect1.gtf T
Geïnfecteerd 2 /pad/naar/CIRIquant/infect2.gtf T

Tabel 1: De .lst file voorbereiding van CIRIquant. De doelpaden van de controle- en behandelde monsters van de CIRIquant-uitvoer worden in een tekstbestand geschreven om de expressies van circRNA tussen de twee typen monsters te vergelijken.

Chr Beginnen Einde Naam . Stranden
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

Tabel 2: Voorbeeld BED-bestand voor Circr. Zes kolommen (Chr, Start, End, Name, Gene en Streng) die aan de circRNA's zijn gekoppeld, zijn vereist om het BED-bestand te genereren.

circRNA_name Type miRNA_name Type
DE_circRNA_1 circRNA MiR-001 Mirna
DE_circRNA_1 circRNA MiR-002 Mirna
DE_circRNA_2 circRNA MiR-003 Mirna
DE_circRNA_2 circRNA MiR-004 Mirna

Tabel 3: Cytoscape invoerbestand. Vier kolommen (circRNA_name, Type, miRNA_name en Type) moeten in een tekstbestand worden geschreven.

CircRNA LogFC LogCPM LR Pwaarde DE FDR
CHR4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3,00E-42 1 1,08E-37
CHR16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
CHR14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tabel 4: Deel van het definitieve output (.csv) bestand van CIRIquant. CIRIquant levert informatie zoals de LogFC, log counts per million (LogCPM), logistic regression (LR), p-waarde, differentiaalexpressie en FDR.

CIRIquant resultaten
Totaal DE Omhoog Dons
35846 306 306 0

Tabel 5: Een samenvatting van het aantal geïdentificeerde totale en differentieel uitgedrukte (DE) circRNA's. In totaal worden 35.846 circRNA's gedetecteerd, waarvan 306 DE-circRNA's. Alle 306 DE-circRNA's zijn upregulated (waarbij geen enkele wordt gedownreguleerd) in behandelde monsters in vergelijking met controlemonsters.

Custom_Name Annotation_Status
hsa_DE_22 Niet-geannoteerde
hsa_DE_2 Geannoteerde
hsa_DE_58 Niet-geannoteerde
hsa_DE_3 Geannoteerde

Tabel 6: Tabel met aangepaste circRNA-namen met annotatiestatus. CircRNA's worden opgevraagd in een database van bekende gedeponeerde circRNA's (circBase). Als het circRNA aanwezig is in de database, wordt het gelabeld om te worden geannoteerd, terwijl de afwezigheid van het circRNA wordt gelabeld als niet-geannoteerd.

CircRNA-type Freq Percentage
Antisense 10 3.27%
Exon 263 85.95%
intergeen 16 5.23%
Intron 17 5.56%

Tabel 7: Soorten geïdentificeerde circRNA's. CircRNA's kunnen verder worden onderverdeeld in verschillende soorten circRNA's op basis van hun sequentiegebied, namelijk exonic, intronic, antisense en intergene.

Aantal ouderlijke genen Freq Percentage
1 261 90%
> 1 29 10%

Tabel 8: Percentage circRNA's met het verschillende aantal genen. CircRNA's worden gewoonlijk gecodeerd uit exonen van één gen, maar circRNA's die meer dan één gen omvatten, kunnen ook door CIRIquant worden gedetecteerd.

Aanvullend bestand 1: Scripts die in het protocol worden gebruikt. Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Om het nut van dit protocol te illustreren, werd RNA-seq van influenza A-virus-geïnfecteerde menselijke macrofaagcellen als voorbeeld gebruikt. CircRNA's die functioneren als potentiële miRNA-sponzen in gastheer-pathogeen interacties en hun GO- en KEGG-functionele verrijking binnen een gastheer werden onderzocht. Hoewel er verschillende circRNA-tools online beschikbaar zijn, is elk van hen een op zichzelf staand pakket dat niet met elkaar communiceert. Hier hebben we enkele van de tools samengesteld die nodig zijn voor circRNA-voorspelling en -kwantificering, circRNA-functionele verrijking, circRNA-miRNA-interactievoorspelling en ceRNA-netwerkconstructie. Dit gestroomlijnde protocol is tijdbesparend en kan worden toegepast op klinische monsters om circRNA-kandidaten met diagnostische en prognostische waarden te detecteren.

In wezen gebruikten we CIRIquant31, een circRNA-kwantificeringstool voorverpakt met CIRI2, die DE-analyse van circRNA's kan detecteren en uitvoeren. DE-circRNA's worden gefilterd op basis van een afkapwaarde van LogFC > |2| en FDR < 0,05, wat helpt om potentiële fout-positieven in downstream-analyses te elimineren. Karakterisering van DE-circRNA's in termen van annotatiestatus, circRNA-typen en het aantal overspannen genen helpen bij het categoriseren en verder filteren van circRNA-kandidaten. Vervolgens wordt Circr37, een circRNA-miRNA voorspellingstool, gebruikt om potentiële miRNA sponsing kandidaten te voorspellen. Na het voorspellen van potentiële miRNA's als doelwitten van circRNA's, wordt een ceRNA-netwerk getekend. Ten slotte wordt op basis van de oudergenen van circRNA's het R clusterProfiler-pakket39 gebruikt voor functionele annotatie via de GO- en KEGG-routeverrijkingsanalyse. Resultaten van GO en KEGG kunnen helpen om de biologische mechanismen te ontrafelen die worden beïnvloed door circRNA's.

Tot op heden zijn er verschillende circRNA-voorspellingstools ontwikkeld, waaronder CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 en UROBORUS 47. In een studie uitgevoerd door Hansen et al., CIRI2 wordt gemeld dat een hoge algemene prestatie heeft. Het is een van de weinige circRNA-detectietools die goed kunnen functioneren in termen van de novo voorspelling en de vermindering van fout-positieve identificatie48. CIRIquant, dat CIRI2 gebruikt voor circRNA-detectie en kwantificering, werd daarom in deze studie gebruikt. CIRIquant werd gebruikt om de back splice junction (BSJ) reads te tellen, en de telgegevens werden genormaliseerd naar de reads die waren toegewezen aan cognate lineaire RNA's getranscribeerd van dezelfde genloci. Dit maakt de kwantificering van circRNA's in een monster mogelijk. Om de differentiële expressie van circRNA's onder experimentele omstandigheden te bepalen, implementeerde CIRIquant een gegeneraliseerd lineair model in edgeR49 voor DE-analyse, en de exacte rate-ratio-test werd gebruikt als een statistische test om de significantie van het verschil in de circRNA-junctieverhouding te bepalen. Hoewel andere circRNA-kwantificeringstools zoals CIRCexplorer3-CLEAR50 kunnen worden gebruikt om het expressieniveau van circRNA's te kwantificeren, staat deze tool alleen circRNA-kwantificering in een steekproef toe, omdat het de BSJ-leest in een monster telt en de telgegevens normaliseert tegen de verwante lineaire RNA-tellingen van hetzelfde monster. CIRCexplorer3-CLEAR kan circRNA-expressies niet vergelijken tussen experimentele omstandigheden. Bovendien is er geen statistische analysetool geïmplementeerd in CIRCexplorer3-CLEAR om het gekwantificeerde expressieniveau te ondersteunen. Hoewel de standaard circRNA-voorspellingstool die binnen CIRIquant is geïmplementeerd CIRI2 is, kunnen de voorspellingsresultaten van andere tools zoals find_circ en CIRCexplorer2 ook worden gebruikt voor de kwantificering en DE-analyse31. In dit protocol werd slechts één circRNA-voorspellingstool (CIRI2) gebruikt voor voorspelling, die nog steeds vals-positieve circRNA-kandidaten zou kunnen opleveren. Om valse positieven te verminderen, kan men andere circRNA-voorspellingstools voor analyse combineren en gemeenschappelijke circRNA's selecteren die zijn gedetecteerd tussen de verschillende circRNA-voorspellingstools48,51. Om de circRNA-detectie verder te verbeteren, is het ideaal om RNA-sequencing-datasets te gebruiken die zowel rRNA-uitgeput zijn als onderworpen zijn aan RNase R-voorbehandeling.

Afhankelijk van het doel van de studie kunnen de novo en geannoteerde DE-circRNA's afzonderlijk worden geïdentificeerd op basis van de circBase-database52. CircRNA's die meer dan één gen omvatten, vereisen echter vaak handmatig onderzoek op UCSC of een andere genoombrowser om de authenticiteit van circRNA's te bepalen en valse positieven te elimineren. Niettemin zijn circRNA's die meer dan één gen omvatten, zoals circRNA's afgeleid van fusiegenen, onlangs ook gemeld53,54.

Circr werkt door drie verschillende miRNA-mRNA-voorspellende algoritmen te combineren, namelijk TargetScan55, miRanda 56 en RNAhybrid57 om de circRNA-miRNA-bindingsplaatsen te voorspellen. Bovendien neemt het algoritme ook informatie over AGO-pieken en eerder gevalideerde interacties op in de circRNA-miRNA-analyse. Hier werden strenge filtercriteria toegepast om een betrouwbaardere circRNA-miRNA-voorspelling te verkrijgen, waardoor valse positieven verder werden verminderd. De strengheid van deze filterstap kan echter hoger of lager worden ingesteld, afhankelijk van de voorkeur van de gebruiker.

ClusterProfiler is een goed gedocumenteerd R-pakket dat functioneel genensets kan annoteren in verschillende organismen. Naast de functies binnen het in dit protocol genoemde R clusterProfiler pakket (enrichGO en enrichKEGG), die gebruik maken van overrepresentatieanalyse, zijn er ook andere functies zoals gseGO en gseKEGG die gebruikt kunnen worden. Als clusterProfiler geen geschikte keuze is voor de workflow, zijn er ook andere tools en pakketten zoals de "AllEnricher"58 of de website-gebaseerde tools zoals "Metascape"59 die functioneel een set genen kunnen annoteren. Ten slotte, hoewel de hierboven verstrekte pijplijn helpt bij het voorspellen van potentiële circRNA's en hun functionele annotaties, zal wet-lab verificatie nodig zijn om solide bewijs te leveren.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

De auteur wil Tan Ke En en Dr. Cameron Bracken bedanken voor hun kritische beoordeling van dit manuscript. Dit werk werd ondersteund door subsidies van Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) en University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Retractie circulair RNA circRNA gastheer-pathogeen interactie
<em>In Silico</em> Identificatie en karakterisering van circRNA's tijdens gastheer-pathogeen interacties
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter