Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

I Silico Identifikation og karakterisering af circRNA'er under værtspatogeninteraktioner

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Den protokol, der indsendes her, forklarer den komplette in silico-pipeline , der er nødvendig for at forudsige og funktionelt karakterisere circRNA'er fra RNA-sekventeringstranskriptomdata, der studerer værtspatogeninteraktioner.

Abstract

Cirkulære RNA'er (circRNA'er) er en klasse af ikke-kodende RNA'er, der dannes via back-splejsning. Disse circRNA'er studeres overvejende for deres roller som regulatorer af forskellige biologiske processer. Især viser nye beviser, at værts-circRNA'er kan udtrykkes forskelligt (DE) ved infektion med patogener (f.eks. Influenza og coronavirus), hvilket tyder på en rolle for circRNA'er i reguleringen af værtsmedfødte immunresponser. Undersøgelser af circRNA'ers rolle under patogene infektioner er imidlertid begrænset af den viden og de færdigheder, der kræves for at udføre den nødvendige bioinformatiske analyse for at identificere DE-circRNA'er fra RNA-sekventeringsdata (RNA-seq). Bioinformatik, forudsigelse og identifikation af circRNA'er er afgørende før enhver verifikation og funktionelle undersøgelser ved hjælp af dyre og tidskrævende vådlaboratorieteknikker. For at løse dette problem findes en trinvis protokol for in silico-forudsigelse og karakterisering af circRNA'er ved hjælp af RNA-seq-data i dette manuskript. Protokollen kan opdeles i fire trin: 1) Forudsigelse og kvantificering af DE-circRNA'er via CIRIquant-pipelinen; 2) Annotation via circBase og karakterisering af DE circRNA'er; 3) CircRNA-miRNA-interaktionsforudsigelse gennem Circr-rørledning; 4) funktionel berigelsesanalyse af circRNA-forældregener ved hjælp af Gene Ontology (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG). Denne pipeline vil være nyttig til at drive fremtidig in vitro - og in vivo-forskning for yderligere at optrævle circRNA'ernes rolle i værtspatogeninteraktioner.

Introduction

Værtspatogeninteraktioner repræsenterer et komplekst samspil mellem patogenerne og værtsorganismerne, som udløser værternes medfødte immunrespons, der i sidste ende resulterer i fjernelse af invaderende patogener 1,2. Under patogene infektioner reguleres en lang række af værtsimmungenerne for at hæmme replikationen og frigivelsen af patogener. For eksempel omfatter almindelige interferonstimulerede gener (ISG'er), der reguleres af patogene infektioner, ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I og OASL 3,4. Udover proteinkodende gener har undersøgelser også rapporteret, at ikke-kodende RNA'er såsom lange ikke-kodende RNA'er (lncRNA'er), mikroRNA'er (miRNA'er) og cirkulære RNA'er (circRNA'er) også spiller en rolle og reguleres samtidigt under patogene infektioner 5,6,7. I modsætning til proteinkodende gener, der hovedsageligt koder for proteiner som funktionelle molekyler, er ikke-kodende RNA'er (ncRNA'er) kendt for at fungere som regulatorer af gener på transkriptionelle og posttranskriptionelle niveauer. Undersøgelser, der involverer deltagelse af ikke-kodende RNA'er, især circRNA'er, i reguleringen af værternes immungener, er imidlertid ikke godt rapporteret sammenlignet med de proteinkodende gener.

CircRNA'er er bredt karakteriseret ved deres kovalent lukkede kontinuerlige sløjfestruktur, som genereres gennem en ikke-kanonisk splejsningsproces kaldet back-splejsning8. Processen med back-splejsning, i modsætning til splejsningsprocessen af beslægtede lineære RNA'er, involverer ligering af nedstrøms donorstedet til opstrøms acceptorstedet, der danner en cirkulærformet struktur. I øjeblikket er der foreslået tre forskellige back-splejsningsmekanismer til biogenese af circRNA'er. Disse er RNA-bindende protein (RBP) medieret cirkularisering 9,10, intronparringsdrevet cirkularisering 11 og lariatdrevet cirkularisering12,13,14. I betragtning af at circRNA'er er forbundet ende-til-ende i en cirkulær struktur, har de tendens til at være naturligt resistente over for normale eksonukleasefordøjelser og anses derfor for at være mere stabile end deres lineære modstykker15. En anden fælles egenskab, der udvises af circRNA'er, inkluderer det celle- eller vævstypespecifikke udtryk i værter16.

Som antydet af deres unikke struktur og celle- eller vævsspecifikke ekspression er circRNA'er blevet opdaget at spille vigtige biologiske funktioner i celler. Til dato er en af de fremtrædende funktioner i circRNA'er deres rolle som microRNA (miRNA) svampe17,18. Denne regulatoriske rolle af circRNA'er forekommer gennem den komplementære binding af circRNA-nukleotider med frøområdet af miRNA'er. En sådan circRNA-miRNA-interaktion hæmmer miRNA'ernes normale regulatoriske funktioner på mål-mRNA'er og regulerer således ekspressionen af gener 19,20. Derudover er circRNA'er også kendt for at regulere genekspression ved at interagere med RNA-bindende proteiner (RBP'er) og danne RNA-proteinkomplekser21. Selvom circRNA'er er klassificeret som ikke-kodende RNA'er, er der også tegn på, at circRNA'er kan fungere som skabeloner til proteinoversættelse22,23,24.

For nylig har circRNA'er vist sig at spille afgørende roller i reguleringen af værtspatogeninteraktionerne, især mellem værterne og vira. Generelt antages værtscirklRNA'er at hjælpe med at regulere værtsens immunrespons for at eliminere de invaderende patogener. Et eksempel på circRNA, der fremmer værtsimmunresponser, er circRNA_0082633, rapporteret af Guo et al.25. Dette circRNA forbedrer type I interferon (IFN) signalering i A549-celler, hvilket hjælper med at undertrykke influenzavirusreplikation25. Desuden rapporterede Qu et al. også et humant intronisk circRNA, kaldet circRNA AIVR, der fremmer immunitet ved at regulere ekspressionen af CREB-bindende protein (CREBBP), en signaltransducer af IFN-β26,27. Imidlertid findes der også circRNA'er, der vides at fremme patogenesen af sygdom ved infektion. For eksempel rapporterede Yu et al. for nylig den rolle, som et circRNA splejset fra GATA-zinkfingerdomænet indeholdende 2A-genet (circGATAD2A) spiller for at fremme H1N1-virusreplikationen gennem hæmning af værtscelleautofagi28.

For effektivt at studere circRNA'er implementeres normalt en genom-wide circRNA-forudsigelsesalgoritme efterfulgt af en in silico-karakterisering af de forudsagte circRNA-kandidater, før der kan udføres funktionelle undersøgelser. En sådan bioinformatisk tilgang til at forudsige og karakterisere circRNA'er er billigere og mere tidseffektiv. Det hjælper med at forfine antallet af kandidater, der skal undersøges funktionelt, og kan potentielt føre til nye resultater. Her leverer vi en detaljeret bioinformatikbaseret protokol til in silico-identifikation , karakterisering og funktionel annotering af circRNA'er under værtspatogeninteraktionerne. Protokollen inkluderer identifikation og kvantificering af circRNA'er fra RNA-sekventeringsdatasæt, annotation via circBase og karakterisering af circRNA-kandidaterne med hensyn til circRNA-typer, antal overlappende gener og forudsagte circRNA-miRNA-interaktioner. Denne undersøgelse giver også den funktionelle annotering af circRNA-forældregenerne gennem genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) berigelsesanalyse.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

I denne protokol blev de-identificerede ribosomale RNA (rRNA)-depleterede RNA-seq-biblioteksdatasæt fremstillet ud fra influenza A-virusinficerede humane makrofagceller downloadet og brugt fra Gene Expression Omnibus (GEO) databasen. Hele bioinformatikpipelinen fra forudsigelse til funktionel karakterisering af circRNA'er er opsummeret i figur 1. Hver del af rørledningen forklares yderligere i afsnittene nedenfor.

1. Forberedelse, download og opsætning før dataanalyse

BEMÆRK: Alle softwarepakker, der bruges i denne undersøgelse, er gratis og open source.

  1. Download af de nødvendige værktøjer på Linux-platformen
    1. Download og installer den nødvendige software og de nødvendige værktøjer, der er anført i materialetabellen , på en højtydende Linux-computer ved hjælp af instruktionerne fra udvikleren.
      BEMÆRK: De fleste værktøjer og software har deres egne online GitHub-sider eller dokumentation, der indeholder instruktioner om installation og brug af deres værktøjer (se materialetabellen).
    2. Download de ønskede RNA-seq-datasæt til circRNA-detektion og analyse fra sekvensarkivwebsteder (f.eks. European Nucleotides Archive og Gene Expression Omnibus).
    3. Download referencegenomet (-erne) (FASTA-format) og annotationsfilerne (GTF / GFF3-format), der er kompatible med den vært, hvorfra RNA-seq-datasættet blev fremstillet. Værtsreferencegenom(er) og annotationsfiler findes normalt på online genombrowsere som National Center for Biotechnology Information (NCBI), University of California Santa Cruz (UCSC) og Ensembl hjemmesider.
  2. Kvalitetskontrol af RNA-seq
    1. Indtast FASTQ-filerne i FASTQC-programmet for at bestemme kvaliteten af RNA-sekvenser. Hvis kvaliteten af FASTQ-filerne er lav (f.eks. 29,30.

2. Forudsigelse og differentiel ekspressionsanalyse af circRNA'er ved hjælp af CIRIquant

BEMÆRK: En mere detaljeret manual om installation og udførelse af differentiel ekspressionsanalyse findes i afsnittet om kodetilgængelighed i CIRIquant-papiret31. De supplerende data indeholder også nogle af de grundlæggende kommandoer, der anvendes i denne protokol.

  1. CircRNA forudsigelser
    1. Indekser værtens referencegenom først ved hjælp af BWA- og HISAT2-justeringer. Udfør derefter kommandoerne bwa index 32 og hisat2-build33 i mappen med værtens referencegenom på en Linux-terminal for at indeksere det.
    2. Forbered derefter en YML-konfigurationsfil, der indeholder navnet på filen, stien til værktøjer (BWA, HISAT2, stringtie34, samtools35), stien til de downloadede referencefiler (værtens referencegenom FASTA-filer, annotationsfiler) og stien til indeksfilerne fra trin 2.1.1.
    3. Udfør CIRIquant-værktøjet fra terminalen ved hjælp af enten standardparametrene eller manuelle parametre. Brugeren kan angive bibliotekstypen (enten strenget eller ikke-strenget) af RNA-seq-dataene, når CIRIquant-værktøjet udføres.
      BEMÆRK: Bibliotekstypen af RNA-seq-data kan bestemmes ved at kende den anvendte type biblioteksforberedelsessæt. Hvis identiteten af bibliotekets forberedelsessæt er ukendt, kan en RNA-seq-kontrolbioinformatisk pakke kaldet RSeQC36 bruges til at bestemme strengheden af RNA-seq-data.
  2. Differentiel ekspressionsanalyse
    BEMÆRK: CIRIquant-pakken indeholder prep_CIRIquant, prepDE.py og CIRI_DE_replicate; Derfor er der ikke behov for yderligere downloads til disse tre værktøjer.
    1. Forbered en tekstfil (.lst) med en liste over data, der indeholder følgende:
      1. kolonne: ID'er for RNA-seq-data anvendt i trin 2.1.3
      2. kolonne: sti til GTF-filer, der udsendes af CIRIquant
      3. kolonne: gruppering af RNA-seq-data, uanset om det er en kontrol- eller behandlet gruppe.
    2. For et eksempel henvises til tabel 1 nedenfor.
      BEMÆRK: Det er ikke nødvendigt at indsætte overskrifterne, da de kun er til reference.
    3. På Linux-terminalen skal du køre prep_CIRIquant med tekstfilen (.lst), der er udarbejdet i trin 2.2.1, som input. Kørslen genererer en liste over filer: library_info.csv, circRNA_info.csv, circRNA_bsj.csv og circRNA_ratio.csv.
    4. Forbered en anden tekstfil med en liste over data, der indeholder RNA-seq-id'erne og stien til deres respektive StringTie-output. Fillayoutet skal ligne tekstfilen i trin 2.2.1 uden grupperingskolonnen.
    5. Kør prepDE.py med tekstfilen, der er udarbejdet i trin 2.2.4, som input til generering af gentællingsmatrixfilerne.
    6. Udfør CIRI_DE_replicate med library_info.csv- og circRNA_bsj.csv-filerne fra trin 2.2.3 og gene_count_matrix.csv-filen fra trin 2.2.5 som input for at sende den endelige circRNA_de.tsv-fil.
  3. Filtrering af DE-circRNA'er
    1. Brug R (i computerterminalen eller RStudio) eller regnearkssoftware (f.eks. Microsoft Excel) til at åbne circRNA_de.tsv-filen , der genereres fra trin 2.2.6, for at filtrere og bestemme antallet af differentielt udtrykte (DE) circRNA'er.
    2. Filtrer DE-circRNA'erne i henhold til kriterierne LogFC > |2| og FDR < 0,05.
    3. Opret en fil med navnet DE_circRNAs.txt for at gemme oplysningerne om DE-circRNA'er.

3. Karakterisering og annotering af forudsagte DE-circRNA'er

  1. Annotationsstatus for DE-circRNA'er
    1. Indlæs filen med navnet DE_circRNAs.txt i RStudio , som består af listen over DE-circRNA'er filtreret fra trin 2.3.3. Inkluder anden information såsom genomiske positioner (Chr, Start, End), strengorienteringer (+ eller -), gennavn og circRNA-type. Før du fortsætter, konverter circRNA genomiske startkoordinater fra CIRIquant til 0-baseret ved at trække 1 basepar.
      BEMÆRK: De øvrige oplysninger, der er angivet ovenfor, kan fås fra GTF-filer, der udsendes af CIRIquant (supplerende fil 1).
    2. Bestem annotationsstatus for de forudsagte DE-circRNA'er ved at downloade et bibliotek, der indeholder de genomiske positioner af circRNA-databasen (f.eks. circBase) deponerede circRNA'er.
      BEMÆRK: Sørg for, at genomversionen, der bruges til at forudsige circRNA'erne, er identisk med circRNA-databasebiblioteket, før du foretager sammenligningen. Den circBase-datafil, der bruges her, er frit tilgængelig i drevmappen i Github (https://github.com/bicciatolab/Circr)37.
    3. Når begge filerne fra trin 3.1.1 og trin 3.1.2 er forberedt, skal du køre R-scriptet i Supplementary File 1. Kromosomplaceringer af DE-circRNA'er forespørges til biblioteket, før status Annoteret eller Unannoteret tildeles status.
  2. Karakterisering af DE-circRNA'er
    1. Brug R og anden regnearkssoftware til at opsummere antallet af circRNA'er i henhold til circRNA-typerne (dvs. exon, intron, intergen og antisense) og antallet af gener, som circRNA'erne spænder over (1 eller >1) (supplerende fil 1).BEMÆRK: CIRIquant kan kun detektere fire typer circRNA'er (exon, intron, intergen og antisense). Exon-intron circRNA'er, også kendt som ElciRNA'er, kan ikke detekteres af CIRIquant.

4. Forudsigelse af circRNA-miRNA-interaktionen ved hjælp af Circr

BEMÆRK: En mere detaljeret manual om, hvordan man installerer og bruger Circr til circRNA-miRNA-interaktionsanalysen, findes på: https://github.com/bicciatolab/Circr37.

  1. Forberedelse af filer
    1. Udpak og udpak indholdet af Circr.zip filen efter at have downloadet den fra Circr GitHub-siden ved hjælp af den relevante software såsom "WinRar" eller "7-zip" til en ny mappe, hvor analysen udføres.
    2. Installer de nødvendige softwareapplikationer (miRanda, RNAhybrid, Pybedtools og samtools), før du udfører circRNA-miRNA-analysen.
    3. Referencegenomer og annotationsfiler for flere organismer af interesse, rRNA-koordinatfil, valideret miRNA-interaktionsfil og circBase circRNA-filer leveres af Circr-forfatteren på Github-siden (https://github.com/bicciatolab/Circr)37. Når du klikker på supportfilerne i drevmappen, skal du vælge mappen til organismen af interesse, miRNA-mappen og circBase-tekstfilen og downloade den.
    4. Når du har downloadet de nødvendige filer i trin 4.1.3, skal du oprette en ny mappe med navnet support_files i mappen nævnt i trin 4.1.1. Udpak derefter og udpak indholdet i support_files-mappen .
    5. Indekser referencegenomfilen for organismen af interesse ved hjælp af kommandoen samtools faidx (supplerende fil 1).
    6. Forbered en inputfil bestående af koordinaterne for DE-circRNA'er af interesse i en tabulatorsepareret BED-fil, som vist i tabel 2.
      BEMÆRK: Da circRNA'er forudsagt af CIRIquant ikke er 0-baserede, er det nødvendigt at minus 1 bp ved startkoordinaten (som nævnt i trin 3.1.1), før de konverteres til BED-formatet. Overskrifterne i tabel 2 er kun til reference og er ikke nødvendige i BED-filerne.
    7. På dette tidspunkt skal du sikre dig, at den forventede mappetræstruktur til Circr-analyse er som i figur 2.
  2. Kører Circr.py
    1. Udfør Circr.py ved hjælp af Python 3, og angiv som argumenter circRNA-inputfilen, FASTA-genomet for organismen af interesse, genomversionen af den valgte organisme, antallet af tråde og navnet på outputfilen i kommandolinjen.
    2. Hvis den pågældende organisme ikke findes i den drevmappe, der er angivet i trin 4.1.3, eller hvis brugeren foretrækker at have et brugerdefineret sæt filer til at køre analysen, skal der medtages yderligere kommandoer, der angiver placeringen af disse filer, når der udføres Circr.py.
    3. Når Circr-analysen er afsluttet, udsender programmet en circRNA-miRNA-interaktionsfil i csv-format.
    4. Filtrer circRNA-miRNA-interaktionsresultaterne i henhold til den brugerspecifikke præference. Til denne undersøgelse filtreres forudsigelserne ved hjælp af Rstudio i henhold til nedenstående kriterier:
      -Opdaget af alle tre softwareværktøjer
      -To eller flere bindingssteder rapporteret af både Targetcan og miRanda
      -Identificeret i kolonnerne "AGO" eller "valideret"
      -Filtrer ingen frøområdeinteraktioner ud
    5. Skriv de circRNA'er, der passerer de filtrerede betingelser fra trin 4.2.3, til en ny tekstfil med navnet circRNA_miRNA.txt. Sådan filtrering kan øge tilliden til de forudsagte interaktioner.

5. Konstruktion af ceRNA-netværket

BEMÆRK: En detaljeret manual om, hvordan du bruger Cytoscape, kan findes på: http://manual.cytoscape.org/en/stable/ og https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Download og forberedelse
    1. Download den nyeste version af Cytoscape38 fra: https://cytoscape.org/download.html.
    2. Udfør installationsguiden, der blev downloadet i trin 5.1.1, og vælg filplaceringen for Cytoscape-softwaren.
    3. Forbered en tabulatorsepareret fil, der indeholder de circRNA'er, der er af interesse, og deres mål-miRNA. Den første kolonne består af circRNA-navnet; den anden kolonne specificerer typen af RNA fra den første kolonne; den tredje kolonne er mål-miRNA; og den fjerde kolonne specificerer typen af RNA fra den tredje kolonne. Et eksempel på filen er vist i tabel 3.
  2. Konstruktion af ceRNA-netværkskortet
    1. Åbn Cytoscape-softwaren, der blev installeret i trin 5.1.2.
    2. I Cytoscape skal du navigere til File > Import > Network from File. Vælg den fil, der er udarbejdet i trin 5.1.3.
    3. I den nye fane skal du vælge den første og anden kolonne som "Source Node" og "Source Node Attribute", mens du vælger den tredje og fjerde kolonne som henholdsvis "Target Node" og "Target Node Attribute". Klik på OK, og netværket vises øverst til højre i Cytoscape.
    4. For at ændre netværkets visuelle stil skal du trykke på Style-knappen i venstre side af Cytoscape.
    5. Tryk på pilen i højre side af Fyldfarve. Vælg Type for kolonnen og Diskret tilknytning for tilknytningstypen. Vælg derefter den ønskede farve for hver af RNA-typerne.
    6. Når du har ændret farven, skal du ændre formen på noderne ved at navigere til Figur og følge trin 5.2.5.

6. Funktionel berigelsesanalyse

  1. Genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) analyse for forældregenet af circRNA'erne
    1. Sørg for clusterProfiler 39,40 og org. Hs.eg.db41 pakker er installeret i Rstudio. Org. Hs.eg.db41-pakken er en genom-dækkende annotationspakke kun til mennesker. Hvis organismen af interesse er en anden art, henvises til: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importer DE_circRNA oplysninger fra trin 2.3.1 til Rstudio-arbejdsområdet.
    3. Brug forældregenet for circRNA'erne, der er angivet i denne fil, til berigelsesanalyse i de kommende trin. Men hvis brugeren ønsker at konvertere gensymbolet til andre formater, såsom Entrez ID, skal du bruge en funktion som "bitr".
    4. Ved at bruge gen-id'et som input skal du køre GO-berigelsesanalysen ved hjælp af enrichGO-funktionen i clusterProfiler 39,40-pakken ved hjælp af standardparametre.
    5. Ved at bruge gen-id'et som input køres KEGG-berigelsesanalysen ved hjælp af enrichKEGG-funktionen i clusterProfiler 39,40-pakken ved hjælp af standardparametrene.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Protokollen, der blev optaget i det foregående afsnit, blev ændret og konfigureret til at passe til Linux OS-systemet. Hovedårsagen er, at de fleste modulbiblioteker og pakker, der er involveret i analysen af circRNA'er, kun kan fungere på Linux-platformen. I denne analyse blev de-identificerede ribosomale RNA (rRNA)-depleterede RNA-seq-biblioteksdatasæt fremstillet ud fra de influenza A-virusinficerede humane makrofagceller downloadet fra GEO-databasen42 og brugt til at generere de repræsentative resultater.

CircRNA forudsigelse og kvantificering
I denne analyse blev ribosomale RNA (rRNA)-depleterede RNA-seq-biblioteksdatasæt fremstillet ud fra influenza A-virusinficerede humane makrofagceller anvendt til at udføre circRNA-detektion og funktionel analyse. Som specificeret i protokolafsnittet blev CIRIquant brugt til at identificere og udføre DE-analyse af identificerede circRNA'er ved hjælp af RNA-seq-bibliotekets datasæt som input. De anvendte referencefiler er baseret på den nyeste version af det humane genom (hg38). Tabel 4 viser et eksempel på det endelige output fra CIRIquant-analysen. Identifikation og filtrering af DE-circRNA'er fra CIRIquant-output blev udført gennem simple RStudio-scripts (supplerende fil 1). CircRNA'er klassificeres kun som DE, når FDR-værdien (false-discovery rate) er <0,05 og log fold change (LogFC) >|2|. Tabel 5 viser det samlede antal påviste circRNA'er og DE-circRNA'er. I alt 35.846 circRNA'er blev påvist, hvor 306 var DE. De DE-circRNA'er, der påvises i dette output, er fuldstændigt opreguleret (LogFC > 2), uden at nogen er nedreguleret (LogFC < 2).

Annotation og karakterisering af DE-circRNA'er
Annotationsstatus for DE-circRNA'er
DE circRNA'er identificeret blev krydstjekket med en etableret circRNA-database, circBase. Men da circRNA-koordinaterne deponeret i circBase er baseret på en tidligere human genomversion (hg19), skal circRNA-koordinaterne fra circBase konverteres til den nuværende humane genomversion (hg38) for krydstjek i denne undersøgelse. Derudover skal startkoordinaten konverteres til 0-baseret fra CIRIquants 1-baserede output. De hg38-versionkonverterede circRNA-koordinater for circBase findes i en drevmappe i Github (https://github.com/bicciatolab/Circr)37. Derefter blev Rstudio-scripts (supplerende fil 1) brugt til at tildele annotationsstatus for circRNA'er i en ny datarammekolonne. Tabel 6 viser et eksempel på circRNA'er med annotationsstatus.

Karakterisering af DE-circRNA'er
Denne del blev udelukkende udført gennem R-scripts i RStudio-softwaren. R-scripts letter de analytiske processer, og kun grundlæggende viden er påkrævet.

CircRNA typer
I dette trin blev DE-circRNA'er karakteriseret ved deres circRNA-typer (Antisense, Exonic, Intergene og Intronic) baseret på deres genomiske positioner. Tabel 7 nedenfor viser den procentvise opdeling af de forskellige circRNA-typer, der er omfattet af de identificerede DE-circRNA'er. Af de i alt 306 DE-circRNA'er blev 263 circRNA'er (85,95%) identificeret som exoniske circRNA'er, hvilket er den mest rigelige circRNA-type identificeret. Introniske circRNA'er kommer ind som den næstmest identificerede circRNA-type, der omfatter 17 DE-circRNA'er, hvilket udgør op til 5,56% af de samlede DE-circRNA'er. Dette efterfølges af intergene circRNA'er (16 DE-circRNA'er ~ 5.23%) og antisense-circRNA'er (10 DE-circRNA'er ~ 3.27%).

Antal gener spændt pr. circRNA
CircRNA'er identificeret ved CIRIquant kan overlappe på tværs af en række gener. Til dato er de fleste undersøgelser fokuseret på circRNA'er, der spænder over et gen. Derfor er circRNA-kandidaterne, der spænder over mere end et gen, i denne protokol udelukket fra downstream-analysen. Tabel 8 nedenfor beskriver antallet og procentdelen af DE-circRNA'er, der spænder over et og mere end et gen. I denne tabel er intergene circRNA'er (16 DE-circRNA'er) udelukket, da de ikke overlapper nogen værtsgener, mens resten af circRNA-typerne (290 DE-circRNA'er) underkastes denne analyse. Af de 290 DE-circRNA'er spænder størstedelen af DE-circRNA'erne (261 circRNA'er ~ 90%) kun over et gen, mens de resterende 29 circRNA'er (~ 10%) spænder over mere end et gen.

Opbygning af ceRNA-netværket
Et ceRNA-netværk tegnes normalt for at visualisere circRNA-miRNA-interaktionerne, efter at det er blevet forudsagt. I figur 3 nedenfor blev kun ét DE-circRNA valgt som et repræsentativt resultat, nemlig hsa_DE_58 circRNA. Baseret på Circr-forudsigelser kan hsa_DE_58 svamp op til ni forskellige miRNA'er. Disse ni miRNA'er identificeres efter filtrering gennem strenge kriterier.

Funktionel berigelsesanalyse
GO- og KEGG-analyse af circRNA-forældregenerne
Figur 4 nedenfor viser et bobleplot af den funktionelle berigelse af DE-circRNA-forældregener gennem GO-analysen. Grundlæggende sigter GO-analysen mod at optrævle de biologiske processer, cellulære placeringer og molekylære funktioner, der beriges eller påvirkes i den undersøgte tilstand, i dette tilfælde den virusinficerede prøve. Berigelsen betragtes som statistisk signifikant og plottes kun på bobleplottet, hvis p-værdien er < 0,01. Som vist i figur 4 inkluderer de tre øverste berigelser for de biologiske processer (BP) ribonukleoproteinkomplekset biogenese, responsen på virus og reguleringen af respons på en biotisk stimulus, mens kun den katalytiske aktivitet, der virker på RNA og enkeltstrenget RNA-binding, er statistisk beriget for molekylfunktionerne (MF). På den anden side er kun retromerkomplekset statistisk beriget for de cellulære komponenter (CC).

Figur 5 viser KEGG-berigelsesanalysen af DE-circRNA-forældregenerne i et bobleplot. I lighed med GO-berigelsesanalysen betragtes KEGG-berigelse kun som statistisk signifikant og plottes på et bobleplot, hvis p-værdien er < 0,01. Kun to KEGG-termer blev beriget i dette tilfælde, som er influenza A og viral livscyklus (HIV-1) veje.

Figure 1
Figur 1: Pipelinen til forudsigelse og funktionel karakterisering af circRNA'er. Pipelinen viser et simpelt overblik over de vigtigste trin fra start til slut, der involverer installation af de nødvendige softwarepakker, forudsigelse og kvantificering af circRNA-ekspressionen, konstruktion af ceRNA-netværket og udførelse af circRNA-forældrenes genetiske funktionelle berigelse. Klik her for at se en større version af denne figur.

Figure 2
Figur 2: Mappetræstruktur for Circr. Denne mappetræstruktur skal etableres, før Circr-softwaren køres, for at registrere de nødvendige filer til analysen. Klik her for at se en større version af denne figur.

Figure 3
Figur 3: ceRNA-netværk bestående af circRNA-miRNA-interaktionen. Den blå ovale form repræsenterer circRNA'et, mens de orange trekanter repræsenterer miRNA'erne. De faste linjer, der forbinder circRNA med miRNA'er, beskriver den potentielle miRNA-svampningsfunktion af hsa_DE_58 circRNA. Klik her for at se en større version af denne figur.

Figure 4
Figur 4: Bobleplot af GO-berigelsesanalyse af DE-circRNA-forældregener. GeneRatio på x-aksen er antallet af gener i inputlisten, der er knyttet til det givne GO-udtryk, der dividerer det samlede antal inputgener. Prikstørrelsen i plottet er repræsenteret af tælleværdien, som er antallet af gener i inputlisten, der er knyttet til det givne GO-udtryk. Jo større størrelsen af prikkerne er, desto større er antallet af inputgener, der er forbundet med udtrykket. Desuden er prikkerne i plottet farvekodede baseret på p-værdien. P-værdien beregnes ved at sammenligne den observerede frekvens af et annotationsudtryk med den frekvens, der forventes ved en tilfældighed. De enkelte termer betragtes som berigede ud over en cut-off værdi (p-værdi < 0,01). Farvegradienten af p-værdi, der spænder fra blå til rød, indikerer stigende berigelse af udtrykkene. Klik her for at se en større version af denne figur.

Figure 5
Figur 5: KEGG berigelsesanalyse af DE circRNA forældregener. GeneRatio på x-aksen er antallet af gener i inputlisten, der er knyttet til det givne KEGG-udtryk, der dividerer det samlede antal inputgener. Prikstørrelsen i plottet er repræsenteret af tælleværdien, som er antallet af gener i inputlisten, der er knyttet til det givne KEGG-udtryk. Jo større størrelsen af prikkerne er, desto større er antallet af inputgener, der er forbundet med udtrykket. Desuden er prikkerne i plottet farvekodede baseret på p-værdien. P-værdien beregnes ved at sammenligne den observerede frekvens af et annotationsudtryk med den frekvens, der forventes ved en tilfældighed. Individuelle udtryk betragtes som beriget ud over en cut-off-værdi (p-værdi < 0,01). Farvegradienten af p-værdi, der spænder fra blå til rød, indikerer stigende berigelse af udtryk. Klik her for at se en større version af denne figur.

Eksempel navn Sti til CIRIquant output GTF-fil Gruppering
Kontrol 1 /sti/til/CIRIquant/ctrl1.gtf C
Kontrol 2 /sti/til/CIRIquant/ctrl2.gtf C
Inficeret 1 /sti/til/CIRIquant/inficere1.gtf T
Inficerede 2 /sti/til/CIRIquant/inficere2.gtf T

Tabel 1: .lst-filpræparatet af CIRIquant. Destinationsvejene for kontrolprøverne og de behandlede prøver fra CIRIquant-outputtet skrives i en tekstfil for at sammenligne ekspressionerne af circRNA mellem de to typer prøver.

Chr Begynde Ende Navn . Strand
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

Tabel 2: Eksempel på BED-fil for Circr. Seks kolonner (Chr, Start, End, Name, Gene og Strand) forbundet med circRNA'erne er nødvendige for at generere BED-filen.

circRNA_name Slags miRNA_name Slags
DE_circRNA_1 circRNA miR-001 Mirna
DE_circRNA_1 circRNA miR-002 Mirna
DE_circRNA_2 circRNA miR-003 Mirna
DE_circRNA_2 circRNA miR-004 Mirna

Tabel 3: Cytoscape-inputfil. Der kræves fire kolonner (circRNA_name, Type, miRNA_name og Type) for at blive skrevet ind i en tekstfil.

CircRNA logFC logCPM LR Pvalue DE FDR
Chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
Chr16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
Chr14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tabel 4: Del af den endelige outputfil (.csv) af CIRIquant. CIRIquant leverer information såsom LogFC, log counts per million (LogCPM), logistisk regression (LR), p-værdi, differentialudtryk og FDR.

CIRIquant resultater
Total DE Opad Ned
35846 306 306 0

Tabel 5: En oversigt over antallet af identificerede totale og differentialt udtrykte (DE) circRNA'er. I alt 35.846 circRNA'er detekteres, hvor 306 er DE-circRNA'er. Alle de 306 DE-circRNA'er opreguleres (uden at nogen nedreguleres) i behandlede prøver sammenlignet med kontrolprøver.

Custom_Name Annotation_Status
hsa_DE_22 Ikke-kommenteret
hsa_DE_2 Kommenteret
hsa_DE_58 Ikke-kommenteret
hsa_DE_3 Kommenteret

Tabel 6: Tabel over brugerdefinerede circRNA-navne med annotationsstatus. CircRNA'er forespørges i en database over kendte deponerede circRNA'er (circBase). Hvis circRNA er til stede i databasen, er det mærket til at blive kommenteret, mens fraværet af circRNA er mærket som ikke-annoteret.

CircRNA Type Freq Procentdel
antisens 10 3.27%
Exon 263 85.95%
intergen 16 5.23%
Intron 17 5.56%

Tabel 7: Typer af circRNA'er identificeret. CircRNA'er kan yderligere kategoriseres i forskellige typer circRNA'er baseret på deres sekvensregion, nemlig exonic, intronic, antisense og intergen.

Antal forældregener Freq Procentdel
1 261 90%
> 1 29 10%

Tabel 8: Procentdel af circRNA'er med det forskellige antal gener, der spænder over. CircRNA'er er almindeligvis kodet fra exoner af et gen, men circRNA'er, der spænder over mere end et gen, kan også detekteres af CIRIquant.

Supplerende fil 1: Scripts brugt i protokollen. Klik her for at downloade denne fil.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

For at illustrere nytten af denne protokol blev RNA-seq fra influenza A-virusinficerede humane makrofagceller brugt som et eksempel. CircRNA'er, der fungerer som potentielle miRNA-svampe i værtspatogeninteraktioner, og deres GO- og KEGG-funktionelle berigelse inden for en vært blev undersøgt. Selvom der er en række circRNA-værktøjer tilgængelige online, er hver af dem en selvstændig pakke, der ikke interagerer med hinanden. Her sammensætter vi nogle af de værktøjer, der kræves til circRNA-forudsigelse og kvantificering, circRNA-funktionel berigelse, circRNA-miRNA-interaktionsforudsigelse og ceRNA-netværkskonstruktion. Denne strømlinede protokol er tidsbesparende og kan anvendes på kliniske prøver til at detektere circRNA-kandidater med diagnostiske og prognostiske værdier.

Grundlæggende anvendte vi CIRIquant31, et circRNA-kvantificeringsværktøj, der er færdigpakket med CIRI2, som kan detektere og udføre DE-analyse af circRNA'er. DE-circRNA'er filtreres baseret på en cut-off-værdi af LogFC > |2| og FDR < 0,05, hvilket hjælper med at eliminere potentielle falske positive i downstream-analyser. Karakterisering af DE-circRNA'er med hensyn til annotationsstatus, circRNA-typer og antallet af gener, der spænder over, hjælper med at kategorisere og yderligere filtrere circRNA-kandidater. Derefter bruges Circr37, et circRNA-miRNA-forudsigelsesværktøj, til at forudsige potentielle miRNA-svampekandidater. Efter at have forudsagt potentielle miRNA'er som mål for circRNA'er, tegnes et ceRNA-netværk. Endelig, baseret på forældregenerne for circRNA'er, anvendes R clusterProfiler-pakke39 til funktionel annotering via GO- og KEGG-vejberigelsesanalysen. Resultater fra GO og KEGG kan hjælpe med at optrævle de biologiske mekanismer, der påvirkes af circRNA'er.

Til dato er der udviklet flere forskellige circRNA-forudsigelsesværktøjer, herunder CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 og UROBORUS 47. I en undersøgelse foretaget af Hansen et al. rapporteres CIRI2 at have en høj samlet præstation. Det er blandt de få circRNA-detektionsværktøjer, der kan fungere godt med hensyn til de novo-forudsigelse og reduktion af falsk positiv identifikation48. CIRIquant, som anvender CIRI2 til circRNA-detektion og kvantificering, blev derfor anvendt i denne undersøgelse. CIRIquant blev brugt til at tælle Back Splice Junction (BSJ) læsninger, og tælledataene blev normaliseret til de aflæsninger, der blev kortlagt for at beslægte lineære RNA'er transkriberet fra det samme gen-loci. Dette muliggør kvantificering af circRNA'er i en prøve. For at bestemme differentialekspressionen af circRNA'er på tværs af eksperimentelle betingelser implementerede CIRIquant en generaliseret lineær model i edgeR49 til DE-analyse, og den nøjagtige hastighedsforholdstest blev brugt som en statistisk test for at bestemme betydningen af forskellen i circRNA-forbindelsesforholdet. Selvom andre circRNA-kvantificeringsværktøjer såsom CIRCexplorer3-CLEAR50 kan bruges til at kvantificere ekspressionsniveauet for circRNA'er, tillader dette værktøj kun circRNA-kvantificering i en prøve, da det tæller BSJ-læsningerne i en prøve og normaliserer tælledataene mod de beslægtede lineære RNA-tællinger fra den samme prøve. CIRCexplorer3-CLEAR kan ikke sammenligne circRNA-ekspressioner på tværs af eksperimentelle forhold. Desuden er der ikke implementeret noget statistisk analyseværktøj i CIRCexplorer3-CLEAR til understøttelse af det kvantificerede ekspressionsniveau. Selvom standard circRNA-forudsigelsesværktøjet implementeret i CIRIquant er CIRI2, kan forudsigelsesresultaterne fra andre værktøjer såsom find_circ og CIRCexplorer2 også bruges til kvantificering og DE-analyse31. I denne protokol blev der kun anvendt ét circRNA-forudsigelsesværktøj (CIRI2) til forudsigelse, hvilket stadig kan give falsk-positive circRNA-kandidater. For at reducere falske positive kan man kombinere andre circRNA-forudsigelsesværktøjer til analyse og vælge almindelige circRNA'er påvist blandt de forskellige circRNA-forudsigelsesværktøjer48,51. For yderligere at forbedre circRNA-detektion er det ideelt at bruge RNA-sekventeringsdatasæt, der både er rRNA-depleterede og udsættes for RNase R-forbehandling.

Afhængigt af formålet med undersøgelsen kan de novo og annoterede DE-circRNA'er identificeres separat baseret på circBase-databasen52. Imidlertid kræver circRNA'er, der spænder over mere end et gen, ofte manuel undersøgelse af UCSC eller enhver anden genombrowser for at bestemme ægtheden af circRNA'er og eliminere falske positive. Ikke desto mindre er circRNA'er, der spænder over mere end et gen, såsom circRNA'er afledt af fusionsgener, også blevet rapporteret for nylig53,54.

Circr virker ved at kombinere tre forskellige miRNA-mRNA-forudsigelsesalgoritmer, nemlig TargetScan55, miRanda 56 og RNAhybrid57 for at forudsige circRNA-miRNA-bindingsstederne. Derudover inkorporerer algoritmen også information om AGO-toppe og tidligere validerede interaktioner i circRNA-miRNA-analysen. Her blev strenge filtreringskriterier anvendt for at muliggøre en mere pålidelig circRNA-miRNA-forudsigelse, hvilket yderligere reducerede falske positive. Strengheden af dette filtreringstrin kan dog indstilles højere eller lavere afhængigt af brugerens præference.

ClusterProfiler er en veldokumenteret R-pakke, der funktionelt kan annotere gensæt på tværs af forskellige organismer. Udover funktionerne i R clusterProfiler-pakken, der er nævnt i denne protokol (enrichGO og enrichKEGG), som bruger overrepræsentationsanalyse, er der også andre funktioner såsom gseGO og gseKEGG , der kan bruges. Hvis clusterProfiler ikke er et passende valg til arbejdsgangen, er der også andre værktøjer og pakker såsom "AllEnricher"58 eller de webstedsbaserede værktøjer såsom "Metascape"59 , der funktionelt kan annotere et sæt gener. Endelig, selvom ovennævnte pipeline hjælper med at forudsige potentielle circRNA'er og deres funktionelle annotationer, vil vådlaboratorieverifikation være nødvendig for at give solide beviser.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Forfatteren vil gerne takke Tan Ke En og Dr. Cameron Bracken for deres kritiske gennemgang af dette manuskript. Dette arbejde blev støttet af tilskud fra Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) og University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Tilbagetrækning udgave 188 cirkulært RNA circRNA værtspatogeninteraktion
<em>I Silico</em> Identifikation og karakterisering af circRNA'er under værtspatogeninteraktioner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter