Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

I Silico Identifisering og karakterisering av circRNA under vertspatogeninteraksjoner

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Protokollen som er sendt inn her, forklarer den komplette silico-rørledningen som trengs for å forutsi og funksjonelt karakterisere circRNA fra RNA-sekvenseringstranskriptomdata som studerer vertspatogeninteraksjoner.

Abstract

Sirkulære RNA (circRNAer) er en klasse av ikke-kodende RNA som dannes via back-spleising. Disse sirkRNAene studeres hovedsakelig for deres roller som regulatorer av ulike biologiske prosesser. Spesielt viser nye bevis at vertscircRNA kan uttrykkes differensielt (DE) ved infeksjon med patogener (f.eks. Influensa og koronavirus), noe som tyder på en rolle for circRNA i regulering av vertens medfødte immunresponser. Imidlertid er undersøkelser av rollen til circRNA under patogene infeksjoner begrenset av kunnskapen og ferdighetene som kreves for å utføre den nødvendige bioinformatiske analysen for å identifisere DE-circRNA fra RNA-sekvensering (RNA-seq) data. Bioinformatikk prediksjon og identifisering av circRNA er avgjørende før verifisering, og funksjonelle studier ved hjelp av kostbare og tidkrevende våtlaboratorieteknikker. For å løse dette problemet er det gitt en trinnvis protokoll for in silico-prediksjon og karakterisering av circRNA ved bruk av RNA-seq-data i dette manuskriptet. Protokollen kan deles inn i fire trinn: 1) Prediksjon og kvantifisering av DE circRNA via CIRIquant-rørledningen; 2) Annotering via circBase og karakterisering av DE circRNAs; 3) CircRNA-miRNA-interaksjonsprediksjon gjennom Circr-rørledning; 4) funksjonell berikelsesanalyse av circRNA-foreldregener ved bruk av genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG). Denne rørledningen vil være nyttig for å drive fremtidig in vitro og in vivo forskning for ytterligere å avdekke rollen til circRNA i vert-patogen-interaksjoner.

Introduction

Vertspatogeninteraksjoner representerer et komplekst samspill mellom patogener og vertsorganismer, noe som utløser vertenes medfødte immunresponser som til slutt resulterer i fjerning av invaderende patogener 1,2. Under patogene infeksjoner reguleres en rekke vertsimmungener for å hemme replikasjon og frigjøring av patogener. For eksempel inkluderer vanlige interferonstimulerte gener (ISG) regulert ved patogene infeksjoner ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I og OASL 3,4. Foruten proteinkodende gener har studier også rapportert at ikke-kodende RNA som lange ikke-kodende RNA (lncRNA), mikroRNA (miRNA) og sirkulære RNA (sircRNA) også spiller en rolle og reguleres samtidig under patogene infeksjoner 5,6,7. I motsetning til proteinkodende gener som hovedsakelig koder for proteiner som funksjonelle molekyler, er ikke-kodende RNA (ncRNA) kjent for å fungere som regulatorer av gener på transkripsjonelle og posttranskripsjonelle nivåer. Imidlertid er studier som involverer deltakelse av ikke-kodende RNAer, spesielt sircRNAer, i regulering av vertenes immungener, ikke godt rapportert sammenlignet med proteinkodende gener.

CircRNA er bredt preget av deres kovalent lukkede kontinuerlige sløyfestruktur, som genereres gjennom en ikke-kanonisk skjøteprosess kalt back-splicing8. Prosessen med tilbakeskjøting, i motsetning til skjøteprosessen av kognitive lineære RNAer, involverer ligering av nedstrøms donorsted til oppstrøms akseptorsted, og danner en sirkulær formet struktur. For tiden er det foreslått tre forskjellige tilbakeskjøtingsmekanismer for biogenese av circRNA. Disse er RNA-bindende protein (RBP) mediert sirkularisering 9,10, intron-paringsdrevet sirkularisering 11 og lariatdrevet sirkularisering12,13,14. Gitt at sirkRNA er koblet ende-til-ende i en sirkulær struktur, har de en tendens til å være naturlig resistente mot normale eksonuklease fordøyelser og anses dermed å være mer stabile enn deres lineære kolleger15. En annen vanlig egenskap utstilt av circRNA inkluderer celle- eller vevstypespesifikt uttrykk i verter16.

Som antydet av deres unike struktur og celle- eller vevsspesifikke uttrykk, har circRNA blitt oppdaget å spille viktige biologiske funksjoner i celler. Til dags dato er en av de fremtredende funksjonene til circRNA deres rolle som mikroRNA (miRNA) svamper17,18. Denne regulatoriske rollen til circRNA skjer gjennom komplementær binding av circRNA-nukleotider med frøområdet av miRNAer. En slik circRNA-miRNA-interaksjon hemmer miRNAenes normale regulatoriske funksjoner på mål-mRNAer, og regulerer dermed ekspresjonen av gener 19,20. I tillegg er circRNA også kjent for å regulere genuttrykk ved å interagere med RNA-bindende proteiner (RBP) og danne RNA-proteinkomplekser21. Selv om circRNA er klassifisert som ikke-kodende RNA, er det også bevis på at circRNA kan fungere som maler for proteinoversettelse22,23,24.

Nylig har circRNA vist seg å spille sentrale roller i reguleringen av vertspatogeninteraksjonene, spesielt mellom vertene og virusene. Generelt antas vertscircRNA å hjelpe til med å regulere vertens immunresponser for å eliminere de invaderende patogenene. Et eksempel på circRNA som fremmer vertsimmunresponser er circRNA_0082633, rapportert av Guo et al.25. Dette circRNA forbedrer type I interferon (IFN) signalering i A549-celler, noe som bidrar til å undertrykke influensavirusreplikasjon25. Videre rapporterte Qu et al. også et humant intronisk circRNA, kalt circRNA AIVR, som fremmer immunitet ved å regulere ekspresjonen av CREB-bindende protein (CREBBP), en signaltransduser av IFN-β26,27. Imidlertid finnes det også circRNA som er kjent for å fremme patogenesen av sykdom ved infeksjon. For eksempel rapporterte Yu et al. nylig rollen spilt av et circRNA spleiset fra GATA sinkfingerdomenet som inneholder 2A-genet (circGATAD2A) for å fremme H1N1-virusreplikasjonen gjennom inhibering av vertscelleautofagi28.

For å effektivt studere circRNAer, implementeres vanligvis en genom-bred circRNA-prediksjonsalgoritme, etterfulgt av en in silico-karakterisering av de forutsagte circRNA-kandidatene før noen funksjonelle studier kan utføres. En slik bioinformatisk tilnærming til å forutsi og karakterisere sircRNA er mindre kostbar og mer tidseffektiv. Det bidrar til å avgrense antall kandidater som skal studeres funksjonelt og kan potensielt føre til nye funn. Her gir vi en detaljert bioinformatikkbasert protokoll for in silico identifikasjon, karakterisering og funksjonell annotasjon av circRNA under vertspatogeninteraksjonene. Protokollen inkluderer identifisering og kvantifisering av circRNA fra RNA-sekvenseringsdatasett, annotering via circBase og karakterisering av circRNA-kandidatene når det gjelder circRNA-typer, antall overlappende gener og forventede circRNA-miRNA-interaksjoner. Denne studien gir også funksjonell annotasjon av circRNA-foreldregenene gjennom genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) anrikningsanalyse.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

I denne protokollen ble avidentifiserte ribosomale RNA (rRNA)-utarmede RNA-seq-bibliotekdatasett fremstilt fra influensa A-virusinfiserte humane makrofagceller lastet ned og brukt fra databasen Gene Expression Omnibus (GEO). Hele bioinformatikkrørledningen fra prediksjon til funksjonell karakterisering av circRNA er oppsummert i figur 1. Hver del av rørledningen er nærmere forklart i avsnittene nedenfor.

1. Forberedelse, nedlasting og oppsett før dataanalyse

MERK: Alle programvarepakker som brukes i denne studien er gratis og åpen kildekode.

  1. Laste ned de nødvendige verktøyene på Linux-plattformen
    1. Last ned og installer nødvendig programvare og verktøy som er oppført i materialfortegnelsen på en datamaskin med høy Linux-ytelse ved hjelp av instruksjonene fra utvikleren.
      MERK: De fleste verktøyene og programvaren har egne GitHub-sider på nettet eller dokumentasjon som inneholder instruksjoner om installasjon og bruk av verktøyene (se materialfortegnelsen).
    2. Last ned de ønskede RNA-seq-datasettene for circRNA-deteksjon og analyse fra sekvensarkivnettsteder (f.eks. European Nucleotides Archive og Gene Expression Omnibus).
    3. Last ned referansegenomet (e) (FASTA-format) og merknadsfilene (GTF / GFF3-format), kompatibelt med verten som RNA-seq-datasettet ble utarbeidet fra. Vertsreferansegenom (er) og merknadsfiler finnes vanligvis på online genomlesere som National Center for Biotechnology Information (NCBI), University of California Santa Cruz (UCSC) og Ensembl nettsteder.
  2. Kvalitetskontroll av RNA-seq
    1. Skriv inn FASTQ-filene i FASTQC-programmet for å bestemme kvaliteten på RNA-sekvenser. Hvis kvaliteten på FASTQ-filene er lav (f.eks. 29,30.

2. Prediksjon og differensialekspresjonsanalyse av circRNA ved bruk av CIRIquant

MERK: En mer detaljert håndbok for installasjon og utførelse av differensialuttrykksanalyse finner du i delen om kodetilgjengelighet i CIRIquant-papiret31. Tilleggsdataene inneholder også noen av de grunnleggende kommandoene som brukes i denne protokollen.

  1. CircRNA-spådommer
    1. Indekser vertens referansegenom først ved hjelp av BWA- og HISAT2-reguleringer. Deretter, på en Linux-terminal, utfør kommandoene bwa index 32 og hisat2-build33 i katalogen til vertens referansegenom for å indeksere den.
    2. Deretter forbereder du en YML-konfigurasjonsfil som inneholder navnet på filen, verktøybanen (BWA, HISAT2, stringtie34, samtools35), banen til de nedlastede referansefilene (vertens referansegenom FASTA-filer, merknadsfiler) og banen til indeksfilene fra trinn 2.1.1.
    3. Kjør CIRIquant-verktøyet fra terminal ved hjelp av enten standard eller manuelle parametere. Brukeren kan spesifisere bibliotekstypen (enten strandet eller ikke-strandet) av RNA-seq-dataene når CIRIquant-verktøyet kjøres.
      MERK: Bibliotekstypen til RNA-seq-dataene kan bestemmes ved å vite hvilken type bibliotekforberedelsessett som brukes. Hvis identiteten til bibliotekforberedelsessettet er ukjent, kan en RNA-seq-kontroll bioinformatisk pakke kalt RSeQC36 brukes til å bestemme strandedness av RNA-seq-data.
  2. Analyse av differensielt uttrykk
    MERK: CIRIquant-pakken inneholder prep_CIRIquant, prepDE.py og CIRI_DE_replicate; Derfor er det ikke nødvendig med flere nedlastinger for disse tre verktøyene.
    1. Klargjør en tekstfil (LST) med en liste over data som inneholder følgende:
      1. kolonne: ID-ene til RNA-seq-dataene som ble brukt i trinn 2.1.3
      2. kolonne: bane til GTF-filene som sendes ut av CIRIquant
      3. kolonne: gruppering av RNA-seq-dataene, enten det er en kontroll- eller behandlingsgruppe.
    2. For et eksempel, se tabell 1 nedenfor.
      MERK: Det er ikke nødvendig å sette i overskriftene som de er bare for referanse.
    3. Kjør prep_CIRIquant på Linux-terminalen med tekstfilen (.lst) som ble utarbeidet i trinn 2.2.1 som inndata. Kjøringen vil generere en liste over filer: library_info.csv, circRNA_info.csv, circRNA_bsj.csv og circRNA_ratio.csv.
    4. Forbered en annen tekstfil med en liste over data som inneholder RNA-seq-IDene og banen til deres respektive StringTie-utdata. Filoppsettet må ligne på tekstfilen i trinn 2.2.1 uten grupperingskolonnen.
    5. Kjør prepDE.py med tekstfilen utarbeidet i trinn 2.2.4 som inndata for å generere gentellingsmatrisefilene.
    6. Utfør CIRI_DE_replicate med library_info.csv- og circRNA_bsj.csv-filene fra trinn 2.2.3 og gene_count_matrix.csv-filen fra trinn 2.2.5 som innganger for å sende ut den endelige circRNA_de.tsv-filen.
  3. Filtrering av DE circRNA
    1. Bruk R (i datamaskinterminalen eller RStudio) eller en hvilken som helst regnearkprogramvare (f.eks. Microsoft Excel) for å åpne circRNA_de.tsv-filen generert fra trinn 2.2.6 for å filtrere og bestemme antall differensielt uttrykte (DE) circRNAer.
    2. Filtrer DE circRNA i henhold til kriteriene LogFC > |2| og FDR < 0,05.
    3. Opprett en fil med navnet DE_circRNAs.txt for å lagre informasjonen om DE circRNAer.

3. Karakterisering og annotering av predikerte DE circRNA

  1. Merknadsstatus for DE circRNA
    1. Last inn filen med navnet DE_circRNAs.txt i RStudio , som består av listen over DE circRNAer filtrert fra trinn 2.3.3. Inkluder annen informasjon som genomiske posisjoner (Chr, Start, End), strengorienteringer (+ eller -), gennavn og circRNA-type. Før du fortsetter, konverter de sircRNA-genomiske startkoordinatene fra CIRIquant til 0-basert ved å trekke 1 basepar.
      MERK: Den andre informasjonen nevnt ovenfor kan fås fra GTF-filene som sendes ut av CIRIquant (tilleggsfil 1).
    2. Bestem merknadsstatusen til de predikerte DE-circRNAene ved å laste ned et bibliotek som inneholder de genomiske posisjonene til circRNA-databasen (f.eks. circBase) deponerte sircRNAer.
      MERK: Forsikre deg om at genomversjonen som brukes til å forutsi circRNAene, er identisk med circRNA-databasebiblioteket før du foretar sammenligningen. CircBase-datafilen som brukes her, er fritt tilgjengelig i stasjonsmappen i Github (https://github.com/bicciatolab/Circr)37.
    3. Når begge filene fra trinn 3.1.1 og trinn 3.1.2 er klargjort, kjører du R-skriptet gitt i tilleggsfil 1. Kromosomale plasseringer av DE circRNA spørres til biblioteket før statusen Annotated eller Unannotated tildeles.
  2. Karakterisering av DE circRNA
    1. Bruk R og annen regnearkprogramvare for å oppsummere antall circRNA i henhold til circRNA-typene (dvs. ekson, intron, intergenisk og antisense) og antall gener som circRNAene spenner over (1 eller >1) (tilleggsfil 1).MERK: CIRIquant kan bare oppdage fire typer circRNA (ekson, intron, intergenisk og antisense). Exon-intron circRNAs, også kjent som ElciRNAs, kan ikke oppdages av CIRIquant.

4. Forutsi circRNA-miRNA-interaksjonen ved hjelp av Circr

MERK: En mer detaljert manual om hvordan du installerer og bruker Circr for circRNA-miRNA-interaksjonsanalysen finner du på: https://github.com/bicciatolab/Circr37.

  1. Klargjøring av filer
    1. Pakk ut og pakk ut innholdet i Circr.zip filen etter å ha lastet den ned fra Circr GitHub-siden ved hjelp av relevant programvare som "WinRar" eller "7-zip" i en ny katalog der analysen skal utføres.
    2. Installer de nødvendige programvarene (miRanda, RNAhybrid, Pybedtools og samtools) før du utfører circRNA-miRNA-analysen.
    3. Referansegenomer og merknadsfiler for flere organismer av interesse, rRNA-koordinatfil, validert miRNA-interaksjonsfil og circBase circRNA-filer leveres av Circr-forfatteren på Github-siden (https://github.com/bicciatolab/Circr) 37. Når du klikker på støttefilene i stasjonsmappen, velger du mappen for organismen av interesse, miRNA-mappen og circBase-tekstfilen og laster den ned.
    4. Etter å ha lastet ned de nødvendige filene i trinn 4.1.3, opprett en ny katalog med navnet support_files i katalogen nevnt i trinn 4.1.1. Deretter pakker du ut og trekker ut innholdet i support_files-katalogen .
    5. Indekser referansegenomfilen til organismen av interesse ved hjelp av kommandoen samtools faidx (tilleggsfil 1).
    6. Forbered en inndatafil som består av koordinatene til DE circRNA av interesse i en tabulatordelt BED-fil, som vist i tabell 2.
      MERK: Fordi circRNA predikert av CIRIquant ikke er 0-basert, er det nødvendig å minus 1 bp ved startkoordinaten (som nevnt i trinn 3.1.1) før du konverterer dem til BED-formatet. Overskriftene vist i tabell 2 er bare ment som referanse og er ikke nødvendige i BED-filene.
    7. På dette tidspunktet må du sørge for at den forventede mappetrestrukturen for Circr-analyse er som i figur 2.
  2. Kjører Circr.py
    1. Utfør Circr.py ved hjelp av Python 3, og som argumenter, spesifiser circRNA-inndatafilen, FASTA-genomet til organismen av interesse, genomversjonen av den valgte organismen, antall tråder og navnet på utdatafilen i kommandolinjen.
    2. Hvis organismen av interesse ikke er angitt i stasjonsmappen som er oppført i trinn 4.1.3, eller hvis brukeren foretrekker å ha et egendefinert sett med filer for å kjøre analysen, må ytterligere kommandoer som angir plasseringen av disse filene, inkluderes når du kjører Circr.py.
    3. Etter at Circr-analysen er fullført, sender programmet ut en circRNA-miRNA-interaksjonsfil i csv-formatet.
    4. Filtrer circRNA-miRNA-interaksjonsresultatene i henhold til den brukerspesifikke preferansen. For denne studien filtreres prediksjonene ved hjelp av Rstudio i henhold til kriteriene nedenfor:
      -Oppdaget av alle tre programvareverktøy
      -To eller flere bindingssteder rapportert av både Targetscan og miRanda
      -Identifisert i kolonnene "AGO" eller "validert"
      -Filtrer ut ingen frø regionen interaksjoner
    5. Skriv circRNAene som sender de filtrerte betingelsene fra trinn 4.2.3 til en ny tekstfil kalt circRNA_miRNA.txt. Slik filtrering kan øke konfidensen til de forutsagte interaksjonene.

5. Bygging av ceRNA-nettverket

MERK: En detaljert håndbok om hvordan du bruker Cytoscape finner du på: http://manual.cytoscape.org/en/stable/ og https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Last ned og klargjør
    1. Last ned den nyeste versjonen av Cytoscape38 fra: https://cytoscape.org/download.html.
    2. Utfør installasjonsveiviseren som ble lastet ned i trinn 5.1.1, og velg filplasseringen for Cytoscape-programvaren.
    3. Forbered en tabulatordelt fil som inneholder circRNAene av interesse og deres mål-miRNA. Den første kolonnen består av circRNA-navnet; den andre kolonnen spesifiserer typen RNA fra den første kolonnen; den tredje kolonnen er målet miRNA; og den fjerde kolonnen spesifiserer typen RNA fra den tredje kolonnen. Et eksempel på filen er vist i tabell 3.
  2. Konstruere ceRNA-nettverkskartet
    1. Åpne Cytoscape-programvaren som ble installert i trinn 5.1.2.
    2. I Cytoscape navigerer du til File > Import > Network from File. Velg filen som er klargjort i trinn 5.1.3.
    3. I den nye fanen velger du den første og andre kolonnen som "Source Node" og "Source Node Attribute" mens du velger den tredje og fjerde kolonnen som henholdsvis "Target Node" og "Target Node Attribute". Klikk OK og nettverket vil dukke opp øverst til høyre i Cytoscape.
    4. For å endre den visuelle stilen til nettverket, trykk på stilknappen på venstre side av Cytoscape.
    5. Trykk pilen på høyre side av Fyllfarge. Velg Type for kolonnen og Diskret tilordning for tilordningstypen. Velg deretter fargen ønsket for hver av RNA-typene.
    6. Etter å ha endret fargen, endre formen på nodene ved å navigere til Form og følge trinn 5.2.5.

6. Analyse av funksjonell berikelse

  1. Gene Ontology (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) analyse for foreldregenet til circRNAene
    1. Sikre clusterProfiler 39,40 og org. Hs.eks.db41 pakker er installert i Rstudio. Organisasjonen. Hs.eks.db41-pakken er en genom-bred merknadspakke bare for mennesker. Hvis organismen av interesse er en annen art, se til: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importer DE_circRNA-informasjonen fra trinn 2.3.1 til Rstudio-arbeidsområdet.
    3. Bruk foreldregenet til circRNAene som er gitt i denne filen for berikelsesanalyse i de kommende trinnene. Men hvis brukeren ønsker å konvertere gensymbolet til andre formater, for eksempel Entrez ID, bruk en funksjon som "bitr".
    4. Ved å bruke gen-ID-en som inndata, kjør GO-berikelsesanalysen ved hjelp av enrichGO-funksjonen i clusterProfiler 39,40-pakken ved hjelp av standardparametere.
    5. Ved å bruke gen-ID-en som inndata, kjør KEGG-berikelsesanalysen ved å bruke enrichKEGG-funksjonen i clusterProfiler 39,40-pakken ved å bruke standardparametrene.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Protokollen vervet i forrige avsnitt ble endret og konfigurert for å passe Linux OS-systemet. Hovedårsaken er at de fleste modulbiblioteker og pakker som er involvert i analysen av circRNAer, bare kan fungere på Linux-plattformen. I denne analysen ble avidentifiserte ribosomale RNA (rRNA)-utarmede RNA-seq-bibliotekdatasett fremstilt fra influensa A-virusinfiserte humane makrofagceller lastet ned fra GEO-databasen42 og brukt til å generere de representative resultatene.

CircRNA-prediksjon og kvantifisering
I denne analysen ble ribosomale RNA (rRNA)-utarmede RNA-seq-bibliotekdatasett fremstilt fra influensa A-virusinfiserte humane makrofagceller brukt til å utføre circRNA-deteksjon og funksjonsanalyse. Som spesifisert i protokollseksjonen ble CIRIquant brukt til å identifisere og utføre DE-analyse av identifiserte circRNA ved hjelp av RNA-seq-bibliotekdatasettene som inngang. Referansefiler som brukes er basert på den nyeste humane genomversjonen (hg38). Tabell 4 viser et eksempel på det endelige resultatet fra CIRIquant-analysen. Identifisering og filtrering av DE circRNA fra CIRIquant-utdata ble utført gjennom enkle RStudio-skript (tilleggsfil 1). CircRNA klassifiseres bare som DE når FDR-verdien (false-discovery rate) er <0,05 og logfoldendring (LogFC) >|2|. Tabell 5 viser totalt antall circRNA og DE circRNA påvist. Totalt 35 846 circRNA ble detektert, hvorav 306 var DE. DE circRNAene som oppdages i denne produksjonen er fullstendig oppregulert (LogFC > 2), og ingen blir nedregulert (LogFC < 2).

Annotasjon og karakterisering av DE circRNA
Merknadsstatus for DE circRNA
DE circRNA som ble identifisert ble kryssjekket med en etablert circRNA-database, circBase. Men siden circRNA-koordinatene deponert i circBase er basert på en tidligere human genomversjon (hg19), må circRNA-koordinatene fra circBase konverteres til den nåværende humane genomversjonen (hg38) for kryssjekking i denne studien. I tillegg må startkoordinaten konverteres til 0-basert fra 1-baserte utdata fra CIRIquant. De hg38-versjonskonverterte circRNA-koordinatene til circBase leveres i en stasjonsmappe i Github (https://github.com/bicciatolab/Circr)37. Deretter ble Rstudio-skriptene (tilleggsfil 1) brukt til å tilordne merknadsstatusen til circRNA i en ny datarammekolonne. Tabell 6 viser et eksempel på circRNA med merknadsstatus.

Karakterisering av DE circRNA
Denne delen ble i sin helhet utført gjennom R-skript i RStudio-programvaren. R-skript letter de analytiske prosessene, og bare grunnleggende kunnskap er nødvendig.

CircRNA-typer
I dette trinnet ble DE circRNA preget av deres circRNA-typer (Antisense, Exonic, Intergenic og Intronic) basert på deres genomiske posisjoner. Tabell 7 nedenfor viser prosentvis fordeling av de forskjellige circRNA-typene som omfattes av de identifiserte DE-circRNAene. Av de totalt 306 DE circRNAene ble 263 circRNA (85,95%) identifisert som eksoniske circRNAer, som er den mest tallrike circRNA-typen som ble identifisert. Introniske circRNA kommer inn som den nest mest identifiserte circRNA-typen som består av 17 DE circRNAer, og utgjør opptil 5,56% av de totale DE-circRNAene. Dette etterfølges av intergeniske circRNA (16 DE circRNA ~ 5,23%) og antisense circRNA (10 DE circRNA ~ 3,27%).

Antall gener som spenner over per circRNA
CircRNA identifisert av CIRIquant kan overlappe på tvers av en rekke gener. Til dags dato er de fleste studier fokusert på circRNA som spenner over ett gen. I denne protokollen er derfor circRNA-kandidatene som spenner over mer enn ett gen ekskludert fra nedstrømsanalysen. Tabell 8 nedenfor beskriver antall og prosentandel av DE circRNA som spenner over ett og mer enn ett gen. I denne tabellen er intergeniske circRNA (16 DE circRNAs) ekskludert siden de ikke overlapper noen vertsgener, mens resten av circRNA-typene (290 DE circRNAs) blir utsatt for denne analysen. Av de 290 DE circRNAene spenner flertallet av DE circRNAene (261 circRNA ~ 90%) bare ett gen, mens de resterende 29 circRNAene (~ 10%) spenner over mer enn ett gen.

Bygging av ceRNA-nettverket
Et ceRNA-nettverk tegnes vanligvis for å visualisere circRNA-miRNA-interaksjonene etter at det har blitt spådd. I figur 3 nedenfor ble bare ett DE circRNA valgt som et representativt resultat, som er det hsa_DE_58 circRNA. Basert på Circr-prediksjoner kan hsa_DE_58 svampe opptil ni forskjellige miRNAer. Disse ni miRNAene identifiseres etter filtrering gjennom strenge kriterier.

Analyse av funksjonell berikelse
GO og KEGG analyse av circRNA foreldregener
Figur 4 nedenfor viser et bobleplott av funksjonell anrikning av DE circRNA-foreldregener gjennom GO-analysen. I utgangspunktet tar GO-analysen sikte på å avdekke de biologiske prosessene, cellulære steder og molekylære funksjoner som er beriket eller påvirket i tilstanden som studeres, i dette tilfellet den virusinfiserte prøven. Anrikningen regnes som statistisk signifikant og plottes på bobleplottet bare hvis p-verdien er < 0,01. Som vist i figur 4 inkluderer de tre øverste anrikningene for de biologiske prosessene (BP) ribonukleoproteinkompleksets biogenese, responsen på virus og reguleringen av respons på en biotisk stimulus, mens for molekylære funksjoner (MF) er bare den katalytiske aktiviteten som virker på RNA og enkeltstrenget RNA-binding statistisk beriket. På den annen side er bare retromerkomplekset statistisk beriket for de cellulære komponentene (CC).

Figur 5 viser KEGG-anrikningsanalysen av DE circRNA-foreldregenene i et bobleplott. I likhet med GO-anrikningsanalysen anses KEGG-anrikning bare som statistisk signifikant og plottes på et bobleplott hvis p-verdien er < 0,01. Bare to KEGG-termer ble beriket i dette tilfellet, som er influensa A og viral livssyklus (HIV-1) veier.

Figure 1
Figur 1: Rørledningen for prediksjon og funksjonell karakterisering av circRNA. Rørledningen viser en enkel oversikt over de viktigste trinnene fra start til slutt som involverer installasjon av nødvendige programvarepakker, forutsi og kvantifisere circRNA-uttrykket, konstruksjon av ceRNA-nettverket og utføre circRNA-foreldregenfunksjonell berikelse. Klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Mappetrestruktur for Circr. Denne mappetrestrukturen er nødvendig å etablere før du kjører Circr-programvaren for å oppdage de nødvendige filene for analysen. Klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: ceRNA-nettverk bestående av circRNA-miRNA-interaksjonen. Den blå ovale formen representerer circRNA, mens de oransje trekantene representerer miRNAene. De faste linjene som forbinder circRNA med miRNA beskriver den potensielle miRNA-svampfunksjonen til det hsa_DE_58 circRNA. Klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Bobleplott av GO-anrikningsanalyse av DE circRNA-foreldregener. GeneRatio på x-aksen er antall gener i inngangslisten assosiert med det gitte GO-begrepet som deler det totale antall inngangsgener. Prikkstørrelsen i plottet er representert av telleverdien, som er antall gener i inngangslisten knyttet til det gitte GO-begrepet. Jo større størrelsen på prikkene er, desto større er antall inngangsgener knyttet til begrepet. Dessuten er prikkene i plottet fargekodet basert på p-verdien. P-verdi beregnes ved å sammenligne den observerte frekvensen av en merknadsterm med frekvensen som forventes ved en tilfeldighet. De enkelte termene anses beriket utover en grenseverdi (p-verdi < 0,01). Fargegradienten til p-verdien fra blå til rød indikerer økende berikelse av termene. Klikk her for å se en større versjon av denne figuren.

Figure 5
Figur 5: KEGG-anrikningsanalyse av DE circRNA-foreldregener. GeneRatio på x-aksen er antall gener i inngangslisten knyttet til det gitte KEGG-begrepet som deler det totale antallet inngangsgener. Prikkstørrelsen i plottet er representert av telleverdien, som er antall gener i inngangslisten knyttet til det gitte KEGG-begrepet. Jo større størrelsen på prikkene er, desto større er antall inngangsgener knyttet til begrepet. Dessuten er prikkene i plottet fargekodet basert på p-verdien. P-verdi beregnes ved å sammenligne den observerte frekvensen av en merknadsterm med frekvensen som forventes ved en tilfeldighet. Enkelttermer anses å være beriket utover en grenseverdi (p-verdi < 0,01). Fargegradienten for p-verdi fra blå til rød indikerer økende berikelse av termer. Klikk her for å se en større versjon av denne figuren.

Eksempel på navn Bane til CIRIquant-utdata GTF-fil Gruppering
Kontroll 1 /path/to/CIRIquant/ctrl1.gtf C
Kontroll 2 /path/to/CIRIquant/ctrl2.gtf C
Smittet 1 /path/to/CIRIquant/infect1.gtf T
Smittet 2 /path/to/CIRIquant/infect2.gtf T

Tabell 1: LST-filforberedelsen av CIRIquant. Målbanene til kontrollprøvene og behandlede prøver fra CIRIquant-utdataene skrives i en tekstfil for å sammenligne uttrykkene for circRNA mellom de to utvalgstypene.

Chr Start Slutt Navn . Strand
Chr2 137428930 137433876 hsa_circ_000076 . -
Chr2 154705868 154706632 hsa_circ_000105 . -
Chr2 159104273 159106793 hsa_circ_000118 . -
Chr2 159215701 159226125 hsa_circ_000119 . -
chr4 39980067 39980129 hsa_circ_002584 . -

Tabell 2: Eksempel på BED-fil for Circr. Seks kolonner (Chr, Start, End, Name, Gene og Strand) tilknyttet circRNAene kreves for å generere BED-filen.

circRNA_name Type miRNA_name Type
DE_circRNA_1 circRNA miR-001 Mirna
DE_circRNA_1 circRNA miR-002 Mirna
DE_circRNA_2 circRNA miR-003 Mirna
DE_circRNA_2 circRNA miR-004 Mirna

Tabell 3: Cytoscape-inndatafil. Fire kolonner (circRNA_name, Type, miRNA_name og Type) må skrives inn i en tekstfil.

CircRNA logFC logCPM LR P-verdi DE FDR
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
Chr14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tabell 4: Del av den endelige utdatafilen (.csv) til CIRIquant. CIRIquant leverer informasjon som LogFC, loggantall per million (LogCPM), logistisk regresjon (LR), p-verdi, differensialuttrykk og FDR.

CIRIquant resultater
Total DE Opp Ned
35846 306 306 0

Tabell 5: En oppsummering av antall identifiserte totale og differensielt uttrykte (DE) circRNAer. Totalt 35 846 circRNA er detektert, hvorav 306 er DE circRNAer. Alle de 306 DE circRNAene er oppregulert (uten at noen blir nedregulert) i behandlede prøver sammenlignet med kontrollprøver.

Custom_Name Annotation_Status
hsa_DE_22 Ikke-kommentert
hsa_DE_2 Kommenterte
hsa_DE_58 Ikke-kommentert
hsa_DE_3 Kommenterte

Tabell 6: Tabell over egendefinerte circRNA-navn med merknadsstatus. CircRNA spørres i en database over kjente deponerte circRNA (circBase). Hvis circRNA er tilstede i databasen, er det merket for å bli annotert, mens fraværet av circRNA er merket som ikke-annotert.

CircRNA Type Freq Prosent
Antisens 10 3.27%
Ekson 263 85.95%
Intergenisk 16 5.23%
Intron 17 5.56%

Tabell 7: Typer circRNA identifisert. CircRNA kan videre kategoriseres i forskjellige typer circRNA basert på deres sekvensregion, nemlig eksonisk, intronisk, antisens og intergenisk.

Antall foreldregener Freq Prosent
1 261 90%
> 1 29 10%

Tabell 8: Andel circRNA med ulikt antall gener spennvidde. CircRNA er vanligvis kodet fra eksoner av ett gen, men circRNA som spenner over mer enn ett gen kan også detekteres av CIRIquant.

Tilleggsfil 1: Skript som brukes i protokollen. Klikk her for å laste ned denne filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

For å illustrere nytten av denne protokollen ble RNA-seq fra influensa A-virusinfiserte humane makrofagceller brukt som eksempel. CircRNA som fungerer som potensielle miRNA-svamper i vertspatogen-interaksjoner og deres GO og KEGG funksjonelle berikelse i en vert ble undersøkt. Selv om det finnes en rekke circRNA-verktøy tilgjengelig online, er hver av dem en frittstående pakke som ikke samhandler med hverandre. Her setter vi sammen noen av verktøyene som kreves for sircRNA-prediksjon og kvantifisering, circRNA-funksjonell berikelse, circRNA-miRNA-interaksjonsprediksjon og ceRNA-nettverkskonstruksjon. Denne strømlinjeformede protokollen er tidsbesparende og kan brukes på kliniske prøver for å oppdage circRNA-kandidater med diagnostiske og prognostiske verdier.

I hovedsak brukte vi CIRIquant31, et circRNA-kvantifiseringsverktøy ferdigpakket med CIRI2, som kan oppdage og utføre DE-analyse av circRNAer. DE circRNA filtreres basert på en grenseverdi for LogFC > |2| og FDR < 0,05, noe som bidrar til å eliminere potensielle falske positive i nedstrømsanalyser. Karakterisering av DE circRNA når det gjelder merknadsstatus, circRNA-typer og antall gener som spenner over hjelp til å kategorisere og videre filtrere circRNA-kandidater. Deretter brukes Circr37, et circRNA-miRNA-prediksjonsverktøy, til å forutsi potensielle miRNA-svampkandidater. Etter å ha forutsagt potensielle miRNA som mål for circRNAer, tegnes et ceRNA-nettverk. Til slutt, basert på foreldregenene til circRNAer, brukes R clusterProfiler-pakken39 til funksjonell annotasjon via GO og KEGG-baneberikelsesanalysen. Resultater fra GO og KEGG kan bidra til å avdekke de biologiske mekanismene påvirket av circRNA.

Til dags dato har flere forskjellige sircRNA-prediksjonsverktøy blitt utviklet, inkludert CIRI2 43, CIRCexplorer244, find_circ 45, MapSplice 46 og UROBORUS 47. I en studie utført av Hansen et al. rapporteres CIRI2 å ha en høy samlet ytelse. Det er blant de få sircRNA-deteksjonsverktøyene som kan fungere godt når det gjelder de novo prediksjon og reduksjon av falsk positiv identifikasjon48. CIRIquant, som benytter CIRI2 til circRNA-deteksjon og kvantifisering, ble derfor brukt i denne studien. CIRIquant ble brukt til å telle BSJ-avlesningene (back splice junction), og telledataene ble normalisert til avlesningene kartlagt til kognitive lineære RNA transkribert fra samme genloci. Dette tillater kvantifisering av circRNA i en prøve. For å bestemme differensialuttrykket av circRNA på tvers av eksperimentelle forhold, implementerte CIRIquant en generalisert lineær modell i edgeR49 for DE-analyse, og den eksakte hastighetsforholdstesten ble brukt som en statistisk test for å bestemme betydningen av forskjellen i circRNA-kryssforholdet. Selv om andre circRNA-kvantifiseringsverktøy som CIRCexplorer3-CLEAR50 kan brukes til å kvantifisere ekspresjonsnivået til circRNAer, tillater dette verktøyet bare circRNA-kvantifisering i en prøve når det teller BSJ-avlesningene i en prøve og normaliserer telledataene mot de kognitive lineære RNA-tellingene fra samme prøve. CIRCexplorer3-CLEAR kan ikke sammenligne circRNA-uttrykk på tvers av eksperimentelle forhold. Videre er det ikke implementert noe statistisk analyseverktøy i CIRCexplorer3-CLEAR for å støtte det kvantifiserte uttrykksnivået. Selv om standard circRNA-prediksjonsverktøy implementert i CIRIquant er CIRI2, kan prediksjonsresultatene fra andre verktøy som find_circ og CIRCexplorer2 også brukes til kvantifisering og DE-analyse31. I denne protokollen ble bare ett sircRNA-prediksjonsverktøy (CIRI2) brukt til prediksjon, noe som fortsatt kan gi falske positive circRNA-kandidater. For å redusere falske positiver kan man kombinere andre prediksjonsverktøy for circRNA for analyse og velge vanlige circRNA oppdaget blant de forskjellige circRNA-prediksjonsverktøyene48,51. For ytterligere å forbedre circRNA-deteksjon, er det ideelt å bruke RNA-sekvenseringsdatasett som både er rRNA-utarmet og utsatt for RNase R-forbehandling.

Avhengig av formålet med studien kan de novo og annoterte DE-circRNA identifiseres separat basert på circBase-databasen52. Imidlertid krever sircRNA som spenner over mer enn ett gen ofte manuell undersøkelse på UCSC eller en annen genomleser for å bestemme ektheten av circRNA og eliminere falske positiver. Ikke desto mindre har circRNA som spenner over mer enn ett gen, for eksempel sircRNA avledet fra fusjonsgener, også blitt rapportert nylig53,54.

Circr fungerer ved å kombinere tre forskjellige miRNA-mRNA-prediksjonsalgoritmer, nemlig TargetScan55, miRanda 56 og RNAhybrid57 for å forutsi circRNA-miRNA-bindingsstedene. På toppen av det inkorporerer algoritmen også informasjon om AGO-topper og tidligere validerte interaksjoner i circRNA-miRNA-analysen. Her ble strenge filtreringskriterier brukt for å tillate en mer pålitelig sircRNA-miRNA-prediksjon å oppnås, og dermed redusere falske positiver ytterligere. Strengheten i dette filtreringstrinnet kan imidlertid angis høyere eller lavere, avhengig av brukerens preferanser.

ClusterProfiler er en veldokumentert R-pakke som funksjonelt kan kommentere gensett på tvers av ulike organismer. I tillegg til funksjonene i R clusterProfiler-pakken nevnt i denne protokollen (enrichGO og enrichKEGG), som bruker overrepresentasjonsanalyse, er det også andre funksjoner som gseGO og gseKEGG som kan brukes. Hvis clusterProfiler ikke er et passende valg for arbeidsflyten, finnes det også andre verktøy og pakker som "AllEnricher"58 eller de nettbaserte verktøyene som "Metascape"59 som funksjonelt kan kommentere et sett med gener. Til slutt, selv om rørledningen gitt ovenfor hjelper til med å forutsi potensielle circRNA og deres funksjonelle merknader, vil våtlaboratorieverifisering være nødvendig for å gi solid bevis.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Forfatteren vil gjerne takke Tan Ke En og Dr. Cameron Bracken for deres kritiske gjennomgang av dette manuskriptet. Dette arbeidet ble støttet av tilskudd fra Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) og University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Retraksjon utgave 188 sirkulært RNA circRNA vert-patogen interaksjon
<em>I Silico</em> Identifisering og karakterisering av circRNA under vertspatogeninteraksjoner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter