Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

I Silico Identifiering och karakterisering av circRNA under värd-patogeninteraktioner

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Protokollet som lämnas in här förklarar den kompletta in silico-pipeline som behövs för att förutsäga och funktionellt karakterisera circRNA från RNA-sekvenseringstranskriptomdata som studerar värd-patogeninteraktioner.

Abstract

Cirkulära RNA (circRNA) är en klass av icke-kodande RNA som bildas via back-splitsning. Dessa circRNA studeras främst för deras roller som regulatorer av olika biologiska processer. I synnerhet visar nya bevis att värd-circRNA kan uttryckas differentiellt (DE) vid infektion med patogener (t.ex. influensa och koronavirus), vilket tyder på en roll för circRNA vid reglering av värdmedfödda immunsvar. Undersökningar av cirRNA: s roll under patogena infektioner begränsas emellertid av de kunskaper och färdigheter som krävs för att utföra den nödvändiga bioinformatiska analysen för att identifiera DE-circRNA från RNA-sekvenseringsdata (RNA-seq). Bioinformatisk förutsägelse och identifiering av circRNA är avgörande före någon verifiering och funktionella studier med kostsamma och tidskrävande våtlaboratorietekniker. För att lösa detta problem tillhandahålls ett steg-för-steg-protokoll för in silico-förutsägelse och karakterisering av circRNA med hjälp av RNA-seq-data i detta manuskript. Protokollet kan delas in i fyra steg: 1) Prediktion och kvantifiering av DE-circRNA via CIRIquant-pipelinen; 2) Annotering via circBase och karakterisering av DE-circRNA; 3) CircRNA-miRNA-interaktionsförutsägelse genom Circr-pipeline; 4) funktionell anrikningsanalys av circRNA-föräldragener med hjälp av Gene Ontology (GO) och Kyoto Encyclopedia of Genes and Genomes (KEGG). Denna pipeline kommer att vara användbar för att driva framtida in vitro - och in vivo-forskning för att ytterligare avslöja rollen av circRNA i värd-patogeninteraktioner.

Introduction

Värd-patogeninteraktioner representerar ett komplext samspel mellan patogenerna och värdorganismerna, vilket utlöser värdarnas medfödda immunsvar som så småningom resulterar i avlägsnande av invaderande patogener 1,2. Under patogena infektioner regleras en mängd av värdens immungener för att hämma replikation och frisättning av patogener. Vanliga interferonstimulerade gener (ISG) som regleras vid patogena infektioner inkluderar exempelvis ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I och OASL 3,4. Förutom proteinkodande gener har studier också rapporterat att icke-kodande RNA såsom långa icke-kodande RNA (lncRNA), mikroRNA (miRNA) och cirkulära RNA (circRNA) också spelar en roll och regleras samtidigt under patogena infektioner 5,6,7. I motsats till proteinkodande gener som huvudsakligen kodar för proteiner som funktionella molekyler, är icke-kodande RNA (ncRNA) kända för att fungera som regulatorer av gener på transkriptions- och posttranskriptionsnivåer. Studier som involverar deltagande av icke-kodande RNA, särskilt circRNA, i regleringen av värdarnas immungener är emellertid inte väl rapporterade jämfört med de proteinkodande generna.

CircRNA kännetecknas allmänt av deras kovalent slutna kontinuerliga slingstruktur, som genereras genom en icke-kanonisk skarvningsprocess som kallas back-splitsning8. Processen för back-splitsning, till skillnad från skarvningsprocessen av kognatlinjära RNA, innefattar ligering av nedströms givarplatsen till uppströms acceptorstället och bildar en cirkulärformad struktur. För närvarande har tre olika back-splitsningsmekanismer för biogenes av circRNA föreslagits. Dessa är RNA-bindande protein (RBP) medierad cirkularisering 9,10, intronparningsdriven cirkularisering 11 och lariatdriven cirkularisering12,13,14. Med tanke på att cirkulärRNA är anslutna från ände till ände i en cirkulär struktur tenderar de att vara naturligt resistenta mot normala exonukleasuppslutningar och anses därför vara mer stabila än deras linjära motsvarigheter15. En annan vanlig egenskap som uppvisas av circRNA inkluderar cell- eller vävnadstypspecifikt uttryck i värdar16.

Som antyds av deras unika struktur och cell- eller vävnadsspecifika uttryck har circRNA upptäckts spela viktiga biologiska funktioner i celler. Hittills är en av de framträdande funktionerna hos circRNA deras roll som mikroRNA (miRNA) svampar17,18. Denna reglerande roll av circRNA sker genom komplementär bindning av circRNA-nukleotider med fröregionen av miRNA. En sådan circRNA-miRNA-interaktion hämmar miRNA: s normala reglerande funktioner på mål-mRNA och reglerar därmed uttrycket av gener19,20. Dessutom är circRNA också kända för att reglera genuttryck genom att interagera med RNA-bindande proteiner (RBP) och bilda RNA-proteinkomplex21. Även om circRNA klassificeras som icke-kodande RNA, finns det också bevis för att circRNA kan fungera som mallar för proteinöversättning22,23,24.

Nyligen har circRNA visat sig spela avgörande roller för att reglera värd-patogeninteraktionerna, särskilt mellan värdarna och virusen. I allmänhet antas värd-circRNA hjälpa till att reglera värdens immunsvar för att eliminera de invaderande patogenerna. Ett exempel på circRNA som främjar värdens immunsvar är circRNA_0082633, rapporterat av Guo et al.25. Detta circRNA förbättrar typ I-interferon (IFN) signalering inom A549-celler, vilket hjälper till att undertrycka influensavirusreplikation25. Dessutom rapporterade Qu et al. också ett humant introniskt circRNA, kallat circRNA AIVR, som främjar immunitet genom att reglera uttrycket av CREB-bindande protein (CREBBP), en signalgivare av IFN-β26,27. Emellertid finns också circRNA som är kända för att främja patogenesen av sjukdom vid infektion. Till exempel rapporterade Yu et al. nyligen den roll som spelas av ett circRNA splitsat från GATA-zinkfingerdomänen innehållande 2A-genen (circGATAD2A) för att främja H1N1-virusreplikationen genom hämning av värdcellautofagi28.

För att effektivt studera circRNA implementeras vanligtvis en genomomfattande circRNA-prediktionsalgoritm, följt av en in silico-karakterisering av de förutsagda circRNA-kandidaterna innan några funktionella studier kan utföras. Ett sådant bioinformatiskt tillvägagångssätt för att förutsäga och karakterisera circRNA är billigare och mer tidseffektivt. Det bidrar till att förfina antalet kandidater som ska studeras funktionellt och kan potentiellt leda till nya fynd. Här tillhandahåller vi ett detaljerat bioinformatikbaserat protokoll för in silico-identifiering , karakterisering och funktionell annotering av circRNA under värd-patogeninteraktionerna. Protokollet inkluderar identifiering och kvantifiering av circRNAs från RNA-sekvenseringsdataset, annotering via circBase, och karakterisering av circRNA-kandidaterna i termer av circRNA-typer, antal överlappande gener och förutsagda circRNA-miRNA-interaktioner. Denna studie ger också funktionell annotering av de circRNA-föräldragenerna genom Gene Ontology (GO) och Kyoto Encyclopedia of Genes and Genomes (KEGG) anrikningsanalys.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

I detta protokoll laddades avidentifierade ribosomala RNA (rRNA)-utarmade RNA-seq-biblioteksdataset framställda från influensa A-virusinfekterade humana makrofagceller ner och användes från databasen Gene Expression Omnibus (GEO). Hela bioinformatikpipelinen från prediktion till funktionell karakterisering av circRNA sammanfattas i figur 1. Varje del av rörledningen förklaras närmare i avsnitten nedan.

1. Förberedelse, nedladdning och installation före dataanalys

OBS: Alla programvarupaket som används i denna studie är gratis och öppen källkod.

  1. Ladda ner de nödvändiga verktygen på Linux-plattformen
    1. Ladda ner och installera nödvändig programvara och verktyg som anges i materialförteckningen på en Linux-högpresterande dator med hjälp av instruktionerna från utvecklaren.
      De flesta verktyg och programvara har sina egna GitHub-sidor online eller dokumentation som innehåller instruktioner om hur du installerar och använder deras verktyg (se materialförteckningen).
    2. Ladda ner önskade RNA-seq-dataset för circRNA-detektion och analys från sekvensarkivwebbplatser (t.ex. European Nucleotides Archive och Gene Expression Omnibus).
    3. Ladda ner referensgenomet (FASTA-format) och annoteringsfilerna (GTF / GFF3-format), kompatibla med värden från vilken RNA-seq-datasetet framställdes. Värdreferensgenom (er) och anteckningsfiler finns vanligtvis på online-genomwebbläsare som National Center for Biotechnology Information (NCBI), University of California Santa Cruz (UCSC) och Ensembl-webbplatserna.
  2. Kvalitetskontroll av RNA-seq
    1. Mata in FASTQ-filerna i FASTQC-programmet för att bestämma kvaliteten på RNA-sekvenser. Om kvaliteten på FASTQ-filerna är låg (t.ex. 29,30.

2. Prediktion och differentialuttrycksanalys av circRNA med CIRIquant

OBS: En mer detaljerad manual om installation och utförande av differentialuttrycksanalys finns i avsnittet om kodtillgänglighet i CIRIquant paper31. Kompletterande data innehåller också några av de grundläggande kommandon som används i detta protokoll.

  1. CircRNA förutsägelser
    1. Indexera värdens referensgenom först med hjälp av BWA- och HISAT2-justerare. På en Linux-terminal kör du sedan kommandona bwa index 32 och hisat2-build33 i katalogen för värdens referensgenom för att indexera det.
    2. Förbered sedan en YML-konfigurationsfil som innehåller namnet på filen, sökvägen till verktygen (BWA, HISAT2, stringtie34, samtools35), sökvägen till de nedladdade referensfilerna (värdens referensgenom-FASTA-filer, anteckningsfiler) och sökvägen till indexfilerna från steg 2.1.1.
    3. Kör CIRIquant-verktyget från terminal med antingen standardparametrarna eller manuella parametrar. Användaren kan ange bibliotekstypen (antingen strängad eller icke-strängad) för RNA-seq-data när CIRIquant-verktyget körs.
      OBS: Bibliotekstypen för RNA-seq-data kan bestämmas genom att känna till vilken typ av biblioteksberedningssats som används. Om identiteten på biblioteksberedningssatsen är okänd kan ett RNA-seq-kontrollbioinformatiskt paket som heter RSeQC36 användas för att bestämma strängheten hos RNA-seq-data.
  2. Analys av differentiellt uttryck
    CIRIquant-paketet innehåller prep_CIRIquant, prepDE.py och CIRI_DE_replicate; Därför behövs inga ytterligare nedladdningar för dessa tre verktyg.
    1. Förbered en textfil (.lst) med en lista med data som innehåller följande:
      Kolumn 1: ID för RNA-seq-data som användes i steg 2.1.3
      2:a kolumnen: sökväg till GTF-filerna som matas ut av CIRIquant
      3:e kolumnen: gruppering av RNA-seq-data, oavsett om det är en kontrollgrupp eller behandlad grupp.
    2. Ett exempel finns i tabell 1 nedan.
      OBS: Det är inte nödvändigt att lägga in rubrikerna eftersom de bara är för referens.
    3. På Linux-terminalen kör du prep_CIRIquant med textfilen (.lst) som förbereddes i steg 2.2.1 som indata. Körningen genererar en lista med filer: library_info.csv, circRNA_info.csv, circRNA_bsj.csv och circRNA_ratio.csv.
    4. Förbered en andra textfil med en lista över data som innehåller RNA-seq-ID:n och sökvägen till deras respektive StringTie-utdata. Fillayouten måste likna textfilen i steg 2.2.1 utan grupperingskolumnen.
    5. Kör prepDE.py med textfilen som förbereddes i steg 2.2.4 som indata för att generera matrisfilerna för genantal.
    6. Kör CIRI_DE_replicate med library_info.csv- och circRNA_bsj.csv filerna från steg 2.2.3 och gene_count_matrix.csv filen från steg 2.2.5 som indata för att mata ut den slutliga circRNA_de.tsv-filen.
  3. Filtrering av DE-circRNA
    1. Använd R (i datorns terminal eller RStudio) eller något kalkylprogram (t.ex. Microsoft Excel) för att öppna filen circRNA_de.tsv som genererades från steg 2.2.6 för att filtrera och bestämma antalet differentiellt uttryckta (DE) circRNA.
    2. Filtrera DE-circRNA enligt kriterierna LogFC > |2| och FDR < 0,05.
    3. Skapa en fil med namnet DE_circRNAs.txt för att lagra informationen om DE-circRNA.

3. Karakterisering och annotering av förutsagda DE-circRNA

  1. Annoteringsstatus för DE-circRNA
    1. Ladda filen med namnet DE_circRNAs.txt i RStudio , som består av listan över DE-circRNA filtrerade från steg 2.3.3. Inkludera annan information såsom genomiska positioner (Chr, Start, End), strängorienteringar (+ eller -), gennamn och circRNA-typ. Innan du fortsätter, konvertera de circRNA genomiska startkoordinaterna från CIRIquant till 0-baserade genom att subtrahera 1 baspar.
      OBS: Den övriga informationen som anges ovan kan erhållas från GTF-filerna som matas ut av CIRIquant (kompletterande fil 1).
    2. Bestäm annoteringsstatusen för de förutsagda DE-circRNAs genom att ladda ner ett bibliotek som innehåller de genomiska positionerna för circRNA-databasen (t.ex. circBase) deponerade circRNAs.
      OBS: Försäkra dig om att genomversionen som används för att förutsäga circRNA är identisk med circRNA-databasbiblioteket innan du gör jämförelsen. Den circBase-datafil som används här är fritt tillgänglig i enhetsmappen i Github (https://github.com/bicciatolab/Circr)37.
    3. När båda filerna från steg 3.1.1 och steg 3.1.2 har förberetts kör du R-skriptet som anges i tilläggsfil 1. Kromosomala platser för DE-circRNA efterfrågas i biblioteket innan statusen Annotated eller Unannotated.
  2. Karakterisering av DE-circRNA
    1. Använd R och annan kalkylprogramvara för att sammanfatta antalet circRNA enligt circRNA-typerna (dvs. exon, intron, intergen och antisense) och antalet gener som circRNA spänner över (1 eller >1) (kompletterande fil 1).CIRIquant kan bara detektera fyra typer av circRNA (exon, intron, intergen och antisens). Exon-intron circRNA, även känd som ElciRNA, kan inte detekteras med CIRIquant.

4. Förutsäga circRNA-miRNA-interaktionen med hjälp av Circr

OBS: En mer detaljerad manual om hur man installerar och använder Circr för circRNA-miRNA-interaktionsanalysen finns på: https://github.com/bicciatolab/Circr37.

  1. Förberedelse av filer
    1. Packa upp och extrahera innehållet i Circr.zip filen efter att ha laddat ner den från Circr GitHub-sidan med relevant programvara som "WinRar" eller "7-zip" till en ny katalog där analysen kommer att utföras.
    2. Installera nödvändiga program (miRanda, RNAhybrid, Pybedtools och samtools) innan du utför circRNA-miRNA-analysen.
    3. Referensgenom och annoteringsfiler för flera organismer av intresse, rRNA-koordinatfil, validerad miRNA-interaktionsfil och circBase-circRNA-filer tillhandahålls av Circr-författaren på Github-sidan (https://github.com/bicciatolab/Circr)37. När du klickar på supportfilerna i enhetsmappen väljer du mappen för organismen av intresse, miRNA-mappen och circBase-textfilen och laddar ner den.
    4. När du har hämtat de nödvändiga filerna i steg 4.1.3 skapar du en ny katalog med namnet support_files i katalogen som nämns i steg 4.1.1. Packa sedan upp och extrahera innehållet till support_files-katalogen .
    5. Indexera referensgenomfilen för organismen av intresse med kommandot samtools faidx (Supplementary File 1).
    6. Förbered en indatafil som består av koordinaterna för DE-circRNA av intresse i en tabbavgränsad BED-fil, som visas i tabell 2.
      OBS: Eftersom circRNA som förutsägs av CIRIquant inte är 0-baserade, är det nödvändigt att minus 1 bp vid startkoordinaten (som nämns i steg 3.1.1) innan de konverteras till BED-formatet. Rubrikerna som visas i tabell 2 är bara för referens och behövs inte i BED-filerna.
    7. Kontrollera nu att den förväntade mappträdstrukturen för Circr-analys är som i figur 2.
  2. Löpande Circr.py
    1. Kör Circr.py med Python 3, och som argument, ange circRNA-indatafilen, FASTA genomet för organismen av intresse, genomversionen av den valda organismen, antalet trådar och namnet på utdatafilen i kommandoraden.
    2. Om organismen av intresse inte finns i enhetsmappen som anges i steg 4.1.3 eller om användaren föredrar att ha en anpassad uppsättning filer för att köra analysen, måste ytterligare kommandon som anger platsen för dessa filer inkluderas när Circr.py körs.
    3. När Cirr-analysen är klar matar programmet ut en circRNA-miRNA-interaktionsfil i csv-formatet.
    4. Filtrera circRNA-miRNA-interaktionsresultaten enligt de användarspecifika inställningarna. För denna studie filtreras förutsägelserna med hjälp av Rstudio enligt kriterierna nedan:
      -Upptäckt av alla tre programverktyg
      -Två eller flera bindningsställen rapporterade av både Targetscan och miRanda
      -Identifierad i kolumnerna "AGO" eller "validerad"
      -Filtrera bort inga interaktioner i fröregionen
    5. Skriv de circRNA som passerar de filtrerade villkoren från steg 4.2.3 till en ny textfil med namnet circRNA_miRNA.txt. Sådan filtrering kan öka förtroendet för de förutsagda interaktionerna.

5. Konstruktion av ceRNA-nätverket

OBS: En detaljerad manual om hur man använder Cytoscape finns på: http://manual.cytoscape.org/en/stable/ och https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Nedladdning och förberedelse
    1. Ladda ner den senaste versionen av Cytoscape38 från: https://cytoscape.org/download.html.
    2. Kör installationsguiden som hämtades i steg 5.1.1 och välj filplatsen för Cytoscape-programvaran.
    3. Förbered en tabbavgränsad fil som innehåller de cirkulära RNA: erna av intresse och deras mål-miRNA. Den första kolumnen består av circRNA-namnet; den andra kolumnen anger typen av RNA från den första kolumnen; den tredje kolumnen är målmiRNA; och den fjärde kolumnen anger typen av RNA från den tredje kolumnen. Ett exempel på filen visas i tabell 3.
  2. Konstruera ceRNA-nätverkskartan
    1. Öppna programvaran Cytoscape som installerades i steg 5.1.2.
    2. I Cytoscape navigerar du till Arkiv > Importera > nätverk från fil. Välj filen som har förberetts i steg 5.1.3.
    3. På den nya fliken väljer du den första och andra kolumnen som "Källnod" och "Källnodattribut" medan du väljer den tredje och fjärde kolumnen som "Målnod" respektive "Målnodattribut". Klicka på OK och nätverket kommer att dyka upp på den övre högra sidan av Cytoscape.
    4. För att ändra nätverkets visuella stil, tryck på stilknappen på vänster sida av Cytoscape.
    5. Tryck på pilen till höger om Fyllningsfärg. Välj Typ för kolumnen och Diskret mappning för mappningstypen. Välj sedan önskad färg för var och en av RNA-typerna.
    6. När du har ändrat färg ändrar du formen på noderna genom att navigera till Form och följa steg 5.2.5.

6. Analys av funktionell anrikning

  1. Gene Ontology (GO) och Kyoto Encyclopedia of Genes and Genomes (KEGG) analys för föräldragenen i circRNAs
    1. Kontrollera clusterProfiler 39,40 och org. Hs.eg.db41 paket har installerats i Rstudio. Organisationen. Hs.eg.db41-paketet är ett genomomfattande annoteringspaket endast för människor. Om organismen av intresse är en annan art, se: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importera DE_circRNA information från steg 2.3.1 till Rstudio-arbetsytan.
    3. Använd föräldragenen för de circRNA som finns i den här filen för anrikningsanalys i de kommande stegen. Men om användaren vill konvertera gensymbolen till andra format, till exempel Entrez ID, använd en funktion som "bitr".
    4. Genom att använda gen-ID som indata kör du GO-anrikningsanalysen med funktionen enrichGO i paketet clusterProfiler39,40 med standardparametrar.
    5. Genom att använda gen-ID som indata kör du KEGG-anrikningsanalysen med funktionen enrichKEGG i paketet clusterProfiler39,40 med standardparametrarna.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Protokollet som anges i föregående avsnitt har modifierats och konfigurerats för att passa Linux OS-systemet. Den främsta anledningen är att de flesta modulbibliotek och paket som är involverade i analysen av circRNA bara kan fungera på Linux-plattformen. I denna analys laddades avidentifierade ribosomala RNA (rRNA)-utarmade RNA-seq-biblioteksdataset framställda från influensa A-virusinfekterade humana makrofagceller ner från GEO-databasen42 och användes för att generera de representativa resultaten.

CircRNA prediktion och kvantifiering
I denna analys användes ribosomalt RNA (rRNA)-utarmat RNA-seq-biblioteksdataset framställda från influensa A-virusinfekterade humana makrofagceller för att utföra circRNA-detektion och funktionell analys. Som specificerat i protokollavsnittet användes CIRIquant för att identifiera och genomföra DE-analys av identifierade circRNA med hjälp av RNA-seq-biblioteksdataset som indata. Referensfiler som används är baserade på den senaste versionen av det mänskliga genomet (hg38). Tabell 4 visar ett exempel på slutresultatet från CIRIquant-analysen. Identifiering och filtrering av DE-circRNA från CIRIquant-utdata utfördes genom enkla RStudio-skript (kompletterande fil 1). CircRNA klassificeras endast som DE när värdet för falsk upptäcktshastighet (FDR) är <0,05 och log fold change (LogFC) >|2|. Tabell 5 visar det totala antalet detekterade circRNA och DE-circRNA. Totalt 35 846 circRNA detekterades, varav 306 var DE. DE-circRNA som detekteras i denna utgång är helt uppreglerade (LogFC > 2), medan ingen är nedreglerad (LogFC < 2).

Annotering och karakterisering av DE-circRNA
Annoteringsstatus för DE-circRNA
DE circRNAs identifierade dubbelkontrollerades med en etablerad circRNA-databas, circBase. Men eftersom de circRNA-koordinater som deponeras i circBase är baserade på en tidigare human genomversion (hg19), måste circRNA-koordinaterna från circBase konverteras till den nuvarande humana genomversionen (hg38) för korskontroll i denna studie. Dessutom måste startkoordinaten konverteras till 0-baserad från 1-baserade utdata från CIRIquant. De hg38-versionskonverterade circRNA-koordinaterna för circBase finns i en enhetsmapp i Github (https://github.com/bicciatolab/Circr)37. Sedan användes Rstudio-skripten (kompletterande fil 1) för att tilldela annoteringsstatus för circRNA i en ny dataramkolumn. Tabell 6 visar ett exempel på circRNA med annoteringsstatus.

Karakterisering av DE-circRNA
Denna del utfördes helt genom R-skript i RStudio-programvaran. R-skript underlättar de analytiska processerna, och endast grundläggande kunskaper krävs.

CircRNA-typer
I detta steg kännetecknades DE-circRNA av deras circRNA-typer (Antisense, Exonic, Intergen och Intronic) baserat på deras genomiska positioner. Tabell 7 nedan visar den procentuella uppdelningen av de olika circRNA-typerna som omfattas av de identifierade DE-circRNA. Av de totalt 306 DE-circRNA identifierades 263 circRNA (85,95%) som exoniska circRNA, vilket är den vanligaste circRNA-typen som identifierats. Intronic circRNA kommer in som den näst mest identifierade circRNA-typen bestående av 17 DE-circRNA, vilket utgör upp till 5,56% av de totala DE-circRNA: erna. Detta följs av intergena circRNA (16 DE circRNAs ~ 5.23%) och antisense circRNAs (10 DE circRNAs ~ 3.27%).

Antal gener som spänner per circRNA
CircRNAs identifierade av CIRIquant kan överlappa över ett antal gener. Hittills är de flesta studier inriktade på circRNA som spänner över en gen. Därför utesluts i detta protokoll de circRNA-kandidater som spänner över mer än en gen från nedströmsanalysen. Tabell 8 nedan beskriver antalet och procentandelen DE-circRNA som spänner över en och mer än en gen. I denna tabell utesluts intergena cirkulärRNA (16 DE-cirkulärRNA) eftersom de inte överlappar några värdgener, medan resten av circRNA-typerna (290 DE-circRNA) utsätts för denna analys. Av de 290 DE-cirkulärRNA spänner majoriteten av DE-circRNA (261 circRNAs ~ 90%) endast en gen, medan de återstående 29 circRNA (~ 10%) spänner över mer än en gen.

Konstruktion av ceRNA-nätverket
Ett ceRNA-nätverk dras vanligtvis för att visualisera de circRNA-miRNA-interaktionerna efter att det har förutsagts. I figur 3 nedan valdes endast ett DE-circRNA som ett representativt resultat, vilket är det hsa_DE_58 circRNA. Baserat på Circr-förutsägelser kan hsa_DE_58 svampa upp till nio olika miRNA. Dessa nio miRNA identifieras efter filtrering genom stränga kriterier.

Analys av funktionell anrikning
GO- och KEGG-analys av de circRNA-föräldragener som finns
Figur 4 nedan visar ett bubbeldiagram över funktionell anrikning av DE-circRNA-föräldragener genom GO-analysen. I grund och botten syftar GO-analysen till att avslöja de biologiska processer, cellulära platser och molekylära funktioner som anrikas eller påverkas i det studerade tillståndet, i detta fall det virusinfekterade provet. Anrikningen anses vara statistiskt signifikant och plottas i bubbeldiagrammet endast om p-värdet är < 0,01. Som visas i figur 4 inkluderar de tre översta anrikningarna för de biologiska processerna (BP) ribonukleoproteinkomplexets biogenes, svaret på virus och regleringen av svaret på en biotisk stimulans, medan för molekylfunktionerna (MF) endast den katalytiska aktiviteten som verkar på RNA och enkelsträngad RNA-bindning är statistiskt anrikad. Å andra sidan är endast retromerkomplexet statistiskt anrikat för de cellulära komponenterna (CC).

Figur 5 visar KEGG-anrikningsanalysen av DE-circRNA-föräldragenerna i ett bubbeldiagram. I likhet med GO-anrikningsanalysen anses KEGG-anrikning endast vara statistiskt signifikant och plottas på ett bubbeldiagram om p-värdet är < 0,01. Endast två KEGG-termer berikades i detta fall, vilka är influensa A och viral livscykel (HIV-1) vägar.

Figure 1
Figur 1: Pipeline för prediktion och funktionell karakterisering av circRNA. Pipelinen visar en enkel översikt över de viktigaste stegen från början till slut som involverar installation av nödvändiga mjukvarupaket, förutsäga och kvantifiera circRNA-uttrycket, konstruktion av ceRNA-nätverket och utföra den cirkulära föräldragenens funktionella anrikning. Klicka här för att se en större version av denna figur.

Figure 2
Bild 2: Mappträdstruktur för Circr. Denna mappträdstruktur måste upprättas innan du kör Circr-programvaran för att upptäcka de filer som krävs för analysen. Klicka här för att se en större version av denna figur.

Figure 3
Figur 3: ceRNA-nätverk bestående av circRNA-miRNA-interaktionen. Den blå ovala formen representerar circRNA, medan de orange trianglarna representerar miRNA. De fasta linjerna som förbinder circRNA med miRNA beskriver den potentiella miRNA-svampfunktionen hos det hsa_DE_58 circRNA. Klicka här för att se en större version av denna figur.

Figure 4
Figur 4: Bubbeldiagram för GO-anrikningsanalys av DE-circRNA-föräldragener. GeneRatio på x-axeln är antalet gener i ingångslistan associerad med den givna GO-termen som delar det totala antalet ingångsgener. Punktstorleken i diagrammet representeras av räkningsvärdet, vilket är antalet gener i inmatningslistan som är associerad med den angivna GO-termen. Ju större storleken på prickarna, desto större är antalet ingångsgener som är associerade med termen. Dessutom är prickarna i diagrammet färgkodade baserat på p-värdet. P-värdet beräknas genom att jämföra den observerade frekvensen för en annoteringsterm med den frekvens som förväntas av en slump. De enskilda termerna anses vara berikade utöver ett brytvärde (p-värde < 0,01). Färggradienten för p-värde som sträcker sig från blått till rött indikerar ökad berikning av termerna. Klicka här för att se en större version av denna figur.

Figure 5
Figur 5: KEGG-anrikningsanalys av DE-circRNA-föräldragener. GeneRatio på x-axeln är antalet gener i ingångslistan associerad med den givna KEGG-termen som delar det totala antalet ingångsgener. Punktstorleken i diagrammet representeras av räkningsvärdet, vilket är antalet gener i inmatningslistan som är associerad med den angivna KEGG-termen. Ju större storleken på prickarna, desto större är antalet ingångsgener som är associerade med termen. Dessutom är prickarna i diagrammet färgkodade baserat på p-värdet. P-värdet beräknas genom att jämföra den observerade frekvensen för en annoteringsterm med den frekvens som förväntas av en slump. Enskilda termer anses vara berikade utöver ett brytvärde (p-värde < 0,01). Färggradienten för p-värde som sträcker sig från blått till rött indikerar ökande berikning av termer. Klicka här för att se en större version av denna figur.

Exempel på namn Sökväg till CIRIquant-utdata GTF-fil Gruppering
Kontroll 1 /sökväg/till/CIRIquant/ctrl1.gtf C
Kontroll 2 /sökväg/till/CIRIquant/ctrl2.gtf C
Infekterade 1 /sökväg/till/CIRIquant/infect1.gtf T
Infekterade 2 /sökväg/till/CIRIquant/infect2.gtf T

Tabell 1: Förberedelse av .lst-filen för CIRIquant. Destinationsvägarna för kontrollen och behandlade prover från CIRIquant-utdata skrivs i en textfil för att jämföra uttrycken av circRNA mellan de två typerna av prover.

Chr Starta Ände Namn . Slinga
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

Tabell 2: Exempel på BED-fil för Circr. Sex kolumner (Chr, Start, End, Name, Gene och Strand) associerade med circRNA krävs för att generera BED-filen.

circRNA_name Typ miRNA_name Typ
DE_circRNA_1 circRNA miR-001 Mirna
DE_circRNA_1 circRNA miR-002 Mirna
DE_circRNA_2 circRNA miR-003 Mirna
DE_circRNA_2 circRNA miR-004 Mirna

Tabell 3: Indatafil för cytoscape. Fyra kolumner (circRNA_name, Typ, miRNA_name och Typ) måste skrivas till en textfil.

CircRNA logFC logCPM LR Pvärde DE FDR
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
chr 16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
chr 14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tabell 4: Del av den slutliga utdatafilen (.csv) för CIRIquant. CIRIquant levererar information som LogFC, loggantal per miljon (LogCPM), logistisk regression (LR), p-värde, differentialuttryck och FDR.

CIRIquant resultat
Total DE Upp Ner
35846 306 306 0

Tabell 5: En sammanfattning av antalet identifierade totala och differentiellt uttryckta (DE) circRNA. Totalt 35 846 circRNA detekteras, varav 306 är DE-circRNA. Alla 306 DE-circRNA är uppreglerade (utan att någon är nedreglerad) i behandlade prover jämfört med kontrollprover.

Custom_Name Annotation_Status
hsa_DE_22 Icke-kommenterade
hsa_DE_2 Kommenterad
hsa_DE_58 Icke-kommenterade
hsa_DE_3 Kommenterad

Tabell 6: Tabell över anpassade circRNA-namn med anteckningsstatus. CircRNA efterfrågas i en databas med kända deponerade circRNA (circBase). Om circRNA finns i databasen är det märkt att det ska annoteras, medan frånvaron av circRNA är märkt som icke-annoterad.

CircRNA-typ Freq Procent
antisens; 10 3.27%
exon 263 85.95%
intergena 16 5.23%
Intron 17 5.56%

Tabell 7: Typer av cirkulärRNA identifierade. CircRNA kan vidare kategoriseras i olika typer av circRNA baserat på deras sekvensregion, nämligen exonic, intronic, antisense och intergen.

Antal föräldragener Freq Procent
1 261 90%
> 1 29 10%

Tabell 8: Procentandel circRNA med olika antal gener som spänner över. CircRNA kodas vanligtvis från exoner av en gen, men circRNA som spänner över mer än en gen kan också detekteras av CIRIquant.

Kompletterande fil 1: Skript som används i protokollet. Klicka här för att ladda ner den här filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

För att illustrera nyttan av detta protokoll användes RNA-seq från influensa A-virusinfekterade humana makrofagceller som exempel. CircRNAs som fungerar som potentiella miRNA-svampar i värd-patogeninteraktioner och deras GO- och KEGG-funktionella anrikning inom en värd undersöktes. Även om det finns en mängd olika circRNA-verktyg tillgängliga online, är var och en av dem ett fristående paket som inte interagerar med varandra. Här sammanställer vi några av de verktyg som krävs för circRNA-förutsägelse och kvantifiering, circRNA-funktionell anrikning, circRNA-miRNA-interaktionsförutsägelse och ceRNA-nätverkskonstruktion. Detta strömlinjeformade protokoll är tidsbesparande och kan tillämpas på kliniska prover för att detektera circRNA-kandidater med diagnostiska och prognostiska värden.

I huvudsak använde vi CIRIquant31, ett cirkulärRNA-kvantifieringsverktyg förpackat med CIRI2, som kan detektera och utföra DE-analys av cirkulärRNA. DE-circRNA filtreras baserat på ett cut-off-värde för LogFC > |2| och FDR < 0,05, vilket bidrar till att eliminera potentiella falska positiva resultat i nedströmsanalyser. Karakterisering av DE-circRNAs i termer av annoteringsstatus, circRNA-typer och antalet gener som spänner över hjälper till att kategorisera och ytterligare filtrera circRNA-kandidater. Därefter används Circr37, ett circRNA-miRNA-prediktionsverktyg, för att förutsäga potentiella miRNA-svampande kandidater. Efter att ha förutspått potentiella miRNA som mål för circRNA dras ett ceRNA-nätverk. Slutligen, baserat på föräldragenerna i circRNAs, används R clusterProfiler-paketet39 för funktionell annotering via GO- och KEGG-väganrikningsanalysen. Resultat från GO och KEGG kan hjälpa till att reda ut de biologiska mekanismer som påverkas av circRNAs.

Hittills har flera olika circRNA-prediktionsverktyg utvecklats, inklusive CIRI2 43, CIRCexplorer2 44, find_circ 45, MapSplice 46 och UROBORUS 47. I en studie utförd av Hansen et al. rapporteras CIRI2 ha en hög övergripande prestanda. Det är bland de få circRNA-detektionsverktygen som kan fungera bra när det gäller de novo-förutsägelse och minskning av falsk positiv identifiering48. CIRIquant som använder CIRI2 för detektion och kvantifiering av circRNA användes därför i denna studie. CIRIquant användes för att räkna BSJ-läsningarna (Back Splice junction) och räkningsdata normaliserades till läsningarna mappade till kognitiva linjära RNA transkriberade från samma genlokus. Detta möjliggör kvantifiering av circRNA i ett prov. För att bestämma differentialuttrycket av circRNA över experimentella förhållanden implementerade CIRIquant en generaliserad linjär modell i edgeR49 för DE-analys, och det exakta hastighetsförhållandetestet användes som ett statistiskt test för att bestämma signifikansen av skillnaden i circRNA-korsningsförhållandet. Även om andra circRNA-kvantifieringsverktyg som CIRCexplorer3-CLEAR50 kan användas för att kvantifiera uttrycksnivån för circRNA, tillåter detta verktyg endast circRNA-kvantifiering i ett prov eftersom det räknar BSJ-läsningarna i ett prov och normaliserar räkningsdata mot de besläktade linjära RNA-räkningarna från samma prov. CIRCexplorer3-CLEAR kan inte jämföra circRNA-uttryck över experimentella förhållanden. Dessutom implementeras inget statistiskt analysverktyg i CIRCexplorer3-CLEAR för att stödja den kvantifierade uttrycksnivån. Även om standardverktyget circRNA som implementeras inom CIRIquant är CIRI2, kan prediktionsresultaten från andra verktyg som find_circ och CIRCexplorer2 också användas för kvantifiering och DE-analys31. I detta protokoll användes endast ett circRNA-prediktionsverktyg (CIRI2) för förutsägelse, vilket fortfarande kan ge falskt positiva circRNA-kandidater. För att minska falska positiva resultat kan man kombinera andra circRNA-prediktionsverktyg för analys och välja vanliga circRNA detekterade bland de olika circRNA-prediktionsverktygen 48,51. För att ytterligare förbättra circRNA-detektion är det idealiskt att använda RNA-sekvenseringsdataset som både är rRNA-utarmade och utsätts för RNas R-förbehandling.

Beroende på studiens syfte kan de novo och annoterade DE-circRNA identifieras separat baserat på circBase-databasen52. CircRNA som spänner över mer än en gen kräver emellertid ofta manuell undersökning på UCSC eller någon annan genomwebbläsare för att bestämma äktheten hos circRNA och eliminera falska positiva. Ändå har circRNA som spänner över mer än en gen, såsom circRNA härrörande från fusionsgener, också rapporterats nyligen53,54.

Circr fungerar genom att kombinera tre olika miRNA-mRNA-förutsägande algoritmer, nämligen TargetScan55, miRanda 56 och RNAhybrid57 för att förutsäga de circRNA-miRNA-bindningsställen. Utöver det innehåller algoritmen också information om AGO-toppar och tidigare validerade interaktioner i circRNA-miRNA-analysen. Här tillämpades stränga filtreringskriterier för att möjliggöra en mer tillförlitlig circRNA-miRNA-prediktion att erhållas, vilket ytterligare reducerade falska positiva. Strängheten för det här filtreringssteget kan dock anges högre eller lägre beroende på användarens inställningar.

ClusterProfiler är ett väldokumenterat R-paket som funktionellt kan kommentera genuppsättningar över olika organismer. Förutom funktionerna i R clusterProfiler-paketet som nämns i detta protokoll (enrichGO och enrichKEGG), som använder överrepresentationsanalys, finns det också andra funktioner som gseGO och gseKEGG som kan användas. Om clusterProfiler inte är ett lämpligt val för arbetsflödet finns det även andra verktyg och paket som "AllEnricher"58 eller de webbplatsbaserade verktygen som "Metascape"59 som funktionellt kan kommentera en uppsättning gener. Slutligen, även om rörledningen ovan hjälper till att förutsäga potentiella circRNA och deras funktionella anteckningar, kommer våtlaboratorieverifiering att behövas för att ge solida bevis.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Författaren vill tacka Tan Ke En och Dr. Cameron Bracken för deras kritiska granskning av detta manuskript. Detta arbete stöddes av bidrag från Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) och University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Retraktion utgåva 188 cirkulärt RNA circRNA värd-patogeninteraktion
<em>I Silico</em> Identifiering och karakterisering av circRNA under värd-patogeninteraktioner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter