Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Burada: Silico Konakçı-Patojen Etkileşimleri Sırasında SirkRNA'ların Tanımlanması ve Karakterizasyonu

Published: October 21, 2022 doi: 10.3791/64565
* These authors contributed equally

Summary

Burada sunulan protokol, konakçı-patojen etkileşimlerini inceleyen RNA dizileme transkriptom verilerinden sirkRNA'ları tahmin etmek ve işlevsel olarak karakterize etmek için gereken in silico boru hattının tamamını açıklamaktadır.

Abstract

Dairesel RNA'lar (sirkRNA'lar), geri ekleme yoluyla oluşturulan kodlamayan RNA'ların bir sınıfıdır. Bu sirkRNA'lar ağırlıklı olarak çeşitli biyolojik süreçlerin düzenleyicileri olarak rolleri için incelenmiştir. Özellikle, ortaya çıkan kanıtlar, konakçı sirkRNA'ların patojenlerle (örneğin, influenza ve koronavirüsler) enfeksiyon üzerine farklı şekilde eksprese edilebileceğini (DE) göstermektedir, bu da sirkRNA'ların konakçı doğuştan gelen bağışıklık tepkilerini düzenlemede bir rol oynadığını düşündürmektedir. Bununla birlikte, patojenik enfeksiyonlar sırasında sirkRNA'ların rolü üzerine yapılan araştırmalar, RNA dizileme (RNA-seq) verilerinden DE sirkRNA'larını tanımlamak için gerekli biyoinformatik analizi yapmak için gerekli bilgi ve becerilerle sınırlıdır. Biyoinformatik tahmin ve sirkRNA'ların tanımlanması, herhangi bir doğrulamadan önce ve maliyetli ve zaman alıcı ıslak laboratuvar tekniklerini kullanan fonksiyonel çalışmalardan önce çok önemlidir. Bu sorunu çözmek için, RNA-seq verilerini kullanarak sirkRNA'ların in silico tahmini ve karakterizasyonunun adım adım bir protokolü verilmiştir. Protokol dört adıma ayrılabilir: 1) CIRIquant boru hattı aracılığıyla DE sirkRNA'larının tahmini ve nicelleştirilmesi; 2) circBase yoluyla ek açıklama ve DE sirkRNA'larının karakterizasyonu; 3) Circr boru hattı üzerinden CircRNA-miRNA etkileşim tahmini; 4) Gen Ontolojisi (GO) ve Kyoto Genler ve Genomlar Ansiklopedisi (KEGG) kullanılarak sirkRNA ebeveyn genlerinin fonksiyonel zenginleştirme analizi. Bu boru hattı, sirkRNA'ların konakçı-patojen etkileşimlerindeki rolünü daha da çözmek için gelecekteki in vitro ve in vivo araştırmaları yönlendirmede yararlı olacaktır.

Introduction

Konakçı-patojen etkileşimleri, patojenler ve konakçı organizmalar arasındaki karmaşık bir etkileşimi temsil eder, bu da konakçıların doğuştan gelen bağışıklık tepkilerini tetikler ve sonuçta istilacı patojenlerin uzaklaştırılmasıyla sonuçlanır 1,2. Patojenik enfeksiyonlar sırasında, konakçı immün genlerinin çoğu, patojenlerin replikasyonunu ve salınımını inhibe etmek için düzenlenir. Örneğin, patojenik enfeksiyonlar üzerinde düzenlenen yaygın interferon ile uyarılmış genler (ISG'ler) ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I ve OASL 3,4'ü içerir. Protein kodlayan genlerin yanı sıra, çalışmalar ayrıca uzun kodlamayan RNA'lar (lncRNA'lar), mikroRNA'lar (miRNA'lar) ve dairesel RNA'lar (sirkRNA'lar) gibi kodlamayan RNA'ların da rol oynadığını ve patojenik enfeksiyonlar sırasında eşzamanlı olarak düzenlendiğini bildirmiştir 5,6,7. Proteinleri esas olarak fonksiyonel moleküller olarak kodlayan protein kodlayan genlerin aksine, kodlamayan RNA'ların (ncRNA'lar) transkripsiyonel ve transkripsiyon sonrası seviyelerde genlerin düzenleyicileri olarak işlev gördüğü bilinmektedir. Bununla birlikte, kodlamayan RNA'ların, özellikle sirkRNA'ların, konakçıların bağışıklık genlerini düzenlemeye katılımını içeren çalışmalar, protein kodlayan genlere kıyasla iyi rapor edilmemiştir.

SirkRNA'lar, geri ekleme8 adı verilen kanonik olmayan bir ekleme işlemi ile üretilen kovalent kapalı sürekli döngü yapıları ile yaygın olarak karakterize edilir. Geri ekleme işlemi, konyak lineer RNA'ların ekleme işleminden farklı olarak, aşağı akış donör bölgesinin yukarı akış alıcı bölgesine bağlanmasını ve dairesel şekilli bir yapı oluşturmasını içerir. Şu anda, sirkRNA'ların biyogenezi için üç farklı geri ekleme mekanizması önerilmiştir. Bunlar RNA bağlayıcı protein (RBP) aracılı daireselleştirme 9,10, intron eşleştirme güdümlü daireselleştirme 11 ve lariat güdümlü daireselleştirme12,13,14'tür. SirkRNA'ların dairesel bir yapıda uçtan uca bağlandığı göz önüne alındığında, normal ekzonükleaz sindirimlerine karşı doğal olarak dirençli olma eğilimindedirler ve bu nedenle doğrusal muadillerinden daha kararlı oldukları düşünülmektedir15. SirkRNA'lar tarafından sergilenen bir diğer ortak özellik, konakçılardaki hücre veya doku tipine özgü ekspresyonu içerir16.

Benzersiz yapıları ve hücre veya dokuya özgü ekspresyonları ile ima edildiği gibi, sirkRNA'ların hücrelerde önemli biyolojik işlevler oynadığı keşfedilmiştir. Bugüne kadar, sirkRNA'ların öne çıkan işlevlerinden biri, mikroRNA (miRNA) süngerleri olarak rolleridir17,18. SirkRNA'ların bu düzenleyici rolü, sirkRNA nükleotidlerinin miRNA'ların tohum bölgesi ile tamamlayıcı bağlanmasıyla gerçekleşir. Böyle bir sirkRNA-miRNA etkileşimi, miRNA'ların hedef mRNA'lar üzerindeki normal düzenleyici fonksiyonlarını inhibe eder, böylece19,20 genlerinin ekspresyonunu düzenler. Ek olarak, sirkRNA'ların, RNA bağlayıcı proteinlerle (RBP'ler) etkileşime girerek ve RNA-protein kompleksleri21'i oluşturarak gen ekspresyonunu düzenlediği de bilinmektedir. Her ne kadar sirkRNA'lar kodlamayan RNA'lar olarak sınıflandırılsa da, sirkRNA'ların protein translasyonu için şablon görevi görebileceğine dair kanıtlar da vardır22,23,24.

Son zamanlarda, sirkRNA'ların, özellikle konakçılar ve virüsler arasında, konakçı-patojen etkileşimlerinin düzenlenmesinde önemli roller oynadığı gösterilmiştir. Genel olarak, konakçı sirkRNA'ların, istilacı patojenleri ortadan kaldırmak için konağın bağışıklık tepkilerini düzenlemeye yardımcı olduğu varsayılır. Konakçı bağışıklık tepkilerini destekleyen bir sirkRNA örneği, Guo ve ark.25 tarafından bildirilen circRNA_0082633'dir. Bu sirkRNA, A549 hücreleri içindeki tip I interferon (IFN) sinyallemesini arttırır ve bu da influenza virüsü replikasyonunu baskılamaya yardımcı olur25. Dahası, Qu ve ark. ayrıca, IFN-β 26,27'nin bir sinyal dönüştürücüsü olan CREB-bağlayıcı proteinin (CREBBP) ekspresyonunu düzenleyerek bağışıklığı teşvik eden sirkRNA AIVR adı verilen bir insan intronik sirkRNA'sını da bildirmiştir. Bununla birlikte, enfeksiyon üzerine hastalığın patogenezini desteklediği bilinen sirkRNA'lar da mevcuttur. Örneğin, Yu ve ark. yakın zamanda, konakçı hücre otofajisi28'in inhibisyonu yoluyla H1N1 virüs replikasyonunu teşvik etmede 2A genini (circGATAD2A) içeren GATA çinko parmak alanından eklenmiş bir sirkRNA'nın oynadığı rolü bildirmiştir.

SirkRNA'ları etkili bir şekilde incelemek için, genellikle genom çapında bir sirkRNA tahmin algoritması uygulanır, ardından herhangi bir fonksiyonel çalışma yapılmadan önce tahmin edilen sirkRNA adaylarının in silico karakterizasyonu yapılır. SirkRNA'ları tahmin etmek ve karakterize etmek için böyle bir biyoinformatik yaklaşım daha az maliyetli ve daha fazla zaman verimlidir. İşlevsel olarak incelenecek aday sayısını iyileştirmeye yardımcı olur ve potansiyel olarak yeni bulgulara yol açabilir. Burada, konakçı-patojen etkileşimleri sırasında sirkRNA'ların in silico tanımlaması, karakterizasyonu ve fonksiyonel ek açıklaması için ayrıntılı bir biyoinformatik tabanlı protokol sunuyoruz. Protokol, RNA dizileme veri kümelerinden sirkRNA'ların tanımlanması ve nicelleştirilmesini, circBase aracılığıyla ek açıklama yapılmasını ve sirkRNA adaylarının sirkRNA tipleri, örtüşen genlerin sayısı ve öngörülen sirkRNA-miRNA etkileşimleri açısından karakterizasyonunu içerir. Bu çalışma aynı zamanda Gen Ontolojisi (GO) ve Kyoto Genler ve Genomlar Ansiklopedisi (KEGG) zenginleştirme analizi yoluyla sirkRNA ebeveyn genlerinin fonksiyonel ek açıklamasını sağlar.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Bu protokolde, influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan kimliksizleştirilmiş ribozomal RNA (rRNA)-tükenmiş RNA-seq kütüphanesi veri setleri, Gen İfade Omnibus (GEO) veritabanından indirilmiş ve kullanılmıştır. Tahminden sirkRNA'ların fonksiyonel karakterizasyonuna kadar tüm biyoinformatik boru hattı Şekil 1'de özetlenmiştir. Boru hattının her bir parçası aşağıdaki bölümlerde daha ayrıntılı olarak açıklanmaktadır.

1. Veri analizinden önce hazırlık, indirme ve kurulum

NOT: Bu çalışmada kullanılan tüm yazılım paketleri ücretsiz ve açık kaynaklıdır.

  1. Linux platformunda gerekli araçları indirme
    1. Malzeme Tablosunda listelenen gerekli yazılım ve araçları, geliştirici tarafından sağlanan talimatları kullanarak Linux yüksek performanslı bir bilgisayara indirin ve yükleyin.
      NOT: Araçların ve yazılımların çoğunun, araçlarını yükleme ve kullanma talimatlarını içeren kendi çevrimiçi GitHub sayfaları veya belgeleri vardır ( Malzeme Tablosuna bakın).
    2. SirkRNA tespiti ve analizi için istenen RNA-seq veri setlerini dizi arşivi web sitelerinden indirin (örneğin, Avrupa Nükleotidler Arşivi ve Gen İfadesi Omnibus).
    3. RNA-seq veri setinin hazırlandığı konakçıyla uyumlu referans genomları (FASTA formatı) ve ek açıklama dosyalarını (GTF/GFF3 formatı) indirin. Ana bilgisayar referans genomları ve ek açıklama dosyaları genellikle Ulusal Biyoteknoloji Bilgi Merkezi (NCBI), California Santa Cruz Üniversitesi (UCSC) ve Ensembl web siteleri gibi çevrimiçi genom tarayıcılarında bulunur.
  2. RNA-seq kalite kontrolü
    1. RNA dizilerinin kalitesini belirlemek için FASTQ dosyalarını FASTQC programına girin. FASTQ dosyalarının kalitesi düşükse (örneğin, 29,30 gibi araçlar kullanılarak daha fazla kırpma gerekebilir.

2. CIRIquant kullanarak sirkRNA'ların tahmin ve diferansiyel ekspresyon analizi

NOT: Diferansiyel ifade analizinin yüklenmesi ve gerçekleştirilmesiyle ilgili daha ayrıntılı bir kılavuz, CIRIquant kağıt31'in kod kullanılabilirliği bölümünde bulunabilir. Ek veriler, bu protokolde kullanılan bazı temel komutları da içerir.

  1. CircRNA tahminleri
    1. BWA ve HISAT2 hizalayıcılarını kullanarak önce konağın referans genomunu indeksleyin. Daha sonra, bir Linux terminalinde, dizine eklemek için ana bilgisayarın referans genomunun dizininde bwa index 32 ve hisat2-build33 komutlarını çalıştırın.
    2. Ardından, dosyanın adını, araçların yolunu (BWA, HISAT2, stringtie34, samtools35), indirilen referans dosyalarının yolunu (ana bilgisayarın referans genomu FASTA dosyaları, ek açıklama dosyaları) ve adım 2.1.1'den itibaren dizin dosyalarının yolunu içeren bir YML yapılandırma dosyası hazırlayın.
    3. Varsayılan veya manuel parametreleri kullanarak CIRIquant aracını terminalden yürütün. Kullanıcı, CIRIquant aracını çalıştırırken RNA-seq verilerinin kütüphane türünü (sarmallı veya zincirsiz) belirtebilir.
      NOT: RNA-SEQ verilerinin kütüphane tipi, kullanılan kütüphane hazırlama kitinin türü bilinerek belirlenebilir. Kütüphane hazırlama kitinin kimliği bilinmiyorsa, RNA-seq verilerinin kısıtlılığını belirlemek için RSeQC36 adı verilen bir RNA-seq kontrol biyoinformatik paketi kullanılabilir.
  2. Diferansiyel ifade analizi
    NOT: CIRIquant paketi prep_CIRIquant, prepDE.py ve CIRI_DE_replicate içerir; bu nedenle, bu üç araç için ek indirme gerekmez.
    1. Aşağıdakileri içeren bir veri listesi içeren bir metin dosyası (.lst) hazırlayın:
      1. sütun: Adım 2.1.3'te kullanılan RNA-seq verilerinin kimlikleri
      2. sütun: CIRIquant tarafından çıkarılan GTF dosyalarının yolu
      3. sütun: RNA-seq verilerinin gruplandırılması, kontrol veya tedavi edilen bir grup olup olmadığı.
    2. Bir örnek için, aşağıdaki Tablo 1'e bakın.
      NOT: Sadece referans amaçlı oldukları için başlıkları koymak gerekli değildir.
    3. Linux terminalinde, adım 2.2.1'de hazırlanan metin dosyasıyla (.lst) giriş olarak prep_CIRIquant çalıştırın. Çalıştırma bir dosya listesi oluşturur: library_info.csv, circRNA_info.csv, circRNA_bsj.csv ve circRNA_ratio.csv.
    4. RNA-seq ID'lerini ve ilgili StringTie çıktılarının yolunu içeren bir veri listesi içeren ikinci bir metin dosyası hazırlayın. Dosya düzeni, gruplandırma sütunu olmadan adım 2.2.1'deki metin dosyasına benzer olmalıdır.
    5. Gen sayısı matris dosyalarını oluşturmak için adım 2.2.4'te hazırlanan metin dosyasıyla prepDE.py giriş olarak çalıştırın.
    6. Son circRNA_de.tsv dosyasının çıktısını almak için adım 2.2.3'teki library_info.csv ve circRNA_bsj.csv dosyalarıyla ve adım 2.2.5'teki gene_count_matrix.csv dosyasıyla giriş olarak CIRI_DE_replicate yürütün.
  3. DE sirkRNA'larının filtrelenmesi
    1. Diferansiyel olarak ifade edilen (DE) sirkRNA'ların sayısını filtrelemek ve belirlemek üzere adım 2.2.6'dan oluşturulan circRNA_de.tsv dosyasını açmak için R (bilgisayar terminalinde veya RStudio'da) veya herhangi bir elektronik tablo yazılımını (örneğin, Microsoft Excel) kullanın.
    2. DE sirkRNA'larını LogFC kriterlerine göre filtreleyin > |2| ve FDR < 0.05.
    3. DE sirkRNA'larının bilgilerini depolamak için DE_circRNAs.txt adlı bir dosya oluşturun.

3. Öngörülen DE sirkRNA'larının karakterizasyonu ve ek açıklaması

  1. DE sirkRNA'larının ek açıklama durumu
    1. Adım 2.3.3'ten filtrelenen DE sirkRNA'larının listesinden oluşan RStudio'da DE_circRNAs.txt adlı dosyayı yükleyin. Genomik pozisyonlar (Chr, Start, End), iplikçik oryantasyonları (+ veya -), gen adı ve circRNA tipi gibi diğer bilgileri de dahil edin. Devam etmeden önce, sirkRNA genomik başlangıç koordinatlarını CIRIquant'tan 1 baz çiftini çıkararak 0 tabanlıya dönüştürün.
      NOT: Yukarıda belirtilen diğer bilgiler, CIRIquant (Ek Dosya 1) tarafından çıkarılan GTF dosyalarından elde edilebilir.
    2. Tahmin edilen DE sirkRNA'larının ek açıklama durumunu, circRNA veritabanının (örneğin, circBase) biriktirilen sirkRNA'ların genomik konumlarını içeren bir kütüphane indirerek belirleyin.
      NOT: Karşılaştırmayı yapmadan önce sirkRNA'ları tahmin etmek için kullanılan genom versiyonunun circRNA veritabanı kütüphanesi ile aynı olduğundan emin olun. Burada kullanılan circBase veri dosyası, Github (https://github.com/bicciatolab/Circr)37'de sağlanan sürücü klasöründe ücretsiz olarak kullanılabilir.
    3. Adım 3.1.1 ve adım 3.1.2'deki her iki dosya da hazırlandıktan sonra, Ek Dosya 1'de verilen R betiğini çalıştırın. DE sirkRNA'larının kromozomal konumları, Açıklamalı veya Açıklamasız durumu atanmadan önce kütüphaneye sorgulanır.
  2. DE sirkRNA'larının karakterizasyonu
    1. SirkRNA tiplerine (yani ekzon, intron, intergenik ve antisens) göre sirkRNA'ların sayısını ve sirkRNA'ların yayıldığı gen sayısını (1 veya >1) özetlemek için R ve diğer elektronik tablo yazılımlarını kullanın (Ek Dosya 1).NOT: CIRIquant sadece dört tip sirkRNA'yı (ekzon, intron, intergenik ve antisens) tespit edebilir. ElciRNA'lar olarak da bilinen ekzon-intron sirkRNA'lar, CIRIquant tarafından tespit edilemez.

4. Circr kullanarak circRNA-miRNA etkileşimini tahmin etme

NOT: CircRNA-miRNA etkileşim analizi için Circr'nin nasıl kurulacağı ve kullanılacağı hakkında daha ayrıntılı bir kılavuz şu adreste bulunabilir: https://github.com/bicciatolab/Circr37.

  1. Dosyaların hazırlanması
    1. "WinRar" veya "7-zip" gibi ilgili yazılımları kullanarak Circr GitHub sayfasından indirdikten sonra Circr.zip dosyasının içeriğini açın ve analizin yapılacağı yeni bir dizine çıkarın.
    2. CircRNA-miRNA analizini yapmadan önce önkoşul yazılım uygulamalarını (miRanda, RNAhybrid, Pybedtools ve samtools) yükleyin.
    3. İlgilenilen çeşitli organizmalar için referans genomlar ve ek açıklama dosyaları, rRNA koordinatları dosyası, doğrulanmış miRNA etkileşim dosyası ve circBase circRNA dosyaları, Circr yazarı tarafından Github sayfasında (https://github.com/bicciatolab/Circr)37 sağlanmıştır. Sürücü klasöründeki destek dosyalarına tıkladıktan sonra, ilgilenilen organizmanın klasörünü, miRNA klasörünü ve circBase metin dosyasını seçin ve indirin.
    4. Adım 4.1.3'te gerekli dosyaları indirdikten sonra, adım 4.1.1'de belirtilen dizinde support_files adında yeni bir dizin oluşturun. Ardından, sıkıştırılmış içeriği açın ve support_files dizinine ayıklayın.
    5. Samtools faidx komutunu kullanarak ilgili organizmanın referans genom dosyasını indeksleyin (Ek Dosya 1).
    6. Tablo 2'de gösterildiği gibi, sekmeyle ayrılmış bir BED dosyasındaki ilgili DE sirkRNA'larının koordinatlarından oluşan bir giriş dosyası hazırlayın.
      NOT: CIRIquant tarafından tahmin edilen sirkRNA'lar 0 tabanlı olmadığından, bunları BED formatına dönüştürmeden önce başlangıç koordinatında (adım 3.1.1'de belirtildiği gibi) eksi 1 bp olması gerekir. Tablo 2'de gösterilen başlıklar yalnızca referans amaçlıdır ve BED dosyalarında gerekli değildir.
    7. Bu noktada, Circr analizi için beklenen klasör ağacı yapısının Şekil 2'deki gibi olduğundan emin olun.
  2. Koşu Circr.py
    1. Python 3 kullanarak Circr.py yürütün ve bağımsız değişkenler olarak, circRNA giriş dosyasını, ilgili organizmanın FASTA genomunu, seçilen organizmanın genom sürümünü, iş parçacığı sayısını ve çıktı dosyasının adını komut satırında belirtin.
    2. İlgilenilen organizma adım 4.1.3'te listelenen sürücü klasöründe sağlanmamışsa veya kullanıcı analizi çalıştırmak için özel bir dosya kümesine sahip olmayı tercih ediyorsa, Circr.py yürütülürken bu dosyaların konumunu belirten ek komutların eklenmesi gerekir.
    3. Circr analizi tamamlandıktan sonra, program csv formatında bir circRNA-miRNA etkileşim dosyası çıkarır.
    4. SirkRNA-miRNA etkileşim sonuçlarını kullanıcıya özel tercihe göre filtreleyin. Bu çalışma için, tahminler aşağıdaki kriterlere göre Rstudio kullanılarak filtrelenir:
      -Her üç yazılım aracı tarafından da algılandı
      -Hem Targetscan hem de miRanda tarafından bildirilen iki veya daha fazla bağlama bölgesi
      -"AGO" veya "doğrulanmış" sütunlarında tanımlanır
      -Hiçbir tohum bölgesi etkileşimini filtreleme
    5. Adım 4.2.3'teki filtrelenmiş koşulları geçiren sirkRNA'ları circRNA_miRNA.txt adlı yeni bir metin dosyasına yazın. Bu tür filtreleme, tahmin edilen etkileşimlerin güvenilirliğini artırabilir.

5. CeRNA ağının inşası

NOT: Cytoscape'in nasıl kullanılacağına dair ayrıntılı bir kılavuz şu adreste bulunabilir: http://manual.cytoscape.org/en/stable/ ve https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. İndirme ve hazırlama
    1. Cytoscape38'in en son sürümünü şuradan indirin: https://cytoscape.org/download.html.
    2. Adım 5.1.1'de indirilen yükleyici sihirbazını çalıştırın ve Cytoscape yazılımı için dosya konumunu seçin.
    3. İlgilenilen sirkRNA'ları ve hedef miRNA'larını içeren sekmeyle ayrılmış bir dosya hazırlayın. İlk sütun circRNA adından oluşur; ikinci sütun, ilk sütundaki RNA tipini belirtir; üçüncü sütun hedef miRNA'dır; ve dördüncü sütun, üçüncü sütundaki RNA tipini belirtir. Dosyanın bir örneği Tablo 3'te gösterilmiştir.
  2. CeRNA ağ haritasının oluşturulması
    1. Adım 5.1.2'de yüklü olan Cytoscape yazılımını açın.
    2. Cytoscape'te, Dosya'ya gidin > Dosya'dan > Ağı İçe Aktar'a gidin. 5.1.3 adımında hazırlanmış olan dosyayı seçin.
    3. Yeni sekmede, birinci ve ikinci sütunu "Kaynak Düğüm" ve "Kaynak Düğüm Özniteliği" olarak seçerken, üçüncü ve dördüncü sütunu sırasıyla "Hedef Düğüm" ve "Hedef Düğüm Özniteliği" olarak seçin. Tamam'a tıklayın ve ağ Cytoscape'in sağ üst tarafında görünecektir.
    4. Ağın görsel stilini değiştirmek için, Cytoscape'in sol tarafındaki Stil düğmesine basın.
    5. Dolgu Rengi'nin sağ tarafındaki oka basın. Sütun için Tür'ü ve eşleme türü için Ayrık Eşleme'yi seçin. Ardından, RNA tiplerinin her biri için istenen rengi seçin.
    6. Rengi değiştirdikten sonra, Şekil'e gidip adım 5.2.5'i izleyerek düğümlerin şeklini değiştirin.

6. Fonksiyonel zenginleştirme analizi

  1. SirkRNA'ların ebeveyn geni için Gen Ontolojisi (GO) ve Kyoto Gen ve Genom Ansiklopedisi (KEGG) analizi
    1. clusterProfiler 39,40 ve org'dan emin olun. Hs.eg.db Rstudio'ya 41 paket yüklendi. Kuruluş. Hs.eg.db41 paketi, yalnızca insanlar için genom çapında bir ek açıklama paketidir. İlgilenilen organizma başka bir türse, aşağıdakilere bakın: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Adım 2.3.1'deki DE_circRNA bilgilerini Rstudio çalışma alanına aktarın.
    3. Sonraki adımlarda zenginleştirme analizi için bu dosyada sağlanan sirkRNA'ların ebeveyn genini kullanın. Bununla birlikte, kullanıcı gen sembolünü Entrez ID gibi diğer biçimlere dönüştürmek isterse, "bitr" gibi bir işlev kullanın.
    4. Gen kimliğini girdi olarak kullanarak, varsayılan parametreleri kullanarak clusterProfiler 39,40 paketindeki enrichGO işlevini kullanarak GO zenginleştirme analizini çalıştırın.
    5. Gen kimliğini girdi olarak kullanarak, varsayılan parametreleri kullanarak clusterProfiler39,40 paketindeki enrichKEGG işlevini kullanarak KEGG zenginleştirme analizini çalıştırın.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Önceki bölümde listelenen protokol, Linux OS sistemine uyacak şekilde değiştirilmiş ve yapılandırılmıştır. Bunun temel nedeni, sirkRNA'ların analizinde yer alan çoğu modül kütüphanesinin ve paketinin yalnızca Linux platformunda çalışabilmesidir. Bu analizde, Influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan tanımlanmamış ribozomal RNA (rRNA) tükenmiş RNA-seq kütüphanesi veri setleri, GEOveritabanı 42'den indirildi ve temsili sonuçları üretmek için kullanıldı.

CircRNA tahmini ve nicelleştirmesi
Bu analizde, sirkRNA tespiti ve fonksiyonel analizi yapmak için İnfluenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan ribozomal RNA (rRNA) tükenmiş RNA-seq kütüphanesi veri setleri kullanılmıştır. Protokol bölümünde belirtildiği gibi, CIRIquant, RNA-seq kütüphanesi veri kümelerini girdi olarak kullanarak tanımlanmış sirkRNA'ların DE analizini tanımlamak ve gerçekleştirmek için kullanılmıştır. Kullanılan referans dosyaları en son insan genomu versiyonuna (hg38) dayanmaktadır. Tablo 4 , CIRIquant analizinden elde edilen nihai çıktının bir örneğini göstermektedir. CIRIquant çıktısından DE sirkRNA'larının tanımlanması ve filtrelenmesi, basit RStudio komut dosyaları (Ek Dosya 1) aracılığıyla gerçekleştirildi. SirkRNA'lar yalnızca yanlış keşif oranı (FDR) değeri <0.05 ve log kıvrım değişimi (LogFC) >|2| olduğunda DE olarak sınıflandırılır. Tablo 5 , tespit edilen sirkRNA'ların ve DE sirkRNA'larının toplam sayısını göstermektedir. 306'sı DE olmak üzere toplam 35.846 sirkRNA tespit edildi. Bu çıktıda tespit edilen DE sirkRNA'ları tamamen yukarı regüle edilir (LogFC > 2), hiçbiri aşağı regüle edilmez (LogFC < 2).

DE sirkRNA'larının ek açıklaması ve karakterizasyonu
DE sirkRNA'larının ek açıklama durumu
Tanımlanan DE sirkRNA'ları, yerleşik bir sirkRNA veritabanı olan circBase ile çapraz kontrol edildi. Bununla birlikte, circBase'de biriken circRNA koordinatları önceki bir insan genomu versiyonuna (hg19) dayandığından, circBase'den gelen circRNA koordinatları, bu çalışmada çapraz kontrol için mevcut insan genomu versiyonuna (hg38) dönüştürülmelidir. Ek olarak, başlangıç koordinatı CIRIquant'ın 1 tabanlı çıktısından 0 tabanlı olarak dönüştürülmelidir. circBase'in hg38 sürümüne dönüştürülmüş circRNA koordinatları, Github (https://github.com/bicciatolab/Circr)37'deki bir sürücü klasöründe sağlanır. Daha sonra, yeni bir veri çerçevesi sütununda sirkRNA'ların ek açıklama durumunu atamak için Rstudio betikleri (Ek Dosya 1) kullanıldı. Tablo 6 , ek açıklama durumuna sahip sirkRNA'ların bir örneğini göstermektedir.

DE sirkRNA'larının karakterizasyonu
Bu bölüm tamamen RStudio yazılımındaki R betikleri aracılığıyla yürütüldü. R betikleri analitik süreçleri kolaylaştırır ve yalnızca temel bilgiler gereklidir.

CircRNA tipleri
Bu adımda, DE sirkRNA'ları, genomik konumlarına dayanarak sirkRNA tipleri (Antisens, Exonic, Intergenic ve Intronic) ile karakterize edildi. Aşağıdaki Tablo 7 , tanımlanan DE sirkRNA'ları tarafından kapsanan farklı sirkRNA tiplerinin yüzde dağılımını göstermektedir. Toplam 306 DE sirkRNA'sından 263 sirkRNA'nın (%85.95) ekzonik sirkRNA'lar olduğu tespit edilmiştir ki bu da tanımlanan en bol sirkRNA tipidir. Intronik sirkRNA'lar, toplam DE sirkRNA'larının% 5.56'sını oluşturan 17 DE sirkRNA'sından oluşan ikinci en çok tanımlanmış sirkRNA tipi olarak gelir. Bunu intergenik sirkRNA'lar (16 DE sirkRNA'ları ~% 5.23) ve antisens sirkRNA'lar (10 DE sirkRNA'ları ~% 3.27) izler.

SirkRNA başına yayılan gen sayısı
CIRIquant tarafından tanımlanan sirkRNA'lar bir dizi gen arasında örtüşebilir. Bugüne kadar, çoğu çalışma bir geni kapsayan sirkRNA'lara odaklanmıştır. Bu nedenle, bu protokolde, birden fazla geni kapsayan sirkRNA adayları aşağı akış analizinden hariç tutulur. Aşağıdaki Tablo 8 , bir ve birden fazla geni kapsayan DE sirkRNA'larının sayısını ve yüzdesini açıklamaktadır. Bu tabloda, intergenik sirkRNA'lar (16 DE sirkRNA'lar) herhangi bir konakçı genle örtüşmedikleri için hariç tutulurken, sirkRNA tiplerinin geri kalanı (290 DE sirkRNA'lar) bu analize tabi tutulmuştur. 290 DE sirkRNA'sından, DE sirkRNA'larının çoğunluğu (261 sirkRNA ~% 90) sadece bir geni kapsarken, kalan 29 sirkRNA (~% 10) birden fazla geni kapsar.

CeRNA ağının inşası
Bir ceRNA ağı genellikle tahmin edildikten sonra sirkRNA-miRNA etkileşimlerini görselleştirmek için çizilir. Aşağıdaki Şekil 3'te , temsili bir sonuç olarak sadece bir DE sirkRNA seçilmiştir, bu da sirkRNA hsa_DE_58. Circr tahminlerine dayanarak, hsa_DE_58 dokuz farklı miRNA'ya kadar sünger oluşturabilir. Bu dokuz miRNA, sıkı kriterlerden geçirildikten sonra tanımlanır.

Fonksiyonel zenginleştirme analizi
SirkRNA ebeveyn genlerinin GO ve KEGG analizi
Aşağıdaki Şekil 4 , GO analizi yoluyla DE sirkRNA ebeveyn genlerinin fonksiyonel zenginleşmesinin bir kabarcık grafiğini göstermektedir. Temel olarak, GO analizi, incelenen durumda, bu durumda virüs bulaşmış örnekte zenginleştirilmiş veya etkilenen biyolojik süreçleri, hücresel konumları ve moleküler fonksiyonları çözmeyi amaçlamaktadır. Zenginleştirme istatistiksel olarak anlamlı kabul edilir ve kabarcık grafiğinde yalnızca p değeri 0,01 < ise çizilir. Şekil 4'te gösterildiği gibi, biyolojik süreçler (BP) için ilk üç zenginleştirme, ribonükleoprotein kompleksi biyogenezi, virüse yanıt ve biyotik bir uyarana yanıtın düzenlenmesini içerirken, moleküler fonksiyonlar (MF) için sadece RNA ve tek sarmallı RNA bağlanması üzerinde etkili olan katalitik aktivite istatistiksel olarak zenginleştirilmiştir. Öte yandan, sadece retromer kompleksi hücresel bileşenler (CC) için istatistiksel olarak zenginleştirilmiştir.

Şekil 5 , bir kabarcık grafiğinde DE circRNA ebeveyn genlerinin KEGG zenginleştirme analizini göstermektedir. GO zenginleştirme analizine benzer şekilde, KEGG zenginleştirmesi yalnızca istatistiksel olarak anlamlı kabul edilir ve p değeri 0.01 < ise bir kabarcık grafiği üzerinde çizilir. Bu vakada sadece iki KEGG terimi zenginleştirilmiştir, bunlar İnfluenza A ve viral yaşam döngüsü (HIV-1) yollarıdır.

Figure 1
Şekil 1: SirkRNA'ların tahmini ve fonksiyonel karakterizasyonu için boru hattı. Boru hattı, gerekli yazılım paketlerinin kurulumunu, sirkRNA ekspresyonunun tahmin edilmesini ve ölçülmesini, ceRNA ağının inşasını ve sirkRNA ebeveyn gen fonksiyonel zenginleştirmesinin gerçekleştirilmesini içeren baştan sona temel adımlara basit bir genel bakış sunar. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 2
Şekil 2: Circr için klasör ağacı yapısı. Bu klasör ağacı yapısının, analiz için gerekli dosyaları tespit etmek için Circr yazılımını çalıştırmadan önce kurulması gerekir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 3
Şekil 3: sirkRNA-miRNA etkileşiminden oluşan ceRNA ağı. Mavi oval şekil sirkRNA'yı temsil ederken, turuncu üçgenler miRNA'ları temsil eder. SirkRNA'yı miRNA'lara bağlayan katı çizgiler, hsa_DE_58 sirkRNA'nın potansiyel miRNA süngerleme fonksiyonunu tanımlar. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 4
Şekil 4: DE circRNA ebeveyn genlerinin GO zenginleştirme analizinin kabarcık grafiği. X eksenindeki GeneRatio, verilen GO terimiyle ilişkili giriş listesindeki genlerin sayısıdır ve toplam giriş gen sayısını böler. Grafikteki nokta boyutu, verilen GO terimiyle ilişkili giriş listesindeki genlerin sayısı olan count değeri ile temsil edilir. Noktaların boyutu ne kadar büyük olursa, terimle ilişkili giriş genlerinin sayısı da o kadar büyük olur. Ayrıca, grafikteki noktalar p değerine göre renk kodludur. P-değeri, bir ek açıklama teriminin gözlemlenen sıklığı ile tesadüfen beklenen frekansın karşılaştırılmasıyla hesaplanır. Bireysel terimler, bir kesme değerinin ötesinde zenginleştirilmiş olarak kabul edilir (p değeri < 0,01). Maviden kırmızıya değişen p değerinin renk gradyanı, terimlerin artan zenginleşmesini gösterir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 5
Şekil 5: DE circRNA ebeveyn genlerinin KEGG zenginleştirme analizi. X eksenindeki GeneRatio, verilen KEGG terimiyle ilişkili giriş listesindeki genlerin sayısıdır ve toplam giriş gen sayısını böler. Grafikteki nokta boyutu, verilen KEGG terimiyle ilişkili giriş listesindeki genlerin sayısı olan count değeri ile temsil edilir. Noktaların boyutu ne kadar büyük olursa, terimle ilişkili giriş genlerinin sayısı da o kadar büyük olur. Ayrıca, grafikteki noktalar p değerine göre renk kodludur. P-değeri, bir ek açıklama teriminin gözlemlenen sıklığı ile tesadüfen beklenen frekansın karşılaştırılmasıyla hesaplanır. Tek tek terimler, bir kesme değerinin ötesinde zenginleştirilmiş olarak kabul edilir (p değeri < 0,01). P değerinin maviden kırmızıya değişen renk gradyanı, terimlerin zenginleşmesinin arttığını gösterir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Örnek ad CIRIquant çıktı GTF dosyasının yolu Grup -landırma
Kontrol 1 /yol/to/CIRIquant/ctrl1.gtf C
Kontrol 2 /yol/to/CIRIquant/ctrl2.gtf C
Enfekte 1 /yol/to/CIRIquant/infect1.gtf T
Enfekte 2 /yol/to/CIRIquant/infect2.gtf T

Tablo 1: CIRIquant'ın .lst dosyası hazırlanması. Kontrolün hedef yolları ve CIRIquant çıktısından işlenmiş örnekler, iki tür numune arasındaki circRNA ifadelerini karşılaştırmak için bir metin dosyasına yazılır.

Chr Başlamak Son Ad . Yalı
CHR2 137428930 137433876 hsa_circ_000076 . -
CHR2 154705868 154706632 hsa_circ_000105 . -
CHR2 159104273 159106793 hsa_circ_000118 . -
CHR2 159215701 159226125 hsa_circ_000119 . -
CHR4 39980067 39980129 hsa_circ_002584 . -

Tablo 2: Circr için örnek BED dosyası. BED dosyasını oluşturmak için sirkRNA'larla ilişkili altı sütun (Chr, Start, End, Name, Gene ve Strand) gereklidir.

circRNA_name Tür miRNA_name Tür
DE_circRNA_1 sirkRNA miR-001 miRNA
DE_circRNA_1 sirkRNA miR-002 miRNA
DE_circRNA_2 sirkRNA miR-003 miRNA
DE_circRNA_2 sirkRNA miR-004 miRNA

Tablo 3: Cytoscape giriş dosyası. Bir metin dosyasına dört sütun (circRNA_name, Type, miRNA_name ve Type) yazılması gerekir.

SirkRNA logFC logCPM LR Pvalue DE FDR
chr4:17595410|17598558 8.167934481 -0.039318634 185.5341965 3.00E-42 1 1.08E-37
chr16:18834892|18850467 -3.955083482 -4.397235736 2.982607619 0.08416358 0 0.282478158
CHR14:73198031|73211942 2.493964729 -4.448176684 2.736442046 0.09808293 0 0.282478158

Tablo 4: CIRIquant'ın son çıktı (.csv) dosyasının bir parçası. CIRIquant, LogFC, milyon başına günlük sayıları (LogCPM), lojistik regresyon (LR), p değeri, diferansiyel ifade ve FDR gibi bilgiler sağlar.

CIRIquant sonuçları
Toplam DE Yukarı Aşağı
35846 306 306 0

Tablo 5: Tanımlanan toplam ve diferansiyel olarak eksprese edilen (DE) sirkRNA'ların sayısının bir özeti. 306'sı DE sirkRNA'ları olmak üzere toplam 35.846 sirkRNA tespit edilmiştir. Tüm 306 DE sirkRNA'ları, kontrol numunelerine kıyasla tedavi edilen numunelerde yukarı regüle edilir (hiçbiri aşağı regüle edilmez).

Custom_Name Annotation_Status
hsa_DE_22 Açıklamasız
hsa_DE_2 Açıklamalı
hsa_DE_58 Açıklamasız
hsa_DE_3 Açıklamalı

Tablo 6: Ek açıklama durumuna sahip özel sirkRNA adları tablosu. CircRNA'lar, bilinen birikmiş sirkRNA'ların (circBase) bir veritabanında sorgulanır. SirkRNA veritabanında mevcutsa, açıklama eklenmek üzere etiketlenirken, sirkRNA'nın yokluğu açıklamasız olarak etiketlenir.

CircRNA Tipi Frekans Yüzde
antisens 10 3.27%
Exon 263 85.95%
intergenik 16 5.23%
İntron 17 5.56%

Tablo 7: Tanımlanan sirkRNA tipleri. SirkRNA'lar, sekans bölgelerine bağlı olarak, yani ekzonik, intronik, antisens ve intergenik olmak üzere farklı sirkRNA tiplerine ayrılabilir.

Ebeveyn genlerinin sayısı Frekans Yüzde
1 261 90%
> 1 29 10%

Tablo 8: Farklı sayıda genin yayıldığı sirkRNA'ların yüzdesi. SirkRNA'lar genellikle bir genin ekzonlarından kodlanır, ancak birden fazla geni kapsayan sirkRNA'lar CIRIquant tarafından da tespit edilebilir.

Ek Dosya 1: Protokolde kullanılan komut dosyaları. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Bu protokolün faydasını göstermek için, influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden RNA-seq örnek olarak kullanılmıştır. Konakçı-patojen etkileşimlerinde potansiyel miRNA süngerleri olarak işlev gören sirkRNA'lar ve bir konakçı içinde GO ve KEGG fonksiyonel zenginleştirmeleri araştırıldı. Çevrimiçi olarak çeşitli sirkRNA araçları olmasına rağmen, her biri birbiriyle etkileşime girmeyen bağımsız bir pakettir. Burada, sirkRNA tahmini ve nicelleştirmesi, sirkRNA fonksiyonel zenginleştirme, sirkRNA-miRNA etkileşim tahmini ve ceRNA ağ yapısı için gerekli olan araçlardan birkaçını bir araya getirdik. Bu kolaylaştırılmış protokol zaman kazandırır ve tanısal ve prognostik değerlere sahip sirkRNA adaylarını tespit etmek için klinik örneklere uygulanabilir.

Temel olarak, sirkRNA'ların DE analizini tespit edebilen ve gerçekleştirebilen CIRI2 ile önceden paketlenmiş bir sirkRNA niceleme aracı olan CIRIquant31'i kullandık. DE sirkRNA'ları, LogFC'nin bir kesme değerine göre filtrelenir > |2| ve FDR 0.05'i <, bu da aşağı akış analizlerinde potansiyel yanlış pozitifleri ortadan kaldırmaya yardımcı olur. DE sirkRNA'larının ek açıklama durumu, sirkRNA tipleri ve yayılan gen sayısı açısından karakterizasyonu, sirkRNA adaylarının kategorize edilmesine ve daha fazla filtrelenmesine yardımcı olur. Daha sonra, bir circRNA-miRNA tahmin aracı olan Circr37, potansiyel miRNA süngerleme adaylarını tahmin etmek için kullanılır. Potansiyel miRNA'ları sirkRNA'ların hedefleri olarak tahmin ettikten sonra, bir ceRNA ağı çizilir. Son olarak, sirkRNA'ların ebeveyn genlerine dayanarak, R clusterProfiler paketi39 , GO ve KEGG yol zenginleştirme analizi yoluyla fonksiyonel ek açıklama için kullanılır. GO ve KEGG'den elde edilen sonuçlar, sirkRNA'lardan etkilenen biyolojik mekanizmaların çözülmesine yardımcı olabilir.

Bugüne kadar, CIRI2 43, CIRCexplorer244, find_circ 45, MapSplice46 ve UROBORUS 47 dahil olmak üzere birkaç farklı sirkRNA tahmin aracı geliştirilmiştir. Hansen ve ark. tarafından yapılan bir çalışmada, CIRI2'nin yüksek bir genel performansa sahip olduğu bildirilmiştir. De novo tahmin ve yanlış pozitif tanımlamanın azaltılması açısından iyi işlev görebilen birkaç sirkRNA tespit aracı arasındadır48. Bu nedenle bu çalışmada sirkRNA tespiti ve nicelleştirmesi için CIRI2'yi kullanan CIRIquant kullanılmıştır. CIRIquant, arka ekleme birleşimi (BSJ) okumalarını saymak için kullanıldı ve sayım verileri, aynı gen lokuslarından kopyalanan doğrusal RNA'ları birleştirmek için eşlenen okumalara normalleştirildi. Bu, bir numunedeki sirkRNA'ların nicelleştirilmesine izin verir. Deneysel koşullar arasında sirkRNA'ların diferansiyel ekspresyonunu belirlemek için CIRIquant, DE analizi için edgeR49'da genelleştirilmiş bir doğrusal model uyguladı ve tam oran-oran testi, sirkRNA bağlantı oranındaki farkın önemini belirlemek için istatistiksel bir test olarak kullanıldı. Her ne kadar sirkRNA'ların ekspresyon seviyesini ölçmek için CIRCexplorer3-CLEAR50 gibi diğer sirkRNA niceleme araçları kullanılabilse de, bu araç sadece bir numunede sirkRNA nicelemesine izin verir, çünkü BSJ bir numunede okur ve sayım verilerini aynı numuneden konyak doğrusal RNA sayımlarına karşı normalleştirir. CIRCexplorer3-CLEAR, deneysel koşullar arasında circRNA ekspresyonlarını karşılaştıramaz. Ayrıca, niceliksel ifade düzeyini desteklemek için CIRCexplorer3-CLEAR'da istatistiksel analiz aracı uygulanmaz. CIRIquant içinde uygulanan varsayılan sirkRNA tahmin aracı CIRI2 olmasına rağmen, find_circ ve CIRCexplorer2 gibi diğer araçlardan elde edilen tahmin sonuçları niceleme ve DE analizi31 için de kullanılabilir. Bu protokolde, tahmin için sadece bir sirkRNA tahmin aracı (CIRI2) kullanıldı, bu da hala yanlış pozitif sirkRNA adayları verebilir. Yanlış pozitifleri azaltmak için, analiz için diğer sirkRNA tahmin araçlarını birleştirebilir ve farklı sirkRNA tahmin araçları arasında tespit edilen ortak sirkRNA'ları seçebilir48,51. SirkRNA tespitini daha da iyileştirmek için, hem rRNA tükenmiş hem de RNase R ön işlemine tabi tutulan RNA dizileme veri kümelerini kullanmak idealdir.

Çalışmanın amacına bağlı olarak, de novo ve açıklamalı DE sirkRNA'ları, circBase veritabanı52'ye dayanarak ayrı ayrı tanımlanabilir. Bununla birlikte, birden fazla geni kapsayan sirkRNA'lar, sirkRNA'ların özgünlüğünü belirlemek ve yanlış pozitifleri ortadan kaldırmak için genellikle UCSC veya başka bir genom tarayıcısında manuel inceleme gerektirir. Bununla birlikte, füzyon genlerinden türetilen sirkRNA'lar gibi birden fazla geni kapsayan sirkRNA'lar da yakın zamandabildirilmiştir 53,54.

Circr, sirkRNA-miRNA bağlanma bölgelerini tahmin etmek için üç farklı miRNA-mRNA tahmin algoritmasını, yani TargetScan 55, miRanda56 ve RNAhybrid57'yi birleştirerek çalışır. Bunun da ötesinde, algoritma ayrıca sirkRNA-miRNA analizinde AGO zirvelerinin ve daha önce doğrulanmış etkileşimlerin bilgilerini de içerir. Burada, daha güvenilir bir sirkRNA-miRNA tahmininin elde edilmesini sağlamak için sıkı filtreleme kriterleri uygulandı, böylece yanlış pozitifler daha da azaltıldı. Ancak, bu filtreleme adımının sıkılığı, kullanıcı tercihine bağlı olarak daha yüksek veya daha düşük olarak ayarlanabilir.

ClusterProfiler, çeşitli organizmalardaki gen kümelerine işlevsel olarak açıklama ekleyebilen iyi belgelenmiş bir R paketidir. Bu protokolde bahsedilen R clusterProfiler paketindeki (enrichGO ve enrichKEGG) aşırı gösterim analizini kullanan işlevlerin yanı sıra, gseGO ve gseKEGG gibi kullanılabilecek başka işlevler de vardır. clusterProfiler iş akışı için uygun bir seçim değilse, "AllEnricher"58 veya "Metascape"59 gibi bir dizi geni işlevsel olarak açıklama ekleyebilen web sitesi tabanlı araçlar gibi başka araçlar ve paketler de vardır. Son olarak, yukarıda sağlanan boru hattı potansiyel sirkRNA'ları ve fonksiyonel ek açıklamalarını tahmin etmede yardımcı olsa da, sağlam kanıtlar sağlamak için ıslak laboratuvar doğrulamasına ihtiyaç duyulacaktır.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların açıklayacak hiçbir şeyi yok.

Acknowledgments

Yazar, bu makaleyi eleştirel bir şekilde gözden geçirdikleri için Tan Ke En ve Dr. Cameron Bracken'e teşekkür eder. Bu çalışma, Temel Araştırma Hibe Programı (FRGS/1/2020/SKK0/UM/02/15) ve Malaya Üniversitesi Yüksek Etkili Araştırma Bursu (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Name Company Catalog Number Comments
Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

DOWNLOAD MATERIALS LIST

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. Andrews, S. FastQC: A quality control tool for high throughput sequence data. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. Carlson, M. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0. , Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022).
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), New York, N.Y. 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Tags

Geri çekme Sayı 188 dairesel RNA sirkRNA konakçı-patojen etkileşimi
<em>Burada: Silico</em> Konakçı-Patojen Etkileşimleri Sırasında SirkRNA'ların Tanımlanması ve Karakterizasyonu
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ealam Selvan, M., Lim, K. S., Teo,More

Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter