Biology

Kimerik Küçük Kodlamayan RNA için Hesaplamalı Analiz Eğitimi: Hedef RNA Dizileme Kitaplıkları

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Burada, in vivo RNA:RNA etkileşimlerinin incelenmesinde kullanılan kimerik RNA dizileme verilerini analiz etmek için bir biyoinformatik boru hattının kurulumunu ve kullanımını gösteren bir protokol sunuyoruz.

Abstract

MikroRNA'lar (miRNA'lar) gibi küçük kodlamayan RNA'ların (sncRNA'lar) hedef RNA'ları ile in vivo gen düzenleyici etkileşimlerinin anlaşılması, son yıllarda, kimerik RNA'ların oluşumu ve müteakip dizileme kütüphaneleri yoluyla sncRNA:hedef RNA etkileşimlerini yakalamak için çapraz bağlanmayı ve ardından ligasyonu kullanan biyokimyasal yaklaşımlarla ilerletilmiştir. Kimerik RNA diziliminden elde edilen veri kümeleri, miRNA tahmin yazılımından genom çapında ve önemli ölçüde daha az belirsiz girdi sağlarken, bu verileri anlamlı ve eyleme geçirilebilir bilgilere damıtmak ek analizler gerektirir ve hesaplama altyapısına sahip olmayan araştırmacıları caydırabilir. Bu rapor, giriş seviyesi hesaplama biyologlarını yeni bir açık kaynaklı yazılım aracı olan Küçük Kimerik RNA Analiz Boru Hattı'nı (SCRAP) kurma ve uygulama konusunda desteklemek için bir eğitim sağlar. Platform gereksinimleri, güncelleştirmeler ve işlem hattı adımlarının açıklaması ve önemli kullanıcı girişi değişkenlerinin işlenmesi sağlanır. Biyologların kimerik RNA dizileme yaklaşımlarından içgörü elde etmelerinin önündeki bir engeli azaltmak, düzenleyici sncRNA'nın keşfe dayalı araştırmalarına sıçrama tahtası yapma potansiyeline sahiptir: çoklu biyolojik bağlamlarda hedef RNA etkileşimleri.

Introduction

Küçük kodlamayan RNA'lar, farklılaşma ve gelişme, sinyal işleme ve hastalık ^1,2,3 gibi çeşitli süreçlerde gen paketlerinden ekspresyonun koordinasyonunda transkripsiyon sonrası rolleri nedeniyle oldukça incelenmiştir. MikroRNA'lar (miRNA'lar) dahil olmak üzere gen düzenleyici küçük kodlamayan RNA'ların (sncRNA'lar) hedef transkriptlerini doğru bir şekilde belirleme yeteneği, hem temel hem de translasyonel seviyelerde RNA biyolojisi çalışmaları için önemlidir. miRNA tohum dizisi ile potansiyel hedefleri arasında beklenen tamamlayıcılıktan yararlanan biyoinformatik algoritmalar, miRNA:hedef RNA etkileşimlerinin tahmini için sıklıkla kullanılmıştır. Bu biyoinformatik algoritmalar başarılı olsa da, başka bir yerde gözden geçirildiği gibi, hem yanlış pozitif hem de yanlış negatif sonuçları barındırabilirler ^4,5,6. Son zamanlarda, in vivo sncRNA:hedef RNA etkileşimlerinin in vivo çapraz bağlanması ve ardından sncRNA'yı tek bir kimerik RNA 4,5,7,8,9,10 oluşturmak üzere hedefine fiziksel olarak bağlamak için bir ligasyon adımının dahil edilmesi yoluyla açık ve yarı kantitatif olarak belirlenmesine izin veren çeşitli biyokimyasal yaklaşımlar tasarlanmış ve uygulanmıştır.. Kimerik RNA'lardan dizileme kitaplıklarının daha sonra hazırlanması, dizileme verilerinin hesaplamalı işlenmesiyle sncRNA:hedef RNA etkileşimlerinin değerlendirilmesine izin verir. Bu video, kimerik RNA dizileme kitaplıklarından sncRNA:hedef RNA etkileşimlerinin sağlam ve tekrarlanabilir analizine izin vermek için tasarlanmış, küçük kimerik RNA analiz boru hattı (SCRAP) olarak adlandırılan bir hesaplama işlem hattının kurulması ve kullanılması için bir eğitim sağlar⁶.

Bu eğitimin amacı, sncRNA'nın kimerik moleküler okumalarını sağlayan biyokimyasal yaklaşımlar yoluyla üretilen verilerin analizinin önündeki engelleri azaltarak, araştırmacılara tamamen tahmine dayalı biyoinformatik algoritmalara aşırı güvenmekten kaçınmalarında yardımcı olmaktır: hedef RNA etkileşimleri. Bu eğitim, giriş seviyesi hesaplamalı bilim insanlarına, hibritlerin çapraz bağlanması, ligasyonu ve dizilenmesi (CLASH) ve endojen Argonaute'ye bağlı RNA'ların kovalent ligasyonu (CLEAR-CLIP)^7,9 dahil olmak üzere mevcut birkaç biyokimyasal protokol tarafından üretilebilen kimerik RNA dizileme verilerini analiz etmek için geliştirilmiş bir boru hattı olan SCRAP'ın kullanımı yoluyla rehberlik edecek pratik adımlar ve ipuçları sağlar.

SCRAP kullanımı, diğer hesaplama boru hatlarına kıyasla kimerik RNA dizileme verilerinin analizi için çeşitli avantajlar sunar⁶. Göze çarpan bir avantaj, boru hattındaki adımlar için genellikle özel ve/veya desteklenmeyen komut dosyalarına dayanan alternatif işlem hatlarına kıyasla, kapsamlı ek açıklaması ve boru hattı içindeki iyi desteklenen ve rutin olarak güncellenen biyoinformatik komut dosyalarına çağrıların dahil edilmesidir. Bu özellik, SCRAP'a istikrar kazandırarak, araştırmacıların boru hattını tanımalarını ve kullanımını iş akışlarına dahil etmelerini daha değerli hale getirir. SCRAP'in ayrıca, önceki bir yayında^{ayrıntılı olarak açıklandığı} gibi, sncRNA:hedef RNA etkileşimlerinin tepe noktalarını çağırmada alternatif boru hatlarından daha iyi performans gösterdiği ve platformlar arası işlevselliğe sahip olduğu gösterilmiştir 6.

Bu eğitimin sonunda, kullanıcılar (i) SCRAP için platform gereksinimlerini öğrenebilecek ve SCRAP boru hatlarını kurabilecek, (ii) referans genomları kurabilecek ve SCRAP için komut satırı parametreleri ayarlayabilecek ve (iii) tepe çağrı kriterlerini anlayabilecek ve tepe çağrı ve tepe ek açıklaması gerçekleştirebilecektir.

Bu video, RNA biyolojisini inceleyen araştırmacıların, dizileme kütüphanesi hazırlığına yönelik tartışılan biyokimyasal yaklaşımlardan biri aracılığıyla elde edilen kimerik RNA dizileme verilerinde haberci RNA'lar gibi hedef RNA'larla sncRNA etkileşimlerini analiz etmek için hesaplama boru hattı SCRAP'ı nasıl kurabileceklerini ve en uygun şekilde nasıl kullanabileceklerini pratik olarak ayrıntılı olarak açıklayacaktır.

SCRAP bir komut satırı yardımcı programıdır. Genel olarak, aşağıdaki kılavuzu izleyerek, kullanıcının (i) SCRAP'ı (https://github.com/Meffert-Lab/SCRAP) indirip yüklemesi, (ii) referans genomları kurması ve SCRAP'yi çalıştırması ve (iii) en yüksek çağrı ve açıklama gerçekleştirmesi gerekir.

Bu yordamdaki hesaplama adımlarıyla ilgili daha fazla ayrıntı https://github.com/Meffert-Lab/SCRAP'da bulunabilir. Bu makale, giriş seviyesi hesaplama becerilerine sahip araştırmacıların kimerik RNA dizileme kitaplığı veri kümelerinde SCRAP yüklemesine, optimize etmesine ve kullanmasına izin vermek için kurulum ve arka plan bilgileri sağlayacaktır.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOT: Protokol, SCRAP kullanarak kimerik RNA dizileme kitaplıklarını analiz etmek için gereken yazılımın indirilmesi ve yüklenmesiyle başlayacaktır.

1. Kurulum

SCRAP'ı kurmadan önce, analizler için kullanılacak makineye Git ve Miniconda bağımlılıklarını kurun. Git büyük olasılıkla zaten yüklüdür. Örneğin, Mac OSX platformunda, "git" yardımcı programının bu dizinde mevcut olduğunu ve yüklü olduğunu görmek için hangi git'i kullanarak bunu doğrulayın. Miniconda'nın hangi conda kullanılarak kurulup kurulmadığını kontrol edin. Hiçbir şey döndürülmezse, Miniconda'yı yükleyin. Miniconda'yı yüklemek için 400 MB disk alanı gerekir.
1. Miniconda'yı kurmanın birkaç yöntemi vardır ve bunlar platforma göre farklılık gösterir. Windows, MacOS ve Ubuntu'ya yüklemek için daha fazla talimatın bulunduğu Meffert Lab GitHub deposundaki [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] PLATFORM-SETUP markdown dosyasına bakın. Linux kullanıcıları için, Linux'un kendi varsayılan paket yöneticisi (apt) vardır. Bu çalışmaya özgü durumda, mevcut bir paket yöneticisi olan brew'u kullanarak Miniconda'yı kurmak için brew install Miniconda komutunu kullanın.
  NOT: 'Brew' olarak adlandırılan 'Homebrew', Apple'ın işletim sistemi macOS'a yazılım yüklenmesini basitleştiren açık kaynaklı bir yazılım paketi yönetim sistemidir.
2. conda ilk kez yükleniyorsa, kullanımda olan belirli bir kabuk için komutunu çalıştırın conda init . Buradaki örnekte, kullanılan kabuk zsh'dir. Ardından, kabuğu kapatın ve yeniden açın. Conda başarıyla yüklendiyse, terminal oturumu içinde etkinleştirilen temel ortam görülecektir.
SCRAP kaynağını indirin ve bağımlılıklarını yükleyin.
1. SCRAP kaynağı elde etmek için tercih edilen yöntem Git kullanmaktır. Kaynak kodun en son kopyasını almak için git clone https://github.com/Meffert-Lab/SCRAP komutunu çalıştırarak buna erişin.
2. Conda için geliştirilmiş bir paket çözücü olan mamba'yı kurun ve aşağıdaki komutları kullanarak SCRAP için tüm bağımlılıkları SCRAP_environment.yml'den kendi conda ortamına yükleyin:
  conda install -n tabanı conda-forge::mamba
  mamba env oluştur -f HURDA/SCRAP_environment.yml -n HURDA
Ardından, SCRAP için başvuru yüklemesini çalıştırın. Referans kurulumunda kullanılan argümanlar, sncRNA-mRNA etkileşimleri analiz edilen organizmaya özgü olacaktır.
bash HURDA/çöp kutusu/Reference_Installation.sh -r dolu/yol/için/HURDA/ -m -g hg38 -s insan var
1. Referans kurulumu için SCRAP kaynak klasörünün dizinini sağlayın. Kurulum adımları daha sonra fasta ve açıklama klasörlerindeki dosyalar kullanılarak gerçekleştirilecektir. Herhangi bir kısayol olmadan tam yolu listeleyin. Eğik çizgi ile bitirin.
2. Doğru miRbase tür kısaltmaları için README.md'deki tablolara bakın. Güncel referans genomlar https://genome.ucsc.edu/ veya https://www.ncbi.nlm.nih.gov/data-hub/genome/'da bulunabilir. Bu örnekte, fare GRCm38 genomu için hg38 kullanılacaktır.
3. Şu anda açıklama için dahil edilen türler insan, fare ve solucandır. SCRAP kaynak klasöründeki ek açıklama dizininde karşılık gelen species.annotation.bed dosyalarını görüntüleyin. Analiz için farklı bir türün kullanılması isteniyorsa, aynı adlandırma şemasını izleyen bir annotation.bed dosyası sağlayın species.annotation.bed.

2. HURDA Çalıştırma

Bağımlılıklar ve SCRAP yüklendiğine göre, - betiği çalıştırın SCRAP.sh
bash HURDA/çöp kutusu/SCRAP.sh -d dolu/yol/için/CLASH_Human/ -a dolu/yol/için/CLASH_Human/CLASH_Human_Adapters.txt -p hayır -f evet -r dolu/yol/için/HURDA/ -m -g hg38'e sahiptir
1. Herhangi bir kısayol olmadan örnek dizinlere giden tüm yolu listeleyin. Örnek dizinleri, Şekil 1'de gösterildiği gibi, örnek adla tam olarak eşleşen klasör adıyla biçimlendirin.
2. Listelenen yolun, tek bir örnek klasörün veya örnek dosyanın yolu değil, tüm örnek klasörleri içeren dizinin yolu olduğunu unutmayın (adım 2.1'deki komut satırına bakın).
3. Ardından, bağdaştırıcı dosyasının tüm yolunu listeleyin. Bağdaştırıcı dosyasındaki örnek adların daha önce bahsedilen klasör adları ve dosya adlarıyla eşleştiğinden emin olun (adım 2.1'deki komut satırına bakın).
4. Numunelerin eşleştirilmiş uç olup olmadığını ve pre-miRNA'lar ve/veya tRNA'lar için filtreleme yapılıp yapılmayacağını belirtin. İsterseniz rRNA temizliği için bir filtre ekleyin (adım 2.1'deki komut satırına bakın).
  NOT: Kullanıcılar, örnek türlerine ve deneysel hedeflere bağlı olarak bu filtreleri kullanmaya karar verebilir veya vermeyebilir. Deneysel tasarıma bağlı olarak, pre-miRNA'lar, tRNA'lar ve rRNA'lar, gerçek sncRNA:hedef RNA kimeraları için mevcut dizileme derinliğini tüketebilir ve kullanıcılar bunları dışlamak için filtreler kullanabilir. Bununla birlikte, kullanıcılar belirli durumlarda bu tür filtrelemeden kaçınmak isteyebilir (örneğin, sncRNA hedeflerini mitokondriyal rRNA'ları içeren mitokondriyal genoma eşlemek).
5. Ardından, başvuru dizininin tüm yolunu, miRbase kısaltmasını ve başvuru genom kısaltmasını listeleyin (adım 2.1'deki komut satırına bakın).
  NOT: Komut dosyasının tamamlanması, veri kümesi boyutuna ve kullanılan bilgisayarın CPU'suna bağlı olarak birkaç saat sürebilir.

3. Tepe arama ve açıklama

SCRAP'ın çalışması bittiğinde, çıktının diğer dosyaların yanı sıra bir SAMPLE.aligned.unique.bam dosyası içerip içermediğini kontrol edin. Bu, hedef RNA'ların kullanıcı tarafından sağlanan referans genom üzerindeki hizalamalarını içeren bir ikili dosyadır.
Şimdi Peak_Calling.sh çalıştırarak yoğun arama gerçekleştirin.
bash HURDA/çöp kutusu/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r HURDA/ -m -g hg38
NOT: Tepe çağrısı, araştırmacıların kimerik RNA kütüphaneleri içindeki en sağlam ve tekrarlanabilir küçük kodlamayan RNA'yı kolayca değerlendirmelerini sağlamak için tasarlanmış bir SCRAP özelliğidir: hedef RNA etkileşimleri. Örneğin bu özellik, araştırmacıların daha fazla araştırma için seçmek isteyebilecekleri etkileşimleri belirlemelerine yardımcı olabilir. Aşağıdaki Adım 3.2.2, kullanıcının bir tepe noktasının çağrıldığı sıkılığı tanımlamak için kullanılmasını istediği kriterleri nasıl belirlediğini açıklar - bu, çağrılacak tepe noktası için meydana gelmesi gereken benzersiz etkileşimlerin veya sıralama okumalarının sayısını ve bu belirli etkileşimin gerçekleşmesi gereken kitaplıkların sayısını içerir.
1. Yine, örnek klasörleri ve bağdaştırıcı dosyasını içeren dizinin tam yollarını listeleyin (adım 3.2'deki komut satırına bakın).
2. Ardından, çağrılacak bir tepe noktası için gereken en düşük sıralama okuma sayısını ayarlayın (adım 3.2'deki komut satırına bakın).
3. Çağrılması için bir tepe noktası içermesi gereken en az farklı sıralama kitaplığı sayısını ayarlayın (adım 3.2'deki komut satırına bakın).
  NOT: Hem 3.2.2 hem de 3.2.3 için değer seçimi, sıralanan numunelerin doğasına ve numunelerin veya numune tiplerinin sayısına bağlı olacaktır. Burada, bir zirveyi çağırmak için bir örnekte en az 3 kimerik dizileme okuması gerekir ve tepe noktası en az 2 örnek tarafından desteklenmelidir. Örneğin, belirli bir koşul için birçok sıralama kitaplığı yinelemesinin bulunduğu bir veri kümesini değerlendiren bir araştırmacı, okumaların daha fazla sayıda örnek sıralama kitaplığında bulunmasını gerektirmeye karar verebilir.
4. Aynı ailenin sncRNA'larının aynı zirveye katkıda bulunması gerekip gerekmediğini belirtin. Örneğin, aynı aileden miRNA'lar tohum dizilerini paylaştığından, bu miRNA'lar paylaşılan ve örtüşen gen hedefleri kümelerini bağlayabilir; Bir kullanıcı, bir ailenin bu hedefler üzerindeki tam etkisini, kolektif zirvelerini değerlendirerek belirlemek isteyebilir (Adım 3.2'deki komut satırına bakın).
5. Ardından, başvuru dizininin tam yolunu, miRBase kısaltmasını ve başvuru genom kısaltmasını belirtin (adım 3.2'deki komut satırına bakın).
Yoğun çağrı tamamlandıktan sonra yoğun ek açıklamayı çalıştırın.
bash HURDA/çöp kutusu/Peak_Annotation.sh -p CLASH_Human/tepeler.yatak -r HURDA/ -s insan
1. Tepe çağrısından elde edilen peaks.bed (veya peaks.family.bed ) dosyasının tam yolunu, başvuru dizininin tam yolunu ve ek açıklama için istenen türü listeleyin.

4. Verileri görselleştirme

NOT: SCRAP kullanarak analiz için tüm adımlar tamamlanmıştır. Verileri görselleştirmek için çeşitli yaklaşımlar önerilir:

Birlikte görselleştirmek istenecek tüm .bam (ikili SAM dosyası) dosyalarını birleştirin (samtools birleştirme).
Elde edilen birleştirilmiş .bam dosyasını sıralayın (samtools sıralaması). Dosya içeriği, samtools'un dizine ekleyebilmesi için satır satır sıralanır.
Sıralanan .bam dosyasını (samtools dizini) dizine ekleyin. Bütünleştirici genomik görüntüleyicide (IGV) görselleştirmeye izin vermek için bir BAI (ikili samtools biçim dizini) dosyası oluşturulur.
Son olarak, ortaya çıkan sıralanmış .bam ve dizine alınmış .bai dosyasını IGV'de açın.
NOT: SncRNA: İlgilenilen hedef RNA etkileşimleri, araştırmaya özgü bir dizi yolla takip için önceliklendirilebilir. Genel bir başlangıç yaklaşımı, zirvelerin en kimerik sıralama okumaları tarafından desteklendiği etkileşimleri değerlendirmektir. İlgilenilen etkileşimler, tespit edilen etkileşimden hem sncRNA hem de hedef RNA için dizi girilerek RNAstructure paketinden DuplexFold Web Sunucusu kullanılarak da görselleştirilebilir¹¹. Her tepe noktası için, kromozom (ilk sütun) ve genomik koordinatlar (başlangıç: 1. sütun sonu: 2. sütun), tepe ek açıklamasında oluşturulan peaks.bed.species.annotation.txt dosyasında bulunabilir. Özellikle miRNA'lar için, tekrarlanabilir ve fonksiyonel etkileşimler kapsamlı tohum uyumlu bağlanmadan yoksun olabilirken (örneğin, etkileşimler 3' telafi edici bağlanma kullanabilir), hedef RNA'nın eş kökenli bir bağlanma motifinde tohum eşleşen bölgelerin varlığı yine de işlevsel olarak önemli tespit edilen etkileşimlerin doğrulayıcı bir özelliği olarak değerlendirilebilir ^4,12. Yardımcı veri işleme, farklı biyolojik koşullardaki pikler arasındaki diferansiyel okuma kapsamının karşılaştırmalarını ve bir yol analiz aracı kullanılarak düzenlenmiş genlerin yollara kümelenmesinin potansiyel olarak değerlendirilmesini içerebilir.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

CLEAR-CLIP⁹ kullanılarak hazırlanan daha önce yayınlanmış dizileme veri kümelerinde SCRAP'nin değiştirilmiş bir sürümü (rRNA filtrelemesi için modifikasyonları uygulayan SCRAP sürüm 2.0) tarafından tespit edilen sncRNA sonuçları: hedef RNA Şekil 2 ve Tablo 1'de gösterilmektedir. Kullanıcılar, SCRAP'de pik çağrısı ile yüksek güvenilirlikli etkileşimlerin izolasyonunu takiben meydana gelen intron bölgeleri ile nispi fraksiyon miRNA etkileşimlerindeki azalmayı takdir edebilirler. SCRAP kullanılarak yapılan analizlerden elde edilen ek veriler, bu boru hattının ilk yayınında da mevcuttur⁶. Deneysel yaklaşıma bağlı olarak, sonuçlardaki artefaktları azaltmak için hazırlanan kimerik RNA kütüphanelerinden dizileme verilerinin filtrelenmesi gerekebilir. Dizileme kütüphanesinin yetersiz biyokimyasal hazırlığı ve/veya dizileme verilerinin yetersiz filtrelenmesi, sncRNA'ların ve Argonaute tarafından bağlanan hedef RNA'ların bağlanmasından kaynaklanmayan okumaların yanlış dahil edilmesine neden olma potansiyeline sahiptir. Bu artefakt okumaları, primer dimerleri veya adaptör dimerleri, rRNA'ları ve pre-miRNA'ları içerebilir. Tablo 2 , sonuçlarda tespit edilebilecek olası artefaktları ve olası çözümleri açıklamaktadır.

Şekil 1: Veri dizinleri için biçimlendirme. Her sıralama kitaplığı için ham okumaları içeren dosyalar .fastq.gz biçiminde sağlanmalıdır. (A) Kütüphaneler eşleştirilmiş uç değilse, analizde tek bir .fastq.gz dosyası kullanılacaktır. Bu dosya 'SAMPLE.fastq.gz' olarak adlandırılmalıdır, burada SAMPLE, bağdaştırıcı dosyasında kullanıcı tarafından sağlanan tam örnek addır. Dosya, örnek adla tam olarak eşleşen bir klasörde yer almalıdır. (B) Eşleştirilmiş uç sıralama kitaplıkları için iki .fastq.gz dosyası kullanılacaktır. Bu dosyalar 'SAMPLE-R1.fastq.gz' ve 'SAMPLE-R2.fastq.gz' olarak adlandırılmalı ve örnek adla tam olarak eşleşen bir klasörde bulunmalıdır. SAMPLE adlı tüm bu dizinler, kullanıcının SCRAP'a "örnek dizin" olarak sağlayacağı aynı üst dizin içinde yer almalıdır. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Şekil 2: Hedef Tipi ve Tepe Çağrısı yöntemlerine göre miRNA:hedef RNA etkileşimlerinin oranı. Kimerik sncRNA: hedef RNA dizilimi CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ kullanılarak hazırlanan kütüphanelerden yayınlanan veriler, rRNA filtrelemesi uygulanmış değiştirilmiş bir SCRAP sürümü (SCRAP sürüm 2.0) kullanılarak analiz edildi. Pre-miRNA'lar, tRNA'lar ve rRNA'lar filtrelendi ve 'yüksek güvenilirlik' (en az 3 okuma ve 2 kitaplık) ve 'tüm etkileşimler' (en az 1 okuma ve 1 kitaplık) için farklı tepe çağrı ayarları kullanıldı. Etkileşimler miRNA ailesine göre gruplandırıldı veya gruplandırılmadı. Kategoriler (CDS, 5' UTR, intergenik, intron, 3'UTR) için kimerik RNA okumalarının nispi fraksiyonları hesaplandı ve grafiklendirildi. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

	Tüm Etkileşimler		Yüksek Güvenilirliğe Sahip Etkileşimler
	Bireysel miRNA'lar	miRNA Aileleri	Bireysel miRNA'lar	miRNA Aileleri
CD	8675	8679	925	1046
5' UTR	338	338	38	43
İntergenik	2230	2230	320	339
İntron	9522	9519	382	406
3' UTR	6814	6813	548	644
Toplam Etkileşimler:	31033	31034	4219	4597

Tablo 1: MiRNA'nın kimerik okuma Sayıları: Hedef Tipine ve Tepe Çağrı Yöntemine Göre Hedef RNA Etkileşimleri. Kimerik sncRNA: CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ kullanılarak hazırlanan kütüphanelerden yayınlanan hedef RNA dizileme verileri, rRNA filtrelemesi uygulanmış değiştirilmiş bir SCRAP versiyonu (SCRAP sürüm 2.0) kullanılarak analiz edildi. Pre-miRNA'lar, tRNA'lar ve rRNA'lar filtrelendi ve miRNA ailesine göre gruplandırılmış veya gruplandırılmamış yüksek güvenilirlikli (en az 3 okuma ve 2 kitaplık) ve tüm (en az 1 okuma ve 1 kitaplık) etkileşimler için farklı tepe çağrı ayarları kullanıldı. Her koşul için, hedef RNA etkileşiminin kodlama dizisi (CDS), 5' çevrilmemiş bölge (5' UTR), intergenik bölge, intron veya 3' çevrilmemiş bölge (3'UTR) kategorisine eşlendiği toplam tespit edilen miRNA: hedef RNA etkileşimlerinin sayıları listelenir.

Potansiyel Kirletici	Olarak Algılandı	Neden	Potansiyel Çözümler
Astar Dimerleri	Dizisi bir amplifikasyon primerinin 5' ucuyla eşleşen miRNA'lar ile dizisi primerin geri kalanıyla eşleşen bir hedef RNA arasında tespit edilen etkileşimler.	Amplifikasyonu takiben PCR ürününün yanlış boyut ayrımı (yani jel ekstraksiyonu).	Çoğu astar dimer, küçük uzunlukları nedeniyle adaptör çıkarıldıktan sonra HURDA tarafından göz ardı edilecektir. Devam ederlerse, filtreye astar dizileri eklemeyi düşünün.
rRNA'lar	Keyfi miRNA'lar ve bilinen rRNA'lar veya lncRNA'lar Gm26917 ve Gm42418 arasındaki etkileşimler	Argonaute komplekslerinin etkisiz izolasyonu (yani immünopresipitasyon ve jel ayrımı).	rRNA kontaminasyonu bol olduğunda rRNA filtrelemesi genellikle gereklidir.
tRNA'lar ve pre-miRNA'lar	Aynı tRNA'nın bozunma ürünleri olan tRNA fragmanları veya aynı pre-miRNA'dan üretilen 5p ve 3p miRNA'lar arasındaki etkileşimler.	Düşük gerçek sncRNA bolluğu: hedef RNA kimeraları veya düşük doku Argonaute ekspresyonu.	tRNA filtreleme ve miRNA öncesi filtreleme.

Tablo 2: Potansiyel kirletici dizilim okumaları ve çözümleri.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

sncRNA:hedef RNA etkileşimlerinin analizi için SCRAP boru hattının kullanımına ilişkin bu protokol, hesaplamalı analize giren araştırmacılara yardımcı olmak için tasarlanmıştır. Eğitimin tamamlanmasının, giriş seviyesi veya daha fazla hesaplama deneyimine sahip araştırmacılara, bu boru hattının kurulumu ve kullanımı için gerekli adımlarda ve kimerik RNA dizileme kitaplıklarından elde edilen verileri analiz etmek için uygulamasında rehberlik etmesi beklenmektedir. Bu protokolün tamamlanması için kritik olan adımlar, özellikle Anaconda kullanılarak bağımlılıkların yüklenmesi veya komut satırı argümanlarının yazılması sırasında dikkatli olunmadıysa, zaman alıcı olabilen ve hataların kaynağı olabilen SCRAP'ın doğru referans kurulumunu ve çalıştırılmasını içerir.

Burada, kimerik sncRNA:hedef RNA dizileme kitaplıklarının analizi için SCRAP boru hattının pratik kullanımına yönelik ipuçları ve adımlar üzerinde özellikle durulmuştur. SCRAP'in sncRNA'nın tespitinde diğer kimerik RNA analiz platformlarından daha iyi performans gösterdiği bulunmuştur:^hedef RNA etkileşimleri ^6,13. Bunun nedeni, kimerik RNA'ların oluşumunda yer alan biyokimyasal adımların bir sonucu olarak gözlemlenen özellikleri (örneğin 3' omuzlama) tespit etmek için özel olarak geliştirilen SCRAP'ın tepe çağırma özelliği olabilir. Kromatin immünopresipitasyon dizileme (CHIP-seq) uygulamalarının aşağı akışı gibi farklı biyokimyasal yaklaşımlar için diğer pik çağırma yöntemleri, bir ortalama etrafında simetrik olarak dağılmış olan ve tipik olarak kimerik sncRNA'nın pik özelliklerini tespit etmede iyi performans göstermeyen verilerdeki pikleri tespit etmek için geliştirilmiştir: hedef RNA kütüphaneleri. Ancak kullanıcılar, özellikle verileri bu tanıma uymuyorsa, ihtiyaçları için daha iyi çalışabilecek diğer hesaplama işlem hatlarının kullanımını test etmek isteyebilir.

SCRAP minimum donanım gereksinimlerine sahip olsa da, SCRAP çalışma zamanı veri kümesi boyutuyla zayıf bir şekilde ölçeklenir. Acemi seviyesinin ötesinde olan veya çok sayıda veri kümesine veya yüksek sıralama kapsamına sahip veri kümelerine sahip araştırmacılar, SCRAP'ı analiz adımlarını hızlandırabilecek şekilde kullanmak isteyebilirler. Büyük veri kümeleri (genellikle 1 milyardan > okuma) gelişmiş dosya depolama yetenekleri ve veriler için okuma/yazma hızları gerektirdiğinden, daha büyük veri kümelerinin analizi için bir Yüksek Performanslı Bilgi İşlem (HPC) kümesinde SCRAP çalıştırmak istenebilir. Paralelleştirme ve gelişmiş performans sağlaması gereken bir SCRAP optimizasyonu GitHub'da kullanıma sunulacaktır (https://github.com/Meffert-Lab/). SCRAP'in bu güncellenmiş sürümü (sürüm 2.0) ayrıca rRNA ve diğer kirleticiler için geliştirilmiş filtrelere sahiptir.

Herhangi bir arayüzde olduğu gibi, kullanıcılar komut satırı arayüzünü kullanırken kaçınılmaz olarak zorluklarla karşılaşabilirler. Bunlardan en yaygın olanları yazım hataları, yanlış yollar ve paket yükleme/sürüm oluşturmadır. Araştırmacıların komut satırı argümanları yazarken dikkatli olmaları ve yazım hatalarından kaçınmaları ve dosya veya klasörlerin yollarını tam olarak yeniden oluşturmaları önerilir (bir 'sekme' otomatik tamamlama kullanımı bu konuda yardımcı olabilir). SCRAP bağımlılıkları Anaconda aracılığıyla yönetilir, böylece araştırmacıların paket yükleme veya sürüm güncellemeleriyle ilgili sorunlarla karşılaşma olasılığı daha düşüktür.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların açıklayacak hiçbir şeyi yok.

Acknowledgments

Boru hattının kurulumu ve uygulanmasını açıklamaya ilişkin kritik geri bildirimler için BH Powell ve WT Mills IV de dahil olmak üzere yararlı tartışmalar için Meffert laboratuvarı üyelerine teşekkür ederiz. Bu çalışma Braude Vakfı ödülü, Maryland Kök Hücre Araştırma Fonu Lansman Programı, Blaustein Ağrı Araştırma ve Eğitim Vakfı ödülü ve NINDS RO1NS103974 ve NIMH RO1MH129292 tarafından MKM'ye desteklenmiştir.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Kimerik Küçük Kodlamayan RNA için Hesaplamalı Analiz Eğitimi: Hedef RNA Dizileme Kitaplıkları

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.