Alternatif ekleme (AS) ve alternatif poliadenilasyon (APA), transkript izoformlarının ve ürünlerinin çeşitliliğini genişletir. Burada, deneysel koşullar arasında değişen AS ve APA’yı tespit etmek ve görselleştirmek için toplu RNA-seq ve 3′ uç dizileme testlerini analiz etmek için biyoinformatik protokolleri açıklıyoruz.
Deneysel / biyolojik koşullar boyunca diferansiyel gen ekspresyonunu (DGE) ölçmek için RNA-Seq’in tipik analizinin yanı sıra, RNA-seq verileri ekzon seviyesindeki diğer karmaşık düzenleyici mekanizmaları keşfetmek için de kullanılabilir. Alternatif ekleme ve poliadenilasyon, transkripsiyon sonrası seviyede gen ekspresyonunu düzenlemek için farklı izoformlar üreterek bir genin fonksiyonel çeşitliliğinde çok önemli bir rol oynar ve analizleri tüm gen seviyesine sınırlamak bu önemli düzenleyici katmanı kaçırabilir. Burada, Bioconductor ve DEXSeq, Limma paketinden diffSplice ve rMATS dahil olmak üzere diğer paketleri ve fonksiyonları kullanarak, koşullar arasında diferansiyel ekzon ve poliadenilasyon sahası kullanımının tanımlanması ve görselleştirilmesi için ayrıntılı adım adım analizler gösteriyoruz.
RNA-seq, yıllar boyunca tipik olarak diferansiyel gen ekspresyonunu ve gen keşfini tahmin etmek için yaygın olarak kullanılmıştır1. Ek olarak, farklı izoformları ifade eden gen nedeniyle değişen ekzon seviyesi kullanımını tahmin etmek için de kullanılabilir, böylece transkripsiyon sonrası seviyede gen düzenlemesinin daha iyi anlaşılmasına katkıda bulunur. Ökaryotik genlerin çoğunluğu, mRNA ekspresyonunun çeşitliliğini arttırmak için alternatif ekleme (AS) ile farklı izoformlar üretir. AS olayları farklı kalıplara ayrılabilir: bir (“kaset”) ekzonun yan tarafındaki intronlarla birlikte transkriptten tamamen çıkarıldığı tam ekzonların (SE) atlanması; ekzonun her iki ucunda iki veya daha fazla ekleme bölgesi bulunduğunda alternatif (donör) 5′ ekleme yeri seçimi (A5SS) ve alternatif 3′ (alıcı) ekleme yeri seçimi (A3SS); Bir intron olgun mRNA transkriptinde tutulduğunda intronların (RI) tutulması ve mevcut iki ekzondan sadece birininbir seferde tutulabildiği ekzon kullanımının (MXE) karşılıklı dışlanması 2,3. Alternatif poliadenilasyon (APA), tek bir transkript4’ten çoklu mRNA izoformları üretmek için alternatif poli (A) bölgeleri kullanarak gen ekspresyonunun düzenlenmesinde de önemli bir rol oynar. Çoğu poliadenilasyon bölgesi (pAs), 3′ çevrilmemiş bölgede (3′ UTR’ler) bulunur ve çeşitli 3′ UTR uzunluklarına sahip mRNA izoformları üretir. 3′ UTR, düzenleyici unsurları tanımak için merkezi merkez olduğundan, farklı 3′ UTR uzunlukları mRNA lokalizasyonunu, kararlılığını ve translasyonunu etkileyebilir5. Protokol6’nın ayrıntılarında farklılık gösteren APA’yı tespit etmek için optimize edilmiş bir 3′ uç sıralama tahlilleri sınıfı vardır. Burada açıklanan boru hattı PolyA-seq için tasarlanmıştır, ancak açıklandığı gibi diğer protokoller için uyarlanabilir.
Bu çalışmada, ekzon bazlı (DEXSeq9, diffSplice10) ve olay tabanlı (Multivariate Analysis of Transcript Splicing (rMATS)11) olmak üzere iki geniş kategoriye ayrılabilen diferansiyel ekzon analiz yöntemleri 7,8 (Şekil 1) boru hattını sunuyoruz. Ekzon tabanlı yöntemler, bireysel ekzonların koşulları arasındaki kıvrım değişimini, farklı şekilde ifade edilen ekzon kullanımını çağırmak için genel gen kıvrım değişiminin bir ölçüsüyle karşılaştırır ve bundan AS aktivitesinin gen düzeyinde bir ölçüsünü hesaplar. Olay tabanlı yöntemler, ekzon atlama veya intronların tutulması gibi belirli ekleme olaylarını algılamak ve sınıflandırmak için ekzon intronunu kapsayan bağlantı okumalarını kullanır ve çıktı3’teki bu AS türlerini ayırt eder. Bu nedenle, bu yöntemler AS12,13’ün tam bir analizi için tamamlayıcı görüşler sağlar. Diferansiyel ekleme analizi için en yaygın kullanılan paketler arasında yer aldıkları için çalışma için DEXSeq (DESeq214 DGE paketine dayanarak) ve diffSplice (Limma10 DGE paketine dayanarak) seçtik. rMATS, olay tabanlı analiz için popüler bir yöntem olarak seçildi. Bir başka popüler olay tabanlı yöntem MISO (İzoform Karışımı)1’dir. APA için ekzon tabanlı yaklaşımı uyarlıyoruz.
Şekil 1. Analiz işlem hattı. Analizde kullanılan adımların akış şeması. Adımlar şunları içerir: verileri elde etmek, kalite kontrolleri yapmak ve okuma hizalaması, ardından bilinen ekzonlar, intronlar ve pA siteleri için ek açıklamalar kullanarak okumaları saymak, düşük sayıları kaldırmak için filtreleme ve normalleştirme. PolyA-seq verileri diffSplice/DEXSeq yöntemleri kullanılarak alternatif pA bölgeleri için, bulk RNA-Seq diffSplice/DEXseq yöntemleri ile ekzon düzeyinde alternatif ekleme için ve AS olayları rMATS ile analiz edilmiştir. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Bu araştırmada kullanılan RNA-seq verileri, Gen İfade Omnibus’undan (GEO) (GSE138691)15 elde edilmiştir. Bu çalışmadan elde edilen fare RNA-seq verilerini iki koşul grubuyla kullandık: vahşi tip (WT) ve her biri üç kopya ile Kas körü benzeri tip 1 nakavt (Mbnl1 KO). Diferansiyel poliadenilasyon alanı kullanım analizini göstermek için, fare embriyo fibroblastları (MEF’ler) PoliA-seq verilerini elde ettik (GEO Katılımı GSE60487)16. Verilerin dört koşul grubu vardır: Wild-type (WT), Kas körü benzeri tip1/tip 2 çift nakavt (Mbnl1/2 DKO), Mbnl3 knockdown (KD) ile Mbnl 1/2 DKO ve Mbnl3 kontrollü Mbnl1/2 DKO (Ctrl). Her koşul grubu iki çoğaltmadan oluşur.
GEO Katılımı | SRA Çalıştırma numarası | Örnek adı | Koşul | Çoğaltmak | Doku | Sıralama | Okuma uzunluğu | |
RNA-Seq | GSM4116218 | SRR10261601 | Mbnl1KO_Thymus_1 | Mbnl1 nakavt | Temsilci 1 | Timus | Eşleştirilmiş uç | 100 bp |
GSM4116219 | SRR10261602 | Mbnl1KO_Thymus_2 | Mbnl1 nakavt | Temsilci 2 | Timus | Eşleştirilmiş uç | 100 bp | |
GSM4116220 göster | SRR10261603 | Mbnl1KO_Thymus_3 | Mbnl1 nakavt | Temsilci 3 | Timus | Eşleştirilmiş uç | 100 bp | |
GSM4116221 | SRR10261604 | WT_Thymus_1 | Vahşi tip | Temsilci 1 | Timus | Eşleştirilmiş uç | 100 bp | |
GSM4116222 | SRR10261605 | WT_Thymus_2 | Vahşi tip | Temsilci 2 | Timus | Eşleştirilmiş uç | 100 bp | |
GSM4116223 | SRR10261606 | WT_Thymus_3 | Vahşi tip | Temsilci 3 | Timus | Eşleştirilmiş uç | 100 bp | |
3P-Seks | GSM1480973 | SRR1553129 | WT_1 | Vahşi tip (WT) | Temsilci 1 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp |
GSM1480974 | SRR1553130 | WT_2 | Vahşi tip (WT) | Temsilci 2 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp | |
GSM1480975 | SRR1553131 | DKO_1 | Mbnl 1/2 çift nakavt (DKO) | Temsilci 1 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp | |
GSM1480976 | SRR1553132 | DKO_2 | Mbnl 1/2 çift nakavt (DKO) | Temsilci 2 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp | |
GSM1480977 göster | SRR1553133 | DKOsiRNA_1 | Mbnl 3 siRNA (KD) ile Mbnl 1/2 çift nakavt | Temsilci 1 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp | |
GSM1480978 | SRR1553134 | DKOsiRNA_2 | Mbnl 3 siRNA (KD) ile Mbnl 1/2 çift nakavt | Temsilci 2 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 36 bg | |
GSM1480979 | SRR1553135 | DKONTsiRNA_1 | Mbnl 1/2 çift nakavt, hedeflemeyen siRNA (Ctrl) ile | Temsilci 1 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp | |
GSM1480980 | SRR1553136 | DKONTsiRNA_2 | Mbnl 1/2 çift nakavt, hedeflemeyen siRNA (Ctrl) ile | Temsilci 2 | Fare embriyonik Fibroblastları (MEF’ler) | Tek uçlu | 40 bp |
Tablo 1. Analiz için kullanılan RNA-Seq ve PolyA-seq veri setlerinin özeti.
Bu çalışmada, toplu RNA-Seq ve 3′ uç dizileme verilerinde AS ve APA’yı saptamak için ekzon tabanlı ve olay tabanlı yaklaşımlar değerlendirildi. Ekzon tabanlı AS yaklaşımları, hem diferansiyel olarak eksprese edilen ekzonların bir listesini hem de genel gen seviyesi diferansiyel ekleme aktivitesinin istatistiksel önemine göre sıralanmış bir gen seviyesi sıralaması üretir (Tablo 1-2, 4-5). Diferansiyel kullanım, bir ekzonun diferansiyel log kıvrım değişimini aynı gen içindeki…
The authors have nothing to disclose.
Bu çalışma, Avustralya Araştırma Konseyi (ARC) Future Fellowship (FT16010043) ve ANU Futures Scheme tarafından desteklenmiştir.