Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

mirMachine: Tesis miRNA Ek Açıklaması için Tek Noktadan Çalışan Bir Dükkan

Published: May 1, 2021 doi: 10.3791/62430

Summary

Burada, 1) bilinen ve yeni miRNA'ları daha doğru bir şekilde tanımlayabilen ve 2) tam otomatik ve serbestçe kullanılabilen yeni ve tam otomatik bir miRNA boru hattı olan mirMachine'i sunuyoruz. Kullanıcılar artık tam otomatik mirMachine işlem hattını çalıştırmak için kısa bir gönderme komut dosyası yürütebilir.

Abstract

Farklı tipte kodlamayan RNA'lardan, mikroRNA'lar (miRNA'lar) son on yılda tartışmasız bir şekilde spot ışığında olmuştur. Gen ekspresyonunun transkripsiyon sonrası düzenleyicileri olarak, miRNA'lar, kuraklık ve hastalıklar gibi a / biyotik strese hem gelişim hem de yanıt dahil olmak üzere çeşitli hücresel yollarda kilit roller oynamaktadır. Yüksek kaliteli referans genom dizilerine sahip olmak, miRNA dizilerinin yüksek oranda korunduğu çeşitli bitki türlerinde miRNA'ların tanımlanmasını ve ek açıklamasını mümkün kılmıştır. Hesaplamalı miRNA tanımlama ve ek açıklama süreçleri çoğunlukla hataya eğilimli süreçler olduğundan, homoloji tabanlı tahminler tahmin doğruluğunu arttırır. Son on yılda, o zamandan beri çeşitli bitki genomları için kullanılan miRNA ek açıklama boru hattı SUmir'i geliştirdik ve geliştirdik.

Bu çalışma, (i) ikincil yapı tahminlerine ek bir filtreleme adımı ekleyerek, (ii) tamamen otomatik hale getirerek ve (iii) homolojiye dayalı bilinen miRNA'yı veya önceki boru hattını kullanarak küçük RNA dizileme okumalarına dayanan yeni miRNA'ları tahmin etmek için yeni seçenekler sunarak tam otomatik, yeni bir miRNA boru hattı olan mirMachine (miRNA Makinesi) sunmaktadır. Yeni miRNA boru hattı mirMachine, Arabidopsis Bilgi Kaynağı, TAIR10, Arabidopsis genomunun salınması ve Uluslararası Buğday Genomu Dizileme Konsorsiyumu (IWGSC) buğday referans genomu v2 kullanılarak test edildi.

Introduction

Yeni nesil dizileme teknolojilerindeki ilerlemeler, RNA yapılarının ve düzenleyici elementlerin anlaşılmasını genişletmiş ve işlevsel olarak önemli kodlamayan RNA'ları (ncRNA'lar) ortaya çıkarmıştır. Farklı ncRNA tipleri arasında, mikroRNA'lar (miRNA'lar), bitkilerde 1,2 nükleotid arasında bir uzunluğa sahip küçük RNA'ların temel bir düzenleyici sınıfını oluşturur 1,2. Nematodda Caenorhabditis elegans3'te ilk miRNA'nın keşfedilmesinden bu yana, miRNA'ların varlığı ve işlevleri hayvan ve bitki genomlarında da 4,5,6 kapsamlı bir şekilde incelenmiştir. miRNA'lar, bölünme veya translasyonel baskı için mRNA'ları hedefleyerek işlev görür7. Biriken kanıtlar ayrıca miRNA'ların bitkilerde büyüme ve gelişme8, kendi kendine biyogenez9 ve çeşitli biyotik ve abiyotik stres yanıtları10 dahil olmak üzere çok çeşitli biyolojik süreçlerde yer aldığını göstermiştir.

Bitkilerde, miRNA'lar başlangıçta pri-miRNA'lar11 adı verilen uzun birincil transkriptlerden işlenir. Çekirdeğin içindeki RNA polimeraz II tarafından üretilen bu pri-miRNA'lar, kusurlu bir katlanır arka yapı oluşturan uzun transkriptlerdir12. Pri-miRNA'lar daha sonra pre-miRNA'lar11 olarak adlandırılan miRNA'ların endojen tek iplikçikli (ss) saç tokası öncüllerini üretmek için bir bölünme işlemine tabi tutulur. Pre-miRNA, bir miRNA dubleksini (miRNA / miRNA *) çıkarmak için tek bir ipliğin çift sarmallı bir yapıya katlandığı saç tokası benzeri bir yapı oluşturur13. Dicer benzeri protein, miRNA / miRNA * dubleksin her iki ipliğini de keser ve 2-nükleotid 3'-çıkıntıları14,15 bırakır. MiRNA dubleksi, miRNA'nın 3'-ucunu bozunma ve idrar aktivitesinden koruyan çekirdeğin içinde metillenir16,17. Bir helikaz, ihracattan sonra metillenmiş miRNA dubleksini çözer ve olgun miRNA'yı sitosol18'deki RNA kaynaklı susturma kompleksine (RISC) maruz bırakır. Dupleksiyonun bir ipliği RISC'ye dahil edilmiş olgun miRNA'dır, diğer iplikçik ise miRNA * bozulur. MiRNA-RISC kompleksi hedef diziye bağlanır ve tam tamamlayıcılık durumunda mRNA bozunmasına veya kısmi tamamlayıcılık durumunda translasyonel baskıya yol açar13.

İfade ve biyogenez özelliklerine dayanarak, miRNA ek açıklaması için kılavuzlar15,19 olarak tanımlanmıştır. Tanımlanan kılavuzlarla Lucas ve Budak, 9 numaralı bitkilerde homoloji tabanlı bir in silico miRNA tanımlaması gerçekleştirmek için SUmir boru hattını geliştirdi. SUmir boru hattı iki komut dosyasından oluşuyordu: SUmirFind ve SUmirFold. SUmirFind, Ulusal Biyoteknoloji Bilgi Merkezi (NCBI) Temel Yerel Hizalama Arama Aracı (BLAST) taraması yoluyla, yalnızca 2 veya daha az uyumsuzluğa sahip isabetleri içerecek ve daha kısa isabetlere (blastn-short -ungapped -penalty -1 -reward 1) yönelik önyargıyı önlemek için değiştirilmiş parametrelerle bilinen miRNA veri kümelerine karşı benzerlik aramaları gerçekleştirir. SUmirFold, UNAfold21 kullanarak BLAST20 sonuçlarından varsayılan miRNA dizilerinin ikincil yapısını değerlendirir. SUmirFold, saç tokası yapısının özelliklerini tanımlayarak miRNA'ları küçük müdahale eden RNA'lardan ayırır. Ayrıca, miRNA'ları tRNA ve rRNA gibi diğer ssRNA'lardan parametreleri, minimum katlama enerjisi indeksi > 0.67 ve GC içeriği% 24-71 ile ayırır. Bu boru hattı yakın zamanda (i) duyarlılığı artırmak, (ii) ek açıklama doğruluğunu artırmak ve (iii) öngörülen miRNA genlerinin genomik dağılımını sağlamak için iki ek adım eklenerek güncellendi22. Bitki miRNA dizilerinin23 yüksek korunumu göz önüne alındığında, bu boru hattı başlangıçta homoloji tabanlı miRNA tahmini için tasarlanmıştır. Bununla birlikte, yeni miRNA'lar, yakından ilişkili türler arasındaki miRNA'ların dizi korunumuna büyük ölçüde dayandığı için bu biyoinformatik analizle doğru bir şekilde tanımlanamamıştır.

Bu makale, 1) bilinen ve yeni miRNA'ları daha doğru bir şekilde tanımlayabilen (örneğin, boru hattı artık sRNA-seq tabanlı yeni miRNA tahminlerinin yanı sıra homoloji tabanlı miRNA tanımlamasını da kullanıyor) ve 2) tamamen otomatik ve serbestçe kullanılabilen yeni ve tam otomatik bir miRNA boru hattı olan mirMachine'i sunmaktadır. Çıktılar ayrıca tahmin edilen miRNA'ların genomik dağılımlarını da içermektedir. mirMachine, buğday ve Arabidopsis genomlarında hem homoloji tabanlı hem de sRNA-seq tabanlı tahminler için test edildi. Başlangıçta özgür yazılım olarak piyasaya sürülmesine rağmen, UNAfold son on yılda ticari bir yazılım haline geldi. Bu yükseltmeyle, ikincil yapı tahmin aracı UNAfold'dan RNAfold'a değiştirildi, böylece mirMachine serbestçe kullanılabilir. Kullanıcılar artık tam otomatik mirMachine işlem hattını çalıştırmak için kısa bir gönderme komut dosyası yürütebilir (örnekler https://github.com/hbusra/mirMachine.git verilmiştir).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Yazılım bağımlılıkları ve kurulumu

  1. Yazılım bağımlılıklarını ana sitelerinden veya conda kullanarak yükleyin.
    1. Perl'i, henüz kurulmamışsa, ana sitesinden (https://www.perl.org/get.html) indirin ve yükleyin.
      NOT: Temsil edilen sonuçlar Perl v5.32.0 kullanılarak tahmin edilmiştir.
    2. Bir hizalama programı olan Blast+'ı ana sitesinden (https://www.ncbi.nlm.nih.gov/books/NBK279671/) yürütülebilir dosya ve kaynak kodu olarak indirin.
      NOT: Temsil edilen sonuçlar BLAST 2.6.0+ kullanılarak tahmin edilmiştir.
    3. Önceden derlenmiş RNAfold paketini https://www.tbi.univie.ac.at/RNA/ yükleyin.
    4. Alternatif olarak, aşağıdaki conda'yı kullanarak bu yazılımları yükleyin: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. mirMachine kurulumu ve testi

  1. GitHub'dan mirMachine betiklerinin ve mirMachine gönderme betiğinin en son sürümünü indirin https://github.com/hbusra/mirMachine.git ve ardından betiklerin yolunu PATH'e ayarlayın.
  2. MirMachine'in tüm bağımlılıklarıyla birlikte doğru indirildiğinden emin olmak için GitHub'da sağlanan test verilerini kullanın.
  3. mirMachine'i aşağıda gösterilen test verilerinde çalıştırın.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    NOT: Test verileri buğday genomunun yalnızca bir kromozomunu içerdiğinden -n seçeneğini 10 olarak ayarlayın. Varsayılan olarak, -n seçeneği 20 olarak ayarlanır.
  4. Tahmin edilen olgun miRNA'lar, tahmin edilen öncülleri ve kromozomlar üzerindeki konumları için hairpins.tbl.out.tbl çıkış dosyalarını kontrol edin.
  5. Program çıktıları ve uyarıları için günlük dosyalarını denetleyin.

3. Homoloji tabanlı miRNA tanımlaması

  1. Aşağıda gösterilen bash komut dosyasını kullanarak mirMachine'i çalıştırın:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Tahmin edilen miRNA'ları kontrol edin. Tahmin edilen miRNA'lar için $input_file.results.tbl.hairpins.tbl.out.tbl adlı çıktı dosyasını bulun. Pre-miRNA FASTA dizileri için $input_file.results.tbl.hairpins.fsa adlı çıktı dosyasını bulun. Saç tokası günlük dosyası için $input_file.results.tbl.hairpins.log adlı çıktı dosyasını bulun.

4. Yeni miRNA tanımlaması

  1. sRNA-seq FASTQ dosyalarını uygun FASTA formatında önceden işleyin. Gerekirse adaptörleri kırpın. Düşük kaliteli okumaları kırpmayın; bunun yerine, bunları kaldırın. N içeren okumaları kaldırın. FASTQ dosyasını FASTA dosyasına ($input_file) dönüştürün.
  2. Aşağıda gösterilen bash betiğini kullanarak mirMachine'i çalıştırın.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    NOT: $mismatches , sRNA-seq tabanlı tahminler için 0 olarak ayarlanmıştır.
  3. Tahmin edilen miRNA'ları kontrol edin. Tahmin edilen miRNA'lar için $input_file.results.tbl.hairpins.tbl.out.tbl adlı çıktı dosyasını bulun. Pre-miRNA FASTA dizileri için $input_file.results.tbl.hairpins.fsa adlı çıktı dosyasını bulun. Saç tokası günlük dosyası için $input_file.results.tbl.hairpins.log adlı çıktı dosyasını bulun.

5. Gelişmiş parametreler

NOT: Varsayılan değerler, genom dosyası ve giriş miRNA dosyası dışındaki tüm parametreler için tanımlanmıştır.

  1. İşlem hattı içindeki bina başvuru veritabanını atlamak için -db seçeneğini bir blast veritabanına ayarlayın.
  2. -m seçeneğini izin verilen uyuşmazlık sayısına ayarlayın.
    NOT: Varsayılan olarak, -m seçeneği homoloji tabanlı tahminler için 1 ve sRNA seq tabanlı tahminler için 0 olarak ayarlanmıştır.
  3. -n'yi hizalamadan sonra ortadan kaldırılacak isabet sayısına ayarlayın (varsayılan değer 20'dir). Bunu türlere göre değiştirin.
  4. Şüpheli listesinin ikincil yapılarını değerlendirmek için -long komutunu kullanın.
  5. sRNA-seq verilerine dayanan yeni miRNA tahminini aktive etmek için -s'yi kullanın.
  6. -lmax seçeneğini, taramaya dahil edilecek sRNA-seq okumalarının maksimum uzunluğuna ayarlayın.
  7. -lmax seçeneğini, taramaya dahil edilecek sRNA-seq okumalarının minimum uzunluğuna ayarlayın.
  8. Milyon Başına Okuma (RPM) eşiğini ayarlamak için - rpm seçeneğini kullanın.
    NOT: Pri-miRNA'ların/pre-miRNA'ların uzunluğu gibi gelişmiş parametreler için, deneyimli kullanıcıların ilgilendikleri araştırmalar için komut dosyalarını değiştirmeleri önerilir. Ayrıca, kullanıcılar bazı adımları atlamak istiyorsa veya değiştirilmiş çıktıları kullanmayı tercih ediyorsa, gönderim komut dosyası, bu satırları atlamak için satırların başına # eklenerek değiştirilebilir.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Yukarıda açıklanan miRNA boru hattı, mirMachine, boru hattının performansının hızlı bir şekilde değerlendirilmesi için test verilerine uygulanmıştır. Sadece miRBase v22.1'de biriken yüksek güvenilirlikli bitki miRNA'ları, IWGSC buğday RefSeq genomu v224'ün kromozom 5A'sına karşı tarandı. mirMachine_find, maksimum 1 uyumsuzluğa izin verilen 189 yüksek güvenilirlikli miRNA'nın gereksiz listesi için 312 isabet döndürdü (Tablo 1). mirMachine_fold 49 tanesini ikincil yapı değerlendirmesine bağlı olarak varsayılan miRNA'lar olarak sınıflandırmıştır. En yüksek temsil edilen miRNA grubu miR9666 idi ve toplam 18 miRNA tanımlandı (Şekil 1). Bazı miRNA'lar aynı olgun miRNA'yı paylaştı, ancak farklı bir pre-miRNA dizisinden işlendi. Bu miRNA'lar, miRNA ailesi adı ve ardından benzersiz bir sayı ile yeniden adlandırıldı, örneğin, miR156-5p-1 ve miR156-5p-2. 49 varsayılan miRNA arasında, 20 gereksiz olmayan olgun miRNA dizisi tanımlanmıştır. Bazı miRNA'lar birden fazla lokustan kopyalanabilir ve bu da temsil edilen daha fazla sayıda miRNA ile sonuçlanır. Test verilerinde, miR9666-3p-5 iki kez temsil edildi: biri duyu ipliğinde (602887137) ve diğeri antisens ipliğinde (542053079). Tüm konumlar GitHub'da mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl adlı TestData çıktı dosyası altında sağlanır.

Bir bitki genomundaki ekspresyon kanıtı, bitkilerdeki miRNA'ların korunumu göz önüne alındığında yeterlidir; Bununla birlikte, yüksek güvenilirliğe sahip bir miRNA veri kümesi yalnızca sınırlı miktarda veri sağlar. Bu nedenle, yüksek güvenilirliğe sahip ve/veya deneysel olarak doğrulanmış miRNA'ları referans veri kümesi olarak kullanmak ve ekspresyon doğrulama adımını atlamak veya referans veri kümesi olarak mevcut tüm bitki miRNA'larını kullanmak ve daha sonra ekspresyon kanıtlarını aramak kullanıcının tercihidir. Burada, yüksek güvenilirliğe sahip miRNA'lar, bitki genomlarından birinde deneysel olarak doğrulanmış referans seti olarak kullanıldığından, test verileri için ekspresyon doğrulama adımı atlandı.

mirMachine, Arabidopsis thaliana (Arabidopsis, TAIR10 salımı) ve Triticum aestivum (buğday, IWGSC RefSeq v2) dahil olmak üzere monokot ve dikot tesisleri kullanılarak karşılaştırıldı. Homoloji tabanlı ve sRNA sek tabanlı tahminlerin performansı değerlendirildi ve sonuçlar NGS tabanlı bir miRNA tahmin aracı olanmiRDP2 25 ile karşılaştırıldı. Homoloji temelli tahminler, miRbase v2226'da biriken bitki olgun miRNA dizilerinin gereksiz olmayan listesi kullanılarak gerçekleştirildi. sRNA-seq tabanlı tahminler, halka açık veri kümeleri kullanılarak gerçekleştirildi; Arabidopsis için GSM2094927 ve buğday için GSM1294661. Ham sonuçlara ek olarak, homoloji tabanlı tahminler, aynı sRNA-seq veri kümeleri kullanılarak olgun miRNA ve miRNA yıldız dizilerinin ekspresyon kanıtı için filtrelendi.

Şekil 2, her bir takımın performansını ve iki türdeki mirMachine ayarlarını göstermektedir. Duyarlılık, tanımlanan bilinen miRNA'ların toplam sayısının, tanımlanan toplam miRNA sayısına bölünmesiyle hesaplandı. Sonuçlar, mirMachine'in duyarlılık ve Arabidopsis verilerindeki gerçek pozitif tahminler açısından miRDP2'den daha iyi performans gösterdiğini gösterdi. Buğday verileri için, ifade kanıtlarıyla desteklenen mirMachine homolojisine dayalı tahmin, miRDP2'den daha iyi hassasiyet sağlamıştır. Her iki genom için de miRDP2, mirMachine sRNA-seq ve ekspresyon kanıtlarına sahip homoloji tabanlı tahminlere kıyasla daha fazla sayıda gerçek pozitif öngördü. MiRDP2'nin, bilinen miRNA'ların tahmini için ekspresyon eşiğini (RPM, milyon başına okuma) 10'dan 1'e düşürdüğü ve bunun sonucunda daha yüksek gerçek pozitif tahminlerle sonuçlandığı belirtilmelidir. Genel olarak, mirMachine hem yeni hem de bilinen miRNA'ların tanımlanması için kullanılabilir. MirMachine'in bir avantajı, spesifik doku ve koşulların bir sınırlaması olmaksızın varsayılan miRNA'ların genom çapında dağılımını tahmin edebilme yeteneğidir. Son olarak, mirMachine kullanıcı dostudur ve isabet sayısı, uyuşmazlıklar, miRNA'ların uzunluğu ve RPM'ler gibi parametreleri belirli araştırma amaçları için ayarlama esnekliği sağlar. Birlikte ele alındığında, mirMachine transkriptomlardaki varsayılan miRNA'lar ve bitkilerin genomları için doğru tahminler sağlar.

Figure 1
Şekil 1: IWGSC buğday referans genomu v2'nin kromozom 5A'sından tanımlanan miRNA ailelerinin dağılımı. Veri etiketleri miRNA ailesini ve her miRNA ailesine ait miRNA sayısını gösterir. Kısaltmalar: miRNA = mikroRNA; IWGSC = Uluslararası Buğday Genomu Dizileme Konsorsiyumu. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 2
Resim 2: mirMachine'in performans değerlendirmesi. MirMachine için homoloji tabanlı ve sRNA-seq tabanlı tahminler ve miRDP2 yazılımı ile duyarlılık ve tahmin edilen bilinen miRNA'ların toplam sayısı (gerçek pozitifler) karşılaştırılmıştır. Kısaltma: miRNA = mikroRNA. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Genom Genom Boyutu Referans miRNA veri kümesi mirMachine_find isabet mirMAchine_fold isabet miRNA ailelerinin sayısı
Test verileri ~0.7 Gb 189 312 49 9
Chr5A

Tablo 1: mirMachine istatistikleri. Test verileri, IWGSC buğday referans genomu v2'nin kromozom 5A'sından alınmıştır. Kısaltmalar: miRNA = mikroRNA; IWGSC = Uluslararası Buğday Genomu Dizileme Konsorsiyumu.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

MiRNA boru hattımız SUmir, son on yıldır birçok bitki miRNA'sının tanımlanması için kullanılmaktadır. Burada, yeni, tam otomatik ve serbestçe kullanılabilen bir miRNA tanımlama ve ek açıklama boru hattı olan mirMachine'i geliştirdik. Ayrıca, önceki boru hattı da dahil ancak bunlarla sınırlı olmamak üzere bir dizi miRNA tanımlama boru hattı, bir zamanlar serbestçe kullanılabilir olmasına rağmen, zamanla ticari bir yazılım haline gelen UNAfold yazılımı21'e bağımlıydı. Bu yeni ve tam otomatik mirMachine artık UNAfold'a bağımlı değil; Bunun yerine, ViyanaRNA paketi27'den serbestçe temin edilebilen RNAfold, ikincil yapı tahmini için kullanılır. Ek olarak, mirMachine için tüm komut dosyaları, mirMachine'i tam otomatik ve serbestçe kullanılabilen bir miRNA tahmin ve ek açıklama aracı haline getirmek için ayarlanabilir parametrelere sahip bir bash komut dosyasında toplandı.

MirMachine, bitki miRNA'larının özelliklerinden ve biyogenezlerinden yararlandı. Hayvan pre-miRNA'larının aksine, bitki pre-miRNA'larının uzunluğu ve yapısal özelliklerideğişkendir 15. Sonuç olarak, miRNA'ların özelliklerine ve biyogenezlerine bağlı olarak bitki miRNA'larının tanımlanması için bir kriter belirlenmiştir15. Pre-miRNA uzunluğu için herhangi bir kesinti ayarlanmamıştır, çünkü bitki pre-miRNA'larının uzunluğu önemli ölçüde değişebilir ve yüzlerce nükleotid uzunluğunda olabilir. Bunun yerine, ilk önce ~ 700 bp uzunluğu ile sınırlı olan pri-miRNA yapı katlanması değerlendirildi. Daha sonra, pre-miRNA dizisi aday pri-miRNA dizilerinden tahmin edildi ve uygun katlama istatistikleri için değerlendirildi.

Birçok bitki genomu, özellikle buğday ve arpa gibi tarımsal açıdan önemli tahıllar, oldukça tekrarlayan genomlara sahiptir28,29,30. Yüksek tekrarlı içerik dışında, bu bitkilerin bazılarında poliploidi gözlenir24, bu da miRNA yapılarının in siliko tanımlanmasına ve karakterizasyonuna ek karmaşıklıklar getirir. Tekrarlar, olgun formlarında miRNA'lara benzeyen siRNA'ların31'in üretimi için önemli bir kaynaktır; Bununla birlikte, biyogenez ve fonksiyon bakımından farklılık gösterirler32,33. SiRNA'ları aday miRNA listelerinden çıkarmak son derece zordur. Aslında, en yaygın kullanılan miRNA veritabanı olan miRBase26'nın, yanlış bir şekilde miRNA'lar34,35 olarak açıklanmış çok sayıda siRNA içerdiği bildirilmiştir. Biyogenezlerindeki farklılıklara dayanarak, mirMachine, antisens ipliği ile mükemmel bir çift oluşturan küçük RNA'ları siRNA'lar olarak filtreler ve bu dizileri şüpheli tabloya yerleştirir. Ek olarak, mirMachine, aday RNA'ları siRNA'lar olarak filtrelemek için maksimum isabet sayısını tanımlayan -n seçeneğine sahiptir.

Silikoda öngörülen tüm miRNA'ları doğrulamak için ekspresyon kanıtı gereklidir. MiRNA'lar bitki genomları arasında yüksek oranda korunduğundan, bitki genomlarından birindeki ekspresyon kanıtı, öngörülen miRNA'nın geçerliliğini doğrulamak için yeterli olmalıdır. İlk tarama sürecinde yüksek güvenilirlikli, olgun miRNA dizilerinin kullanılması, öngörülen tüm miRNA'lar için ekspresyon kanıtı sağlama avantajına sahiptir; Bununla birlikte, başlangıçtaki miRNA veri kümesinin kısa listesi, bir genomdaki kapsamlı bir miRNA kümesinin tahminini sınırlar. Alternatif olarak, miRBase veritabanında biriken tam bir bitki miRNA seti, yüksek güvenilirliğe sahip miRNA'ları filtrelemek yerine ilk veri kümesi olarak kullanılabilir. Kullanıcılara, ilgili türler için herhangi bir ekspresyon verisi mevcut değilse, bitki genomlarından en az biri için eksprese edilmiş dizi etiketleri, miRNA mikrodizileri veya küçük RNA dizileme verileri aracılığıyla ekspresyon kanıtlarını aramaları önerilir.

Homoloji tabanlı miRNA tahminleri, bilinen miRNA ailesinin genom çapında dağılımını aydınlatmaya yardımcı olabilir. Bu miRNA'ların belirli dokularda ve koşullarda eksprese edilmesi muhtemeldir. Homolojiye dayalı tahminlerin bir dezavantajı, yeni miRNA ailelerini tanımlama yeteneğinin olmamasıdır. Buna karşılık, sRNA-seq tabanlı tahminler, çok sayıda yanlış pozitif maliyeti olan yeni miRNA'ları tanımlayabilir. Bu nedenle, en iyi yaklaşımın seçimi kullanıcılara ve ilginin araştırmasına bağlıdır. Burada sunulan mirMachine, bilinen miRNA'lara homolojiye veya sRNA dizilemesine dayanarak miRNA'ların tanımlanmasına yardımcı olabilir.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

Biyoloji Sayı 171
mirMachine: Tesis miRNA Ek Açıklaması için Tek Noktadan Çalışan Bir Dükkan
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter