Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

De novo Aktif Olarak Çevrilmiş Açık Okuma Çerçevelerinin Ribozom Profil Oluşturma Verileri ile Tanımlanması

Published: February 18, 2022 doi: 10.3791/63366
* These authors contributed equally

Summary

Ribozomların çevrilmesi, kodon başına üç nükleotidin peptitlere şifresini çözer. Ribozom profillemesi ile yakalanan mRNA boyunca hareketleri, karakteristik üçlü periyodiklik sergileyen ayak izlerini üretir. Bu protokol, tüm transkriptom düzeyinde aktif olarak çevrilmiş açık okuma çerçevelerini tanımlamak için ribozom profil oluşturma verilerinden bu belirgin özelliği deşifre etmek için RiboCode'un nasıl kullanılacağını açıklar.

Abstract

Açık okuma çerçevelerinin (ORF'ler), özellikle küçük peptitleri kodlayan ve belirli fizyolojik bağlamlar altında aktif olarak çevrilenlerin tanımlanması, bağlama bağlı translatomların kapsamlı ek açıklamaları için kritik öneme sahiptir. RNA üzerindeki ribozomları çevirmenin bağlanma yerlerini ve yoğunluklarını tespit etmek için kullanılan bir teknik olan ribozom profilleme, genom çapında çevirinin nerede gerçekleştiğini hızlı bir şekilde keşfetmek için bir yol sunar. Bununla birlikte, biyoinformatikte, ribozom profillemesi için çeviri yapan ORF'leri verimli ve kapsamlı bir şekilde tanımlamak önemsiz bir görev değildir. Burada, ribozom profil oluşturma verilerindeki bozuk ve belirsiz sinyallerden herhangi bir boyuttaki ORF'leri aktif olarak çevirmek için tasarlanmış RiboCode adlı kullanımı kolay bir paket açıklanmaktadır. Daha önce yayımlanmış veri kümemizi örnek alan bu makalede, ham verilerin önceden işlenmesinden nihai çıktı sonucu dosyalarının yorumlanmasına kadar tüm RiboCode işlem hattı için adım adım yönergeler sağlanmaktadır. Ayrıca, açıklamalı ORF'lerin çeviri oranlarını değerlendirmek için, her bir ORF'deki ribozom yoğunluklarının görselleştirilmesi ve ölçülmesi için prosedürler de ayrıntılı olarak açıklanmaktadır. Özetle, bu makale çeviri, küçük ORF'ler ve peptitlerle ilgili araştırma alanları için yararlı ve zamanında bir talimattır.

Introduction

Son zamanlarda, giderek artan bir çalışma grubu, kodlayan genlerin ORF'lerinden ve daha önce açıklanmış genlerden kodlanmamış olarak çevrilmiş peptitlerin yaygın bir şekilde üretildiğini ortaya koymuştur, örneğin uzun kodlamayan RNA'lar (lncRNA'lar)1,2,3,4,5,6,7,8. Bu çevrilmiş ORF'ler, çevresel değişikliklere, strese ve hücre farklılaşmasına yanıt vermek için hücreler tarafından düzenlenir veya uyarılır1,8,9,10,11,12,13. Bazı ORF'lerin çeviri ürünlerinin, gelişim ve fizyolojideki çeşitli biyolojik süreçlerde önemli düzenleyici roller oynadığı gösterilmiştir. Örneğin, Chng ve ark.14, kardiyovasküler gelişim için kritik olan Elabela (Ela, Apela / Ende / Toddler olarak da bilinir) adlı bir peptid hormonu keşfetti. Pauli ve ark., Ela'nın ayrıca erken balık embriyosunda hücre göçünü teşvik eden bir mitojen görevi gördüğünü öne sürdü15. Magny ve ark., kalsiyum taşınımını düzenleyen ve Drosophila kalbindeki düzenli kas kasılmasını etkileyen 30'dan az amino asitten oluşan iki mikropeptit bildirmiştir10.

Bu tür peptitlerin genom tarafından kaç tane kodlandığı ve biyolojik olarak alakalı olup olmadıkları belirsizliğini korumaktadır. Bu nedenle, bu potansiyel olarak kodlayan ORF'lerin sistematik olarak tanımlanması oldukça arzu edilir. Bununla birlikte, evrimsel koruma16,17 ve kütle spektrometrisi18,19 gibi geleneksel yaklaşımları kullanarak bu ORF'lerin (yani protein veya peptit) ürünlerini doğrudan belirlemek zordur, çünkü her iki yaklaşımın da tespit verimliliği, üretilen proteinlerin veya peptitlerin uzunluğuna, bolluğuna ve amino asit bileşimine bağlıdır. Nükleotid çözünürlüğünde mRNA'lar üzerindeki ribozom doluluğunu tanımlamak için bir teknik olan ribozom profillemesinin ortaya çıkışı, uzunluklarına ve bileşimlerine bakılmaksızın farklı transkriptlerin kodlama potansiyelini değerlendirmek için kesin bir yol sağlamıştır3,20,21. Ribozom profillemesini kullanarak aktif olarak çevrilen ORF'leri tanımlamak için önemli ve sık kullanılan bir özellik, ribozomun mRNA üzerindeki ayak izlerinin başlangıç kodonundan durdurma kodonuna kadar üç nükleotid (3-nt) periyodikliğidir. Bununla birlikte, ribozom profilleme verileri genellikle ORF'ler boyunca düşük ve seyrek dizileme okumaları, yüksek dizileme gürültüsü ve ribozomal RNA (rRNA) kontaminasyonları dahil olmak üzere çeşitli sorunlara sahiptir. Bu nedenle, bu tür veriler tarafından üretilen çarpık ve belirsiz sinyaller, ribozomların mRNA üzerindeki ayak izlerinin 3-nt periyodiklik kalıplarını zayıflatır ve bu da sonuçta yüksek güvenilirliğe sahip çevrilmiş ORF'lerin tanımlanmasını zorlaştırır.

"RiboCode" adlı bir paket, ORF'nin çerçeve dışı RPF'lerden önemli ölçüde daha fazla kare içi ribozom korumalı parçaya (RPF) sahip olup olmadığını incelemek için değiştirilmiş bir Wilcoxon imzalı sıralama testi ve P değeri entegrasyon stratejisini uyarladı22. Simüle edilmiş ve gerçek ribozom profil oluşturma verilerinde translatomun de novo ek açıklaması için son derece verimli, hassas ve doğru olduğu gösterilmiştir. Burada, önceki çalışma tarafından oluşturulan ham ribozom profil oluşturma sıralama veri kümelerinden potansiyel çeviri ORF'lerini tespit etmek için bu aracın nasıl kullanılacağını açıklıyoruz23. Bu veri kümeleri, kontrol (si-Ctrl) ve EIF3E (si-eIF3e) küçük müdahale eden RNA'lar (siRNA'lar) ile transfekte edilen MCF-10A hücrelerinin ribozom doluluk profillerini karşılaştırarak çeviride EIF3 alt birimi "E" nin (EIF3E) işlevini araştırmak için kullanılmıştır. RiboCode'u bu örnek veri kümelerine uygulayarak, potansiyel olarak küçük peptitleri veya proteinleri kodlayan 5.633 yeni ORF tespit ettik. Bu ORF'ler, yukarı akış ORF'leri (uORF'ler), aşağı akış ORF'leri (dORF'ler), üst üste binen ORF'ler, yeni protein kodlayan genlerden (yeni PCG'ler) ORF'ler ve yeni protein kodlamayan genlerden (yeni NonPCG'ler) ORF'ler dahil olmak üzere kodlama bölgelerine göre konumlarına göre çeşitli tiplerde kategorize edildi. uORF'ler üzerindeki RPF okuma yoğunlukları, kontrol hücrelerine kıyasla EIF3E eksikliği olan hücrelerde önemli ölçüde artmıştır, bu da en azından kısmen aktif olarak çevrilen ribozomların zenginleşmesinden kaynaklanabilir. EIF3E eksikliği olan hücrelerin 25. ila 75. kodonu arasındaki bölgede lokalize ribozom birikimi, erken evrede translasyon uzamasının tıkandığını göstermiştir. Bu protokol ayrıca, tanımlanan ORF'ler üzerindeki ribozom ayak izlerinin 3-nt periyodiklik modellerini incelemek için istenen bölgenin RPF yoğunluğunun nasıl görselleştirileceğini de göstermektedir. Bu analizler, RiboCode'un ORF'lerin çevirisini tanımlamadaki ve çevirinin düzenlenmesini incelemedeki güçlü rolünü göstermektedir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Ortam kurulumu ve RiboCode kurulumu

  1. Bir Linux terminal penceresi açın ve bir conda ortamı oluşturun:
    conda create -n RiboCode python=3.8
  2. Oluşturulan ortama geçin ve RiboCode ve bağımlılıklarını yükleyin:
    conda RiboCode'u etkinleştir
    conda yüklemek -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt papyon yıldız samtools

2. Veri hazırlama

  1. Genom referans dosyalarını alın.
    1. Referans sırası için, https://www.ensembl.org/index.html adresindeki Ensemble web sitesine gidin, üst menüyü İndir'i ve sol taraftaki FTP İndir menüsünü tıklayın. Sunulan tabloda, DNA (FASTA) sütununda ve Türlerin İnsan olduğu satırda FASTA'ya tıklayın. Açılan sayfada, Homo_sapiens bağlantısını kopyalayın. GRCh38.dna.primary_assembly.fa.gz dosyasını indirin, ardından terminalde indirin ve sıkıştırmasını açın:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
    2. Başvuru ek açıklaması için, son açılan web sayfasındaki Gen kümeleri sütununda GTF'yi sağ tıklatın. Homo_sapiens bağlantısını kopyalayın. GRCh38.104.gtf.gz ve aşağıdakileri kullanarak indirin:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      NOT: GTF dosyasının üç seviyeli bir hiyerarşide düzenlenmiş genom ek açıklamaları içerdiğinden Ensemble web sitesinden alınması önerilir, yani her gen ekzonlar ve isteğe bağlı çeviriler içeren transkriptler içerir (örneğin, kodlama dizileri [CDS], çeviri başlangıç sitesi, çeviri bitiş sitesi). Bir genin veya transkriptin ek açıklamaları eksik olduğunda, örneğin UCSC veya NCBI'den elde edilen bir GTF dosyası, tam üst-alt hiyerarşi ek açıklamalarıyla güncellenmiş bir GTF oluşturmak için GTFupdate'i kullanın: GTFupdate original.gtf > updated.gtf. .gff biçimindeki ek açıklama dosyası için, AGAT toolkit24'ü veya .gtf biçimine dönüştürmek üzere başka bir aracı kullanın.
  2. rRNA dizileri alın.
    1. UCSC Genom Tarayıcısını https://genome.ucsc.edu'da açın ve Araçlar | Açılır listede Tablo Tarayıcısı .
    2. Açılan sayfada, klade için Memeli , genom için İnsan , grup için Tüm Tablolar , tablo için rmask ve bölge için genom değerlerini belirtin. Filtre için, yeni bir sayfaya gitmek üzere Oluştur'u tıklatın ve repClass'ı rRNA ile eşleştiği gibi ayarlayın.
    3. Gönder'e tıklayın ve ardından çıktı biçimini hg38_rRNA.fa olarak sıraya ve çıktı dosya adına ayarlayın. Son olarak, tıklayın Çıktı al | rRNA dizisini almak için dizi alın.
  3. Sıralı Okuma Arşivi'nden (SRA) ribozom profil oluşturma veri kümeleri alın.
    1. si-eIF3e tedavi grubunun çoğaltılmış örneklerini indirin ve yeniden adlandırın:
      fastq-dump SRR9047190 SRR9047191 SRR9047192
      mv SRR9047190.fastq si-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. Denetim grubunun çoğaltma örneklerini indirin ve bunları yeniden adlandırın:
      fastq-dump SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      NOT: Bu örnek veri kümeleri için SRA katılım kimlikleri, GSE131074 araması yapılarak Gene Expression Omnibus (GEO) web sitesinden25 alınmıştır.

3. Adaptörleri kesin ve rRNA kontaminasyonunu giderin

  1. (İsteğe bağlı) Bağdaştırıcıları sıralama verilerinden çıkarın. Bu örnekte olduğu gibi bağdaştırıcı dizileri zaten kırpılmışsa bu adımı atlayın. Aksi takdirde, adaptörleri okumalardan kırpmak için cutadapt kullanın.
    i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
    yapmak
    cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    yapılmış
    NOT: -a parametresinden sonraki adaptör dizisi, cDNA kütüphanesinin hazırlanmasına bağlı olarak değişecektir. 15'ten kısa okumalar ( -m ile verilir) atılır, çünkü ribozom korumalı parçalar genellikle bu boyuttan daha uzundur.
  2. Aşağıdaki adımları kullanarak rRNA kontaminasyonunu kaldırın:
    1. İndeks rRNA referans dizileri:
      bowtie-build -f hg38_rRNA.fa hg38_rRNA
    2. rRNA'dan kaynaklanan okumaları ekarte etmek için okumaları rRNA referansıyla hizalayın:
      i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
      yapmak
      papyon -n 0 -y -a --norc --en iyi --tabaka -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      yapılmış
      -p , görevlerin paralel olarak çalıştırılması için iş parçacığı sayısını belirtir. RPF okumalarının nispeten küçük boyutu göz önüne alındığında, bildirilen hizalamaların en iyi olduğunu garanti etmek için diğer bağımsız değişkenler (örneğin, -n, -y, -a, -norc, --best, --strata ve -l) belirtilmelidir. Daha fazla ayrıntı için Bowtie web sitesine26 bakın.

4. Temiz okumaları genomla hizalayın

  1. Bir genom indeksi oluşturun.
    mkdir STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
  2. Temiz okumaları (rRNA kontaminasyonu yok) oluşturulan referansla hizalayın.
    i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
    yapmak
    STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes Tümü
    yapılmış
    NOT: Ters transkriptaz27 tarafından her okunuşun 5' ucuna sıklıkla şablonsuz bir nükleotid eklenir ve varsayılan olarak yumuşak kırpma gerçekleştirdiği için STAR tarafından verimli bir şekilde kesilir. STAR parametreleri STAR kılavuzunda28 açıklanmıştır.
  3. Hizalama dosyalarını sıralayın ve dizine ekleyin.
    i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
    yapmak
    samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    samtools dizini ${i}. Aligned.toTranscriptome.out.sorted.bam
    samtools dizini ${i}. Aligned.sortedByCoord.out.bam
    yapılmış

5. RPF'lerin boyut seçimi ve P-bölgelerinin tanımlanması

  1. Transkript ek açıklamalarını hazırlayın.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    -f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    NOT: Bu komut, GTF dosyasından mRNA transkriptlerinin gerekli bilgilerini toplar ve FASTA dosyasından tüm mRNA transkriptleri için dizileri çıkarır (her transkript, GTF dosyasında tanımlanan yapılara göre ekzonları birleştirerek birleştirilir).
  2. Belirli uzunluklardaki RPF'leri seçin ve P sitesi konumlarını belirleyin.
    i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
    yapmak
    metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0,35 -pv1 0,001 -pv2 0,001
    yapılmış
    NOT: Bu komut, her uzunluktaki hizalanmış okumaların 5' ucunun toplam profillerini, açıklamalı çeviri başlangıç (veya durdurma) kodonları etrafında çizer. Okuma uzunluğuna bağımlı P-sitesi, ana okumaların 5' uçları ile başlangıç kodonu arasındaki ofset mesafelerinin dağılım grafikleri (örneğin, Şekil 1B) incelenerek manuel olarak belirlenebilir. RiboCode ayrıca her örnek için, önemli 3-nt periyodiklik desenleri gösteren okumaların P-site konumlarının otomatik olarak belirlendiği bir yapılandırma dosyası oluşturur. -f0_percent, -pv1 ve -pv2 parametreleri, okuma çerçevesinde zenginleştirilmiş RPF okumalarını seçmek için oran eşiğini ve p-değeri kesmelerini tanımlar. Bu örnekte, 29, 30 ve 31 nt okumaların 5' ucundaki +12, +13 ve +13 nükleotidler her yapılandırma dosyasında el ile tanımlanmıştır.
  3. Her örnek için yapılandırma dosyalarını düzenleme ve birleştirme
    NOT: Benzersiz ORF'lerden oluşan bir fikir birliği kümesi oluşturmak ve sonraki analizleri gerçekleştirmek üzere yeterli okuma kapsamını sağlamak için, önceki adımdaki tüm örneklerin seçilen okumaları birleştirilir. merged_config.txt dosyada (Ek Dosya 1) tanımlanan belirli uzunluklardaki okumalar ve bunların P-site bilgileri, bir sonraki adımda ORF'lerin çeviri potansiyelini değerlendirmek için kullanılır.

6. De novo ek açıklama çeviri ORF'leri

  1. RiboCode'u çalıştırın.
    RiboCode -a RiboCode_annot -c merged_config.txt -l evet -g \
    -o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG

    Bu komutun önemli parametreleri aşağıdaki gibidir:
    -c, giriş dosyalarının yolunu ve seçilen okumaların ve bunların P-sitelerinin bilgilerini içeren yapılandırma dosyası.
    -l, durdurma kodonlarının yukarısında birden fazla başlangıç kodonu bulunan transkriptler için, çeviri potansiyellerini değerlendirmek için en uzun ORF'lerin (en distal başlangıç kodonundan durdurma kodonuna kadar olan bölge) kullanılıp kullanılmadığı. Hayır olarak ayarlanırsa, başlangıç kodonları otomatik olarak belirlenir.
    -s, ORF'lerin tanımlanması için kullanılan kanonik başlangıç kodon(lar)ı.
    -A, (isteğe bağlı olarak) ORF tanımlaması için kullanılan kanonik olmayan başlangıç kodonları (örneğin, insan için CTG, GTG ve TTG), diğer türlerin mitokondrilerinde veya çekirdeğinde farklılık gösterebilir29.
    -m, ORF'lerin minimum uzunluğu (yani amino asitler).
    -o, tahmin edilen ORF'lerin ayrıntılarını içeren çıktı dosya adının öneki (Ek Dosya 2).
    -g ve -b, tahmin edilen ORF'leri sırasıyla gtf veya yatak formatına çıkarır.

7. (İsteğe bağlı) ORF ölçümü ve istatistikleri

  1. Her ORF'de RPF okumalarını sayın.
    i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3 için
    yapmak
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s yes -c intersection-strict
    yapılmış
    NOT: ORF'lerin başlangıç ve bitişlerinin etrafında biriken potansiyel ribozomları hariç tutmak için, ilk 15'te (-f ile belirtilir) ve son 5 kodonda (-l ile spesifik) ayrılan okuma sayısı sayılmaz. İsteğe bağlı olarak, sayılan RPF'lerin uzunlukları 25 ila 35 nt (RPF'lerin ortak boyutları) aralığıyla sınırlıdır.
  2. RiboCode kullanarak tespit edilen ORF'lerin temel istatistiklerini hesaplayın:
    Rscript RiboCode_utils. R
    NOT: RiboCode_utils. R (Ek Dosya 3), RiboCode çıktısı için bir dizi istatistik sağlar, örneğin, tanımlanan ORF'lerin sayısını sayma, ORF uzunluklarının dağılımını görüntüleme ve normalleştirilmiş RPF yoğunluklarını hesaplama (yani, RPKM, eşlenen milyon okuma başına kilobaz başına okuma).

8. (İsteğe bağlı) Tahmin edilen ORF'lerin görselleştirilmesi

  1. İstediğiniz ORF için başlangıç ve bitiş kodonlarının göreceli konumlarını (örneğin, ENSG00000100902_35292349_35292552_67) transkriptinde RiboCode_ORFs_result_collapsed.txt'dan (Ek dosya 3) alın. Ardından, ORF'de RPF okumalarının yoğunluğunu çizin:
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-kodon ATG -o ENSG00000100902_35292349_35292552_67
    Burada - s ve - e, ORF'yi çizmenin çeviri başlangıç ve bitiş konumunu belirtir. -- start-codon , şekil başlığında görünecek olan ORF'nin başlangıç kodonunu tanımlar. -o , çıktı dosyası adının önekini tanımlar.

9. (İsteğe bağlı) RiboMiner kullanarak metagen analizi

NOT: Aşağıdaki adımları izleyerek, EIF3E knockdown'ın tanımlanan açıklamalı ORF'lerin çevirisi üzerindeki etkisini değerlendirmek için metagen analizini gerçekleştirin:

  1. RiboMin için transkript ek açıklamaları oluşturun, bu da RiboCode tarafından oluşturulan ek açıklama dosyasına dayanarak her gen için en uzun transkriptleri ayıklar (adım 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    -g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -O all.transcripts.info.txt
  2. RiboMiner için yapılandırma dosyasını hazırlayın. RiboCode'un metaplots komutu tarafından oluşturulan yapılandırma dosyasını kopyalayın (adım 5.4) ve "RiboMiner_config.txt" olarak yeniden adlandırın. Ardından, Ek dosya 4'te gösterilen biçime göre değiştirin.
  3. RiboMiner kullanarak metagen analizleri
    1. Transkriptler arasında RPF'lerin yoğunluklarının toplu ve ortalama profilini oluşturmak için MetageneAnalysis'i kullanın.
      MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U kodon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm evet \
      -y 100 --tipi UTR
      Önemli parametreler şunlardır: --type, CDS veya UTR bölgelerini analiz etme; --norm, okuma yoğunluğunun normalleştirilip normalleştirilmediği; -y, her transkript için kullanılan kodon sayısı; -U, RPF yoğunluğunu kodon seviyesinde veya nt seviyesinde çizin; -u ve -d, kodonu başlatmak veya kodonu durdurmak için analiz bölgelerinin aralığını tanımlar; -l, CDS'nin minimum uzunluğu (yani kodon sayısı); -M, transkript filtreleme modu, ya sayım ya da RPKM; -n minimum sayım veya analiz için CDS'de RPKM. -m normalleştirilmiş bölgede CDS'nin minimum sayıları veya RPKM'si; -e, normalleştirilmiş bölgeden hariç tutulan kodon sayısı.
    2. Kontrol hücrelerinde ve eIF3 eksikliği olan hücrelerde mRNA üzerindeki ribozom doluluklarını karşılaştırmak için bir dizi pdf dosyası oluşturun.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mod ortalama
      NOT: PlotMetageneAnalysis pdf dosyaları kümesini oluşturur. MetageneAnalysis ve PlotMetageneAnalysis kullanımı ile ilgili ayrıntılar RiboMiner web sitesinde30 mevcuttur.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Örnek ribozom profil oluşturma veri kümeleri, GEO veritabanında GSE131074 katılım numarası altında depolanmıştır. Bu protokolde kullanılan tüm dosyalar ve kodlar Ek dosyalar 1-4'ten edinilebilir. RiboCode'u bir dizi yayınlanmış ribozom profilleme veri kümesine23 uygulayarak, kontrol ve EIF3E siRNA'ları ile tedavi edilen MCF-10A hücrelerinde aktif olarak çevrilen yeni ORF'leri tanımladık. Büyük olasılıkla çeviri ribozomları tarafından bağlanan RPF okumalarını seçmek için, sıralama okumalarının uzunlukları incelendi ve bilinen çeviri genleri üzerinde eşlenen RPF'ler kullanılarak bir metagen analizi yapıldı. Okumaların uzunluklarının frekans dağılımı, çoğu RPF'nin beklendiği gibi ribozomların kapladığı bir nükleotid dizisine karşılık gelen 25-35 nt (Şekil 1A) olduğunu göstermiştir. RPF'lerin farklı uzunlukları için P-site konumları, sırasıyla 5' uçlarından açıklamalı başlangıç ve bitiş kodonlarına olan mesafeler incelenerek belirlenmiştir (Şekil 1B). RPF'nin 28-32nt içindeki okumaları güçlü 3-nt periyodiklik gösterdi ve P-siteleri +12. nt'deydi (Ek dosya 1).

RiboCode, aday ORF'leri kanonik başlangıç kodonu (AUG) veya alternatif başlangıç kodonlarından (isteğe bağlı, örneğin, CUG ve GUG) bir sonraki durak kodonuna kadar arar. Daha sonra, tanımlanan aralıktaki RPF'lerin haritalama sonuçlarına dayanarak, RiboCode, çerçeve içi RPF'lerin sayısının (yani, her bir kodonun ilk nükleotidine tahsis edilen P bölgelerinin) çerçeve dışı RPF'lerin sayısından (yani, her bir kodonun ikinci veya üçüncü nükleotidine tahsis edilen P bölgelerinin) daha büyük olup olmadığını değerlendirerek 3-nt periyodikliğini değerlendirir. Aralarında açıklamalı ORF'leri kodlayan 10.394 gen (%70,8) ve dORF'Şekil 2 ve Ek dosya 3)

Farklı ORF'lerin boyutlarının karşılaştırılması, uORF'lerin ve örtüşen ORF'lerin açıklamalı ORF'lerden (~ 1.771 nt) daha kısa olduğunu (sırasıyla ortalama 195 ve 188 nt) göstermiştir. Aynı eğilim yeni ORF'ler (yeni PCG'ler ve yeni olmayan PCG'ler için sırasıyla 670 ve 385 nt) ve dORF'ler (~ 671 nt) için de gözlenmiştir (Şekil 3). Birlikte, RiboCode tarafından tanımlanan kanonik olmayan ORF'ler (açıklamasız), bilinen açıklamalı ORF'lerden daha küçük olan peptitleri kodlama eğilimindeydi.

Çeviri süreçlerinde EIF3'ün işlevini değerlendirmek için her ORF için göreceli RPF sayıları hesaplandı. Sonuçlar, uORF'lerin ribozom yoğunluklarının EIF3E eksikliği olan hücrelerde kontrol hücrelerine göre anlamlı derecede daha yüksek olduğunu göstermiştir (Şekil 4). Birçok uORF'nin aşağı akış kodlama ORF'lerinin çevirisi üzerinde inhibitör etkiler gösterdiği bildirildiğinden, EIF3E knockdown'un başlangıç kodonlarının aşağı yönündeki RPF'lerin küresel yoğunluklarını değiştirip değiştirmediğini daha fazla inceledik (Şekil 5). Birçok ORF'nin profilinin hizalandığı ve daha sonra ortalamasının alındığı metagen analizi, başlangıç kodonunun aşağı yönündeki 25 ve 75 numaralı kodonlar arasında bir ribozom kütlesinin durduğunu ortaya koydu ve bu da translasyon uzamasının EIF3E eksikliği olan hücrelerde erken bloke edilebileceğini düşündürdü. Sinyal-gürültü oranının veya ORF'lerin çeviri verimliliğindeki değişikliklerin, uORF RPKM'deki artışa ve EIF3E'nin yokluğunda 25 ila 75 kodonları arasındaki ribozomların birikmesine katkıda bulunup bulunmadığını, yani EIF3E içermeyen örneklerde 1) daha az kontaminasyon (veya iyi kütüphane kalitesi) veya 2) aktif çeviri (veya ribozom duraklaması) uORF'lerde ve arasında tanımlanan bölgede daha fazla okuma ile sonuçlanıp sonuçlanmadığını incelemek için daha fazla araştırma yapılması gerekmektedir. 25. ve 75. kodonlar.

Son olarak, RiboCode ayrıca istenen ORF'deki RPF'lerin P-bölgelerinin yoğunlukları için görselleştirme sağlar ve bu da kullanıcıların RPF'lerin 3-nt periyodiklik modellerini ve yoğunluklarını incelemelerine yardımcı olabilir. Örneğin, Şekil 6 , PSMA6'nın bir uORF'si ve SENP3-EIF4A1'in bir dORF'si üzerindeki RPF yoğunluklarını göstermektedir; her ikisi de yayınlanmış proteomik veriler23 (veriler gösterilmemiştir) ile doğrulanmıştır.

Figure 1
Şekil 1: Dizileme okumalarının ve P-site konumlarının değerlendirilmesi. (A) Replika 1'deki (si-eIF3e-1) EIF3E eksikliği olan hücrelerde ribozom korumalı fragmanların (RPF'ler) uzunluk dağılımı; (B) 29nt'lik RPF'lerin P-site konumunu, bilinen başlangıç (üstte) ve durdurma kodonları (altta) etrafındaki yoğunluklarına dayanarak çıkarmak. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 2
Şekil 2: RiboCode tarafından tüm örnekler birlikte kullanılarak tanımlanan farklı ORF türlerini barındıran genlerin yüzdeleri. Kısaltmalar: ORF = açık okuma çerçevesi; dORF = aşağı akış ORF; PCG = protein kodlayan gen; NonPCG = protein kodlamayan gen; uORF = yukarı akış ORF. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 3
Şekil 3: Farklı ORF türlerinin uzunluk dağılımları. Kısaltmalar: ORF = açık okuma çerçevesi; dORF = aşağı akış ORF; PCG = protein kodlayan gen; NonPCG = protein kodlamayan gen; uORF = yukarı akış ORF; nt = nükleotid. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 4
Şekil 4: Kontrol ve EIF3E eksikliği olan hücreler arasındaki farklı ORF tipleri için normalleştirilmiş okuma sayılarının karşılaştırılması . p-değerleri Wilcoxon işaretli sıralama testi ile belirlenmiştir. Kısaltma: ORF = açık okuma çerçevesi; dORF = aşağı akış ORF; PCG = protein kodlayan gen; NonPCG = protein kodlamayan gen; uORF = yukarı akış ORF; RPKM = Eşlenen milyon okuma başına kilobase başına okuma; siRNA = küçük müdahale eden RNA; si-Ctrl = kontrol siRNA; si-eIF3e = EIF3E'yi hedefleyen siRNA. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 5
Şekil 5: Açıklamalı ORF'lerin başlangıç kodonunun aşağı yönündeki 25-75. kodondaki ribozomların duraklamasını gösteren metagen analizi. Kısaltma: ORF = açık okuma çerçevesi; siRNA = küçük müdahale eden RNA; si-Ctrl = kontrol siRNA; si-eIF3e = EIF3E'yi hedefleyen siRNA; A. U., herhangi bir birim. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 6
Şekil 6: Mikropeptitleri kodlayan örnek ORF'lerin P-site yoğunluk profilleri. (A) Tahmin edilen uORF'nin P-site yoğunlukları ve transkript ENST00000622405 üzerindeki açıklamalı CDS'ye göre konumu; (B) A'dakiyle aynıdır, ancak ENST00000614237 transkriptindeki öngörülen dORF için. Tahmin edilen uORF (A) veya dORF'nin (B) genişletilmiş görünümünü gösteren alt panel. Kırmızı çubuk = çerçeve içi okumalar; Yeşil ve mavi çubuklar = çerçeve dışı okumalar. Kısaltma: ORF = açık okuma çerçevesi; dORF = aşağı akış ORF; uORF = yukarı akış ORF; CDS = kodlama dizileri. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Ek Bilgi: İki p-değeri arasındaki bağımlılığın değerlendirilmesi ve RiboCode sonuçlarının açıklanması (örnek olarak ATF4'ün uORF'si). Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Dosya 1: RPF'lerin ve P sitesi konumlarının seçilen uzunluklarını tanımlayan RiboCode yapılandırma dosyası. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Dosya 2: Tahmin edilen ORF'lerin bilgilerini içeren RiboCode çıktı dosyası. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Dosya 3: RiboCode çıktısının temel istatistiklerini gerçekleştirmek için R komut dosyası. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Dosya 4: Ek Dosya 1'den değiştirilen yapılandırma dosyası (RiboMiner için). Bu Dosyayı indirmek için lütfen tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ribozom profilleme, ribozomların hücrelerdeki etkisini genom ölçeğinde incelemek için benzeri görülmemiş bir fırsat sunar. Ribozom profilleme verileri tarafından taşınan bilgilerin tam olarak deşifre edilmesi, hangi gen bölgelerinin veya transkriptlerin aktif olarak çevrildiğine dair fikir verebilir. Bu adım adım protokol, ribozom profil oluşturma verilerini paket yükleme, veri hazırlama, komut yürütme, sonuç açıklaması ve veri görselleştirme dahil olmak üzere ayrıntılı olarak analiz etmek için RiboCode'un nasıl kullanılacağı konusunda rehberlik sağlar. RiboCode'un analiz sonuçları, çevirinin yaygın olduğunu ve kodlama genlerinin açıklamasız ORF'lerinde ve daha önce kodlama olmadığı varsayılan birçok transkriptte gerçekleştiğini göstermiştir. Aşağı akış analizleri, ribozomların, çeviri gerçekleştikçe 3-nükleotid adımlarında öngörülen ORF'ler boyunca hareket ettiğine dair kanıt sağlamıştır; Bununla birlikte, çeviri işleminin veya üretilen peptitlerin herhangi bir işleve hizmet edip etmediği belirsizliğini korumaktadır. Bununla birlikte, genom üzerindeki ORF'lerin çevirisinin doğru ek açıklamaları, daha önce karakterize edilmemiş transkriptlerin işlevlerini tanımlamak için heyecan verici fırsatlara yol açabilir31.

Ribozom profil oluşturma verilerini kullanarak her ORF için kodlama potansiyelinin tahmini, başlangıçtan ORF'lerin durdurma kodonlarına kadar her bir kodon üzerindeki P-siteleri yoğunluklarının 3-nt periyodikliğine büyük ölçüde dayanır. Bu nedenle, farklı uzunluklardaki okumaların P-site konumlarının hassas bir şekilde algılanmasını gerektirir. Bu tür bilgiler doğrudan ribozom profil oluşturma verileri tarafından sağlanmaz, ancak RPF'lerin 5' ucu ile açıklamalı başlatma veya durdurma kodonları arasındaki mesafelerden çıkarılabilir (protokol adımı 5.3). GTF dosyasındaki bilinen başlatma/durdurma kodonlarının ek açıklamalarının olmaması, örneğin yeni bir araya getirilmiş genomlar için, okumaların tam P-site konumları başka yollarla belirlenmediği sürece RiboCode'un aşağı akış adımlarını yürütememesine neden olabilir. Çoğu durumda, ribozoma bağlı parçaların boyutu ve P-site konumları sabittir, örneğin, 28-30 nt uzunluğunda ve insan hücrelerinde okumaların 5' ucundan +12 nt'de. RiboCode, deneyime dayalı P-site konumlarını tanımlamak için belirli bir aralıktaki okumaların seçilmesine izin verir. Bununla birlikte, hem RPF okumalarının uzunlukları hem de P-bölgelerinin konumu, çevresel koşullar (örneğin, stres veya uyaran) veya deneysel prosedür (örneğin, nükleaz, tampon, kütüphane hazırlığı ve dizileme) değiştirildiğinde farklı olabilir. Bu nedenle, en yüksek güvenilirliğe sahip RPF'leri (yani, 3 nt'lik periyodiklik desenlerini görüntüleyen okumaları) ayıklamak ve farklı koşullarda P sitesi konumlarını belirlemek için her örnek için meta grafiklerin (protokol adım 5.3) gerçekleştirilmesini öneririz. Bu işlemler metaplots işlevi kullanılarak otomatik olarak yapılabilse de, genellikle mükemmele yakın bir çerçeveleme veya aşamalandırma gösteren okumaların yalnızca küçük bir kısmı titiz seçim kriterlerini ve istatistiksel testi geçer. Bu nedenle, belirli parametreleri, özellikle de "-f0_percent" gevşetmek ve daha sonra her uzunluktaki okumaların 3 nt'lik periyodikliğini görsel olarak incelemek ve yapılandırma dosyasını, özellikle kütüphane kalitesi zayıf olduğunda, buna göre daha fazla okuma içerecek şekilde manuel olarak düzenlemek gerekir (protokol adımı 5.3).

RiboCode, aday ORF'leri kanonik veya kanonik olmayan başlangıç kodonlarından (NUG'ler) bir sonraki durak kodonuna kadar arar. Durdurma kodonlarının yukarı yönünde birden fazla başlangıç kodonu olan transkriptler için, en olası başlangıç kodonları, iki komşu başlangıç kodonu arasında eşlenen RPF okumalarının 3-nt periyodikliğini değerlendirerek veya sadece kare dışı RPF okumalarından daha fazla çerçeve içi olan yukarı akış başlangıç kodonu seçilerek belirlenir. Böyle bir stratejinin bir sınırlaması, başlangıç kodonu bölgelerine hizalanmış okumaların seyrek veya eksik olması durumunda gerçek başlangıç kodonlarının yanlış tanımlanabilmesidir. Neyse ki, küresel çeviri başlatma dizilimi (GTI-seq)32 ve nicel çeviri başlatma sıralaması (QTI-seq)33 gibi son stratejiler, çeviri başlatma sitelerini bulmak için daha doğrudan yollar sağlar. NUG'lar için, verimli başlangıç kodonları olarak geçerliliklerini araştırmak için daha fazla çalışmaya ihtiyaç vardır.

Ayrıca üç yeni özellik ekleyerek RiboCode için yeni bir güncelleme yayınladık: 1) en uzun olandan farklı transkriptlere göre konumlarına göre atanan diğer potansiyel ORF türlerini bildirir; 2) iki dış çerçevedeki RPF okumalarının testi bağımsız değilse, birleştirilmiş p-değerlerini ayarlamak için bir seçenek sunar ( Ek Bilgiler'deki daha ayrıntılı açıklamaya bakın); 3) çoklu testler için p-değeri düzeltmesi yapar ve ORF'lerin daha sıkı bir şekilde çevrilmesinin taranmasına izin verir.

RiboCode, RPF okuma yoğunluklarının 3-nt periyodikliğini değerlendirerek aktif olarak çevrilen ORF'leri tanımladığından, son derece kısa olan ORF'ler için belirli sınırlamaları vardır (örneğin, 3 kodondan az). Spealman ve ark. RiboCode'un performansını uORF-seqr ile karşılaştırmış ve veri setlerinde RiboCode tarafından 60 nt'den kısa hiçbir uORF'nin tahmin edilmediğini bildirmiştir34. RiboCode'un önceki sürümündeki ORF boyut seçimi (-m) parametresinin doğru ayarlanmadığını savunuyoruz. Güncelleştirilmiş RiboCode'da bu bağımsız değişkenin varsayılan değerini 5 olarak değiştirdik.

RiboCode, tanımlanan ORF'leri iki dosyada bildirir: Aynı genin farklı transkriptlerinden gelen gereksiz ORF'ler de dahil olmak üzere tüm ORF'leri içeren "RiboCode_ORFs_result.txt"; "RiboCode_ORFs_result_collapsed.txt" (Ek Dosya 2), çakışan ORF'leri aynı durdurma kodonu ile entegre eder, ancak farklı başlangıç kodonları, yani aynı okuma çerçevesinde en yukarı akış başlangıç kodonunu barındıran kodonu koruyacaktır. Her iki dosyada da, tespit edilen ORF'ler, bilinen CDS'ye göreceli konumlarına göre ORF'leri veya diğer farklı türleri çeviren "yeni" olarak sınıflandırılır (RiboCode paper22'den veya RiboCode web sitesinden35 ORF türlerinin ayrıntılı bir açıklamasına bakın). Örnek olarak ATF4 geninin tahmin edilen bir uORF'sini kullanarak RiboCode çıktılarının nasıl yorumlanacağını gösterdik (Ek Bilgiler). RiboCode ayrıca farklı tipte ORF'ler içeren genlerin sayısını da sayar ve bunları yüzdeleriyle birlikte çizer (Şekil 2).

Bir çalışma, bazı eksprese edilmiş ancak translasyonel olarak sessiz genlerin, oksidatif stres üzerine peptitlere dönüşmek üzere aktive edilebileceğini bildirmiştir12, bu da muhtemelen yalnızca duruma bağlı bir şekilde çevrilebilecek başka ORF'ler olduğunu göstermektedir. RiboCode, farklı deneysel koşullar için ayrı ayrı (örneğin, si-Ctrl veya si-eIF3e) veya bu protokolde gösterildiği gibi birlikte (adım 5.4 ve 6.1) gerçekleştirilebilir. "merged_config.txt" bölümünde seçilen okumaların uzunluklarını ve P-site konumlarını tanımlayarak birden fazla numuneyi tek bir çalıştırmada çoğullamak, her bir numunenin ayrı ayrı işlenmesine göre çeşitli avantajlara sahiptir. İlk olarak, tek bir örnekte bulunan önyargıları azaltır; ikincisi, programın çalışma süresinden tasarruf sağlar; son olarak, istatistikleri gerçekleştirmek için yeterli veri sağlar. Bu nedenle, teorik olarak, özellikle düşük sıralama kapsama alanı ve yüksek arka plan gürültüsüne sahip numuneler için tek örneklem modundan daha iyi çalışır. Farklı koşullar arasında (örneğin, si-eIF3e ve si-Ctrl) tahmin edilen ORF'lere atanan RPF sayılarının daha fazla nicelleştirilmesi ve karşılaştırılması, bağlama bağlı ORF'leri keşfetmemize veya ORF'lerin translasyonel düzenlemesini keşfetmemize olanak tanır.

"Çeviri rampası" adı verilen bir fenomen olan ORF'lerin başında ve sonlarında ribozomların birikmesi nedeniyle, ilk 15 kodon ve son 5 kodonda atanan RPF'lerin, başlangıç oranlarının farklılıklarına yönelik diferansiyel ORF çevirisinin analizinden kaçınmak için okuma sayımının dışında tutulması gerektiğini unutmayın3,5, 36. Bu sonuçlar, uORF tiplerinin bolluğunun, EIF3'ü olmayan hücrelerde, aktif olarak çevrilen ribozomların yüksek seviyelerinin neden olabileceği (veya en azından kısmen) kontrol hücrelerinden daha yüksek olduğunu göstermiştir. Başlangıç kodonları etrafındaki RPF yoğunluklarının meta-analizi, erken çeviri uzamasının EIF3E tarafından düzenlendiğini de göstermiştir. RPF'nin bir ORF'de okunduğunu saymanın, özellikle çeviri uzaması ciddi şekilde engellendiğinde, çeviri ölçümü için doğru olmadığını unutmayın.

Özetle, bu protokol, RiboCode'un, mikropeptitleri kodlayanlar da dahil olmak üzere herhangi bir boyuttaki yeni çevrilmiş ORF'leri tanımlamak için kolayca uygulanabileceğini göstermektedir. Araştırma topluluğunun farklı fizyolojik bağlamlarda veya deneysel koşullarda çeşitli ORF türlerini keşfetmesi için değerli bir araç olacaktır. Bu ORF'lerden protein veya peptit ürünlerinin daha fazla doğrulanması, ribozom profillemesinin gelecekteki uygulamalarının geliştirilmesi için yararlı olacaktır.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların açıklayacağı bir çıkar çatışması yoktur.

Acknowledgments

Yazarlar, Xi'an Jiaotong Üniversitesi'nin HPCC platformu tarafından sağlanan hesaplama kaynaklarından gelen desteği kabul etmek istiyor. Z.X., Xi'an Jiaotong Üniversitesi'nin Genç Topnotch Yetenek Destek Planı'na minnetle teşekkür eder.

Materials

Name Company Catalog Number Comments
A computer/server running Linux Any - -
Anaconda or Miniconda Anaconda - Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation - https://www.r-project.org/
Rstudio Rstudio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
  25. Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
  26. Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
  27. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  28. Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
  29. Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
  30. Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
  31. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  32. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  33. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  34. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  35. Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
  36. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Tags

Biyoloji Sayı 180 Ribozom profilleme açık okuma çerçevesi mRNA translasyonu mikropeptit uORF dORF
<em>De novo</em> Aktif Olarak Çevrilmiş Açık Okuma Çerçevelerinin Ribozom Profil Oluşturma Verileri ile Tanımlanması
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Zhu, Y., Li, F., Yang, X., Xiao, Z.More

Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter