Waiting
Login-Verarbeitung ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

RNA yeni nesil sıralamayı ve Biyoinformatik boru hattını Locus 'a özgü düzeyde Ifade eden SATıRı-1s tanımlamak için

Published: May 19, 2019 doi: 10.3791/59771

Summary

Burada, hat-1 ifadesini Locus özel seviyesinde belirlemek için Biyoinformatik bir yaklaşım ve analizler sunuyoruz.

Abstract

Uzun INterspersed Elements-1 (LINEs/L1s), genomik istikrarsızlık ve Mutagenezi ortaya çıkan genomu kopyalayabilir ve rasgele ekleyebilen tekrarlayan öğelerdir. Tek seviyede L1 loci 'nin ifade desenlerini anlamak, bu mutajitik elemanın biyoloji anlayışına borç verecektir. Bu otonom eleman, 500.000 ' den fazla kopya ile insan genomunun önemli bir kısmını oluşturur, ancak 99% kesilmiş ve arızalı. Ancak, onların bolluk ve kusurlu kopya baskın sayısı diğer genlerin bir parçası olarak ifade L1 ile ilgili dizileri otantik ifade L1s tanımlamak için zor hale. Ayrıca hangi belirli L1 Locus elementlerin tekrarlayan doğası nedeniyle ifade edilir belirlemek için zordur. Bu zorlukların üstesinden gelmek, bir RNA-Seq Biyoinformatik yaklaşımı, Locus belirli düzeyde L1 ifadesini belirlemek için sunuyoruz. Özetle, sitoplazmik RNA topluyoruz, poliadenile transkriptler için seçiyoruz ve insan referansı genomunda okumaları L1 loci 'ye benzersiz bir şekilde eşlemek için ipliklere özgü RNA-Seq analizlerini kullanıyoruz. Biz görsel olarak her L1 Locus benzersiz eşlemeli ile kendi Organizatör transkripsiyon onaylamak ve eşleştirilen transkript her tek L1 Locus mappability için hesaba okur ayarlamak için okur kürate. Bu yaklaşım, DU145, bu protokol tam uzunlukta L1 elemanlarının az sayıda ifade algılamak için yeteneğini göstermek için bir prostat tümör hücre hattı uygulandı.

Introduction

Retrotransposons RNA ara yoluyla bir kopya ve yapıştırma mekanizmasında genomda "atlamak" olabilir tekrarlayan DNA unsurlarıdır. Retrotranspozonları bir alt kümesi uzun interspersed Elements-1 (LINEs/L1s) olarak bilinir ve 500, 0000 kopya1ile insan genomu altıncı yapar. Onların bolluk rağmen, bu kopyaları çoğu arızalı ve yalnızca tahmini 80-120 L1 elemanları aktif2olduğu düşünülmektedir ile kesilir. Tam uzunluklu L1, 5 ' ve 3 ' tercüme edilmemiş bölgeler, dahili bir organizatör ve ilişkili Anti-Sense promotör, iki adet örtüşmeyen açık okuma çerçevesi (ORFS) ve bir sinyal ve Polya kuyruğu3,4,5 ile yaklaşık 6 KB uzunluğunda . İnsanlarda, L1s en genç alt ailesine kıyasla zaman içinde daha fazla benzersiz sıra mutasyonları birikmiş olan eski aileleri ile evrimsel yaş ayırt alt ailelerden oluşur, L1HS. L1s tek otonom, insan retrotranspozonları ve onların ORFS bir ters transcriptase kodlamak, endonuclease, ve RNA-bağlayıcı ve refakatçi faaliyetleri ile rnps retrotranspoze ve bir süreçte genom eklemek için gerekli hedef-astar olarak adlandırılır Ters transkripsiyon8,9,10,11,12.

L1s retrotranspozit, İnsersiyonel mutagenesis, hedef site silmeleri ve yeniden düzenlemeler13,14,15, dahil olmak üzere çeşitli mekanizmalar ile insan germline hastalıklarına neden olduğu bildirilmiştir 16. son zamanlarda, bu mutajisik elemanın çeşitli epitelyal kanserlerde gözlenen artan ifade ve ekleme olayları olarak L1s onserit ve/veya tümör ilerlemesinde bir rol oynayabilirler hipotez olmuştur17,18 . Her 200 Doğum19yeni bir L1 ekleme olduğunu tahmin edilmektedir. Bu nedenle, daha iyi aktif L1s ifade biyoloji anlamak zorunludur. Tekrarlayan doğası ve diğer genlerin transkriptler içinde bulunan kusurlu kopyaları bolluk bu düzeyde analiz zorlu yaptık.

Neyse ki, yüksek verimlilik sıralama teknolojileri gelişiyle, adımlar ayrıştırmak ve otantik L1s Locus özel düzeyde ifade tanımlamak için yapılmıştır. RNA 'nın yeni nesil sıralamayı kullanarak L1s ifade etme konusunda farklı felsefeler vardır. L1 transkriptleri Locus 'a özgü düzeyde eşlemek için önerilen sadece iki makul yaklaşım olmuştur. Biri sadece L1 polimadenilasyon sinyali ve20' li sıralar arasında okuyan potansiyel transkripsiyon üzerinde duruluyor. Yaklaşımımız L1 elemanları arasındaki küçük sıralı farklılıklardan yararlanır ve sadece bu RNA-Seq ' d e k i benzersiz bir Locus21ile eşleştirir. Bu yöntemlerin her ikisi de transkript düzeylerinin kantitasyon açısından sınırlamalar vardır. Quantitation, her L1 Locus21' in ' benzersiz mappability ' için bir düzeltme ekleyerek veya belirli bir Locus22' ye benzersiz olarak eşlenmemiş çok eşlemeli okuma yeniden dağıtmak daha karmaşık algoritmalar kullanarak potansiyel olarak iyileştirilebilir. Burada, RNA ekstraksiyonu ve yeni nesil sıralamaya ve Biyoinformatik protokolünde, yer alan L1 unsurlarını Locus 'a özgü seviyede tanımlamak için adım-adım bir şekilde ayrıntı verecektir. Yaklaşımımız, fonksiyonel L1 elemanlarının biyolojisi hakkındaki bilgimizin maksimal avantajı alır. Bu, L1 elemanının başlangıcında başlatılan L1 düzenleyicinden fonksiyonel L1 unsurlarının oluşturulması gerektiğini bilerek, sitoplazmada tercüme edilmelidir ve transkriptlerinin genom ile birlikte doğrusal olması gerektiğini de içerir. Kısaca, biz taze, sitoplazmik RNA toplamak, poliadenile transkriptler için seçin, ve insan referans genom içinde L1 loci benzersiz harita okumak için Strand özgü RNA-Seq analizleri kullanın. Bu hizalanmış okur sonra yine de transkript okur L1 organizatör bir otantik ifade L1 olarak bir Locus belirlemeden önce kaynaklanan olup olmadığını belirlemek için geniş manuel kürasyon gerektirir. Biz DU145 prostat tümör hücre hattı örneği üzerinde bu yaklaşımı uygulamak nasıl nispeten az aktif nüshaların kütlesinden L1 üyeleri tespit göstermek için.

Protocol

1. sitoplazmik RNA ekstraksiyon

  1. Hücreleri aşağıdaki yöntemlerle edinin.
    1. % 2.75 –% 100 konfluent, T-75 flsordan canlı hücreler toplayın.
      1. 5 mL soğuk PBS, ve son yıkama hücreleri kapalı kazımak ve 15 mL konik tüp Transfer 2 kez Flask yıkayın. 1.000 x g ve 4 °c ' de 2 dakika Santrifüjü ve süpernatant 'ı (malzeme tablosu) dikkatle kaldırın ve atın.
    2. Doku örneklerden hücreleri toplayın.
      1. Bir saat içinde sitoplazmik RNA ekstraksiyonu için doku hazırlamak ve her zaman buz üzerinde tutmak. Uzun süreli depolama için, üreticinin protokolünü (malzeme tablosu) takiben diseksiyondan sonra 72 saate kadar doku depolamak için RNA inhibitörü çözümlerini kullanın.
      2. 10 μm3 numune zar ve steril Dons Homogenizer 5 ml soğuk PBS ile taze örnek homojenize, 15 ml konik tüp transfer, 4 °c ' de 1.000 x g 'de 2 dakika Santrifüjü, ve dikkatle kaldırmak ve atmak süpernatant (malzeme tablosu < /C8 >).
  2. Hücresel Pellet karışımı 2 mL liziz tamponu ekleyin ve 5 dakika boyunca buzun üzerinde inkübe.
    1. 150 mM NaCl, 50 mM HEPES (pH 7,4) ve 25 μg/mL digitonin (malzeme tablosu) ile taze liziz tamponu hazırlayın.
    2. Plazma membranı nüfuz etmek için gerekli olan liziz tamponunun minimum digitonin konsantrasyonu hücre tipine göre değişebilir, mikroskobik olarak liziz tampon ile tedavi hücrelerin plazma membranı kaybetmek ve bozulmamış nükleer membran korumak onaylayın.
    3. Kullanmadan hemen önce, eklemek 1.000 U/mL RNase inhibitörü (malzeme tablosu).
  3. 1.000 x g ve 4 °c ' de 1 dakika Santrifüjü ve supernatant toplayın.
  4. Önceden soğutulmuş 7,5 ml trizol ve 1,5 ml kloroform için süpernatant ekleyin. Kloroform gerektiren tüm adımlar temiz bir kimyasal kaput içinde yapılmalıdır (malzeme tablosu).
  5. 3.220 x g ve 4 °c ' de 35 dk Santrifüjü.
  6. Sulu kısmı (üst katman) taze bir ön soğutulmuş 15 mL tüp aktarın.
  7. 4,5 mL kloroform ve girdap ekleyin.
  8. 3.220 x g ve 4 °c ' de 10 dakika Santrifüjü.
  9. Sulu kısmı taze ön soğutulmuş tüpe aktarın.
  10. 4,5 mL isopropanol ekleyin, iyi sallayın ve-80 °C ' de gece (malzeme tablosu) olarak Inküye yapın.
  11. 3.220 x g ve 4 °c ' de 45 dakika Santrifüjü.
  12. İsopropanol çıkarın, 15 mL 100% etanol (malzeme tablosu) ekleyin.
  13. 3.220 x g 'de 10 dakika Santrifüjü
  14. Yaklaşık 1 saat için etanol, drenaj ve kuru çıkarın.
    1. Herhangi bir kalan etanol (malzeme tablosu) dışarı leke için steril bir pamuk çubukla kullanın.
  15. 100 ' de örnek olarak, Pelet boyutuna (malzeme tablosu) bağlı olarak 200 μL RNase serbest su yeniden askıya alın.
  16. Üreticinin intructions23 (malzeme tablosu) göre numunelerin kalitesini ve konsantrasyonunu belirlemek için Elektroforez teknolojisini kullanarak fraksiyonat örnekleri.
    1. Örnekler, rın > 824ise RNA-Seq analizine hak kazanırsa.

2. yeni nesil sıralama

  1. En az 50.000.000 eşleştirilen 100 BP okuma üretme amaçlı yeni nesil sıralama platformunu kullanarak sitoplazmik RNA örnekleri gönderin.
  2. Poli-adenylated RNAs ve Strand-özel sıralama için seçin.

3. Detaylandırmalar oluşturun (varolan bir detaylandırma varsa isteğe bağlı)

  1. Tam uzunlukta L1 ek açıklaması oluşturun veya tam uzunlukta L1 ek açıklamasını indirin (ek dosya 1a-b).
    1. Tablo tarayıcı aracı (https://genome.ucsc.edu/cgi-bin/hgTables) ile UCSC genom tarayıcısından LINE-1 elemanları için REPEAT Masker ek açıklamaları indirin. Memeli clade, insan genomu, hg19 derleme (veya daha güncelleştirilmiş bir genom için hg38) belirtin ve sınıf adı altında "SATıRALTı" için filtre. FL-L1-BLAST. GTF olarak. GTF dosyası ve etiketi olarak indirin.
    2. İnsan genomunda Organizatör bölgeyi kapsayan L 1.3 tam uzunlukta L1 elemanının ilk 300 BP 'nin yerel bir BLAST araması çalıştırın ve ek açıklama dosyasına L1 koordinatlarının bir sonu oluşturmak için 6.000 BP aşağı aşağı ekleyin. FL-L1-RM. GTF olarak bir GTF dosyası ve etiket kaydedin.
    3. RepeatMasker ek açıklama ve Promoter tabanlı L1 açıklama bedtools kullanarak ve etiket FL-L1-BLAST_RM. txt (yazılım paketleri)olarak kesişir.
      1. Linux terminalinde bu komutu kullanın: bedtools kesişme-a fl-L1-Blast. GTF-b fl-L1-RM. gtf > FL-L1-BLAST_RM. txt.
    4. Kesişen fl-L1 detaylandırmayı üst ve alt iplikçik ile ayırın.
      1. FL-L1-BLAST_RM. txt üzerinden elektronik tablo yazılımı ve sıralama "eksi" ve "artı" Strand ve sonra kromozom konumuna göre sıralamak kopyalayın.
      2. İki yeni elektronik tablo belgeleri oluşturun, biri tam uzunlukta L1s için kesişen koordinatları ile eksi iplikteki ve bir alt iplikteki ve FL-L1-BLAST_RM_minus. xls ve FL-L1-BLAST_RM_plus. xls olarak kaydedin.
      3. İki yeni belgeyi. txt dosyaları olarak kaydedin.
    5. Mac2unix programı,. txt dosyalarını doğru ek açıklama dosyalarına (yazılım paketleri) dönüştürmek için kullanın.
      1. Bu komutu terminalde kullanın: Mac2unix.sh fl-L1-BLAST_RM_minus. gff.
      2. Bu komutu terminalde kullanın: Mac2unix.sh fl-L1-BLAST_RM_plus. gff.
      3. Yeni dosyaları. gff uzantısıyla kaydedin.
    6. Alternatif olarak, + ve-Strand ile ilişkili satırları filtrelemek için AWK kullanın.
      1. + Strand almak için aşağıdaki komutu kullanın: awk '/+/' fl-L1_BLAST_RM. gtf > FL-L1_BLAST_RM_plus. GTF.
      2. -Strand almak için aşağıdaki komut satırını kullanın: awk '/-/' fl-L1_BLAST_RM. gtf > FL-L1_BLAST_RM_minus. GTF.

4. L1s ifade tanımlamak için hizalama ardışık okuyun

Seçeneği Açıklama
-p Bu, bilgisayarın hizalamayı çalıştırması gereken iş parçacıklarının sayısını ayrıntılarıyla kullanır. Daha büyük bilgisayar belleği daha fazla iş parçacıklarına izin verecektir ve ampirik olarak d.
– m 1 Bu, programa sadece genomda diğer genom eşleştiğinden daha iyi bir eşleşme olan okuma kabul etmesini söyler.
– y Bu, tüm olası maçlar için haritalama arama yapar ve eşleşme sabit sayıda ulaşıldığında çıkmak için izin tryhard anahtarıdır.
– v 3 Bu yalnızca program eşlenen için bellek kullanmak için 3 veya daha az uyuşmazlık genom ile okur sağlar.
– X 600 Bu yalnızca eşlenmesine izin verir eşleştirilmesi 600 içinde birbirlerine temelleri. Bu, okuma çiftleri genom içinde ortak doğrusal olduğundan emin olur ve işlenen RNA molekülleri içeren s karşı seçer.
– chunkmbs 8184 Bu komut, L1 ile ilgili her okuma için mümkün olan büyük miktarda hizalama miktarını işlemek için fazladan bellek atar.

Tablo 1: Bowtie için komut satırı seçenekleri.

  1. Hizalama eşleştirilmiş-bitiş sıralama fastq dosyaları Bowtie kullanarak ilgi RNA-Seq örneği ile çalıştırın.
    Not: benzersiz hizalama için gerekli parametreler özellikle sadece Papyon (yazılım paketleri) bu sürümünde bulunan çünkü Bowtie1 kullanılmalıdır ve Bowtie2 değil. Bowtie gibi splice-Aware plaklar üzerinde kullanılır Star sırayla uyumlu değerlendirmek, bitişik L1 biyoloji ve ifade daha alakalı okur.
    1. Linux terminalinde bu komut satırını kullanın: papyon-p 10-m 1-S-y-v 3-X 600--chunkmbs 8184 hg_X_Y_M_index-1 hg_sample_1. FQ-2 hg_sample_2. FQ | samtools görünümü-hbus-| samtools sıralama – hg_sample_sorted. bam. Bkz: Tablo 1 Bowtie için komut satırı seçenekleri açıklaması.
  2. Strand çıkış bam dosya samtools (yazılım paketleri) ve aşağıdaki Linux komutlarını kullanarak ayırın. Standart yeni nesil sıralama protokolleri kullanmıyorsanız, gerçek bayrak değerlerinin farklılık gösterebileceğini unutmayın.
    1. Üst Strand için seçmek için bu komut satırını kullanın: samtools View-h hg_sample_sorted. bam | awk ' substr ($ 0, 1, 1) = = "@" | | $2 = = 83 | | $2 = = 163 {Yazdır} ' | samtools görünüm-bS-> hg_sample_sorted_topstrand. bam.
    2. Alt Strand için seçmek için bu komut satırını kullanın: samtools View-h hg_sample_sorted. bam | awk ' substr ($ 0, 1, 1) = = "@" | | $2 = = 99 | | $2 = = 147 {Yazdır} ' | samtools görünüm-bS-> hg_sample_sorted_bottomstrand. bam.
  3. Yatak takımları (yazılım paketleri) kullanarak L1 loci için Detaylandırmalara karşı okuma sayımı oluşturun.
    1. Üst iplikteki anlamda yönde L1s için okuma sayar oluşturmak için bu komut satırını kullanın: bedtools kapsama-abam fl-L1-BLAST_RM_plus. gff-b hg_sample_sorted_topstrand. bam > hg_sample_sorted_bowtie_tryhard_plus_top. txt.
    2. Bu komut satırını kullanarak L1s için alt iplikteki anlam yönünde okuma sayar oluşturun: bedtools kapsama-abam fl-L1-BLAST_RM_minus. gff-b hg_sample_sorted_bottomstrand. bam > hg_sample_sorted_bowtie_tryhard_minus_bottom. txt.
  4. Dizin bam dosya adım 5.1.1 Integrative Genomics Viewer (ıGV)25 (yazılım paketleri) görüntülenebilir hale getirmek için.
    1. Bu komut satırını kullanın: samtools endeksi hg_sample_sorted. bam
  5. Bir seferde gelen RNA-Seq örneklerinin sayısını artırmak için bir toplu iş modu kullanmak için, human_bowtie. sh adlı adım 4,1 tamamlamak için bir süper bilgisayar komut dosyası kullanın, 4.2-4.3 adımları tamamlamak için bir komut dosyası human_L1_pipeline. sh adlı oluşturuldu ve tamamlamak için bir komut dosyası Adım 4,4 bam_index. sh adlı oluşturuldu. Bu komut dosyaları, komut dosyalarını çalıştırmak için ilişkili süper bilgisayar komutlarıyla birlikte ek dosya 2 ' de bulunabilir.

5. Manuel kürasyon

  1. Her açıklama eklenmiş L1 Locus ile eşlenen okuma için bir elektronik tablo oluşturun.
    1. Adım 4.3.2 ve etiket sayfasında oluşturulan hg_sample_sorted_bowtie_tryhard_minus_bottom. txt üzerinden Kopyala "eksi-Bottom."
      1. J sütununda bulunan en yüksek ve en düşük okuma sayısına dayanan tüm sütunları Sırala.
    2. Hg_sample_sorted_bowtie_tryhard_plus_top. txt adım 4.3.1 ve etiket "üst-artı" başka bir elektronik tabloda oluşturulan üzerinde kopyalayın.
      1. J sütununda bulunan en yüksek ve en düşük okuma sayısına dayanan tüm sütunları Sırala.
    3. "Kombine" olarak etiketlenmiş üçüncü bir sayfa oluşturun ve on veya daha fazla okuma ile tüm loci ekleyin "eksi-Bottom" ve "artı-top" sayfaları.
      1. J sütununda bulunan en yüksek ve en düşük okuma sayısına dayanan tüm sütunları Sırala.
    4. Aşağıdaki dosyaları ıGV25 (yazılım paketleri) içine yükleyin: 1) referans genom ilgiye detaylandırılmış genleri görselleştirin, 2) fl-L1-BLAST_RM. gff L1 ek açıklama görselleştirmek için, 3) hg_sample_sorted. bam eşlemeli transkriptler görselleştirmek için örnek faiz ve 4) hg_genomicDNA_sorted. bam genomik bölgelerin mappability değerlendirmek için.
    5. Her bam dosyası ile ilişkili kapsama ve kavşak satırlarını kaldırın.
    6. Hg_sample_sorted. bam ve hg_genomicDNA_sorted. bam sıkıştırmak tüm ıGV bir ekrana uygun izler.
  2. El ile kürate.
    1. Tablo "kombine" sayfasında listelenen loci koordinatlarını kullanarak, ıGV25 (yazılım paketleri) loci denilen görünümü.
    2. L1 yönünde 5 KB 'ye kadar hiçbir okuma olmazsa, bir Locus 'un kendine özgü bir şekilde kendi kendini ifade etmesini istiyorum.
      1. Satır rengi yeşil etiket ve neden bir otantik olarak ifade L1 olduğunu unutmayın.
        Not: L1 bölge upstream eşlenebilir değilse, bu kural için bir istisna var. Bu durumda, satırı kırmızı renkte etiketleyin ve L1 promotör 'nin upstream bölgesinin ifadesinin değerlendirilemez olduğunu ve bu nedenle L1's ifadesinin güvenle belirlenemiyor olduğunu unutmayın.
    3. 5 KB 'ye kadar upstream okur varsa, bir Locus otantik kendi Organizatör kapalı ifade edilemez Curate.
      1. Satır renk kırmızı etiket ve neden bir otantik olarak ifade L1 olmadığını unutmayın.
      2. Aynı yönde bir ifade gen bir intron içinde ifade edilir, L1 upstream okur ile aynı yönde bir ifade gen aşağı ise L1, veya un-açıklamalı ifade desenleri ile aynı yöne aşağı aşağı ise bir Locus yanlış olarak kürate Re L1 reklamları upstream.
        Not: L1 Organizatör Başlangıç sitesi, ancak biraz L1 upstream doğrudan çakışan en az okuma olduğunda bu kuralın bir istisnası uygulanır. Böyle bir L1 durumda upstream başka okur varsa, bu L1 otantik ifade etmek için düşünün. Satır yeşil renk etiket ve neden bir otantik olarak ifade L1 olduğunu unutmayın.
    4. Bir L1 Locus büyük olasılıkla falseolarak eşleştirilen desen için Locus okur, belirli L1's bölgeleri ile ilişkilendirmeyin mappability.
      Not: Örneğin, bir L1 son derece eşlenebilir ancak L1 içinde bir yoğunlaştırılmış bölgede okuma yığını yalnızca varsa, L1 ifade kendi Organizatör kapalı ilgili ve daha büyük olasılıkla ekzonlar veya Ltrs gibi açıklamasız kaynaklardan olması muhtemeldir. Bu gibi durumlarda, loci turuncu olarak papaz ve neden Locus şüpheli olduğunu unutmayın. UCSC genom tarayıcısında L1 konumunu kontrol ederek şüpheli kazık-up kaynaklarını doğrulayın.
    5. Bir lokus Curate bir genomik ortam içinde olup olmadığını otantik ifade edilemez dile getirilmiş un-açıklamalı bölgeler
      Not: Örneğin, okuma L1 10 KB upstream ifade edilebilir, ancak her 10 KB veya böylece eşlenen okuma ve bazı bu okur L1 ile hizalayın. Bu L1s kendi Promoter kapalı ifade edilmesi daha az muhtemeldir ve daha büyük olasılıkla genomik ifade Un-annotated desenleri nedeniyle okur. Bu gibi durumlarda, loci turuncu olarak papaz ve neden Locus şüpheli olduğunu unutmayın.

6. referans genom içinde mappability değerlendirmek için hizalama stratejisi okuyun (varsa isteğe bağlı bir genomik DNA veri kümesi mevcut hizalanmış)

  1. Tüm genom DNA dizisi dosyalarını indirin ve. FQ dosyalarına dönüştürün
    1. Burada bulunan NCBı Web sitesine gidin: https://www.ncbi.nlm.nih.gov/sra
    2. WGS hela eşleştirilen sonuyazın.
    3. Takson tarafından sonuçlaraltında Homo sapiens için seçin.
    4. Son eşleştirilmiş bir örnek seçin ve 100 veya aşağıdaki örnek gibi daha fazla BP ile okur: https://www.ncbi.nlm.nih.gov/sra/ERX457838 [accn]
    5. Okuma uzunluğunu seçerek onaylayın Çalıştır ve sonra meta verileri gösterildiği gibi burada: https://Trace.ncbi.NLM.nih.gov/Traces/SRA/?Run=ERR492384
    6. Tüm genom DNA dizisi verilerini indirmek için, Linux terminalinde bu komutu girin: sratoolkit. 2.9.2-mac64/bin/Prefetch-X 100G ERR492384
      Not: SRA araç seti hazırlık işlevi, NCBI sitesinde (yazılım paketleri) bulunan "ERR492384" katılım numarasını indirir. "100G" 100 gigabayt indirilen verilerin miktarını sınırlar.
    7. Linux terminalinde bu komutu girin: fastq-dump--Split-FILES ERR492384
      Not: Bu, indirilen genomik DNA veri kümesini iki fastq dosyalarına böler.
  2. Bowtie kullanarak hizalama çalıştırın.
    1. Hizalama için Linux bu komutu kullanın: papyon-p 10-m 1-S-y-v 3-X 600-chunkmbs 8184 hg_X_Y_M_index-1 hg_genomicDNA_1. FQ-2 hg_genomicDNA_2. FQ | samtools görünümü-hbus-| samtools sıralama – hg_genomicDNA_sorted. bam.
      1. Bkz. Adım 4,1 Bowtie hizalama (yazılım paketleri) kullanılan parametreleri anlamak için.
      2. Yazar isteği üzerine kullanılabilir mappability değerlendirmek için genomically hizalanmış bam dosyasını indirin.
  3. Dizin bam dosya adım 4.2.1 dan IV25 (yazılım paketleri) görüntülenebilir yapmak için samtools kullanarak daha fazla manuel Curation bilgilendirmek için.
    1. Linux bu komut satırını kullanın: samtools endeksi hg_genomicDNA_sorted. bam
  4. Her L1 loci için mappability değerlendirmek
    1. Düz araçlar programını, FL-L1 ek açıklamasını ve hizalanmış genomik sıra verilerini (yazılım paketleri) kullanarak L1 loci 'ye benzersiz olarak eşlenen okuma sayısını belirleyin.
      1. Linux bu komut satırını kullanın: bedtools kapsama-abam fl-L1-BLAST_RM. GTF – b hg_genomicDNA_sorted. bam ≫ L1_Mappability_hg_genomicDNA. txt.
    2. 400 benzersiz okuma hizalanmış olduğunda tam kapsama mappability için bir L1 Locus atayın.
    3. Genişleme veya aşağı genomik DNA hizalanması için gereken faktörü belirlemek, her bir L1 için 400 için okur.
    4. Bireysel L1 Locus mappability göre ifade ölçeklenmiş bir ölçü için, 4 – 5 bölümlerde belirlenen otantik ifade L1s hizalanır RNA transkript okuma sayısına adım 6.4.3 belirlenen faktörü çarpın.

Representative Results

Şekil 1 ' de yukarıda açıklanan ve grafiksel olarak açıklanan adımlar, DU145 bir insan prostat tümörü hücre hattına uygulanmıştır. RNA numunesi sitoplazmik olarak hazırlandı ve bir Poly-A seçilmiş, Strand-specific, eşleştirilmiş-End protokolünde sonraki nesil olarak sıralanmış. Bowtie kullanarak, eşleştirilmiş uç sıralama dosyaları eşleştirilmiş uç okuma başka bir genomik konuma kıyasla bir genomik konuma daha iyi eşleşen sadece benzersiz maçlar izin hizalanmış. DU145 sıra dosyaları, yazar isteği üzerine kullanılabilen bir BAM dosyası oluşturarak insan referansı genomuna hizalanmıştır. Bedtools kullanarak, veri DU145 Strand ayrılmış bam dosyaları tam uzunlukta L1s eşlenen okuma sayısı ayıklandı. Bu okur, en küçüğüne bir elektronik tabloya sıralanmış ve elle küratörlü, ıGV 'de her L1 Locus çevresindeki genomik ortamı inceleyerek orijinalliğini onaylamak için (ek tablo 1). Bir örnek özgün olarak ifade edilmesi için küratörüne, en sağdaki sütunda kabul için bir açıklama ile renk kodlu yeşil oldu. Yöntem bölümünde açıklanan yönergelere uygun olarak kabul edilen L1 loci örnekleri Şekil 2a-b ' de gösterilir. Bir örnek özgün olarak ifade edilmek üzere reddedildiyse, en sağdaki sütunda ret nedeni ile kırmızı olarak renk kodlu oldu. Yöntem bölümünde açıklanan kendi aşağıdaki yönergelerine göre bir organizatör dışında bir düzenleyici 'den ifade nedeniyle reddedilen L1 loci örnekleri Şekil 2c-e ' d a ayrıntılıdır.

Burada, bozulmamış bir organizatör bölge ile sadece tam uzunlukta L1s incelenmiştir. Bu ayrım yapılmışsa, kesilmiş L1s kaynaklanan transkripsiyon gürültüsünün büyük bir kaynağı sunulmuştur. DU145 'de kesilmiş L1s örnekleri, Şekil 3a-b ' d a gösterildiği gibi, benzersiz olarak eşlenen RNA-Seq okur olarak tanımlanır. Ancak ıGV 'de, bu transkriptlerin kesilmiş L1 'den başlatılmamış olması, ancak L1 dizisinin bir gen veya aşağı yukarı ifade edilen bir geni eklenmesiyle görülür.

DU145 içinde genel olarak, tam uzunluklu L1 loci yüzdesi ve manuel kürasyon sonra L1s ifade olarak reddedilen okur yaklaşık 50% (ek tablo 2) L1 eşlemeli yüksek düzeyde gösteren transkripti okur Aksi takdirde el ile Curation olmadan yanlış pozitif olarak kaydedilir. Özellikle, DU145 orada 114 Toplam tam uzunlukta L1 loci benzersiz 3.152 okuma toplam anlamda yönde okur eşleştirilmelidir vardı, ama sadece 60 loci kendi Organizatör kapalı ifade edilecek tespit edildi ile manuel küratörlüğü sonra 1.879 okur ( Ek tablo 1). Bu durum, sitoplazmik mRNA 'yı seçerek L1 Biyoloji ile ilgisiz ifadeyi azaltmak için bile adımlar atıldı. DU145 içinde eşlenen transkriptler en yüksek düzeyde olan Locus, bir otantik olarak ifade L1 (Şekil 4) olmadığından reddedildi unutmayın. Genel olarak, el ile kürasyon sonrasında kabul edilen ve reddedilen L1 loci arasında benzer şekilde belirli L1 locı aralıklarını eşlenen transkriptler sayısı (Şekil 4).

Manuel kürasyon sonrasında, DU145 aralığında benzersiz olarak özgün olarak ifade edilen belirli L1 loci haritasındaki okuma sayısı 175 ' den itibaren rasgele seçilmiş en az 10 okuma (Şekil 5) kesimli olarak gösterilir. Benzersiz olarak eşleştirilen transkript tanımlama Bu yaklaşım L1s için doğru ölçmek için yeteneği sınırlar ifade. Bunun için hesap için bir düzeltme faktörü her Locus için kendi mappability dayalı oluşturuldu. Bu düzeltme faktörü oluşturmak için ilk bedtools tüm tam uzunlukta L1 loci için hizalanır ve bu loci en düşük eşlemeli transkript okur (ek olarak grafikli hela genomik bam dosyasından benzersiz eşlemeli okuma sayısını ayıklamak için kullanıldı Şekil 1). Bu keyfi L1s ile 400 okuma tam kapsama mappability vardı belirlenmiştir. HeLa genomik sıralama örneği L1 Locus eşlemek mümkün okuma sayısı 400 için göreli olarak ölçeklendi ve bu ölçekli sayı daha sonra her özgün olarak ifade L1 loci DU145 (ek tablo 2) eşlenen okuma sayısına çarpıldı . Beklendiği gibi, mappability için daha büyük düzeltme puanları vardı L1 elemanları L1PA2 gibi genç alt ailelerden geldi (ek tablo 2). Bir kez okuma her Locus içinde mappability puanları için ayarlandı, çoğu loci için ifade için niceler arttı (Şekil 6). DU145 içinde mappability düzeltmeler ile benzersiz bir şekilde otantik belirli L1 loci ifade eşleştirilen okuma sayısı 612 den 4 okur ve en düşük ifade loci (Şekil 6) için bir yeniden sipariş edildi.

Figure 1
Şekil 1: Iş akışı şeması.
Grafiksel olarak açıklanan adımları bir insan örneğinde L1s ifade tanımlamak için vardır. 1 ve 2 adımlarının uygun dosyalar zaten kullanılabiliyorsa yinelenmesi gerektiğini unutmayın. Bu uygun dosyalar ek dosya 1a-b ve ek dosya 2indirilebilir. Kırmızı kutularda, aynı anlamda L1s için okuma eşlemesinin sayısını saymak için kullanılan bedtools kapsama programının adımları gösterir. Mantık odaklı haritalama okur bu loci el ile küratörü olmalıdır L1s. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Figure 2
Şekil 2: DU145 'de küratörden L1 loci örnekleri.
IGV içine Loaded referans genom, tam uzunluklu L1 gff ek açıklama dosyası (ek dosya 1), DU145 bam dosyası, ve son olarak genomik hela bam dosya referansla eşleşen tüm yazar üzerinde kullanılabilir mappability, değerlendirmek Istek. Oklar, açıklamalı L1 yönünü görselleştirmede yardımcı olmak için eklenmiştir. Oklar ve kırmızı okur sağdan sola sırayla yönlendirilir. Oklar ve mavi okur sırayla soldan sağa yöneltir. a) IGV içinde, bu L1 Locus, 5 KB üzerinde anlamda oryantasyonda L1 upstream okur yok gibi kendi Organizatör kapalı ifade edilir görünüyor. Bu L1 düşük mappability vardır, bir gen değil, ve beklenen antisens Organizatör aktivite kanıtı26. b) IGV içinde, bu L1 Locus kendi Organizatör kapalı ifade gibi görünüyor hiçbir yukarıda 5 KB için anlamda oryantasyonda L1 upstream okur. Bu L1 düşük mappability ve ters yönde bir gen içindedir. c) IGV 'de, bu L1 Locus, 5 KB içinde aynı oryantasyonda upstream okuma olduğu Için bir L1 ifadesi olarak reddedildi. Bu L1 aynı yönde bir gen içinde böylece transkript okur büyük olasılıkla ifade gen Organizatör kaynaklanan vardır. d) IGV 'de, bu L1 Locus, 5 KB içinde aynı oryantasyonda upstream okuma olduğu Için bir L1 ifadesi olarak reddedildi. Bu L1, aynı yönde son derece ifade edilen bir genin aşağı doğru olduğunu, böylece transkripti okur büyük olasılıkla bu ifade gen organizatörden kaynaklanan ve normal gen terminatörü ötesinde uzanan. e) IGV 'de, bu L1 Locus, 5 KB içinde aynı oryantasyonda upstream okuma olduğu Için bir L1 ifadesi olarak reddedildi. Bu L1, referans geni içinde veya bir açıklamalı gen yakınında değildir, bu nedenle L1 elemanının içindeki ve yukarısında bu transkriptinin kökeni, açıklamalı bir promotör önermektedir. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Figure 3
Şekil 3: arka plan gürültüsü kesilmiş L1s de kaynaklanır.
Önemli bir arka plan gürültüsü kaynağı olduğu için L1 ek açıklamalarımız kesilmiş L1s içermez. Oklar, açıklamalı L1 yönünü görselleştirmede yardımcı olmak için eklenmiştir. Oklar ve mavi okur sırayla soldan sağa yöneltir. a) gösterilen 2706 bps olan L1MB5 sufamily kesilmiş bir L1 örneğidir. IGV 'de, okur, ifade edilen bir genin aşağı akım uzantısıyla kaynakının ortaya çıktığı görülmektedir. b) gösterilen bir kesilmiş L1 başka bir örnektir. Bu L1, 4767 bps uzunluğunda bir L1PA11. IGV 'de, L1 'e benzersiz olarak gösterilen haritacılık, L1 'in içinde olduğu ifade edilen eXoN 'dan kaynaklanan belirgindir. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Figure 4
Şekil 4: transkript, DU145 prostat tümör hücresi hattında ifade edilen insan genomunda tüm tam uzunlukta bozulmamış L1s haritasının benzersiz olduğunu okur.
Siyah özel loci olarak tanımlanmalıdır özgün el kürasyon sonra ifade ve kırmızı özel loci olarak reddedilmesi için otantik ifade manuel küratörlüğü sonra okur. Gri olarak her biri için haritalama okur az on ile loci vardır. Bu loci transkripsiyonunun küçük bir kısmını temsil ederken, el ile Curate değildi. X ekseni onay işaretleri her 100 tam uzunluklu, bozulmamış L1s. yaklaşık 4.500 loci grafik olarak sıfır eşlenen okur gibi gösterilmez. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Figure 5
Şekil 5: transkript, DU145 prostat tümör hücresi hattında tam uzunluklu bozulmamış L1s haritasına benzersiz olarak ifade edilir.
Gösterilen transkript numaraları manuel Curation sonra DU145 hücrelerinde belirli loci harita okur. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Figure 6
Şekil 6: mappability ile ayarlandığında L1 'yi otantik olarak ifade eden haritalama okur.
Gösterilen transkript numaraları DU145 hücrelerinde el ile L1 loci küratörüne harita loci özel mappability puanları tarafından ayarlanan okur. Bu figürün daha büyük bir versiyonunu görmek Için lütfen tıklayınız.

Ek dosya 1: tam uzunlukta Için Detaylandırmalar, sağlam ınsan L1s Orientation. a göre) FL-L1-BLAST_RM_minus. gff. b) fl-L1-BLAST_RM_plus. gff. Bu dosyayı indirmek Için lütfen buraya tıklayın.

Ek dosya 2: Bölüm 4 ayrıntılı Biyoinformatik boru hattı otomatikleştirmek için kullanılan süper bilgisayar komut dosyaları. Bu dosyayı indirmek Için lütfen buraya tıklayın.

Ek şekil 1: L1 mappability belirlemek için kullanılan genomik DNA örneği.
Gösterilen genomik transkript sayısı, genom tüm 5.000 tam uzunlukta L1 loci benzersiz harita HeLa hücre hattı örnek okur. Bu bir L1 tam kapsama mappability olduğunda 400 L1 harita okur belirlenmiştir. Bu rakam indirmek Için lütfen buraya tıklayın.

Ek tablo 1: DU145 Içinde L1s manuel Curation. Bu tabloyu indirmek Için lütfen tıklayınız.

Ek tablo 2: eşlemeli ayarlama Ile DU145 yılında küratörlü L1s. Bu tabloyu indirmek Için lütfen tıklayınız.

Discussion

L1 aktivitesi, hastalığın27,28,29' a katkı sağlayan genetik hasarlara ve istikrarsızlığa neden olduğu gösterilmiştir. Yaklaşık 5.000 tam uzunlukta L1 kopyaları, sadece birkaç düzine evrimsel genç L1s hesap retrotranspozis etkinliği çoğunluğu için2. Ancak, hatta bazı eski, retrotranspositi,-incompentent L1s hala DNA zarar proteinleri30üretmek mümkün olduğunu kanıtlar vardır. L1s 'nin genomik istikrarsızlık ve hastalıkta rolünü tam anlamıyla takdir etmek için, Locus özel seviyesinde L1 ifadesi anlaşılmalıdır. Ancak, L1 retrotranspoziteye ilgisiz diğer RNAs 'a dahil L1 ile ilgili sıraların yüksek arka planı, otantik L1 ifadesinin yorumlanması konusunda önemli bir zorluk oluşturmaktadır. Tanımlamak ve bu nedenle bireysel L1 loci ifade desenleri anlamak başka bir zorluk birçok kısa okuma dizileri tek bir benzersiz Locus eşlemek için izin vermez tekrarlayan doğası nedeniyle oluşur. Bu zorlukların üstesinden gelmek için, RNA-Seq verilerini kullanarak bireysel L1 loci ifadesini tanımlayarak yukarıda açıklanan yaklaşımı geliştirdik.

Yaklaşımımız yüksek seviyede filtreler (% 99 üzerinde) bir dizi adım alarak L1 retrotranspozitiyle ilgisiz L1 dizilerinden oluşturulan transkripsiyonel gürültü. İlk adım sitoplazmik RNA 'nın hazırlanması içerir. Sitoplazmik RNA için seçerek, çekirdeğin içinde ifade edilen intronik mRNA içinde bulunan L1 ile ilgili okuma önemli ölçüde tükenmiş. Sıralama Kütüphanesi hazırlık, başka bir adım L1s ilgisiz transkripsiyonel gürültü azaltmak için poliadenile transkripsiyon seçimi içerir. Bu, mRNA olmayan türlerde bulunan L1 ile ilgili transkript gürültüsünü giderir. Başka bir adım, antisens L1 ile ilgili transkriptleri belirlemek ve ortadan kaldırmak için Strand özgü sıralamayı içerir. L1s ile eşleştiren RNA-Seq transkriptlerinin sayısını tanımlayırken işlevsel Organizatör bölgeleri ile tam uzunlukta L1s için ek açıklama kullanımı, aksi takdirde kesilmiş L1s kaynaklanan arka plan gürültüsünü de ortadan kaldırır. Son olarak, L1 retrotranspozitasyonu ile ilgisiz L1 sıralarının transkripsiyonel gürültüsünü ortadan kaldırmanın son kritik adımı, tam uzunlukta L1s ' nin RNA-Seq transkriptlerinin eşlemeli olduğu tespit edilen manuel kürasyon. Manuel küratörlüğü her Biyoinformatik tanımlanan-to-to-ifade L1 Locus onun çevreleyen genomik çevre bağlamında bu ifadenin L1 Promoter kaynaklanan onaylamak için görselleştirme içerir. Bu yaklaşım DU145, prostat tümör hücresi hattı uygulandı. Arka plan gürültüsünü azaltmak için yapılan tüm preparatlarla ilgili adımlarda bile, DU145 'de Biyoinformatik olarak tanımlanan L1 loci 'nin yaklaşık% 50 ' si, diğer transkripsiyon kaynaklarından kaynaklanan L1 arka plan gürültüsü olarak reddedildi (Şekil 4), güvenilir sonuçlar üretmek için gereken zorluklarla vurgulayarak. Bu yaklaşım el Kürasyonu kullanarak emek yoğundur, ancak bu boru hattının geliştirilmesinde gerekli olan, tam uzunlukta L1 'i çevreleyen genomik ortamı değerlendirmek ve anlamak. Sonraki adımlar, kürasyon kurallarının bazılarını otomatikleştirerek gerekli manuel kürasyon miktarını azaltarak, yine de tamamen bilinen genomik ifadenin doğası nedeniyle, referans genomu ifadesinde un-açıklamalı kaynaklar, düşük bölgeler mappability ve hatta bir referans genomunun inşası ile ilgili faktörleri karmaşık hale getirmek, şu anda L1 kürasyonunu tamamen otomatikleştirmek mümkün değildir.

Sıralama ile bireysel L1 loci ifadesinin belirlenmesi ikinci zorluk tekrarlayan L1 transkriptleri haritalama ile ilgilidir. Bu hizalama stratejisinde, bir transkript eşleştirilmek üzere referans genomuna benzersiz ve eşdoğrusal olarak hizalanması gerekir. Uyumlu olarak eşleştirilen eşleştirilmiş uç sıraları seçerek, referans genomunda bulunan L1 loci 'ye benzersiz olarak hizalanan transkriptler miktarı artar. Bu benzersiz eşleme stratejisi özellikle tek bir L1 Locus için okuma eşleme çağrılması güven sağlar, potansiyel olarak her tanımlanan-to-olmak-otantik ifade, tekrarlayan L1 ifade miktarını hafife. Bu alt tahmin için yaklaşık olarak doğru, onun mappability dayalı her L1 Locus için bir "mappability" puanı geliştirilmiştir ve benzersiz eşlemeli transkripti okuma sayısına uygulanan (Şekil 6). Bu ideal, mappability tam kapsama tam uzunlukta L1 arasında eşleşen WGS örnek göre okur için puan olmalıdır Not edilir. Burada, biz DU145 prostat tümörü hücre hatları L1 loci için haritalama okur şişirmek veya deflate her L1 loci mappability puanları belirlemek için HeLa hücrelerinin WGS kullanın. Bu mappability hesaplama ham düzeltme puanı, ancak 400 okuma seçilen ' komple kapsama mappability ' akılda tümör hücre hatları dinamik doğası ile belirlendi. Ek Şekil 1' de görülebilir, birkaç L1 loci ile hela WGS ile son derece yüksek sayıda eşlenen okur. Bu büyük olasılıkla HeLa içinde yinelenen kromozom dizileri gelen referans genom içinde değil, bu yüzden bu loci tam mappability kapsama temsilcisi olarak seçildi değildi gelir. Bunun yerine% 100 ortalama% okuma kapsamı yaklaşık 400 ek Şekil 1 göre okur ve daha sonra bu ortalama DU145 tümör prostat hücre hattı için de geçerli olduğu varsayılır görülmektedir belirlendi.

RNA-Seq teknolojisinden 100-200 BP okur bu hizalama stratejisi de tercihen daha büyük L1s zaman benzersiz mutasyonlar onları daha eşlenebilir hale biriken olarak referans genom içinde evrimsel olarak eski L1s için seçer. Bu yaklaşım, bu nedenle, L1s en genç yanı sıra referans olmayan, polimorfik L1s tanımlamak için geldiğinde hassasiyet sınırlıdır. L1s en genç tanımlamak için, biz kullanarak öneririz 5 ' L1 transkriptler YARıŞ seçimi ve PacBio gibi sıralama teknolojisi daha uzun kullanım yapmak21okur. Bu daha benzersiz haritalama ve bu nedenle ifade, Genç L1s emin kimlik izin verir. RNA-Seq ve PacBio yaklaşımlarının birlikte kullanılması, özgün olarak ifade edilen L1s daha kapsamlı bir listeye yol açabilir. Otantik olarak ifade edilen polimorfik L1s tanımlamak için, ilk sonraki adımlar, referans genomuna polimorfik diziler oluşturma ve ekleme içerir.

Tekrar dizileri okuyan biyolojik ve teknik zorluklar büyük, ancak yukarıdaki titiz prosedür ile L1 dizileri transkripsiyonel gürültüyü kaldırmak için RNA-sıralama teknolojisini kullanarak retrotransposition ile ilgili, biz üzerinden elemek için başlar büyük düzeyde transkripsiyon arka plan gürültüsü ve güvenle ve sıkı bir şekilde L1 ifade desenleri ve miktarı bireysel Locus düzeyinde tanımlamak için varlık.

Disclosures

Yazarların ifşa etmesi gereken hiçbir şey yok.

Acknowledgments

DU145 prostat tümörü hücreleri için Dr. yan Dong 'a teşekkür etmek istiyoruz. Dr. Nathan Ungerleider 'e süper bilgisayar senaryoları yaratmada rehberlik ve tavsiyeler için teşekkür etmek istiyoruz. Bu çalışmanın bazıları NıH hibe R01 GM121812 tarafından PD, R01 AG057597 VPB ve 5TL1TR001418 TK tarafından finanse edildi. Biz de kanser Haçlılar ve Tulane Kanser Merkezi Biyoinformatik Core destek kabul etmek istiyorum.

Materials

Name Company Catalog Number Comments
1 M HEPES Affymetrix AAJ16924AE
5 M NaCl Invitrogen AM9760G
Agilent bioanalyzer 2100 Agilent technologies
Agilent RNA 6000 Nano Kit Agilent technologies 5067-1511
bedtools.26.0 https://bedtools.readthedocs.io/en/latest/content/installation.html
bowtie-0.12.8 https://sourceforge.net/projects/bowtie-bio/files/bowtie/0.12.8/
Cell scraper Olympus plastics 25-270
Chloroform Fisher C298-500
Digitonin Research Products International Corp 50-488-644
Ethanol Fisher A4094
Gibco (Phosphate Buffered Saline) Invitrogen 10-010-049
Homogenizer Thomas Scientific BBI-8541906
IGV 2.4 https://software.broadinstitute.org/software/igv/download
Isopropanol Fisher A416-500
mac2unix https://sourceforge.net/projects/cs-cmdtools/files/mac2unix/
Q-tips Fisher 23-400-122
RNAse later solution Invitrogen AM7022
RNaseZap RNase Decontamination Solution Invitrogen AM9780
samtools-1.3 https://sourceforge.net/projects/samtools/files/
sratoolkit.2.9.2 https://github.com/ncbi/sra-tools/wiki/Downloads
SUPERase·In RNase Inhibitor Invitrogen AM2694
Trizol Invitrogen 15-596-018
Water (DNASE, RNASE free) Fisher BP2484100

DOWNLOAD MATERIALS LIST

References

  1. International Human Genome Sequencing. Initial sequencing and analysis of the human genome. Nature. 409, 860 (2001).
  2. Brouha, B., et al. Hot L1s account for the bulk of retrotransposition in the human population. Proceedings of the National Academy of Sciences of the United States of America. 100 (9), 5280-5285 (2003).
  3. Dombroski, B. A., Mathias, S. L., Nanthakumar, E., Scott, A. F., Kazazian, H. H. Isolation of an active human transposable element. Science. 254 (5039), 1805 (1991).
  4. Swergold, G. D. Identification, characterization, and cell specificity of a human LINE-1 promoter. Molecular and Cellular Biology. 10 (12), 6718-6729 (1990).
  5. Speek, M. Antisense promoter of human L1 retrotransposon drives transcription of adjacent cellular genes. Molecular and Cellular Biology. 21 (6), 1973-1985 (2001).
  6. Deininger, L., Batzer, M. A., Hutchison, C. A., Edgell, M. H. Master genes in mammalian repetitive DNA amplification. Trends in Genetics. 8 (9), 307-311 (1992).
  7. Boissinot, S., Chevret, P., Furano, A. L1 (LINE-1) Retrotransposon Evolution and Amplification in Recent Human History. Molecular Biology and Evolution. 17 (6), 915-918 (2000).
  8. Khazina, E., Weichenrieder, O. Non-LTR retrotransposons encode noncanonical RRM domains in their first open reading frame. Proceedings of the National Academy of Sciences of the United States of America. 106 (3), 731-736 (2009).
  9. Martin, S. L., Bushman, F. D. Nucleic acid chaperone activity of the ORF1 protein from the mouse LINE-1 retrotransposon. Molecular and Cellular Biology. 21 (2), 467-475 (2001).
  10. Feng, Q., Moran, M. H., Kazazian, H. H., Boeke, J. D. Human L1 Retrotransposon Encodes a Conserved Endonuclease Required for Retrotransposition. Cell. 87 (5), 905-916 (1996).
  11. Mathias, S. L., Scott, A. F., Kazazian, H. H., Boeke, J. D., Gabriel, A. Reverse transcriptase encoded by a human transposable element. Science. 254 (5039), 1808 (1991).
  12. Luan, D. D., Korman, M. H., Jakubczak, J. L., Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: A mechanism for non-LTR retrotransposition. Cell. 72 (4), 595-605 (1993).
  13. van den Hurk, J. A. J. M., et al. Novel types of mutation in the choroideremia (CHM) gene: a full-length L1 insertion and an intronic mutation activating a cryptic exon. Human Genetics. 113 (3), 268-275 (2003).
  14. Miné, M., et al. A large genomic deletion in the PDHX gene caused by the retrotranspositional insertion of a full-length LINE-1 element. Human Mutation. 28 (2), 137-142 (2007).
  15. Solyom, S., et al. Pathogenic orphan transduction created by a nonreference LINE-1 retrotransposon. Human Mutation. 33 (2), 369-371 (2012).
  16. Hancks, D. C., Kazazian, H. H. Roles for retrotransposon insertions in human disease. Mobile DNA. Mobile DNA. 7, 9-9 (2016).
  17. Tubio, J. M. C., et al. Mobile DNA in cancer. Extensive transduction of nonrepetitive DNA mediated by L1 retrotransposition in cancer genomes. Science. 345 (6196), 1251343-1251343 (2014).
  18. Ewing, A. D., et al. Widespread somatic L1 retrotransposition occurs early during gastrointestinal cancer evolution. Genome Research. 25 (10), 1536-1545 (2015).
  19. Beck, C. R., Garcia-Perez, J. L., Badge, R. M., Moran, J. V. LINE-1 elements in structural variation and disease. Annual Review of Genomics and Human Genetics. 12, 187-215 (2011).
  20. Philippe, C., et al. Activation of individual L1 retrotransposon instances is restricted to cell-type dependent permissive loci. eLife. 5, e13926 (2016).
  21. Deininger, P., et al. A comprehensive approach to expression of L1 loci. Nucleic Acids Research. 45 (5), e31-e31 (2017).
  22. Jin, Y., Tam, O. H., Paniagua, E., Hammell, M. TEtranscripts: a package for including transposable elements in differential expression analysis of RNA-seq datasets. Bioinformatics. 31 (22), 3593-3599 (2015).
  23. Agilent RNA 6000 Nano Kit Guide. , Agilent. (2017).
  24. Mueller, O. L., Schroeder, A. RNA Integrity Number (RIN) –Standardization of RNA Quality Control. , Agilent Technologies. (2016).
  25. Robinson, J. T., et al. Integrative genomics viewer. Nature Biotechnology. 29, 24 (2011).
  26. Speek, M. Antisense promoter of human L1 retrotransposon drives transcription of adjacent cellular genes. Molecular Cellular Biology. 21 (6), 1973-1985 (2001).
  27. Belancio, V. P., Deininger, L., Roy-Engel, A. M. LINE dancing in the human genome: transposable elements and disease. Genome Medicine. 1 (10), 97-97 (2009).
  28. Iskow, R. C., et al. Natural Mutagenesis of Human Genomes by Endogenous Retrotransposons. Cell. 141 (7), 1253-1261 (2010).
  29. Scott, E. C., et al. A hot L1 retrotransposon evades somatic repression and initiates human colorectal cancer. Genome Research. 26 (6), 745-755 (2016).
  30. Kines, K. J., Sokolowski, M., deHaro, D. L., Christian, C. M., Belancio, V. P. Potential for genomic instability associated with retrotranspositionally-incompetent L1 loci. Nucleic Acids Research. 42 (16), 10488-10502 (2014).

Tags

Genetik sayı 147 LINE-1 loci tekrarlayan elemanları retrotranspsosons transkripsiyon RNA-seq mappability Düzeltme
RNA yeni nesil sıralamayı ve Biyoinformatik boru hattını Locus 'a özgü düzeyde Ifade eden SATıRı-1s tanımlamak için
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Kaul, T., Morales, M. E., Smither,More

Kaul, T., Morales, M. E., Smither, E., Baddoo, M., Belancio, V. P., Deininger, P. RNA Next-Generation Sequencing and a Bioinformatics Pipeline to Identify Expressed LINE-1s at the Locus-Specific Level. J. Vis. Exp. (147), e59771, doi:10.3791/59771 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter