Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Eksiltici genomik tarafından roman sıra bulma

Published: January 25, 2019 doi: 10.3791/58877

Summary

Bu iletişim kuralının amacı bilinen yalnızca kısmen bir ortak arındırıcı serisinden kolayca ayrılamayan roman dizileri bulamadı bir arada hesaplamalı ve tezgah araştırma kullanmaktır.

Abstract

Eksiltici genomik hedefi gen, protein veya daha büyük bir genomik bağlamda katıştırılmış genel bölge sırasını tanımlamak için nerede herhangi bir araştırmada kullanılabilir. Eksiltici genomik faiz (T) bir hedef dizi kapsamlı sıralama ve bilinen genetik öğeleri (başvuru, R) çıkarılarak tarafından izole etmek bir araştırmacı sağlar. Yöntem mitokondri, kloroplast, virüs gibi roman serileri tanımlamak için kullanılan veya germline kromozomlar sınırlı ve T kapsamlı genomik veri ile (R + T), yöntem başlayan R. kolayca izole olamaz özellikle yararlıdır Temel yerel hizalama arama aracı (patlama) eşleşen bilinen dizileri (R), (T) hedef bırakarak kaldırmak için bir başvuru sırası veya dizileri, karşı kullanır. En iyi çalışacak şekilde çıkarma için R T. eksik nispeten tam bir taslak olmalıdır Çıkarma test sonra nicel polimeraz zincir reaksiyonu (qPCR) aracılığıyla kalan dizileri beri R yöntemin işe yaraması için tamamlanmış olması gerekmez. Biz gerektiği gibi tekrarlanır bir döngü içine deneysel adımlarla Hesaplamalı adımları sırayla birden fazla başvuru dizileri kaldırma ve T. için arama rafine link burada Eksiltici genomik avantajı tamamen yeni hedef sıra fiziksel arıtma zor, imkansız ya da pahalı olduğu durumlarda bile belirlenebilir olması. Yöntemin bir dezavantajı uygun bir başvuru için çıkarma bulma ve T-pozitif alma ve negatif qPCR sınama örnekleri. Bizim zebra finch germline tarafından kısıtlanmış kromozom gelen ilk gen tanımlaması yönteminde uygulanması açıklanmaktadır. Bu durumda üç başvuruları (R), sırayla üç devir kaldırıldı Hesaplamalı filtreleme söz konusu: bir eksik genomik derleme, ham genomik veri ve transcriptomic veri.

Introduction

Bu yöntemin amacı bir roman hedef (T) genomik serisinden, DNA veya RNA, genomik bağlam veya başvuru (R) (resim 1) belirlemektir. Hedef fiziksel olarak ayrı tutulamaz veya bunu yapmak için pahalı olacağını, yöntem en yararlı olur. Yani bizim Yöntem önemli bir yenilik içine referans kusurlu olduğunda hedef sıraları ayırmak araştırmacılar etkinleştirme bir döngüsü, ya da bir taslak tezgah yöntemleri ve hesaplama birleşimi yalnızca birkaç organizmaların mükemmel genleri çıkarma için bitirdikten bir sigara modeli organizmadan genom. Bir döngü sonunda, qPCR sınama daha fazla çıkarma gerekip gerekmediğini belirlemek için kullanılır. Doğrulanmış aday T sıra istatistiksel olarak daha büyük algılama qPCR tarafından bilinen T-pozitif örnekleri gösterir.

Ana bilgisayar homologs1,2,3,4 var mı yeni bakteri uyuşturucu hedefler keşfi ve kimliği roman virüslerden virüslü bilgisayarlardan yöntemi enkarnasyonları uygulanmıştır 5,6. T kimlik ek olarak, yöntem yöntem zebra finch başvuru genom 936 eksik genler ve salt germline kromozom (T)7yeni bir gen tanımlamak için son kullanılan R: artırabilirsiniz. Eksiltici genomik T bilinen dizileri son derece farklı olma olasılığı veya olduğu gibi zebra finch germline tarafından kısıtlanmış kromozom7T kimliğini geniş tanımsızdır özellikle değerlidir.

Önceden T olumlu tanımlaması gerektirmeyen bir anahtar Eksiltici genomik tarafsız avantajdır. Bir son çalışmada, Readhead ve ark. Alzheimer hastalığı ve viral bolluk içinde dört beyin bölgeleri arasındaki ilişki incelenmiştir. İçin viral tanımlama, Readhead ve ark. 515 virüs8ağır sınırlama yaptıkları çalışmada teşhis edebilir viral ajanlar, bir veritabanı oluşturdu. Eksiltici genomik sağlıklı ve Alzheimer genleri karşılaştırmak için ne olursa olsun onların benzerlik bilinen bulaşıcı hastalığı ile ilişkili olası roman virüslerden yalıtmak için kullanılabilirdi. 263 bilinen virüsler insan hedefleme iken, bu yaklaşık 1.67 milyon keşfedilmemiş viral tür var, 631,000-827,000 insanlar9bulaştırmak için bir potansiyele sahip biri ile tahmin edilmektedir.

Roman virüslerden işlemleri olan bir alandır hangi Eksiltici genomik özellikle etkilidir, ancak bazı çalışmalarda sıkı bir yöntem gerekmeyebilir. Örneğin, tanımlayıcı roman virüslerden ayıklamak ve ters ters transkripsiyon ve BLASTx için viral dizileri5 ardından tarafsız yüksek üretilen iş sıralama veya viral nükleik asitleri zenginleştirici kullanmış çalışmalar viral dizileri uyarlamak 6. bu çalışmalar de novo sıralama ve derleme ediyor hedef sıraları olumlu aracılığıyla patlama tespit edilmiştir çünkü çıkarma kullanılmadı. Eğer belgili tanımlık virüs tamamen Roman ve ilişkili olmayan (veya uzaktan ilgili) diğer virüs, Eksiltici genomik yararlı bir yöntem olurdu. Eksiltici genomik yararı tamamen yeni dizileri elde edilebilir olmasıdır. Canlı genomunun büyüklüğü biliniyorsa, o dışarı herhangi bir viral dizileri bırakmak düşülen. Örneğin, bizim orijinal niyet7değildi ama bizim yayınlanan çalışmada biz zebra finch Eksiltici genomik, üzerinden viral bir roman serisinden izole.

Eksiltici genomik da yararlı bakteri aşısı hedefleri, antibiyotik direnci1,2,3,4dramatik artış tarafından motive tanımlaması içinde kanıtlamıştır. Otoimmün reaksiyon riski en aza indirmek için homologs içinde insan sahibi herhangi bir protein çıkararak araştırmacılar potansiyel aşı hedefleri daralmış. Uyuşturucu hedefleri proteinler yan etkileri için önde gelen ana bilgisayarlar arasında etkilemeyeceği emin olmak için birkaç bakteriyel genom üzerinden çıkarma omurgalı ana bilgisayar genleri Corynebacterium pseudotuberculosis, arıyorum bir belirli çalışmada gerçekleştirilen 1. bu çalışmaların temel iş akışı bakteriyel Proteom indir, hayati proteinler belirlemek, gereksiz proteinler kaldırmak için gerekli proteinler yalıtmak için BLASTp ve BLASTp ana bilgisayar Proteom karşı herhangi bir protein ile ev sahibi homologs kaldırmak için kullanın etmektir 1 , 2 , 3 , 4. Bu durumda, Eksiltici genomik geliştirilen aşı ana bilgisayar1,2,3,4' te herhangi bir hedef kapalı etkisi olmayacaktır emin olun.

Biz Eksiltici genomik ilk protein kodlayıcı gen germlines içinde bulunan bir germline tarafından kısıtlanmış kromozom üzerinde (GRC) (Bu durumda, T), tanımlamak için kullanılan ancak ikisinden de değil somatik doku10cinsiyette. Bu çalışmada önce GRC hakkında bilinen sadece genomik bilgi bir yinelenen bölge11oldu. De novo derleme yumurtalık ve teste dokulardan (R + T) Yetişkin zebra finches üzerinden sıralı RNA üzerinde gerçekleştirildi. Dizileri Hesaplamalı ortadan kaldırılması yayımlanmış somatik (kas) genom dizisi (R1)12kullanarak gerçekleştirilen, onun ham (Sanger) veri (R2) ve somatik (beyin) transcriptome (R3)13okuyun. Üç başvurular sıralı kullanımı ek filtreleme gerekli gösterilen adımında her döngüsü (Şekil 2A), 5 test qPCR tarafından tahrik edildi. Keşfedilen α-ek gen DNA ve RNA ve klonlama ve sıralamanın üzerinden qPCR üzerinden teyit edildi. Biz örneğimizde bu yöntem esnektir gösterir: Bu çıkarma-ebilmek var olmak kılınmak ile başvuruları (R) bu derlemeleri veya ham okuma oluşmaktadır ve nükleik asit (DNA vs RNA) eşleşen üzerinde bağımlı değildir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. de novo araya başlayarak sırası

Not: derleme bu verilerden üretilebilir sürece herhangi bir yeni nesil sıralı (NGS) verileri, kullanılabilir. Illumina, PacBio, uygun giriş verileri içerir veya Oxford Nanopore bir fasta dosyaya monte okur. Concreteness için bu bölümde açıklanmaktadır bir Illumina tabanlı transcriptomic derleme belirli zebra finch bir çalışma biz gerçekleştirilen7; Ancak ayrıntıları projeye göre değişir unutmayın. Bizim örnek proje için ham veri--dan bir MiSeq elde edilmiştir ve yaklaşık 10 milyon eşleştirilmiş okuma her örnekten elde edilmiştir.

  1. Trimmomatic 0,3214 Illumina adaptörleri ve düşük kaliteli üsleri kaldırmak için kullanın. Komut satırında girin:
    Java-jar trimmomatic 0.32.jar PE-phred33 forward.fq.gz reverse.fq.gz - baseout quality_and_adaptor_trimmed ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 satır aralığı: 3 firar: 3 SLIDINGWINDOW:4:20 MINLEN:40
  2. ARMUT15 0.9.6 v. yüksek kaliteli birleştirilmiş okuma trimmomatic çıkış eşleştirilmiş okur, varsayılan parametrelerini kullanarak oluşturmak için kullanın. Komut satırında girin:
    armut -f < quality_and_adaptor_trimmed_1P.fastq > - r < quality_and_adaptor_trimmed_2P.fastq >
  3. Kullanım sürüngen v. 1,116 hatayı düzeltmek için armut okuma üretilen. 17' açıklanan adım adım iletişim kuralı izleyin.
  4. Trinity 2.4.0 v. kullanın18 düzeltilmiş dizileri montajı için varsayılan modunda. Strand özel kütüphaneler için kullanın - SS_lib_type parametresi. Çıkış (your_assembly.fasta) bir fasta dosyasıdır. Komut satırında girin:
    Trinity..... seqType fq--SS_lib_type FR-max_memory 10G-Trinity_output quality_and_adaptor_trimmed_forward_paired_reads.fq yaptı--çıkış – quality_and_adaptor_trimmed_reverse_paired_reads.fq – CPU 10 sağ
    Not: Çıkış yeni bir dizin, Trinity_output, yer alacak ve derleme 'Trinity.fasta' istenirse Your_assembly.fasta adlandırılabilir isimlendirilecektir. Trinity Web sitesi daha fazla bilgi için bkz: https://github.com/trinityrnaseq/trinityrnaseq/wiki/Running-Trinity.

2. patlama derleme başvuru sıra karşı

Not: Kullanım başvuru bir derleme veya uzun olduğunda bu adımı Sanger gibi okur; in oluşuyorsa ham Illumina okur, okuma için sorgu eşleştirmek için adım 3 aşağı bakın. Komutları-meli iş üstünde birisi son patlama yorum-se bile tüm patlama adımları sürüm 2.2.29+ ile tamamlandı.

  1. Bir patlama veritabanı başvuru sırası (nucleotide_reference.fasta) komut satırında olun. Komut satırında aşağıdakini girin:
    makeblastdb - dbtype nucl-nucleotide_reference.fasta içinde-nucleotide_reference.db dışarı
  2. PATLAMA-maç (1. adımda oluşturulan) sorgu derlemesi için başvuru veritabanı. Bir çıkış dosyası elde etmek için kullanın [-BLAST_results.txt dışarı] ve [-outfmt 6] tablo çıkış (Python komut dosyaları ile sonraki işlem adımları için gerekli) oluşturmak için kullanın. Bu seçeneklerin herhangi bir sıra ile kombine edilebilir, bir örneği tamamlamak için emirdir [blastn-your_assembly.fasta - db nucleotide_reference.db sorgulamak-BLAST_results.txt - outfmt 6 dışarı]. Bir e-değer ayarı isterseniz - evalue seçeneği örnek [evalue-1e-6] için uygun bir rakam ile kullanın. Ancak bu Eksiltici döngüsü etkili bir şekilde tartışmaya açıklandığı gibi ayarlar evalue ters çevirir unutmayın.
  3. Artan sıkılık için protein dizileri derlemeden ile çevrilmiş nükleotit 6-yönlü çeviri (nükleotit) veritabanının gerçekleştirir (tBLASTn), patlama patlama sorguyu kullanın. Bu yöntem eksik protein ek açıklamaları sorun kaçınarak çoğu modeli olmayan sistemler için önerilir.
    1. Doğru genetik kodu organizma olduğu için seçili emin olmak okudu, kullanarak - db_gencode seçeneği. Sorgu için protein serileri elde etmek için TransDecoder.LongOrfs komutunu (3.0.1 v. TransDecoder paketinden) birleştirilmiş sorgu dizilerinden en uzun açık okuma çerçevesi tanımlamak için çalıştırın. [TransDecoder.LongOrfs -t your_assembly.fasta] emirdir; Çıkış 'transcripts.transdecoder_dir' adlı dizin içinde yer alacak ve your_assembly.fasta her serisinden en uzun tahmini protein dizileri içeren longest_orfs.pep adlı bir dosya içerir.
    2. TBLASTn kullanmak için koşmak belgili tanımlık buyurmak [tblastn-longest_orfs.pep - db nucleotide_reference.db sorgulamak-BLAST_results.txt - outfmt 6 dışarı]. Yüksek kaliteli protein başvuru varsa, protein-protein tBLASTn yerine BLASTp ile eşleşen kullanın.
    3. Bir patlama veritabanı protein referans yapmak [makeblastdb - dbtype prot-protein_reference.fasta içinde-protein_reference.db dışarı] ve sonra [blastp-longest_orfs.pep - db protein_reference.db sorgulamak-BLAST_results.txt - outfmt 6 dışarı]. Sonuçlar için aşağı akım işlem dosyası olarak kaydettiğinizden emin olun ve Python komut dosyaları doğru şekilde ayrıştırılır emin olmak için tablo (outfmt 6) kullanın.

3. harita derleme okur

Not: Bu yöntem ham genomik okuma yerine monte diziler başvuru veri kümesi oluşur veya Sanger dizileri, hangi durumda kullanımda patlama (adım 2.1) kullanılabilir.

  1. BWA kullanarak-MEM 0.7.12 v.19 veya bowtie220, sorgu derleme üzerine indirilen ham okuma (raw_reads.fastq) göster. Çıkış .sam biçimi olacaktır. Komutlar şunlardır: ilk derleme dizin: [bwa Dizin your_assembly.fasta] ve sonra okuma eşleme [bwa mem your_assembly.fasta raw_reads.fastq > mapped.sam]. (Not ' >' sembol daha büyük bir değil-daha imzalamak; bunun yerine dosya mapped.sam gitmek için çıktı bildirir).

4. herhangi bir eşleştirme dizileri kaldırmak için Python komut dosyası kullanma

Not: komut dosyaları iş Python 2.7 ile sağlanan.

  1. 2. adımda [./Non-matching_sequences.py your_assembly.fasta BLAST_results.txt] komutunu kullanarak Eksiltici Python komut dosyasını kullanın. Komut dosyasını çalıştırmadan önce patlama çıktı dosyası biçimi 6 (sekmeli) olduğundan emin olun. Komut çıktısı bir dosyayla eşleşmeyen serilerinde fasta formatı your_assembly.fasta_non-matching_sequences_BLAST_results.txt.fasta adlı ve aynı zamanda eşleşen kayıtları için your_assembly.fasta_matching_sequences_BLAST_ dizileri results.txt.fasta. Sigara eşleşen dosya en önemli, test için potansiyel T sıralarının bir kaynak ve daha fazla Eksiltici genomik döngüleri olarak olacaktır.
  2. Adım 3, Python komut dosyası removeUnmapped.py olarak almak çalıştırmak takip adım 3.1, .sam girin ve eşleşen herhangi bir okuma olmadan sorgu sıralarının adları tanımlar ve yeni bir metin dosyasına kaydeder. [./RemoveUnmapped.py mapped.sam] komutunu kullanın ve çıkış mapped.sam_contigs_with_no_reads.txt olacaktır. (Program kaldırıldı tüm bağlanılmayan okuma ile bir slimmed aşağı sam dosyası oluşturur; resimi bu protokolü amaçları doğrultusunda yoksayılabilir ama diğer analizler için yararlı olabilir).
  3. Önceki adımı mapped.sam_contigs_with_no_reads.txt adlı bir metin dosyası sıra adları listesi çıktı gibi bu DNA dizileri ile fasta dosyasını ayıklayın: [./getContig.py your_assembly.fasta mapped.sam_contigs_with_no_reads.txt]. Çıkış mapped.sam_contigs_with_no_reads.txt.fasta adlı bir dosya olacaktır.

5. tasarım astar kalır serisi için

Not: Bu aşamada aday T dizileri içeren bir fasta dosya yoktur. QPCR deneysel olarak T ya da r. önceden bilinmeyen bölgelerden gelen olup olmadığını sınamak için bu bölümde açıklanmaktadır Adım 4'te çıkarma tüm dizileri kaldırdıktan sonra T eklemek ilk derleme başarısız oldu veya çıkarma çok sıkı olabilir.

  1. Geneious21 en uygun astar dizileri el ile belirlemek için kullanın.
    1. 21-28 bp ileri astar için aday dizisi vurgulayın. 4 veya daha fazla herhangi bir Bankası nöbetleri önlemek. Tüm basepairs oldukça düzgün bir kombinasyonu ile bir bölge hedeflemek deneyin. Tek bir G veya C 3' ucunda astar tutturmak yardım, faydalıdır.
    2. Aday bölge vurgulandığında sırasının erime sıcaklığı (Tm) tahmini görüntülemek için ekranın sağ tarafında İstatistikleri sekmesinde tıklayın. Erime sıcaklığı arasındaki 55-60 ° C tekrarlar ve uzun ishal G/c kaçınırken, elde etmek için bak
    3. 5.1.1 adımları. ve geriye doğru bir astar seçmek için 5.1.2 yer alan 150-250 baz çifti 3' ileri astar. Astar uzunluğu eşleşmesi gerekmez, tahmin edilen Tm mümkün olduğu kadar yakın ileri astar Tm için olmalıdır. Tamamlayıcı sırasını tersine çevirmek emin olun (sıra vurgulanır iken Geneious içinde sağ Eğer menü seçenektir).
  2. Sıra penceredeki üst araç çubuğunda bulunan Astar dizayn işlevini kullanın.
    1. Astar tasarım düğmesini tıklatın. Hedef bölgealtında yükseltmek için bölge ekleme.
    2. Özellikleri sekmesi altında istediğiniz boyuta, erime sıcaklığı (Tm) ve % GC (bkz. Adım 5.1.1.) ekleyin.
    3. Oluşturulan astar için Tamam düğmesini tıklatın. Astar özel oligo servisi üzerinden sipariş.
  3. Astar (T ve R kodlama) denetim DNA ile Tm ve uzantısı zaman optimize etmek için doğrulayın. Grup boyutunu görmek için düzenli Taq ve jel elektroforez kullanır, ancak en iyi duruma getirme yöntemleri 6. adımda takip qPCR ile de yapılabilir.
    1. Böylece astar 10 mikron bir konsantrasyon ileriye ve geriye doğru astar, 10 X dilutions olun.
    2. Böylece 5 bir konsantrasyon ile şablonu başına 25 μL dNTP 0.5 μL, 0.5 μL ileri astar, 0.5 μL ters astar, Taq polimeraz 0.1 μL, 2 μL şablonunun, magnezyum 0,75 μL, arabelleği 2.5 μL ve su 18.15 μL PCR karışımı kullanın ng / μL.
    3. PCR programda astar farklı erime sıcaklıkları adlı sınayın. Genellikle en iyi performans gözlenen erime sıcaklıkları biraz aşağıda öngörülen Tm astar, fakat genellikle 60 ° c üzerinde olduğunu Ayrıca bu kılavuzu kullanarak kez en iyi uzantısı için test: 1 min başına 1000 bp (böylece, genellikle 10-30 saniye amplicon uzunluğu bağlı olarak).
    4. Son nokta jel elektroforez astar beklenen sıra yükseltmek onaylamak için gerçekleştirin. 6 X gliserol boya 200 V 20 dk için % 2 TAE özel jel üzerinde 5 μL ile karışık qPCR ürünün 25 μL çalıştırın.

6. qPCR kalan sırasının doğrulama

Not: Bu adımı doğrulanmış astar ve adım 5'te kurulan PCR koşulları gerektirir.

  1. Her şablon nüsha aşağıdaki karışımı ile çalıştırmak; PowerSYBR yeşil ana Mix 12.5 μL, ileri astar 0.5 μL 10 mikron, ters astar 0.5 μL 10 mikron, 10.5 μL su ve 1 μL şablonunun DNA (at 2 ng/μL bir konsantrasyon) bir konsantrasyon ile bir konsantrasyon ile , böylece her şey toplam hacminin 25 μL içerir.
  2. Doğrulanmış sıcaklık ve adım 4 uzantısı zaman haberdar qPCR programını çalıştırın. Tasarlanmış ve bir iki aşamalı döngü, için 10 dk ilk eritebilir, 95 ° C ile uyumlu olacak şekilde tüm astar doğrulanmış sonra 40 döngüleri 95 ° C 30 ve 60 ° C için 1 dk için. Ancak, bir üç aşamalı programı (erime-tavlama-uzatmak) astar için daha uygun olabilir ve gerekirse adapte olmalıdır. Son denaturing eğrileri en az astar qPCR içinde tek bir DNA ürün amplifikasyon doğrulamak için istihdam edilmektedir ilk kez oluşturulması tavsiye ediyoruz.
  3. Ölçü qPCR/SYBR yeşil sinyalleri aktin (veya herhangi bir diğer uygun 'R' denetimi) göreceli olarak CT için tarafından her zaman hesaplamak ortalama ve standart sapmayı 2-(gen Ct - β-aktin Ct).
  4. (İsteğe bağlı) Doğru ürün boyutu algılama qPCR tarafından onaylamak için son nokta jel elektroforez gerçekleştirin. Burada, 6 x gliserol boya 200 V 20 dk için % 2 TAE özel jel üzerinde 5 μL ile karışık qPCR ürünün 25 μL çalıştırın.

7. Pare bilgi yeni bir başvuru ile yineleyin .

Not: adım 6 t tanımlanan dizileri doğrulanmış, (Şekil 2A) döngüsü sona. Ancak, dikkat edilmesi gereken noktalar çeşitli döngüsü, örneğin çok R dizileri dosyasında kalır veya adım 6'aday T dizileri hiçbiri qPCR tarafından doğrulanmış Eğer bir devamıdır motive.

  1. Yeni bir referans elde edilir. Bu adım yeni bir yineleme döngüsü sağlar ve ham genomik veri, ham RNA-seq veri ve diğer birleştirilmiş veri kümelerini içerebilir. Biyoteknoloji genleri (ftp://ftp.ncbi.nlm.nih.gov/genomes/), FTP aracılığıyla erişilebilir hangi mağazalarda monte bilgi (https://www.ncbi.nlm.nih.gov/genome) için genom veritabanı Ulusal Merkezi referans veri için değerli kaynaklar dahil ve gen ifade ham yeni nesil sıralı okuma depolandığı Omnibus (https://www.ncbi.nlm.nih.gov/geo/). Genom projeleri diğer proje ilgili web siteleri ve veritabanları üzerinden kendi ham sıra veri sağlayabilir.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

PATLAMA çalıştırdıktan sonra çıktı dosyasını sorgudan veritabanıyla eşleşmesi sýra bir listesi olacak. Python çıkarma sonra nonmatching dizileri bir dizi elde edilen ve qPCR tarafından test edilmiştir. Bu sonuçlar ve sonraki adımlar, aşağıda ele alınmıştır.

Negatif sonuç. Patlamadan sonra başvuru sırasına görülebilir iki olası olumsuz sonuçları vardır. Toplam sıra herhangi bir benzer dizileri başvuru yok anlamı yok patlama sonuçları olabilir. Bu sıralı örnek için doğru başvuru sırası seçiminde bir hata olabilir. (Her şey uzakta çıkarılır) başlangıç derlemede hiçbir benzersiz dizileri vardır, bu nedenle hiçbir genler faiz dizisi için bulunan başka bir olasılık var. Başvurunun geldiği yerde denetleyin ve sorgu derleme gibi aynı doku olmadığından emin olun.

Hesaplamalı filtreleme sonra qPCR negatif bir sonuç verim, örnekler için bkz: Şekil 3A, 3B, C hangi orada hiçbir fark algılama kuş dokular arasında oldu. C A panellerinden farklı çıkarma döngüleri, hangi motive ek Eksiltici döngüsü yineleme ve yöntemi (resim 2A, 2B) gelişimi temsil eden genler vardır.

Olumlu sonuç. Olumlu bir sonuç--gerçek hedef sıra--tanımlaması doğruladı genomik DNA qPCR doku istatistiksel olarak daha büyük algılama gösterdiğinde / örnek başvuru (Şekil 3D) göre ilgi. Eksiltici proje bu durumda 10 milyon okuma çiftleri her seksten alma RNA germline doku ve erkek yetişkin zebra finch, üzerinden sıralama ile başladı. 167,929 transkript de novo kurul tarafından elde edildi işleme yumurtalık dizisinin yalnızca, kısalık için anlatacağız. Eksiltici genomik yöntemi (BLASTn) 5,060 transkript karşılık gelen birçok transkriptleri kodlamayan gösteren 598 benzersiz proteinler için yaptı yayımlanmış somatik genom12eşleşen herhangi bir dizileri ortadan kaldırmak için kullanıldı. Ham okuma derleme oluşturmak için kullanılan Sanger sonra kullanılan çıkarma sonraki düzeyi için tBLASTn tarafından 78 proteinlerin verimli. Bir son çıkarma RNA-seq ham kullanarak gerçekleştirilen sekiz proteinler bırakan işitsel kulak13, okur. Bu proteinler NCBI nr patlama ile çalıştırdığınızda altı proteinler viral, kuşlar tekrarlayan bir bölgede biriydi ve son sınırlı germline7 (Şekil 2B) bir α-ek oldu. Bu işlem sırasında daha önce tüm genom ek açıklama bulunmayan 935 somatik gen tespit edilmiştir; Birkaç tek tip qPCR güçlendirme (Şekil 3A, 3B, 3 C) dokular arasında gösterdi. α-ek gen germline testis aktin (Şekil 3D) eşdeğer düzeyde mevcut olduğu DNA göre somatik doku tükenmiş çünkü qPCR, kullanarak sınırlı olmak doğrulandı.

Ne ters gidebilir ki. Bu yöntemi kullanarak uygun başvuru sırası kullanılır garanti etmektedir yükleyen üstesinden gelmesi gereken asıl sorun. En iyi başvuru sırası, en geniş anlamda, faiz (T) dizisi katıştırıldığı genomik karmaşıklığını saklar. Bu farklı şekillerde dizileri anlamına gelir; transcriptome, derleme, ham veri veya veri birden fazla çalışmalar (Şekil 1) referans olarak kullanılması gerekir. Zebra finch çalışmada, astar RNA sıralama verilerden geliştirdiğimiz; Ancak, astar intron astar bağlayıcı siteleri DNA içinde veya arasında varlığı nedeniyle her zaman çalışmadı. Testis hedef (T) ve Referans (R), yapım o uygun olumlu denetim kodlayan DNA PCR genomik DNA kapalı belirlediği her astar test ettik. Bu aşamada astar başarısızlık tasarımı ve uygun bir küme tanımlanır kadar yeni astar sınama gerektirir. Standart tuzaklar PCR temelli yöntemleri uygulayın: amplifikasyon koşullar gerekir, optimize edilebilir, amplifikasyon özgüllük test ederek doğruladı ve/veya klonlama ve no-şablonu denetimler dahil tüm deneyler. QPCR deneyleri hakkında daha fazla bilgi için bkz:22.

Figure 1
Resim 1 . Eksiltici yaklaşım yinelemeli olarak birden çok başvuru (R) faiz (T) hedef dizisi toplam genomik veri kurtarmak için kaldırabilirsiniz. Tek tek projeleri başvuru dizisi tam olarak bu şekilde çakışmayabilir ve şekil üzerinde belirtilen değil veri kümelerini içerebilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 2
Şekil 2Görsel yöntemleri. (A) Eksiltici döngüsü şeması. Döngüsü birçok kez, en iyi sonuçları elde etmek için farklı başvuru dizileri, kullanan her zaman gerektiği gibi olarak tekrarlanır. (B) Biederman vd. belirli adımları Eksiltici döngüsü örneği yürütülen 7, gösterilen her aşamasında kalan sıraların sayısını ve olduğu gibi A numaralı adımları ile. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 3
Şekil 3 . Örnek veri qPCR sonuç negatif ve pozitif sonuçları da dahil olmak üzere. (A) CHD8, olumsuz bir sonuç genomik DNA qPCR. (B) DNMT1, olumsuz bir sonuç genomik DNA qPCR. CHD7, olumsuz bir sonuç (C) Genomic DNA qPCR. (D) testis örnekleri ve tükenmesi karaciğer ve yumurtalık aktin, olumlu bir sonuca göre özellikle huzurunda teyit NAPAG, genomik DNA qPCR. Tüm panelleri ortalama üç ölçümler'in standart sapması +/-gösterir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Eksiltici genomik güçlü olmakla birlikte, özelleştirme birkaç önemli adımlar ve başvuru dizileri ve test örnekleri dikkatli seçimi gerektiren bir çerez kesici yaklaşım değildir. Sorgu derleme kalitesiz ise, adımları süzme yalnızca derleme eserler izole. Bu nedenle, iyice belirli proje için bir uygun doğrulama protokolü kullanılarak de novo derleme doğrulanması önemlidir. RNA-seq için yönergeleri Tarih teslis Web sitesi18 ve DNA'ın, REAPR23 kullanılabilir gibi bir araç temin edilmektedir. PATLAMA kullanırken başka bir önemli adım uygun e-değer, çıkarma rahat yoksa sıkı olacağını belirleyen seçimdir. Ancak, bir inversiyon yönteminde oluşur: başvurmak için daha sıkı bir maç aslında daha az sıkı bir çıkarma, eşleşmeyen dizileri değil düşülen gibidir. Bu nedenle, daha büyük (daha az sıkı) e-değer patlamada daha sıkı bir çıkarma için kullanılmalıdır. Son önemli adım iletişim kuralı başvuru seçimdir. En yüksek etkinlik için başvurunun tamamlanmış olarak olmalıdır; Ancak, bu qPCR test kalan dizileri T veya R olup ve daha fazla filtreleme gerekli olup onaylar çünkü mükemmel olmak zorunda değil. Protokolün uygulanması sırasında yeni başvuruları genlerin aşağı daha da daraltmak için doğrulanması için kullanılabilir. Biz bazen eşleşen yöntemi değişebilir: sorgu serileri ile tanımlamak için son Eksiltici adım biz algoritması BWA sorgu dizileri üzerine ham okuma eşleştirmek için kullanılan ve özel python kullanılan komutlar için hiçbir eşleştirme (Şekil 2B) okur.

Bu yöntemin sınırlamaları bir başvuru sırası kullanılabilirliğini içerir. Örneğin, Meyer vd. Yeni bir homo mitokondrial genom değerlendirilir; insan kullandılar ve sıralı ve insan başvuru24eşlenen mitokondrial DNA, yakalamak için Denisovan sondalar. Bu durumda, araştırmacılar karşı mitokondrial genom elde etmek için24okuma-eşleme alternatif strateji gerektiren düşülen varolan hiçbir nükleer genom başvuru veri vardı. İnsan mitokondriyal başvuru göre Roman mitokondri kapsamlı diverged herhangi bir bölgelerinde okuma-eşleştirilmesiyle kaybolacaktım. Eksiltici genomik daha okunur-eşleme ama her zaman araştırma soru bağlı olarak geçerli değildir ve bu durumda gerekli de novo derleme () için sıra kapsama tür antik DNA seviyesinin düşük durdurulmasını emretti daha az önyargılı bir yaklaşım sunuyor Adım 1 / Eksiltici genomik).

Fiziksel Arıtma Eksiltici genomik için başka bir alternatif yöntemdir. Bu organellar genleri nükleer genom25,26,27,28küçüktür çünkü DNA veya RNA arıtma sıralama bütün kloroplast ve mitokondri genom kez kullanılır. İnsan ve diğer küçük mitokondrial genom amplifikasyon astar iki arıtma25tarafından takip kullanarak aracılığıyla sıralama için ayrılmış olabilir. Ancak, Eksiltici genomik mitokondrial genom astar bağlayıcı siteleri farklı veya tam genom oluşturmayacaktır alışılmadık büyük olduğu durumlar için yararlı olabilir. Bunun bir örneği var büyük, farklı, ciliates içinde doğrusal mitokondrial genom29olduğunu. Eşleme için bir başvuru genom ciliates yüksek sapma nedeniyle için uygun bir seçenek türleri ve homologs eksikliği arasında arasında bile30genuses değil. Eksiltici genomik kullanarak, ciliate mitokondrial genom izole ve genom eksik parçalarını potansiyelini en aza indirerek analiz. Benzer şekilde, bir de novo derleme yaklaşım Sitka Ladin kloroplast genom derlemede kullanılan iken, gap-kapanış ilgili karşılaştırmalı eşleme karşı önyargı bu siteleri31potansiyel olarak tanıtan beyaz Ladin okuyun.

Projeye bağlı olarak Eksiltici genomik teklif etmek zaman ve maliyet avantajları arıtma veya eşleme yaklaşımlar bulma işlemi daha az önyargı sunarken göre. Çünkü tamamen bilinmeyen, bazı durumlarda, hedef sıra kolayca izole olamaz (mitokondri), hücre hayatta kalmamız için önemli veya standart jel elektroforez tarafından ayırmak için çok büyük. Elektroforetik arıtma boyutu tabanlı yavaş ve koşullar üzerinde birden çok deneme optimize ederken (ki pahalı olabilir) önemli başlangıç malzemesi gerektirir. Darbe alan jel elektroforez (PFGE) DNA parçalarının 107 bp (10 Mb) kadar ayrılması sağlar, fakat 2-3 gün, büyük miktarda malzeme ve piyasada bulunan32değil bazen özel ekipman alır. Biederman vdgermline tarafından kısıtlanmış kromozom bilinen tek sıra kodlamayan tekrar7. yapıldı. Bu kromozom kuş, üzerinde 100 Mb uzunluğu10, en büyük olduğu gibi arıtma imkansız olurdu; Bu nedenle, Eksiltici genomik diğer yöntemleri yapamadığımı yapmak başardı. Genomik dönemde genellikle daha ucuz ve daha hızlı şimdi sıra ve bilgisayar tarafından daha sonra filtre olur. Etkinleştirme tamamen Roman dizileri keşfi, Eksiltici genomik yaklaşımlar roman dizileri bile olmadan bir mükemmel başvuru sırası yalıtmak için bir arada kullanır.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar ifşa gerek yok.

Acknowledgments

Yazarlar Michelle Biederman, Alyssa Pedersen ve Colin J. Saldanha çeşitli aşamalarında zebra finch genomik proje ile onların yardımını kabul edersiniz. Ayrıca Evgeny Bisk küme sistem yönetimi ve NIH grant 1K22CA184297 (için J.R.B.) ve NIH NS 042767 (C.J.S için) bilgi işlem için kabul.

Materials

Name Company Catalog Number Comments
Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

DOWNLOAD MATERIALS LIST

References

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer's Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics' GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).

Tags

Genetik sayı 143 genomik çıkarma qPCR harita De novo derleme astar tasarım patlama Python okuma
Eksiltici genomik tarafından roman sıra bulma
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Asalone, K. C., Nelson, M. M.,More

Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter