Bizim Bayesian Değişim Noktası (BCP) algoritması Saklı Markov Modelleri ile modelleme değişim noktaları state-of-the-art gelişmeler üzerine inşa ve kromatin immünopresipitasyon sekans (ChIPseq) veri analizi uygular. BCP geniş ve noktasal hem de veri türleri iyi performans sergilediğini, ancak doğru diffüz histon zenginleştirme sağlam, tekrarlanabilir adalar belirlenmesinde öne çıkmaktadır.
ChIPseq protein-DNA etkileşmeleri araştırmak için yaygın olarak kullanılan bir tekniktir. Oku yoğunluğu profilleri proteine bağlı DNA sonraki sıralama kullanarak ve bir referans genomuna okur kısa hizalayarak tarafından oluşturulur. Zenginleştirilmiş bölgeler genellikle hedef protein 1 bağlı olarak, şekil olarak büyük ölçüde farklılık dorukları, olarak ortaya çıkar. Örneğin, transkripsiyon faktörleri genellikle site ve sekans-spesifik bir şekilde bağlamak ve histon modifikasyonları daha yaygındır ve zenginleştirme 2 geniş, diffüz adalar ile karakterize edilirken, punktat zirveleri üretme eğilimindedir. Güvenilir bu bölgelerin belirlenmesi Çalışmalarımızın odak noktası oldu.
ChIPseq verilerin analiz edilmesi için algoritmalar buluşsal 3-5 den daha titiz istatistiksel modeller için çeşitli yöntemler, örneğin Hidden Markov Modellerinin (HMM'ler) 6-8 istihdam var. Biz zor olan tanımlamak, geçici parametrelerin sık sık gerekliliğini minimize çözüm aranmasıçözünürlük uzlaşma ve aracı sezgisel kullanılabilirlik azaltmak. HMM tabanlı yöntemler ile ilgili olarak, biz parametre kestirimi usul ve sıklıkla kullanılmaktadır basit, sonlu durumlu sınıflandırmalar kısaltmak amaçlanmıştır.
Ayrıca, geleneksel ChIPseq veri analizi kategorizasyonu içermektedir uygun aracı müteakip uygulaması takip noktasal veya diffüz ya olarak yoğunluk profilleri okumak bekleniyor. Biz daha capably veri türleri tüm spektrumu hitap edebilecek bir tek, daha çok yönlü bir model, bu iki farklı modelleri için ihtiyaç yerini amaçladık.
Bu hedeflere ulaşmak için, öncelikle istatistiksel bir çerçeve inşa sadece açık kullanır HMM'ler 9 bir kesme kenarı peşin, formüller-bir performans avantajları için önemli yeniliği kullanarak doğal modellenmiş ChIPseq veri yapıları. Daha sofistike sonra sezgisel modelleri, bizim SMM Bir aracılığıyla sonsuz gizli durumlar barındırmaktadırBayes modeli. Biz daha zenginleştirme kesimleri tanımlamak okumak yoğunluğu, makul değişim noktaları tanımlamak için uygulanır. Bizim analizimiz bizim Bayesian Değişim Noktası (BCP) algoritması azaltılmış bir hesaplama karmaşıklığı-kanıtladığı kısaltılmış çalışma süresi ve bellek izi tarafından vardı gözler önüne serdi. BCP algoritma başarıyla sağlam doğruluğu ve sınırlı kullanıcı tanımlı parametreler ile noktasal tepe ve diffüz ada tanımlama hem de uygulandı. Bu resimli, çok yönlülüğü ve kullanım kolaylığı hem de. Sonuç olarak, biz onu araştırma grupları arasındaki işbirliği ve corroboration yardımcı olabilir ChIPseq veri analizi için harika bir araç yapma, kolaylıkla karşılaştırılmış ve bir şekilde veri tipleri ve son kullanıcılara geniş aralıkları boyunca kolaylıkla uygulanabilir inanıyorum. Burada, yararlılığını göstermek için mevcut transkripsiyon faktörü 10,11 ve epigenetik verileri 12 BCP uygulamasını göstermek.
Biz eşit derecede iyi hem noktasal ve yaygın veri yapılarını tanımlayabilir ChIPseq verilerin analiz edilmesi için bir model geliştirmek için yola çıktı. Şimdiye kadar, zenginleştirme bölgelerinde, büyük ada boyutu önvarsayıyordu beklentilerini yansıtan, özellikle diffüz bölgeleri, tespit etmek zor olmuştur. Bu sorunları çözmek için, varolan sezgisel model ve daha az yenilikçi HMM'ler üzerinde birçok avantajı sahip SMM teknolojisindeki en son gelişmeler, kullandı.
<p class="jove…The authors have nothing to disclose.
STARR vakıf ödülü (MQZ), NIH hibe ES017166 (MQZ), NSF hibe DMS0906593 (HX).
Name of the reagent | Company | Catalogue number | Comments (optional) |
Linux-based workstation |