December 10th, 2012
Bizim Bayesian Değişim Noktası (BCP) algoritması Saklı Markov Modelleri ile modelleme değişim noktaları state-of-the-art gelişmeler üzerine inşa ve kromatin immünopresipitasyon sekans (ChIPseq) veri analizi uygular. BCP geniş ve noktasal hem de veri türleri iyi performans sergilediğini, ancak doğru diffüz histon zenginleştirme sağlam, tekrarlanabilir adalar belirlenmesinde öne çıkmaktadır.
Aşağıdaki deneyin genel amacı, genom boyunca posterior ortalama okuma yoğunluğunu tahmin etmek için kromatin immünopresipitasyon dizileme verilerinden eşlenmiş okuma pozisyonlarının yoğunluğunu kullanmaktır. Bu, ön işleme ile elde edilir. Eşlenen ChIP-seq, 200 baz çifti örtüşmeyen bölme içine düşen aynı sayıda okuma ile engellenen yoğunluk profillerine okumalar yapar.
Aynı yoğunluğa sahip herhangi bir bitişik bölme, ikinci adım olarak daha büyük bir blok halinde birleştirilir: her bloğun arka ortalama yoğunlukları, ileri ve geri filtreli bir Bayes modeli kullanılarak çevredeki tüm bloklar bağlamında özyinelemeli olarak hesaplanır. Bir blok için okuma sayısı, alfa ve beta parametreleri ile bir gama önceki dağılımı alan bir teta parametresi ile bir Poisson dağılımı ile modellenir. Her bloğun sonraki posterior ortalama yoğunluk tahminleri, nihai zenginleştirilmiş genom segmentlerini oluşturmak için giriş kontrolü arka plan yoğunluğuna göre 90. kantil'i aşıp aşmadığına bağlı olarak anlamlılık açısından değerlendirilir, ham dizilenmiş okumalardan posterior ortalama okuma yoğunluğu tahminlerine ilerlemeyi gösteren sonuçlar elde edilir, ve son olarak BCP analizi sırasında ChIP-seq verilerinde zenginleştirilmiş adalar.
Ayrıca, sonuçlar BCP'nin bir rakip araç üreticisinden daha iyi performans gösterdiğini göstermektedir. Bu tekniğin CER gibi mevcut yöntemlere göre ana avantajı, BCP'nin gizli işaretleyici modellerinde en son A gelişmelerini kullanmasıdır, bu nedenle yongalı veri analizinin nüansını önceki sezgisel yöntemlere göre daha iyi karakterize eder. Bu yöntem, epigenomik alanda, genom çapında zenginleştirme modellerini karakterize ederek histo modifikasyonlarının rolü gibi temel sorulara yardımcı olabilir.
Bu hasta yöntemi, ChIP-seq veri analizi hakkında bilgi sağlayabilse de, temel çerçeve, bis Sufi dizileme verilerinde diferansiyel olarak metillenmiş bölgelerin tanımlanması, RNA-Seq'deki yeni transkripsiyon lokusları, kopya sayısı varyasyonu veya herhangi bir sayıda mikrodizi döşeme verisi. Bu yöntemin görsel gösterimi, metodolojinin net bir şekilde anlaşılması için kritik öneme sahiptir ve bazı avantajlara sahiptir. Teorik avantajlar yazılımın içinde gizlidir.
Burada gösterilen tüm prosedür adımları, bu videoda indirilebilen BCP yazılım paketinde tek bir yürütülebilir dosyada paketlenmiştir. Yazılımı çalıştırmak için program tarafından yürütülen adımlar açıklanmıştır. Üç parametre gereklidir.
Bir çip örneğinden benzersiz bir şekilde eşlenmiş okumalar içeren bir dosya ve giriş kontrolü okumaları için benzer bir dosyanın yanı sıra BCP analizi için giriş dosyalarını hazırlamak için bir çıktı dosyası adı. İlk olarak, tercih edilen kısa okuma hizalama yazılımını kullanarak dizileme çalışmalarından üretilen kısa okumaları uygun referans genomuna hizalayın. Eşlenen konumlar, eşlenen kromozom başlangıç konumunu, bitiş konumunu, okunan adı, puanı ve ipliği gösteren eşlenmiş okuma başına sekmeyle ayrılmış bir çizgi olan altı sütunlu tarayıcı genişletilebilir verilerine veya BED biçimine dönüştürülmelidir.
Çip ve giriş haritası konumlarını önceden belirlenmiş bir parça uzunluğuna genişletin. Örneğin, DNA'nın enzim sindirimi veya sonikasyonu sırasında hedeflenen parça boyutu, genellikle yaklaşık 200 baz çifti. Parça sayıları daha sonra bitişik bölmelerde toplanır.
Varsayılan olarak, bölme boyutu 200 baz çiftinin tahmini parça uzunluğuna ayarlanmıştır. Aynı yeniden sayımlara sahip bir dizi bölmedeki olası değişiklik noktaları büyük olasılıkla en dış sınırlara düşecektir. Buna göre, aynı okuma sayılarına sahip iki kutu arasındaki iç sınırda bir değişiklik noktasının oluşması olası değildir.
Bu nedenle, bölme başına aynı okumalara sahip bitişik bölmeleri tek bir blokta gruplandırın. Giriş dosyalarını hazırladıktan sonra, ekranın altında gösterilen komutu yazarak BCP tahminini çağırın. Her bloğun okuma yoğunluğu, alfa ve beta parametreleri ile gama dağılımlarının bir karışımını ve herhangi bir blokta meydana gelen bir değişim noktasının önceki olasılığını takiben bir ortalama parametre tetası ile bir poisson dağılımı olarak modellenmiştir.
Her bloğun bu şekilde koşullandırılan P sınırı, sonsuz bir durumu etkili bir şekilde gizli Markov modeli veya HMM haline getirir. Alfa, beta ve P hiper parametreleri, maksimum posterior olasılık kullanılarak tahmin edilir. Bölme tahminleri, HMS'de sıklıkla kullanılan daha geleneksel ancak zaman alıcı ileri ve geri filtrelerin, arka ortalamaları tahmin etmek için hesaplama açısından daha verimli sınırlı karmaşıklık karışımı yaklaşımı ile değiştirildiği göz önüne alındığında, teta alt T'nin beklentisi olarak her bir blok teta alt T için açıkça hesaplanır. bu nedenle, aynı teta şapka alt T'ye sahip bloklar, güncellenmiş sınır koordinatları ile birlikte daha fazla engellenmelidir.
BCP, arka plan hızı olarak blok başına giriş okuma sayısını kullanır ve zenginleştirmeyi belirler. Bir blok için çip konumu ortalama yoğunluğunun bir anlamlılık eşiğini aşıp aşmadığına dayalı basit bir hipotez testi kullanmak. 90. nicelik varsayılan eşiktir ve çoğu durumda uygundur.
BCP daha sonra zenginleştirmeyi aşan bitişik arka ortalama yoğunluk bloklarını tek bir bölgede birleştirir ve birleştirilmiş koordinatları tarayıcıda bildirir. Genişletilebilir veri formatı BCP, histon modifikasyon verilerinde geniş zenginleştirme bölgelerini belirlemede mükemmeldir. Burada. BCP sonuçları, H üç K 36 trimetilasyonunu inceleyen bu laboratuvardan önce güçlü performans gösteren mevcut bir araç olan cser'in sonuçlarıyla karşılaştırılır, BCP'de cer'den çok daha büyük ada boyutu için bir eğilim göstermiştir.
Daha büyük adalar, H üç K 36 trimetilasyon zenginleştirmesinin geniş dağınık adalarının geleneksel beklentisiyle daha uyumludur. Daha büyük adalar tek başına doğruluğu göstermez. Bu nedenle, H üç K 36 Trimetilasyon Adasının aktif olarak kopyalanan gen gövdeleri ile bilinen ilişkisi ve bunların H üç K 27 Trimetilasyon Adası ile karşılıklı münhasırlığı, CER'e kıyasla BCP ve CER'in performansını değerlendirmek için kullanıldı BCP, H üç K 27 ile artan örtüşmeden ödün vermeden gen cisimlerini daha iyi yakalayan daha büyük bitişik adalar olarak adlandırılır, trimetilasyon Adaları.
BCP, iki replike veri setinde BCP Adası çağrılarının tekrarlanabilirliğini değerlendirirken, bastırılmış transkripsiyonlu intergenik uzay genleri ile yanlış pozitif örtüşme derecesini artırmadan, sınırları gen gövdelerine yakından hizalanmış H üç K 36 Trimetilasyon Adası ile aktif genlerin yüksek örtüşmesini korur veya H üç K 27 TRİMETİLASYON baskılayıcı işareti, BCP'nin, rakip algoritmada kamış kapsama derinliğine büyük bir bağımlılıktan muzdarip olmadığı gözlemlendi, ancak BCPS'nin sağlamlığı ve tekrarlanabilirliğine dair ek kanıtlar, azaltılmış kapsama derinliğine rağmen tutarlı ada sınırları gösteren ek farklı bölgelerin incelenmesiyle sağlandı. BCP'nin çok yönlülüğünü tam olarak göstermek için, H üç K 27 asetilasyonu, H üç K dokuz asetilasyon ve H üç K dört trimetilasyon noktalama işaretleri ve H üç K dört trimetilasyon ve H üç K 36 trimetilasyonuna ek olarak dağınık işaret H üç K dokuz trimetilasyon dahil olmak üzere geniş bir histon modifikasyon verileri spektrumu elde edildi. Bu veri setleri, hem BCP hem de cser için varsayılan parametre ayarları kullanılarak analiz edildi.
Merkezde, transkripsiyon başlangıç bölgesinde beklendiği gibi düşen aktif transkripsiyonu işaretleyen PX DN geninde H üç K 36 trimetilasyon zenginleştirmesi bulunur, ek noktalama aktif işaretleri H üç K 27 asetilasyon, H üç K dokuz asetilasyon ve H üç K dört trimetilasyondur. PXDN'nin hemen aşağısında, H üç K 27 trimetilasyon zenginleştirmesi ile işaretlenmiş bastırılmış intergenik boşluk bulunur, karşı kanatta bir H üç K 27 TRİMETİLASYON baskılanmış gen bulunur. Bir adım daha atıyoruz.
Susturulmuş kromatinimiz, belki de H üç K 27 trimetilasyon baskısından daha az geçici bir anlamda, SN TG iki ve MYT bir L'nin susturulmasını gösteriyor gibi görünen H üç K dokuz trimetilasyon zenginleştirmesinin varlığı ile gösterilmiştir. Bu bölge, histon modifikasyonlarının ChIPseek'inde karşılaşılan fenomenlerin çoğunu kapsar. BCP'nin dinamik doğasının hem punktat asetilasyonunu hem de H üç K dört trimetilasyon işaretini nasıl tanımlayabildiğini gösterirken, aynı zamanda H üç K 27 trimetilasyon ve H üç K dokuz trimetilasyon baskısının yanı sıra H üç K 36 trimetilasyon aktif transkripsiyonunun büyük bitişik adalarını ayırt eder.
Bu algoritma, okuma sayısına ve genom işaretleri sonucuna bağlı olarak yaklaşık 30 dakika içinde gerçekleştirilebilir. Bu prosedürü takiben, diğer yöntemlerde sıklıkla gerekli olduğu gibi herhangi bir önemli optimizasyon. Kromatin immünopresipitasyonunun birçok farklı hedef proteini, epigenomik mekanizmalar ve gen regülasyonu hakkında ek soruları yanıtlamak için DNA bağlanma transkripsiyon faktörlerinin yanı sıra çeşitli diğer hison modifikasyonları da dahil olmak üzere BBCP kullanılarak incelenebilir.
Bu videoyu izledikten sonra, çipli veri analizinde dağınık hison işaretlerine ulaşılan bölgeleri belirlemek için BCP'nin nasıl kullanıldığını iyi anlamış olmalısınız.
View the full transcript and gain access to thousands of scientific videos
Bu çalışma, kromatin immünoprecipitasyon sekanslama (ChIP-seq) verilerinin analizinin geliştirilmesine yardımcı olan bir Bayesyen Değişim Noktası (BCP) algoritması sunar. Gizli Markov Modellerini kullanarak, BCP etkili bir şekilde hem geniş hem de noktasal veri türlerinde histon zenginleşme bölgelerini tanımlar.