Genetics

Sıralı veri--dan toplu Maya 2-hibrid perde Bilişim Analizi

Published: June 28, 2018 doi: 10.3791/57802

Venkatramanan Krishnamani¹, Tabitha A. Peterson¹, Robert C. Piper¹, Mark A. Stamnes¹

¹Molecular Physiology and Biophysics, University of Iowa

Summary

Pozitif Maya 2-hibrid etkileşimleri için potansiyel olarak seçilen Maya nüfusun derin sıralama etkileşen ortak proteinler hakkında bilgi hazinesi verir. Burada, biz böyle ekranlar sıra verileri çözümlemek için özelleştirilmiş güncelleştirmek bilgisayar yazılımı ve belirli Biyoinformatik araçlarını işlemini açıklar.

Abstract

Aynı anda onlarca geçici ve statik protein etkileşimleri yüksek üretilen iş kısa okuma DNA sıralama kullanan tek bir ekran içinde ortaya çıkarmak için Maya 2-hibrid tahlil adapte olması. Elde edilen sıra veri kümeleri sadece olumlu Maya 2-hibrid etkileşimleri için seçimi sırasında zenginleştirilmiş hangi genlerin bir popülasyondaki izlemek ama ayrıca protein etkileşimi için yeterli ilgili alt etki alanları hakkında ayrıntılı bilgi verir. Burada, uzman olmayan tüm Biyoinformatik ve işlemek ve DNA dizisi fastq dosyaları toplu Maya 2-hibrid tahlil analiz istatistiksel adımları gerçekleştirmek izin tek başına yazılım programları tam bir süit açıklayın. Bu yazılım tarafından örtülü işlem adımları içerir: bir Maya 2-hibrid av kitaplıkta; kodlanmış her aday protein karşılık gelen 1) haritalama ve sayım sıra okuma 2) zenginleştirme profilleri değerlendirir bir istatistiksel analiz programı; ve 3) translasyonel çerçeve ve kodlayıcı bölge içinde konumunu ilgi etkileşen protein kodlayan her zenginleştirilmiş plazmid incelemek için araçlar.

Introduction

Protein etkileşimleri keşfetmek için bir yaklaşım hangi olağanüstü başarı bir protein ilgi etkileşen bir ortak¹bir parçası için bağlandığında büyümek Maya hücreleri mühendislik Maya 2-hibrid (Y2H) tahlil olduğunu. Birden çok Y2H etkileşimleri tespiti şimdi büyük paralel yüksek üretilen iş sıralama yardımı ile yapılabilir. Birkaç biçimi olmuştur nerede nüfus toplu üretmek plazmid içeren Maya için seçin koşullar altında yetiştirilen geliştirdiğimiz bir dahil olmak üzere²^,³^,⁴^,⁵ açıklanan bir pozitif Y2H etkileşim⁶. İş akışı geliştirilen, DEEPN (Protein ağları değerlendirme için dinamik zenginleştirme) olarak adlandırdığı, fark interactomes bir protein (veya etki alanı) vsile etkileşim proteinler tanımlamak için aynı av kitaplıklarındaki tanımlar. başka bir protein veya doğurmak farklı mutant etki alanı. Bu iş akışındaki temel adımlardan uygun işleme ve DNA sıralama veri analizi biridir. Bazı bilgiler sadece her gen için okuma önce ve sonra seçimi bir moda Y2H etkileşimlerin sayısını benzer bir RNA-seq deney sayarak panoda. Ancak, çok daha ayrıntılı bilgi Y2H etkileşim üretebilen bir verilen protein alt etki alanı hakkında bilgi de dahil olmak üzere bu veri kümeleri elde edilebilir. DEEPN yaklaşım değerli ise, buna ek olarak, birçok örnek çoğaltır analiz hantal ve pahalı olabilir. Bu sorun özellikle DEEPN veri kümeleri için geliştirilmiş istatistiksel bir modelini kullanarak çoğaltır sayısı sınırlı⁶nerede ortadan kalkar. İşleme ve analiz DNA sıralama veri kümeleri Biyoinformatik uzmanlık olmadan bu araştırmacılar için güvenilir, tam, sağlam ve erişilebilir yapmak için a maiyet-in tüm adımları analiz kapak yazılım programları geliştirdi.

Masaüstü bilgisayarlarda tek başına yazılım programları bu paketi MAPster, DEEPN ve Stat_Maker içerir. MAPster aşağı akım uygulamalarda kullanmak için bir standart .sam dosyası üreten her fastq dosya sıraya eşlemek için istimal HISAT2 programı⁷, genom sağlar bir grafik kullanıcı arayüzü var. DEEPN birkaç modülden oluşmaktadır. Bu atar ve belirli gen 'Gene say' modülü kullanılarak bir RNA-seq türü miktar için benzer karşılık gelen okur sayar. Ayrıca Gal4 transkripsiyon etki alanı ve av dizini arasında kavşak karşılık gelen dizileri ayıklar ve onların muayene karşılaştırmalı tablolar ve grafikler ('Junction_Make' modülü kullanılarak) izin vermek için bu kavşak konumunu harmanlar 'Blast_Query' modülü kolay muayene, Nefelometri ve kavşak Gal4 junction sıralarının karşılaştırma sağlar. Stat_Maker okuma başına gen zenginleştirme veri büyük olasılıkla Y2H sayısı öncelik istatistiksel bir yolu olarak değerlendirir. Burada, biz nasıl kullanma bunlar bilgisayar yazılımı bilgisayar programı ve DEEPN Y2H verilerden deneme DNA dizisi tam olarak çözümlemek için açıklar. DEEPN sürümleri PC, Mac ve Linux sistemleri çalıştırmak kullanılabilir. Eşleştirme programı MAPster gibi diğer programlar ve DEEPN istatistikler modülü Stat_Maker Unix altında çalışan ve yalnızca Mac ve linux sistemlerinde kullanılabilir alt yordamlar kullanır.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. eşleme Fastq dosyaları

Not: Başvuru DNA konumunda için DNA dizisi veri okumak her sıra onda eşlenmiş DEEPN bilgisayar yazılımı hem hem birçok Biyoinformatik programı kullanın. Haritalama programları çeşitli bu HISTAT2 programın sonraki adımda kullanılan .sam dosyaları üretmek için kullandığı MAPster arabirimi eklemek için kullanılabilir.

Sıralı veri genom doğru sürüme eşleyin. Y2H kitaplıkları için fare kökenli, UCSC mm10 genom kullanın; o insan genleri kullanarak, UCSC hg38 başvuru soykırım, Saccharomyces cerevisiae genler için kullanın, UCSC SacCer3 başvuru genom kullanın.
MAPster yükleyin.
1. MAPster yazılımını indirin ve yükleyin. Aşağıdaki, bir web tarayıcısı kullanarak yazılım bulunabilir: https://github.com/emptyewer/MAPster/releases. HISAT2 bir Apple Macintosh gibi UNIX tabanlı sistemlerde çalışır. Bu nedenle, MAPster program yalnızca Apple Macintosh ve linux gibi uyumlu sistemlerde çalışır.
  Not: Bir Apple Mac için sistem gereksinimleri şunlardır: OSX 10.10 +, > 4 Gb RAM, > 500 Gb disk alanı ve başvuru genleri indirmek için internet bağlantısı. Kullanıcılar kendi kurumsal yönetici haklarını ve izinlerini kısıtlayarak güvenlik protokolleri varsa bir kurumsal ile o kişinin danışmanız gerekebilir.
Gerekli dosyaları ve "Ana" sekmesini (Şekil 1) aracılığıyla parametreleri girin. Dosyaları girmek için uygun "Pairwise" düğmesini ya da gibi çiftleri ile FASTQ olarak varsayılan dosya biçimi unpaired seçin.
1. DEEPN analiz için tek okuma biçimde çalıştırmak için "Off" "Pairwise" seçeneğini kapatın.
2. Dosyaları sürükle ve bırak uygun pencere içine sadece tarafından MAPster yükleyin.
3. Bir referans Y2H av kitaplığı ekler kaynağına karşılık gelen DNA/genom kaynak'ı seçin. Birkaç model organizmalar üzerinden dizin oluşturulmuş genleri "Genom" kutusunda listelenir ve otomatik olarak merkezi Johns Hopkins Üniversitesi'nden-ebilmek var olmak downloaded için İşlemsel Biyoloji. Başvuru genleri daha sonra kullanmak üzere yerel olarak depolanır.
4. HISAT2 çekmek multi-iplik beri "Konu" kutusunun altındaki eşleme programa sadık olmak bilgisayar işlem sayısını gösterir. MAPster bilgisayarı arayın ve varsayılan olarak kullanılabilir olan işlemci en fazla sayısını öneririz.
5. Çıkış dosyası adı belirtin. Bu yüzden kısa ama açıklayıcı bir ad boşluk veya özel karakterler olmaksızın tavsiye bu dosya adı DEEPN süreci boyunca kullanılır. Çıkış "Açık çıktı dizin" düğmesini kullanarak eşlenen dosyaları için bir klasör belirtin.
6. Parametreleri ve uygun dosyaları seçtikten sonra eşleme iş "Eklemek için sıraya al" düğmesini kullanarak işleri sıraya ekleyin. Ana penceresinde dosya adları silinir ve yeni bir örneğe karşılık gelen dosyalarla değiştirilir ve onlar sıraya karşılık gelen bir çıktı dosya adı sağladıktan sonra eklenebilir.
7. Tüm işleri iş kuyruğuna girildikten sonra "Sıra çalıştırmak" düğmesini tıklatın.
  Not: bir kez bir eşleme iş sırasına yerleştirilir, bu işi seçmek "İş parametreleri" ve "İş komut" penceresinde görüntülenecek tüm bağımsız değişkenler komut satırı deyimiyle görüntülenecek parametre ayarlarını neden olur. Çıkış seçenekleri hizalamak için başarısız devam okuma olup olmadığını yönlendiren ve birincil hizalamaları her okuma için izin sayısını belirten içerir. MAPster varsayılan çıkış dosyasından (Örneğin bir '.sam' dosyası) SAM biçimindedir. Tüm sıra okuma fastq dosyalarından (eşleştirilmiş) olduğunu o da dahil olmak üzere bu örnek için belirtilen ve değildi içereceği (belirtilen geome başarıyla eşlenen eşlenmemiş).

2. Bioinformatic işleme kullanarak DEEPN yazılımı

Not: DEEPN yazılım şu anda fare cDNA dizileri, insan cDNA dizileri veya S. cerevisiae genomik DNA dizileri içeren av kütüphaneleri ile kullanım için derlenmektedir. DEEPN standart .sam dosya biçimlerini kabul eder ve her eşlenmeyen ve eşlenen okuma için hem eşlenmiş hem de eşlenmemiş okuma veya ayrı dosyalar içeren bir SAM (.sam) dosya kabul edebilir.

DEEPN yazılımını indirin ve yükleyin. Aşağıdaki, bir web tarayıcısı kullanarak yazılım bulunabilir: https://github.com/emptyewer/DEEPN/releases. Bilgi işlem platformu ve download hangi sürümü ile eşleşen seçin. Yüklemek için karşıdan yüklenen yükleme paketi açın.
Not: DEEPN sürümleri için PC, Mac ve Linux sysrems mevcuttur. Mac ve PC sistemleri olmalı > 500 Gb sabit disk alanı ve > 4 Gb RAM.
DEEPN yazılımını açın. Ana penceresinden (Şekil 2) karşılık gelen bir av kütüphane bilgi üst seçim kutusundan seçin. İşlem gören dosyaları "Çalışma klasörü" düğmesini ve gezinme ağıl/müdür için gidebilecekleri bir klasör seçin. Gerekirse yeni bir klasör/dizin oluşturabilirsiniz. Bir "çalışma klasörü" seçildikten sonra DEEPN unmapped_sam_files, mapped_sam_files ve sam_files adlı üç alt klasörler oluşturabilirsiniz.
1. Bu gibi hem eşlenmiş hem de eşlenmemiş okuma içeren .sam dosyaları kullanılarak üretilen MAPster programın varsayılan ayarlarla Eğer onları 'sam_files' klasörüne yerleştirin. Aksi takdirde .sam dosyalarını içine belgili tanımlık unmapped_sam_files ve mapped_sam_files buna göre yerleştirin.
İşleme "Gen sayısı + Kavşağı yapmak" düğmesini tıklatarak başlatın.
Not: İşlem eşleme pozisyonlar her gen için kaç defa okundu karşılık saymak için kullanacağı gen sayısı modülü ile başlayacak. Kavşak yapmak sonra kavşak dizileri ayıklamak (dizileri erimiş doğrudan aşağı akım Gal4-harekete geçirmek etki alanından) üzerinden okuma ve patlama algoritmasıyla tanımak. Bu, Şekil 3' te resimde klasörlerin tam bir set oluşturur. İşlem zamanı büyüklüğüne ve sıralı veri dosyası sayısı ve kullanılan bilgisayarın işlem hızından bağlıdır. 12 – 30 h ~ 250 milyon deneysel veri kümesinin aralığından tipik kez okur. Gen sayısı yordam ve Junction_Make yordam tek tek "Gen sayısı" ya da "Kavşağı yapmak" düğmesini tıklatarak başlatılabilir.
Karşıdan yükleyip Stat_Maker (https://github.com/emptyewer/DEEPN/releases). Bu bir istatistiksel analiz paketi şu anda yalnızca UNIX Mac sistemlerinde çalışır DEEPN veri kümeleri için dizayn edilmiştir.
1. Stat_Maker açın ve tıkırtı belgili tanımlık düğme "Doğrulamak yüklemeyi" (Şekil 4). İlk kez çalıştırıyorsanız, Stat_Maker otomatik olarak R, KEŞLER ve Bioconductor internetten bu kaynakları çekerek yükler. Kez R, KEŞLER ve Bioconductor algılandı, Stat_Maker aktif hale gelir ve daha fazla kullanıcı girişi sağlar.
2. DEEPN işlenen çalışma klasöre gitmek için "Klasörünü Seç" düğmesini tıklatın. Stat_Maker otomatik olarak bulmak ve penceredeki istatistiksel analiz için dosyaları listelemek.
3. Uygun dosyaları dosya listesi penceresinden dosya windows altında her vektör ve yem veri kümesi için ve her büyüme koşulları için sürükleyip bırakamazsınız: seçili olmayan (onun + medya) ve (onun - medya) seçili. Önemlisi, Stat_Maker boş için yinelenen veri kümelerini tek başına, seçili olmayan nüfusun iki örnek vektör ve iki örnekleri seçili gerektirir. Bu tahmini değişkenlik deneme içinde verir.
4. "Çalıştır" düğmesini tıklatın. Bilgisayarın hızına bağlı olarak, hesaplama 5-15 dakika arasında sürer.
Etiketli "Stat_Maker sonuçlar" ana çalışma klasörü içinde yeni bir alt klasör yerleştirildiği Stat_Maker çıktı sonuçları gözden geçirin.
Not: Sonuçları ortak elektronik tablo programları açılabilir bir CSV (virgülle ayrılmış değerler) dosyasında bulunur. Stat_Maker differentially faiz ile yem seçimi boş pTEF-GBD (Şekil 5) zenginleştirilmiş muhtemeldir gen sayısı rütbe olacak. Ayrıca tablo her veri kümesi için okuma yüzdesi gen ekleme, veya açık okuma çerçevesi ve olsun gene de doğru translasyonel okuma çerçevesi içinde bulunan içinde ters yönde, bulunursa nerede. Çoğu zaman, DEEPN bir yem sağlam Y2H etkileşimleri ile ilgili protein uygun okuma çerçevesi dışında veya bir karşılık gelen onun açık okuma çerçevesi aşağı akım cDNA parçasıdır verilen cDNA bölümlerini yakalayacaktır. Stat_Maker birleştirilmiş çıktısı tarama algılama ve bu alakasız sayısı ortadan kaldırılması basitleştirir.
Her potansiyel aday üzerinde verileri gözden geçirmek için açık DEEPN bilgisayar yazılımı, karşılık gelen av kütüphane bilgi ve sonra "Çalışma klasörü" kullanarak doğru çalışma klasörü seçin.
1. "Patlama" sorgu"düğmesini tıklatın. Bu yeni pencere (Şekil 6) yükler. Üst metin kutusuna gen adını veya aday gen ilgi seçmek için GenBank NM numarasını yazın. Bu gen adları StatMaker çıktı dosyasında listelenen adlarına karşılık gelir. Türü enter veya return, hangi ilgi gen alınmasını başlatır.
2. Hangi veri kümeleri "Veri kümesi seçin" menüleri kullanarak çözümleme için kullanılacak seçin. Genellikle, bunlar sadece vektör içerir ve selektif olmayan koşullar altında yetiştirilen örnekleri ve seçimi koşullar altında yetiştirilen yem örnek yem. Başlangıçta, veri kümelerini yüklemek için bir kaç saniye sürecek, ancak, aynı veri kümeleri farklı genler ile sonraki sorgu hızla gidecek. Blast_Query ilgi ve nasıl bol miktarda her erime noktası sıra boyunca füzyon noktaları görüntüler. Bu hem "Sonuçlar" sekmesini kullanarak tablo biçiminde veya bir grafik biçiminde "Komplo" sekmesini kullanarak görüntülenebilir. Bu sonuçlar bir .csv dosyasına sağ üst köşesinde ".csv Kaydet" düğmesini tıklatarak dışa aktarılabilir.

3. DEEPN tarafından belirlenen adaylar doğrulanması

Not: DEEPN ve Stat_Maker amacı bir pozitif Y2H etkileşim vermek aday genler belirlemektir. Böyle Y2H etkileşimleri doğrulama de bitmiş yem plazmid ilgi kullanarak geleneksel ikili Y2H biçimini kullanarak boş Gal4-harekete geçirmek etki alanı 'av' plazmid ile eşleştirilmiş olarak faiz gen/cDNA parçası taşıyan av plazmid ile eşleştirilmiş. Gerçek plazmid DNA Y2H Seçime tabi Maya popülasyondan izole karışımı içinde ilgi izole etmek mümkün değildir. Ancak, bir hesaplama açısından ne o Y2H etkileşim üretiyor gen/cDNA parçası olan yeniden yapılandırma, astar 5' ve 3' ucunda bu parça için tasarım ve o parça Maya popülasyondan izole DNA yükseltmek. Bu bölüm 5' ve 3' sonunda aday av parçasının bulmak açıklar.

DEEPN yazılımını açın ve parametreleri "Select Parameter" ve "İş projeye karşılık gelen klasör seç" çalışma klasörü seçin. Blast_Query modülü "Patlama" sorgu"düğmesini tıklatarak başlatın.
Faiz veya onun GenBank "NM" gen adını yazın en iyi metin kutusuna numara. Aşağı açılır menüden birleşme pozisyonları 'Sonuç' sekmesinin altındaki tablo almak için seçilen Maya popülasyon için yem ilgi için karşılık gelen veri kümesini seçin. Varsayılan olarak, veritabanı içinde bulunan kavşak sayısı ppm tarafından sayısal veri kümesi, onların bereket göre farklı pozisyonlar Blast_Query sipariş edecek.
1. En bol pozisyon bulmak "ORF içinde" ve "çerçevesinde". Pozisyon için değer üst metin kutusunda bulunan nükleotit konumunu gen NCBI başvuru sırası ('NM' numarası) ile karşılık gelir. Bu sıra GenBank (https://www.ncbi.nlm.nih.gov/nuccore/) alınan veya Blast_Query pencerenin alt metin kutusuna kopyalanır.
  Not: Bir örnek Şekil 6' da, orta masası bulunur. Merkezi veri kümesinde 'Sonuç' en bol kavşak göster: 'Konum': 867; '#Junctions': 20033.821; 'Sorgu Başlat', 1; CD: ORF; ve 'Çerçeve': çerçeve içinde. Nükleotit 867 GenBank NCBI başvuru sırası NM_019648 av parçası başlıyor.
Sorguyu başlatın 1 ise, 5' ucuna pozisyon numarasına karşılık gelen nükleotit dahil etmek için astar tasarım ve o konumdan (Şekil 7) 25 nükleotit aşağı genişletme. Sorguyu başlatın 1 den fazla ise, Gal4 harekete geçirmek etki alanı ve faiz av dizisi arasındaki fazladan nükleotid vardır ve astar aşağı sorguyu başlatın değerine göre daha başlaması gerektiğini gösterir.
DEEPN penceresinden "Verileri çözümleme" altında "Okuma derinlik" düğmesini tıklatın. Okuma derinlik penceresi açıldıktan sonra NCBI başvuru sırası (NM) numarası veya gen adı üst metin kutusuna yazın. İlgi zenginleştirilmiş gen içeren ilgili veri kümesi seçmek için açılan menüyü kullanın. Soldaki tablo kullanın ve kaç defa okundu faiz (Şekil 7B) gen için karşılık gelen veri bulunamadı belirlemek için sağdaki grafik görüntüler.
Okuma derinlik tarafından hesaplanan gen parça dizisi ele geçirecek bir 3' son astar tasarım. Okuma zenginliği ORF giderse ve dur kodonu, o katmak kodonu ve sadece akıntıya karşı bölgenin kodonu astar tasarlayın. Gen dizileri için kodonu genişlemediğine sonuçları tablo tespit edilebilir ve bu pozisyon en uzak 3' kullanabileceğiniz en uzak 3' bölgesini bulmak için kullanırsanız, astar yerleştirmek için konumu.
Not: Okuma derinlik program belirtilen gen/cDNA ilgi maç dizileri bulamadı aralıklarla tarar. Bu en bol av parçası 5' ve 3' sonu o gen örnek için nerede tahmin yardımcı olur. Şekil 7' de görüldüğü gibi dizinin uzunluğunu okuma derinliğine dalgalanmaları normaldir. Okuma derinlik açıkça kodonu ise, av parçası kodonu genişletir ve böylece 3' astar sadece kodonu çevresindeki karşılık gelebilir gösterir.
Gen başına 50 µL PCR reaksiyonu gerçekleştirmek. Her reaksiyon 25 pmol av-Kütüphane plazmid eşleşen her ileriye ve geriye doğru astar içerir (bkz. tablo malzeme). Reaksiyonlar da yüksek-sadakat 2 x PCR Master Mix 25 µL, DNA örneği ve 50 µL kadar su 5 µg içerir.
1. Tavlama sıcaklığı 55 ° C 30 72 ° C'de 3 dk. uzantılı kez 25 döngüleri için tepkiler yükseltmek s ve 10 98 ° C'de denaturing 98 ° C'de 30 s denatürasyon tarafından Bisiklete binme Precede s. ve 72 ° C'de 5 dk kuluçka ile takip edin

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Fastq veri eşleme: ilk adım
DEEPN ilk çıkış, hizalama için genomik tarafından eşlenmelidir kısa sıra okuma bir dosyadır dahil olmak üzere hemen hemen tüm NGS uygulamalarda transcriptomic veya diğer referans DNA⁸. Son zamanlarda, HISAT2 hizalama program eşleme hız⁷^,⁹önemli ölçüde artırmak için state-of--art dizin oluşturma algoritmaları kullanan geliştirilmiştir. HISAT2 verimli bir masaüstü bilgisayarda çalışır ve genellikle ölçekli harita dakika içinde dosyayı okuyabilir. Bu bize HISAT2 fastq dosyaları yerel olarak eşleyebilirsiniz MAPster adında bir grafik kullanıcı arabirimi kaydırmak kullanıcılar genellikle komut satırı dili (Şekil 1) ile faaliyet uzaktan yüksek performanslı bilgisayar kümeleri güvenerek önlemek için izin izin. Ve tüm genom eşleme deneyler, birden çok iş sıraya ve kolayca ayarlanabilir HISAT2 parametreleri ve uzman kullanıcılar için tam bir dizi erişim yeteneği özelleştirilmiş MAPster önemli özellikleri önceden ayarlanmış parametre varlığı RNA-seq için içerir. uygulamaları. MAPster'ın işlevselliği göstermek için bir yayım kullanılabilir eHAP hücre RNA-seq veri dosyası Ensemble GRChg38 genom artı transkript başvuru DNA eşlendi. EHAP A11 REPLICATE 1 FASTQ dosya NCBI sıra okuma arşivden indirilen ve içerdiği 38.3 milyon defa okundu. MAPster bir Apple iMac unpaired okunur dosyanın RNA-seq parametrelerini varsayılan kullanarak bir 3,5 GHz Intel Core i7 işlemci ile çalıştırmak oldu. Eşleme az beş dakika içinde tamamlandı. Genel hizalama oranı % 96.6 oldu. Genel hizalama oranı Y2H av plazmid serisinden vektör varlığı nedeniyle daha düşük olmasına rağmen 15-25 milyon okuma/örnek, tipik DEEPN veri ile benzer sonuçlar bulunur.

Aday sayısı Stat_Maker yardımıyla bulma.
StatMaker programı aday etkileşen proteinler tanımlamak için gereken gerekli bilgilerin çoğunu özetleyen excel görüntülenebilir bir dosya oluşturur. Çünkü Stat_Maker kullanın UNIX tabanlı alt yordamlar o-ecek koşmak üstünde a yağmurluk (OS10.10 +) PC ama değil. İlk olarak, o faiz yemi ile Y2H etkileşim için seçili olduğunda belirli bir gen zenginleştirme gerçekten daha büyük olup sıralaması bir olasılık için hem vektör kontrolü ve yem nüfus hem üretir her gen için ppm içinde okuma özetler Sadece vektör kontrolü (Şekil 5) ile etkileşim için seçili olduğunda o gen zenginleştirme. İkinci olarak, StatMaker değerlendirildi her gen BlastQuery modülü hesaplamaları gerçekleştirir ve doğru translasyonel çerçeve ve bir bonafide biyolojik ilgili gerekli olacaktır kodlama dizisi kavşak okuma yüzdesi tabulates etkileşen. Bu Birleşik çıkış adaylara bu o daha yakın BlastQuery tarafından kontrol tanımlamak için hızlı bir şekilde sıralama ve süzme sağlar. Bu çıktı ile bir ilk Bu adaylar ile ilgi ve vektör plazmid yalnız üzerinde etkileşim için seçilen değil yem protein Y2H etkileşim için seçimi sırasında zenginleştirilmiş en yüksek probabily için sıralayabilirsiniz. Uygulamada, biz bulmak bu P > 0.95 çalışır. Sonra adaylar Kodlayıcı bölge ve basit bir sıralama işlevini kullanarak uygun okuma çerçevesi vardır çoğu kavşak okuma sahip olanlar için sırada yer. Burada, adaylar ile > Bu doğru translasyonel çerçeve ve çerçeve/protein bölgede (ORF) kodlama okuma açık içinde ikisinden biri bulunur veya sadece başlayan kavşak % 85'i ters yönde (yukarı) başlama kodonu ile. Bu ikinci filtre adayların biyolojik olarak çok daha uygun ve daha fazla kontrol için yönetilebilir bir liste üreten kabul edilebilir bir P değeri % 60-80 ortadan kaldırır.

DEEPN yazılım.
Çekirdek DEEPN yazılım birkaç hesaplama modülü SAM dosyaları kullanan tüm Biyoinformatik adımları birlikte entegre demetleri. Gene_Count gene, başına okuma sayısı bir RNA-seq Nefelometri için benzer bir hesaplama gerçekleştirmek sağlar. Bu hesaplamanın türünü gerçekleştiren diğer programlar de kullanılabilir, ancak, dosya biçimi diğer DEEPN modüller ve Stat_Maker programı ile uyumlu olacak şekilde değiştirilmesi gerekir. Alternatif olarak, Gene_Count modülü RNAseq deneyler ölçmek için kullanılabilir, ancak, diğer paketleri belirli istatistik programları ile entegre Gelişmiş¹⁰olmuştur. Belirli bir eşlenen okumak onun karşılık gelen gen ilgi ile eşleştirme işlemi gen atama için veri ağaç yapısı kullanarak beri ilk DEEPN yazılım geliştirilmiştir. Bunun etkisi büyük ölçüde öyle ki 10 milyon içeren tipik bir DataSet'e okur eşlenen işleme hızını hızlandırmak için 5-10 dk en az sistem gereksinimleri ile masaüstü bilgisayar alır oldu. Özellikle Gal4-harekete geçirmek etki alanı kapsayan kavşak okuma Analizi ve ilgi etkileşen aday diğer analizleri kendi kendine yeten. Onlar yerel olarak çalışır patlama alogorithm ile paketlenir ve doğru tüm kavşak okur harmanlamak için yordamlar ve konumlarını belirli genler için ayrıştırma. Öyle yapar hangi ekzonlar başvuru genleri içinde cDNAs veya Kodlayıcı bölgeler tanımlamak için kullanılan tanımlayan özel biçimlendirilmiş veritabanları kullanmak ve sıra ve çevirim başlangıç ve durur belirtin veritabanları biçimlendirilmiş DEEPN yazılım dezavantajları biridir Her cDNA/genler kullanılır. Bazı belirli genler dizin oluşturma ile karşılaştı sahte hatalar yoksun güvenilir bir biçimde DEEPN gerektirir tüm veritabanı bilgilerini almak zor olduğunu ortaya koymuştur. Böylece, biz kalite kontrol ve onları tutarlı iç başvuru DEEPN yazılımı içine gömülü yeni veritabanları monte. Şu anda, DNA fastq dosyaları mm10, hg38 veya SacCer3 referans UCSC kullanılabilir veritabanlarının karşı eşlenmiş olması koşuluyla fare, insan ve S. cerevisiae Y2H av kitaplıkları dahil veritabanlarının tarafından desteklenir. Benzer veritabanları inşa ve DEEPN yazılım yerleştirilen koşuluyla farklı organizmalar kitaplıklardan Y2H DEEPN tarafından işlenebilir. Genel olarak, ancak, kendi kendine yeten ambalaj tüm DEEPN modülleri, veritabanları ve diğer programlar yapmak bu bioinformatic analizleri müfettişler, tüm uzmanlık düzeylerindeki için erişilebilir.

Resim 1 : MAPster arabirimi. MAPster ana penceresinin ekran görüntüsü. Gerekli dosyalar ve biçimleri girmek için kutuları gösterilir. "Pairwise"(a)tek taraflı kenar okur gibi tedavi sırası dosyalarını devre dışı bırakın. Başvuru genom 'Genom' menü ile seçilir (B) bar. HISAT2 tarafından kullanılan işlemci sayısını "Konu" menüsü ile (C) seçilir. Yeni örnek adı "Çıkış dosya adı" metin penceresine (D) yazılabilir. Çıktı dosyaları için dizini (E) belirlenebilir. Aşağıda tek taraflı kenar kuyruk gösteren bir penceresi dosyaları okunur. Örnek sıraya eklendikten sonra eşleme "Sıra çalıştırmak" düğmesini (F) ile başlatılabilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Resim 2 : DEEPN arabirimi. Resim DEEPN modülleri çalıştırmak için kullanılan grafik kullanıcı arabirimi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 3 : İşleme tamamlanması. Bir kez DEEPN verileri işleyen, aşağıdaki alt klasörleri oluşturulur. Bunlar kontrol, ama aşağı akım işlemlerini bu alt klasörler ana çalışma klasörü içinde kalır ve onlar kendi içeriği ve adları korumak gerekir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 4 : Stat_Maker analiz. Grafik Kullanıcı arayüzü ile işlenmesini sağlamak için uygun dosyaları yüklü Stat_Maker için resmi. Üst Stat_Maker ilk görünümünü gösterir. GUI temel destek veri varlığı doğrulandıktan sonra "Doğrulamak yüklemeyi" düğmesi ve "Klasörünü Seç" düğmesine tıkladıktan sonra tespit düzgün bir iş klasörü tıklatarak, dosyaları yüklemek için izin veren aktif, olacaksınız. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 5 : Alıntı Stat_Maker çıktı. Zenginleştirme adayların yalnız (boş pTEF-GBD) vektör için av bir tek yem protein üzerinde karşılaştırma Stat_Maker çıkış kısmı. Ayrıca ister av aday için karşılık gelen plazmid uygun açık okuma çerçevesi içeren ilgili analiz gösterilir. Her gen değerlendirilen çeşitli değerler vardır: temel, Vec, yem ve Enr. 'Base' ortalama oranıdır bu gözlendi okur (ppm) için yinelenen nüfus karşılık gelen 2 veri kümeleri içinde gen içeren yalnızca vektör yalnız ve selektif olmayan koşullar altında yetiştirilen. "Vec" anlamına gelir ortalama oran bu gözlendi okur (ppm) için yinelenen nüfus karşılık gelen 2 veri kümeleri içinde gen içeren yalnızca vektör yalnız ve seçici koşullar altında yetiştirilen (Örneğin-onun). 'Yem' gen yem plazmid içeren 2 Nüfus karşılık gelen 2 veri kümeleri içinde gözlenen ve seçici koşullar altında yetiştirilen okuma (ppm) oranı anlamına gelir (Örneğin-onun). "Enr" (enrichement) olduğunu log2 ((Bs/Bn) / (Vs/Vn)) nerede Bs's yem seçimi için okuma, Bn yem seçimi sigara için okuma, Vs olduğunu vektör altında seçime tek başına ise Vn vektör altında seçime tek başına. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 6 : Blast_Query ekran. 3 farklı görünümlerden Blast_Query çıktı. Aday veri kümeleri seçmeden önce üst Stat_Maker ilk görülmektedir. Orta masası iki farklı veri kümeleri için verilen bir aday üzerinde bilgileri görüntüleyen veri tablosu bir örnek görülmektedir. Alt gen/cDNA boyunca ilgi belirli kavşak sayısı komplo sekmeli veri grafik bir görünümünü gösterir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 7 : Yükseltmek için 5' ve 3' astar bulma. Varsayımsal bir sıra ve nasıl doğru çerçeve ve füzyon yakalamak için 5' oligo tasarım Gal4-harekete geçirmek etki alanı ve faiz av sıralaması arasında gelin(a)gösterir. Örnek 1'de, 10^th nükleotid 1 Q başlangıcı ile füzyon noktasının konumunu altındadır. Yukarıdaki kullanarak tablo, 0 nükleotit vardır 5' başlamak astar konumunu bulmak için eklenecek. Yeniden oluşturulan av plazmid erime noktası Gal4 harekete geçirmek etki alanı doğrudan nükleotit 10, av için erimiş gösterir. Örnek 2'de, sorguyu başlatın 3, hangi 1 nükleotid bir uzaklığı doğru başlangıç noktası ve av Ekle çerçeve yakalamak için gerektirmesidir. Yeniden oluşturulan av şematik Gal4 harekete geçirmek etki alanı için muhasebesi gerekir av ucun bilinen pozisyonu arasında 2 nükleotit gösterilir. (B) okuma derinlik pencerede gösterilir. Üst metin kutusu NCBI başvuru sıra numarası girmek için kullanılır ve açılan menüden 'Select .sam dosyası' altında zenginleştirilmiş etkileşen gen içeren örnek için veri seçmek için kullanılır faiz. Okuma derinliği kaç dizileri (Y ekseni) faiz (x ekseni) dizisi nükleotit konumlarına karşılık gelen veri bulunamadı gösterir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Burada açıklanan yazılım paketi bir tamamen işlemek ve DEEPN deney yüksek işlem hacmi DNA sıralama verileri çözümlemek izin verir. Kullanılan ilk DNA dizisi okuma standart fastq dosyalarında alır ve konumlarını DEEPN yazılım da dahil olmak üzere bilişim programları bir bütün ana tarafından aşağı akım işleme için bir referans DNA üzerine haritalar MAPster bir programdır. Belgili tanımlık yarar MAPster arabirimi ve birden çok iş birleştirmek giriş dosyaları, sıraya yeteneğini coveniently adı çıktı dosyaları, program⁷ denetlediği çeşitli için bir kolay kullanımlı aracı eşleme sağlar temel HISAT2 hızı ile birleştiğinde DEEPN dışındaki uygulamaların. MAPster veri analizi DEEPN yanı sıra diğer türleri için uygun çeşitli parametreler HISAT2 programının erişebilirsiniz. Bu özelliklerin bazılarına RNA-seq ve tüm genom eşleme deneyler için hazır ayar parametreleri içerir ve kolayca ayarlanabilir HISAT2 parametreleri ve uzman kullanıcılar için özelleştirilmiş uygulamalar için tam bir set erişimi. Örneğin, RNA-seq düğmesi transkript derleme kolaylaştıran biçimlendirme ekler. CRISPR düğme blok hizalama geriye doğru tamamlayıcı strand için Kılavuzu RNA dizileri türetilmiş bir başvuru DNA dosya için uygun olacaktır. İsteğe bağlı parametreler etiketli, altında dört sekme "Giriş, hizalama, Puanlama ve çıktı" bulunur. Giriş seçenekleri giriş dosyası biçimlerini değiştirmek için ve temel okuma Düzeltme seçeneklerini belirtmek için içerir. Hizalama ve skor sekmeleri tek bir başvuru DNA iplikçiğe seçin ve hizalama puanları bir boşluk ve uyuşmazlığı cezaları ayarlamak için seçenekler içerir. Elverişli bir konuma sahip her biri farklı parametre ayarı karmaşık NGS uygulamalar takip hem uzman ve uzman olmayan kullanıcılara MAPster ilgi yapmalıdır birden çok eşleme işi sıraya yeteneği.

DEEPN ve Stat_Maker yazılım programları verilerin belirli Biyoinformatik analizi için toplu Y2H ekranlarından adanmıştır. Bu müfettişler geniş bir erişilebilir ve bir grafik kullanıcı arabirimi aracılığıyla çalıştırmak bir bitişik bioinformatic yazılım paketi kabul ettiğiniz anlamına gelir. Bu paket daha fazla en iyi duruma getirilmiş ve onun orijinal açıklama⁶ daha hızlı çalışır ve aday sayısı analizini aerodinamik entegre. Biyoinformatik adımları masaüstü bir bilgisayarda çalıştırabilirsiniz. Bunlar kaç okur hesaplamak için pozisyonlar göster ana DEEPN yazılım alır böylece için belirli bir gen seçimi nasıl zenginleştirilmiş temel oluşturan her gen karşılık gelir. Bu yazılım aynı zamanda 'Kavşağı' olarak av plazmid transkripsiyon harekete geçirmek etki alanı için erimiş ve böylece bir belirli bir ORF tüm farklı bölümlerini görselleştirebilirsiniz bu sonuçlar tabulates faiz Ekle seçeneğine karşılık sıraları bulur. veya etkileşim için yeterli cDNA. Buna ek olarak, bu da okuma çerçevesi her ucun doğrulamak için bilgi sağlar. DEEPN tarafından işlenen çıkış dosyalarının gene enrichments verilen yem protein Gal4 DNA'ya bağlanıcı etki alanı vektör yalnız (vs ile etkileşimleri kaynaklanan istatistik alaka kullanır Stat_Maker bioinformatic yazılımının üçüncü koludur boş pTEF-GBD). Stat_Maker her aday istatistiksel bir sıralama sağlar, ancak Ayrıca karşılık gelen bağlantı dizileri çıkarılan ilgili bilgilere çok daha kolay hale bir tek dosyada kullanılabilir hale tabulates ki son bir gelişmedir anket ve sonuçları gözden geçirmek müfettişler için.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar ifşa yoktur

Acknowledgments

Bu eser Ulusal Sağlık Enstitüleri tarafından desteklenmiştir: NIH R21 EB021870-01A1 ve NSF araştırma projesi hibe: 1517110.

Materials

Name	Company	Catalog Number	Comments
Mapster			https://github.com/emptyewer/MAPster/releases
DEEPN software			https://github.com/emptyewer/DEEPN/releases
Statmaker			https://github.com/emptyewer/DEEPN/releases
Minimum computer system	Apple		Mac Intel Core i5 or better
	-		4 Gb RAM or better
	-		500 Gb Disk spce or better
	-		OS 10.10 or higher
	Dell		Intel i5-7400 or better
	-		4 Gb RAM or better
	-		500 Gb Disk spce or better
	-		Windows 7 or higher

DOWNLOAD MATERIALS LIST

References

Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Genetics

Sıralı veri--dan toplu Maya 2-hibrid perde Bilişim Analizi

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.