$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Yukarıda açıklanan iş akışı bir MS veri kümesi üzerinde gurur depo38,39kullanılabilir uygulandı. Özgün çalışma kararlı izotop amino asit hücre kültürü (SILAC) etiketleme kullanarak bir yöntem (iMixPro), geliştirilen, yanlış mutlak--dan benzeşme arıtma Bayan ortadan kaldırmak için (AP-MS)38deneyler. Kısacası, AP-MS deney faiz (yem) ve onun interactors (avlar) bir protein almak için boncuk bağlı antikorları kullanarak oluşur. Toplanan proteinler sonra sindirmek ve MS için hazırlanmış. Örnek hazırlama yöntemi ve enstrüman ayarlarını özgün çalışma ve gurur depo (PXD004246) açıklanmıştır. Özellikle boncuk ama değil yem için bağlayıcı proteinler üzerinden yanlış mutlak bolluk böyle deneylerde bir mücadeledir. Burada, biz SILAC farklı izotop oranları gerçek avlar ve yanlış pozitif durumlar arasında oluşturmak için kullanılan: ışık orta, hafif orta kültürlü yem ifade 1 örnek ve ağır ortamda kültürlü yem ifade 1 örnek kültürlü 3 kontrol örnekleri (yem) vardır boncuk ve daha fazla kütle spektrometresi analiz ile işlenir. Böyle tasarım ile non-spesifik proteinler boncuk için bağlayıcı bir ağır ışık oranı 1:4 olacak; Ne zaman gerçek dualarının 11:3838oranında olacak.
Yeniden OpenProt veritabanı kullanarak onların AP-MS verileri analiz; Yemler üç endojen proteinleri (PTPN14, JIP3 ve IQGAP1) dahil ve iki aşırı protein (RAF1 ve RNF41) ifade. Deneyler SILAC kullanılan bu yana, Galaxy iş akışı protein miktar için kullanılan (Ek malzeme S3, Şekil 2). İş akışı tüm OpenProt veritabanı (OpenProt_all) ya da sınırlı bir OpenProt veritabanı (OpenProt_2pep, daha önce en az iki benzersiz peptidler ile tespit proteinler de dahil olmak üzere) kullanarak çalıştırıldı.
Protein tanımlama ve miktar farklı kullanılan veritabanları arasında iyi ve tekrarlanabilir. Şekil 3' te gösterildiği gibi orijinal kağıt tespit çoğu proteinler de (ayrıntılı bir liste Ek malzeme S5kullanılabilir) OpenProt_2pep veya OpenProt_all veritabanı kullanarak tespit edilmiştir. Bu sonuç, burada açıklanan boru hattı ve veritabanları protein tanımlama ve miktar geçerli yordamlar üzerinde40UniProtKB veritabanları dayalı karşılaştırılabilir üretmek mümkün OpenProt gösterir. Ancak, OpenProt veritabanlarının kullanımını çalışma, roman ve önceden belirlenemeyen proteinler, bu durumda gösterildiği sağlayan benzersiz avantajı vardır.
11 iyi desteklenen proteinler (1 izoformu ve 10 AltProts), ama şu anda değil, ek açıklama eklenen veritabanları, kendine güvenen peptidler, OpenProt_2pep veritabanı (tüm protein katılımların, destekleyen numarasıyla birlikte kullanarak ile tüm veri kümeleri arasında tespit edilmiştir peptidler, Takıma giren malzeme S5kullanılabilir). Bu veritabanı sağlar geleneksel bir %1 FDR arama alanı artış olarak orta kalır. Yok onlar gibi 11 bu proteinler orijinal çalışmada tespit edilmiştir değil veritabanından.
29 roman proteinler (16 izoformlarının ve 13 AltProts) ile kendine güvenen peptidler, OpenProt_all veritabanı kullanarak tüm veri kümeleri arasında keşfedildi (numarasıyla birlikte tüm protein katılımların peptidler destekleme, are elde edilebilir içinde takıma giren malzeme S6 ). Saptanan proteinler toplam sayısını azaltmak, ancak önerilen sıkı FDR şekil 3' te gösterildiği gibi kendine en çok güvenen protein kimliklerinin etkilemedi. Nispeten OpenProt_2pep veritabanı için daha yüksek bir sayı roman proteinlerin güvenle tespit edilebilir. Tüm bu roman proteinler yok OpenProt_2pep veritabanından. Seçilen veritabanı için MS tabanlı proteomik çok önemli rolü vurgulamaktadır.
Bir roman protein RAF1 protein (IP_637643) bir etkileşen keşfedilmiştir. OpenProt Web sitesini kullanarak, bir bu proteinin değil tespit edilmiştir MS ne de ribozom şimdiye kadar profil oluşturma tarafından görebilirsiniz (OpenProt v1.3). Protein 46 amino asit uzunluğunda ve sadece tryptic sindirim üzerine iki benzersiz peptidler verebilirsiniz. Tespit peptid RAF1 AP-MS içinde veri kümesi (kesir 18), şekil 4' te gösterildiği gibi kaliteli spektrum vardı ve 1,09 ağır ışık oranında görüntülenir. Protein NANOGNBpseudogene olan NANOGNBP1 gen içinde kodlanır. Şu anda kodlamayan olarak, açıklamalı transkript (ENST00000448444), GTEx portal40göre çeşitli dokular arasında tespit edildi. Protein DNA bağlama (gen Ontoloji GO: 0003677)41ile ilişkili bir tahmin işlev etki alanı içerir.

Resim 1 : Veritabanı proteomik analizleri grafik için seçim. Analizleri MS verilerin, özellikle veritabanı seçim, araştırma hedefler üzerinde bağlıdır. Üç ortak hedef mavi (Klasik proteomik boru hattı), yeşil (ayrıntılı proteomik arama) ve turuncu (Proteomik keşif) özetlenmiştir. Her amaç bir uygun veritabanı ve boru hattı bağlıdır. Bir tek tanımlama aracı bir ayrıntılı ve klasik proteomik için kullanılabilir boru hatları. Proteomik keşif boru hattı için birden çok kimlik motorlarını kullanarak önerilir. Önerilen FDRs kırmızı ile gösterilen ve protein veritabanı boyutu gri kutularında gösterilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Resim 2 : Kullanılan Galaxy iş akışı grafik olarak gösterilmesi. Re-analiz Eyckerman ve ark. veri38için kullanılan proteomik analiz iş akışı adım adım gösterimi. Giriş dosyaları, peptid arama ve protein miktar portakal kutuları ile gösterilen. Mavi kutu kullanılan araçlar için karşılık gelen ve gri kutular oluşturulan çıktı dosyalarına karşılık gelen. Farklı arama motorları (MS-GF + ve X! Tandem) farklı renkler (sırasıyla kırmızı ve mor) yanı sıra onların gerekli girişleri ve çıkışları gösteren oklar gösterilir. Yeşil kutu protein kimliklerinin bir listesini oluşturma araçlarına vurgulamaktadır. Birden çok çıkış oluşturulduğunda, bir aşağı akım adımlar için kullanılan en yakın belirtilir okun. Bu iş akışı Ek malzeme S2içinde serbestçe kullanılabilir. X! Tandem varsayılan parametrelerini yapılandırma dosyası Ek malzeme S4içinde kullanılabilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 3 : İnteractor kimlik farklı veritabanları kullanarak yem başına karşılaştırılması. Kendine en çok güvenen OpenProt kullanarak protein tanımlamaları, Venn diyagramları veritabanı (en az 2 benzersiz peptidler, OpenProt_2pep kanıtı destek turuncu,) % 1'ile FDR veya tüm OpenProt veritabanında (mavi, OpenProt_all) ile % 0.001 FDR, veya rapor olarak Özgün gazetede (gri)38. Her diyagram karşılık gelen belirtilen yem için tanımlanan interactors: RAF1, RNF41, PTPN14, JIP3 ve IQGAP1. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Şekil 4 : MS/MS spektrum tanımlanan MDNLWAK(13C 6) roman protein IP_637643 peptid. Yoğunluk (0-0) görecelidir. Seçili tepeler yeşil koyu kırmızı ve b iyonları açıklamaları y iyonları ek açıklamalar bulunmaktadır kırmızıyla gösterilir. TOPPview yazılım34ayıklanır. Öncü hata = 2.70 ppm, PEP puanı 0.12 =. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.
| Dönem | Tanımı | Başvuru |
| Alternatif ORF (AltORF) | kanonik olmayan ORF, ama şu anda değil genom ek açıklamalar, açıklamalı OpenProt içinde açıklamalı. | 15 |
| Başvuru ORF (RefORF) | kurallı ORF genom ek açıklamaları ve OpenProt açıklamalı. | 15 |
| Alternatif protein (AltProt) | roman protein bir RefProt ile önemli hiçbir benzerlik ile bir AltORF tarafından kodlanmış. Katılım önek: IP_. | 15 |
| Referans protein (RefProt) | Şu anda UniProtKB, Ensembl veya NCBI RefSeq gibi protein sıra veritabanlarını ve aynı zamanda OpenProt açıklamalı protein. | 15 |
| Roman izoformu | roman protein bir RefProt ile önemli bir benzerlik ile bir AltORF tarafından kodlanmış. Katılım önek: II_. | 15 |
| OpenProt_2pep veritabanı | Tüm RefProts ve roman proteinler OpenProt, zaten en az 2 benzersiz peptidler ile tespit tarafından tahmin dizisini içerir. | 15 |
| OpenProt_1pep veritabanı | Tüm RefProts ve roman proteinler OpenProt, zaten en az 1 benzersiz peptid ile tespit tarafından tahmin dizisini içerir. | 15 |
| OpenProt_all veritabanı | Tüm RefProts ve OpenProt tarafından öngörülen yeni proteinler dizisini içerir. | 15 |
Tablo 1: Tanımı OpenProt ve protokol boyunca kullanılan terimler
Takıma giren malzeme S1: Galaxy iş akışı veritabanı işleme için. Bu CRAPome ve yem diziler (giriş veritabanına ters) ekler. Çıkış Fasta dosyasıdır. İndirmek için buraya tıklayınız.
Takıma giren malzeme S2: Galaxy iş akışı protein tanımlama için. Bu iki arama motorlarını kullanarak bir kütle spektrometresi veri dosyasından proteinler belirleyecektir (MS-GF + ve X! Tandem). Her parametre ayarlanan iş akışı çalıştırmadan önce istediğiniz gibi. İndirmek için buraya tıklayınız.
Takıma giren malzeme S3: Galaxy iş akışı kararlı izotop (SIL) etiketleme kullanarak protein miktar için. Bu tanımlamak ve proteinler kütle spektrometresi veri dosyasından iki arama motorlarını kullanarak ölçmek (MS-GF + ve X! Tandem). Her parametre ayarlanan iş akışı çalıştırmadan önce istediğiniz gibi. İndirmek için buraya tıklayınız.
Takıma giren malzeme S4: X! Tandem varsayılan parametrelerini yapılandırma dosyası. Bu XML dosyasıdır X çalıştırmak için gerekli! Galaxy platformda TandemAdapter aracı. İndirmek için buraya tıklayınız.
Takıma giren malzeme S5: proteinler iMixPro veri kümesinden gelen sayılabilir. Veri dosyaları Eyckerman vd. 201638 OpenProt veritabanlarını kullanarak işlendi ve quantified proteinler her koşul için listelenir. Yemler PTPN14, JIP3, IQGAP1, RAF1 ve RNF41 vardır. Yeşille gösterilen Gene adları aynı zamanda orijinal kağıt38içinde tespit proteinler karşılık gelir. Gene adları turuncu renkte gösterilen özgün gazetede rapor değil bilinen interactors BioGrid göre karşılık gelir. Açık mavi belirtilen Gene adları roman proteinler (karşılık gelen protein katılım sayısı parantez içinde gösterilir) interactors olarak tanımlanan karşılık gelir. Gene adları ışık gri renkle gösterilir ve olası kirletici (keratin protein) İtalik karşılık gelir. İndirmek için buraya tıklayınız.
Takıma giren malzeme S6: roman proteinler iMixPro veri kümesinden gelen teşhis. Veri dosyaları Eyckerman vd. 201638 OpenProt veritabanlarını kullanarak işlendi ve yeni saptanan proteinler her koşul için listelenir. Yemler PTPN14, JIP3, IQGAP1, RAF1 ve RNF41 vardır. Roman izoformlarının bilinen bir protein için II_ ve IP_ bir alternatif ORF (AltProt) üzerinden yeni proteinler için başlayan protein katılım numaraları listelenir. Numarayı peptidler destekleme parantez içinde gösterilir. İndirmek için buraya tıklayınız.