Waiting
Traitement de la connexion…

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Gen kullanmak için bir protokol translasyonel araştırma için uygun hayvan modeli belirlemek için zenginleştirme çözümlemesi ayarla

Published: August 16, 2017 doi: 10.3791/55768

Summary

Gen kümesi zenginleştirme translasyonel araştırma için bir ideal fare modeli tanımlamak için transcriptomic veri analizini kullanımına ilişkin standart bir protokol sağlar.
Bu iletişim kuralı ve DNA Mikroarray ve RNA sıralama veri ile kullanılabilir veri yoksa diğer omics veri için daha da uzatılabilir.

Abstract

İnsan hastalıkları transcriptomic veri kümeleri veri geleneksel gen gen karşılaştırma teknikleri kullanarak fare modelleri ile karşılaştırıldığında son yıllarda yapılan çalışmalarda hayvan modellerinde alaka ile ilgili çelişkili sonuçlar sonuçlandı translasyonel araştırma. Rasgele differentially ifade genler filtreleme farklı gen ifade analizleri arasındaki farklılıkları için önemli bir nedeni var. Ayrıca, farklı tür ve genellikle platformlar arasında tek gen karşılaştırılması con/uyumsuzluk yanlış yorumlanmasına yol insan ve hayvan modellerinden veri arasında önde gelen teknik farkı ile sınırlıdır. Böylece, standart yaklaşımları sistematik veri analizi için ihtiyaç vardır. Öznel gen filtreleme ve etkisiz gen gen karşılaştırma üstesinden gelmek için biz son zamanlarda gen kümesi zenginleştirme analiz (GSEA) bu sorunları önlemek için potansiyele sahip olduğunu gösterdi. Bu nedenle, biz translasyonel araştırma için uygun ve uygun olmayan hayvan modelleri arasında ayırt etmek için GSEA kullanımı için bir standart iletişim kuralı geliştirilmiştir. Bu iletişim kuralı olarak varolan deneysel omics veri gerektirir bir-priori, yeni model sistemleri nasıl tahmin etmek uygun değildir. Ancak, protokol böylece gereksiz hayvan deneyleri kaçınarak ve çevirim çalışmalar yanıltıcı en uygun hayvan modeli seçmek için standart bir şekilde varolan verileri yorumlamak açıklar.

Introduction

Hayvan modelleri yaygın insan hastalıkları, genetik, anatomi ve Fizyoloji bakımından insanlara kabul onların benzerlik nedeniyle incelemek için kullanılır. Ayrıca, hayvan modelleri genellikle ağ geçidi denetleyicileri için klinik tedaviler olarak hizmet ve translasyonel araştırma başarısı üzerinde büyük bir etkisi olabilir. En iyi hayvan modeli dikkatli seçimi yanıltıcı hayvan çalışmaları sayısını azaltabilirsiniz. Özellikle insan inflamatuar hastalıkları ve ilgili fare modelleri elde aynı veri kümeleri çözümleme çelişkili sonuçlara yol açtı çünkü son zamanlarda, hayvan modellerinde translasyonel araştırma uygunluğu tartışmalı, tartışıldı 1,2. Bu tartışma omics veri çözümleme sırasında temel bir sorun ortaya: sistematik veri analizi için standart yaklaşımları önyargılı gen seçim azaltmak için ve türler arası karşılaştırmalar 3sağlamlığı artırmak için ihtiyaç vardır.

Geleneksel olarak, transcriptomics veri (ve diğer omics veri) analizi tek gen düzeyinde yapılır ve gen seçim sıkı kesme parametrelere dayalı bir ilk adım içerir (örneğin, kat değişiklik > 2.0, p değeri < 0,05). Ancak, ilk kesme parametrelerinin ayarı kez öznel, rasgele ve biyolojik olarak haklı olduğunu ve ters sonuçlar1,2bile yol açabilir. Ayrıca, ilk gen seçim genellikle analizi birkaç son derece yukarı - ve downregulated genler için kısıtlar ve böylece differentially daha az bir ölçüde ifade edildi genler çoğunluğu dahil etmek için duyarlı değildir.

2000'lerin genomik dönemi yükselişi ve biyolojik yollar ve bağlamlarda artan bilgi ile alternatif istatistiksel yaklaşımlar tek gen düzeyinde analizler sınırlamaları aşmak için izin geliştirilmiştir. Gene transcriptomics veri analizi için yaygın olarak kabul edilen yöntemlerden biri zenginleştirme analiz (GSEA)4, ayarla, priori bir tanımlı grupların genlerin (yollar, bir kromozom vb proksimal konumunda sinyalörneğin,.) kullanır. GSEA ilk ifade onların bireysel değişiklik bakılmaksızın tüm algılanan filtre uygulanmamış genler (örneğin, yollar), hedeflenen gen kümeleri için eşleştirir. Bu yaklaşım böylece Ayrıca aksi takdirde tek gen düzeyinde analizler ile kayıp olacağını orta düzenlenmiş genden oluşmaktadır. İfade gen kümeleri içinde katkı maddesi değişikliği daha sonra çalışan toplam istatistikleri kullanılarak gerçekleştirilir.

Tıbbi araştırma rağmen geniş kullanımı, GSEA ve ilgili küme zenginleştirme yaklaşımlar bakarsanız karmaşık omics veri analizi için dikkate alınmaz. Burada, biz translasyonel çalışmaları için ideal modeli tanımlamak için bu fare modelleri ile insan örnekleri omics verileri karşılaştırmak için bir protokol tanımlamak. Biz insan enflamatuar bozuklukları taklit için kullanılan fare modelleri topluluğu dayalı İletişim Kuralı Uygulanabilirlik göstermek. Ancak, bu analiz boru hattı insan-fare karşılaştırmalar için sınırlı değildir ve daha fazla iyileştirilebilir araştırma soruları.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. download belgili tanımlık GSEA bilgisayar yazılımı ve moleküler imza veritabanı

  1. (http://software.broadinstitute.org/gsea/index.jsp) resmi GSEA geniş Enstitüsü Web sitesine gidin ve GSEA yazılımına erişim almak için kayıt aracı ve moleküler imza veritabanı (MSigDB).
  2. Download javaGSEA masaüstü uygulaması ya da bir alternatif bilgisayar yazılımı seçme hakkı (örneğin, R script).
    Not: Tüm seçenekler tam olarak aynı algoritmayı uygulamak. GSEA yazılım serbestçe Akademi ve sanayi iç araştırma amacıyla bireylerde kullanılabilir.
  3. Daha fazla GSEA yazılımı ile ilgili ayrıntılar belgeleri Web sitesi (http://software.broadinstitute.org/cancer/software/gsea/wiki/index.php/Main_Page) ve GSEA Kullanıcı Kılavuzu (http://software.broadinstitute.org/gsea/doc/ için GSEAUserGuideFrame.html).
  4. moleküler imza veritabanı (MSigDB) erişmek genin set koleksiyonları için GSEA Web sitesinden indirmek.
    Not: MSigDB GSEA yazılım veya başka amaçlar ile kullanmak için ek açıklama eklenen gen setlerinin topluluğudur. Gen kümeleri yolları, gen Ontoloji açısından, CIS düzenleyici motifleri, deneysel imzalar ve diğerleri sinyal göre ayrılabilir. MSigDB genler her zaman onların resmi HUGO (İnsan Genom organizasyonu) gen sembolü ile adlandırılır. Yol düzenleme verilen insan bozukluğu ve farklı fare arasında karşılaştırma modelleri için indirmek için tavsiye edilir ' tüm kanonik yolları, gen sembolleri ' dosya (c2.cp.v5.2.symbols.gmt). Bu dosyayı açıklamalı ve sinyal yolları KEGG 5 , 6, Reactome 7 , 8 ve BioCarta tarafından düzenlenen gen kümeleri oluşur 9. dize ' v5.2 ' koleksiyon sürüm bilgisini gösterir. Dosyaların en son sürümünü indirmek emin olun. MSigDB, Akademi ve sanayi iç araştırma amacıyla bireylerin serbestçe kullanılabilir. Çözümleme sırasında Internet bağlantısı varsa MSigDB, download gerekmez. Bu durumda MSigDB doğrudan GSEA kullanıcı arabirimi içinden seçilebilir.
  5. Download DNA çip dizi özgü sonda tanımlayıcıları genel HUGO gen simgeleri (örneğin, Mouse430_2.chip) çevirmek için GSEA Web sitesi (dizi) ek açıklamaları dosyalardan.
    Not: Internet Bağlantı Çözümleme sırasında verdiyse o DNA çip ek açıklamaları indirmek için gerekli değildir. Bu durumda DNA çip ek açıklamaları doğrudan GSEA kullanıcı arabirimi içinden seçilebilir. Protokolü de RNA sıralama veri ile kullanılabilir. Bu durumda, ek açıklama dosyaları indirmek için gerekli değil. Bunun yerine, (bkz: adım 4.12) gen ifadesi verileri analiz etmek için GSEA preranked aracını kullanın.

2. İnsan bozukluğu ve uygun hayvan modelleri için deneysel gen ifadesi verileri indir

  1. Seçimi (örneğin, gen ifade profilleri insan bozukluk tespit deneysel gen ifade (transcriptomics) çalışmaları lökosit hastalarda septik bozukluğu, GSE9960 türetilmiştir).
  2. (Örneğin, gen ifade profilleri fare Staphylococcus aureus (S. aureus), GSE20524 enjeksiyon sonra elde edilen kan hücrelerinin) insan çalışmaları ile karşılaştırıldığında gerekiyor
  3. Likewise, birkaç hayvan ara modeller. Bu aşamada insan durumu taklit için uygun olabilir hayvan modelleri ön için ön bilgi kullanın.
  4. Bu amaç için edebiyat bakın ve veritabanları gen ifade Omnibus (GEO) gibi veritabanı 10 ya da ArrayExpress 11 ve ilgi normalleştirilmiş transcriptomics veri indirmek için. Verileri yerel sabit diskinizdeki metin dosyaları olarak kaydedin. Coğrafi veritabanı için sekmeyle ayrılmış serisi matris metin dosyalarının karşıdan yüklenmesini tavsiye edilir. Ayrıca bu bilgileri genel HUGO gen sembolleri için dizi özgü sonda tanımlayıcıları çevirmek için gereken bu yana bu çalışma için kullanılan platform (dizi türü) dikkat.
    Not: veri depolama için yeterli bellek transcriptomics veri kümeleri genellikle birkaç yüz MB oluşturan gibi olun.

3. Kullanım ve biçimlendirme veri

  1. GSEA yazılım aracına deneysel gen ifadesi verileri almadan önce gerekli veri yapısı göz önünde bulundurun. Her çalışma için el ile iki farklı dosya oluşturun: çeşitli genler ve örnekleri için ölçüm değerlerini içeren 1) bir gen ifade veri dosyası ve bireysel örnekleri (örneğin, tedavi grupları için) gruplandırmak için örnek etiketleri içeren 2) bir fenotip dosya.
    Daha fazla bilgi ve veri yapısı için GSEA veri biçimi sayfasına (http://software.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats) seçenekleri gidin.
    Not: Genel olarak, transcriptomics veri her türlü DNA Mikroarray deneyler, RNA-seq veya çip seq çalışmaları da dahil olmak üzere iletişim kuralı ile uyumludur. DNA Mikroarray deneyler kullanma durumunda, gen ifade veri dosyası dizi özgü sonda tanımlayıcı veya HUGO gen semboller her gen (sonda tanımlayıcıları HUGO gen sembolleri için Çözümleme sırasında bkz: adım 1.5 ve 4.10 tercüme edilecektir) içermelidir. RNA-seq veya çip seq verileri kullanarak durumunda, el ile hesaplanan grup ölçümleri gen ifadesi verileri (örneğin, grup ortalama oranı) için tek tek örnek veri yerine kullanılmalıdır. Bu grup ölçümler sonra GSEA preranked aracı ile analiz edilmelidir (bkz. Adım 4.12). Gen ifadesi verileri her zamanki gibi GSEA yazılımı içine almadan önce normalleştirilmiş gerek. Normalleştirme (örneğin, DÖRTTEBİRLİK veya kübik spline) türü genellikle araştırmacı için kaldı.
  2. Gen ifadesi verileri dosya: şekil 1A ' gösterildiği gibi bir ifade veri kümesi tanımlamak için sekmeyle ayrılmış metin dosyasından (*.txt) biçimi kullanın. Ayrıca bkz: desteklenen örnek dosyası GSE20524_expression.txt.
    Not: Gen ifade veri dosyası ifade değerleri tüm tespit genler (veya sondalar) için değil differentially ifade gen için de içermektedir. Dosyayı bu nedenle genellikle binlerce gen oluşmaktadır. şekil 1A ' tasvir düzenlenmiştir. İlk satır etiketi adı içerir (örneğin, gen sembol veya kimliği probe) (örneğin, Örnek 1, örnek 2 vb) veri kümesindeki her örnek için tanımlayıcı tarafından takip. Dosyayı geri kalanı ifade değerleri her gen için ve her örnek veri kümesi içerir. GSEA yazılım aracı hesaplama yapan grup ölçülerini (örneğin, grup ortalama oranı veya sinyal-gürültü oranı), bu nedenle tek tek her örnek için veri eklemek önerilir. Alternatif olarak, (bkz: şekil 1B) gen ifadesi verileri için harici olarak hesaplanan grup ölçümleri kullanmak mümkündür.
  3. Fenotip dosya: tanımlama ve gruplar etiketleme tasvir gibi bireysel örnekleri oluşturan için ayrı bir dosya oluşturma < güçlü sınıfı"xfig" = > Şekil 2. Boşluk ya da sekme alanları ayırmak için kullanın. CLS (C++ sınıf tanımı) dosya biçiminde kaydedin. Ayrıca bkz: desteklenen örnek dosyası GSE20524_pheno_infection.cls.
    Not: İlk satır örneklerin toplam sayısını ve daha fazla gruplar ( Şekil 2) sayısını içerir. Gen ifade veri dosyasına örnek sayısına karşılık gelmelidir iken (bkz: 3.2), grup sayısı çalışma tasarım üzerinde bağlıdır. Her zaman ilk satırın üçüncü alandır ' 1 '.
    CLS dosya ikinci satırda her grubunun adını içerir. Yolun ardından bir boşluk ( Şekil 2) bir sayı işareti (#) ile başlamalıdır.
    Üçüncü satır her örnek için bir grup etiket içerir. Grup etiketi bir rasgele sayı veya metin olabilir. Bu Derneğin gruplara her örneğinin belirleyen sadece etiketleri sırasıdır: kullanılan ilk etiket ikinci satırda; ilk grubuna atanır İkinci benzersiz etiketi ve benzeri ikinci grubuna atanır. Aynı grup içinde bulunan her örnek bu adımda aynı etiketi varsa ve etiket sayısını ilk satırında belirtilen örnekleri sayısı ile aynı olduğundan emin olun. Son olarak, dosyayı sekmeyle ayrılmış metin dosyası (*.txt) olarak kaydedin ve dosya adı uzantısını (*.cls) el ile değiştirin.
  4. (isteğe bağlı) gen küme veritabanı dosyaları: özel gen kümelerini tanımlayın. şekil 3 ' te gösterildiği gibi gen kümeleri için sekmeyle ayrılmış GMT (gen aktarılmış matris) dosya biçimini kullanır. Ayrıca bkz: desteklenen örnek dosyası Gene_sets_Inflammation_BIOCARTA_KEGG_REACTOME.gmt.
    Not: özel gen kümeleri tanımlama örneğin gen kısıtlamak için ayarla zenginleştirme analiz yolları özel ilgi (örneğin, sepsis çalışmaları için sinyal İmmünoloji), ya da kendi gen kümeleri tanımlama de novo için yararlı olabilir (aktif örneğin, ve «««inhibe) genleri Karşılaştırılacak olan çalışmalarda. Dosyayı şekil 3 ' te gösterildiği gibi düzenlenmiştir. GMT biçiminde her satır bir gen kümesi ( şekil 3) temsil eder. Her gen kümesi bir ad, açıklama ve genler gen küme tarafından tanımlanır. İlk sütun benzersiz gen kümesi adlarını içerir. İkinci satır isteğe bağlı olarak gen kümesinin açıklamasını içerebilir. Aşağıdaki sütunları (resmi HUGO gen semboller) gen isimlerini ilgili gen kümesini içerir. Son olarak, sekme sınırlandırılmış metin dosyası (*.txt) olarak kaydedin ve el ile değiştirmek için dosya adı uzantısı (* .gmt).

4. GSEA performans

  1. GSEA yazılım aracını açın (bkz: 1.2).
  2. 'I tıklatın ' yük veri ' düğmesini ( şekil 4A) ana penceresinin sol tarafında. Yeni bir sekme ( şekil 4B) gerekli veri dosyaları içe aktarma için açılır. Yeni sekmede gen ifadesi verileri (*.txt) dosyasına göz atın (bkz: 3.2), fenotip (*.cls) dosyası (bkz: 3.3) ve isteğe bağlı olarak, özel gen kümeleri için (* .gmt) dosyası ( şekil 4B).
    1. GSEA Internet'e bağlanamıyor durumunda da yük indirilen MSigDB (* .gmt) dosyaları (örneğin, c2.cp.v5.2.symbols.gmt için yollar, görme 1.4) ve DNA çip (dizi) ek açıklamaları (* .chip) dosyaları (örneğin, Mouse430_2.chip, 1.5 bkz.). Başarıyla alınan verileri görünür ' yük veri ' bölüm ( şekil 4 c).
      Not: Her gen ifade çalışma GSEA ile ayrı ayrı analiz gerekir. İki çalışma (örneğin insan bozukluk fare modeli vs) arasında karşılaştırma 5 adımda gerçekleştirilecek.
  3. 'I tıklatın ' çalıştırmak GSEA ' ana penceresinin sol tarafındaki düğme. Yeni bir sekme ( şekil 4 d) analiz parametrelerini ayarlamak için açılır. Belgili tanımlık etiket üç parçaya bölünmüştür: gerekli alanları, temel alanları ve Gelişmiş alanlar.
  4. Gerekli alanlar, ilk adım 4.2 ( şekil 4 d) yüklü ifade veri kümesi seçin.
  5. Gen veritabanını ayarlar, bağlı Web sitesi veya el ile alınan gen kümesi dosya ( şekil 4 d) seçin.
  6. Birine (örneğin, S. aureus tedavi vs sağlıklı kontrol) karşılaştırılmak üzere sözde örnekleri grupları seçmek için fenotip etiketleri Düzenle ( şekil 4 d).
  7. Gen sembolleri kümesine Daralt (resmi HUGO gen sembolleri gen kümeleri veritabanında kullanılan ifade kümesine sonda tanımlayıcılarda çevirmek için = true). İfade veri kümesi zaten HUGO gen sembolleri ( şekil 4 d) içeriyorsa false seçin.
  8. Ayarla permütasyon için varsayılan ayar 1000 ( şekil 4 d).
    Not: bilgisayar zaman önemli ölçüde daha yüksek sayılar için artacak.
  9. Permütasyon türü ile değiştirmek ' gen kümesi ', fenotip permütasyon yalnızca her fenotip ( şekil 4 d) yediden fazla örnek olduğunda önerilir.
  10. Son olarak, gen ifadesi verileri oluşturmak için kullanılan çip platformu seçin, ya bağlı Web sitesi veya el ile alınan DNA (dizi) ek açıklamalar dosya ( şekil 4 d) chip.
    Not: Bu adım sadece sonda tanımlayıcıları yüklenen ifade veri kümesinde kullanılırsa, gereklidir.
  11. Temel alan en az sonuç dosyası ( şekil 4 d) bulmak için analiz adı ve Bu klasöre kaydet sonuç bölümünde düzenleyin. Buna ek olarak, daha fazla istatistik parametreler değiştirilebilir. İçin daha fazla parametreleri ve Gelişmiş alanlar bölümü detayları gidin lütfen GSEA Kullanıcı Kılavuzu (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html).
  12. (İsteğe bağlı): gen ifadesi verileri (örneğin, grup ortalama oranı) var tek tek örnek veri yerine kullanılmak üzere durum harici olarak hesaplanan grup ölçülerine içinde GSEA preranked aracını kullanın. Analiz sonra bağlı gen sıralaması için kullanılan önceden hesaplanan grup ölçümleri ile atanan genlerin basit bir liste olarak yapılacaktır. Alternatif gen ifade dosya yükledikten sonra ana gezinti çubuğuna gidin ve Araçlar/GseaPreranked üzerinde tıklatın. Benzer şekilde, analiz ( şekil 4E) parametrelerini ayarlamak için yeni bir sekme açın.
    Not: GSEA preranked aracını kullanarak tek tek örnek özgü gen ifadesi verileri olmayan çalışmalar için önerilir. Özel istatistik veya normalleştirme yordamlar grup ortalama değerleri tek tek örnek veri yerine önde gelen veriler üzerinde gerçekleştirilen bu durumda olabilir. GSEA preranked aracını kullanarak RNA sıralama veri için önerilir. RNA sıralama ifadesi verileri normalleştirmek ve onların ifade göre genlerin sıralamak için kullanılan örnekleri (örneğin, günlük kat değişim), grup ölçümlerini hesaplayabilmesi.
  13. Tıklama ' çalıştırmak ' pencerenin sağ alt düğmesini.
    Not: Analiz sonra bilgi işlem hızına bağlı olarak birkaç dakika sürebilir. Pencerenin sol alt analiz GSEA raporlar bölümünde ilerlemesini izleyin. Analizi, durumu bitirdikten sonra ' başarı ' GSEA raporlar bölümünde görünür.
  14. Tıklama üzerinde başarılı oldu analiz analiz sonuçları açmak için GSEA raporlar bölümünde.
    Not: Yeni bir navigasyon menüsü tüm sonuçları ve parametre ayarları ( şekil 5) özetleyen bir tarayıcı penceresinde açılır. Navigasyon menüsü üst iki bölümden oluşur Gen zenginleştirme sonuçları tanımlanmış grupları (örneğin, S. aureus tedavi örnekleri ya da sağlıklı kontrol örnekleri Zenginleştirme) için ayarlayın. Her iki bölümde ilk satırlar istatistik sonuçlarının bir özetini gösterir. Önemli ölçüde % 25 altında bir yanlış-keşif oranında (FDR) zenginleştirilmiş gen kümeleri aşağıdaki yorumlanmasında zenginleştirilmiş olarak kabul edilmektedir. Analiz yorumlanması hakkında daha fazla bilgi-ebilmek bulunmak GSEA Kullanıcı Kılavuzu'nda (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html).
  15. Çözümleme sonuçlarını bir elektronik ( şekil 6A) vermek için ayrıntılı zenginleştirme sonuçlarında biçimi excel Tarih
  16. 'ı tıklatın. Detaylı zenginleştirme sonuçlarında excel her iki fenotipleri ( şekil 5) için ayrı ayrı verebilir ve sonuçları verilerini bir elektronik tablo dosyasındaki katılın. Sonraki gen ifadesi verileri çeşitli çalışmaların karşılaştırılması korumak için en az (sütun A) gen kümesi adı onun normalleştirilmiş zenginleştirme Puan edinildi (NES) (sütun F) ve FDR (yanlış bulma oranı) değeri (sütun H) ( şekil 6B ).
    Not: Elektronik tablo dosyası büyük veri analiz için içerir gen kümesi, gen kümesi (sütun A), onun boyutu (diğer bir deyişle, genler gen ifadesi verileri, sütun D tespit sayı), adı da dahil olmak üzere onun NES (yön nicel bir ölçü ve ölçüde zenginleştirme, sütun F), nominal p değerini (Düzeltilmemiş, sütun G) ve FDR değerini (birden fazla Hipotez testleri, sütun H için düzeltilmiş). İçin daha fazla yorum hakkında ayrıntılı bilgi bakın lütfen GSEA Kullanıcı Kılavuzu (http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html).
  17. Gen zenginleştirme analiz (Adım 4.1-4,15) ayarlamak için (örneğin, S. aureus GSE9960) ikinci çalışma ve birbirleriyle karşılaştırılmak üzere gereken tüm daha fazla çalışmaları için yineleyin. Translasyonel araştırma soru için en iyi fare modeli tanımlamak için mümkün olduğunca çok insan klinik çalışmalar ve farklı fare modelleri dahil.

5. GSEA sonuçları karşılaştırarak

    birbirlerine tüm çalışmaların GSEA sonuçları insan durum karşılaştırın taklit için en uygun hayvan modeli tanımlamak için
  1. . Yolları (gen kümeleri) aktif olarak sınıflandırmak için zenginleştirme puanları ve FDR değerleri kullanın (NES > 0, FDR < % 25), Inhibe (NES < 0, FDR < % 25) veya her ikisi de hiçbiri (FDR > % 25). Her iki çalışma karşılaştırma için bir 3 x 3 Acil durum tablosu ( şekil 7A) tarafından belirtildiği şekilde yol düzenleme dokuz olası birleşimlerini gerçekleşmeleri saymak.
  2. Pozitif öngörü değeri (ppv) hesaplaması tarafından iki çalışma ve aynı yönetmelik (harekete geçirmek ya da inhibe) iki çalışmalarda göster yollar parçası tanımı gereği olan negatif tahmini değer (NBD), arasında ilişki değerlendirmek .
    1. Hesaplama ppv ve NBD göre aşağıdaki formüller (1) ve (2):
      (1) Equation 1
      (2) Equation 2
      Not: çakışmayı çubuk ya da-ebil var olmak tamamen rastlantısal, ppv ve NBD daha fazla şans eseri beklenen değerler Karşılaştırılacak var. Bu yaklaşım başka bir çalışmada etkileri tahmin için bir çalışma elde edilebilir bilgi miktarını tahmin sağlar. Örneğin, iki model düzenleme işlemlerinde birbirinden bağımsız (ve şans eseri sadece üst üste) ve ilk modelinde %10 yollar upregulated, ppv ikinci modeli için de % 10 olur ve hiçbir ek daha olsaydı INF kazanmak ormation. Her iki modelde ortak düzenleme mekanizmaları tarafından bağlandı diğer tarafta sonra ppv (ve NBD) şans eseri beklenenden daha önemli ölçüde daha fazla olurdu. Örneğin, gen ifade değişiklikleri için insan sepsis (GSE9960) etkileri bir fare S. aureus enjeksiyon modeli (GSE20524) sırasında ppv % 43 's (6/(6+8+0)) NBD ise % 61 (11/(0+7+11)). Başka bir deyişle, %43 fare S. aureus enjeksiyon (GSE20524) modeli etkin yollar da insan sepsis (GSE9960) sırasında etkinleştirilir. Benzer şekilde, %61 fare S. aureus enjeksiyon (GSE20524) modeli Inhibe yollar da insan sepsis (GSE9960) sırasında inhibe ( şekil 7B). PPV ve NBD de tespit için (yani 1-2 eğitim kursundan tahmin anlamına gelir) ters takımyıldızı.
  3. Çakışma hesaplamak için şans eseri başvuru 3 x 3 Acil durum tablo ( Şekil 7) ve ppvchance ve npvchance göre aşağıdaki formüller (3) ve (4):
    (3) < img alt "Denklem 3" src = "/files/ = ftp_upload/55768/55768eq3.jpg"/ >
    (4) Equation 4
    Not: Örneğin, gen ifade değişiklikleri tahmin sırasında fare S. aureus etkilerden insan sepsis (GSE9960) enjeksiyon modeli (GSE20524) ppvchance % 13 şey (8/64) ve npvchance ve % 22 (14/64).
  4. Şans vs ppv kazanç ppvchance ppv üzerinden çıkararak hesaplar. Buna göre hesaplamak NBD:
    (5) Equation 5
    (6) Equation
    Not: Örneğin, gen öngörü ifade bir fare S. aureus enjeksiyon modeli (GSE20524) etkileri ppv değişikliği sırasında insan sepsis (GSE9960) değiştirir ve NBD şans vs olduğunu + %30 (% 43-%13) ve + %39 (% 61-%22), sırasıyla.
  5. Hesaplamak çalışma 2 ile ilgili çalışma 1 ppvgain ve npvgain sayı ortalaması alınarak elde edilebilir bilgi kazanç:
    (7) Equation
  6. (study1.pathway, study2.pathway) tarafından ki-kare testi p değeri hesaplamak için yapılan çalışmaların bir çift 5.1 adım tanımlanan acil durum tablo kullanın
    Bir matris X. Perform ki-kare testi, örneğin acil durum tablo verileri depolamak, R kullanımı ile chisq.test işlev.
    Not: Örneğin, seçilen insan sepsis çalışma (GSE9960) fare S. aureus ile karşılaştırıldığında enjeksiyon modeli (GSE20524) istatistiksel olarak anlamlı bir örtüşme inflamatuar yolu yönetmelikte gösterir:
    > chisq.test(X,simulate.p.value=F)$ p.Value
    3.82e-07

6. En iyi hayvan modeli tanımlama

  1. Karşılaştır GSEA sonuçları analiz için seçilmiş olan çalışmaların tüm birleşimler için.
    Not: Bu da bir başka (benzer) insan çalışmaları yanı sıra farklı hayvan çalışmaları birbirleriyle karşılaştırmak için önerilir. Bu karşılaştırma klinik çalışmalar (veya bozuklukları) ilkinde varyansını içgörü sağlayabilir ve farklı hayvan modelleri. Aksi takdirde klinik çalışmalar insan durumu taklit edebilen bir hayvan modeli bulmak için çok heterojen olabilir çünkü klinik çalışmalar kabul edilebilir bir örtüşme ve önemli bilgileri elde etmek, göstermek gerektiğini bekleniyor. Bu durumda, yalnızca uygun hayvan modelleri tanımlanması için birbirine benzer insan çalışmaları dahil etmek için tavsiye edilir.
  2. Tüm birleşimler bilgi (Adım 5.5) kazanç sıralayın. Birçok veri kümelerini karşılaştırma için bir matris kullanın ve renkli bir heatmap veya benzeri kullanımı ile bulgular görselleştirmek ( şekil 8).
  3. Bilgi ve yüksek kazanç ile hayvan modeli seçin. Önemini bilgi kazanç değerlendirmek için de ki-kare testi (Adım 5.6) dikkate alın.
    Not: Hayvan modelleri sadece uygun şekilde bilgi kazanç önemli ise ve ki-kare testi p değerinin altında anlam düzeyinde olması düşünülmelidir. User-Defined eşikleri genellikle çeşitli faktörlere bağlı olacaktır: 1) Aktarılabilirliği 2) insanlar tarafından varsayılan bir başarı, 3) pratik için beklenen yararı insanlara (örneğin benzer Fizyoloji), hayvan modeli sonuçlarının Tarih öncesi çalışma bilgi Bu hayvan deney ve 4 uygulanabilirliği) beklenen ağrı, acı veya laboratuara verdirdiler zararhitabet hayvanlar.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

GSEA iş akışı ve ekran örnek veri içinde gösterilen. Şekil 1 transcriptomic veri ilgi içeren gen ifade veri dosyası gösterir. Her çalışma bir açıklayıcı fenotip dosyası gerekli olduğu için bu Şekil 2' de gösterilmiştir. Ek açıklama eklenen gen kümeleri (örneğin, yollar) (şekil 3) gen küme veritabanı dosyasında tanımlanır. Şekil 4 GSEA bilgisayar yazılımı alet kullanımı için adım adım bir protokol gösterir. Bir örnek sonuç raporu şekil 5' te verilmiştir. Detaylı GSEA zenginleştirme sonuçları şekil 6' da özetlenmiştir. Farklı gen ifade çalışmalar karşılaştırma için özellikle insan fare çalışmaları, vs bir acil durum tablo gereklidir (Şekil 7). Sonuçları görselleştirme için şekil 8 yolu karşılaştırmalar insan arasında bir korelasyon matrisi gösterir ve fare çalışmaları.

Figure 1
Şekil 1: GSEA gen ifadesi verileri dosyası. Dosyayı ifade değerleri tüm tespit genler (veya sondalar), aynı zamanda değil differentially ifade gen içermektedir. Dosyayı bu nedenle genellikle binlerce gen oluşmaktadır. (A) gen ifade veri dosyası tek tek her örnek için veri içerir. İlk satır etiketleri adı içerir (burada: kimliği probe) ardından isteğe bağlı bir açıklama ve tek tek örnek adları (burada: GSM515585, GSM515586, vb). Dosyayı geri kalanı ifade değerleri her gen için ve her örnek veri kümesi içerir. (B) alternatif gen ifade veri biçimi. Harici olarak hesaplanan grup ölçümleri (burada: ortalama oranı) tek tek örnek veri mevcut değilse GSEA preranked aracı için kullanılabilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 2
Resim 2: GSEA fenotip dosya. Dosya grupları ve etiketlere gruplar bireysel örnekleri buna göre birleştirir. İlk satırı örnekleri toplam sayısını içerir ve grup sayısı daha fazla. İlk satırın üçüncü alan her zaman '1' dir. İkinci satır her grubunun adını içerir. Yolun bir sonra gelen bir sayı işareti (#) başlar. Üçüncü satır her örnek için bir grup etiket yer alır (burada: 0 veya 1). Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 3
Şekil 3: GSEA Gene veritabanı dosyası ayarla. Dosya kümeleri belirli biyolojik süreçlerin veya kategorilere atanmış olan genlerin tanımlar (burada: inflamatuar yollar). GMT biçiminde her satır bir ad, açıklama ve dahil genler (resmi HUGO gen semboller) tarafından tanımlanan bir gen kümesini temsil eder. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 4
Şekil 4: GSEA yazılım ayarları. GSEA yazılım aracı Broad Enstitüsü Web sitesinden java masaüstü uygulaması indirilmiş. (A)başlamak yemek listesi. Sağ kısım (Ana sayfa) GSEA iş akışı kısa bir özetini verir iken sol navigasyon menüsü içerir. Load data düğmesini tıklatarak dosyaları almak için yeni bir sekme açılır. (B) yük veri bölümünde veri alma daha önce. Gerekli dosyaları ithal yolu ile dosya tarayıcı olabilir. (C) yük veri bölümünde verileri aldıktan sonra. Dosya nesne önbelleğinde listelenir ve için veri kümeleri (zorunlu dosyası), fenotipleri (zorunlu dosyası), düzenlenen alınan verileri gen ayarla veritabanları (isteğe bağlı, Internet bağlantısı verdiyse) ve çip dosyaları (isteğe bağlı; Eğer Internet bağlantısı sağlamak). Tıkırtı üstünde Koşmak GSEA düğme analiz parametrelerini ayarlamak için yeni bir sekme açılır. (D) Çalıştırmak GSEA bölüm. Analiz parametrelerini ayarlama sekmesini gerekli alanları, temel ve gelişmiş alanları ayrılmıştır. Çalıştır düğmesini tıklayarak pencerenin sağ alt üzerinde analiz başlar. İlerleme durumunu analiz sonra pencerenin sol alt GSEA raporlar bölümünde görünür. Durum 'başarı' GSEA içinde görünür analiz, bitirdikten sonra bölüm bildirir. (E) GSEA aracı preranked. Harici olarak hesaplanan grup ölçümleri yerine tek tek örnek veri içeren veri dosyalarını olabilir gen ekspresyonu ile ana gezinti çubuğu analiz. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 5
Şekil 5: GSEA raporu. GSEA rapor tüm sonuçları ve seçme parameters özetleyen bir tarayıcı penceresinde açılır. Navigasyon menüsü üst iki bölümden gen kümesi zenginleştirme sonucu elde etmek için tanımlanmış grupları (örneğin, tedavi S. aureus örnekleri ya da sağlıklı kontrol örnekleri Zenginleştirme) oluşturmaktadır. Bu örnekte, 14 tanesi önemli ölçüde % 25 altında bir FDR ile zenginleştirilmiş iken tedavi S. aureus farelerde 42 65 gen kümeleri (yollar) etkinleştirilir. Benzer şekilde, 18'önemli ölçüde % 25 altında bir FDR ile zenginleştirilmiş ise 23 65 gen kümeleri (yollar) tedavi S. aureus farelerde inhibe. Üzerinde ayrıntılı zenginleştirme sonuçlar ' ı tıklatarak bir html açılır veya excel dosyası farklı gen ifade çalışmalar karşılaştırma için gerekli analiz veri verme. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 6
Şekil 6: ayrıntılı zenginleştirme sonuçları. (A)verilebilir elektronik tablo dosyanızı S. aureus içinde etkinleştirildi gen kümeleri (yollar) için ayrıntılı çözümleme sonuçlarını içeren tedavi fareler. Elektronik tablo dosyasını gen kümesi, boyutuna, normalleştirilmiş zenginleştirme puanını, nominal (düzeltilmeyen) p değerini ve FDR değeri içeren analiz gen kümesi için büyük veri içerir. (B) basitleştirilmiş elektronik tablo dosyasıSadece farklı gen ifade çalışmalar karşılaştırmak için gerekli olan bilgileri içerir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 7
Şekil 7:3 x 3 Acil durum tablo GSEA sonuçlarının. (A)ortak acil durum tablo biçiminde 2 çalışmalar karşılaştırma için. (B) örnek bir insan sepsis çalışma (GSE9960) bir fare ile karşılaştırılması için düzenlenmiş yolları sayıda S. aureus enjeksiyon modeli (GSE20524). Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 8
Şekil 8: insan ve fare çalışmalar arasında yol karşılaştırmalar korelasyon matrisi. Yol düzenleme çakışma bir (fare) araştırması (mavi, azalma, düşük korelasyon; kırmızı, artış, yüksek korelasyon) başka bir (insan) çalışmada etkileri tahmin etmek için elde edilebilir bilgi kazanç olarak gösterilir. Bu örnekte, insan fare veri ile karşılaştırılması alt grubu bu fare modelleri taklit için en uygun olduğunu gösteren son derece insan klinik çalışmalar (çalışmalar 10 ve 11, noktalı çizgi), bağdaşık deneysel fare modelleri ortaya. insan durumu. Buna ek olarak, 7, 8 ve 9 çalışmaları insan hastalık çalışmalar için hiçbir korelasyon gösterdi. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Hayvan modelleri uzun hastalık mekanizmaları incelenmesi ve roman tedavi stratejilerinin geliştirilmesi için uygulandı. Ancak, şüphecilik hayvan modellerin predictivity ilgili klinik çalışmalar12sayısının yayılmaya başladı. Ayrıca, çözümlemek ve preklinik denemeler büyük omics verileri yorumlama için uygun stratejiler hakkında tartışmalı tartışmalar ters sonuçlar aynı verilerden farklı veri analizi stratejileri1 uygulandıktan sonra çizilmiş tarafından yetiştirildin ,2. Sonuç olarak, sistematik olarak verilen bir insan hastalık için en uygun hayvan modeli tanımlamak için daha fazla karmaşık omics veri analizi için sağlam Biyoinformatik teknikleri için yüksek bir talep vardır. En iyi mevcut modeli uygulamak sadece translasyonel araştırma artırır ama daha insan durum ile ilişkilendirmek değil hayvan deneyleri kaçınarak hayvan refahı için katkı.

Sunulan Protokolü sistematik olarak en iyi hayvan modelleri ve belirli bir insan bozukluğu için tedavi protokollerinin belirlemek amacı ile farklı türlerin omics verileri karşılaştırmak için standart bir yaklaşımı açıklar. Bir tek gen analizi yerine GSEA kullanımı ile bu iletişim kuralı gen ifade eşikleri öznel ayarı ve gen filtreleme ile ilgili tüm sorunları kaçınmanızı sağlar. Seçili yolları daha fazla odaklanmak (patho) fizyolojik işlemin (örneğin, iltihabı) bozukluğu/koşul söz konusu özellikle adresine izin verir. Tabii ki, GSEA sonuçlarının doğruluğunu geçerli gen kümesi ek açıklamaları kalitesini ve düzenleme mekanizmaları türler arasında olup korunmuş bağlıdır. Ancak, genel olarak korunması, yolu'den tek gen düzeyinde daha yüksek olduğunu öngörmekteyiz. Buna ek olarak, set zenginleştirme yaklaşımlar13tek gen analizleri daha daha sağlam farklı platformlar ve deneysel modeller veya klinik kohort arasında transcriptomic veri karşılaştırmaları için.

Yollar gibi önceden tanımlanmış gen kümeleri kullanmak yerine, sunulan yaklaşım aynı zamanda özel gen kümeleri tanımlamak için sağlar. Özellikle, deneysel ifade veri aktif veya bir durumda (örneğin, örtüşme klinik tabur düzenlenmiş insan genlerinin) inhibe ilgili genlerin tanımlamak için kullanılabilir. De novo gen kümeleri daha sonra test etmek için farklı hayvan modellerinden veri zenginleştirme için kullanılabilir tanımlanmış. Bu alternatif bir yaklaşım 'yol' ek açıklama eklenen yollar kullanarak önler. Ayrıca, protokol transcriptomic veri karşılaştırma için sınırlı değildir, ama proteomik ve metabolomics de dahil olmak üzere herhangi bir omics veri transfer edilebilir. Yine de, bir bu yaklaşım varolan omics veriler için fare modelleri ve insanlar sınırlıdır ve nasıl yeni hayvan modellerinin geliştirilmesi anlamına gelmez unutmayın vardır. Ancak, varolan verileri en iyi hayvan modeli dikkatli seçimi kolaylaştırmak ve böylece gereksiz ve yanıltıcı translasyonel çalışmaları önlemek, standart yorumlanması için etkili bir yaklaşım temsil eder.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar onlar rakip hiçbir mali çıkarları var bildirin.

Acknowledgments

Bu eser Risk değerlendirmesi (BfR) Alman Federal Enstitüsü tarafından finanse edildi.

Materials

Name Company Catalog Number Comments
Excel Microsoft Corporation

DOWNLOAD MATERIALS LIST

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update--simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Tags

Temel protokolü sayı: 126 hayvan modeli fare modeli translasyonel araştırma sistemleri biyoloji Transcriptomics GSEA
Gen kullanmak için bir protokol translasyonel araştırma için uygun hayvan modeli belirlemek için zenginleştirme çözümlemesi ayarla
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Weidner, C., Steinfath, M., Wistorf, More

Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter