Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: yüksek boyutlu sitometresi veri analizi düzene için bir grafik kullanıcı arabirimi

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT bir MATLAB tabanlı grafiksel kullanıcı arayüzü (kullanıcıların kendi akış sitometresi veri yolu ile yaygın olarak analiz olanak sağlayan GUI) dimensionality azaltma yolu ile t-SNE, otomatik ve el ile çeşitli dahil olmak üzere yüksek boyutlu verileri için analitik teknikler istihdam olduğunu kümeleme yöntemleri, heatmaps ve Roman yüksek boyutlu Akış grafiğini çizer.

Abstract

Akış cytometers parametreleri giderek artan sayıda ölçme yeteneğine sahip çıkmasıyla, bilim adamları phenotypically onların hücresel örnekleri özelliklerini keşfetmek için daha büyük paneller geliştirmeye devam. Ancak, bu teknolojik gelişmeler objektif manuel tabanlı geleneksel gating programları içinde analiz için giderek daha zor hale gelmiştir yüksek boyutlu veri kümeleri verim. Daha iyi analiz ve veri sunmak için akış sitometresi verilerini ayrıştırmak için yüksek boyutlu veri çözümleme uzmanlık ile bioinformaticians ile bilim adamları ortak. Bu yöntemler akış sitometresi okumak çok değerli olduğu gösterilmiştir iken, onlar henüz basit ve kullanımı kolay bir pakette Hesaplamalı veya programlama uzmanlık eksikliği bilim adamları için dahil olmak gerek. Bu gereksinimi karşılamak için biz ExCYT, bir MATLAB tabanlı grafik kullanıcı arabirimi (yüksek boyutlu akış sitometresi verilerin analizi yüksek boyutlu veri de dahil olmak üzere yaygın olarak istihdam analitik tekniklerini uygulayarak akıcılık GUI) geliştirdik t-SNE tarafından dimensionality azaltma, otomatik ve el ile kümeleme yöntem, heatmaps ve Roman yüksek boyutlu akış çeşitli çizer. Ayrıca, ExCYT daha fazla t-SNE ve Kümeleme Analizi yanı sıra yetenek gates doğrudan t-SNE araziler üzerinde uygulamak için ilgi seçin örneğin alınma olasılığını geleneksel gating seçenekleri sağlar. Belgili tanımlık bilgisayar yazılımı da telafi işe ek avantajı veya uncompensated FCS dosyaları sağlar. Olay bu sonrası edinme tazminat gereklidir, Kullanıcı bir dizin tek lekeleri ve günahı bir örnek program sağlamak seçebilirsiniz. Program tüm kanalları olumlu olayları algılar ve bu verileri seçme daha objektif olarak tazminat matris hesaplamak için kullanır. Özetle, ExCYT akış sitometresi veri FCS dosyaları şeklinde almak ve herhangi bir bireysel hesaplama verilerini anlamada en son algoritmik yaklaşımlar kullanmak için eğitim, ne olursa olsun, izin vermek için kapsamlı bir analiz boru hattı sağlar.

Introduction

Akış Sitometresi yanı sıra kitle sitometresi gelişiyle gelişmeler klinisyenler ve bilim adamları hızla belirlemek ve phenotypically biyolojik ve klinik olarak ilginç örnekleri çözünürlük büyük oluşturma, yeni seviyeleri ile karakterize izin verdi bilgi zengin1,2,3olan yüksek boyutlu veri kümeleri. Ise manuel geçişi gibi akış sitometresi veri analizi için geleneksel yöntemler orada birkaç işaretleri ve görsel olarak discernable nüfus bu işaretleri var deneyler için daha basit olabilirdi, bu yaklaşım oluşturmak başarısız olabilir yüksek boyutlu veri kümeleri ya da bir spektrum üzerinde boyama işaretçileri olan analiz ederken tekrarlanabilir sonuçlar. Örneğin, bir çok kurumsal çalışmada, intra hücresel nerede (ICS) boyama deneyleri antijen spesifik T hücre yanıt-e doğru iyi inter-laboratory hassas, analiz, rağmen özellikle quantitating tekrarlanabilirlik değerlendirmek için gerçekleştirilen perdeleme, değişkenlik4önemli bir kaynak tanıttı. Ayrıca, el ile popülasyon çıkarlarının, son derece öznel olmasının yanı sıra perdeleme süreci son derece zaman alıcı ve emek yoğun olduğunu. Ancak, sağlam, verimli ve zamanında bir şekilde yüksek boyutlu veri kümeleri çözümleme sorunu araştırma Bilimleri yeni biri değil. Gen ifade çalışmalar genellikle son derece yüksek boyutlu veri kümeleri nerede analiz manuel formları sadece olanaksız olurdu (genellikle sırasına genler yüzlerce) oluşturur. Bu veri kümeleri çözümleme mücadele için bioinformatic araçları gen ifadesi verileri5ayrıştırmak için gelişmekte olan fazla çalışma olmuştur. Parametre sayısı artmıştır ve bu yüksek boyutlu veri kümeleri6,7analizinde çok değerli olduğu kanıtlanmıştır algoritmik bu yaklaşımlar sadece son zamanlarda sitometresi veri analizi benimsenmiştir.

Üretimi ve çeşitli algoritmalar ve bilim adamları bu yüksek boyutlu bioinformatic yaklaşımlar onların akış sitometresi verilere uygulamak izin yazılım paketleri uygulanmasına rağmen bu analitik teknikler hala büyük ölçüde kullanılmayan kalır. Bu yaklaşımların sitometresi veri8yaygınlaşmasının sınırlı olan faktörler çeşitli olsa, biz şüpheli büyük engel bu yaklaşımlar bilim adamları tarafından kullanımı, Hesaplamalı bilgi eksikliğidir. Aslında, çok sayıda bu yazılım paketi (Yani, flowCore, flowMeans ve OpenCyto) programlama hala önemli programlama bilgisi gerektiren dillerinde R gibi uygulanmak üzere yazılmıştır. FlowJo gibi yazılım paketlerini iyilik kolaylığı kullanım ve 'Tak ve Çalıştır' doğa gibi PC işletim sistemi ile uyumluluk nedeniyle bilim adamları arasında bulduk. Biz ExCYT, en son teknikleri çok çeker PC/Mac'te kolayca kurulabilir bir grafik kullanıcı arabirimi (GUI) geliştirilen çeşitli bilim adamı yabancı programlama için analitik teknikler kabul edilen ve değerli sağlamak, dimensionality azaltma sezgisel görselleştirme, kümeleme Yöntemler çıktı bu keşfetmek için yeni özellikler ile birlikte literatürde atıf için kümeleme algoritmaları ile heatmaps ve Roman yüksek boyutlu akış/kutu araziler de dahil olmak üzere.

ExCYT MATLAB'de yerleşik bir grafik kullanıcı arabirimidir ve bu nedenle de MATLAB içinde doğrudan çalıştırılabilir veya herhangi bir PC/Mac yazılım yüklemek için kullanılabilir bir yükleyici sağlanır Https://github.com/sidhomj/ExCYT kullanılabilir bir yazılımdır. Biz nasıl veri almak, ön işlemden, kuralları t-SNE dimensionality azaltma, küme veri, sıralama ve Kullanıcı tercihlerini ve faiz kümeleri üzerinden heatmaps ve roman hakkında bilgi görüntüler dayalı kümeleri filtre için detaylı bir iletişim kuralı mevcut yüksek boyutlu akış/kutu araziler ()Şekil 1). Eksenleri t-SNE parsellerde keyfi ve rasgele birimlerinde ve bu nedenle her zaman kullanıcı kolaylığı için rakamlar gösterildiği gibi arabirim. Boyama "t-SNE Heatmaps" veri noktalarının belirtilen işaretleyici sinyal dayalı sarı maviden etmektir. Çözümler kümeleme, veri noktası rengini rasgele küme sayısına dayanır. İş akışının tüm parçalar tek panelinde GUI ()Şekil 2 yürütülen olabilir & Tablo 1). Son olarak, biz ExCYT kullanımı daha önce yayımlanmış veri renal hücreli karsinom da benzer yöntemlerle analiz literatürde bağışıklık manzara keşfetmek Tarih gösterecektir. Bir hesap kayıt üzerine https://premium.cytobank.org/cytobank/projects/875, rakamlar bu el yazması ile birlikte aşağıdaki iletişim kuralı oluşturmak için kullanılan örnek veri kümesi bulunabilir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. toplama ve sitometresi veri hazırlama

  1. Tüm tek lekeleri bir klasörde kendilerini ve etiket tarafından kanal adıyla (fluorophore tarafından imini içermeden) yerleştirin.

2. veri ithalat & ön işleme

  1. Duraklatmak veya bu analiz boru hattı kaydetmek için çalışma alanı olarak kaydetme için programın sol alt Çalışma alanını Kaydet'i düğmesini kullanın bir '. MAT' Yük çalışma alanı düğmesi ile daha sonra yüklenebilir dosya. Program birden fazla örneğini bir anda çalıştırmayın. Bu nedenle, yeni bir çalışma alanı yüklerken, ExCYT çalışan diğer hiçbir örnek kontrol etmek emin olun.
  2. Analiz boru hattı başlamak için ilk sitometresi (akış sitometresi veya kitle sitometresi – CYTOF), Dosya seçimi parametrelerini seçin numarası (Bu örnek kullanımı için 2.000) dosyasından örnek olayların altında türünü seçin. Veri başarıyla alındıktan sonra bir iletişim kutusu kullanıcıya verileri başarıyla alındığını bildiren yukarı açılır.
  3. Bagwell & Adams9tarafından yapılan bir isteğe bağlı otomatik-tazminat adım yapmak için Auto-tazminat düğmesine basın. Tek leke içeren dizini seçin. Kullanıcı arabirimi diyalog içinde günahı örnek seçin.
    1. Bir ileri/yan-dağılım kapı herhangi tazminat matris hesaplamak için olayları seçmek için kullanılan bu dizindeki örneklerinin yerleştirin. Bu günahı örneği bu amaç için kullanmak için tavsiye edilir. Bu noktada, bir algoritma her tazminat matris hesaplamak için tek lekeler içinde olumlu olayları tanımlamak için günahı örnek 99inci yüzdelik tutarlı eşikleri ayarlamak için uygulamaya konmuştur. Bu bittiği zaman, bir diyalog kutusu tazminat gerçekleştirilen kullanıcı bilgi verecektir.
  4. Daha sonra Kapı nüfus basın ve Kongre akışında Sitometresi Analizi olarak faiz, hücrelerin nüfus seçin. Nüfus hücre seçildiğinde, olayları aşağı akım Analizi (10.000 bu olaylarda) yüzdesini girin.
  5. Sonra liste kutusunda önceden işleme kutusunun sağ analizde kullanılacak numara kanalları seçin (örnekte gösterilen belirli kanalları kullanın).

3. t-SNE Analizi

  1. Programın başlangıç başlamak için t-SNE düğmesine basın t-SNE butonunun altında penceredeki görselleştirme için azaltılmış dimensionality veri kümesi hesaplamak için. T-SNE görüntü kaydetmek için TSNE görüntü kaydetmekbasın. 8 ile bir makinede @ 3.4 GHz ve 8 Bu adım yaklaşık 2 dakika 10,000 olayları, 50.000 olaylar için 10 dakika ve 100.000 olaylar için 20 dakika boyunca almalı GM RAM CPU.
  2. 'T-SNE heatmap oluşturmak için ', birkaç CYTOF yayınları10,11' de seçim İşaretçisi özgü t-SNE açılır menüsünden bir seçeneği görüldüğü gibi (CD64 veya CD3 belirli işaretleri örnekte gösterildiği gibi kullanın). Bir şekil şekil oluşturmak için kaydedilebilir t-SNE arsa bir heatmap temsil göstermek yukarıya açılır.
  3. T-SNE parsellerde daha da aşağı akım analizleri Kapısı t-SNE düğmesini kullanarak Kullanıcı tarafından ilgi alanları seçin.

4. küme analizi

  1. Kümeleme Analizi başlamak için Kümeleme yöntemi listbox (örnekte bize DBSCAN mesafe faktörü 5 diyalog kutusu listbox sağında) bir seçenek seçin. Küme düğmesine basın.
  2. 'Otomatik kümeleme parametreler' panelinde bulunan otomatik kümeleme algoritmaları için aşağıdaki seçeneklerden birini kullanın:
    1. Zor KMEANS (üzerinde t-SNE): azaltılmış 2 boyutlu t-SNE verileri için kümeleme k ortalamalar uygulamak ve algoritma12' ye sağlanacak küme sayısı gerektirir.
    2. (Üzerinde HD veri) zor KMEANS: k ortalamalar kümeleme için t-SNE algoritması verildi özgün yüksek boyutlu verilere uygulamak. Bir kez daha, küme sayısı algoritması için sağlanması gerekiyor.
    3. DBSCAN: Azaltılmış 2 boyutlu t-SNE veri kümeleri ve genel boyutunu belirler bir boyutlu mesafe faktörü gerektiren gürültü13 ile kayma kümeleme yoğunluğu tabanlı uygulamalar denilen kümeleme, kümeleme yöntemi uygulamak kümeleri. Çoğu kez azaltılmış t-SNE temsilciliği mevcut küme yuvarsı olmayan küme mümkün olduğu gibi kümeleme algoritması bu tür küme t-SNE azaltılması için son derece uygundur. 2-boyutlu veriler üzerinde faaliyet nedeniyle gerçeğini, Ayrıca, daha hızlı kümeleme algoritmaları biridir.
    4. Hiyerarşik kümeleme: Geleneksel hiyerarşik kümeleme yöntem burada tüm Öklid uzaklığı matris algoritma küme boyutunu ayarlar bir mesafe faktörü sağlayarak önce tüm olayları arasında hesaplanır yüksek boyutlu verilere uygulamak.
    5. Ağ grafik- Temel:11,14algılamak için kullanıcının istediği nadir altgrupları olduğunda akış sitometresi verileri analiz içine en son zamanlarda kullanılmaya başlanan bir kümeleme yöntem uygulanır. Bu yöntem ilk veri tüm olaylar arasındaki bağlantıları belirler bir grafik oluşturmaya dayanır. Bu adım k-en yakın komşular sayısıdır grafik oluşturmak için bir başlangıç parametresi sağlama oluşur. Bu parametre genellikle küme boyutu belirler. Bu noktada, bir grafiğe uygulanan algoritma kümeleme 5 istihdam kullanıcıya isteyen başka bir diyalog kutusu açılır. Bu grafik, Danon yöntemi ve bir spektral kümeleme algoritması14,15,16,17,18modüler en üst düzeye çıkarmak için 3 seçenek içerir. Genellikle daha hızlı küme çözümü isteyen, spektral kümeleme veya hızlı açgözlü modülerlik maksimizasyonu öneririz. Danon yöntemi yanı sıra modülerlik maksimizasyonu yöntemleri kümeleri en iyi sayısını belirlemek, spektral kümeleme programa verilecek küme sayısı gerektirir.
    6. Kendi kendine organize harita: Yüksek boyutlu veri küme için bir yapay sinir ağı kullanır.
    7. GMM-Beklenti Maximization: yüksek boyutlu veri küme için Beklenti Maximization (EM) tekniği kullanarak bir Gauss karışım modeli oluşturun. 19 kümeleme yöntem bu tür aynı zamanda küme sayısını girmek kullanıcı gerektirir.
    8. Variational Bayesian kesmesi için GMM: Gauss karışım Model oluşturmak, ancak program verilecek küme sayısı gerektiren süre EM farklı olarak, bu otomatik olarak karışımı bileşenleri k.20 sayısını belirleyebilirsiniz (daha büyük beklenen küme sayısı), algoritma kendi başına en iyi numarasını belirler.
  3. T-SNE Arsa belirli bir alanda çalışmaya, Kullanıcı tanımlı kümeleri bir dizi çizmek için Küme el ile Seç düğmesine basın. Not, kümeleri Üyeler (her olay sadece 1 kümeye ait olabilirYani, ) paylaşamazsınız.

5. küme filtrasyon

  1. Kümelerini kümelerinin ya el ile tanımlanan veya üzerinden aşağıdaki şekilde filtreleyin yukarıda açıklanan otomatik yöntemlerinden birini yoluyla olabilir.
    1. Kümeleri ( Küme filtre panelinde) herhangi bir denemede ölçülen işaretleri göre sıralamak için sıralama açılır menüsünden bir seçenek belirleyin. Sipariş artan veya azalan düzende olup olmadığını belirlemek için sıralama açılır menüsünün sağındaki Artan/azalan düğmesine basın. Bu kümeleri listesini 'Kümeleri (filtreleme)' liste kutusu güncelleştirmek ve bu marker medyan küme ifadesinin azalan düzende yeniden düzenleyin. 'Kümeleri (filtreleme)' liste kutusunda belirtilen yüzdesi bu küme temsil eden nüfusun yüzde gösterir.
    2. Belirli bir kanal boyunca belirli bir küme için minimum eşik değerini ayarlamak için eşik açılır menüsünden bir seçenek belirleyin (Bu örnekte bize işaret CD65 ve küme bir eşik, 0,75). Grafik aşağıdaki sayısal kutuya bir değer yazın veya bir eşik ayarlamak için kaydırma çubuğunu kullanın. Eşiği ayarlandıktan sonra eşik yönünü belirtmek için Eşik Ekle yukarıda ya da Aşağıda eşik Ekle tuşuna basın. Bu eşik ayarladığınızda, Kullanıcı hangi eşikleri Şu anda uygulanmakta olan farkında bu yüzden nerede marker, eşik değerini ve yön listelenir eşikleri yanındaki metin kutusuna 'Küme filtre' panelinde listelenir. Son olarak, t-SNE Arsa filtrasyon gereksinimlerini karşılamayan kümeleri bulanıklık tarafından güncellenir ve 'Kümeleri (filtreleme)' listbox filtrasyon gereksinimlerini karşılamak kümelerini göstermek için güncellenir.
    3. Frekans bir küme için minimum bir eşik ayarlamak için sayısal bir kesme Küme sıklığı eşik (%) girin (Bu örnek kullanım %1) olarak küme filtre panelinde kutu.

6. küme analizi ve görselleştirme

  1. Kümeleri daha fazla analiz ve görselleştirme için seçmek için kümeler kümeler (filtreleme) liste kutusunda seçin ve bunları Küme analiz liste kutusuna taşımak için seçin à düğmesine basın.
  2. Heatmaps kümeleri oluşturmak için Küme analiz listbox ilgi kümelerini seçin ve Kümeleri HeatMap düğmesine basın. Bu düğmeye basıldığında bir rakam bir ısı haritası ile birlikte dendrograms küme ve parametre eksen içeren açılır. Dendrogram dikey eksende kümeleri tarafından bu süre yatay olarak dendrogram yakından ilişkili Grup eksen Co ilişkili işaretçileri grubu. Heatmap kaydetmek için dosyasını basın | Kurulum ihracat | İhracat.
  3. Bir 'Boyutlu yüksek kutu arsa' veya 'Yüksek boyutlu akış çizim' oluşturmak için Küme analiz listbox ilgi kümelerini seçin ve Yüksek boyutlu kutusu çiz düğmesini veya Yüksek boyutlu akış Arsa düğmesine basın. Bu araziler görsel olarak dağılımı değerlendirmek için kullanılan çeşitli kümeleri kanal tüm boyutları verilen.
  4. Kümeleri geleneksel 2D akışı araziler içinde göstermek için dönüştürme (doğrusal, log10, arcsinh) seçin ve kanal Akışı geleneksel çizim masası ve basın akışı geleneksel arsa.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

ExCYT kullanılabilirliğini sınamak için analiz ettik adlı bir veri kümesinin Chevrier ve ark. 'Bir bağışıklık Atlas, açık hücre böbrek nerede grubu CyTOF analiz 73 alınan tümör örnekler üzerinde kapsamlı bir bağışıklık paneliyle yürütülen Karsinomu' başlıklı tarafından yayınlandı hastalar11. İki ayrı panel, myeloid ve lenfoid bir panel, phenotypically tümör microenvironment karakterize etmek için kullanılmıştır. Çalışmamızın amacı kendi t-SNE sonuçlarını özetlemek ve analizi, gösterilen ExCYT aynı sonuca gibi ek yöntemleri görselleştirme ve küme analizi göstermek için kullanılan olabilir küme oldu.

Özgün makale, lenfoid panel tarafından tanımlanan 22 T hücre kümeleri ve 17 hücre kümeleri miyeloid panel tarafından tanımlanan Grup nitelendirdi. Şekil 3 & Şekil 4 yayın grubu renk kodlu küme çözümleri ve t-SNE heatmaps subpanels A, B & C. içinde t-SNE arsalar kümeleri, heatmaps gösterir Çözümlemeyi gerçekleştirmek için biz el ile geçişli veri Cytobank alınan ve 2.000 olaylar her dosyadan örnek veya az 2.000 olaylar, olsaydı tüm dosya içinde orijinal el yazması resimli analiz boru hattı takip aldı. Bu noktada, biz toplam 100.000 olayların bizim sonrası gating subsampling parametresi ile örnek, t-SNE analiz ve kümeleme yöntemleri çeşitli verileri çeşitli yollarla incelemek için kullanılır.

İlk olarak, biz t-SNE analiz tamamlanıyor ve çeşitli veri işaretleyicilerini (Şekil 3A) heatmaps oluşturma aynı analiz boru hattı orijinal el yazması olarak takip ederek miyeloid paneli inceledi. Orijinal el yazması t-SNE heatmaps 99inci yüzdelik her işaretçi için normalleştirilmiş iken, ExCYT bu tür normalleştirme onun heatmaps için bir iş yapıyor. Ancak, işaretleyici ortak ifade benzer dağıtımları orijinal el yazması içinde açıklandığı gibi tespit edildi. O zaman 100 k-en yakın komşuları ile grafik oluşturma ve grafik grafik modüler 19 bulduğumuz ExCYT içinde Fast-açgözlü uygulama kullanarak en iyi duruma getirme yoluyla kümeleme tarafından verileri kümeleme bir ağ grafik tabanlı yöntemi uygulanan alt nüfus hücre (Şekil 3B). ExCYT tarafından heatmap ile oluşturulan bu kümeler heatmap karşılaştırma özgün makale yayımlandığında, myeloid hücre (Şekil 3 c) benzer kümeleri tanımlamak başardık kaydetti. Dikkat, orijinal el yazması tespit ve HLA-DRinttarafından CD68intCD64intCD36 tanımlanan bizim analizde tespit myeloid hücrelerin iki alt nüfus tezat+CD11b+ (küme 13) ve HLA-DR+ CD4+CD68+CD64+CD36-CD11b- (18 küme). Bu iki popülasyonun yüksek boyutlu kutu arsa tarafından Görselleştirme istatistiksel olarak anlamlı farklılıklar (Mann-Whitney) belirtilen altı işaretleri (Şekil 1 d) saptandı.

Daha sonra bir daha geleneksel ve daha hızlı hiyerarşik kümeleme yaklaşım lenfoid paneliyle analiz ettik. Bu yaklaşım benzer işaret dağıtımları t-SNE heatmaps (Şekil 4A) üzerinden vermiştir. Ayrıca, veri yolu ile hiyerarşik kümeleme (Şekil 4B), kümeleme lenfoid hücre (Şekil 4 c) benzer kümeleri gösterdi. Not, ayrıca CD4 tanımlanan orijinal el yazması benzersiz düzenleyici T hücre popülasyondan tespit+CD25+Foxp3+CTLA-4+CD127- (küme 17) bizim yüksek boyutlu akış Arsa (Şekil 4 d) üzerinden.

Son olarak, hızlı ve nicelik belirteçleri arasındaki ortak ilişkileri değerlendirmek için ExCYT bir yöntemden istihdam etmek istedik. Biz 5000 (Şekil 4E) iki boyutlu t-SNE veri kümelerinde için zor k ortalamalar kümeleme algoritması kullanarak başladı. O zaman bir heatmap bu kümeler (Şekil 4F) oluşturmak için tüm işaretleri bu kümeler medyan ifade kullanılır. Bu heatmaps yanı sıra benzer olan sütunlar satır küme, veri kümelerinin iyi bir kafes uygulamak ve sonra bir heatmap oluşturma soyutladığı yöntemi iş ilişkilerini kolayca, Tim-3, işbirliği Derneği gibi PD-1, CD38, devam etmemizi sağlar ve 4-1BB.

Figure 1
Şekil 1: ExCYT boru hattı & özellikleri. (A) ExCYT başlar ham FCS veri alma, isteğe bağlı tazminat vurması, perdeleme ve rasgele önce aşağı akım Analizi alt örnekleme tarafından. Bu tüm olayları analiz ediliyor analiz ediliyor deney ilgili sağlar. t-SNE dimensionality azaltma sonra tüm olayları görselleştirmek için gerçekleştirilir ve t-SNE heatmaps fenotipik dağıtımları görselleştirmek için oluşturulabilir. Son olarak, kümeleme algoritmaları çeşitli t-SNE dönüştürme ya da yüksek boyutlu ham veri üzerinde uygulanabilir. (B) yeni sıralama ve eşik özellikleri hızlı bir şekilde muhtemelen yüzlerce kümeden oluşan grupları ilgi bulmak zordur sıralamak kullanıcılara izin verir. (C) Heatmaps kümelerinin her diğer yanı sıra hangi işaretleri Co ilişkilendirmek için birden çok küme karşılaştırın incelemek için oluşturulabilir. (D) roman yüksek boyutlu akış/kutu araziler geri perdeleme form verileri yüksek boyutlu doğa takdir ederken özgün veri kümeleri olarak oluşturulabilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 2
Resim 2: ExCYT grafik kullanıcı arayüzü: Kullanıcı kendi veri alır gibi bir düzene iş akışı soldan panelinin sağına çalışmak için grafik kullanıcı arabirimi sağlar ExCYT t-SNE dimensionality azaltma, kümeleme ve son küme analizi ve görselleştirme yürütmektedir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 3
Şekil 3: Rekapitülasyon alt gruplarından Myeloid Chevrier vd. (A) belirteci t-SNE heatmaps myeloid paneli (B) t-SNE Arsa miyeloid paneli renk kodlu ağ-grafik kümeleme algoritması (C) Heatmap çözüm miyeloid panelde kümeleme tarafından tanımlanan küme tarafından (D) karşılaştırmalı yüksek boyutlu kutu arsa içinde orijinal el yazması başvurulan miyeloid altgrupları (kümeleri 13 ve 18) zıt karşılaştırma Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 4
Şekil 4: Rekapitülasyon alt gruplarından lenfoid Chevrier vd. (A) belirteci t-SNE heatmaps lenfoid paneli (B) t-SNE Arsa lenfoid paneli renk kodlu hiyerarşik kümeleme algoritması tarafından (C) Heatmap lenfoid paneli (D) yüksek boyutlu akışı çözüm kümeleme tarafından tanımlanan küme Arsa 5000 kümenin zor tanımlanan düzenleyici T hücre nüfusu (küme 17) orijinal el yazması (E) kümeleme çözüm k-t-SNE veri kümeleri k ortalamalar kümeleme çözüm lenfoid üzerinde tanımlanan (F) Heatmap analizine anlamına gelir paneli gösteren işaret ortak dernekler. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

No Açıklama Adı (GUI)
1 Sitometresi türünü seçin NA
2 Rasgele ham veri alt örnekleme NA
3 Seçme eğe için çözümleme Dosyaları seçin
4 Auto-tazminat ham veri dizini tek lekeler için sağlanan temel Auto-tazminat
5 T-SNE ve kümeleme analizi için olayları seçmek için geçişi Kapı nüfus
6 Rasgele, alt örnekleme veri (mutlak sayı) geçişli NA
7 Rasgele, alt örnekleme veri (geçişli nüfusunun yüzde) geçişli NA
8 Kanal analiz için seçin NA
9 Çalışma t-SNE dimensionality azaltma t-SNE
10 t-SNE pencere NA
11 Çalışma alanını Kaydet Çalışma alanını Kaydet
12 Çalışma alanını yüklemek Çalışma alanını yüklemek
13 T-SNE heatmap seçme işaretçisi oluşturmak NA
14 Kapı t-SNE için t-SNE analiz select nüfusun yeniden yapın Kapı t-SNE
15 T-SNE pencere resim olarak kaydet TSNE görüntü kaydetmek
16 Kümeleme algoritması seçin Kümeleme yöntem
17 Verilen için kümeleme parametre girme algoritması NA
18 Küme Analizi Küme
19 Manuel kümeler çizmek El ile küme seçin
20 Küme analizi yeniden yapmak için tüm kümeler temizleyin Açık kümeler
21 Kümeleri geçerli filtre koşulları altında göster Kümeleri (filtreleme)
22 Seçme kümeleri küme analiz listbox kaldırın Kaldır <--
23 Küme küme analiz liste kutusuna eklemek Seçin ->
24 Tüm olayların geleneksel heatmap analizde oluşturmak Olayların HeatMap
25 Sıralama kümeleri tarafından işaretleyiciyi seçin Sıralama
26 Seçme işaretçisi tarafından küme eşik Eşik
27 Geleneksel heatmap seçin küme küme analiz listbox oluşturmak HeatMap kümeleri
28 Sıralama sırasını ters çevir Artan/azalan
29 Bütün eşikleri temizleyin Bütün eşikleri temizleyin
30 Frekans ayarı eşik kümeleri için Küme sıklığı eşik (%)
31 Geçerli eşikleri 'Kümeleri (filtreleme)' listbox üzerinde etkin listesi Eşikleri
32 Yüksek boyutlu kutu arsa Yüksek boyutlu kutu arsa
33 Yüksek boyutlu akış Arsa Yüksek boyutlu akış Arsa
34 Yatay eksen parametresi için geleneksel akışı Arsa NA
35 Dikey eksen parametresi için geleneksel akışı Arsa NA
36 Yatay eksen üzerindeki geleneksel akışı arsa için veri dönüştürme NA
37 Geleneksel akışı arsa üzerinde dikey eksen için veri dönüştürme NA
38 Geleneksel akışı çizim oluşturma Geleneksel akışı Arsa
39 Gösteri kümeleri çözümleme için NA

Tablo 1: Tek bakış ExCYT GUI mevcut işlevleri

Yazılım/paketinin adı ExCYT CYT FCS Express flowCore openCyto FlowMeans
Program türü MATLAB MATLAB Tek başına uygulama R R R
Kullanıcı fiyat Ücretsiz Ücretsiz 1.000 $ Ücretsiz Ücretsiz Ücretsiz
Grafik Kullanıcı arabirimi Evet Evet Evet Hayır Hayır Hayır
Dimensionality azaltma teknikleri t-SNE t-SNE, PCA t-SNE, PCA, kürek hiçbiri hiçbiri hiçbiri
Kümeleme algoritmaları K-anlamına gelir
DBSCAN
Hiyerarşik kümeleme
Kendi kendine organize harita
Birden çok ağ-grafik yöntemleri temel
GMM - EM
GMM - Variational Bayesian kesmesi
K-anlamına gelir
GMM - EM
Tek ağ-grafik yöntemi (Phenograph) dayalı
K-anlamına gelir hiçbiri elle perdeleme iş akışı Otomasyonu K-anlamına gelir
Yetenek-e doğru sıralama/filtre kümeleri Evet Hayır Hayır Hayır Hayır Hayır
Yüksek boyutlu akış araziler Evet Hayır Hayır Hayır Hayır Hayır

Tablo 2: Yazılım destekli Akış Sitometresi Analizi çözümleri genel bakış

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Burada en son yüksek boyutlu veri uygulamak için programlama arka plan ile bireylerin izin ExCYT, MATLAB tabanlı algoritmalar yüksek boyutlu sitometresi, veri çözümlemesi kolaylaştırmak için çalışan bir roman grafik kullanıcı arabirimi mevcut analiz algoritmaları. Bu yazılım daha geniş bilimsel topluluk için kullanılabilirliğini akış sitometresi verilerine bir sezgisel ve kolay iş akışı içinde keşfetmek bilim adamları sağlayacaktır. T-SNE dimensionality azaltma iletken bir kümeleme yöntemi uygulayarak, güçlü olmak ile sıralama/filtre bu kümeleri aracılığıyla hızlı ve esnek, özelleştirilebilir heatmaps ve yüksek boyutlu akış/kutu araziler, bilim adamları yapmak için sadece mümkün olacak onların örneklerinde benzersiz olarak tanımlanan altgrupları anlıyorum ama sezgisel ve kolay anlaşılır onların arkadaşları tarafından görsel öğeler oluşturmak mümkün olacak.

Program çeşitli veri türleri (geleneksel akış sitometresi vs kitle sitometresi) işleme esnek olmakla birlikte, programın en uygun yardımcı programı için birkaç konuları vardır. Bunlardan ilki veri kalitesi, özellikle akış sitometresi veri ile ilgili olarak. Uygun tazminat ve emisyon spectra çakışan çözüm bulunmamaktadır büyük önem. Kötü telafi veri yanlışlıkla işaretleri yanlış ortak dernekler ve gerçek biyolojik önemi olmayan kümeler oluşumuna yol açabilir. Bu nedenle, giriş verilerinin t-SNE Analizi ve daha fazla aşağı akım çözümleme işlemine devam etmeden önce ses kalitesi olduğunu son derece tavsiye edilir. Ayrıca, ExCYT uygulanan otomatik tazminat algoritma kullanımı doğru bir şekilde tazminat parametreleri hesaplamak için tüm kanallar için açık tek lekeleri gerektirir.

ExCYT, kullanmak için diğer bir önemli faktör birden çok FCS dosyaları (Bu el yazması gösterildiği) bir analiz bitiştirme, onlar tüm kanalları üzerinden benzer olmalıdır. İlk olarak, bu aynı paneli örnekler üzerindeki tüm kanallar arasında hiçbir drift olduğunu tüm örnekleri ve kullanılması gerektiği anlamına gelir. Örneğin, bir iki örnek ayrı günlerde okumak için vardı ve lekeli CD8 FITC gün ama sitometresi gerilim içinde farklı bir gün biraz değiştirdi CD8 Vaha'da kaynaklanan tarihinde kuruldu, yanlış kümeleri aşağı akım analizde üretebilir , bu değişim aracı varyasyon ve biyolojik önemi nedeniyle değil bir fonksiyonu olarak oluşturulmadı şeklinde. Gelecek yorum-in ExCYT örnekleri tek onların lekeleri normalize etmek mümkün olsa da, bu noktada, dikkatli bir değerlendirme FCS dosyalarını birbirine ExCYT almadan önce karşılaştırılabilir olduğunu yapılması gerekir.

Son olarak, kümeleme işlemi bir Yani mutlak/katı değil. Farklı kümeleme algoritmaları ve parametreleri farklı küme çözümleri oluşturabilirsiniz. Algoritma çözüm uygun olup küme çözümü ile biyoloji anlayışlarını sentezleme tarafından belirlemek kullanıcı içindir. Örneğin, tümörlerin bağışıklık ortamı anlama zaman bir makroskopik kümelerinde (Yani, T hücreleri vs B hücreleri vs Myeloid hücrelerin) ilginizi çekebilir iken başka makroskopik kümeleri altgrupları ilginizi çekebilir. Kümeleri çözünürlüğe Kullanıcı ve bu nedenle, tek tarafından belirlenir çözüm kümeleme 'doğru' Bu ExCYT içinde mevcut yüksek boyutlu akış araziler kullanma ana avantajlarından biri. Onlar sadece bir biyolojik ilgili yol ama denemeye isteniyor bilimsel soru alakalı bir şekilde kümelenmiş olup olmadığını belirlemek kullanıcının yeteneği belirli bir küme dağıtım tüm kanalları üzerinden görselleştirmek için yardımcı olabilir. Amacımız bir bolluk kümeleme ek yöntemleri sunarken edebiyat küme yüksek boyutlu akış sitometresi verileri için kullanılan bir yöntem sağlamak için olmakla birlikte, hızlı bir şekilde üzerinden veri keşfetmeye k-anlamına gelir ve DBSCAN gibi yöntemler kullanmanızı öneririz yineleme kümesi numarası ve boyut ve ağ-grafik ve Gauss karışık modeli yaklaşımlar daha güçlü ama daha uzun sürmesine yaklaşımlar için doğru hareket.

Bu hususlar göz önüne alındığında, ExCYT hala yüksek boyutlu sitometresi veri keşfetmek için son derece esnek ve değerli bir araç ve diğer kullanılabilir paketleri analiz (Tablo 2) bu tür yapmak kullanılabilir daha benzersiz/ayırt özellikleri sunar . İlk olarak, ExCYT kendisi dimensionality azaltma kullanan ve kümeleme algoritmaları tarafından herhangi bir komut dosyası oluşturma/programlama bilgisi olmadan kullanılmak üzere onun yetenek çoğu Akış Sitometresi Analizi yaklaşımlar üzerinde ayırır. Ayrıca, birçok kümeleme algoritması edebiyat gösterdi toplayarak, küme veri için seçeneklerin çoğu sağlamak inanıyorum. Son olarak, bizim benzersiz özellik küme filtrasyon ve görüntü yoluyla roman yüksek boyutlu akış araziler, birlikte sıralama sağlar kullanıcıların hızlı ve verimli bir şekilde, onların kümeler özelliklerini keşfetmek için 'keşfetmek' işlemi nadir yapma altgrupları basit ve etkili.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar ifşa gerek yok.

Acknowledgments

Yazarlar hiçbir katkıda bulunanlar var.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Geri çekilmesi sayı 143 akış sitometresi yüksek boyutlu analiz t-SNE kümeleme ısı haritalar Dimensionality azaltma
ExCYT: yüksek boyutlu sitometresi veri analizi düzene için bir grafik kullanıcı arabirimi
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter