January 2nd, 2011
Visual analitik (VA), etkileşimli veri analiz yeni bir yaklaşım. Bu video, yüksek verimli biyolojik deneyler tarafından getirilen veri aşırı sorunu tartışmak ve bu soruna bir çözüm olarak VA teklif. Içinde ve immünolojik veri setleri arasındaki Tableau denilen bir VA aracını kullanarak video analizi göstermektedir.
İmmünolojik verilerin görsel analitik tekniklerle analizinin kolaylaştırılması. Veri toplama ve depolama kapasitesi hızla ilerlemiş olsa da, onu işleme ve analiz etme yeteneği ve karşılaştırıldığında çok az ilerleme kaydetmiştir. Sonuç olarak, büyük veri kümeleri genellikle biyomedikal laboratuvarlarda bulunur ve bunlar etkili veya verimli bir şekilde analiz edilmez.
Bununla birlikte, potansiyel olarak zengin ve güçlü bilgiler, depolama sistemlerinin uçurumunda kaybolur. Görsel analitik veya VA, büyük karmaşık veri kümelerini analiz etmenin yeni bir yolu olarak ortaya çıkmıştır. VA teknikleri, analistlerin genel eğilimler veya aykırı değerler gibi verilerdeki kalıpları tespit etmek için görsel zekalarını kullanmalarına olanak tanıyan görselleştirmelere dayanır.
Bu hızlı görselleştirmeler, verileri keşfederken hızlı hipotez oluşumuna olanak tanır. VA araçlarının esnekliği, analistin ilişkilerini keşfederken birden çok veri kümesini hem yakınlaştırmasına, detayına inmesine hem de bağlantılar kurmasına olanak tanır. VA'nın entegre veri kaynaklarına uygulanması sayesinde, kullanıcı yeni ve önemli bulguları ortaya çıkarabilir.
Ebeveyn analizi, bir VA aracı uzmanının ve alan uzmanı olarak da bilinen bir tekniğin, alan uzmanının veriler hakkında biyolojik olarak ilgili sorular sorduğu birlikte çalıştığı bir VA yaklaşımıdır. VA araç uzmanı daha sonra bu soruyu yanıtlamaya yardımcı olan veya daha fazla araştırmaya yol açan kalıpları ortaya çıkarmaya yardımcı olabilecek görselleştirmeler oluşturur. Bu işlem, içgörü sağlayan farklı görselleştirmeler oluşturmak için yinelenebilir.
Eşleştirilmiş bir analiz VA yaklaşımının büyük ve karmaşık bir biyomedikal veri setine uygunluğunu test etmek için yola çıktık. Ön pilot deneylerde, mevcut sorun için mevcut VA araçlarından birkaçını değerlendirdik. Elimizdeki görev için en uygun araç olarak Tableau by Tableau yazılımını seçtik.
Bu pilot deneylerdeki seçim kriterleri, kullanıcı dostu olma, genel kullanılabilirlik gibi öznel parametrelerin yanı sıra bir dizi etkileşim tekniği ve görselleştirme özellikleri gibi nesnel teknik özelliklere dayanıyordu. Burada, bulaşıcı hastalıklar alanında çalışan bir laboratuvara özgü bir Microsoft Excel elektronik tablosunda bir veri setine sahibiz. Bu set, genetik DNA dizilerindeki varyasyon hakkında bir konu tanımlayıcı veri içerir.
Bu durumda, denek için NF kappa BIA tek nükleotid polimorfizmleri veya SNS, ayrıca bu durumda birkaç biyolojik molekülün gözlenen konsantrasyonu, bağışıklık hücrelerinin spesifik uyaranlarla uyarılmasından sonra deneğin bağışıklık hücreleri tarafından üretilen sitokinlerdir. Şimdi e-tabloya doğru aşağı kaydıracağız. Size bu veri setinin hacmi hakkında bir fikir vermek için, bu durumda NF Kappa BIA geninin farklı parçaları olan genotip ile gözlemlenen sitokin yanıtı arasında genel bir ilişki olup olmadığını öğrenmekle ilgileniyoruz.
Stimülasyondan sonra, şimdi veri kümesini Tableau ile bağlayacağız ve NF kappa BIA tablosunu içe aktardığımızdan emin olacağız. Sol tarafta, tablonun doğru tabloya bağlı olduğunu ve sütun değişkenlerini otomatik olarak Tablo'nun çağırdığı, boyutlar ve hesaplamalar olarak ayırdığını görebilirsiniz. Boyutlar basitçe, verileri kategorilere ayıran ve bu sütundaki nicel değerleri ölçen sütunlardır.
Bu görselleştirme için, şimdi gözlemlenen sitokin tepki konsantrasyonuna karşı uyaran konsantrasyon seviyelerini çizeceğiz. Şimdi sitokin konsantrasyon seviyelerinin değerlerinin ortalamasını alıyoruz. Konsantrasyon seviyelerinin sırası yanlıştır, ancak bunu hızlı bir şekilde uygulamak oldukça kolaydır.
Ardından görünümü ekrana sığacak şekilde değiştirebilir ve verilerin daha kolay görselleştirilmesini sağlayabiliriz. Farklı genotipler arasında nasıl ayrım yapacağımızı araştırmak istediğimiz için tek yapmamız gereken genotip boyutunu bu renk bölümüne bırakmak. Görselleştirme, genotipe göre otomatik olarak ve hemen ayrılır.
Şimdi, farklı bir görüntüleme formatı deneyebiliriz. Örneğin, bir çizgi grafiği, yakalamak istediğimiz bir deseni daha iyi ortaya çıkarabilir. Açıkçası başka birçok seçenek var.
Bu eşleştirilmiş analizdeki biyologlar, 3M oh oh iki adı verilen bir reaktif ile stimülasyondan sonra QNF alfa adı verilen sitokin belirteçlerinden birinin üretiminin ilişkilerini keşfederek başlamamızı önermektedir. Bunu yapmak için, işaretleyici boyutunu, TNF alfa'yı ve uyaran boyutunu 3M oh oh iki'yi filtrelememiz gerekiyor. Filtreleme işlemini daha esnek hale getirmek için, hem işaretleyici hem de uyaran boyutları için hızlı filtreyi göster seçeneğini seçebilir ve bunun tek bir değer listesi olduğundan emin olabiliriz.
Bu görselleştirme, farklı renklerde genotipe göre ayrılmış üç MO oh iki stimülasyonun farklı seviyelerinden sonra TNF alfa üretimi ile bir fark olduğunu açıkça göstermektedir, işaretleyici ve uyaran filtre değerlerinin başka herhangi bir kombinasyonunu seçebiliriz ve görselleştirme buna göre değişecektir. Excel'e benzer şekilde, ayrı sekmelerde farklı görselleştirmeler oluşturabiliriz. Sunum amacıyla, birden fazla analizin özet bir görünümünü de oluşturabiliriz.
Bu durumda, farklı bir NF Kappa BIAS snip genotipine sahip birkaç denekte TNF Alpha üretimini araştırdık. Bu gösterimde, eşleştirilmiş bir analiz VA yaklaşımı kullanarak yaklaşık bir dakika 30 saniye içinde bir dizi güçlü görselleştirmeyi başarıyla ürettik. Benzer bir görselleştirme kümesinin Excel'de oluşturulması genellikle bir biyomedikal araştırmacının 30 dakikasını gerektirir.
Önceki bir örnek, basit bir iki boyutlu analizdi. VA'nın gerçek gücü, aynı anda birden fazla boyutu görselleştirme yeteneğidir. Örneğin, Tableau, anahtar değerlerin mantıksal birleştirmeleri yoluyla veri kümeleri arasındaki analizi destekler.
Burada, aynı çalışma kitabına yerleştirilmiş iki elektronik tablo verilmiştir. İlk veri seti, önceki gösteri örneğinden biridir ve diğeri, aynı hücrede çoklu sitokin üretimi için akış sitometrisi adı verilen teknikle analiz edilen bir hücre veri setidir. Aynı zamanda, çoklu işlevsellik derecesi veya PFD adı verilen bir ölçü, içe aktarma aşamasında bunları tanımlamayı kolaylaştırmak için sayfayı adlandırabilirsiniz.
Bu, Tableau'nun iki elektronik tabloyu birbirine bağlamasına olanak tanır. Çoklu tablo seçeneğini seçtikten sonra, iki tabloyu birleştirmek için yeni tablo ekle özelliğini kullanabilirsiniz. Bu özellik, ikinci elektronik tabloyu birinciye ekler ve hücre tipi, konsantrasyon seviyesi, aşama ve grup uyaranı ve konu tanımlayıcısı gibi aynı anahtarları kullanarak veri kümelerini birleştirmek için birleştirme deyimlerini kullanır.
Boyutların elektronik tablo adına göre ayrıldığına dikkat edin. Bu, mantıksal ortak ifadenin bir parçası olmayan boyutları kullanmamıza izin verir. Örneğin çoklu işlevselliğin tanımı, birden fazla sitokin üreten hücrelerin yüzdesidir.
Örneğin, iki PFD olarak iki sitokin yapan bir hücre ve üç PFD olarak üç sitokin yapan bir hücre. Burada, bu değerleri görsel bir ekranda kullanabileceğimiz tek bir hesaplamada birleştirmek için bir hesaplanan alan oluşturuyoruz. Artık görselleştirmeyi oluşturmaya başlayabiliriz.
İlk olarak, PFD'lere karşı sitokin seviyelerinin konsantrasyonunu ikinin üzerinde çiziyoruz ve son demoda olduğu gibi, ikiden büyük PFD'lerin ortalama değerini alıyoruz. Konsantrasyon etiketlerini de manuel olarak ayarlayarak düşükten yükseğe doğru düzenliyoruz. Genotip bilgisi yalnızca bu gruptaki bazıları için mevcut olduğundan, genotip bilgisi içermeyen veri satırlarını filtrelememiz gerekir.
Tıpkı daha önce olduğu gibi, genotipi hızlı bir şekilde renk etiketine bırakabiliriz, bu da her bir farklı genotipi ayırt etmemizi sağlar. Ardından görünümü ekrana sığacak şekilde değiştirebilir ve verilerin daha kolay görselleştirilmesini sağlayabiliriz. Çubuk grafiği iki olarak da değiştirebiliriz.
Örneğin, bunu test eden bir çizgi grafiği, CYT yanıtının ve PFP yanıtının her bir genotip için spesifik modellere göre nasıl değiştiğine dair iyi bir fikir verir. GG genotipine sahip NF kappa b SNP'nin diğer genotiplere kıyasla farklı bir yanıt modeline sahip olduğunu hemen fark edersiniz. Farklı uyaranların bu model üzerindeki etkisini araştırarak bunu daha da keşfedebiliriz.
Uyaran boyutuna LPS eklendikten sonra, üç ana genotipin tüm konsantrasyonlarda benzer bir PFD seviyesi gösterdiğini, ancak yalnızca 3M MO oh iki uyaranla, GG genotipinin PFD'de düşükten yüksek uyaran konsantrasyonuna kadar keskin bir işaret gösterdiğini unutmayın. Bu bulgu, gelecekteki deneylerde test etmek için bir hipotez oluşturmamıza izin verir, yani uyaran türünün PFD'yi etkilediğini. Son iki gösterimde, hem veri kümeleri içinde hem de veri kümeleri arasında potansiyel olarak anlamlı kalıpları algılamak için görselleştirmenin hızlı bir şekilde oluşturulduğunu gördük.
Görsel analitiğin gücü, uygulamaya bağlı olarak analizin boyutlarını ölçeklendirerek ve bilgileri geniş veri kümelerine entegre ederek büyük veri kümelerine hızla genişletilebilir. Örneğin, kohort çalışmalarında oluşturulan birçok veri silosu ile VA, kategorik ve sayısal tabanlı veri kümeleri de dahil olmak üzere büyük miktarda birçok farklı veri türüne sahip herhangi bir alana potansiyel olarak uygulanabilen, yüksek oranda aktarılabilir bir yaklaşımdır. VA yaklaşımı iki ana avantaj sunar.
Bir, esnek hipotez üretimi. Kullanıcı, mevcut bulgulardan elde edilen veriler hakkında anında hipotezler üretebilir ve iki zaman kazanmak için hipotezi keşfeden yeni görselleştirmeleri hızla oluşturabilir. UVA araçlarının kullanılabilirliği ve verimliliği, geleneksel bilgi görselleştirme araçlarına göre ana avantajlarıdır.
Tipik olarak geleneksel yöntemler kullanılarak grafik oluşturmada yer alan çaba, Tableau gibi bir VA platformunda iki ila üç saat içinde kolayca gerçekleştirilen şeyi tamamlamak için birkaç iş günü sürebilir. Açıkçası, bunlar her biri belirli avantaj ve dezavantajlara sahip diğer uygulama platformlarıdır ve muhtemelen öyle olacaktır. Bu göreve para analizi ile yaklaşmanın ek faydası, karmaşık çok boyutlu verilerin analizine yönelik VA tabanlı bir yaklaşımın genel faydasına açıkça katkıda bulunur.
View the full transcript and gain access to thousands of scientific videos
Bu video, büyük immünolojik veri setlerini analiz etmenin zorluklarını tartışmakta ve bu soruna çözüm olarak görsel analitik (VA) yöntemlerini tanıtmaktadır. VA teknikleri, analistlerin karmaşık verilerdeki kalıpları ve eğilimleri tanımlamasına yardımcı olmak için görselleştirmeleri kullanmaktadır.