Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Underlättar analysen av immunologiska data med Visual analytiska tekniker

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visual Analytics (VA) är en ny metod att analysera data interaktivt. I den här videon diskuterar vi de data overload problemet orsakades av hög genomströmning biologiska experiment, och föreslå VA som en lösning på dessa problem. Videon visar analysen inom och mellan immunologiska datamängder med hjälp av en VA verktyg kallat tablån.

Abstract

Visual Analytics (VA) har vuxit fram som ett nytt sätt att analysera stora datamängder genom interaktiva visuell display. Vi har visat nyttan och flexibiliteten i en VA synsätt i sin analys av biologiska data. Exempel på dessa dataset i immunologi omfattar flödescytometri, Luminex data och genotypning (t.ex. enda nukleotid polymorfism) data. I motsats till den traditionella informationsvisualisering synsätt återställer VA analysen makten i händerna på analytikern genom att låta analytiker att engagera sig i realtid utforskande process. Vi valde VA programvara kallad tablån efter att ha utvärderat flera VA verktyg. Två typer av analyser arbetsuppgifter analys inom och mellan datamängder visades i videon presentation med hjälp av en metod som kallas parade analys. Kopplade analys, enligt VA, är en analys strategi, där en VA verktyg expert arbetar sida vid sida med en domän expert under analysen. Domänen experten är den som förstår betydelsen av uppgifterna, och ber de frågor som de insamlade uppgifterna kan adressen. Verktyget expert skapar sedan visualiseringar för att hitta mönster i data som kan besvara dessa frågor. Den korta fördröjning-tid mellan hypotesen generationen och den snabba visuell display av data är den största fördelen med en VA strategi.

Protocol

1. Exploration analys på tablån

  1. Du har en datamängd och du vill utforska de olika relationer mellan kolumner i informationen.
    1. (Figur 1) Import datasetet genom att klicka på "Anslut till data". Välj den datakälla typ och följ instruktionerna för att importera din databas.
    2. (Figur 1) Se till att måtten hyllan innehåller kategoriska kolumner medan åtgärderna hyllan innehåller numeriska kolumner från din databas. Ibland kan en dimension kolumn som ämne identifierare kan anges som åtgärd om den är numrerade. Ändra det till dimensioner genom att högerklicka på den och välj "Konvertera till dimensionen. I Figur 1, är kategorisk kolumner från datasetet som stimulans koncentration och identifierare ämne korrekt placerad i dimensioner hylla, och den observerade koncentrationen av cytokiner är korrekt placerade i åtgärder hylla.
    3. (Figur 2) Om det under analysprocessen, är ett beräknat fält behövs, högerklicka i antingen dimensioner eller åtgärder hylla och välj "Skapa Beräknat fält". Ingång beräkningen i rutan Formel med fält i kombination med funktioner och matematiska operationer. Figur 2 visar hur du skapar ett nytt fält som kallas PFD> 2 genom aggregering PFD2, PFD3 och PFD4 värderingar.
    4. (Figur 3) Skapa en 2-D tomt i tablån, vanligtvis med en dimension och ett mått av intresse. Eftersom gränssnittet erbjuder enkla dra och släpp-interaktion, kan valet av dimension och mäta enkelt ändras. Mått placeras normalt i kolumner hylla, och åtgärder i rader hylla. I figur 3 innehåller mått hyllan nivå stimulans koncentration, och de åtgärder hyllan innehåller observerade Halten av cytokiner.
    5. (Figur 3) För att differentiera visualisering av en viss dimension, placera den dimensionen etikett i text, färg eller storlek hylla, beroende på vilken typ av dimension. Text hylla försöker skilja data i visualiseringen genom att märka dem med textinformation från den valda dimensionen. Färg och storlek hyllan kommer automatiskt att skilja data efter färg och storlek, som kan justeras med rullningslisten längst ned på varje hylla. I figur 3, placering genotyp i färg hylla leder till separation av tre genotyper av distinkta färger.
    6. (Figur 3) Filtrera visualisering av de särskilda kolumnen variabler i andra dimensioner. Detta kan göras genom att dra dimensionen etiketten in i filtret hyllan. Ett fönster visas med en lista över värden att välja mellan. Det valda värdet kommer vara den enda värden kvar i visualisering.
    7. (Figur 4) Du kan kombinera visualisering med annan dimension eller åtgärd för att skapa en matris av visualisering. Detta kan göras genom att släppa flera dimensioner i kolumner hylla, och flera åtgärder i rader hylla. Figur 4 innehåller ett exempel på två kolumner visualisering matris genom att placera två olika dimensioner i kolumnerna hyllan.
    8. Att producera en liknande visualisering, högerklicka på den aktuella tabellen i det nedre vänstra hörnet, och utvalda "duplicate blad".
    9. Iterera analysen process för att identifiera intressanta trender eller extremvärden som kan hjälpa dig att generera nya hypoteser om uppgifterna.
  2. Du har flera dataset som genereras från samma källa, och vill utforska eventuella samband mellan dessa datamängder.
    1. Placera flera dataset i en samma källa, dvs placera två kalkylblad i samma arbetsbok, så att Tableau ansluta till dessa dataset genom samma anslutning.
    2. (Figur 5) Anslut datamängder genom logiska ansluta sig viktiga värderingar och se till att de dimensioner som är lika för flera dataset väljs. I Figur 5 finns det fem grundläggande värderingar för att gå med: celltyp, stimulans koncentrationsnivå, steg eller grupp, stimulans och under förutsättning identifierare.
    3. Utför analys liknar avsnitt 1.1.

2. Presentation behov som baserar

  1. Du vet relationer mellan data, men du vill snabbt kunna generera en lista med visualiseringar för användning i presentationen.
    1. Följ protokoll som beskrivs i avsnitt 1.1, och kommentera den visualiseringar därefter.
    2. Använd export funktionen i tablån för att producera bilder av visualiseringar.
  2. Du har genererat en uppsättning kraftfulla visualiseringar i tablån arbetsbok och vill dela den arbetsboken.
    1. Spara arbetsboken som tablån förpackade arbetsbok och dela denna fil.
    2. Kollegor utan Tableau Desktop kan ladda ner tablån Reader för att öppna den förpackade arbetsboken. Tableau Reader kan dina medarbetare att interagera med visualiseringar som du har skapat.

3. Representativa resultat

Figur 1
Figur 1. En skärmbildi tablån efter att importera kalkylbladet heter NFKBIA från Excel-filen demo.xls. Måtten och åtgärder hyllorna var ordentligt i med kategoriska och numeriska data, respektive.

Figur 2
Figur 2. Beräknat fält fönstret är åberopas för att skapa en speciell beräknat fält att använda i tablån. Listan på den nedre vänstra rutan hjälper till att identifiera möjliga områden, och listan på höger sida innehåller förkortning av funktioner som kan användas i formeln. I detta exempel ville vi att lägga till värden för PFD4, PFD3 och PFD2 att få det slutliga värdet som vi kallar PFD> 2

Figur 3
Figur 3. Visualisering av stimulans halt vs observeras cytokin koncentration. Visualisering visar en tomt på de olika koncentrationerna av stimulans 3M-002 mot observerade koncentrationen av cytokin TNF-α. Färgerna i linje avser olika genotyper för en enda nukleotid polymorfism i NFKBIA genen av individerna i vårt medfödda immunförsvar studie.

Figur 4
Figur 4. En skärmbild av ett två-kolonn visualisering matris. Vi genererade en två kolumner matris för att underlätta en sida-vid-sida jämförelse av svaren på två stimuli, 3M-003 och LPS. Den x-axeln är de olika koncentrationsnivåer för de två stimuli, och y-axeln plottar värden beräknat fält, flytväst> 2.

Figur 5
Figur 5. Dessa tablån dialog fönster visar hur man ansluter uppgifter som registrerats i olika kalkylblad. Ansluta data från olika kalkylblad kan uppnås genom att kombinera dessa med hjälp av logiska ansluta klausuler av viktiga värden.

Visualisering och analysverktyg
Funktion Tableau VIS-STÄMPEL xmdvtool Ggobi Starlight Gapminder Visulab InfoVis Toolkit Geotime Inspire
Parallell samordna tomter Ja Ja Ja Ja Ja Inga Ja Ja Inga Inga
Punktdiagram matriser Ja Inga Ja Ja Ja Inga Ja Inga Inga Inga
Dimensional minskning Inga Inga Ja Ja Inga Inga Inga Inga Inga Inga
Temporal dimensioner Ja Ja Inga Ja Ja Ja Inga Ja Ja Inga
Geospatial dimensioner Ja Ja Inga Inga Ja Ja Inga Inga Ja Inga
Text mining Inga Inga Inga Inga Ja Inga Inga Inga Inga Ja
Direkt manipulation av data Ja Ja Ja Ja Ja Ja Ja Inga Ja Inga
Filtrering Ja Ja Ja Ja Ja Ja Ja Inga Ja Ja
Utbyggbart till andra plattformar (t.ex. R) Ja Inga Ja Ja Inga Ja Inga Ja Inga Inga
CSV tabellformat Ja Ja Ja Ja Inga Inga Ja Ja Ja Inga
XML-data format Ja Inga Inga Ja Ja Inga Ja Ja Ja Inga
Kan hantera en0000 + rader Ja Inga Inga Inga Ja Inga Inga Inga Inga Ja
Dokumentation Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
Kommersiell produkt Ja Inga Inga Inga Ja Inga Inga Inga Ja Ja

Tabell 1. Lista över visuella analysverktyg och några av deras funktioner.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Tillkomsten av hög genomströmning teknik i modern biomedicinsk forskning har lett till en explosion av forskningsdata som kräver ett mer effektivt sätt för analys. Visual Analytics (VA) är vetenskapen om analytiska resonemang underlättas av interaktiva visuella gränssnitt (1). VA-approach återställer den analytiska kraften i händerna på mänskliga analytiker, i motsats till den traditionella metoden för att upptäcka mönster av dator. Visuell analys har använts till forskning inom olika områden, som t.ex. försvar forskning (1) och orkan trender (2). Hittills finns det bara ett fåtal exempel på VA tillämpningar inom biologi (3). Vi visar i denna video artikeln att VA är en metod som kan läggas till biologen arsenal av analysverktyg. Många VA mjukvaror finns allt från de som är under utveckling i akademiska laboratorier för att de som är kommersiellt tillgänglig. För vårt arbete med neonatal medfödd immunitet (4), valde vi tablån på grund av dess lämplighet i att analysera kalkylblad stil datamängder som finns i labbet. Andra VA verktyg, varav några vi nämnde i vår video artikel kan vara mer lämplig för andra typer av biologiska data. Vi listade de funktioner och egenskaper hos några av de mer populära VA verktyg i tabell 1. Denna lista är inte avsedd att vara uttömmande eftersom det är utanför ramen för vår studie, men det bör vara en bra utgångspunkt för forskare att bestämma lämplig VA verktyg för sina specifika data.

Det finns två viktiga punkter om VA som vi vill lyfta fram. Ett, är VA tillvägagångssätt för som ett utforskande processen genom att hjälpa analytikern snabbt plats mönster som allmänna trender och avvikelser i data. Tyngdpunkten i VA är att ge en kraftfull visualisering teknik för stora datamängder. Det är inte ett alternativ till statistisk analys. I själva verket är de flesta VA verktyg mycket begränsade i sin förmåga att utföra statistiska analyser även om vi räknar med att detta ska ändras inom en snar framtid. Den andra punkten som vi vill nämna är att de data som förbehandling före importera datasetet till en VA verktyg är avgörande för hur framgångsrikt av analysen. Tänk på att data som presenteras i en lättläst mode i kalkylblad ibland skiljer sig från ett maskinläsbart format. Dataförbehandling kan vara ett tidskrävande steg, som ofta kräver omfattande omvandling av uppgifterna, om den ursprungliga formatet på de uppgifter är inte lämplig till VA verktyget. Vi rekommenderar en noggrann planering för inmatning och kodning för att möjliggöra flexibel och effektiv uppladdning till nedströms analysverktyg programvara som de som finns i VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Inga intressekonflikter deklareras.

Acknowledgments

Vi vill tacka ledamöterna i Vancouver Institute of Visual Analytics (VIVA) för att erbjuda kommentarer och råd för projektet. Framför allt vill vi tacka John Dill, Brian Fisher, och David Darvill. Vi vill också tacka medlemmarna i Kollmann labbet för deras stöd och hjälp diskussioner. Detta arbete stöddes delvis av National Institute of Allergy och infektionssjukdomar, National Institute of Health Grant N01 AI50023, allergen IOU Bidrag 07-A1A och 07-B2B, och Michael Smith Stiftelsen för hälsoforskning. TRK stöds delvis av en karriär Award i Biomedicinsk vetenskap från Burroughs Wellcome Fund annons genom en kanadensisk Institutes for Health Research Training Grant i kanadensiska barnhälsovård klinikern Scientist Program i samarbete med Sick-Kids Foundation, barn och familj Forskningsinstitut ( British Columbia), Kvinnors och barns hälsa Research Institute (Alberta) och Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Immunologi Visual Analytics flödescytometri Luminex Tableau cytokin medfödd immunitet singel nukleotid polymorfism
Underlättar analysen av immunologiska data med Visual analytiska tekniker
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter