Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Het vergemakkelijken van de Analyse van de immunologische gegevens met Visual analytische technieken

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visuele analyses (VA) is een nieuwe benadering van het analyseren van gegevens interactief. In deze video bespreken we de data overload probleem veroorzaakt door high-throughput biologische experimenten, en stellen VA als een oplossing voor dergelijke problemen. De video toont analyse binnen en tussen de immunologische datasets met behulp van een tool genaamd VA Tableau.

Abstract

Visuele analyses (VA) is ontstaan ​​als een nieuwe manier om grote dataset te analyseren door middel van interactieve visuele weergave. We hebben laten zien het nut en de flexibiliteit van een VA aanpak in de analyse van biologische datasets. Voorbeelden van deze datasets in de immunologie zijn flowcytometrie, Luminex gegevens, en genotypering (bv, single nucleotide polymorfisme) gegevens. In tegenstelling tot de traditionele informatie visualisatie aanpak, VA herstelt de analyse macht in de handen van analist doordat de analist om deel te nemen in real-time data exploratie verwerken. We hebben gekozen voor de VA software genaamd Tableau na evaluatie van verschillende VA tools. Twee soorten analyses taken analyse binnen en tussen de datasets werden aangetoond in de video-presentatie met behulp van een aanpak genaamd gekoppeld analyse. Gepaarde analyse, zoals gedefinieerd in VA, is een analyse benadering waarbij een VA hulpmiddel expert side-by-side werkt met een domein expert tijdens de analyse. Het domein expert is degene die begrijpt de betekenis van de gegevens, en verzoekt de vragen die de verzamelde gegevens zou kunnen pakken. De tool expert maakt vervolgens visualisaties te helpen bij het vinden van patronen in de gegevens die zouden kunnen deze vragen beantwoorden. De korte lag-tijd tussen de hypothese generatie en de snelle visuele weergave van de gegevens is het belangrijkste voordeel van een VA aanpak.

Protocol

1. Verkenning op basis van analyse over Tableau

  1. Je hebt een dataset en u wilt de verschillende relaties tussen de kolommen in de gegevens te verkennen.
    1. (Figuur 1) Importeer de dataset door te klikken op 'Verbinding maken met gegevens'. Kies de gegevensbron type en volg de instructies om uw dataset te importeren.
    2. (Figuur 1) Zorg ervoor dat de afmetingen plank categorische kolommen bevat, terwijl de maatregelen die plank bevat numerieke kolommen van uw dataset. Soms is een dimensie kolom, zoals onderwerp identifier mag worden vermeld als te meten als het genummerde. Verander het naar dimensies door met de rechtermuisknop op te klikken en selecteer 'Convert to Dimension'. In Figuur 1, zijn categorische kolommen uit de dataset, zoals stimulans concentratie niveau en het onderwerp id's correct geplaatst in afmetingen plank, en de waargenomen concentraties van cytokines correct zijn geplaatst in maatregelen plank.
    3. (Figuur 2) Indien tijdens het analyseproces, een berekend veld nodig is, door rechts te klikken in een van beide dimensies of maatregelen plank, en selecteer 'Create Berekend veld'. Voer de berekening in de formule doos met velden, gecombineerd met functies of wiskundige bewerkingen. Figuur 2 laat zien hoe u een nieuw veld genaamd PFD> 2 door samenvoeging van PFD2, PFD3, en PFD4 waarden.
    4. (Figuur 3) Genereer een 2-D plot in Tableau, meestal met een afmeting en een maat van belang. Omdat de interface biedt een eenvoudige drag-and-drop interactie, kan de keuze van de afmeting en meet eenvoudig worden aangepast. Afmetingen zijn meestal geplaatst in kolommen plank, en maatregelen in rijen plank. In figuur 3, de afmetingen plank bevat stimulus concentratie, en de maatregelen die plank bevat waargenomen concentratie niveau van cytokines.
    5. (Figuur 3) Om de visualisatie te onderscheiden door een specifieke dimensie, plaats die dimensie label in tekst, kleur of grootte plank, afhankelijk van de aard van de dimensie. Tekst plank pogingen om de gegevens in de visualisatie te onderscheiden door middel van etikettering ze met tekstuele informatie die door de geselecteerde dimensie. Kleur en grootte plank zal automatisch differentiëren gegevens door kleur en grootte, die kan worden aangepast met de schuifbalk bevindt zich aan de onderkant van elke plank. In figuur 3, het plaatsen van genotype in kleur schap leidt tot de scheiding van de drie genotypen door verschillende kleuren.
    6. (Figuur 3) Filter de visualisatie door de specifieke kolom variabelen in andere dimensie. Dit kan gedaan worden door het slepen van de afmeting label in het filter plank. Er verschijnt een venster met de lijst van waarden om uit te kiezen. De geselecteerde waarde wordt de enige waarden die nog in de visualisatie.
    7. (Figuur 4) U kunt combineren visualisatie met andere dimensie of maatregel om een ​​matrix van visualisatie te produceren. Dit kan gedaan worden door het droppen van meerdere dimensies in kolommen plank, en meerdere maatregelen in rijen plank. Figuur 4 bevat een voorbeeld van twee kolommen visualisatie matrix door het plaatsen van twee verschillende dimensies in de kolommen plank.
    8. Voor de productie van een soortgelijke visualisatie, klik met de rechtermuisknop op het huidige blad aan de linker benedenhoek, en de geselecteerde 'kopie van het blad'.
    9. Itereren de analyse proces om interessante trends of uitschieters die u kunnen helpen het genereren van nieuwe hypothese over de gegevens te identificeren.
  2. U hebt meerdere dataset gegenereerd op basis van dezelfde bron, en u wilt de mogelijke verbanden tussen deze datasets te verkennen.
    1. Plaats meerdere datasets in een dezelfde bron, namelijk plaats twee spreadsheets in dezelfde werkmap, zodat Tableau om op deze dataset verbinding te maken via dezelfde verbinding.
    2. (Figuur 5) Sluit de datasets door middel van logisch aansluiten van de belangrijkste waarden, ervoor te zorgen dat de afmetingen die hetzelfde zijn voor meerdere datasets zijn geselecteerd. In figuur 5, zijn er vijf kernwaarden voor het samenvoegen van: celtype, stimulus concentratie, podium of een groep, stimulus, en het onderwerp identifier.
    3. Uit te voeren analyse vergelijkbaar met paragraaf 1.1.

2. Presentatie op basis van behoeften

  1. Je weet dat de relaties tussen gegevens, maar u wilt in staat zijn om snel een lijst van visualisaties voor gebruik in de presentatie.
    1. Volg het protocol beschreven in paragraaf 1.1, en dienovereenkomstig annoteren van de visualisaties.
    2. Gebruik de exportfunctie in Tableau om beelden van visualisaties te produceren.
  2. U heeft geleid tot een reeks krachtige visualisaties in Tableau werkboek en wilt u die werkmap te delen.
    1. Sla de werkmap op als Tableau verpakt werkboek en delen van dit bestand.
    2. Collega's zonder Tableau Desktop kunt downloaden Tableau Reader nodig om de verpakte werkmap te openen. Tableau Reader kunt u uw collega's om te communiceren met de visualisaties die u hebt gemaakt.

3. Representatieve resultaten

Figuur 1
Figuur 1. Een screenshotvan Tableau na het importeren van de spreadsheet met de naam NFKBIA uit het Excel-bestand demo.xls. De afmetingen en de maatregelen planken waren goed gevuld met de categorische en numerieke gegevens, respectievelijk.

Figuur 2
Figuur 2. De Berekend veld venster is ingeroepen om een speciale berekend veld te creëren om te gebruiken in Tableau. De lijst aan de onderkant links box helpt bij het identificeren mogelijke velden, en de lijst aan de rechterkant bevat afkorting van functies die kunnen worden gebruikt in de formule. In dit voorbeeld, wilden we de waarden toe te voegen voor PFD4, PFD3 en PFD2 tot de uiteindelijke waarde die we aanduiden als PFD> 2 te verkrijgen

Figuur 3
Figuur 3. Visualisatie van de stimulus concentratie versus waargenomen cytokine concentratie. De visualisatie toont een plot van de verschillende concentraties van de stimulus 3M-002 tegen de waargenomen concentratie van het cytokine TNF-α. De kleuren van de lijnen verwijzen naar de verschillende genotypes voor een single-nucleotide polymorfisme in het NFKBIA gen van de individuen in onze aangeboren immuunsysteem te bestuderen.

Figuur 4
Figuur 4. Een screenshot van een twee-kolommen visualisatie matrix. We genereerden een twee-koloms matrix om een ​​side-by-side vergelijking van de antwoorden op twee stimuli, 3M-003 en LPS te vergemakkelijken. De x-as zijn de verschillende concentraties van de twee stimuli, en de y-as plots de waarden van het berekende veld, PFD> 2.

Figuur 5
Figuur 5. Tableau Deze dialoog vensters laten zien hoe gegevens die zijn opgenomen in verschillende spreadsheets verbinden. Koppelen van data uit verschillende spreadsheets kan worden bereikt door het combineren van deze door gebruik te logisch aansluiten clausules van de belangrijkste waarden.

Visualisatie en Analysis Tool
Functie Tableau VIS-STAMP xmdvtool GGobi Sterrenlicht Gapminder Visulab InfoVis Toolkit Geotime Inspireren
Parallel coördineren van percelen Ja Ja Ja Ja Ja Geen Ja Ja Geen Geen
Scatterplot matrixen Ja Geen Ja Ja Ja Geen Ja Geen Geen Geen
Dimensionele reductie Geen Geen Ja Ja Geen Geen Geen Geen Geen Geen
Temporele dimensies Ja Ja Geen Ja Ja Ja Geen Ja Ja Geen
Geospatial afmetingen Ja Ja Geen Geen Ja Ja Geen Geen Ja Geen
Text mining Geen Geen Geen Geen Ja Geen Geen Geen Geen Ja
Directe manipulatie van data Ja Ja Ja Ja Ja Ja Ja Geen Ja Geen
Filteren Ja Ja Ja Ja Ja Ja Ja Geen Ja Ja
Uitbreidbaarheid naar andere platforms (bijvoorbeeld R) Ja Geen Ja Ja Geen Ja Geen Ja Geen Geen
CSV tabelindelingen Ja Ja Ja Ja Geen Geen Ja Ja Ja Geen
XML-data formaten Ja Geen Geen Ja Ja Geen Ja Ja Ja Geen
Kan omgaan met een0000 + rijen Ja Geen Geen Geen Ja Geen Geen Geen Geen Ja
Documentatie Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
Commercieel product Ja Geen Geen Geen Ja Geen Geen Geen Ja Ja

Tabel 1. Lijst van visuele analytics tools en sommige van hun kenmerken.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

De komst van high-throughput technologie in moderne biomedisch onderzoek leidde tot een explosie van het onderzoek gegevens die een meer efficiënte manier van analyse vereist. Visuele analyses (VA) is de wetenschap van het analytisch denken vergemakkelijkt door interactieve visuele interfaces (1). De VA aanpak herstelt de analytische macht in de handen van de menselijke analist, in tegenstelling tot de traditionele aanpak om patronen te ontdekken via de computer. Visuele analyses is toegepast voor onderzoek op verschillende gebieden, zoals defensie onderzoek (1) en de orkaan trends (2). Tot nu toe zijn er slechts een paar voorbeelden van VA toepassingen in de biologie (3). We hebben laten zien in deze video artikel dat VA is een aanpak die kan worden toegevoegd aan het arsenaal van de bioloog van de analyse-instrumenten. Veel VA software zijn beschikbaar, variërend van degenen die in ontwikkeling zijn in academische laboratoria tot degenen die zijn commercieel verkrijgbaar. Voor ons werk op de neonatale aangeboren immuniteit (4), kozen we voor Tableau vanwege de geschiktheid in het analyseren van spreadsheet-stijl datasets beschikbaar zijn in het lab. Andere VA tools, waarvan sommige we al in onze video artikel, wellicht meer geschikt voor andere soorten biologische data. We genoemde functies en kenmerken van een aantal van de meer populaire VA tools in tabel 1. Deze lijst is niet bedoeld volledig te zijn, omdat het buiten het bestek van onze studie, maar het zou een goed uitgangspunt voor wetenschappers is om de geschikte VA tool voor hun specifieke datasets te bepalen.

Er zijn twee belangrijke punten over VA, dat willen we benadrukken. One, is de VA aanpak bedoeld als een verkenning proces door te helpen de analist snel ter plaatse patronen, zoals de algemene trends en uitschieters in de gegevens. De belangrijkste focus van de VA is het bieden van een krachtige visualisatie techniek voor grote datasets. Het is geen alternatief voor statistische analyse. In feite zijn de meeste van de VA tools zeer beperkt in hun mogelijkheid om statistische analyses uit te voeren, hoewel we verwachten dat dit zal veranderen in de nabije toekomst. Het tweede punt dat we willen noemen is dat de gegevens pre-processing voorafgaand aan het importeren van de dataset om een ​​VA tool is cruciaal voor het succes van de analyse. Houd in gedachten dat gegevens in een leesbare manier in spreadsheets soms anders dan een machine-leesbaar formaat. Data pre-processing kan een tijdrovende stap zijn, waarvoor vaak enorme transformatie van de gegevens, als de oorspronkelijke indeling van de gegevens is niet geschikt om de VA tool. We raden de zorgvuldige planning van de data entry en codering om flexibele en efficiënte upload laten downstream analyse software tools zoals die beschikbaar zijn in VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Geen belangenconflicten verklaard.

Acknowledgments

We willen graag de leden van Vancouver Institute of Visual Analytics (VIVA) bedanken voor het aanbieden van commentaar en advies voor het project. In het bijzonder, willen we John Dill, Brian Fisher, en David Darvill bedanken. Wij zouden ook graag de leden van de Kollmann lab bedanken voor hun steun en nuttige discussies. Dit werk werd mede ondersteund door de Nationale Instituut voor Allergie en Infectieziekten, National Institute of Health Grant N01 AI50023; allergenen NVU Subsidies 07-A1A en 07-B2B, en de Michael Smith Foundation for Health Research. TRK wordt gedeeltelijk ondersteund door een Career Award in de Biomedische Wetenschappen van de Burroughs Wellcome Fund advertentie door een Canadese Institutes for Health Research Training Grant in de Canadese Child Health Clinician Scientist Program, in samenwerking met Sick-Kids Foundation, Kind en Gezin Research Institute ( British Columbia), vrouwen en kinderen's Health Research Institute (Alberta), en Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Immunologie visuele analyses flowcytometrie Luminex Tableau cytokine aangeboren immuniteit single nucleotide polymorfisme
Het vergemakkelijken van de Analyse van de immunologische gegevens met Visual analytische technieken
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter