Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Facilitare l'analisi dei dati immunologici con Visual tecniche analitiche

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visual analytics (VA) è un nuovo approccio di analisi dei dati in modo interattivo. In questo video si discute il problema di sovraccarico di dati causata da esperimenti biologici high-throughput, VA e proporre come soluzione a tale problema. Il video mostra l'analisi all'interno e tra le serie di dati immunologici usando uno strumento chiamato Tableau VA.

Abstract

Visual analytics (VA) è emerso come un nuovo modo di analizzare insieme di dati di grandi dimensioni attraverso interattivo di visualizzazione. Abbiamo dimostrato l'utilità e la flessibilità di un approccio VA nell'analisi dei set di dati biologici. Esempi di questi set di dati in immunologia comprendono citometria a flusso, i dati di Luminex, e la genotipizzazione (ad esempio, singolo polimorfismo del nucleotide) di dati. Contrariamente all'approccio tradizionale visualizzazione delle informazioni, VA ripristina la potenza di analisi nelle mani di analista, consentendo l'analista di impegnarsi in tempo reale processo di esplorazione dei dati. Abbiamo scelto il software VA chiamato Tableau dopo aver valutato diversi strumenti VA. Due tipi di attività di analisi di analisi all'interno e tra i set di dati sono state dimostrate nel video di presentazione con un approccio chiamato analisi associati. Analisi appaiati, come definito in VA, è un approccio di analisi in cui un esperto strumento VA lavora fianco a fianco con un esperto di dominio durante l'analisi. L'esperto di dominio è colui che capisce il significato dei dati, e pone le domande che i dati raccolti potrebbero affrontare. L'esperto strumento crea poi visualizzazioni per aiutare a trovare modelli nei dati che potrebbero rispondere a queste domande. Il breve intervallo di tempo tra la generazione di ipotesi e la visualizzazione rapida visiva dei dati è il principale vantaggio di un approccio VA.

Protocol

1. Esplorazione a base di analisi su Tableau

  1. Hai un set di dati e si desidera esplorare le varie relazioni tra le colonne all'interno dei dati.
    1. (Figura 1) Importare il set di dati cliccando su 'Connect ai dati'. Scegliere il tipo di origine dati e seguire le istruzioni per importare i set di dati.
    2. (Figura 1) Verificare che la mensola dimensioni contiene colonne categorico, mentre la mensola misure contiene colonne numeriche dal set di dati. A volte una colonna dimensione come identificatore del soggetto possono essere elencati come misura se è numerata. Modificarlo in dimensioni facendo clic destro su di esso e scegliere 'Converti in Dimension'. Nella Figura 1, colonne categorico dal set di dati come il livello di concentrazione e stimolo identificatori soggetto sono correttamente collocati in scaffali dimensioni, e la concentrazione delle citochine osservate sono correttamente collocati in misure di ripiano.
    3. (Figura 2) Se durante il processo di analisi, un campo calcolato è necessario, basta fare clic destro in entrambe le dimensioni o misure di ripiano, e seleziona 'Crea campo calcolato'. Inserire il calcolo nella casella della formula con i campi e le numerose funzioni o operazioni matematiche. La figura 2 mostra come creare un nuovo campo chiamato PFD> 2 aggregando PFD2, PFD3 e PFD4 valori.
    4. (Figura 3) Generare un 2-D trama in Tableau, in genere con una dimensione e una misura di interesse. Poiché l'interfaccia offre semplice drag-and-drop interazione, la scelta della dimensione e misura può essere facilmente cambiata. Le dimensioni sono di solito collocati in scaffali colonne, e le misure di ripiano righe. Nella Figura 3, la mensola dimensioni contiene concentrazione a livello di stimolo, e la mensola contiene misure di livello osservato concentrazione delle citochine.
    5. (Figura 3) Per differenziare la visualizzazione di una dimensione specifica, posto che l'etichetta dimensione in scaffale testo, il colore o la dimensione, a seconda della natura della dimensione. Scaffale testo tentativi per differenziare i dati nella visualizzazione, mediante l'etichettatura con informazioni testuali fornite dal dimensione selezionata. Mensola a colori e le dimensioni automaticamente differenziare i dati per colore e dimensioni, che può essere regolato con la barra di scorrimento nella parte inferiore di ogni ripiano. In figura 3, ponendo genotipo a scaffale colore porta alla separazione di tre genotipi di colori distinti.
    6. (Figura 3) Filtrare la visualizzazione dalle variabili colonna specifica in altra dimensione. Questo può essere fatto trascinando l'etichetta dimensione nello scaffale filtro. Apparirà una finestra con l'elenco di valori tra cui scegliere. Il valore selezionato saranno gli unici valori rimasti nella visualizzazione.
    7. (Figura 4) Si può unire visualizzazione con altra dimensione o misura per la produzione di una matrice di visualizzazione. Questo può essere fatto facendo cadere più dimensioni in scaffale colonne, e le misure di ripiano in più righe. Figura 4 contiene un esempio di due colonne della matrice di visualizzazione mettendo due dimensioni diverse nello scaffale colonne.
    8. Per produrre una visualizzazione simile, fate clic destro sul foglio corrente sul basso a sinistra, e selezionate 'foglio duplicato'.
    9. Iterare il processo di analisi per identificare tendenze interessanti o valori anomali che possono aiutare a generare nuove ipotesi sui dati.
  2. Hai set di dati multipli generati dalla stessa fonte, e vogliono esplorare le possibili connessioni tra questi gruppi di dati.
    1. Luogo più set di dati in una stessa fonte, luogo cioè due fogli di calcolo nella stessa cartella di lavoro, per consentire Tableau di connettersi a questi set di dati attraverso la stessa connessione.
    2. (Figura 5) Collegare il set di dati attraverso la logica di unire valori chiave, facendo attenzione che le dimensioni che sono le stesse per più set di dati selezionati. Nella Figura 5, ci sono cinque valori chiave per unire: identificatore tipo di cellula, la concentrazione a livello di stimolo, la fase o gruppo, stimolo, e soggetto.
    3. Effettuare analisi simile alla sezione 1.1.

2. Presentazione a base di bisogni

  1. Sapete le relazioni tra dati, ma si vuole essere in grado di generare rapidamente un elenco di visualizzazioni per l'uso in presentazione.
    1. Seguire il protocollo di cui al punto 1.1, e annotare le visualizzazioni di conseguenza.
    2. Utilizzare la funzione di esportazione in Tableau per produrre immagini di visualizzazioni.
  2. Lei ha generato una serie di visualizzazioni potente nella cartella di lavoro Tableau e vogliono condividere tale cartella di lavoro.
    1. Salvare la cartella di lavoro come cartella di lavoro Tableau confezionati e condividere questo file.
    2. Colleghi senza Desktop Tableau Tableau Reader può essere scaricato per aprire la cartella di lavoro confezionato. Reader permette tableau tuoi colleghi di interagire con le visualizzazioni che hai creato.

3. RAPPRESENTANTE RISULTATI

Figura 1
Figura 1. Uno screenshotdi Tableau dopo l'importazione il foglio di calcolo chiamato NFKBIA dal demo.xls file di Excel. Le dimensioni e le mensole misure sono state opportunamente compilato con i dati categorici e numerici, rispettivamente.

Figura 2
Figura 2. La finestra di campo calcolato è invocato per creare un campo calcolato speciale da usare in Tableau. La lista in basso a sinistra della finestra consente di individuare possibili campi, e la lista sulla destra contiene un'abbreviazione di funzioni che possono essere utilizzati nella formula. In questo esempio, abbiamo voluto aggiungere i valori per PFD4, PFD3 e PFD2 per ottenere il valore finale che noi chiamiamo PFD> 2

Figura 3
Figura 3. Visualizzazione del livello di concentrazione stimolo contro la concentrazione delle citochine osservato. La visualizzazione mostra un grafico dei diversi livelli di concentrazione dello stimolo 3M-002 contro la concentrazione osservata della citochina TNF-α. I colori delle linee di consultare i genotipi differenti per un polimorfismo a singolo nucleotide nel gene NFKBIA degli individui nel nostro studio immunitario innato.

Figura 4
Figura 4. Uno screenshot di un due colonne della matrice di visualizzazione. Abbiamo generato una matrice a due colonne per facilitare un side-by-side di confronto delle risposte a due stimoli, 3M-003 e LPS. L'x-assi sono i diversi livelli di concentrazione dei due stimoli, e l'asse y trame i valori del campo calcolato, PFD> 2.

Figura 5
Figura 5. Tableau Queste finestre di dialogo illustrano come collegare i dati registrati in fogli di calcolo diversi. Connessione dati da fogli di calcolo che può essere svolto dalla combinazione di questi con logiche unire le clausole dei valori chiave.

Visualizzazione e strumento di analisi
Funzione Quadro VIS-STAMP xmdvtool GGobi Luce stellare Gapminder Visulab InfoVis Toolkit Geotime Ispirare
Grafici delle coordinate parallele No No No
Scatter plot matrici No No No No No
Riduzione dimensionale No No No No No No No No
Dimensioni temporali No No No
Geospaziali dimensioni No No No No No
Text mining No No No No No No No No
La manipolazione diretta dei dati No No
Filtraggio No
Estensibilità ad altre piattaforme (ad esempio, R) No No No No No
CSV tavolo formati No No No
Formati di dati XML No No No No
Sa muoversi con 10000 + file No No No No No No No
Documentazione
Prodotto commerciale No No No No No No

Tabella 1. Elenco degli strumenti di analisi visiva e alcune delle loro caratteristiche.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

L'avvento della tecnologia high-throughput nella moderna ricerca biomedica portato a un'esplosione dei dati di ricerca che richiede un modo più efficiente di analisi. Visual analytics (VA) è la scienza del ragionamento analitico facilitato da interfacce visuali interattivi (1). L'approccio VA ripristina la potenza analitica nelle mani di analista umano, in contrasto con l'approccio tradizionale di individuare modelli di computer. Analisi visiva è stata applicata alla ricerca in vari campi, come la difesa di ricerca (1) e le tendenze degli uragani (2). Finora, ci sono solo alcuni esempi di applicazioni in biologia VA (3). Abbiamo dimostrato in questo articolo video che VA è un approccio che può essere aggiunto arsenale del biologo di strumenti di analisi. Molti software di VA sono disponibili vanno da quelli che sono in fase di sviluppo nei laboratori accademici a quelli che sono disponibili in commercio. Per il nostro lavoro su neonatale immunità innata (4), abbiamo scelto Tableau a causa della sua idoneità ad analizzare foglio di calcolo in stile set di dati disponibili in laboratorio. Altri strumenti di VA, alcuni dei quali abbiamo parlato nel nostro articolo video, può essere più appropriato per altri tipi di dati biologici. Abbiamo elencato le funzioni e le caratteristiche di alcuni degli strumenti più popolari VA nella tabella 1. Questo elenco non intende essere esaustiva, perché va oltre lo scopo del nostro studio, ma dovrebbe essere un buon punto di partenza per gli scienziati di determinare lo strumento adatto VA per i loro set di dati specifici.

Ci sono due punti importanti su VA che vorremmo evidenziare. Uno, l'approccio VA è inteso come un processo di esplorazione, aiutando l'analista rapidamente schemi posto come tendenze generali e valori anomali nei dati. L'obiettivo principale del VA è di fornire una potente tecnica di visualizzazione per grandi insiemi di dati. Non è un'alternativa alla analisi statistica. In realtà, la maggior parte degli strumenti di VA sono molto limitati nella loro capacità di effettuare analisi statistiche, anche se ci aspettiamo che questo cambi nel prossimo futuro. Il secondo punto che vogliamo ricordare è che i dati di pre-elaborazione prima di importare il set di dati di uno strumento VA è cruciale per il successo delle analisi. Tenete presente che i dati presentati in un formato leggibile moda in fogli di calcolo sono a volte diverse da un formato leggibile dalla macchina. Pre-elaborazione dei dati può essere un tempo passo, che spesso richiedono massiccia trasformazione dei dati, se il formato originale dei dati non è adatto allo strumento VA. Consigliamo vivamente l'accurata pianificazione di immissione dei dati e la codifica per consentire il caricamento flessibile ed efficiente a strumenti software di analisi a valle, come quelli disponibili in VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Nessun conflitto di interessi dichiarati.

Acknowledgments

Vorremmo ringraziare i membri di Vancouver Istituto di Visual Analytics (VIVA) per offrire commenti e consigli per il progetto. In particolare, vorremmo ringraziare John Dill, Brian Fisher e David Darvill. Vorremmo anche ringraziare i membri del laboratorio Kollmann per il sostegno e utili discussioni. Questo lavoro è stato sostenuto in parte dal National Institute of Allergy and Infectious Diseases, Istituto Superiore di Sanità di Grant N01 AI50023; Borse di NCE Allergen 07-07-A1A e B2B, e il Michael Smith Fondazione per la Ricerca Sanitaria. TRK è sostenuto in parte da un Premio alla carriera nella scienza biomedica dal annuncio Burroughs Wellcome Fondo da un Istituti canadesi per Grant formazione per la ricerca in sanità canadese Health Program Scientist Bambino Clinico, in collaborazione con Sick-Kids Foundation, Child and Family Research Institute ( British Columbia), Donne e salute dei bambini Research Institute (Alberta), e Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Immunologia Numero 47 analisi visuale citometria a flusso Luminex Tableau citochine l'immunità innata singolo polimorfismo del nucleotide
Facilitare l'analisi dei dati immunologici con Visual tecniche analitiche
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter