Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Faciliter l'analyse des données immunologiques avec Visual techniques analytiques

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visuel Analytics (VA) est une nouvelle approche d'analyse des données de manière interactive. Dans cette vidéo, nous abordons le problème de surcharge de données provoquée par haut-débit les expériences biologiques, et de proposer VA comme une solution à ces problèmes. La vidéo démontre l'analyse au sein et entre les ensembles de données immunologiques utilisant un outil appelé VA Tableau.

Abstract

Visuel Analytics (VA) a émergé comme une nouvelle manière d'analyser grande base de données grâce à l'affichage visuel interactif. Nous avons démontré l'utilité et la souplesse d'une approche de VA dans l'analyse des ensembles de données biologiques. Des exemples de ces ensembles de données en immunologie incluent la cytométrie de flux, les données Luminex, et le génotypage (par exemple, single nucleotide polymorphism) des données. Contrairement à l'approche de visualisation d'information traditionnels, VA restaure la puissance d'analyse dans les mains de l'analyste, en permettant à l'analyste de se livrer en temps réel processus d'exploration de données. Nous avons choisi le logiciel VA appelé Tableau après avoir évalué plusieurs outils VA. Deux types de tâches d'analyse d'analyse au sein et entre les ensembles de données ont été démontrées dans la vidéo de présentation en utilisant une approche appelée analyse appariés. L'analyse par paires, comme défini dans VA, est une approche d'analyse dans lequel un expert outil de VA travaille côte à côte avec un expert du domaine lors de l'analyse. L'expert du domaine est celui qui comprend la signification des données, et pose les questions que les données recueillies pourraient adresse. L'expert outil crée ensuite des visualisations pour aider à trouver des modèles dans les données qui pourraient répondre à ces questions. Le court temps de latence entre la génération d'hypothèses et de l'affichage visuel rapide des données est le principal avantage d'une approche VA.

Protocol

1. Exploration de l'analyse comparative sur le Tableau

  1. Vous disposez d'un ensemble de données et que vous voulez explorer les différentes relations entre les colonnes dans les données.
    1. (Figure 1) Importer les données en cliquant sur «Se connecter aux données». Choisissez le type de source de données et suivez les instructions pour importer vos données.
    2. (Figure 1) Assurez-vous que le plateau des dimensions contient des colonnes catégorielles tout le plateau de mesures contient des colonnes numériques de votre dataset. Parfois, une colonne de dimension tels que le code objet peut être répertorié comme mesure, si elle est numérotée. Changez les dimensions en cliquant-droit dessus et sélectionnez "Convertir en dimension. Dans la figure 1, colonnes catégorique de l'ensemble de données tels que le niveau de concentration de relance et les identificateurs de l'objet sont correctement placés dans étagères dimensions, et la concentration observée de cytokines sont correctement placés dans des mesures de conservation.
    3. (Figure 2) Si, durant le processus d'analyse, un champ calculé est nécessaire, il suffit de faire un clic droit dans les deux dimensions ou une étagère mesures, et sélectionnez "Créer un champ calculé. Entrée dans le calcul de la zone de formule avec des champs combinée avec les fonctions ou des opérations mathématiques. La figure 2 montre comment créer un nouveau champ appelé VFI> 2 en agrégeant PFD2, PFD3 et PFD4 valeurs.
    4. (Figure 3) Générer une parcelle en 2-D dans le Tableau, généralement avec une dimension et une mesure d'intérêt. Depuis l'interface offre un simple glisser-déposer d'interaction, le choix de la dimension et la mesure peut être facilement changée. Les dimensions sont généralement placés dans des étagères des colonnes et des mesures de conservation des lignes. Dans la figure 3, le plateau des dimensions contient le niveau de concentration de relance, et la tablette contient des mesures niveau de concentration observée de cytokines.
    5. (Figure 3) Afin de différencier la visualisation d'une dimension spécifique, placez cette étiquette dimension étagère texte, la couleur ou la taille, selon la nature de la dimension. Étagères texte tente de différencier les données dans la visualisation en les étiquetant avec des informations textuelles fournies par la dimension sélectionnée. Étagères couleur et la taille de différencier automatiquement les données par couleur et par taille, qui peut être réglé avec la barre de défilement située en bas de chaque étagère. Dans la figure 3, en plaçant le génotype étagère de couleur conduit à la séparation des trois génotypes par des couleurs distinctes.
    6. (Figure 3) Filtre la visualisation par les variables de colonne spécifique dans une autre dimension. Cela peut être fait en faisant glisser l'étiquette de dimension dans le plateau du filtre. Une fenêtre apparaîtra avec la liste des valeurs à choisir. La valeur sélectionnée sera les seules valeurs restantes dans la visualisation.
    7. (Figure 4) Vous pouvez combiner visualisation avec une autre dimension ou d'une mesure de produire une matrice de visualisation. Cela peut être fait en laissant tomber les multiples dimensions de conservation des colonnes et des mesures multiples dans le rayon des lignes. La figure 4 contient un exemple de deux-colonne de la matrice de visualisation en plaçant deux dimensions différentes dans le plateau colonnes.
    8. Pour produire une visualisation semblables, faites un clic droit sur la feuille en cours sur le coin inférieur gauche, et choisis "feuille de duplicata».
    9. Itérer le processus d'analyse pour identifier les tendances intéressantes ou aberrantes qui peuvent vous aider à générer de nouvelles hypothèses sur les données.
  2. Vous avez plusieurs données générées à partir de la même source, et que vous voulez explorer les liens possibles entre ces ensembles de données.
    1. Placez les ensembles de données multiples dans un même source, le lieu soit deux feuilles de calcul dans le même classeur, pour permettre Tableau de se connecter à ces données par la même connexion.
    2. (Figure 5) Connecter les ensembles de données grâce à rejoindre logique des valeurs clés, en s'assurant que les dimensions qui sont les mêmes pour plusieurs ensembles de données sont sélectionnés. Dans la figure 5, il ya cinq valeurs clés pour joindre: identificateur du type de cellule, le niveau de concentration de relance, le stade ou à un groupe, de relance, et le sujet.
    3. Effectuer une analyse similaire à l'article 1.1.

2. Présentation basée sur les besoins

  1. Vous savez les relations entre les données, mais vous voulez être en mesure de générer rapidement une liste des visualisations pour une utilisation dans la présentation.
    1. Suivre le protocole décrit à la section 1.1, et d'annoter les visualisations en conséquence.
    2. Utilisez la fonction d'exportation dans le Tableau de produire des images de visualisations.
  2. Vous avez généré un ensemble de visualisations puissant classeur Tableau et veulent partager ce classeur.
    1. Enregistrez le classeur en tant que classeur Tableau emballés et partager ce fichier.
    2. Collègues de bureau, sans Tableau pouvez télécharger lecteur Tableau pour ouvrir le classeur emballés. Lecteur Tableau permet à vos collègues d'interagir avec les visualisations que vous avez créés.

3. Les résultats représentatifs

Figure 1
Figure 1. Une capture d'écranTableau d'après l'importation du tableur appelé NFKBIA du demo.xls fichier Excel. Les dimensions et les étagères des mesures ont été correctement remplies avec les données catégoriques et numériques, respectivement.

Figure 2
Figure 2. La fenêtre champ calculé est appelé pour créer un champ spécial calculée à utiliser dans le Tableau. La liste sur le fond à gauche la boîte permet d'identifier les champs du possible, et la liste sur le côté droit contient abréviation de fonctions qui peuvent être utilisés dans la formule. Dans cet exemple, nous avons voulu ajouter les valeurs pour PFD4, PFD3 et PFD2 pour obtenir la valeur finale que nous appelons VFI> 2

Figure 3
Figure 3. Visualisation des niveaux de concentration de relance fonction de la concentration des cytokines observées. La visualisation montre un tracé des niveaux de concentration différents du stimulus 3M-002 contre la concentration observée de la cytokine TNF-α. Les couleurs des lignes se réfèrent à différents génotypes pour un polymorphisme nucléotidique du gène NFKBIA des individus dans notre étude immunitaire inné.

Figure 4
Figure 4. Une capture d'écran d'une matrice de visualisation à deux colonnes. Nous avons généré une matrice à deux colonnes pour faciliter une comparaison côte à côte des réponses aux deux stimuli, 3M-003 et LPS. Le x-axes sont les niveaux de concentration différents de ces deux stimuli, et les parcelles axe y les valeurs du champ calculé, VFI> 2.

Figure 5
Figure 5. Ces fenêtres de dialogue Tableau illustrent comment connecter les données enregistrées dans des feuilles de calcul différentes. Connexion de données à partir des feuilles de calcul différente peut être accomplie en combinant ces logiques en utilisant des clauses JOIN de valeurs clés.

Outil de visualisation et d'analyse
Fonction Tableau VIS-STAMP xmdvtool Ggobi Lumière des étoiles Gapminder Visulab InfoVis Toolkit Geotime Inspirent
Tracés parallèles de coordonnées Oui Oui Oui Oui Oui Aucun Oui Oui Aucun Aucun
Matrices nuage de points Oui Aucun Oui Oui Oui Aucun Oui Aucun Aucun Aucun
Réduction dimensionnelle Aucun Aucun Oui Oui Aucun Aucun Aucun Aucun Aucun Aucun
Les dimensions temporelle Oui Oui Aucun Oui Oui Oui Aucun Oui Oui Aucun
Les dimensions géospatiales Oui Oui Aucun Aucun Oui Oui Aucun Aucun Oui Aucun
Le text mining Aucun Aucun Aucun Aucun Oui Aucun Aucun Aucun Aucun Oui
La manipulation directe des données Oui Oui Oui Oui Oui Oui Oui Aucun Oui Aucun
Filtrage Oui Oui Oui Oui Oui Oui Oui Aucun Oui Oui
Extensibilité à d'autres plateformes (par exemple, R) Oui Aucun Oui Oui Aucun Oui Aucun Oui Aucun Aucun
Formats de tableau CSV Oui Oui Oui Oui Aucun Aucun Oui Oui Oui Aucun
XML des formats de données Oui Aucun Aucun Oui Oui Aucun Oui Oui Oui Aucun
Peut se débrouiller dans une0000 + lignes Oui Aucun Aucun Aucun Oui Aucun Aucun Aucun Aucun Oui
Documentation Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
Le produit commercial Oui Aucun Aucun Aucun Oui Aucun Aucun Aucun Oui Oui

Tableau 1. Liste des outils d'analyse visuelle et certaines de leurs caractéristiques.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

L'avènement de la technologie à haut débit dans la recherche biomédicale moderne, conduit à une explosion des données de recherche qui nécessite un moyen plus efficace de l'analyse. Visuel Analytics (VA) est la science du raisonnement analytique facilité par les interfaces visuelles interactives (1). L'approche VA restaure la puissance analytique dans les mains de l'analyste humains, contrairement à l'approche traditionnelle de détecter des modèles par ordinateur. Visuel d'analyse a été appliquée à la recherche dans divers domaines, tels que la défense de recherche (1) et les tendances des ouragans (2). Jusqu'ici, il n'ya que quelques exemples d'applications en biologie VA (3). Nous avons démontré dans cet article la vidéo que VA est une approche qui peut être ajouté à l'arsenal du biologiste d'outils d'analyse. Beaucoup de logiciels de VA sont disponibles, allant de ceux qui sont en développement dans les laboratoires universitaires à ceux qui sont disponibles dans le commerce. Pour nos travaux sur l'immunité innée néonatale (4), nous avons choisi en raison de son Tableau pertinence dans l'analyse de tableurs style ensembles de données disponibles dans le laboratoire. Autres outils de VA, dont certains nous l'avons mentionné dans notre article la vidéo, peut être plus approprié pour d'autres types de données biologiques. Nous avons listé les fonctions et les caractéristiques de certains des outils de VA en plus populaire dans le tableau 1. Cette liste n'est pas exhaustive, car il est hors de la portée de notre étude, mais il devrait être un bon point de départ pour les scientifiques pour déterminer l'outil approprié VA pour leurs ensembles de données spécifiques.

Il ya deux points importants sur VA que nous voudrions mettre en évidence. Un, l'approche VA est conçu comme un processus d'exploration en aidant l'analyste rapidement disposition des taches telles que les tendances générales et les valeurs aberrantes dans les données. L'objectif principal de la VA est de fournir une technique de visualisation puissant pour grands ensembles de données. Ce n'est pas une alternative à l'analyse statistique. En fait, la plupart des outils VA sont très limitées dans leur capacité à effectuer des analyses statistiques, même si nous prévoyons que cela change dans un proche avenir. Le deuxième point que nous voulons mentionner est que les données pré-traitement avant d'importer les données à un outil de VA est cruciale pour le succès de l'analyse. Gardez à l'esprit que les données présentées de façon lisible dans les tableurs sont parfois différentes d'un format lisible par machine. Les données pré-traitement peut être une étape fastidieuse, nécessitant souvent transformation massive des données, si le format d'origine des données n'est pas adapté à l'outil de VA. Nous recommandons fortement la planification minutieuse de la saisie de données et d'encodage pour permettre le chargement souple et efficace à l'aval des outils logiciels d'analyse tels que ceux disponibles dans VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Aucun conflit d'intérêt déclaré.

Acknowledgments

Nous tenons à remercier les membres du Vancouver Institute of Visual Analytics (VIVA) pour offrir des commentaires et des conseils pour le projet. En particulier, nous tenons à remercier John Dill, Brian Fisher et David Darvill. Nous tenons également à remercier les membres du laboratoire de Kollmann pour leur soutien et des discussions utiles. Ce travail a été soutenu en partie par l'Institut national des allergies et des maladies infectieuses, Institut national de santé Grant AI50023 N01; subventions des RCE AllerGen 07-07-A1A et B2B, et la Fondation Michael Smith pour la recherche en santé. TRK est soutenu en partie par une bourse de carrière dans les sciences biomédicales de l'annonce du Burroughs Wellcome Fund par une subvention des Instituts canadiens de recherche en santé Formation Programme de santé des enfants canadiens clinicien-chercheur, en partenariat avec Sick Kids Foundation-, Child and Family Research Institute ( Colombie-Britannique), Femmes et Enfants Health Research Institute (Alberta), et au Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Immunologie Numéro 47 l'analyse visuelle la cytométrie en flux Luminex Tableau cytokines immunité innée single nucleotide polymorphism
Faciliter l'analyse des données immunologiques avec Visual techniques analytiques
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter