Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Facilitar el análisis de los datos inmunológicos con Visual técnicas analíticas

Published: January 2, 2011 doi: 10.3791/2397

Summary

La analítica visual (AV) es un nuevo enfoque de análisis de datos de forma interactiva. En este video, se discute el problema de la sobrecarga de datos causada por experimentos de alto rendimiento biológico y proponer VA como una solución a tal problema. El video muestra el análisis dentro y entre los conjuntos de datos inmunológicos utilizando una herramienta llamada Tableau VA.

Abstract

La analítica visual (VA) ha surgido como una nueva forma de analizar la gran base de datos a través de pantallas de visualización interactiva. Hemos demostrado la utilidad y la flexibilidad de un enfoque de VA en el análisis de conjuntos de datos biológicos. Ejemplos de estos conjuntos de datos en inmunología incluyen la citometría de flujo, los datos de Luminex, y el genotipo (por ejemplo, el polimorfismo de nucleótido único) de datos. A diferencia del enfoque tradicional de visualización de información, VA restaura el poder de análisis en las manos del analista, al permitir que el analista de participar en tiempo real proceso de exploración de datos. Hemos seleccionado el software VA llamado Tableau después de evaluar varias herramientas de VA. Hay dos tipos de tareas de análisis de análisis dentro y entre los conjuntos de datos se demuestra en el video de presentación usando un método llamado análisis de pares. El análisis de pares, tal como se define en el VA, es un método de análisis en el que un experto en la herramienta VA trabaja codo a codo con un experto en el campo durante el análisis. El experto en el campo es el que entiende la importancia de los datos, y hace las preguntas que los datos recogidos podrían abordar. El experto herramienta crea visualizaciones para ayudar a encontrar patrones en los datos que puedan responder a estas preguntas. El corto tiempo de retardo entre la generación de hipótesis y la visualización rápida visual de los datos es la principal ventaja de un enfoque de VA.

Protocol

1. Exploración basada en el análisis de Tableau

  1. Usted tiene un conjunto de datos y desea explorar las diversas relaciones entre las columnas de los datos.
    1. (Figura 1) Importar el conjunto de datos, haga clic en "Conectar a los datos. Seleccione el tipo de fuente de datos y siga las instrucciones para importar el conjunto de datos.
    2. (Figura 1) Asegúrese de que la plataforma contiene columnas de dimensiones categóricas a la vez la plataforma de medidas contiene las columnas numéricas del conjunto de datos. En ocasiones una columna de dimensión, tales como identificador de objeto se puede enumerar como medida si es numerado. El cambio a las dimensiones haciendo clic derecho sobre él y seleccione "Convertir a la dimensión". En la Figura 1, las columnas del conjunto de datos categóricos como el nivel de concentración de estímulo y los identificadores de objeto se colocan correctamente en la plataforma dimensiones, y la concentración observada de las citoquinas están correctamente colocados en el estante medidas.
    3. (Figura 2) Si durante el proceso de análisis, un campo calculado que se necesita, simplemente haga clic derecho en cualquiera de las dimensiones o la plataforma de medidas, y seleccione "Crear un campo calculado. De entrada para el cálculo en el cuadro de fórmula con campos combinados con las funciones u operaciones matemáticas. La figura 2 muestra cómo crear un nuevo campo llamado PFD> 2 mediante la agregación de PFD2, PFD3, y los valores PFD4.
    4. (Figura 3) Generar un gráfico 2-D en el Tableau, por lo general con una dimensión y una medida de interés. Puesto que la interfaz ofrece una sencilla función de arrastrar y soltar la interacción, la elección de la dimensión y la medida puede ser cambiado fácilmente. Las dimensiones se suelen colocar en el estante columnas, y las medidas de conservación en las filas. En la figura 3, la plataforma dimensiones contiene un nivel de concentración de estímulo, y la plataforma contiene las medidas de nivel de concentración observada de las citoquinas.
    5. (Figura 3) Para diferenciar la visualización de una dimensión específica, lugar que marca la dimensión en la plataforma de texto, color o tamaño, dependiendo de la naturaleza de la dimensión. Estante texto intenta diferenciar los datos en la visualización, mediante el etiquetado con información textual proporcionada por la dimensión seleccionada. Estante de color y el tamaño automáticamente diferenciar los datos por color y tamaño, que se puede ajustar con la barra de desplazamiento situada en la parte inferior de cada estante. En la figura 3, colocando en el estante de color genotipo conduce a la separación de los tres genotipos de distintos colores.
    6. (Figura 3) Filtrar la visualización de las variables de columna específica en otra dimensión. Esto se puede hacer arrastrando la etiqueta de dimensión en la plataforma de filtrado. Aparecerá una ventana con la lista de valores para elegir. El valor seleccionado será el único valor que queda en la visualización.
    7. (Figura 4) Usted puede combinar la visualización con otra dimensión o medida para producir una matriz de visualización. Esto puede hacerse dejando caer las múltiples dimensiones en el estante columnas, y múltiples medidas de conservación filas. Figura 4 muestra un ejemplo de dos columnas de la matriz de visualización mediante la colocación de dos dimensiones diferentes en la plataforma columnas.
    8. Para producir una visualización similar, haga clic derecho en la hoja actual en la esquina inferior izquierda, y selecciona "hoja duplicada.
    9. Iterar el proceso de análisis para identificar las tendencias interesantes o atípicos que pueden ayudarle a generar nuevas hipótesis sobre los datos.
  2. Usted tiene múltiples conjuntos de datos generados a partir de la misma fuente, y desea explorar las posibles conexiones entre estos conjuntos de datos.
    1. Coloque varios conjuntos de datos en una misma fuente, es decir, dos hojas de cálculo a cabo en el mismo libro, para que Tableau para conectarse a estos datos a través de la misma conexión.
    2. (Figura 5) Conectar los conjuntos de datos a través de unirse lógica de los valores clave, asegurándose de que las dimensiones que son los mismos para varios conjuntos de datos seleccionados. En la figura 5, hay cinco valores clave para ingresar: identificador del tipo de célula, nivel de concentración de estímulo, etapa o grupo, el estímulo, y el sujeto.
    3. Realizar un análisis similar a la sección 1.1.

2. Basado en la presentación-las necesidades

  1. Usted sabe las relaciones entre los datos, pero desea ser capaz de generar rápidamente una lista de visualizaciones para su uso en la presentación.
    1. Siga el protocolo descrito en la sección 1.1, y anotar las visualizaciones en consecuencia.
    2. Utilice la función de exportación en el Tableau para producir imágenes de visualizaciones.
  2. Que han generado una serie de visualizaciones de gran alcance en el libro de Tableau y queremos compartir ese libro.
    1. Guarde el libro como libro Tableau envasados ​​y compartir este archivo.
    2. Colegas sin escritorio Tableau puede descargar lector de Tableau para abrir el libro envasados. Lector de Tableau permite a sus colegas para interactuar con las visualizaciones que ha creado.

3. Los resultados representativos

Figura 1
Figura 1. Una captura de pantallade Tableau después de importar la hoja de cálculo llamada NFKBIA de la demo.xls archivo de Excel. Las dimensiones y medidas de los estantes estaban pobladas correctamente con los datos categóricos y numéricos, respectivamente.

Figura 2
Figura 2. La ventana de campo calculado que se invoca para crear un campo especial calculada para su uso en el Tapete. La lista en la parte inferior izquierda de caja ayuda a identificar posibles campos, y la lista de la derecha contiene la abreviatura de las funciones que se pueden utilizar en la fórmula. En este ejemplo, queremos sumar los valores de PFD4, PFD3 y PFD2 para obtener el valor final que nos referimos como PFD> 2

Figura 3
Figura 3. Visualización del nivel de estímulo de concentración frente a la concentración de citoquinas observados. La visualización muestra un gráfico de los diferentes niveles de concentración del estímulo 3M-002 frente a la concentración observada de la citoquina TNF-α. Los colores de las líneas se refieren a los diferentes genotipos para un polimorfismo de un solo nucleótido en el gen NFKBIA de los individuos en nuestro estudio inmunológico innato.

Figura 4
Figura 4. Una captura de pantalla de visualización de una matriz de dos columnas. Hemos generado una matriz de dos columnas para facilitar una comparación lado a lado de las respuestas a dos estímulos, 3M-003 y LPS. El x-ejes son los diferentes niveles de concentración de los dos estímulos, y las parcelas del eje y los valores del campo calculado, PFD> 2.

Figura 5
Figura 5. Estas ventanas de diálogo Tableau ilustran cómo conectar los datos registrados en las hojas de cálculo diferente. Conexión de datos de hojas de cálculo diferente se puede lograr mediante la combinación de estos con lógica unirse a las cláusulas de los valores clave.

Visualización y análisis de herramientas
Función Cuadro VIS-STAMP xmdvtool GGobi Luz de las estrellas Gapminder Visulab InfoVis Toolkit Geotime Inspirar
Paralelo coordinar las parcelas No No No
Matrices gráfico de dispersión No No No No No
Reducción dimensional No No No No No No No No
Dimensiones temporales No No No
Geoespaciales dimensiones No No No No No
De minería de texto No No No No No No No No
La manipulación directa de los datos No No
Filtración No
De ampliación para otras plataformas (por ejemplo, R) No No No No No
CSV formatos de tabla No No No
XML formatos de datos No No No No
Puede hacer frente a una0000 + filas No No No No No No No
Documentación
Producto comercial No No No No No No

Tabla 1. Lista de herramientas visuales de análisis y algunas de sus características.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

El advenimiento de la tecnología de alto rendimiento en la investigación biomédica moderna llevó a una explosión de datos de investigación que requiere de una forma más eficiente de los análisis. La analítica visual (AV) es la ciencia del razonamiento analítico facilitada por interfaces interactivas visuales (1). El enfoque VA restaura el poder analítico en las manos del analista humano, a diferencia del enfoque tradicional para detectar patrones por ordenador. La analítica visual se ha aplicado a la investigación en diversos campos, tales como la defensa de investigación (1) y las tendencias de los huracanes (2). Hasta el momento, sólo hay algunos ejemplos de aplicaciones de VA en la biología (3). Hemos demostrado en este artículo de vídeo que VA es un enfoque que puede ser añadido al arsenal de los biólogos de herramientas de análisis. Muchos programas de VA están disponibles desde las que se encuentran en desarrollo en los laboratorios académicos a los que están disponibles en el mercado. Por nuestro trabajo en la inmunidad innata neonatal (4), se optó por Tableau, debido a su idoneidad en el análisis de una hoja de cálculo, bases de datos disponibles en el laboratorio. Otras herramientas de VA, algunos de los cuales mencionamos en nuestro artículo de vídeo, puede ser más apropiado para otros tipos de datos biológicos. Hicimos una lista de las funciones y características de algunas de las herramientas VA más popular en la Tabla 1. Esta lista no pretende ser exhaustiva, ya que está fuera del alcance de nuestro estudio, pero debe ser un buen punto de partida para los científicos determinar la herramienta adecuada VA por sus conjuntos de datos específicos.

Hay dos puntos principales de la VA que nos gustaría resaltar. Uno de ellos, el enfoque de VA se concibe como un proceso de exploración, ayudando a que el analista rápidamente los patrones de puntos, tales como las tendencias generales y los valores atípicos en los datos. El objetivo principal de la VA es proporcionar una técnica de visualización de gran alcance para grandes conjuntos de datos. No es una alternativa al análisis estadístico. De hecho, la mayoría de las herramientas de VA son muy limitados en su capacidad para realizar análisis estadísticos, aunque podemos anticipar que esto cambie en un futuro próximo. El segundo punto que quiero mencionar es que los datos de un tratamiento previo a la importación de los datos a una herramienta de VA es crucial para el éxito de los análisis. Tenga en cuenta que los datos presentados en forma legible en hojas de cálculo son a veces diferentes de un formato legible por máquina. Los datos de pre-procesamiento puede ser un paso mucho tiempo, que a menudo requiere una transformación masiva de los datos, si el formato original de los datos no es adecuado a la herramienta de VA. Le recomendamos una cuidadosa planificación de la entrada de datos y codificación para permitir cargas flexibles y eficientes para abajo herramientas de análisis de software, tales como los disponibles en VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

No hay conflictos de interés declarado.

Acknowledgments

Nos gustaría agradecer a los miembros de Vancouver Instituto de Visual Analytics (VIVA) para ofrecer comentarios y consejos para el proyecto. En particular, nos gustaría agradecer a John Dill, Brian Fisher, y Darvill David. También nos gustaría agradecer a los miembros del laboratorio de Kollmann por su apoyo y sus útiles comentarios. Este trabajo fue apoyado en parte por el Instituto Nacional de Alergias y Enfermedades Infecciosas, Instituto Nacional de Salud Grant N01 AI50023; Becas alérgenos NCE 07-A1A y 07 B2B-, y la Michael Smith Fundación para la Investigación en Salud. TRK es apoyado en parte por una concesión de carrera en la ciencia biomédica del anuncio Fondo Burroughs Wellcome por Institutos Canadienses de Salud de subvención en el Programa de Capacitación en Investigación Canadiense de Salud Infantil Científico Médica, en colaboración con la Fundación Niños Enfermos, Niño y la Familia del Instituto de Investigación ( Columbia Británica), la Mujer y la Infancia del Instituto de Investigación de la Salud (Alberta), Manitoba y el Instituto de Salud Infantil.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Inmunología Número 47 el análisis visual la citometría de flujo Luminex Tableau citoquinas la inmunidad innata el polimorfismo de nucleótido único
Facilitar el análisis de los datos inmunológicos con Visual técnicas analíticas
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter