Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Facilitar a Análise de Dados com Visual imunológicos Técnicas Analíticas

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visual analytics (VA) é uma nova abordagem de análise de dados de forma interativa. Neste vídeo, discutimos o problema de sobrecarga de dados causada por high-throughput experimentos biológicos, e propor VA como uma solução para esse problema. O vídeo demonstra a análise dentro e entre os conjuntos de dados imunológicos usando uma ferramenta chamada Tableau VA.

Abstract

Visual analytics (VA) tem emergido como uma nova forma de analisar grande volume de dados através de display visual interativo. Demonstramos a utilidade ea flexibilidade de uma abordagem VA na análise de conjuntos de dados biológicos. Exemplos destes conjuntos de dados em imunologia incluem citometria de fluxo, dados Luminex e genotipagem (por exemplo, o polimorfismo de nucleotídeo único) de dados. Contrariamente à abordagem tradicional de visualização de informação, VA restaura o poder de análise nas mãos do analista, permitindo que o analista se engajar em tempo real processo de exploração de dados. Nós selecionamos o software chamado VA Tableau após avaliar várias ferramentas VA. Dois tipos de tarefas de análise de análise dentro e entre os conjuntos de dados foram demonstrados na apresentação de vídeo utilizando uma abordagem chamada análise pareada. Análise pareada, conforme definido no VA, é uma abordagem de análise em que um especialista ferramenta VA trabalha lado a lado com um especialista de domínio durante a análise. O especialista de domínio é aquele que entende o significado dos dados, e faz as perguntas que os dados coletados possam endereço. O especialista ferramenta cria visualizações para ajudar a encontrar padrões nos dados que possam responder a estas perguntas. O curto intervalo de tempo entre a geração de hipóteses ea exibição rápida visual dos dados é a principal vantagem de uma abordagem VA.

Protocol

1. Exploração baseada em Análise de Tableau

  1. Você tem um conjunto de dados e você deseja explorar as várias relações entre as colunas dentro dos dados.
    1. (Figura 1) Importe o conjunto de dados, clicando em 'Connect aos dados ". Escolha o tipo de fonte de dados e siga as instruções para importar o seu conjunto de dados.
    2. (Figura 1) Certifique-se que a plataforma dimensões contém colunas categóricas, enquanto a prateleira medidas contém colunas do conjunto de dados numéricos. Às vezes, uma coluna de dimensão, tais como identificador de assunto podem ser listados como medir se é numerada. Alterá-lo para dimensões clicando sobre ele e selecione "Convert to Dimension". Na Figura 1, as colunas do conjunto de dados categóricos tais como o nível de concentração e estímulo identificadores sujeitos estão correctamente colocados na prateleira dimensões, ea concentração de citocinas são observadas corretamente colocado na prateleira de medidas.
    3. (Figura 2) Se durante o processo de análise, um campo calculado é necessário, simplesmente clique direito em dimensões ou medidas de prateleira, e selecione 'Criar Campo Calculado. Entrada de cálculo da fórmula na caixa com os campos combinadas com funções ou operações matemáticas. A Figura 2 mostra como criar um novo campo chamado PFD> 2 agregando PFD2, PFD3 e PFD4 valores.
    4. (Figura 3) Gerar um lote 2-D no Tableau, tipicamente com uma dimensão e uma medida de interesse. Já que a interface oferece interação de arrastar e soltar-simples, a escolha da dimensão e medida pode ser facilmente alterada. Dimensões são normalmente colocadas em colunas de prateleira, e medidas em prateleira linhas. Na Figura 3, a plataforma dimensões contém nível de concentração de estímulo, ea plataforma medidas contém nível de concentração de citocinas observadas.
    5. (Figura 3) Para diferenciar a visualização de uma dimensão específica, coloque esse rótulo dimensão na prateleira cor do texto, ou tamanho, dependendo da natureza da dimensão. Prateleira texto tentativas para diferenciar de dados na visualização, rotulando-os com informações textuais fornecidas pela dimensão selecionada. Prateleira Cor e tamanho será automaticamente diferenciar dados por cor e tamanho, que pode ser ajustado com a barra de rolagem localizada na parte inferior de cada prateleira. Na figura 3, colocando genótipo na prateleira cor leva à separação de três genótipos de cores distintas.
    6. (Figura 3) Filtrar a visualização pelas variáveis ​​coluna específica em outra dimensão. Isto pode ser feito arrastando o rótulo dimensão na prateleira do filtro. Aparecerá uma janela com a lista de valores para escolher. O valor selecionado será os únicos valores restantes na visualização.
    7. (Figura 4) Você pode combinar visualização com outra dimensão ou medida para produzir uma matriz de visualização. Isto pode ser feito por queda múltiplas dimensões na prateleira colunas e múltiplas medidas na prateleira linhas. Figura 4 contém um exemplo de duas colunas da matriz de visualização, colocando duas dimensões diferentes na prateleira colunas.
    8. Para produzir uma visualização semelhante, clique direito sobre a planilha atual no canto inferior esquerdo, e selecionou 'página duplicada.
    9. Iterar o processo de análise para identificar as tendências interessantes ou outliers que podem ajudar a gerar novas hipóteses sobre os dados.
  2. Você tem múltiplos dataset gerado a partir da mesma fonte, e querem explorar as possíveis ligações entre estes conjuntos de dados.
    1. Coloque vários conjuntos de dados em uma mesma fonte, lugar ou seja, duas planilhas no mesmo livro, para permitir Tableau para se conectar a estes dataset através da mesma conexão.
    2. (Figura 5) Conecte os conjuntos de dados por meio de unir lógica de valores-chave, certificando-se que as dimensões que são as mesmas para vários conjuntos de dados são selecionados. Na Figura 5, existem cinco valores-chave para adesão: identificador de tipo de célula, nível de concentração de estímulo palco, ou grupo, de estímulo, e assunto.
    3. Realizar uma análise semelhante a seção 1.1.

2. Apresentação baseada em Necessidades

  1. Você sabe que as relações entre os dados, mas você quer ser capaz de gerar rapidamente uma lista de visualizações para uso em apresentações.
    1. Seguir o protocolo descrito na secção 1.1, e anotar as visualizações de acordo.
    2. Use a função de exportação no Tableau para produzir imagens de visualizações.
  2. Você tem gerado um conjunto de visualizações poderoso livro Tableau e quero compartilhar essa pasta de trabalho.
    1. Guardar o livro como livro Tableau embalados e compartilhar esse arquivo.
    2. Colegas sem desktop Tableau pode baixar Leitor Tableau para abrir o livro embalado. Leitor Tableau permite que os seus colegas de interagir com as visualizações que você criou.

3. RESULTADOS REPRESENTANTE

Figura 1
Figura 1. A screenshotTableau de depois de importar a planilha denominada NFKBIA do demo.xls arquivo do Excel. As dimensões e as prateleiras medidas foram devidamente preenchidos com os dados categóricos e numéricos, respectivamente.

Figura 2
Figura 2. A janela de Campo Calculado é chamado para criar um campo especial calculado para uso em Tableau. A lista na caixa inferior esquerda ajuda a identificar possíveis campos, ea lista no lado direito contém abreviação de funções que podem ser usados ​​na fórmula. Neste exemplo, nós queríamos adicionar os valores para PFD4, PFD3 PFD2 e para obter o valor final que nos referimos como PFD> 2

Figura 3
Figura 3. Visualização do nível de estímulo de concentração versus concentração de citocinas observadas. A visualização mostra um gráfico dos diferentes níveis de concentração do estímulo 3M-002 contra a concentração observada da citocina TNF-α. As cores das linhas referem-se os diferentes genótipos para o polimorfismo de nucleotídeo único no gene NFKBIA dos indivíduos em nosso estudo imunológico inato.

Figura 4
Figura 4. Um screenshot de uma matriz de visualização de duas colunas. Geramos uma matriz de duas colunas para facilitar uma comparação lado a lado de respostas a dois estímulos, a 3M-003 e LPS. O x-eixos são os diferentes níveis de concentração dos dois estímulos, e as parcelas do eixo y os valores do campo calculado, PFD> 2.

Figura 5
Figura 5. Essas janelas diálogo Tableau ilustram como conectar dados registrados em planilhas diferentes. De dados conectando a partir de planilhas diferentes pode ser realizado através da combinação destes usando lógica juntar cláusulas de valores de chave.

Ferramenta de visualização e análise
Função Quadro VIS-STAMP xmdvtool GGobi Luz das estrelas Gapminder Visulab InfoVis Toolkit Geotime Inspirar
Paralelo coordenar parcelas Sim Sim Sim Sim Sim Não Sim Sim Não Não
Enredo matrizes dispersão Sim Não Sim Sim Sim Não Sim Não Não Não
Redução dimensional Não Não Sim Sim Não Não Não Não Não Não
Dimensões temporais Sim Sim Não Sim Sim Sim Não Sim Sim Não
Dimensões geoespaciais Sim Sim Não Não Sim Sim Não Não Sim Não
Mineração de texto Não Não Não Não Sim Não Não Não Não Sim
Manipulação direta de dados Sim Sim Sim Sim Sim Sim Sim Não Sim Não
Filtragem Sim Sim Sim Sim Sim Sim Sim Não Sim Sim
Extensibilidade para outras plataformas (por exemplo, R) Sim Não Sim Sim Não Sim Não Sim Não Não
Tabela formatos CSV Sim Sim Sim Sim Não Não Sim Sim Sim Não
Formatos de dados XML Sim Não Não Sim Sim Não Sim Sim Sim Não
Pode lidar com um0000 + linhas Sim Não Não Não Sim Não Não Não Não Sim
Documentação Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim
Produto comercial Sim Não Não Não Sim Não Não Não Sim Sim

Lista Tabela 1. Análises de ferramentas visuais e algumas de suas características.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

O advento da tecnologia de alto rendimento na pesquisa biomédica moderna conduziu a uma explosão de dados de pesquisa que requer uma maneira mais eficiente de análise. Visual analytics (VA) é a ciência do raciocínio analítico facilitada pela interativo interfaces visuais (1). A abordagem VA restaura o poder analítico nas mãos do analista humano, ao contrário da abordagem tradicional para detectar padrões por computador. Visual analytics tem sido aplicada à pesquisa em vários campos, tais como a defesa de pesquisa (1) e as tendências de furacão (2). Até agora, existem apenas alguns exemplos de aplicações VA em biologia (3). Nós demonstramos neste artigo vídeo que VA é uma abordagem que pode ser adicionado ao arsenal do biólogo de ferramentas de análise. Muitos softwares VA estão disponíveis desde aquelas que estão em desenvolvimento nos laboratórios acadêmicos para aqueles que estão comercialmente disponíveis. Para o nosso trabalho na imunidade inata neonatal (4), optamos Tableau por causa de sua adequação na análise de planilhas de estilo conjuntos de dados disponíveis no laboratório. Outras ferramentas de VA, alguns dos quais mencionamos em nosso artigo de vídeo, pode ser mais apropriado para outros tipos de dados biológicos. Listamos as funções e características de algumas das ferramentas mais populares do VA na Tabela 1. Esta lista não pretende ser exaustiva, porque está além do escopo do nosso estudo, mas deve ser um bom ponto de partida para os cientistas para determinar a ferramenta adequada para a sua VA conjuntos de dados específicos.

Há dois pontos importantes sobre a VA que gostaríamos de destacar. Um, a abordagem VA é concebida como um processo de exploração, ajudando o analista rapidamente padrões de local, tais como tendências gerais e outliers nos dados. O foco principal do VA é fornecer uma poderosa técnica de visualização de grandes conjuntos de dados. Não é uma alternativa para análise estatística. Na verdade, a maioria das ferramentas VA são muito limitados em sua capacidade de realizar análise estatística, embora nós antecipamos que isso mude no futuro próximo. O segundo ponto que quero mencionar é que os dados de pré-processamento antes de importar o conjunto de dados para uma ferramenta VA é crucial para o sucesso da análise. Tenha em mente que os dados apresentados de forma legível em planilhas às vezes são diferentes de um formato legível por máquina. Dados de pré-processamento pode ser um passo demorado, muitas vezes exigindo a transformação maciça dos dados, se o formato original dos dados não é adequado para a ferramenta de VA. Recomendamos o planejamento cuidadoso de entrada de dados e codificação para permitir envios flexível e eficiente de ferramentas de análise de software a jusante, como os disponíveis em VA.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Não há conflitos de interesse declarados.

Acknowledgments

Gostaríamos de agradecer aos membros do Vancouver Institute of Visual Analytics (VIVA) para oferecer comentários e sugestões para o projeto. Em particular, gostaríamos de agradecer a John Dill, Brian Fisher, e David Darvill. Gostaríamos também de agradecer aos membros do laboratório Kollmann pelo apoio e discussões úteis. Este trabalho foi financiado em parte pelo Instituto Nacional de Alergia e Doenças Infecciosas, Instituto Nacional de Saúde Grant N01 AI50023; Grants Allergen NCE 07-07-A1A e B2B, eo Michael Smith Fundação para a Pesquisa em Saúde. TRK é suportado, em parte, por um Prémio Carreira na Ciência Biomédica da ad Burroughs Wellcome Fund por um Canadian Institutes for Health Research Grant Formação em Canadian Criança Programa de Saúde Clínico Scientist, em parceria com Doente-Kids Foundation, Criança e Família (Instituto de Pesquisa British Columbia), Saúde da Mulher e da Criança Research Institute (Alberta), e Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Imunologia Edição 47 análise visual citometria de fluxo Luminex Tableau de citocinas imunidade inata polimorfismo de nucleotídeo único
Facilitar a Análise de Dados com Visual imunológicos Técnicas Analíticas
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter