Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Uma Interface gráfica do usuário para racionalizar a análise de dados de alta dimensão Cytometry

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT é um baseado em MATLAB Graphical User Interface (GUI) que permite aos usuários analisar seus dados de citometria de fluxo via comumente empregadas técnicas de análise dos dados de alta dimensão incluindo redução de dimensionalidade através de t-PND, uma variedade de automático e manual fluxo de alta dimensão romance, heatmaps e métodos de clustering parcelas.

Abstract

Com o advento dos citômetros capazes de medir um número crescente de parâmetros, os cientistas continuam a desenvolver painéis maiores fenotipicamente explorar as características de suas amostras celulares. No entanto, estes avanços tecnológicos rendem elevado-dimensional conjuntos de dados que se tornaram cada vez mais difíceis de analisar objetivamente dentro tradicionais manual programas associados. A fim de melhor analisar e apresentar dados, cientistas parceiro com bioinformaticians com experiência em análise de dados de alta dimensão para analisar seus dados de citometria de fluxo. Enquanto esses métodos foram mostrados para ser altamente valiosa no estudo de citometria de fluxo, eles ainda têm a ser incorporados em um pacote simples e fácil de usar para os cientistas que não possuem conhecimentos computacionais ou programação. Para atender a essa necessidade, nós desenvolvemos ExCYT, uma baseada em MATLAB Graphical User Interface (GUI) que simplifica a análise dos dados de citometria de fluxo elevado-dimensional implementando técnicas analíticas comumente empregadas para a inclusão de dados de alta dimensão redução de dimensionalidade por t-PND, uma variedade de métodos de clusterização automáticos e manuais e heatmaps novo alta dimensão fluxo de parcelas. Além disso, ExCYT fornece opções associadas tradicionais de selecionadas populações de interesse para mais t-PND e análise, bem como a capacidade de aplicar gates diretamente na t-PND parcelas de clustering. O software fornece a vantagem adicional de trabalhar com qualquer compensada ou descompensados arquivos FCS. Caso a compensação pós aquisição é necessária, o usuário pode escolher fornecer o programa, um diretório único manchas e uma amostra de imaculado. O programa detecta eventos positivos em todos os canais e usa esses dados selecionados mais objetivamente, calcular a matriz de compensação. Em resumo, ExCYT fornece um pipeline de análise abrangente para pegar dados de citometria de fluxo na forma de arquivos FCS e permitir que qualquer indivíduo, independentemente de formação computacional, para usar as últimas abordagens algorítmicas na compreensão de seus dados.

Introduction

Avanços em citometria de fluxo, bem como o advento da citometria de massa permitiu que os médicos e cientistas para rapidamente identificar e caracterizar fenotipicamente biologicamente e clinicamente interessantes amostras com novos níveis de resolução, criando grandes conjuntos de dados altamente dimensionais que são informações ricas1,2,3. Enquanto os métodos convencionais para a análise de dados de citometria de fluxo como gating manual têm sido mais simples para experiências onde existem alguns marcadores e esses marcadores têm populações visualmente perceptíveis, esta abordagem pode falhar gerar Resultados reprodutíveis ao analisar conjuntos de dados de dimensão superior ou aqueles com marcadores em um espectro de coloração. Por exemplo, em um estudo multi-institucional, onde intra celular coloração (ICS) ensaios foram sendo realizados para avaliar a reprodutibilidade de dosar respostas de célula T de antígeno-específicas, apesar de boa precisão interlaboratorial, análise, particularmente gating, introduziu uma fonte significativa de variabilidade4. Além disso, o processo de retenção manualmente de população de interesses, além de ser altamente subjetivo é altamente consumindo tempo e mão de obra intensiva. No entanto, o problema de analisar conjuntos de dados de alta dimensão de maneira robusta, eficiente e oportuna não é um novo para as Ciências da pesquisa. Estudos de expressão do gene muitas vezes geram conjuntos de dados extremamente elevado-dimensional (muitas vezes na ordem de centenas de genes) onde formulários manuais de análise seria simplesmente inviável. Para obviar a análise desses conjuntos de dados, tem havido muito trabalho no desenvolvimento de ferramentas de bioinformatic para analisar a expressão de gene dados5. Essas abordagens algorítmicas só recentemente adoptaram-na análise dos dados de citometria como o número de parâmetros aumentou e têm provado para ser muito útil na análise destes conjuntos de dados dimensional elevada6,7.

Apesar da geração e aplicação de uma variedade de algoritmos e pacotes de software que permitem que os cientistas aplicar essas abordagens de bioinformatic alta dimensão aos seus dados de citometria de fluxo, estas técnicas analíticas ainda permanecem em grande parte não utilizadas. Embora possa haver uma variedade de fatores que têm limitado a adopção generalizada dessas abordagens para citometria dados8, o obstáculo principal suspeita no uso dessas abordagens pelos cientistas, é uma falta de conhecimento computacional. Na verdade, muitos destes pacotes de software (isto é, flowCore, flowMeans e OpenCyto) são escritos para ser implementado em linguagens de programação como R que ainda exigem conhecimento de programação substantivo. Pacotes de software, tais como FlowJo tem encontrado favor entre os cientistas, devido à simplicidade de uso e natureza 'plug-n-play', bem como a compatibilidade com o sistema operacional do PC. A fim de fornecer a variedade de técnicas analíticas aceitas e valiosas para a programação de cientista desconhecido, nós desenvolvemos ExCYT, uma interface de usuário gráfica (GUI) que pode ser facilmente instalada em um PC/Mac que puxa muitas das mais recentes técnicas incluindo a redução de dimensionalidade para visualização intuitiva, uma variedade de métodos de clusterização citado na literatura, juntamente com novos recursos para explorar a saída destes algoritmos com parcelas de fluxo/caixa alta dimensão heatmaps e romance de clustering.

ExCYT é uma interface de usuário gráfica criada em MATLAB e, portanto, pode também ser executado dentro MATLAB diretamente ou um instalador é fornecido que pode ser usado para instalar o software em qualquer PC/Mac. O software está disponível em https://github.com/sidhomj/ExCYT. Apresentamos um protocolo detalhado para saber como importar dados, pre-processá-lo, realizar redução de dimensionalidade de t-PND, dados do cluster, classificar & filtrar conjuntos com base em preferências do usuário e exibir informações sobre os clusters de interesse via heatmaps e romance fluxo/caixa alta dimensão parcelas (Figura 1). Eixos em parcelas t-PND são arbitrários e em unidades arbitrárias e como tal, como nem sempre mostrado nas figuras a simplicidade do usuário da interface. A coloração de pontos de dados no "t-PND Heatmaps" é do azul ao amarelo, com base no sinal do marcador indicado. Em soluções de cluster, a cor do ponto de dados se baseia arbitrário número de cluster. Todas as partes do fluxo de trabalho podem ser realizadas no painel único GUI (Figura 2 & tabela 1). Finalmente, vamos demonstrar o uso de ExCYT em dados publicados anteriormente, explorando a paisagem imune de carcinoma de células renais na literatura, também analisada com métodos similares. O conjunto de dados de exemplo que nós usamos para criar os números neste manuscrito juntamente com o protocolo abaixo pode ser encontrado em https://premium.cytobank.org/cytobank/projects/875, aquando do registo de uma conta.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. coletar e preparar dados Cytometry

  1. Coloca todas as manchas única em uma pasta por si mesmos e o rótulo com o nome de canal (por fluoróforo, não marcador).

2. pré-processamento & importação de dados

  1. Para pausar ou salvar em todo esse pipeline de análise, use o botão de Salvar espaço de trabalho no canto inferior esquerdo do programa para salvar o espaço de trabalho como um '. MAT' arquivo que mais tarde pode ser carregado através do botão de Carga de trabalho . Não execute mais de uma instância do programa de cada vez. Portanto, ao carregar um novo espaço de trabalho, certifique-se de verificar que não há nenhuma outra instância de ExCYT correndo.
  2. Para começar o pipeline de análise, primeiro selecione o tipo de citometria (citometria de fluxo ou citometria de massa – CYTOF), sob o número de Parâmetros de seleção de arquivo selecione de eventos a amostra do arquivo (para este exemplo uso 2.000). Uma vez que os dados foi importados com êxito, uma caixa de diálogo pop-up informando ao usuário que os dados foi importados com êxito.
  3. Pressione o botão de Autocompensação para realizar um passo opcional autocompensação, como feito por Bagwell & Adams9. Selecione o diretório contendo manchas única. Selecione a amostra imaculada dentro do diálogo de interface do usuário.
    1. Coloque um portão para a frente/lado-dispersão em qualquer das amostras neste diretório que será usado para selecionar eventos para calcular a matriz de compensação. Recomenda-se usar o exemplo imaculado para essa finalidade. Neste ponto, foi implementado um algoritmo para definir limiares consistentes noth percentil 99 da amostra imaculada para definir eventos positivos em cada uma das manchas simples para calcular a matriz de compensação. Quando isso for concluído, uma caixa de diálogo informará o usuário que foi realizada a compensação.
  4. Em seguida, pressione a População de portão e selecione as populações de células de interesse, como é a Convenção em fluxo cytometry análises. Quando a população de células é seleccionada, insira o número de porcentagem de análise a jusante de eventos (neste 10.000 eventos).
  5. Em seguida, seleccione os canais números a ser usado para análise na caixa de listagem no canto direito da caixa de pre-processamento (usar os canais específicos mostrados no exemplo).

3. análise t-PND

  1. Pressione o botão T-PND para que o programa começar iniciar para calcular o conjunto de dados de dimensão reduzida para visualização na janela abaixo do botão t-PND. Para salvar a imagem de t-PND, pressione Salvar imagem de TSNE. Em uma máquina com 8 CPU @ 3.4 GHz cada e 8 GM RAM esta etapa deve levar cerca de 2 minutos para 10.000 eventos, 10 minutos para 50.000 eventos e a 20 minutos para 100.000 eventos.
  2. Para criar um heatmap ' t-PND ', como pode ser visto em vários CYTOF publicações10,11, selecione uma opção no menu pop-up Marcador específico t-PND (use os marcadores específicos CD64 ou CD3, conforme mostrado no exemplo). Uma figura irá aparecer mostrando uma representação heatmap do enredo do t-PND que pode ser salvos para geração de figura.
  3. Selecione as áreas de interesse nas tramas t-PND pelo usuário para ainda mais a jusante análises usando o botão do Portão t-PND .

4. análise de cluster

  1. Para começar a análise de cluster, selecione uma opção no Método de Clustering listbox (no exemplo nos DBSCAN com um fator de distância de 5 no diálogo caixa à direita da caixa de listagem). Pressione o botão de Cluster .
  2. Use uma das seguintes opções para algoritmos de clusters automatizados encontrados no painel 'Parâmetros automatizada de Clustering':
    1. KMEANS difícil (no t-PND): aplique k-meios de cluster para os dados de 2-dimensional reduzido t-PND e requer o número de clusters deve ser fornecido para o algoritmo de12.
    2. KMEANS duro (em dados de HD): uso de k-meios de clustering para dados de alta dimensão originais que foi dado ao algoritmo t-PND. Mais uma vez, o número de clusters deve ser fornecido para o algoritmo.
    3. DBSCAN: Aplicar o método de cluster do cluster, chamado baseado em densidade Spatial Clustering de aplicações com ruído13 que clusters de dados 2-dimensional reduzido t-PND e requer um fator de distância não-dimensional que determina o tamanho geral do aglomerados. Este tipo de algoritmo de clustering é bem adequado para cluster a redução de t-PND como é capaz de cluster não-esferoidal de cluster que estão frequentemente presentes na representação reduzida t-PND. Além disso, devido ao fato de que ele opera sobre os dados 2-dimensional, é um dos algoritmos mais rápido clusters.
    4. De Clustering hierárquico: Aplica o método convencional de cluster hierárquico para os dados de alta dimensão, onde a matriz de toda distância euclidiana é calculada entre todos os eventos antes de fornecer o algoritmo de um fator de distância que define o tamanho do cluster.
    5. Gráfico de rede- Com base: Aplica um método de cluster que foi mais recentemente introduzido analisando dados de citometria de fluxo quando há subpopulações raras que o usuário deseja detectar11,14. Este método baseia-se na primeira, criando um gráfico que determina as conexões entre todos os eventos nos dados. Esta etapa consiste em fornecer um parâmetro inicial para criar o gráfico, que é o número de vizinhos k-a mais próxima. Este parâmetro geralmente rege o tamanho dos clusters. Neste ponto, a outra caixa de diálogo aparece perguntando ao usuário empregar um dos 5 algoritmos de clustering que é aplicado para o gráfico. Estes incluem 3 opções para maximizar a modularidade de gráfico, o método de Dan e um espectrais clusterização algoritmo14,15,16,17,18. Se alguém quiser uma solução de cluster geralmente mais rápido, recomendamos espectrais clusterização ou a maximização de modularidade rápido ganancioso. Enquanto os métodos de maximização de modularidade juntamente com o método de Dan em determinam o número ideal de clusters, Spectral Clustering requer o número de clusters para ser dado ao programa.
    6. Auto organizada mapa: Emprega uma rede neural artificial para os dados de alta dimensão do cluster.
    7. GMM-maximização de expectativa: criar um modelo de mistura gaussiano usando técnica de maximização de expectativa (me) para cluster de dados de alta dimensão. 19 este tipo de método de cluster também exige que o usuário inserir o número de clusters.
    8. Variacional inferência Bayesiana para GMM: criar um modelo de mistura gaussiano, mas ao contrário de EM, ele automaticamente pode determinar o número da mistura componentes k.20 enquanto o programa requer um número de clusters para ser dada (maior do que o esperado o número de clusters), o algoritmo irá determinar o número ideal por conta própria.
  3. Para estudar uma área específica da trama t-PND, pressione o botão Selecionar manualmente Cluster desenhar um conjunto de clusters definidos pelo usuário. Digno de nota, clusters não podem compartilhar Membros (ou seja, cada evento só pode pertencer a 1 cluster).

5. cluster filtração

  1. O grupo de clusters identificados ou manualmente ou através de um dos métodos automáticos descritos acima pode ser filtrar através da seguinte maneira.
    1. Para classificar os clusters (no painel Filtro de Cluster ) por qualquer um dos marcadores medidos no experimento, selecione uma opção no menu pop-up tipo . Para definir se a ordem é crescente ou decrescente, pressione no botão à direita do menu pop-up tipo Crescente/decrescente . Isto será atualizar a lista de Clusters na listbox 'Clusters (filtração)' e re-encomendá-los em ordem decrescente de expressão mediana aglomerado de marcador. O percentual indicado na listbox 'Clusters (filtração)' denota a porcentagem da população que representa este aglomerado.
    2. Para definir um valor de limiar mínimo para um determinado cluster através de um canal, selecione uma opção no menu pop-up limiar (neste exemplo nós o marcador CD65 e defina um limite na 0,75). Ou digite um valor na caixa numérica abaixo do gráfico ou usar a barra deslizante para definir um limite. Uma vez que o limite é definido, pressione Adicionar acima limite ou Adicionar abaixo de limiar para especificar a direção do limiar. Uma vez que esse limite foi definido, ela será listada na caixa de limiares, junto ao painel da 'Filtro de Cluster', onde o marcador, o valor de limiar e a direção serão listados para que o usuário está ciente de quais limites atualmente estão sendo aplicados. Finalmente, a trama de t-PND atualizará desfocando fora clusters que não satisfazem os requisitos da filtragem e listbox 'Clusters (filtração)' será atualizada para mostrar os clusters que cumprir as exigências de filtração.
    3. Para definir um limite mínimo para a frequência de um cluster, digite um limite numérico no Limiar de frequência de Cluster (%) caixa no painel Filtro de Cluster (no presente exemplo uso 1%).

6. cluster Analysis & visualização

  1. Para selecionar conjuntos para análise e visualização, selecione aglomerados no listbox de Clusters (filtração) e pressione o botão de à selecione para movê-los para o listbox Cluster analisar .
  2. Para criar heatmaps de clusters, selecionar grupos de interesse na Análise de Cluster listbox e pressione o botão HeatMap de Clusters . Quando este botão é pressionado, uma figura pop-up contendo um mapa de calor juntamente com dendrograms nos eixos cluster e parâmetro. A dendrograma no eixo vertical agrupará aglomerados por aqueles que estão intimamente relacionados ao mesmo tempo a dendrograma na horizontal eixo agrupará marcadores que estão co associados. Para salvar o heatmap, pressione arquivo | Configuração de exportação | Exportação.
  3. Para criar uma 'Parcela alta de caixa Dimensional' ou 'Alta Dimensional Flow plotagem', selecione os clusters turísticos na listbox Cluster analisar e pressione o botão de Plotagem de caixa Dimensional elevada ou o botão Alta Dimensional Flow plotar . Estes gráficos podem ser usados para avaliar visualmente a distribuição de canais de vários clusters tendo em conta todas as dimensões.
  4. Para mostrar aglomerados em parcelas de fluxo 2D tradicional, selecione a transformação (linear, log10, arcsinh) e canal no painel de Plotagem de fluxo convencional e imprensa parcela de fluxo convencional.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

A fim de testar a usabilidade de ExCYT, analisamos um conjunto de dados com curadoria, publicado por Chevrier et al . intitulada 'An imune Atlas de claro Cell Carcinoma Renal' onde o grupo realizou análises de CyTOF com um extenso painel imune em tumor amostras colhidas de 73 pacientes de11. Dois painéis separados, um painel de mieloide e linfoide, foram usados para caracterizar fenotipicamente o microambiente do tumor. O objetivo do nosso estudo foi recapitular os resultados da sua t-PND e análise, mostrando que ExCYT poderia ser usada para vir às mesmas conclusões, bem como mostrar métodos adicionais de análise de cluster e visualização de cluster.

O manuscrito original, o grupo descreveu 22 aglomerados de células T, identificados pelo painel linfoide e 17 aglomerados de células identificados pelo painel mieloide. Na Figura 3 e Figura 4 da publicação, o grupo mostra heatmaps de clusters, t-PND parcelas com soluções de clustering codificados por cores e t-PND heatmaps em subpainéis A, B e C. A fim de realizar a análise, obteve os dados manualmente fechados de Cytobank e amostrados 2.000 eventos de cada arquivo ou tomou todo o arquivo, se tivesse menos de 2.000 eventos, seguindo o pipeline de análise ilustrado no manuscrito original. Neste ponto, nós amostrado um total de 100.000 eventos através do nosso parâmetro de subamostragem pós-associado, realizou análises t-PND e usado uma variedade de métodos de clusterização para explorar os dados de várias maneiras.

Primeiro, nós examinamos o painel mieloide, seguindo o mesmo pipeline de análise como o manuscrito original, completando a análise t-PND e criando heatmaps dos vários marcadores (Figura 3A). Enquanto o manuscrito original normalizada a t-PND heatmaps para os 99% deth de cada marcador, ExCYT não faz este tipo de normalização para sua heatmaps. No entanto, distribuições similares de expressão co marcador foram observadas como descritas no manuscrito original. Então aplicamos um método baseado em gráfico de rede de cluster os dados criando o gráfico com 100 k-nearest vizinhos e o gráfico de cluster através de otimizando a modularidade do gráfico usando a implementação rápida-ganância dentro ExCYT, onde encontramos 19 subpopulações de células (Figura 3B). Quando comparar o heatmap destes clusters criados pelo ExCYT com o heatmap publicado no manuscrito original, observamos que fomos capazes de identificar agrupamentos semelhantes de células mieloides (Figura 3). Digno de nota, o manuscrito original identificou e contrastado duas sub-populações de células mieloides que identificamos em nossa análise definido pelo HLA-DRintCD68intCD64intCD36+CD11b+ (13 de Cluster) e HLA-DR+ CD4+CD68+CD64+CD36 CD11b (18 de Cluster). Visualização por parcela de caixa alta dimensão dessas duas populações revelou diferenças estatisticamente significativas (Mann-Whitney) dos seis marcadores mencionado (Figura 1).

Em seguida, analisamos o painel linfoide com uma abordagem de clusterização hierárquica mais rápido e mais convencional. Esta abordagem gerou semelhante distribuições do marcador através de t-PND heatmaps (Figura 4A). Além disso, agrupamento dos dados via hierárquica cluster (Figura 4B), demonstrou semelhantes aglomerados de células linfoides (Figura 4). Digno de nota, também identificamos a população exclusivos de célula T reguladoras do manuscrito original definido como CD4+CD25+Foxp3++CD127 CTLA-4 (Cluster 17) através de nosso enredo de fluxo elevado-dimensional (Figura 4).

Finalmente, nós queríamos empregar um método dentro ExCYT rapidamente e quantitativamente avaliar co associações entre marcadores. Começamos usando um algoritmo de clustering de k-means difícil estabelecer 5.000 conjuntos de dados t-PND bidimensional (Figura 4E). Então usamos a expressão mediana de todos os marcadores de todos estes clusters para criar um heatmap destes clusters (Figura 4F). Desde que estes heatmaps cluster linhas as well as colunas que são semelhantes, este método de abstrair os dados aplicando uma malha fina de clusters e então criando um heatmap nos permite buscar associações co facilmente, tais como a associação co de Tim-3, PD-1, CD38, e 4-1BB.

Figure 1
Figura 1: ExCYT Pipeline & características. (A) ExCYT começa importar dados brutos do FCS, aplicando compensação opcional, retenção, e subamostragem aleatória antes da análise a jusante. Isso garante que todos os eventos sendo analisados são relevantes para o experimento sendo analisado. redução de dimensionalidade de t-PND, em seguida, é executada para Visualizar todos os eventos e heatmaps t-PND pode ser gerado para visualizar distribuições fenotípicas. Finalmente, uma variedade de algoritmos de agrupamento pode ser aplicada em qualquer transformação t-PND ou dados brutos de alta dimensão. (B) romance classificação e limiarização características permitem que os usuários rapidamente classificar através de possivelmente centenas de clusters para encontrar aqueles de interesse. (C) Heatmaps de clusters podem ser criados para examinar como vários clusters comparam entre si, bem como quais marcadores co associam. (D) romance fluxo elevado-dimensional/caixa parcelas podem ser geradas como um formulário de fundos-gating clusters em dados originais ao mesmo tempo apreciando a natureza altamente dimensionais dos dados. Clique aqui para ver uma versão maior desta figura.

Figure 2
Figura 2: Interface de utilizador gráfica ExCYT: O ExCYT interface gráfica do usuário permite uma aerodinâmica trabalho fluxo trabalhando da esquerda para a direita do painel de como o usuário importa seus dados, realiza a redução de dimensionalidade de t-PND, cluster e análise de cluster final e visualização. Clique aqui para ver uma versão maior desta figura.

Figure 3
Figura 3: Recapitulação das subpopulações mieloides de Chevrier et al (A) Token t-PND heatmaps de trama painel mieloide (B) t-PND, da cor do painel mieloide codificada pelo algoritmo de clustering de rede-gráfico (C) Heatmap de clusters identificados pela solução de cluster no painel mieloide (D) comparativo de alta lote de caixa dimensional comparando contrastando subpopulações mieloides (Clusters de 13 e 18) referenciado no manuscrito original por favor clique aqui para ver uma versão maior desta figura.

Figure 4
Figura 4: Recapitulação das subpopulações linfoides de Chevrier et al (A) Token t-PND heatmaps de trama do painel linfoide (B) t-PND da cor do painel linfoides codificada pelo algoritmo de clustering hierárquico (C) Heatmap de clusters identificados pela solução de cluster no fluxo dimensional elevada de painel linfoide (D) parcela da população da pilha de T reguladoras identificados (17 de Cluster) no manuscrito original (E) solução de Clustering de 5.000 cluster difícil k-meios análise sobre dados t-PND (F) Heatmap de clusters identificados por k-means cluster solução na linfoide painel mostrando marcador co as associações. Clique aqui para ver uma versão maior desta figura.

Não. Descrição Nome (GUI)
1 Seleccione o tipo de citometria AT
2 Subamostragem aleatória de dados brutos AT
3 Selecione arquivos para análise Selecionar arquivo (s)
4 Autocompensação de dados brutos, com base em diretório de manchas único fornecido ao software Autocompensação
5 Gating para selecionar eventos para t-PND e análise de cluster População de portão
6 Subamostragem aleatória de condomínio fechado dados (número absoluto) AT
7 Subamostragem aleatória de condomínio fechado de dados (% da população fechada) AT
8 Selecionar canais para análise AT
9 Redução de dimensionalidade de execução t-PND t-PND
10 Janela t-PND AT
11 Salvar o espaço de trabalho Salvar o espaço de trabalho
12 Carga de trabalho Carga de trabalho
13 Criar t-PND heatmap selecionar marcador AT
14 Portão t-PND para voltar a fazer análise de t-PND da população selecione Portal t-PND
15 Salvar a janela t-PND como imagem Salvar imagem TSNE
16 Selecionar o algoritmo de Clustering Método de clustering
17 Digite o parâmetro de Clustering para dado algoritmo AT
18 Análise de cluster Cluster de
19 Desenhar Clusters manualmente Selecione o Cluster manualmente
20 Limpar todos os Clusters para refazer a análise de cluster Clusters de claras
21 Mostrar Clusters nas actuais condições de filtro Aglomerados (filtração)
22 Remover selecionados grupos de Cluster analisar listbox Remover <...
23 Adicionar cluster para Cluster analisar listbox Selecione-->
24 Criar heatmap convencional de todos os eventos em análise HeatMap de eventos
25 Clusters de classificar por selecione o marcador Tipo
26 Limite definido pelo marcador de seleção Limiar de
27 Criar heatmap convencional de selecionados clusters de Cluster analisar listbox HeatMap de Clusters
28 Inverter a ordem de classificação Crescente/decrescente
29 Limpar todos os limiares Limpar todos os limiares
30 Limite de frequência definida para clusters Limite de frequência de cluster (%)
31 Lista dos limiares atuais ativos na listbox 'Clusters (filtração)' Limiares
32 Caixa Dimensional elevada parcela Caixa Dimensional elevada parcela
33 Enredo de alto fluxo Dimensional Enredo de alto fluxo Dimensional
34 Parâmetro de eixo horizontal para plotagem de fluxo convencional AT
35 Parâmetro de eixo vertical para plotagem de fluxo convencional AT
36 Transformação de dados para plotagem de fluxo convencional no eixo horizontal AT
37 Transformação de dados para plotagem de fluxo convencional no eixo vertical AT
38 Criar o enredo de fluxo convencional Enredo de fluxo convencional
39 Show de Clusters para análise AT

Tabela 1: Visão geral de tudo funções presentes no ExCYT GUI

Nome do pacote de Software / ExCYT CYT FCS Express flowCore openCyto FlowMeans
Tipo de programa MATLAB MATLAB Aplicação stand-alone R R R
Preço para o usuário Grátis Grátis $1.000 Grátis Grátis Grátis
Interface gráfica do usuário Sim Sim Sim Não Não Não
Técnicas de redução de dimensionalidade t-PND t-PND, PCA t-PND, PCA, pá nenhum nenhum nenhum
Algoritmos de clustering K-Means
DBSCAN
Clusterização hierárquica
Autogestionadas mapa
Métodos baseados em rede vários-gráfico
GMM - EM
GMM - variacional inferência Bayesiana
K-Means
GMM - EM
Rede única-gráfico baseado método (Phenograph)
K-Means nenhum automação de workflow associada manual K-Means
Capacidade de Clusters do tipo/filtro Sim Não Não Não Não Não
Terrenos de alto fluxo Dimensional Sim Não Não Não Não Não

Tabela 2: Visão geral de soluções de fluxo de Software assistida análise Cytometry

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Aqui nós apresentamos ExCYT, interface gráfica do usuário do romance executando algoritmos baseados em MATLAB para simplificar a análise de dados de alta dimensão citometria, permitindo que os indivíduos com nenhuma experiência em programação para implementar o mais recente de dados de alta dimensão algoritmos de análise. A disponibilidade deste software para a comunidade científica mais ampla permitirá que os cientistas explorar seus dados de citometria de fluxo em um fluxo de trabalho intuitivo e simples. Através da realização de redução de dimensionalidade de t-PND, aplicando um método de cluster, sendo capaz de classificação/filtro através destes aglomerados rapidamente e fazer heatmaps flexível e personalizável e parcelas de fluxo/caixa alta dimensão, os cientistas será capaz não só entender as subpopulações exclusivamente definidas em suas amostras, mas será capaz de criar visualizações que são intuitivas e facilmente compreensível por seus colegas.

Enquanto o programa é flexível no tratamento de uma variedade de tipos de dados (convencional cytometry vs massa citometria de fluxo), existem algumas considerações para o utilitário ideal do programa. A primeira delas é sobre a qualidade dos dados, especificamente dos dados de citometria de fluxo. Resolução de sobreposição de espectros de emissão e compensação adequada é de suma importância. Dados mal compensados inadvertidamente podem levar a falsas Associações co de marcadores e formação de clusters que não são do verdadeiro significado biológico. Portanto, é altamente aconselhável que os dados de entrada são da qualidade do som antes de prosseguir com a análise de t-PND e análises posteriores a jusante. Além disso, o uso do algoritmo de compensação automática, implementado em ExCYT requer manchas claras única para todos os canais para calcular com precisão os parâmetros de compensação.

Outra consideração importante para o uso de ExCYT é ao concatenar vários arquivos FCS em uma análise (como demonstrado neste manuscrito), eles devem ser comparáveis em todos os canais. Em primeiro lugar, isso significa que o mesmo painel precisa ser usado em todas as amostras e que não há nenhum desvio entre as amostras em todos os canais. Por exemplo, se alguém fosse ler duas amostras em dias separados e CD8 manchado em FITC em ambos os dias, mas a tensão do citômetro de conjunto diferente em um dia, resultando em uma população de CD8 ligeiramente deslocada, um poderia gerar clusters de falsos na análise a jusante , como essa mudança foi gerada em função da variação do instrumento e não devido à importância biológica. Enquanto as versões futuras do ExCYT podem ser capazes de normalizar as amostras às suas manchas única, neste ponto, avaliação cuidadosa deve ser feita que arquivos FCS podem ser comparados ao outro antes de importá-los para ExCYT.

Finalmente, o processo de clusterização não é aquele que é absoluto/rígida. Parâmetros e algoritmos de clusters diferentes podem gerar diferentes soluções de clustering. Se a solução do algoritmo é apropriada é para o usuário determinar por sintetizar seu entendimento da biologia com a solução de cluster. Por exemplo, quando a compreensão do ambiente imune de tumores, um pode estar interessado em aglomerados macroscópicos (i.e., T células vs B células vs células mieloides) enquanto outro pode estar interessado em subpopulações de aglomerados macroscópicos. A resolução dos clusters é determinada pelo usuário e, portanto, nenhuma única solução de cluster é 'correto'. Esta é uma das principais vantagens de usar os terrenos de alto fluxo dimensional disponível em ExCYT. A capacidade de visualizar a distribuição de um determinado cluster em todos os canais pode ajudar o usuário a determinar se eles têm agrupado em não só uma biologicamente relevantes maneira mas de uma forma que seja relevante para a pergunta científica no experimento. Enquanto nosso objetivo é fornecer uma infinidade de métodos usados na literatura para dados de citometria de fluxo elevado-dimensional do cluster enquanto fornece métodos adicionais de clusterização, recomendamos o uso de métodos como k-means e DBSCAN para explorar os dados através de rapidamente Iterando sobre número de cluster e tamanho e movimento em direção a rede-gráfico e abordagens modelo gaussiano-misturado para abordagens mais robustas, mas mais demoradas.

Feitas essas considerações, ExCYT ainda é uma ferramenta altamente flexível e valiosa para explorar dados de citometria dimensional elevada e oferece recursos exclusivos/diferenciação do que outros pacotes disponíveis disponíveis para realizar este tipo de análise (tabela 2) . Primeiro, ExCYT diferencia-se por maioria as abordagens da análise fluxo cytometry utilizando a redução de dimensionalidade e algoritmos de clustering, pela sua capacidade de ser usado sem qualquer conhecimento de programação/script. Além disso, agregando muitos algoritmos de clusters, citados em toda literatura, acreditamos que podemos fornecer mais opções para clusterização de dados. Finalmente, nossa característica única do cluster filtragem e classificação junto com display através de parcelas de romance alto fluxo dimensional, permite aos usuários explorar as características de seus aglomerados de forma rápida e eficiente, tornando o processo de 'descobrir' rara subpopulações simples e eficientes.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada para divulgar.

Acknowledgments

Os autores têm sem agradecimentos.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Retração edição 143 citometria de fluxo High-Dimensional de análise t-PND clusterização mapas redução de dimensionalidade de calor
ExCYT: Uma Interface gráfica do usuário para racionalizar a análise de dados de alta dimensão Cytometry
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter