Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator e Filigrana: Ferramentas para Análise de Redes Data-Driven de Dados Metabolômicos

Published: November 10, 2023 doi: 10.3791/65512

Summary

Apresentamos CorrelationCalculator e Filigrana, duas ferramentas para construção de redes baseadas em dados e análise de dados metabolômicos. O CorrelationCalculator suporta a construção de uma única rede de interação de metabólitos com base em dados de expressão, enquanto o Filigrana permite a construção de uma rede diferencial, seguida de clustering de rede e análise de enriquecimento.

Abstract

Um desafio significativo na análise de dados ômicos é extrair conhecimento biológico acionável. A metabolômica não é exceção. O problema geral de relacionar mudanças nos níveis de metabólitos individuais a processos biológicos específicos é agravado pelo grande número de metabólitos desconhecidos presentes em estudos de cromatografia líquida não direcionada acoplada à espectrometria de massas (LC-MS). Além disso, o metabolismo secundário e o metabolismo lipídico são pouco representados nos bancos de dados de vias existentes. Para superar essas limitações, nosso grupo desenvolveu diversas ferramentas para construção e análise de redes baseadas em dados. Estes incluem CorrelationCalculator e filigrana. Ambas as ferramentas permitem que os usuários construam redes baseadas em correlação parcial a partir de dados metabolômicos experimentais quando o número de metabólitos excede o número de amostras. CorrelationCalculator suporta a construção de uma única rede, enquanto Filigrana permite a construção de uma rede diferencial utilizando dados de dois grupos de amostras, seguido de agrupamento de rede e análise de enriquecimento. Descreveremos a utilidade e a aplicação de ambas as ferramentas para a análise de dados metabolômicos da vida real.

Introduction

Na última década, a metabolômica emergiu como ciência ômica devido aos avanços em tecnologias analíticas como a Cromatografia Gasosa-Espectrometria de Massas (GC-MS) e a Cromatografia Líquida-Espectrometria de Massas (LC-MS). Essas técnicas permitem a medição simultânea de centenas a milhares de metabólitos de pequenas moléculas, criando conjuntos de dados multidimensionais complexos. Os experimentos metabolômicos podem ser realizados em modos direcionados ou não. Experimentos de metabolômica direcionada medem classes específicas de metabólitos. Eles são geralmente orientados por hipóteses, enquanto abordagens não direcionadas tentam medir o maior número possível de metabólitos e são geradoras de hipóteses por natureza. Ensaios direcionados geralmente incluem padrões internos e, portanto, permitem a quantificação absoluta de metabólitos de interesse. Em contraste, ensaios não direcionados permitem quantificação relativa e incluem muitos metabólitos desconhecidos1.

A análise de dados metabolômicos é um processo de várias etapas que utiliza muitas ferramentas de software especializadas1. Ele pode ser dividido em três etapas principais: (1) processamento e controle de qualidade dos dados, (2) análise estatística e (3) interpretação dos dados biológicos. As ferramentas aqui descritas são projetadas para permitir a última etapa da análise.

Uma maneira intuitiva e popular de interpretar dados metabolômicos é mapear as medidas experimentais em vias metabólicas. Inúmeras ferramentas foram projetadas para isso2,3,4,5, incluindo o Metscape, desenvolvido por nosso grupo 6. O mapeamento de vias é frequentemente combinado com a análise de enriquecimento, o que ajuda a identificar as vias mais significativas 7,8. Essas técnicas ganharam destaque na análise de dados de expressão gênica e têm sido aplicadas com sucesso para análise de dados proteômicos e epigenômicos9,10,11,12,13. No entanto, a análise de dados metabolômicos apresenta uma série de desafios para abordagens baseadas em conhecimento. Primeiro, além dos metabólitos endógenos, os ensaios metabolômicos medem compostos exógenos, incluindo aqueles provenientes da nutrição e de outras fontes ambientais. Esses compostos, assim como os metabólitos produzidos por bactérias, não podem ser mapeados em vias humanas ou metabólicas de outros organismos eucarióticos. Além disso, a cobertura das vias do metabolismo secundário e do metabolismo lipídico atualmente não permite um mapeamento de alta resolução em nível que facilmente apoiaria a interpretação biológica dos dados14,15.

Técnicas de análise de rede orientadas por dados podem ajudar a superar esses desafios. Por exemplo, redes baseadas em correlação podem ajudar a derivar relações entre metabólitos conhecidos e desconhecidos e facilitar a anotação das incógnitas16. Embora o cálculo dos coeficientes de correlação de Pearson seja a abordagem mais simples para estabelecer as relações lineares entre metabólitos, a desvantagem é que ele captura associações diretas e indiretas17,18,19. Uma alternativa é calcular coeficientes de correlação parciais que possam distinguir entre associações diretas e indiretas. A modelagem gráfica gaussiana (GGM) pode ser usada para estimar redes de correlação parcial. No entanto, o GGM requer que o tamanho da amostra e o número de características sejam comparáveis. Essa condição raramente é encontrada em dados LC-MS não direcionados que contêm medições para milhares de características metabólicas. Técnicas de regularização podem ser utilizadas para superar essa limitação. Laço gráfico (Glasso) e regressão nodewise são métodos populares para estimação regularizada da rede de correlação parcial16,20.

A primeira das ferramentas de bioinformática aqui apresentadas, a CorrelationCalculator16, baseia-se no algoritmo de correlação parcial esparsa enviesada (DSPC). O DSPC conta com modelagem gráfica de laço desparsificado. A suposição subjacente do algoritmo é que o número de conexões entre os metabólitos é consideravelmente menor do que o número de amostras, ou seja, a rede de correlação parcial de metabólitos é escassa. Essa suposição permite que o DSPC descubra a conectividade entre um grande número de metabólitos usando menos amostras, aproveitando técnicas de regressão regularizada. Além disso, usando uma etapa de debiasing para as estimativas de regressão regularizada, obtém-se distribuições amostrais para os parâmetros de borda que podem ser usadas para construir intervalos de confiança e testar hipóteses de interesse (por exemplo, presença/ausência de uma única ou de um grupo de arestas). A presença ou ausência de uma aresta na rede de correlação parcial pode, portanto, ser formalmente testada usando os valores de p calculados.

O CorrelationCalculator mostrou-se muito útil para análise de grupo único16; No entanto, o objetivo de muitos experimentos metabolômicos é a análise diferencial de duas ou mais condições. Enquanto CorrelationCalculator pode ser empregado em cada um dos grupos separadamente para gerar redes de correlação parcial para cada condição, essa abordagem limita o número de amostras que podem ser usadas para geração de rede. Uma vez que um tamanho de amostra suficientemente grande é uma das maiores considerações na análise orientada por dados, métodos que possam aproveitar todas as amostras disponíveis nos dados para construir redes são altamente desejáveis. Essa abordagem é implementada na segunda ferramenta aqui apresentada, denominada Filigrana21. A filigrana baseia-se no algoritmo Differential Network Enrichment Analysis (DNEA) publicado anteriormente22. A Tabela 1 mostra os aplicativos e o fluxo de trabalho de ambas as ferramentas.

Número de condições experimentais (k) k = 1 k = 2
Ferramenta de software CorrelationCalculator Filigrana
Dados de entrada • Metabólitos x Matriz de dados de amostras • Metabólitos x Matriz de dados de amostras
• Grupos experimentais
Fluxo de trabalho
•Pré-tratamento
• Estimativa de rede
• Clustering de rede
• Análise de enriquecimento

• Transformação de logs; dimensionamento automático
• DSPC
• Através de aplicativos externos
•Não

• Transformação de logs; dimensionamento automático
• Estimativa de rede conjunta
• Agrupamento de consenso
• NetGSA
Visualização de dados Via aplicativo externo, por exemplo, Cytoscape Via aplicativo externo, por exemplo, Cytoscape
Testando módulos metabólicos para a associação com o desfecho de interesse (opcional) Através de aplicativos externos Através de aplicativos externos

Tabela 1: O escopo de aplicação e o fluxo de trabalho de CorrelationCalculator e Filigrana.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Calculadora de Correlação:

  1. Faça o download de um arquivo de entrada delimitado por vírgulas contendo uma lista de metabólitos com medições experimentais em http://metscape.med.umich.edu/kora_data_240.csv.
  2. Clique duas vezes no arquivo de exemplo baixado para abri-lo.
    1. Certifique-se de que o arquivo contenha rótulos para as amostras e os metabólitos.
    2. Como as amostras estão em linhas, confirme se a primeira coluna são os nomes de amostra e a primeira linha são os nomes dos metabólitos.
  3. Faça o download do aplicativo Java CorrelationCalculator (http://metscape.med.umich.edu/calculator.html). Clique duas vezes no arquivo de .jar baixado para iniciar o aplicativo.
  4. Na guia Entrada , clique no botão Procurar para carregar o arquivo de entrada.
  5. Em Especificar Formato de Arquivo, use a seta suspensa para selecionar o formato de arquivo de entrada apropriado. Selecione amostras em linhas (Figura suplementar 1).
  6. Vá para a guia Normalização de Dados clicando no botão Avançar >> no canto inferior direito da janela.
  7. Em Selecionar método(s), marque a caixa ao lado de Log2-Transform Data. Marque a caixa ao lado de Dimensionamento automático de dados.
  8. Em Normalizar Dados, clique no botão Executar .
    Observação : quando a normalização estiver concluída, clique no botão Exibir dados normalizados , localizado em Normalizar dados e revise o conjunto de dados atualizado (Figura suplementar 2).
  9. Em Normalizar Dados, clique no botão Salvar e salve o novo arquivo de dados.
  10. Vá para a guia Análise de Dados clicando no botão Avançar >> no canto inferior direito da janela.
  11. Em Calcular Correlação de Pearson, clique em Executar. Determine o melhor intervalo de Correlação de Pearson para os dados.
    1. Clique no botão Exibir histograma . Revise a frequência dos escores máximos de correlação de Pearson por característica.
    2. Clique no botão Exibir mapa de calor . Revise a representação da matriz de correlação de Pearson.
  12. Em Filtrar por correlações de Pearson, deixe os números padrão para filtrar por um intervalo de 0,00 a 1,00
    Observação : deslize a pequena seta azul na extremidade direita de 1 e a pequena seta azul à esquerda de 0 para alterar o filtro. Inserir números específicos nas caixas de texto também é uma opção.
  13. Em Selecionar Método de Correlação Parcial, selecione o método desejado, Método DSPC.
    Observação : se o número de metabólitos é menor do que o número de amostras no conjunto de dados, somente o método DSPC pode ser usado.
  14. Em Calcular correlações parciais, clique no botão Executar (Figura 3 suplementar).
  15. Clique no arquivo CSV View e visualize os resultados. Clique no botão Salvar e salve os resultados.
  16. Clique no botão Exibir no MetScape para iniciar uma rede de correlação interativa.
    Ver Karnovsky, A. et al.6 para obter mais informações sobre o uso do MetScape.
    NOTA: MetScape é uma aplicação Cytoscape que permite a criação e exploração de redes de correlação.

2. Filigrana

  1. Baixe um arquivo de entrada delimitado por vírgulas de amostra contendo medidas de metabólitos em http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Clique duas vezes no arquivo de exemplo baixado para abri-lo.
    1. Verifique se o arquivo contém nomes de exemplo na coluna 1 e atribuições de grupo na coluna 2. Confirme se as colunas restantes contêm metabolitos/lípidos.
    2. Certifique-se de que cada linha represente uma amostra.
      NOTA: As medições de metabolitos devem ser transformadas em log e dimensionadas automaticamente, a menos que se execute a agregação de funcionalidades, caso em que as medições só devem ser transformadas em log.
  3. Faça o download do aplicativo Filigree Java (http://metscape.med.umich.edu/filigree.html).
    NOTA: Um manual do usuário detalhado está disponível em http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Clique duas vezes no arquivo de .jar baixado para iniciar o aplicativo.
  5. Na guia Dados , clique no botão Procurar para carregar o arquivo de entrada.
  6. Em Especificar Colunas/Linhas, clique na seta suspensa ao lado de ID de Exemplo para selecionar o nome da coluna/linha correspondente no arquivo de entrada. Selecione Exemplo.
  7. Em Especificar colunas/linhas, clique na seta suspensa ao lado de "Grupo" para selecionar a coluna/linha correspondente no arquivo de entrada. Selecione Grupo.
  8. Em Especificar Grupos de Exemplo, clique nas setas suspensas ao lado de cada Grupo para selecionar a coluna de grupo correspondente no arquivo de entrada. Para o Grupo 1, selecione Diabético. Para o Grupo 2, selecione Não diabético.
  9. Em Agrupamento de Recursos, marque a caixa ao lado do método desejado, Calcular Grupos de Recursos.
  10. Clique no botão Exibir mapas de calor . Visualize o mapa de calor e determine uma redução percentual desejada.
  11. Use o controle deslizante Redução de recursos para selecionar a redução percentual desejada de recursos. Deslize o pequeno círculo até que a redução percentual mostre uma relação característica/amostra de 1,25 (Figura 4 suplementar).
  12. Vá para a guia Análise clicando no botão Avançar >> no canto inferior direito da janela.
  13. Em Selecionar diretório de saída, clique no botão Procurar e selecione o local de diretório desejado para armazenar os arquivos de saída gerados.
  14. Clique no botão Executar análise localizado na parte inferior esquerda da janela. As barras de progresso são atualizadas para cada componente de análise (Figura 5 Suplementar). Clique no botão OK na janela pop-up que exibe a mensagem Análise concluída com êxito.
  15. Na guia Análise , clique no botão Procurar Redes para abrir as sub-redes interativas do Filigrana em uma guia do navegador.
  16. Clique no link Sub-rede 1 na coluna Nome da sub-rede .
  17. Explore a sub-rede interativa usando os vários botões. Clique no botão + e aumente o zoom na parte da rede. Clique no botão - e reduza o zoom (Figura 6 Suplementar).
  18. Clique em um Nó de Grupo e arraste-o para reposicioná-lo dentro da sub-rede.
    NOTA: A cor do nó representa a regulação ascendente/descendente e a opacidade da cor representa a alteração da dobra superior/inferior. A cor da borda representa o status diferencial entre os grupos.
  19. Clique no botão Expandir Recursos no canto superior direito da página para expandir todos os nós do grupo. Revise os compostos específicos que compõem os nós do grupo.
  20. Clique no botão Recolher Recursos no canto superior direito da página para recolher os nós de grupo expandidos recentemente.
  21. Clique no botão Por Grupo de Amostra no canto superior direito da página para alterar a exibição de uma única sub-rede para várias sub-redes divididas por um grupo. Explore e compare os grupos usando essa visão das sub-redes (Figura 7 Suplementar).
  22. Clique no botão Todas as amostras para voltar ao modo de exibição de sub-rede única.
  23. Exiba a próxima sub-rede clicando no botão Avançar no canto superior direito da página.
  24. Repita as etapas 2.19-2.23 para cada sub-rede.
  25. Clique no link Resultados da Análise de Enriquecimento de Rede Diferencial no meio superior da janela para retornar à exibição de tabela de resumo listando todas as sub-redes.
    Observação : importar os arquivos de saída de borda e/ou nó em uma ferramenta de software diferente, como o Cytoscape23, para criar visualizações de rede adicionais.

3. Considerações adicionais

  1. Para computadores Mac com Big Sur (OSX 11.2) ou posterior, aprove a ferramenta no Menu Apple > Preferências do Sistema > Segurança e Privacidade > Geral e selecione Permitir na parte inferior da guia.
  2. Além disso, permita o acesso da filigrana aos arquivos no Menu Apple > nas Preferências do Sistema > Segurança e Privacidade > Privacidade selecionando Arquivos e Pastas no menu à esquerda e, em seguida, selecionando Filigrana no menu à direita.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Para ilustrar o uso da CorrelationCalculator, construímos uma rede de correlação parcial usando um subconjunto dos dados metabolômicos do estudo populacional KORA descrito em Krumsiek et al.24. O conjunto de dados continha 151 metabólitos e 240 amostras. A Figura 1 mostra a rede de correlação parcial resultante que foi visualizada no Cytoscape. A rede contém 148 nós e 272 bordas. A cor dos nós representa metabólitos pertencentes a diferentes classes químicas, enquanto as arestas representam o valor de p ajustado dos coeficientes de correlação parcial (valor de p ajustado < 0,05). Notavelmente, apesar de não usar nenhuma informação anterior, CorrelationCalculator foi capaz de agrupar metabólitos quimicamente relacionados. Por exemplo, fosfatidilcolinas e lisofosfatidilcolinas estão intimamente ligadas na rede. A visualização de mudanças de metabólitos no contexto desse tipo de rede pode facilitar a geração de hipóteses, ajudar a planejar experimentos futuros e permitir a preparação do manuscrito. Para ilustrar um fluxo de trabalho potencial utilizando uma rede de metabólitos de correlação parcial, realizamos agrupamento de redes de consenso como descrito em Ma et al.22, resultando na identificação de 9 sub-redes ou módulos metabólicos. Esses módulos apresentaram boa concordância com as classes químicas, ou seja, metabólitos pertencentes à mesma classe química tenderam a fazer parte de um mesmo módulo metabólico. O usuário pode acessar a ferramenta de clustering clusterNet em https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Figura 1: Exemplo representativo de uma rede CorrelationCalculator. A rede foi construída a partir de um subconjunto dos dados metabolômicos do estudo populacional KORA24 consistindo de 151 metabólitos em 240 indivíduos. Os nós representam metabólitos, e as arestas que os conectam são ponderadas pelo valor de p ajustado dos coeficientes de correlação parcial (valor de p ajustado < 0,05). A forma dos nós representa diferentes classes metabólicas, e a cor representa módulos metabólicos obtidos pelo agrupamento da rede usando o método de agrupamento de consenso. Clique aqui para ver uma versão maior desta figura.

Ilustramos a aplicação da filigrana analisando um conjunto de dados de um modelo de camundongo de diabetes tipo I (DM1)25,26. Dosagens de metabólitos plasmáticos de camundongos T1D e não-diabéticos (NOD) foram usadas para gerar uma rede de correlação parcial diferencial (Figura 2). Notadamente, observamos um maior grau de conectividade de rede no grupo de não-diabéticos. As etapas seguintes da análise identificaram doze módulos metabólicos, nove dos quais foram significativamente diferentes entre camundongos T1D e não diabéticos (FDR < 0,05). Remetemos o leitor à publicação original para maiores insights sobre as conclusões biológicas que podem ser extraídas dessa análise21.

Figure 2
Figura 2: Exemplo representativo de uma rede de filigrana. A rede diferencial foi construída utilizando os níveis de 163 metabólitos de 71 camundongos (30 T1D e 41 não-T1D)25,26. As bordas diferenciais entre os grupos T1D e não-T1D são indicadas em rosa e azul, respectivamente. Os nós são coloridos com base na mudança de dobra. A tabela mostra os resultados de enriquecimento produzidos pela filigrana. Nove das doze sub-redes identificadas foram significativamente diferentes entre DT1 e não-DT1 (valor de p ajustado < 0,05). Clique aqui para ver uma versão maior desta figura.

Figura suplementar 1: CorrCalc_InputTab. Captura de tela da guia Entrada da Calculadora de Correlação. Clique aqui para baixar este arquivo.

Figura suplementar 2: CorrCalc_DataNormTab. Captura de tela da guia Normalização de Dados da Calculadora de Correlação . Log-2 Transform Data e Autoscale Data são marcados. Clique aqui para baixar este arquivo.

Figura complementar 3: CorrCalc_DataAnalTab. Captura de tela da guia Análise de Dados da Calculadora de Correlação mostrando a filtragem para a Correlação de Pearson de 0-0,8. Além disso, o Método DSPC foi selecionado. Clique aqui para baixar este arquivo.

Figura 4 suplementar: Filigree_DataTab. Captura de tela da guia Dados da filigrana. Colunas, linhas e grupos foram especificados. O método Calcular Grupos de Recursos foi selecionado com uma redução de recursos de 1,25 na proporção de recursos/amostra. Clique aqui para baixar este arquivo.

Figura complementar 5: Filigree_AnalysisTab. Captura de tela da guia Análise de filigrana mostrando o progresso dos diferentes componentes de análise. Clique aqui para baixar este arquivo.

Figura 6 suplementar: Filigree_Subnetwork1. Uma sub-rede gerada a partir de filigrana. A cor do nó representa a regulação para cima/para baixo, e a opacidade da cor representa a mudança de dobra superior/inferior. A cor da borda representa o status diferencial entre os grupos. Clique aqui para baixar este arquivo.

Figura complementar 7: Filigree_Subnetwork_SampleGroup. Sub-rede separada por grupo. A rede esquerda representa amostras diabéticas e a rede direita representa amostras não diabéticas. A cor do nó representa o nível de expressão proporcional à média do grupo. Clique aqui para baixar este arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Métodos de análise de rede baseados em correlação parcial implementados em CorrelationCalculator e Filigrana ajudam a superar algumas das limitações das análises de vias metabólicas baseadas em conhecimento, especialmente para os conjuntos de dados com alta prevalência de metabólitos desconhecidos e cobertura limitada de vias metabólicas (por exemplo, dados lipidômicos). Essas ferramentas têm sido amplamente utilizadas pela comunidade de pesquisa para analisar uma ampla gama de dados metabolômicos e lipidômicos14,22,27,28,29,30. Por exemplo, a CorrelationCalculator tem sido usada para analisar dados de muitos sistemas biológicos que vão desde microbioma e plantas até doenças humanas31,32,33,34. Aqui ilustramos como a análise de redes orientada por dados, possibilitada por nossas ferramentas, pode ser combinada com análise de agrupamento e regressão para identificar os módulos metabólicos associados ao fenótipo de interesse.

Redes de correlação parcial geradas usando CorrelationCalculator e Filigrana podem ser agrupadas usando algoritmos de agrupamento de grafos para produzir módulos metabólicos. Esses módulos tendem a ser compostos por metabólitos química ou funcionalmente relacionados entre si. Tais módulos são muito úteis não apenas do ponto de vista da visualização, mas também do ponto de vista da relevância biológica. Estudar as relações entre módulos metabólicos e desfechos fenotípicos de interesse (por exemplo, desfecho de sobrevivência) pode fornecer mais poder estatístico e gerar insights biológicos adicionais em comparação com o teste de metabólitos individuais.

Módulos metabólicos identificados por meio de abordagens de agrupamento de redes também podem ser usados na análise de enriquecimento. A filigrana usa módulos metabólicos identificados através de agrupamento de consenso em vez de vias biológicas predefinidas. Embora os módulos metabólicos baseados em correlação parcial não sejam idênticos às vias, eles consistentemente agrupam metabólitos química e bioquimicamente semelhantes (por exemplo, aminoácidos, acilcarnitinas, lipídios da mesma classe, etc.). A filigrana testa ainda a significância desses módulos usando o algoritmo NetGSA22,35. Além dos nós diferenciais, o NetGSA é responsável por diferenças específicas de doenças na estrutura da rede.

Uma das questões a considerar ao usar CorrelationCalculator e Filigrana para a análise de dados metabolômicos e lipidômicos da "vida real" é a relação entre o número de metabólitos versus o número de amostras em um determinado experimento. Embora estudos epidemiológicos em grande escala envolvendo milhares de amostras estejam se tornando mais comuns, o tamanho da amostra na maioria dos experimentos metabolômicos permanece modesto. Isso é particularmente verdadeiro para estudos mecanísticos envolvendo sistemas onde se espera baixa variação biológica (i.e., linhagens celulares ou modelos animais geneticamente homogêneos). Os algoritmos estatísticos implementados em ambas as ferramentas podem ser aplicados em situações em que o número de metabólitos excede o número de amostras, mas o aumento dessa relação leva a redes mais esparsas.

Outra consideração importante para a aplicação das ferramentas aqui descritas diz respeito à análise de dados metabolômicos não direcionados que sabidamente contêm um grande número de características redundantes ou degeneradas36, que podem incluir isótopos, adutos químicos, fragmentos na fonte e contaminantes. Como muitas características degeneradas se originam do mesmo metabólito, elas tendem a ter um alto grau de correlação. A análise parcial baseada em correlação desses dados pode exigir anotação cuidadosa e remoção de características degeneradas.

Em conclusão, as ferramentas aqui apresentadas fornecem uma alternativa viável às ferramentas de análise de vias baseadas em conhecimento para a interpretação de dados metabolômicos.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm interesses financeiros concorrentes.

Acknowledgments

Este trabalho foi apoiado pela concessão NIH 1U01CA235487.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biologia Edição 201
CorrelationCalculator e Filigrana: Ferramentas para Análise de Redes Data-Driven de Dados Metabolômicos
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter