Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelacionaciónCalculadora y filigrana: herramientas para el análisis de redes basado en datos de datos metabolómicos

Published: November 10, 2023 doi: 10.3791/65512

Summary

Presentamos CorrelationCalculator y Filigree, dos herramientas para la construcción de redes basadas en datos y el análisis de datos metabolómicos. CorrelationCalculator admite la construcción de una única red de interacción de metabolitos basada en datos de expresión, mientras que Filigrana permite construir una red diferencial, seguida de la agrupación de redes y el análisis de enriquecimiento.

Abstract

Un reto importante en el análisis de los datos ómicos es la extracción de conocimientos biológicos procesables. La metabolómica no es una excepción. El problema general de relacionar los cambios en los niveles de metabolitos individuales con procesos biológicos específicos se ve agravado por el gran número de metabolitos desconocidos presentes en los estudios de cromatografía líquida y espectrometría de masas (LC-MS) no dirigidos. Además, el metabolismo secundario y el metabolismo lipídico están escasamente representados en las bases de datos de vías existentes. Para superar estas limitaciones, nuestro grupo ha desarrollado varias herramientas para la construcción y el análisis de redes basadas en datos. Estos incluyen CorrelationCalculator y Filigrana. Ambas herramientas permiten a los usuarios construir redes basadas en correlaciones parciales a partir de datos metabolómicos experimentales cuando el número de metabolitos supera el número de muestras. CorrelationCalculator admite la construcción de una sola red, mientras que Filigrana permite crear una red diferencial utilizando datos de dos grupos de muestras, seguidos de agrupación en clústeres de red y análisis de enriquecimiento. Describiremos la utilidad y aplicación de ambas herramientas para el análisis de datos metabolómicos de la vida real.

Introduction

En la última década, la metabolómica se ha convertido en una ciencia ómica debido a los avances en tecnologías analíticas como la cromatografía de gases-espectrometría de masas (GC-MS) y la cromatografía líquida-espectrometría de masas (LC-MS). Estas técnicas permiten la medición simultánea de cientos a miles de metabolitos de moléculas pequeñas, creando conjuntos de datos multidimensionales complejos. Los experimentos metabolómicos se pueden realizar en modo dirigido o no dirigido. Los experimentos de metabolómica dirigida miden clases específicas de metabolitos. Por lo general, se basan en hipótesis, mientras que los enfoques no dirigidos intentan medir tantos metabolitos como sea posible y son de naturaleza generadora de hipótesis. Los ensayos dirigidos suelen incluir patrones internos y, por lo tanto, permiten la cuantificación absoluta de los metabolitos de interés. Por el contrario, los ensayos no dirigidos permiten la cuantificación relativa e incluyen muchos metabolitos desconocidos1.

El análisis de datos metabolómicos es un proceso de varios pasos que aprovechamuchas herramientas de software especializadas. Se puede dividir en los siguientes tres pasos principales: (1) procesamiento de datos y control de calidad, (2) análisis estadístico y (3) interpretación de datos biológicos. Las herramientas descritas aquí están diseñadas para permitir el último paso del análisis.

Una forma intuitiva y popular de interpretar los datos metabolómicos es mapear las mediciones experimentales en las vías metabólicas. Para lograrlo se han diseñado numerosas herramientas 2,3,4,5, entre ellas Metscape, desarrollada por nuestro grupo6. El mapeo de vías a menudo se combina con el análisis de enriquecimiento, lo que ayuda a identificar las vías más significativas 7,8. Estas técnicas ganaron protagonismo por primera vez en el análisis de datos de expresión génica y se han aplicado con éxito para el análisis de datos de proteómica y epigenómica 9,10,11,12,13. Sin embargo, el análisis de los datos metabolómicos presenta una serie de desafíos para los enfoques basados en el conocimiento. En primer lugar, además de los metabolitos endógenos, los ensayos metabolómicos miden compuestos exógenos, incluidos los que provienen de la nutrición y otras fuentes ambientales. Estos compuestos, así como los metabolitos producidos por las bacterias, no pueden ser mapeados en las vías humanas o metabólicas de otros organismos eucariotas. Además, la cobertura de la vía del metabolismo secundario y del metabolismo lipídico actualmente no permite un mapeo de alta resolución al nivel que apoyaría fácilmente la interpretación biológica de los datos14,15.

Las técnicas de análisis de redes basadas en datos pueden ayudar a superar estos desafíos. Por ejemplo, las redes basadas en la correlación pueden ayudar a derivar relaciones entre metabolitos conocidos y desconocidos y facilitar la anotación de las incógnitas16. Si bien el cálculo de los coeficientes de correlación de Pearson es el enfoque más sencillo para establecer las relaciones lineales entre los metabolitos, la desventaja es que captura asociaciones directas e indirectas17,18,19. Una alternativa es calcular coeficientes de correlación parciales que puedan distinguir entre asociaciones directas e indirectas. El modelado gráfico gaussiano (GGM) se puede utilizar para estimar redes de correlación parcial. Sin embargo, GGM requiere que el tamaño de la muestra y el número de características sean comparables. Esta condición rara vez se cumple en los datos de LC-MS no dirigidos que contienen mediciones de miles de características metabólicas. Se pueden utilizar técnicas de regularización para superar esta limitación. El lazo gráfico (Glasso) y la regresión de nodos son métodos populares para la estimación regularizada de la red de correlación parcial 16,20.

La primera de las herramientas bioinformáticas aquí presentadas, CorrelationCalculator16, se basa en el algoritmo de correlación parcial dispersa desviada (DSPC). DSPC se basa en el modelado de lazo gráfico no dispersificado. La suposición subyacente del algoritmo es que el número de conexiones entre los metabolitos es considerablemente menor que el número de muestras, es decir, la red de correlación parcial de metabolitos es escasa. Esta suposición permite a DSPC descubrir la conectividad entre un gran número de metabolitos utilizando menos muestras, aprovechando las técnicas de regresión regularizada. Además, utilizando un paso de dessesgo para las estimaciones de regresión regularizada, obtiene distribuciones de muestreo para los parámetros de borde que se pueden utilizar para construir intervalos de confianza y probar hipótesis de interés (por ejemplo, presencia/ausencia de un solo borde o de un grupo de bordes). Por lo tanto, la presencia o ausencia de un borde en la red de correlación parcial se puede probar formalmente utilizando los valores p calculados.

CorrelacioneCalculator demostró ser muy útil para el análisis de un solo grupo16; Sin embargo, el objetivo de muchos experimentos metabolómicos es el análisis diferencial de dos o más condiciones. Aunque CorrelationCalculator se puede emplear en cada uno de los grupos por separado para generar redes de correlación parciales para cada condición, este enfoque limita el número de muestras que se pueden utilizar para la generación de redes. Dado que un tamaño de muestra suficientemente grande es una de las consideraciones más importantes en el análisis basado en datos, los métodos que pueden aprovechar todas las muestras disponibles en los datos para construir redes son muy deseables. Este enfoque se implementa en la segunda herramienta que se presenta aquí, llamada Filigrana21. Filigrana se basa en el algoritmo de Análisis de Enriquecimiento Diferencial de Red (ADN) publicado anteriormente22. En la Tabla 1 se muestran las aplicaciones y el flujo de trabajo de ambas herramientas.

Número de condiciones experimentales (k) k = 1 k = 2
Herramienta de software Calculadora de correlación Filigrana
Datos de entrada • Matriz de datos de metabolitos x muestras • Matriz de datos de metabolitos x muestras
• Grupos experimentales
Flujo de trabajo
•Pretratamiento
• Estimación de la red
• Agrupación en clústeres de red
• Análisis de enriquecimiento

• Transformación logarítmica; Escalado automático
• DSPC
• A través de aplicaciones externas
•No

• Transformación logarítmica; Escalado automático
• Estimación de la red conjunta
• Agrupación por consenso
• NetGSA
Visualización de datos A través de una aplicación externa, por ejemplo, Cytoscape A través de una aplicación externa, por ejemplo, Cytoscape
Prueba de módulos metabólicos para la asociación con el resultado de interés (opcional) A través de aplicaciones externas A través de aplicaciones externas

Tabla 1: El ámbito de aplicación y el flujo de trabajo de CorrelationCalculator y Filigrana.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Calculadora de correlación

  1. Descargue un archivo de entrada de muestra delimitado por comas que contenga una lista de metabolitos con mediciones experimentales en http://metscape.med.umich.edu/kora_data_240.csv.
  2. Haga doble clic en el archivo de muestra descargado para abrirlo.
    1. Asegúrese de que el archivo contenga etiquetas tanto para las muestras como para los metabolitos.
    2. Dado que las muestras están en filas, confirme que la primera columna son los nombres de las muestras y la primera fila son los nombres de los metabolitos.
  3. Descargue la aplicación Java CorrelationCalculator (http://metscape.med.umich.edu/calculator.html). Haga doble clic en el archivo .jar descargado para iniciar la aplicación.
  4. En la pestaña Entrada , haga clic en el botón Examinar para cargar el archivo de entrada.
  5. En Especificar formato de archivo, utilice la flecha desplegable para seleccionar el formato de archivo de entrada adecuado. Seleccione las muestras en filas (Figura complementaria 1).
  6. Desplácese a la pestaña Normalización de datos haciendo clic en el botón Siguiente >> en la parte inferior derecha de la ventana.
  7. En Seleccionar método(s), marque la casilla junto a Datos de transformación log2. Marque la casilla situada junto a Escalado automático de datos.
  8. En Normalizar datos, haga clic en el botón Ejecutar .
    NOTA: Una vez completada la normalización, haga clic en el botón Ver datos normalizados , ubicado en Normalizar datos, y revise el conjunto de datos actualizado (Figura complementaria 2).
  9. En Normalizar datos, haga clic en el botón Guardar y guarde el nuevo archivo de datos.
  10. Desplácese a la pestaña Análisis de datos haciendo clic en el botón Siguiente >> en la parte inferior derecha de la ventana.
  11. En Calcular la correlación de Pearson, haga clic en Ejecutar. Determine el mejor rango de correlación de Pearson para los datos.
    1. Haga clic en el botón Ver histograma . Revise la frecuencia de las puntuaciones máximas de correlación de Pearson por característica.
    2. Haga clic en el botón Ver mapa de calor . Revise la representación de la matriz de correlación de Pearson.
  12. En Filtrar por correlaciones de Pearson, deje los números predeterminados para filtrar por un rango de 0,00 a 1,00
    NOTA: Deslice la pequeña flecha azul en el extremo derecho desde 1 y la pequeña flecha azul a la izquierda desde 0 para cambiar el filtro. Ingresar números específicos en los cuadros de texto también es una opción.
  13. En Seleccionar método de correlación parcial, seleccione el método deseado, Método DSPC.
    NOTA: Si el número de metabolitos es menor que el número de muestras en el conjunto de datos, solo se puede utilizar el método DSPC.
  14. En Calcular correlaciones parciales, haga clic en el botón Ejecutar (Figura complementaria 3).
  15. Haga clic en Ver archivo CSV y vea los resultados. Haga clic en el botón Guardar y guarde los resultados.
  16. Haga clic en el botón Ver en MetScape para iniciar una red de correlación interactiva.
    Véase Karnovsky, A. et al.6 para obtener más información sobre el uso de MetScape.
    NOTA: MetScape es una aplicación de Cytoscape que permite la creación y exploración de redes de correlación.

2. Filigrana

  1. Descargue un archivo de entrada de muestra delimitado por comas que contenga las mediciones de metabolitos en http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
  2. Haga doble clic en el archivo de muestra descargado para abrirlo.
    1. Asegúrese de que el archivo contiene nombres de muestra en la columna 1 y asignaciones de grupo en la columna 2. Confirme que las columnas restantes contienen metabolitos/lípidos.
    2. Asegúrese de que cada fila representa una muestra.
      NOTA: Las mediciones de metabolitos deben transformarse logarítmicamente y escalarse automáticamente a menos que se realice la agregación de características, en cuyo caso las mediciones solo deben transformarse logarítmicamente.
  3. Descargue la aplicación Java Filigree (http://metscape.med.umich.edu/filigree.html).
    NOTA: Un manual de usuario detallado está disponible en http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
  4. Haga doble clic en el archivo .jar descargado para iniciar la aplicación.
  5. En la pestaña Datos , haga clic en el botón Examinar para cargar el archivo de entrada.
  6. En Especificar columnas/filas, haga clic en la flecha desplegable junto a ID de muestra para seleccionar el nombre de columna/fila correspondiente del archivo de entrada. Seleccione Muestra.
  7. En Especificar columnas/filas, haga clic en la flecha desplegable junto a "Grupo" para seleccionar la columna/fila correspondiente del archivo de entrada. Seleccione Grupo.
  8. En Especificar grupos de muestra, haga clic en las flechas desplegables junto a cada grupo para seleccionar la columna de grupo correspondiente del archivo de entrada. En Grupo 1, seleccione Diabético. En Grupo 2, seleccione No diabético.
  9. En Agrupación de entidades, marque la casilla situada junto al método deseado, Calcular grupos de entidades.
  10. Haga clic en el botón Ver mapas de calor . Vea el mapa de calor y determine el porcentaje de reducción deseado.
  11. Utilice el control deslizante Reducción de entidades para seleccionar el porcentaje de reducción de entidades que desee. Deslice el círculo pequeño hasta que la reducción porcentual muestre una relación entidad-muestra de 1,25 (Figura complementaria 4).
  12. Desplácese a la pestaña Análisis haciendo clic en el botón Siguiente >> en la parte inferior derecha de la ventana.
  13. En Seleccionar directorio de salida, haga clic en el botón Examinar y seleccione la ubicación del directorio deseado para almacenar los archivos de salida generados.
  14. Haga clic en el botón Ejecutar análisis situado en la parte inferior izquierda de la ventana. Las barras de progreso se actualizan para cada componente de análisis (Figura complementaria 5). Haga clic en el botón Aceptar en la ventana emergente que muestra el mensaje Análisis completado correctamente.
  15. En la pestaña Análisis , haga clic en el botón Examinar redes para abrir las subredes interactivas de filigrana en una pestaña del navegador.
  16. Haga clic en el enlace Subred 1 en la columna Nombre de subred .
  17. Explore la subred interactiva utilizando los distintos botones. Haga clic en el botón + y amplíe la parte de la red. Haga clic en el botón - y aléjese (Figura complementaria 6).
  18. Haga clic en un nodo de grupo y arrástrelo para cambiarlo de posición dentro de la subred.
    NOTA: El color del nodo representa la regulación hacia arriba o hacia abajo, y la opacidad del color representa el cambio de pliegue más alto o más bajo. El color del borde representa el estado diferencial entre los grupos.
  19. Haga clic en el botón Expandir entidades en la parte superior derecha de la página para expandir todos los nodos del grupo. Revise los compuestos específicos que componen los nodos del grupo.
  20. Haga clic en el botón Contraer entidades en la parte superior derecha de la página para contraer los nodos de grupo expandidos recientemente.
  21. Haga clic en el botón Por grupo de muestras en la parte superior derecha de la página para cambiar la vista de una sola subred a varias subredes divididas por un grupo . Explore y compare los grupos utilizando esta vista de las subredes (Figura complementaria 7).
  22. Haga clic en el botón Todas las muestras para volver a la vista de subred única.
  23. Para ver la siguiente subred, haga clic en el botón Siguiente en la parte superior derecha de la página.
  24. Repita los pasos 2.19-2.23 para cada subred.
  25. Haga clic en el vínculo Resultados del análisis de enriquecimiento diferencial de red en la parte superior central de la ventana para volver a la vista de tabla de resumen que enumera todas las subredes.
    NOTA: Importe los archivos de salida de borde y/o nodo en una herramienta de software diferente, como Cytoscape23, para crear visualizaciones de red adicionales.

3. Consideraciones adicionales

  1. Para computadoras Mac con Big Sur (OSX 11.2) o posterior, apruebe la herramienta en el menú Apple > Preferencias del > Seguridad y privacidad > General y seleccione Permitir en la parte inferior de la pestaña.
  2. Además, permite que Filigrana acceda a los archivos en el menú de Apple > Preferencias del Sistema > Seguridad y privacidad > Privacidad seleccionando Archivos y carpetas en el menú de la izquierda y, a continuación, seleccionando Filigrana en el menú de la derecha.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Para ilustrar el uso de CorrelationCalculator, construimos una red de correlación parcial utilizando un subconjunto de los datos metabolómicos del estudio poblacional KORA descrito en Krumsiek et al.24. El conjunto de datos contenía 151 metabolitos y 240 muestras. La Figura 1 muestra la red de correlación parcial resultante que se visualizó en Cytoscape. La red contiene 148 nodos y 272 bordes. El color de los nodos representa los metabolitos que pertenecen a diferentes clases químicas, mientras que los bordes representan el valor p ajustado de los coeficientes de correlación parcial (valor p ajustado < 0,05). En particular, a pesar de no utilizar ninguna información previa, CorrelationCalculator fue capaz de agrupar metabolitos químicamente relacionados. Por ejemplo, las fosfatidilcolinas y las lisofosfatidilcolinas están estrechamente conectadas en la red. La visualización de los cambios en los metabolitos en el contexto de este tipo de redes puede facilitar la generación de hipótesis, ayudar a planificar futuros experimentos y permitir la preparación de manuscritos. Para ilustrar un flujo de trabajo potencial utilizando una red de metabolitos de correlación parcial, realizamos un agrupamiento de redes de consenso como se describe en Ma et al.22, lo que resultó en la identificación de 9 subredes o módulos metabólicos. Estos módulos tenían una buena concordancia con las clases químicas, es decir, los metabolitos pertenecientes a la misma clase química tendían a formar parte del mismo módulo metabólico. El usuario puede acceder a la herramienta de clustering clusterNet en https://github.com/Karnovsky-Lab/clusterNet.

Figure 1
Figura 1: Ejemplo representativo de una red CorrelationCalculator. La red se construyó a partir de un subconjunto de los datos metabolómicos del estudio poblacionalKORA 24 que consta de 151 metabolitos en 240 sujetos. Los nodos representan metabolitos, y los bordes que los conectan se ponderan por el valor p ajustado de los coeficientes de correlación parcial (valor p ajustado < 0,05). La forma de los nodos representa diferentes clases metabólicas, y el color representa los módulos metabólicos obtenidos mediante la agrupación de la red utilizando el método de agrupación por consenso. Haga clic aquí para ver una versión más grande de esta figura.

Ilustramos la aplicación de la filigrana mediante el análisis de un conjunto de datos de un modelo de ratón de diabetes tipo I (DT1)25,26. Se utilizaron mediciones de metabolitos plasmáticos de ratones con DM1 y no diabéticos (NOD) para generar una red de correlación parcial diferencial (Figura 2). En particular, observamos un mayor grado de conectividad de red en el grupo no diabético. Los siguientes pasos del análisis identificaron doce módulos metabólicos, nueve de los cuales eran significativamente diferentes entre los ratones con diabetes tipo 1 y los no diabéticos (FDR < 0,05). Remitimos al lector a la publicación original para obtener más información sobre las conclusiones biológicas que pueden extraerse de este análisis21.

Figure 2
Figura 2: Ejemplo representativo de una red de filigrana. La red diferencial se construyó utilizando los niveles de 163 metabolitos de 71 ratones (30 DT1 y 41 no DT1)25,26. Los bordes diferenciales entre los grupos con diabetes tipo 1 y sin diabetes tipo 1 se indican en rosa y azul, respectivamente. Los nodos se colorean en función del cambio de plegado. La tabla muestra los resultados de enriquecimiento producidos por Filigrana. Nueve de las doce subredes identificadas fueron significativamente diferentes entre DT1 y no DT1 (valor p ajustado < 0,05). Haga clic aquí para ver una versión más grande de esta figura.

Figura complementaria 1: CorrCalc_InputTab. Captura de pantalla de la pestaña Entrada de la calculadora de correlación. Haga clic aquí para descargar este archivo.

Figura complementaria 2: CorrCalc_DataNormTab. Captura de pantalla de la pestaña Normalización de datos de la calculadora de correlación. Se comprueban los datos de transformación de registro 2 y los datos de escalado automático . Haga clic aquí para descargar este archivo.

Figura complementaria 3: CorrCalc_DataAnalTab. Captura de pantalla de la pestaña Análisis de datos de la calculadora de correlación que muestra el filtrado a la correlación de Pearson de 0-0,8. Además, se ha seleccionado el método DSPC . Haga clic aquí para descargar este archivo.

Figura complementaria 4: Filigree_DataTab. Captura de pantalla de la pestaña Datos de Filigrana. Se han especificado columnas, filas y grupos. Se ha seleccionado el método Calcular grupos de entidades con una reducción de características de 1,25 en relación entidad-muestra. Haga clic aquí para descargar este archivo.

Figura complementaria 5: Filigree_AnalysisTab. Captura de pantalla de la pestaña Análisis de Filigrana que muestra el progreso de los diferentes componentes del análisis. Haga clic aquí para descargar este archivo.

Figura complementaria 6: Filigree_Subnetwork1. Una subred generada a partir de filigrana. El color del nodo representa la regulación hacia arriba o hacia abajo, y la opacidad del color representa el cambio de pliegue más alto o más bajo. El color del borde representa el estado diferencial entre los grupos. Haga clic aquí para descargar este archivo.

Figura complementaria 7: Filigree_Subnetwork_SampleGroup. Subred separada por grupo. La red de la izquierda representa las muestras diabéticas y la red de la derecha representa las muestras no diabéticas. El color del nodo representa el nivel de expresión proporcional a la media del grupo. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Los métodos de análisis de redes basados en correlaciones parciales implementados en CorrelationCalculator y Filigree ayudan a superar algunas de las limitaciones de los análisis de vías metabólicas basados en el conocimiento, especialmente para los conjuntos de datos con una alta prevalencia de metabolitos desconocidos y una cobertura limitada de vías metabólicas (por ejemplo, datos lipidómicos). Estas herramientas han sido ampliamente utilizadas por la comunidad investigadora para analizar una amplia gama de datos metabolómicos y lipidómicos 14,22,27,28,29,30. Por ejemplo, CorrelationCalculator se ha utilizado para analizar los datos de muchos sistemas biológicos que van desde el microbioma y las plantas hasta las enfermedades humanas31,32,33,34. Aquí ilustramos cómo el análisis de redes basado en datos, habilitado por nuestras herramientas, se puede combinar con el análisis de agrupamiento y regresión para identificar los módulos metabólicos asociados con el fenotipo de interés.

Las redes de correlación parcial generadas con CorrelationCalculator y Filigree se pueden agrupar utilizando algoritmos de agrupamiento de grafos para producir módulos metabólicos. Estos módulos tienden a comprender metabolitos que están química o funcionalmente relacionados entre sí. Estos módulos son muy útiles no solo desde el punto de vista de la visualización, sino también desde el punto de vista de la relevancia biológica. El estudio de las relaciones entre los módulos metabólicos y los resultados fenotípicos de interés (por ejemplo, el resultado de supervivencia) puede proporcionar más poder estadístico y generar información biológica adicional en comparación con las pruebas de metabolitos individuales.

Los módulos metabólicos identificados a través de enfoques de agrupamiento en red también se pueden utilizar en el análisis de enriquecimiento. La filigrana utiliza módulos metabólicos identificados a través de agrupamientos consensuados en lugar de vías biológicas predefinidas. Aunque los módulos metabólicos basados en la correlación parcial no son idénticos a las vías, agrupan sistemáticamente metabolitos química y bioquímicamente similares (por ejemplo, aminoácidos, acilcarnitinas, lípidos de la misma clase, etc.). La filigrana prueba además la importancia de estos módulos utilizando el algoritmo NetGSA 22,35. Además de los nodos diferenciales, NetGSA tiene en cuenta las diferencias específicas de la enfermedad en la estructura de la red.

Una de las cuestiones a tener en cuenta cuando se utilizan CorrelationCalculator y Filigrana para el análisis de datos metabolómicos y lipidómicos de la "vida real" es la relación entre el número de metabolitos y el número de muestras en un experimento determinado. Si bien los estudios epidemiológicos a gran escala que involucran miles de muestras son cada vez más comunes, el tamaño de la muestra en la mayoría de los experimentos de metabolómica sigue siendo modesto. Esto es particularmente cierto para los estudios mecanicistas que involucran sistemas en los que se espera una baja variación biológica (es decir, líneas celulares o modelos animales genéticamente homogéneos). Los algoritmos estadísticos implementados en ambas herramientas se pueden aplicar en situaciones en las que el número de metabolitos supera el número de muestras, pero el aumento de esa proporción conduce a redes más dispersas.

Otra consideración importante para la aplicación de las herramientas aquí descritas se refiere al análisis de datos metabolómicos no dirigidos que se sabe que contienen un gran número de características redundantes o degeneradas36, que pueden incluir isótopos, aductos químicos, fragmentos en la fuente y contaminantes. Dado que muchas características degeneradas se originan a partir del mismo metabolito, tienden a tener un alto grado de correlación. El análisis parcial basado en la correlación de dichos datos puede requerir una anotación cuidadosa y la eliminación de características degeneradas.

En conclusión, las herramientas aquí presentadas proporcionan una alternativa viable a las herramientas de análisis de vías basadas en el conocimiento para la interpretación de datos metabolómicos.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen intereses financieros contrapuestos.

Acknowledgments

Este trabajo fue financiado por la subvención NIH 1U01CA235487.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biología Número 201
CorrelacionaciónCalculadora y filigrana: herramientas para el análisis de redes basado en datos de datos metabolómicos
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter