Construcción y visualización de modelos mediante un marco de aprendizaje automático basado en MIME

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Construcción y visualización de modelos mediante un marco de aprendizaje automático basado en MIME

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime es un marco computacional flexible para construir un modelo de integración basado en el aprendizaje automático con un rendimiento elegante. Aquí, proporcionamos un procedimiento detallado paso a paso para desarrollar modelos predictivos con alta precisión, aprovechando conjuntos de datos complejos para identificar genes críticos asociados con la progresión de la enfermedad, los resultados de los pacientes y la respuesta terapéutica.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La tecnología de secuenciación de alto rendimiento ha mejorado significativamente nuestra comprensión de la biología y la heterogeneidad del cáncer. Los algoritmos de aprendizaje automático de datos transcripcionales se han vuelto vitales para predecir el pronóstico de los pacientes y las respuestas clínicas. A pesar de los avances en los algoritmos de aprendizaje automático, sigue sin existir una plataforma de código abierto que incorpore los algoritmos de aprendizaje automático más sofisticados en datos transcripcionales. Para abordar esta brecha, desarrollamos Mime, un marco de aprendizaje automático versátil para mejorar la construcción y visualización de modelos predictivos de características clínicas y firmas genéticas. Mediante la integración de diversos conjuntos de datos y el empleo de las técnicas de selección de características más avanzadas, Mime aborda los desafíos críticos en las predicciones clínicas. Proporciona tres funciones principales, incluida la construcción de modelos, la selección de características y la visualización de datos. La construcción del modelo abarca una variedad de algoritmos de aprendizaje automático, que incluyen, entre otros, árboles de decisión, máquinas de vectores de soporte y métodos de conjuntos, lo que permite a los investigadores seleccionar el enfoque más adecuado para su análisis específico. La selección de características utiliza algoritmos avanzados, como la eliminación recursiva de características y la regresión LASSO, para optimizar el conjunto de datos y centrarse en las características más informativas. El marco admite el ajuste de parámetros personalizables a través de métodos de validación cruzada, lo que optimiza el rendimiento del modelo y mitiga los riesgos de sobreajuste. Las herramientas de visualización integradas en Mime permiten a los investigadores interpretar los resultados del modelo de manera efectiva, proporcionando representaciones gráficas de la importancia de las características y métricas de rendimiento predictivas. En este manuscrito, proporcionamos un tutorial detallado sobre los procedimientos paso a paso de este versátil marco de aprendizaje automático.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La adopción generalizada de tecnologías de secuenciación de alto rendimiento ha influido significativamente en nuestra comprensión de la biología y la heterogeneidad del cáncer¹. Este avance revolucionario en biotecnología no solo ha profundizado nuestro conocimiento científico, sino que también ha revolucionado el campo de la investigación médica. Al permitir a los científicos secuenciar grandes cantidades de material genético de forma rápida y precisa, la secuenciación de alto rendimiento ha acelerado el descubrimiento de nuevos genes, mutaciones y vías biológicas. Un creciente cuerpo de investigación ha deli....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: Todos los tutoriales de este estudio se ejecutan en la plataforma Linux utilizando el software R. La versión del paquete R utilizada en este protocolo se muestra en la Tabla de materiales. Cada paso necesario para el análisis se muestra a continuación y el protocolo detallado también se puede adquirir en GitHub (https://github.com/l-magnificence/Mime). Los usuarios que tengan problemas con Mime pueden visitar la página de problemas de GitHub (https://github.com/l-magnificence/Mime/issues) para proporcionar comentarios.

1. Preparación de Mime y conjunto de datos de ejemplo

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El genelist y Example.cohort, incluyendo una cohorte de entrenamiento y una cohorte de validación, se utilizaron para construir modelos pronósticos mediante la integración de 10 algoritmos de aprendizaje automático en Mime. Entre los 117 modelos de pronóstico construidos por Mime, el modelo combinado StepCox + plsRcox (SPCOM) tuvo el índice C más alto entre todas las cohortes, lo que indica su rendimiento sobresaliente (Figura 1A). Los pacientes se separaron en grupos de alto y bajo riesgo d.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

En este estudio, proporcionamos una descripción detallada de cómo utilizar el paquete Mime para desarrollar modelos predictivos de aprendizaje automático robustos y potentes para datos transcriptómicos. En estudios anteriores, los investigadores a menudo tenían dificultades para seleccionar el algoritmo de modelo predictivo adecuado en función de las características específicas de sus datos de secuenciación^13,14. Además, para los.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

No se han declarado conflictos de interés.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Agradecemos a todos los participantes e investigadores involucrados en la producción de datos.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Nombre del paquete	Versión	Software
trama	0.1.10	Estudio R
BART	2.9.4	Estudio R
Boruta	8.0.0	Estudio R
clase de cáncer	1.38.0	Estudio R
signo de intercalación	6.0-89	Estudio R
Ckmeans.1d.dp	4.3.5	Estudio R
comparar	1.3.2	Estudio R
Mapa de calor complejo	2.15.1	Estudio R
Composiciones	2.0-4	Estudio R
data.tabla	1.14.0	Estudio R
doParalelo	1.0.16	Estudio R
dplyr	1.1.3	Estudio R
E1071	1.7-7	Estudio R
Trazador forestal	1.1.0	Estudio R
futuro	1.21.0	Estudio R
Gbm	2.1.8.1	Estudio R
buen juego, rompe	0.1.1	Estudio R
ggplot2	3.4.1	Estudio R
buen juego pubr	0.4.0	Estudio R
ggsci	2.9	Estudio R
buena suerte	4.1-2	Estudio R
rejilla	4.1.3	Estudio R
gridExtra	2.3	Estudio R
GSEABase	1.54.0	Estudio R
GSVA	1.40.1	Estudio R
Hmisc	5.1-1	Estudio R
kknn	1.3.1	Estudio R
tejer	1.42	Estudio R
magrittr	2.7.2	Estudio R
Matriz	1.5-4	Estudio R
meta	5.2-0	Estudio R
miscHerramientas	0.6-28	Estudio R
mixÓmica	6.18.1	Estudio R
herramientas mixtas	1.2.0	Estudio R
pbapply	1.4-3	Estudio R
por favorRcox	1.7.7	Estudio R
Proc	1.18.0	Estudio R
R	4.1.3	Estudio R
randomForestSRC	4.6-14	Estudio R
lector	1.4.0	Estudio R
Recetas	0.1.17	Estudio R
remodelar2	1.4.4	Estudio R
rebaja	2.8	Estudio R
ROCit	2.1.1	Estudio R
ROCR	1.0-11	Estudio R
balanza	1.2.1	Estudio R
gorrión	1.0.3	Estudio R
larguero	1.5.0	Estudio R
supercomputadora	1.12	Estudio R
supervivencia	3.3-1	Estudio R
supervivenciaROC	1.0.3	Estudio R
supervivenciasvm	0.0.5	Estudio R
SVA	3.40.0	Estudio R
prueba eso	3.1.0	Estudio R
Tibble	3.2.1	Estudio R
Ordena	1.3.0	Estudio R
tidyverse	1.3.1	Estudio R
UpSetR	1.4.0	Estudio R
Viridis	0.6.1	Estudio R

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Construcción y visualización de modelos mediante un marco de aprendizaje automático basado en MIME

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles