Method Article

Construcción y visualización de modelos mediante un marco de aprendizaje automático basado en MIME

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime es un marco computacional flexible para construir un modelo de integración basado en el aprendizaje automático con un rendimiento elegante. Aquí, proporcionamos un procedimiento detallado paso a paso para desarrollar modelos predictivos con alta precisión, aprovechando conjuntos de datos complejos para identificar genes críticos asociados con la progresión de la enfermedad, los resultados de los pacientes y la respuesta terapéutica.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La tecnología de secuenciación de alto rendimiento ha mejorado significativamente nuestra comprensión de la biología y la heterogeneidad del cáncer. Los algoritmos de aprendizaje automático de datos transcripcionales se han vuelto vitales para predecir el pronóstico de los pacientes y las respuestas clínicas. A pesar de los avances en los algoritmos de aprendizaje automático, sigue sin existir una plataforma de código abierto que incorpore los algoritmos de aprendizaje automático más sofisticados en datos transcripcionales. Para abordar esta brecha, desarrollamos Mime, un marco de aprendizaje automático versátil para mejorar la construcción y visualización de modelos predictivos de características clínicas y firmas genéticas. Mediante la integración de diversos conjuntos de datos y el empleo de las técnicas de selección de características más avanzadas, Mime aborda los desafíos críticos en las predicciones clínicas. Proporciona tres funciones principales, incluida la construcción de modelos, la selección de características y la visualización de datos. La construcción del modelo abarca una variedad de algoritmos de aprendizaje automático, que incluyen, entre otros, árboles de decisión, máquinas de vectores de soporte y métodos de conjuntos, lo que permite a los investigadores seleccionar el enfoque más adecuado para su análisis específico. La selección de características utiliza algoritmos avanzados, como la eliminación recursiva de características y la regresión LASSO, para optimizar el conjunto de datos y centrarse en las características más informativas. El marco admite el ajuste de parámetros personalizables a través de métodos de validación cruzada, lo que optimiza el rendimiento del modelo y mitiga los riesgos de sobreajuste. Las herramientas de visualización integradas en Mime permiten a los investigadores interpretar los resultados del modelo de manera efectiva, proporcionando representaciones gráficas de la importancia de las características y métricas de rendimiento predictivas. En este manuscrito, proporcionamos un tutorial detallado sobre los procedimientos paso a paso de este versátil marco de aprendizaje automático.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La adopción generalizada de tecnologías de secuenciación de alto rendimiento ha influido significativamente en nuestra comprensión de la biología y la heterogeneidad del cáncer1. Este avance revolucionario en biotecnología no solo ha profundizado nuestro conocimiento científico, sino que también ha revolucionado el campo de la investigación médica. Al permitir a los científicos secuenciar grandes cantidades de material genético de forma rápida y precisa, la secuenciación de alto rendimiento ha acelerado el descubrimiento de nuevos genes, mutaciones y vías biológicas. Un creciente cuerpo de investigación ha deli....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: Todos los tutoriales de este estudio se ejecutan en la plataforma Linux utilizando el software R. La versión del paquete R utilizada en este protocolo se muestra en la Tabla de materiales. Cada paso necesario para el análisis se muestra a continuación y el protocolo detallado también se puede adquirir en GitHub (https://github.com/l-magnificence/Mime). Los usuarios que tengan problemas con Mime pueden visitar la página de problemas de GitHub (https://github.com/l-magnificence/Mime/issues) para proporcionar comentarios.

1. Preparación de Mime y conjunto de datos de ejemplo

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

El genelist y Example.cohort, incluyendo una cohorte de entrenamiento y una cohorte de validación, se utilizaron para construir modelos pronósticos mediante la integración de 10 algoritmos de aprendizaje automático en Mime. Entre los 117 modelos de pronóstico construidos por Mime, el modelo combinado StepCox + plsRcox (SPCOM) tuvo el índice C más alto entre todas las cohortes, lo que indica su rendimiento sobresaliente (Figura 1A). Los pacientes se separaron en grupos de alto y bajo riesgo d.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

En este estudio, proporcionamos una descripción detallada de cómo utilizar el paquete Mime para desarrollar modelos predictivos de aprendizaje automático robustos y potentes para datos transcriptómicos. En estudios anteriores, los investigadores a menudo tenían dificultades para seleccionar el algoritmo de modelo predictivo adecuado en función de las características específicas de sus datos de secuenciación13,14. Además, para los.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

No se han declarado conflictos de interés.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Agradecemos a todos los participantes e investigadores involucrados en la producción de datos.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Nombre del paqueteVersiónSoftware
trama0.1.10Estudio R
BART2.9.4Estudio R
Boruta8.0.0Estudio R
clase de cáncer1.38.0Estudio R
signo de intercalación6.0-89Estudio R
Ckmeans.1d.dp4.3.5Estudio R
comparar1.3.2Estudio R
Mapa de calor complejo2.15.1Estudio R
Composiciones2.0-4Estudio R
data.tabla1.14.0Estudio R
doParalelo1.0.16Estudio R
dplyr1.1.3Estudio R
E10711.7-7Estudio R
Trazador forestal1.1.0Estudio R
futuro1.21.0Estudio R
Gbm2.1.8.1Estudio R
buen juego, rompe0.1.1Estudio R
ggplot23.4.1Estudio R
buen juego pubr0.4.0Estudio R
ggsci2.9Estudio R
buena suerte4.1-2Estudio R
rejilla4.1.3Estudio R
gridExtra2.3Estudio R
GSEABase1.54.0Estudio R
GSVA1.40.1Estudio R
Hmisc5.1-1Estudio R
kknn1.3.1Estudio R
tejer1.42Estudio R
magrittr2.7.2Estudio R
Matriz1.5-4Estudio R
meta5.2-0Estudio R
miscHerramientas0.6-28Estudio R
mixÓmica6.18.1Estudio R
herramientas mixtas1.2.0Estudio R
pbapply1.4-3Estudio R
por favorRcox1.7.7Estudio R
Proc1.18.0Estudio R
R4.1.3Estudio R
randomForestSRC4.6-14Estudio R
lector1.4.0Estudio R
Recetas0.1.17Estudio R
remodelar21.4.4Estudio R
rebaja2.8Estudio R
ROCit2.1.1Estudio R
ROCR1.0-11Estudio R
balanza1.2.1Estudio R
gorrión1.0.3Estudio R
larguero1.5.0Estudio R
supercomputadora1.12Estudio R
supervivencia3.3-1Estudio R
supervivenciaROC1.0.3Estudio R
supervivenciasvm0.0.5Estudio R
SVA3.40.0Estudio R
prueba eso3.1.0Estudio R
Tibble3.2.1Estudio R
Ordena1.3.0Estudio R
tidyverse1.3.1Estudio R
UpSetR1.4.0Estudio R
Viridis0.6.1Estudio R

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles