$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
La tecnología de secuenciación de alto rendimiento ha mejorado significativamente nuestra comprensión de la biología y la heterogeneidad del cáncer. Los algoritmos de aprendizaje automático de datos transcripcionales se han vuelto vitales para predecir el pronóstico de los pacientes y las respuestas clínicas. A pesar de los avances en los algoritmos de aprendizaje automático, sigue sin existir una plataforma de código abierto que incorpore los algoritmos de aprendizaje automático más sofisticados en datos transcripcionales. Para abordar esta brecha, desarrollamos Mime, un marco de aprendizaje automático versátil para mejorar la construcción y visualización de modelos predictivos de características clínicas y firmas genéticas. Mediante la integración de diversos conjuntos de datos y el empleo de las técnicas de selección de características más avanzadas, Mime aborda los desafíos críticos en las predicciones clínicas. Proporciona tres funciones principales, incluida la construcción de modelos, la selección de características y la visualización de datos. La construcción del modelo abarca una variedad de algoritmos de aprendizaje automático, que incluyen, entre otros, árboles de decisión, máquinas de vectores de soporte y métodos de conjuntos, lo que permite a los investigadores seleccionar el enfoque más adecuado para su análisis específico. La selección de características utiliza algoritmos avanzados, como la eliminación recursiva de características y la regresión LASSO, para optimizar el conjunto de datos y centrarse en las características más informativas. El marco admite el ajuste de parámetros personalizables a través de métodos de validación cruzada, lo que optimiza el rendimiento del modelo y mitiga los riesgos de sobreajuste. Las herramientas de visualización integradas en Mime permiten a los investigadores interpretar los resultados del modelo de manera efectiva, proporcionando representaciones gráficas de la importancia de las características y métricas de rendimiento predictivas. En este manuscrito, proporcionamos un tutorial detallado sobre los procedimientos paso a paso de este versátil marco de aprendizaje automático.