$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
La technologie de séquençage à haut débit répandue a considérablement amélioré notre compréhension de la biologie et de l’hétérogénéité du cancer. Les algorithmes d’apprentissage automatique sur les données transcriptionnelles sont devenus essentiels pour prédire le pronostic et les réponses cliniques des patients. Malgré les progrès des algorithmes d’apprentissage automatique, il n’existe toujours pas de plateforme open source intégrant les algorithmes d’apprentissage automatique les plus sophistiqués sur les données transcriptionnelles. Pour combler cette lacune, nous avons développé Mime, un cadre d’apprentissage automatique polyvalent pour améliorer la construction et la visualisation de modèles prédictifs des caractéristiques cliniques et des signatures génétiques. En intégrant divers ensembles de données et en utilisant les techniques de sélection de caractéristiques les plus avancées, Mime relève des défis critiques en matière de prédictions cliniques. Il fournit trois fonctions principales, notamment la construction de modèles, la sélection de fonctionnalités et la visualisation des données. La construction de modèles englobe une gamme d’algorithmes d’apprentissage automatique, y compris, mais sans s’y limiter, des arbres de décision, des machines à vecteurs de support et des méthodes d’ensemble, ce qui permet aux chercheurs de sélectionner l’approche la mieux adaptée à leur analyse spécifique. La sélection de caractéristiques utilise des algorithmes avancés tels que l’élimination récursive des caractéristiques et la régression LASSO pour rationaliser l’ensemble de données et se concentrer sur les caractéristiques les plus informatives. Le cadre prend en charge le réglage des paramètres personnalisables grâce à des méthodes de validation croisée, optimisant ainsi les performances du modèle tout en atténuant les risques de surapprentissage. Les outils de visualisation intégrés à Mime permettent aux chercheurs d’interpréter efficacement les résultats du modèle, en fournissant des représentations graphiques de l’importance des caractéristiques et des mesures de performance prédictives. Dans ce manuscrit, nous fournissons un tutoriel détaillé sur les procédures par étapes de ce cadre d’apprentissage automatique polyvalent.