Method Article

Construction et visualisation de modèles à l’aide d’un cadre d’apprentissage automatique basé sur MIME

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime est un cadre de calcul flexible permettant de construire un modèle d’intégration basé sur l’apprentissage automatique avec des performances élégantes. Nous présentons ici une procédure détaillée, étape par étape, pour développer des modèles prédictifs de haute précision, en exploitant des ensembles de données complexes pour identifier les gènes critiques associés à la progression de la maladie, aux résultats pour les patients et à la réponse thérapeutique.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La technologie de séquençage à haut débit répandue a considérablement amélioré notre compréhension de la biologie et de l’hétérogénéité du cancer. Les algorithmes d’apprentissage automatique sur les données transcriptionnelles sont devenus essentiels pour prédire le pronostic et les réponses cliniques des patients. Malgré les progrès des algorithmes d’apprentissage automatique, il n’existe toujours pas de plateforme open source intégrant les algorithmes d’apprentissage automatique les plus sophistiqués sur les données transcriptionnelles. Pour combler cette lacune, nous avons développé Mime, un cadre d’apprentissage automatique polyvalent pour améliorer la construction et la visualisation de modèles prédictifs des caractéristiques cliniques et des signatures génétiques. En intégrant divers ensembles de données et en utilisant les techniques de sélection de caractéristiques les plus avancées, Mime relève des défis critiques en matière de prédictions cliniques. Il fournit trois fonctions principales, notamment la construction de modèles, la sélection de fonctionnalités et la visualisation des données. La construction de modèles englobe une gamme d’algorithmes d’apprentissage automatique, y compris, mais sans s’y limiter, des arbres de décision, des machines à vecteurs de support et des méthodes d’ensemble, ce qui permet aux chercheurs de sélectionner l’approche la mieux adaptée à leur analyse spécifique. La sélection de caractéristiques utilise des algorithmes avancés tels que l’élimination récursive des caractéristiques et la régression LASSO pour rationaliser l’ensemble de données et se concentrer sur les caractéristiques les plus informatives. Le cadre prend en charge le réglage des paramètres personnalisables grâce à des méthodes de validation croisée, optimisant ainsi les performances du modèle tout en atténuant les risques de surapprentissage. Les outils de visualisation intégrés à Mime permettent aux chercheurs d’interpréter efficacement les résultats du modèle, en fournissant des représentations graphiques de l’importance des caractéristiques et des mesures de performance prédictives. Dans ce manuscrit, nous fournissons un tutoriel détaillé sur les procédures par étapes de ce cadre d’apprentissage automatique polyvalent.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L’adoption généralisée des technologies de séquençage à haut débit a considérablement influencé notre compréhension de la biologie et de l’hétérogénéité du cancer1. Cette avancée révolutionnaire en biotechnologie a non seulement approfondi nos connaissances scientifiques, mais a également révolutionné le domaine de la recherche médicale. En permettant aux scientifiques de séquencer rapidement et avec précision de grandes quantités de matériel génétique, le séquençage à haut débit a accéléré la découverte de nouveaux gènes, mutations et voies biologiques. De plus en plus de recherches ont permis de délimiter des....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

REMARQUE : Les tutoriels de cette étude sont tous exécutés sur la plate-forme Linux à l’aide du logiciel R. La version du package R utilisée dans ce protocole est répertoriée dans la Table des matériaux. Chaque étape nécessaire à l’analyse est illustrée ci-dessous et le protocole détaillé peut également être acquis sur GitHub (https://github.com/l-magnificence/Mime). Les utilisateurs qui rencontrent des problèmes avec Mime peuvent visiter la page Problème GitHub (https://github.com/l-magnificence/Mime/issues) pour fournir des commentaires.

1. Préparation de Mime et d’un exemple de jeu....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le genelist et Example.cohort, y compris une cohorte d’entraînement et une cohorte de validation, ont été utilisés pour construire des modèles pronostiques en intégrant 10 algorithmes d’apprentissage automatique dans Mime. Parmi les 117 modèles de pronostic construits par Mime, le modèle combiné StepCox[forward] + plsRcox (SPCOM) avait l’indice C le plus élevé parmi toutes les cohortes, ce qui indique sa performance exceptionnelle (Figure 1A). Les patients ont ensuite été séparés en groupes .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dans cette étude, nous fournissons une description détaillée de la façon d’utiliser le package Mime pour développer des modèles prédictifs d’apprentissage automatique robustes et puissants pour les données transcriptomiques. Dans des études précédentes, les chercheurs avaient souvent du mal à sélectionner l’algorithme de modèle prédictif approprié en fonction des caractéristiques spécifiques de leurs données de séquençage13,14. D.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Aucun conflit d’intérêts n’a été déclaré.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nous remercions tous les participants et les enquêteurs impliqués dans la production des données.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Nom du packageVersionLogiciel
aplot0.1.10R studio
BART2.9.4R studio
Boruta8.0.0R studio
Classe de cancer1.38.0R studio
caret6.0-89R studio
ckmeans.1d.dp4.3.5R studio
comparerC1.3.2R studio
ComplexHeatmap2.15.1R studio
Compositions2.0-4R studio
données.table1.14.0R studio
doParallel1.0.16R studio
dplyr1.1.3R studio
E10711.7-7R studio
traceur forestier1.1.0R studio
futur1.21.0R studio
Gbm2.1.8.1R studio
ggbreak0.1.1R studio
ggplot23.4.1R studio
ggpubr0.4.0R studio
ggsci2.9R studio
glmnet4.1-2R studio
grille4.1.3R studio
gridExtra2.3R studio
GSEABase1.54.0R studio
La1.40.1R studio
Hmisc5.1-1R studio
kknn1.3.1R studio
tricoteuse1.42R studio
Magrittr2.7.2R studio
Matrice1.5-4R studio
méta5.2-0R studio
miscTools0.6-28R studio
mixOmics6.18.1R studio
Mixtools1.2.0R studio
pbapply1.4-3R studio
plsRcox1.7.7R studio
Proc1.18.0R studio
R4.1.3R studio
randomForestSRC4.6-14R studio
Lecteur1.4.0R studio
Recettes0.1.17R studio
Remodel21.4.4R studio
rmarkdown2.8R studio
ROCit2.1.1R studio
ROCR1.0-11R studio
balance1.2.1R studio
moineau1.0.3R studio
Longeron1.5.0R studio
SuperPC1.12R studio
survie3.3-1R studio
survivalROC1.0.3R studio
surviesVM0.0.5R studio
SVA3.40.0R studio
testthat3.1.0R studio
Tibble3.2.1R studio
tidyr1.3.0R studio
Tidyverse1.3.1R studio
UpSetR1.4.0R studio
Viridis0.6.1R studio

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles