Method Article

Modellen bouwen en visualiseren met behulp van Mime-based Machine-learning Framework

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime is een flexibel computationeel framework om een op machine learning gebaseerd integratiemodel met elegante prestaties te bouwen. Hier bieden we een gedetailleerde stapsgewijze procedure voor het ontwikkelen van voorspellende modellen met hoge nauwkeurigheid, waarbij gebruik wordt gemaakt van complexe datasets om kritieke genen te identificeren die verband houden met ziekteprogressie, patiëntresultaten en therapeutische respons.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De wijdverbreide high-throughput sequencing-technologie heeft ons begrip van biologie en heterogeniteit van kanker aanzienlijk verbeterd. Machine learning-algoritmen op transcriptionele gegevens zijn van vitaal belang geworden voor het voorspellen van de prognose van patiënten en klinische reacties. Ondanks de vooruitgang in machine learning-algoritmen, blijft een open-sourceplatform dat de meest geavanceerde machine learning-algoritmen op transcriptionele gegevens bevat, afwezig. Om deze kloof te dichten, hebben we Mime ontwikkeld, een veelzijdig raamwerk voor machine learning om de constructie en visualisatie van voorspellende modellen voor klinische kenmerken en gensignaturen te verbeteren. Door diverse datasets te integreren en gebruik te maken van de meest geavanceerde technieken voor functieselectie, pakt Mime kritieke uitdagingen in klinische voorspellingen aan. Het biedt drie hoofdfuncties, waaronder modelconstructie, functieselectie en gegevensvisualisatie. Modelconstructie omvat een reeks machine learning-algoritmen, inclusief maar niet beperkt tot beslissingsbomen, ondersteunende vectormachines en ensemblemethoden, waardoor onderzoekers de best passende aanpak voor hun specifieke analyse kunnen selecteren. Functieselectie maakt gebruik van geavanceerde algoritmen zoals recursieve functie-eliminatie en LASSO-regressie om de dataset te stroomlijnen en zich te concentreren op de meest informatieve functies. Het framework ondersteunt aanpasbare parameterafstemming door middel van kruisvalidatiemethoden, waardoor de modelprestaties worden geoptimaliseerd en de risico's van overfitting worden beperkt. Visualisatietools die in Mime zijn geïntegreerd, stellen onderzoekers in staat om modelresultaten effectief te interpreteren, met grafische weergaven van het belang van functies en voorspellende prestatiestatistieken. In dit manuscript geven we een gedetailleerde tutorial over de stapsgewijze procedures van dit veelzijdige machine-learningframework.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De wijdverbreide acceptatie van high-throughput sequencing-technologieën heeft ons begrip van biologie en kankerheterogeniteit aanzienlijk beïnvloed1. Deze baanbrekende vooruitgang in de biotechnologie heeft niet alleen onze wetenschappelijke kennis verdiept, maar heeft ook een revolutie teweeggebracht op het gebied van medisch onderzoek. Door wetenschappers in staat te stellen grote hoeveelheden genetisch materiaal snel en nauwkeurig te sequencen, heeft high-throughput sequencing de ontdekking van nieuwe genen, mutaties en biologische routes versneld. Een groeiend aantal onderzoeken heeft specifieke moleculair....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

OPMERKING: De tutorials voor deze studie worden allemaal uitgevoerd op het Linux-platform met behulp van R-software. De versie van het R-pakket die in dit protocol wordt gebruikt, wordt vermeld in de Materiaaltabel. Elke stap die nodig is voor analyse wordt hieronder weergegeven en een gedetailleerd protocol kan ook worden verkregen op GitHub (https://github.com/l-magnificence/Mime). Gebruikers die problemen ondervinden met Mime, kunnen naar de GitHub-probleempagina (https://github.com/l-magnificence/Mime/issues) gaan om feedback te geven.

1. Voorbereiding van Mime en voorbeeld datase....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De genelist en het Example.cohort, waaronder één trainingscohort en één validatiecohort, werden gebruikt om prognostische modellen te construeren door 10 machine learning-algoritmen in Mime te integreren. Van de 117 prognosemodellen die door Mime zijn gebouwd, had het gecombineerde model StepCox [forward] + plsRcox (SPCOM) de hoogste C-index van alle cohorten, wat wijst op uitstekende prestaties (Figuur 1A). Patiënten werden verder onderverdeeld in groepen m.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In dit onderzoek geven we een gedetailleerde beschrijving van hoe het Mime-pakket kan worden gebruikt om robuuste en krachtige machine-learning voorspellende modellen voor transcriptomische gegevens te ontwikkelen. In eerdere studies worstelden onderzoekers vaak met het selecteren van het juiste voorspellende modelalgoritme op basis van de specifieke kenmerken van hun sequentiegegevens13,14. Bovendien is er voor onderzoekers zond.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Geen belangenconflicten verklaard.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

We bedanken alle deelnemers en onderzoekers die betrokken zijn bij de productie van gegevens.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Name of PackageVersionSoftware
aplot0.1.10R studio
BART2.9.4R studio
Boruta8.0.0R studio
cancerclass1.38.0R studio
caret6.0-89R studio
Ckmeans.1d.dp4.3.5R studio
compareC1.3.2R studio
ComplexHeatmap2.15.1R studio
compositions2.0-4R studio
data.table1.14.0R studio
doParallel1.0.16R studio
dplyr1.1.3R studio
e10711.7-7R studio
forestploter1.1.0R studio
future1.21.0R studio
gbm2.1.8.1R studio
ggbreak0.1.1R studio
ggplot23.4.1R studio
ggpubr0.4.0R studio
ggsci2.9R studio
glmnet4.1-2R studio
grid4.1.3R studio
gridExtra2.3R studio
GSEABase1.54.0R studio
GSVA1.40.1R studio
Hmisc5.1-1R studio
kknn1.3.1R studio
knitr1.42R studio
magrittr2.7.2R studio
Matrix1.5-4R studio
meta5.2-0R studio
miscTools0.6-28R studio
mixOmics6.18.1R studio
mixtools1.2.0R studio
pbapply1.4-3R studio
plsRcox1.7.7R studio
pROC1.18.0R studio
R4.1.3R studio
randomForestSRC4.6-14R studio
readr1.4.0R studio
recipes0.1.17R studio
reshape21.4.4R studio
rmarkdown2.8R studio
ROCit2.1.1R studio
ROCR1.0-11R studio
scales1.2.1R studio
sparrow1.0.3R studio
stringr1.5.0R studio
superpc1.12R studio
survival3.3-1R studio
survivalROC1.0.3R studio
survivalsvm0.0.5R studio
sva3.40.0R studio
testthat3.1.0R studio
tibble3.2.1R studio
tidyr1.3.0R studio
tidyverse1.3.1R studio
UpSetR1.4.0R studio
viridis0.6.1R studio

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles