Modellen bouwen en visualiseren met behulp van Mime-based Machine-learning Framework

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Modellen bouwen en visualiseren met behulp van Mime-based Machine-learning Framework

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime is een flexibel computationeel framework om een op machine learning gebaseerd integratiemodel met elegante prestaties te bouwen. Hier bieden we een gedetailleerde stapsgewijze procedure voor het ontwikkelen van voorspellende modellen met hoge nauwkeurigheid, waarbij gebruik wordt gemaakt van complexe datasets om kritieke genen te identificeren die verband houden met ziekteprogressie, patiëntresultaten en therapeutische respons.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De wijdverbreide high-throughput sequencing-technologie heeft ons begrip van biologie en heterogeniteit van kanker aanzienlijk verbeterd. Machine learning-algoritmen op transcriptionele gegevens zijn van vitaal belang geworden voor het voorspellen van de prognose van patiënten en klinische reacties. Ondanks de vooruitgang in machine learning-algoritmen, blijft een open-sourceplatform dat de meest geavanceerde machine learning-algoritmen op transcriptionele gegevens bevat, afwezig. Om deze kloof te dichten, hebben we Mime ontwikkeld, een veelzijdig raamwerk voor machine learning om de constructie en visualisatie van voorspellende modellen voor klinische kenmerken en gensignaturen te verbeteren. Door diverse datasets te integreren en gebruik te maken van de meest geavanceerde technieken voor functieselectie, pakt Mime kritieke uitdagingen in klinische voorspellingen aan. Het biedt drie hoofdfuncties, waaronder modelconstructie, functieselectie en gegevensvisualisatie. Modelconstructie omvat een reeks machine learning-algoritmen, inclusief maar niet beperkt tot beslissingsbomen, ondersteunende vectormachines en ensemblemethoden, waardoor onderzoekers de best passende aanpak voor hun specifieke analyse kunnen selecteren. Functieselectie maakt gebruik van geavanceerde algoritmen zoals recursieve functie-eliminatie en LASSO-regressie om de dataset te stroomlijnen en zich te concentreren op de meest informatieve functies. Het framework ondersteunt aanpasbare parameterafstemming door middel van kruisvalidatiemethoden, waardoor de modelprestaties worden geoptimaliseerd en de risico's van overfitting worden beperkt. Visualisatietools die in Mime zijn geïntegreerd, stellen onderzoekers in staat om modelresultaten effectief te interpreteren, met grafische weergaven van het belang van functies en voorspellende prestatiestatistieken. In dit manuscript geven we een gedetailleerde tutorial over de stapsgewijze procedures van dit veelzijdige machine-learningframework.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De wijdverbreide acceptatie van high-throughput sequencing-technologieën heeft ons begrip van biologie en kankerheterogeniteit aanzienlijk beïnvloed¹. Deze baanbrekende vooruitgang in de biotechnologie heeft niet alleen onze wetenschappelijke kennis verdiept, maar heeft ook een revolutie teweeggebracht op het gebied van medisch onderzoek. Door wetenschappers in staat te stellen grote hoeveelheden genetisch materiaal snel en nauwkeurig te sequencen, heeft high-throughput sequencing de ontdekking van nieuwe genen, mutaties en biologische routes versneld. Een groeiend aantal onderzoeken heeft specifieke moleculair....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

OPMERKING: De tutorials voor deze studie worden allemaal uitgevoerd op het Linux-platform met behulp van R-software. De versie van het R-pakket die in dit protocol wordt gebruikt, wordt vermeld in de Materiaaltabel. Elke stap die nodig is voor analyse wordt hieronder weergegeven en een gedetailleerd protocol kan ook worden verkregen op GitHub (https://github.com/l-magnificence/Mime). Gebruikers die problemen ondervinden met Mime, kunnen naar de GitHub-probleempagina (https://github.com/l-magnificence/Mime/issues) gaan om feedback te geven.

1. Voorbereiding van Mime en voorbeeld datase....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De genelist en het Example.cohort, waaronder één trainingscohort en één validatiecohort, werden gebruikt om prognostische modellen te construeren door 10 machine learning-algoritmen in Mime te integreren. Van de 117 prognosemodellen die door Mime zijn gebouwd, had het gecombineerde model StepCox [forward] + plsRcox (SPCOM) de hoogste C-index van alle cohorten, wat wijst op uitstekende prestaties (Figuur 1A). Patiënten werden verder onderverdeeld in groepen m.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In dit onderzoek geven we een gedetailleerde beschrijving van hoe het Mime-pakket kan worden gebruikt om robuuste en krachtige machine-learning voorspellende modellen voor transcriptomische gegevens te ontwikkelen. In eerdere studies worstelden onderzoekers vaak met het selecteren van het juiste voorspellende modelalgoritme op basis van de specifieke kenmerken van hun sequentiegegevens^13,14. Bovendien is er voor onderzoekers zond.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Geen belangenconflicten verklaard.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

We bedanken alle deelnemers en onderzoekers die betrokken zijn bij de productie van gegevens.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Name of Package	Version	Software
aplot	0.1.10	R studio
BART	2.9.4	R studio
Boruta	8.0.0	R studio
cancerclass	1.38.0	R studio
caret	6.0-89	R studio
Ckmeans.1d.dp	4.3.5	R studio
compareC	1.3.2	R studio
ComplexHeatmap	2.15.1	R studio
compositions	2.0-4	R studio
data.table	1.14.0	R studio
doParallel	1.0.16	R studio
dplyr	1.1.3	R studio
e1071	1.7-7	R studio
forestploter	1.1.0	R studio
future	1.21.0	R studio
gbm	2.1.8.1	R studio
ggbreak	0.1.1	R studio
ggplot2	3.4.1	R studio
ggpubr	0.4.0	R studio
ggsci	2.9	R studio
glmnet	4.1-2	R studio
grid	4.1.3	R studio
gridExtra	2.3	R studio
GSEABase	1.54.0	R studio
GSVA	1.40.1	R studio
Hmisc	5.1-1	R studio
kknn	1.3.1	R studio
knitr	1.42	R studio
magrittr	2.7.2	R studio
Matrix	1.5-4	R studio
meta	5.2-0	R studio
miscTools	0.6-28	R studio
mixOmics	6.18.1	R studio
mixtools	1.2.0	R studio
pbapply	1.4-3	R studio
plsRcox	1.7.7	R studio
pROC	1.18.0	R studio
R	4.1.3	R studio
randomForestSRC	4.6-14	R studio
readr	1.4.0	R studio
recipes	0.1.17	R studio
reshape2	1.4.4	R studio
rmarkdown	2.8	R studio
ROCit	2.1.1	R studio
ROCR	1.0-11	R studio
scales	1.2.1	R studio
sparrow	1.0.3	R studio
stringr	1.5.0	R studio
superpc	1.12	R studio
survival	3.3-1	R studio
survivalROC	1.0.3	R studio
survivalsvm	0.0.5	R studio
sva	3.40.0	R studio
testthat	3.1.0	R studio
tibble	3.2.1	R studio
tidyr	1.3.0	R studio
tidyverse	1.3.1	R studio
UpSetR	1.4.0	R studio
viridis	0.6.1	R studio

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Modellen bouwen en visualiseren met behulp van Mime-based Machine-learning Framework

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles