Erstellen und Visualisieren von Modellen mit einem Mime-basierten Framework für maschinelles Lernen

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Erstellen und Visualisieren von Modellen mit einem Mime-basierten Framework für maschinelles Lernen

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime ist ein flexibles Rechen-Framework zur Erstellung eines auf maschinellem Lernen basierenden Integrationsmodells mit eleganter Leistung. Hier bieten wir ein detailliertes Schritt-für-Schritt-Verfahren für die Entwicklung von Vorhersagemodellen mit hoher Genauigkeit, wobei wir komplexe Datensätze nutzen, um kritische Gene zu identifizieren, die mit dem Fortschreiten der Krankheit, den Patientenergebnissen und dem therapeutischen Ansprechen verbunden sind.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die weit verbreitete Hochdurchsatz-Sequenzierungstechnologie hat unser Verständnis der Biologie und der Heterogenität von Krebs erheblich verbessert. Algorithmen des maschinellen Lernens auf der Grundlage von Transkriptionsdaten sind für die Vorhersage der Patientenprognose und des klinischen Ansprechens unerlässlich geworden. Trotz Fortschritten bei Algorithmen des maschinellen Lernens gibt es nach wie vor keine Open-Source-Plattform, die die ausgefeiltesten Algorithmen des maschinellen Lernens auf Transkriptionsdaten integriert. Um diese Lücke zu schließen, haben wir Mime entwickelt, ein vielseitiges Framework für maschinelles Lernen, um die Konstruktion und Visualisierung von Vorhersagemodellen für klinische Merkmale und Gensignaturen zu verbessern. Durch die Integration verschiedener Datensätze und den Einsatz der fortschrittlichsten Techniken zur Merkmalsauswahl adressiert Mime kritische Herausforderungen bei der klinischen Vorhersage. Es bietet drei Hauptfunktionen, darunter Modellkonstruktion, Merkmalsauswahl und Datenvisualisierung. Die Modellkonstruktion umfasst eine Reihe von Algorithmen des maschinellen Lernens, einschließlich, aber nicht beschränkt auf Entscheidungsbäume, Support Vector Machines und Ensemble-Methoden, die es den Forschern ermöglichen, den am besten geeigneten Ansatz für ihre spezifische Analyse auszuwählen. Bei der Merkmalsauswahl werden fortschrittliche Algorithmen wie die rekursive Merkmalseliminierung und die LASSO-Regression verwendet, um das Dataset zu optimieren und sich auf die informativsten Merkmale zu konzentrieren. Das Framework unterstützt die anpassbare Parameterabstimmung durch Kreuzvalidierungsmethoden, optimiert die Modellleistung und mindert gleichzeitig das Risiko einer Überanpassung. In Mime integrierte Visualisierungstools ermöglichen es Forschern, Modellergebnisse effektiv zu interpretieren, indem sie grafische Darstellungen der Wichtigkeit von Merkmalen und prädiktive Leistungsmetriken liefern. In diesem Manuskript stellen wir ein detailliertes Tutorial zu den schrittweisen Verfahren dieses vielseitigen Frameworks für maschinelles Lernen zur Verfügung.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die weit verbreitete Einführung von Hochdurchsatz-Sequenzierungstechnologien hat unser Verständnis der Biologie und der Heterogenität von Krebs erheblich beeinflusst¹. Dieser bahnbrechende Fortschritt in der Biotechnologie hat nicht nur unsere wissenschaftlichen Kenntnisse vertieft, sondern auch das Feld der medizinischen Forschung revolutioniert. Durch die schnelle und genaue Sequenzierung großer Mengen an genetischem Material hat die Hochdurchsatz-Sequenzierung die Entdeckung neuer Gene, Mutationen und biologischer Signalwege beschleunigt. Eine wachsende Zahl von Forschungsarbeiten hat anhand von Sequenzierun....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

HINWEIS: Die Tutorials für diese Studie werden alle auf der Linux-Plattform mit der R-Software ausgeführt. Die Version des R-Pakets, die in diesem Protokoll verwendet wird, ist in der Materialtabelle aufgeführt. Jeder Schritt, der für die Analyse erforderlich ist, ist unten aufgeführt und das detaillierte Protokoll kann auch auf GitHub (https://github.com/l-magnificence/Mime) abgerufen werden. Benutzer, die auf Probleme mit Mime stoßen, können die GitHub-Problemseite (https://github.com/l-magnificence/Mime/issues) besuchen, um Feedback zu geben.

1. Vorbereitung von Mime und Beispielda....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Der Genelist und Example.cohort, bestehend aus einer Trainingskohorte und einer Validierungskohorte, wurden verwendet, um prognostische Modelle zu erstellen, indem 10 Algorithmen des maschinellen Lernens in Mime integriert wurden. Unter den 117 von Mime konstruierten Prognosemodellen hatte das kombinierte Modell StepCox[forward] + plsRcox (SPCOM) den höchsten C-Index unter allen Kohorten, was auf seine hervorragende Leistung hinweist (Abbildung 1A). Die Patienten wurden gemäß dem von SPCOM b.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In dieser Studie geben wir eine detaillierte Beschreibung, wie das Mime-Paket verwendet werden kann, um robuste und leistungsstarke Vorhersagemodelle für maschinelles Lernen für transkriptomische Daten zu entwickeln. In früheren Studien hatten Forscher oft Schwierigkeiten mit der Auswahl des geeigneten Vorhersagemodellalgorithmus auf der Grundlage der spezifischen Eigenschaften ihrer Sequenzierungsdaten^13,14. Darüber hinaus beste.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Es wurden keine Interessenkonflikte angegeben.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Wir danken allen Beteiligten und Forschern, die an der Datenproduktion beteiligt waren.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Name des Pakets	Version	Software
verlosen	0.1.10	R Studio
BART	2.9.4	R Studio
Boruta	8.0.0	R Studio
Krebsklasse	1.38.0	R Studio
Einschaltungszeichen	6.0-89	R Studio
ckmeans.1d.dp	4.3.5	R Studio
VergleichC	1.3.2	R Studio
KomplexeHeatmap	2.15.1	R Studio
kompositionen	2.0-4	R Studio
data.table	1.14.0	R Studio
doParallel	1.0.16	R Studio
dplyr	1.1.3	R Studio
Nr. E1071	1.7-7	R Studio
Forstplotter	1.1.0	R Studio
Zukunft	1.21.0	R Studio
Gbm	2.1.8.1	R Studio
ggbreak	0.1.1	R Studio
ggplot2	3.4.1	R Studio
ggpubr	0.4.0	R Studio
GGSCI	2.9	R Studio
glmnet	4.1-2	R Studio
Gitter	4.1.3	R Studio
GitterExtra	2.3	R Studio
GSEABase	1.54.0	R Studio
GSVA	1.40.1	R Studio
Hmisc	5.1-1	R Studio
KKNN	1.3.1	R Studio
Strickerin	1.42	R Studio
magrittr	2.7.2	R Studio
Matrix	1.5-4	R Studio
meta	5.2-0	R Studio
Sonstiges Werkzeuge	0.6-28	R Studio
mixOmics (Englisch)	6.18.1	R Studio
Mixtools	1.2.0	R Studio
pbapply	1.4-3	R Studio
plsRcox	1.7.7	R Studio
Proc	1.18.0	R Studio
R	4.1.3	R Studio
randomForestSRC	4.6-14	R Studio
READR	1.4.0	R Studio
Rezepte	0.1.17	R Studio
Umformen2	1.4.4	R Studio
rmarkdown	2.8	R Studio
ROCit	2.1.1	R Studio
ROCR	1.0-11	R Studio
Waage	1.2.1	R Studio
Spatz	1.0.3	R Studio
stringr	1.5.0	R Studio
SuperPC	1.12	R Studio
Überleben	3.3-1	R Studio
ÜberlebenROC	1.0.3	R Studio
ÜberlebensVM	0.0.5	R Studio
SVA	3.40.0	R Studio
testen, dass	3.1.0	R Studio
Tibble	3.2.1	R Studio
aufgeräumt	1.3.0	R Studio
aufgeräumt	1.3.1	R Studio
UpSetR	1.4.0	R Studio
Viridis	0.6.1	R Studio

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Erstellen und Visualisieren von Modellen mit einem Mime-basierten Framework für maschinelles Lernen

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles