Method Article

Erstellen und Visualisieren von Modellen mit einem Mime-basierten Framework für maschinelles Lernen

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime ist ein flexibles Rechen-Framework zur Erstellung eines auf maschinellem Lernen basierenden Integrationsmodells mit eleganter Leistung. Hier bieten wir ein detailliertes Schritt-für-Schritt-Verfahren für die Entwicklung von Vorhersagemodellen mit hoher Genauigkeit, wobei wir komplexe Datensätze nutzen, um kritische Gene zu identifizieren, die mit dem Fortschreiten der Krankheit, den Patientenergebnissen und dem therapeutischen Ansprechen verbunden sind.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die weit verbreitete Hochdurchsatz-Sequenzierungstechnologie hat unser Verständnis der Biologie und der Heterogenität von Krebs erheblich verbessert. Algorithmen des maschinellen Lernens auf der Grundlage von Transkriptionsdaten sind für die Vorhersage der Patientenprognose und des klinischen Ansprechens unerlässlich geworden. Trotz Fortschritten bei Algorithmen des maschinellen Lernens gibt es nach wie vor keine Open-Source-Plattform, die die ausgefeiltesten Algorithmen des maschinellen Lernens auf Transkriptionsdaten integriert. Um diese Lücke zu schließen, haben wir Mime entwickelt, ein vielseitiges Framework für maschinelles Lernen, um die Konstruktion und Visualisierung von Vorhersagemodellen für klinische Merkmale und Gensignaturen zu verbessern. Durch die Integration verschiedener Datensätze und den Einsatz der fortschrittlichsten Techniken zur Merkmalsauswahl adressiert Mime kritische Herausforderungen bei der klinischen Vorhersage. Es bietet drei Hauptfunktionen, darunter Modellkonstruktion, Merkmalsauswahl und Datenvisualisierung. Die Modellkonstruktion umfasst eine Reihe von Algorithmen des maschinellen Lernens, einschließlich, aber nicht beschränkt auf Entscheidungsbäume, Support Vector Machines und Ensemble-Methoden, die es den Forschern ermöglichen, den am besten geeigneten Ansatz für ihre spezifische Analyse auszuwählen. Bei der Merkmalsauswahl werden fortschrittliche Algorithmen wie die rekursive Merkmalseliminierung und die LASSO-Regression verwendet, um das Dataset zu optimieren und sich auf die informativsten Merkmale zu konzentrieren. Das Framework unterstützt die anpassbare Parameterabstimmung durch Kreuzvalidierungsmethoden, optimiert die Modellleistung und mindert gleichzeitig das Risiko einer Überanpassung. In Mime integrierte Visualisierungstools ermöglichen es Forschern, Modellergebnisse effektiv zu interpretieren, indem sie grafische Darstellungen der Wichtigkeit von Merkmalen und prädiktive Leistungsmetriken liefern. In diesem Manuskript stellen wir ein detailliertes Tutorial zu den schrittweisen Verfahren dieses vielseitigen Frameworks für maschinelles Lernen zur Verfügung.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die weit verbreitete Einführung von Hochdurchsatz-Sequenzierungstechnologien hat unser Verständnis der Biologie und der Heterogenität von Krebs erheblich beeinflusst1. Dieser bahnbrechende Fortschritt in der Biotechnologie hat nicht nur unsere wissenschaftlichen Kenntnisse vertieft, sondern auch das Feld der medizinischen Forschung revolutioniert. Durch die schnelle und genaue Sequenzierung großer Mengen an genetischem Material hat die Hochdurchsatz-Sequenzierung die Entdeckung neuer Gene, Mutationen und biologischer Signalwege beschleunigt. Eine wachsende Zahl von Forschungsarbeiten hat anhand von Sequenzierun....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

HINWEIS: Die Tutorials für diese Studie werden alle auf der Linux-Plattform mit der R-Software ausgeführt. Die Version des R-Pakets, die in diesem Protokoll verwendet wird, ist in der Materialtabelle aufgeführt. Jeder Schritt, der für die Analyse erforderlich ist, ist unten aufgeführt und das detaillierte Protokoll kann auch auf GitHub (https://github.com/l-magnificence/Mime) abgerufen werden. Benutzer, die auf Probleme mit Mime stoßen, können die GitHub-Problemseite (https://github.com/l-magnificence/Mime/issues) besuchen, um Feedback zu geben.

1. Vorbereitung von Mime und Beispielda....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Der Genelist und Example.cohort, bestehend aus einer Trainingskohorte und einer Validierungskohorte, wurden verwendet, um prognostische Modelle zu erstellen, indem 10 Algorithmen des maschinellen Lernens in Mime integriert wurden. Unter den 117 von Mime konstruierten Prognosemodellen hatte das kombinierte Modell StepCox[forward] + plsRcox (SPCOM) den höchsten C-Index unter allen Kohorten, was auf seine hervorragende Leistung hinweist (Abbildung 1A). Die Patienten wurden gemäß dem von SPCOM b.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In dieser Studie geben wir eine detaillierte Beschreibung, wie das Mime-Paket verwendet werden kann, um robuste und leistungsstarke Vorhersagemodelle für maschinelles Lernen für transkriptomische Daten zu entwickeln. In früheren Studien hatten Forscher oft Schwierigkeiten mit der Auswahl des geeigneten Vorhersagemodellalgorithmus auf der Grundlage der spezifischen Eigenschaften ihrer Sequenzierungsdaten13,14. Darüber hinaus beste.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Es wurden keine Interessenkonflikte angegeben.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Wir danken allen Beteiligten und Forschern, die an der Datenproduktion beteiligt waren.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Name des PaketsVersionSoftware
verlosen0.1.10R Studio
BART2.9.4R Studio
Boruta8.0.0R Studio
Krebsklasse1.38.0R Studio
Einschaltungszeichen6.0-89R Studio
ckmeans.1d.dp4.3.5R Studio
VergleichC1.3.2R Studio
KomplexeHeatmap2.15.1R Studio
kompositionen2.0-4R Studio
data.table1.14.0R Studio
doParallel1.0.16R Studio
dplyr1.1.3R Studio
Nr. E10711.7-7R Studio
Forstplotter1.1.0R Studio
Zukunft1.21.0R Studio
Gbm2.1.8.1R Studio
ggbreak0.1.1R Studio
ggplot23.4.1R Studio
ggpubr0.4.0R Studio
GGSCI2.9R Studio
glmnet4.1-2R Studio
Gitter4.1.3R Studio
GitterExtra2.3R Studio
GSEABase1.54.0R Studio
GSVA1.40.1R Studio
Hmisc5.1-1R Studio
KKNN1.3.1R Studio
Strickerin1.42R Studio
magrittr2.7.2R Studio
Matrix1.5-4R Studio
meta5.2-0R Studio
Sonstiges Werkzeuge0.6-28R Studio
mixOmics (Englisch)6.18.1R Studio
Mixtools1.2.0R Studio
pbapply1.4-3R Studio
plsRcox1.7.7R Studio
Proc1.18.0R Studio
R4.1.3R Studio
randomForestSRC4.6-14R Studio
READR1.4.0R Studio
Rezepte0.1.17R Studio
Umformen21.4.4R Studio
rmarkdown2.8R Studio
ROCit2.1.1R Studio
ROCR1.0-11R Studio
Waage1.2.1R Studio
Spatz1.0.3R Studio
stringr1.5.0R Studio
SuperPC1.12R Studio
Überleben3.3-1R Studio
ÜberlebenROC1.0.3R Studio
ÜberlebensVM0.0.5R Studio
SVA3.40.0R Studio
testen, dass3.1.0R Studio
Tibble3.2.1R Studio
aufgeräumt1.3.0R Studio
aufgeräumt1.3.1R Studio
UpSetR1.4.0R Studio
Viridis0.6.1R Studio

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles