Konstruowanie i wizualizacja modeli przy użyciu struktury uczenia maszynowego opartej na MIME

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Konstruowanie i wizualizacja modeli przy użyciu struktury uczenia maszynowego opartej na MIME

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime to elastyczna platforma obliczeniowa do konstruowania modelu integracji opartego na uczeniu maszynowym o eleganckiej wydajności. W tym miejscu przedstawiamy szczegółową procedurę krok po kroku dotyczącą opracowywania modeli predykcyjnych z dużą dokładnością, wykorzystując złożone zestawy danych do identyfikacji krytycznych genów związanych z postępem choroby, wynikami pacjentów i reakcją terapeutyczną.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Szeroko rozpowszechniona technologia sekwencjonowania o wysokiej przepustowości znacznie poszerzyła naszą wiedzę na temat biologii i heterogeniczności nowotworów. Algorytmy uczenia maszynowego na danych transkrypcyjnych stały się niezbędne do przewidywania rokowań pacjentów i odpowiedzi klinicznych. Pomimo postępów w algorytmach uczenia maszynowego nadal brakuje platformy typu open source, która obejmuje najbardziej wyrafinowane algorytmy uczenia maszynowego na danych transkrypcyjnych. Aby wypełnić tę lukę, opracowaliśmy Mime, wszechstronną platformę uczenia maszynowego, która usprawnia konstrukcję i wizualizację modeli predykcyjnych dla cech klinicznych i sygnatur genów. Integrując różnorodne zestawy danych i stosując najbardziej zaawansowane techniki wyboru cech, Mime odpowiada na krytyczne wyzwania związane z prognozowaniem klinicznym. Zapewnia trzy główne funkcje, w tym budowę modelu, wybór funkcji i wizualizację danych. Konstrukcja modelu obejmuje szereg algorytmów uczenia maszynowego, w tym między innymi drzewa decyzyjne, maszyny wektorów nośnych i metody zespołowe, co pozwala badaczom wybrać najlepiej dopasowane podejście do ich konkretnej analizy. Wybór funkcji wykorzystuje zaawansowane algorytmy, takie jak rekurencyjna eliminacja cech i regresja LASSO, aby usprawnić zestaw danych i skupić się na najbardziej pouczających funkcjach. Struktura obsługuje dostosowywalne dostrajanie parametrów za pomocą metod krzyżowej walidacji, optymalizując wydajność modelu przy jednoczesnym ograniczaniu ryzyka nadmiernego dopasowania. Narzędzia do wizualizacji zintegrowane z Mime umożliwiają badaczom efektywną interpretację wyników modelu, zapewniając graficzne reprezentacje znaczenia funkcji i predykcyjne wskaźniki wydajności. W tym manuskrypcie przedstawiamy szczegółowy samouczek dotyczący procedur krokowych tej wszechstronnej struktury uczenia maszynowego.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Powszechne zastosowanie wysokoprzepustowych technologii sekwencjonowania znacząco wpłynęło na nasze zrozumienie biologii i heterogeniczności nowotworów¹. Ten przełomowy postęp w biotechnologii nie tylko pogłębił naszą wiedzę naukową, ale także zrewolucjonizował dziedzinę badań medycznych. Umożliwiając naukowcom szybkie i dokładne sekwencjonowanie dużych ilości materiału genetycznego, sekwencjonowanie o wysokiej przepustowości przyspieszyło odkrywanie nowych genów, mutacji i szlaków biologicznych. Coraz więcej badań wskazuje na specyficzne sygnatury molekularne związane z postępem choroby, rokowaniem pacjenta i reakcją terapeutyczną na podstawie....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

UWAGA: Wszystkie samouczki do tego badania są uruchamiane na platformie Linux przy użyciu oprogramowania R. Wersja pakietu R używana w tym protokole jest wymieniona w Tabeli materiałów. Każdy krok niezbędny do analizy jest pokazany poniżej, a szczegółowy protokół można również pobrać na GitHub (https://github.com/l-magnificence/Mime). Użytkownicy, którzy napotkają problemy z Mime, mogą odwiedzić stronę problemu z usługą GitHub (https://github.com/l-magnificence/Mime/issues), aby przekazać opinię.

1. Przygotowanie Mime i przykładowego zestawu danych

Zainstaluj wersję rozwojową Mime z GitHub przy ....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Genelist i Example.cohort, w tym jedna kohorta szkoleniowa i jedna kohorta walidacyjna, zostały wykorzystane do skonstruowania modeli prognostycznych, integrując 10 algorytmów uczenia maszynowego w Mime. Spośród 117 modeli prognostycznych, model kombinowany StepCox[forward] + plsRcox (SPCOM) miał najwyższy indeks C spośród wszystkich kohort, co wskazuje na jego wyjątkową wydajność (Rysunek 1A). Pacjenci zostali następnie podzieleni na grupy wysokiego i niskiego ryzyka zgodnie z medianą oceny.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W tym badaniu przedstawiamy szczegółowy opis sposobu wykorzystania pakietu Mime do tworzenia solidnych i wydajnych modeli predykcyjnych uczenia maszynowego dla danych transkryptomicznych. W poprzednich badaniach badacze często zmagali się z wyborem odpowiedniego algorytmu modelu predykcyjnego w oparciu o specyficzne cechy danych sekwencjonowania^13,14. Dodatkowo, dla badaczy bez wykształcenia informatycznego, istnieje pewna trudność w ustabilizowaniu środowiska uc.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nie stwierdzono konfliktu interesów.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dziękujemy wszystkim uczestnikom i badaczom zaangażowanym w tworzenie danych.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Nazwa pakietu	Wersja	Oprogramowanie
aplot	0.1.10	R studio
BART	2.9.4	R studio
Boruta	8.0.0	R studio
Klasa raka	1.38.0	R studio
Daszek	6.0-89	R studio
Ckmeans.1d.dp	4.3.5	R studio
porównaj C	1.3.2	R studio
ZłożonaMapa ciepła	2.15.1	R studio
Kompozycje	2.0-4	R studio
data.table (tabela)	1.14.0	R studio
doParallel (doRównoległy)	1.0.16	R studio
dplyr (dplyr)	1.1.3	R studio
E1071 powiedział:	1.7-7	R studio
Ploter leśny	1.1.0	R studio
przyszłość	1.21.0	R studio
Gbm	2.1.8.1	R studio
Przerwa w grze ggbreak	0.1.1	R studio
ggplot2 powiedział:	3.4.1	R studio
ggpubr powiedział:	0.4.0	R studio
GGSCI	2.9	R studio
glmnet (glmnet)	4.1-2	R studio
siatka	4.1.3	R studio
gridExtra (siatka dodatkowa)	2.3	R studio
GASEABase (Biblioteka Główna)	1.54.0	R studio
Jednostka GSVA (GSVA)	1.40.1	R studio
Hmisc (Język Hmisc)	5.1-1	R studio
kknn powiedział:	1.3.1	R studio
Dziewiarstwo	1.42	R studio
magrittr powiedział:	2.7.2	R studio
Matryca	1.5-4	R studio
Meta	5.2-0	R studio
miscTools (Narzędzia różne)	0.6-28	R studio
mixOmika	6.18.1	R studio
Narzędzia do mieszania	1.2.0	R studio
PBAapply (Certyfikat PBA)	1.4-3	R studio
plsRcox powiedział:	1.7.7	R studio
Proc	1.18.0	R studio
R	4.1.3	R studio
randomForestSRC (LasKlucz losowy)	4.6-14	R studio
Odczyt	1.4.0	R studio
Przepisy	0.1.17	R studio
Przekształcanie 2	1.4.4	R studio
rmarkdown (język rmarkdown)	2.8	R studio
ROCit (Język angielski)	2.1.1	R studio
Rejon Morza Śródziemnego (	1.0-11	R studio
waga	1.2.1	R studio
wróbel	1.0.3	R studio
podłużnica	1.5.0	R studio
Komputer superPC	1.12	R studio
przetrwanie	3.3-1	R studio
przetrwanieROC	1.0.3	R studio
PrzetrwanieSVM	0.0.5	R studio
SVA (SVA)	3.40.0	R studio
Przetestuj, że	3.1.0	R studio
Sztuczka	3.2.1	R studio
tidyr powiedział:	1.3.0	R studio
tidyverse (Świat Tidy)	1.3.1	R studio
UpSetR	1.4.0	R studio
Viridis	0.6.1	R studio

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Konstruowanie i wizualizacja modeli przy użyciu struktury uczenia maszynowego opartej na MIME

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles