Method Article

Konstruowanie i wizualizacja modeli przy użyciu struktury uczenia maszynowego opartej na MIME

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime to elastyczna platforma obliczeniowa do konstruowania modelu integracji opartego na uczeniu maszynowym o eleganckiej wydajności. W tym miejscu przedstawiamy szczegółową procedurę krok po kroku dotyczącą opracowywania modeli predykcyjnych z dużą dokładnością, wykorzystując złożone zestawy danych do identyfikacji krytycznych genów związanych z postępem choroby, wynikami pacjentów i reakcją terapeutyczną.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Szeroko rozpowszechniona technologia sekwencjonowania o wysokiej przepustowości znacznie poszerzyła naszą wiedzę na temat biologii i heterogeniczności nowotworów. Algorytmy uczenia maszynowego na danych transkrypcyjnych stały się niezbędne do przewidywania rokowań pacjentów i odpowiedzi klinicznych. Pomimo postępów w algorytmach uczenia maszynowego nadal brakuje platformy typu open source, która obejmuje najbardziej wyrafinowane algorytmy uczenia maszynowego na danych transkrypcyjnych. Aby wypełnić tę lukę, opracowaliśmy Mime, wszechstronną platformę uczenia maszynowego, która usprawnia konstrukcję i wizualizację modeli predykcyjnych dla cech klinicznych i sygnatur genów. Integrując różnorodne zestawy danych i stosując najbardziej zaawansowane techniki wyboru cech, Mime odpowiada na krytyczne wyzwania związane z prognozowaniem klinicznym. Zapewnia trzy główne funkcje, w tym budowę modelu, wybór funkcji i wizualizację danych. Konstrukcja modelu obejmuje szereg algorytmów uczenia maszynowego, w tym między innymi drzewa decyzyjne, maszyny wektorów nośnych i metody zespołowe, co pozwala badaczom wybrać najlepiej dopasowane podejście do ich konkretnej analizy. Wybór funkcji wykorzystuje zaawansowane algorytmy, takie jak rekurencyjna eliminacja cech i regresja LASSO, aby usprawnić zestaw danych i skupić się na najbardziej pouczających funkcjach. Struktura obsługuje dostosowywalne dostrajanie parametrów za pomocą metod krzyżowej walidacji, optymalizując wydajność modelu przy jednoczesnym ograniczaniu ryzyka nadmiernego dopasowania. Narzędzia do wizualizacji zintegrowane z Mime umożliwiają badaczom efektywną interpretację wyników modelu, zapewniając graficzne reprezentacje znaczenia funkcji i predykcyjne wskaźniki wydajności. W tym manuskrypcie przedstawiamy szczegółowy samouczek dotyczący procedur krokowych tej wszechstronnej struktury uczenia maszynowego.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Powszechne zastosowanie wysokoprzepustowych technologii sekwencjonowania znacząco wpłynęło na nasze zrozumienie biologii i heterogeniczności nowotworów1. Ten przełomowy postęp w biotechnologii nie tylko pogłębił naszą wiedzę naukową, ale także zrewolucjonizował dziedzinę badań medycznych. Umożliwiając naukowcom szybkie i dokładne sekwencjonowanie dużych ilości materiału genetycznego, sekwencjonowanie o wysokiej przepustowości przyspieszyło odkrywanie nowych genów, mutacji i szlaków biologicznych. Coraz więcej badań wskazuje na specyficzne sygnatury molekularne związane z postępem choroby, rokowaniem pacjenta i reakcją terapeutyczną na podstawie....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

UWAGA: Wszystkie samouczki do tego badania są uruchamiane na platformie Linux przy użyciu oprogramowania R. Wersja pakietu R używana w tym protokole jest wymieniona w Tabeli materiałów. Każdy krok niezbędny do analizy jest pokazany poniżej, a szczegółowy protokół można również pobrać na GitHub (https://github.com/l-magnificence/Mime). Użytkownicy, którzy napotkają problemy z Mime, mogą odwiedzić stronę problemu z usługą GitHub (https://github.com/l-magnificence/Mime/issues), aby przekazać opinię.

1. Przygotowanie Mime i przykładowego zestawu danych

  1. Zainstaluj wersję rozwojową Mime z GitHub przy ....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Genelist i Example.cohort, w tym jedna kohorta szkoleniowa i jedna kohorta walidacyjna, zostały wykorzystane do skonstruowania modeli prognostycznych, integrując 10 algorytmów uczenia maszynowego w Mime. Spośród 117 modeli prognostycznych, model kombinowany StepCox[forward] + plsRcox (SPCOM) miał najwyższy indeks C spośród wszystkich kohort, co wskazuje na jego wyjątkową wydajność (Rysunek 1A). Pacjenci zostali następnie podzieleni na grupy wysokiego i niskiego ryzyka zgodnie z medianą oceny.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W tym badaniu przedstawiamy szczegółowy opis sposobu wykorzystania pakietu Mime do tworzenia solidnych i wydajnych modeli predykcyjnych uczenia maszynowego dla danych transkryptomicznych. W poprzednich badaniach badacze często zmagali się z wyborem odpowiedniego algorytmu modelu predykcyjnego w oparciu o specyficzne cechy danych sekwencjonowania13,14. Dodatkowo, dla badaczy bez wykształcenia informatycznego, istnieje pewna trudność w ustabilizowaniu środowiska uc.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nie stwierdzono konfliktu interesów.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dziękujemy wszystkim uczestnikom i badaczom zaangażowanym w tworzenie danych.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Nazwa pakietuWersjaOprogramowanie
aplot0.1.10R studio
BART2.9.4R studio
Boruta8.0.0R studio
Klasa raka1.38.0R studio
Daszek6.0-89R studio
Ckmeans.1d.dp4.3.5R studio
porównaj C1.3.2R studio
ZłożonaMapa ciepła2.15.1R studio
Kompozycje2.0-4R studio
data.table (tabela)1.14.0R studio
doParallel (doRównoległy)1.0.16R studio
dplyr (dplyr)1.1.3R studio
E1071 powiedział:1.7-7R studio
Ploter leśny1.1.0R studio
przyszłość1.21.0R studio
Gbm2.1.8.1R studio
Przerwa w grze ggbreak0.1.1R studio
ggplot2 powiedział:3.4.1R studio
ggpubr powiedział:0.4.0R studio
GGSCI2.9R studio
glmnet (glmnet)4.1-2R studio
siatka4.1.3R studio
gridExtra (siatka dodatkowa)2.3R studio
GASEABase (Biblioteka Główna)1.54.0R studio
Jednostka GSVA (GSVA)1.40.1R studio
Hmisc (Język Hmisc)5.1-1R studio
kknn powiedział:1.3.1R studio
Dziewiarstwo1.42R studio
magrittr powiedział:2.7.2R studio
Matryca1.5-4R studio
Meta5.2-0R studio
miscTools (Narzędzia różne)0.6-28R studio
mixOmika6.18.1R studio
Narzędzia do mieszania1.2.0R studio
PBAapply (Certyfikat PBA)1.4-3R studio
plsRcox powiedział:1.7.7R studio
Proc1.18.0R studio
R4.1.3R studio
randomForestSRC (LasKlucz losowy)4.6-14R studio
Odczyt1.4.0R studio
Przepisy0.1.17R studio
Przekształcanie 21.4.4R studio
rmarkdown (język rmarkdown)2.8R studio
ROCit (Język angielski)2.1.1R studio
Rejon Morza Śródziemnego (1.0-11R studio
waga1.2.1R studio
wróbel1.0.3R studio
podłużnica1.5.0R studio
Komputer superPC1.12R studio
przetrwanie3.3-1R studio
przetrwanieROC1.0.3R studio
PrzetrwanieSVM0.0.5R studio
SVA (SVA)3.40.0R studio
Przetestuj, że3.1.0R studio
Sztuczka3.2.1R studio
tidyr powiedział:1.3.0R studio
tidyverse (Świat Tidy)1.3.1R studio
UpSetR1.4.0R studio
Viridis0.6.1R studio

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles