Costruzione e visualizzazione di modelli utilizzando il framework di apprendimento automatico basato su MIME

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Costruzione e visualizzazione di modelli utilizzando il framework di apprendimento automatico basato su MIME

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime è un framework computazionale flessibile per costruire un modello di integrazione basato sull'apprendimento automatico con prestazioni eleganti. In questo articolo, forniamo una procedura dettagliata passo dopo passo per lo sviluppo di modelli predittivi con elevata precisione, sfruttando set di dati complessi per identificare i geni critici associati alla progressione della malattia, agli esiti dei pazienti e alla risposta terapeutica.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La diffusa tecnologia di sequenziamento ad alto rendimento ha migliorato significativamente la nostra comprensione della biologia e dell'eterogeneità del cancro. Gli algoritmi di apprendimento automatico sui dati trascrizionali sono diventati fondamentali per prevedere la prognosi dei pazienti e le risposte cliniche. Nonostante i progressi negli algoritmi di apprendimento automatico, rimane assente una piattaforma open source che incorpori i più sofisticati algoritmi di apprendimento automatico sui dati trascrizionali. Per colmare questa lacuna, abbiamo sviluppato Mime, un versatile framework di apprendimento automatico per migliorare la costruzione e la visualizzazione di modelli predittivi per le caratteristiche cliniche e le firme geniche. Integrando diversi set di dati e impiegando le tecniche di selezione delle caratteristiche più avanzate, Mime affronta le sfide critiche nelle previsioni cliniche. Fornisce tre funzioni principali, tra cui la costruzione del modello, la selezione delle caratteristiche e la visualizzazione dei dati. La costruzione del modello comprende una gamma di algoritmi di apprendimento automatico, tra cui, a titolo esemplificativo ma non esaustivo, alberi decisionali, macchine a vettori di supporto e metodi di insieme, consentendo ai ricercatori di selezionare l'approccio più adatto per la loro analisi specifica. La selezione delle funzionalità utilizza algoritmi avanzati come l'eliminazione ricorsiva delle funzionalità e la regressione LASSO per semplificare il set di dati e concentrarsi sulle funzionalità più informative. Il framework supporta l'ottimizzazione dei parametri personalizzabili attraverso metodi di convalida incrociata, ottimizzando le prestazioni del modello e mitigando i rischi di overfitting. Gli strumenti di visualizzazione integrati in Mime consentono ai ricercatori di interpretare efficacemente i risultati del modello, fornendo rappresentazioni grafiche dell'importanza delle caratteristiche e metriche predittive delle prestazioni. In questo manoscritto, forniamo un tutorial dettagliato sulle procedure passo-passo di questo versatile framework di apprendimento automatico.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L'adozione diffusa di tecnologie di sequenziamento ad alto rendimento ha influenzato in modo significativo la nostra comprensione della biologia e dell'eterogeneità del cancro¹. Questo progresso rivoluzionario nel campo della biotecnologia non solo ha approfondito le nostre conoscenze scientifiche, ma ha anche rivoluzionato il campo della ricerca medica. Consentendo agli scienziati di sequenziare grandi quantità di materiale genetico in modo rapido e accurato, il sequenziamento ad alto rendimento ha accelerato la scoperta di nuovi geni, mutazioni e percorsi biologici. Un numero crescente di ricerche ha delineat....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: le esercitazioni per questo studio vengono tutte eseguite sulla piattaforma Linux utilizzando il software R. La versione del pacchetto R utilizzata in questo protocollo è elencata nella tabella dei materiali. Ogni passaggio necessario per l'analisi è mostrato di seguito e il protocollo dettagliato può essere acquisito anche su GitHub (https://github.com/l-magnificence/Mime). Gli utenti che riscontrano problemi con Mime possono visitare la pagina del problema di GitHub (https://github.com/l-magnificence/Mime/issues) per fornire un feedback.

1. Preparazione del Mime e del dataset ....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La genelist e la coorte Example.cohort, che includono una coorte di addestramento e una coorte di convalida, sono state utilizzate per costruire modelli prognostici, integrando 10 algoritmi di apprendimento automatico in Mime. Tra i 117 modelli di prognosi costruiti da Mime, il modello combinato StepCox [forward] + plsRcox (SPCOM) ha avuto il C-index più alto tra tutte le coorti, indicando la sua eccezionale performance (Figura 1A). I pazienti sono stati ulteriormente separati in gruppi ad a.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In questo studio, forniamo una descrizione dettagliata di come utilizzare il pacchetto Mime per sviluppare modelli predittivi di apprendimento automatico robusti e potenti per i dati trascrittomici. Negli studi precedenti, i ricercatori hanno spesso avuto difficoltà a selezionare l'algoritmo del modello predittivo appropriato in base alle caratteristiche specifiche dei loro dati di sequenziamento^13,14. Inoltre, per i ricercatori .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nessun conflitto di interessi dichiarato.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ringraziamo tutti i partecipanti e gli investigatori coinvolti nella produzione dei dati.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Nome del pacchetto	Versione	Software
una trama	0.1.10	R studio
BART	2.9.4	R studio
Boruta	8.0.0	R studio
cancrodi classe	1.38.0	R studio
Cursore	6.0-89	R studio
Ckmeans.1d.dp	4.3.5	R studio
confrontaC	1.3.2	R studio
Mappa di calore complessa	2.15.1	R studio
Composizioni	2.0-4	R studio
data.table	1.14.0	R studio
doParallelo	1.0.16	R studio
dplyr	1.1.3	R studio
E1071	1.7-7	R studio
forestale	1.1.0	R studio
futuro	1.21.0	R studio
Gbm	2.1.8.1	R studio
ggbreak	0.1.1	R studio
ggplot2	3.4.1	R studio
ggpubr	0.4.0	R studio
ggsci	2.9	R studio
glmnet	4.1-2	R studio
griglia	4.1.3	R studio
grigliaExtra	2.3	R studio
GSEABase	1.54.0	R studio
GSVA	1.40.1	R studio
Hmisc	5.1-1	R studio
kknn	1.3.1	R studio
maglia	1.42	R studio
magrittr	2.7.2	R studio
Matrice	1.5-4	R studio
meta	5.2-0	R studio
Strumenti vari	0.6-28	R studio
mixOmics	6.18.1	R studio
Strumenti di miscelazione	1.2.0	R studio
pbapply	1.4-3	R studio
plsRcox	1.7.7	R studio
Proc	1.18.0	R studio
R	4.1.3	R studio
casualeForestaSRC	4.6-14	R studio
lettore	1.4.0	R studio
Ricette	0.1.17	R studio
rimodellare2	1.4.4	R studio
rmarkdown	2.8	R studio
ROCit	2.1.1	R studio
ROCR	1.0-11	R studio
bilancia	1.2.1	R studio
passero	1.0.3	R studio
stringer	1.5.0	R studio
SuperPC	1.12	R studio
sopravvivenza	3.3-1	R studio
sopravvivenzaROC	1.0.3	R studio
SopravvivenzaSVM	0.0.5	R studio
SVA	3.40.0	R studio
testche	3.1.0	R studio
tibble	3.2.1	R studio
tidyr	1.3.0	R studio
Tidyverse	1.3.1	R studio
UpSetR	1.4.0	R studio
Viridis	0.6.1	R studio

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Costruzione e visualizzazione di modelli utilizzando il framework di apprendimento automatico basato su MIME

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles