Method Article

Costruzione e visualizzazione di modelli utilizzando il framework di apprendimento automatico basato su MIME

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime è un framework computazionale flessibile per costruire un modello di integrazione basato sull'apprendimento automatico con prestazioni eleganti. In questo articolo, forniamo una procedura dettagliata passo dopo passo per lo sviluppo di modelli predittivi con elevata precisione, sfruttando set di dati complessi per identificare i geni critici associati alla progressione della malattia, agli esiti dei pazienti e alla risposta terapeutica.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La diffusa tecnologia di sequenziamento ad alto rendimento ha migliorato significativamente la nostra comprensione della biologia e dell'eterogeneità del cancro. Gli algoritmi di apprendimento automatico sui dati trascrizionali sono diventati fondamentali per prevedere la prognosi dei pazienti e le risposte cliniche. Nonostante i progressi negli algoritmi di apprendimento automatico, rimane assente una piattaforma open source che incorpori i più sofisticati algoritmi di apprendimento automatico sui dati trascrizionali. Per colmare questa lacuna, abbiamo sviluppato Mime, un versatile framework di apprendimento automatico per migliorare la costruzione e la visualizzazione di modelli predittivi per le caratteristiche cliniche e le firme geniche. Integrando diversi set di dati e impiegando le tecniche di selezione delle caratteristiche più avanzate, Mime affronta le sfide critiche nelle previsioni cliniche. Fornisce tre funzioni principali, tra cui la costruzione del modello, la selezione delle caratteristiche e la visualizzazione dei dati. La costruzione del modello comprende una gamma di algoritmi di apprendimento automatico, tra cui, a titolo esemplificativo ma non esaustivo, alberi decisionali, macchine a vettori di supporto e metodi di insieme, consentendo ai ricercatori di selezionare l'approccio più adatto per la loro analisi specifica. La selezione delle funzionalità utilizza algoritmi avanzati come l'eliminazione ricorsiva delle funzionalità e la regressione LASSO per semplificare il set di dati e concentrarsi sulle funzionalità più informative. Il framework supporta l'ottimizzazione dei parametri personalizzabili attraverso metodi di convalida incrociata, ottimizzando le prestazioni del modello e mitigando i rischi di overfitting. Gli strumenti di visualizzazione integrati in Mime consentono ai ricercatori di interpretare efficacemente i risultati del modello, fornendo rappresentazioni grafiche dell'importanza delle caratteristiche e metriche predittive delle prestazioni. In questo manoscritto, forniamo un tutorial dettagliato sulle procedure passo-passo di questo versatile framework di apprendimento automatico.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L'adozione diffusa di tecnologie di sequenziamento ad alto rendimento ha influenzato in modo significativo la nostra comprensione della biologia e dell'eterogeneità del cancro1. Questo progresso rivoluzionario nel campo della biotecnologia non solo ha approfondito le nostre conoscenze scientifiche, ma ha anche rivoluzionato il campo della ricerca medica. Consentendo agli scienziati di sequenziare grandi quantità di materiale genetico in modo rapido e accurato, il sequenziamento ad alto rendimento ha accelerato la scoperta di nuovi geni, mutazioni e percorsi biologici. Un numero crescente di ricerche ha delineat....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: le esercitazioni per questo studio vengono tutte eseguite sulla piattaforma Linux utilizzando il software R. La versione del pacchetto R utilizzata in questo protocollo è elencata nella tabella dei materiali. Ogni passaggio necessario per l'analisi è mostrato di seguito e il protocollo dettagliato può essere acquisito anche su GitHub (https://github.com/l-magnificence/Mime). Gli utenti che riscontrano problemi con Mime possono visitare la pagina del problema di GitHub (https://github.com/l-magnificence/Mime/issues) per fornire un feedback.

1. Preparazione del Mime e del dataset ....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La genelist e la coorte Example.cohort, che includono una coorte di addestramento e una coorte di convalida, sono state utilizzate per costruire modelli prognostici, integrando 10 algoritmi di apprendimento automatico in Mime. Tra i 117 modelli di prognosi costruiti da Mime, il modello combinato StepCox [forward] + plsRcox (SPCOM) ha avuto il C-index più alto tra tutte le coorti, indicando la sua eccezionale performance (Figura 1A). I pazienti sono stati ulteriormente separati in gruppi ad a.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In questo studio, forniamo una descrizione dettagliata di come utilizzare il pacchetto Mime per sviluppare modelli predittivi di apprendimento automatico robusti e potenti per i dati trascrittomici. Negli studi precedenti, i ricercatori hanno spesso avuto difficoltà a selezionare l'algoritmo del modello predittivo appropriato in base alle caratteristiche specifiche dei loro dati di sequenziamento13,14. Inoltre, per i ricercatori .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nessun conflitto di interessi dichiarato.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ringraziamo tutti i partecipanti e gli investigatori coinvolti nella produzione dei dati.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Nome del pacchettoVersioneSoftware
una trama0.1.10R studio
BART2.9.4R studio
Boruta8.0.0R studio
cancrodi classe1.38.0R studio
Cursore6.0-89R studio
Ckmeans.1d.dp4.3.5R studio
confrontaC1.3.2R studio
Mappa di calore complessa2.15.1R studio
Composizioni2.0-4R studio
data.table1.14.0R studio
doParallelo1.0.16R studio
dplyr1.1.3R studio
E10711.7-7R studio
forestale1.1.0R studio
futuro1.21.0R studio
Gbm2.1.8.1R studio
ggbreak0.1.1R studio
ggplot23.4.1R studio
ggpubr0.4.0R studio
ggsci2.9R studio
glmnet4.1-2R studio
griglia4.1.3R studio
grigliaExtra2.3R studio
GSEABase1.54.0R studio
GSVA1.40.1R studio
Hmisc5.1-1R studio
kknn1.3.1R studio
maglia1.42R studio
magrittr2.7.2R studio
Matrice1.5-4R studio
meta5.2-0R studio
Strumenti vari0.6-28R studio
mixOmics6.18.1R studio
Strumenti di miscelazione1.2.0R studio
pbapply1.4-3R studio
plsRcox1.7.7R studio
Proc1.18.0R studio
R4.1.3R studio
casualeForestaSRC4.6-14R studio
lettore1.4.0R studio
Ricette0.1.17R studio
rimodellare21.4.4R studio
rmarkdown2.8R studio
ROCit2.1.1R studio
ROCR1.0-11R studio
bilancia1.2.1R studio
passero1.0.3R studio
stringer1.5.0R studio
SuperPC1.12R studio
sopravvivenza3.3-1R studio
sopravvivenzaROC1.0.3R studio
SopravvivenzaSVM0.0.5R studio
SVA3.40.0R studio
testche3.1.0R studio
tibble3.2.1R studio
tidyr1.3.0R studio
Tidyverse1.3.1R studio
UpSetR1.4.0R studio
Viridis0.6.1R studio

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles