July 22nd, 2025
Mime è un framework computazionale flessibile per costruire un modello di integrazione basato sull'apprendimento automatico con prestazioni eleganti. In questo articolo, forniamo una procedura dettagliata passo dopo passo per lo sviluppo di modelli predittivi con elevata precisione, sfruttando set di dati complessi per identificare i geni critici associati alla progressione della malattia, agli esiti dei pazienti e alla risposta terapeutica.
La tecnologia di sequenziamento ad alto contenuto di tutto ha un impatto significativo sulla nostra comprensione della biologia e dell'eterogeneità del cancro. Tuttavia, con numerosi dati di sequenziamento ad alto tasso di interruzione, è difficile selezionare e identificare rapidamente i geni e i biomarcatori associati alla malattia. Esistono numerosi framework di apprendimento automatico, ma nessuno di essi offre un confronto integrato per un processo decisionale informato. Per colmare questa lacuna, abbiamo sviluppato Mime, una piattaforma unificata per la valutazione dello stress e dei punti deboli del modello.
Mime offre quattro funzioni: modellazione della prognosi ottimale, previsione della risposta binaria, identificazione delle caratteristiche co-prognostiche e visualizzazione delle prestazioni del modello, sfruttando algoritmi di apprendimento automatico auto-addestrati per l'analisi intercritica integrata.
I ricercatori spesso hanno difficoltà a scegliere gli algoritmi predittivi e a gestire gli ambienti di apprendimento automatico. Il packaging R open source MIME semplifica la configurazione del modello, la selezione dei parametri e l'implementazione, consentendo agli utenti di analizzare facilmente i propri dati.
Mime segna una pietra miliare nell'applicazione dell'intelligenza artificiale alla biomedicina per integrare l'apprendimento automatico attraverso il livello di sequenziamento di singole cellule per scoprire l'eterogeneità intratumorale utilizzando la diversità intratumorale.
[Narratore] Per iniziare, apri il sito Web GitHub su un computer desktop. Installa la versione di sviluppo di Mime da GitHub utilizzando il pacchetto devtools in R. Prepara più coorti contenenti dati di sequenziamento trascrizionale con informazioni sulla sopravvivenza o sulla risposta clinica. Utilizza i set di dati di esempio, Example.cohort e Example.ici, accessibili dal repository GitHub Mime. La coorte Example.cohort contiene due set di dati di glioma con 100 campioni selezionati casualmente rispettivamente dal database TCGA e CGGA. Includi più set di dati per costruire modelli predittivi per la prognosi in Example.cohort. Verificare che il formato del set di dati includa l'ID del campione nella prima colonna, il tempo di sopravvivenza e lo stato nella seconda e nella terza colonna e registrare i livelli di espressione genica trasformata nelle colonne rimanenti. Verificare che Dataset1 venga utilizzato per il training e altri set di dati per la convalida. Quindi, caricare il set di dati Example.ici e verificare che il formato includa l'ID del campione nella prima colonna, la risposta terapeutica nella seconda colonna e i livelli di espressione genica trasformata del log nelle colonne rimanenti. Preparare la genelist utilizzando il set di geni associato alla segnalazione Wnt/beta-catenina in R dal file genelist. Utilizza la funzione ML.Dev.Prog.Sig e i codici forniti per costruire modelli predittivi per la prognosi basati su Example.cohort e genelist. Quindi utilizzare la funzione cindex_dis_all per tracciare il C-index di ciascun modello e identificare il modello ottimale. Calcolare le curve di sopravvivenza dei pazienti utilizzando il punteggio di rischio utilizzando un modello specifico tra diversi set di dati ed elaborarlo in Mime utilizzando i codici forniti. Calcolare l'AUC dipendente dal tempo per i modelli predittivi utilizzando la funzione cal_AUC_ml_res e i codici specificati. A questo punto, tracciare l'AUC dipendente dal tempo per ciascun modello utilizzando la funzione auc_dis_all e i codici specificati. Elabora la curva ROC dipendente dal tempo di un modello specifico tra diversi set di dati in Mime utilizzando la funzione roc_vis e i codici forniti. Per costruire modelli predittivi per la risposta terapeutica, utilizzare la funzione ML.Dev.Pred.Category.Sig basata sul set di dati Example.ici e sulla genelist. Visualizzare l'AUC per ogni modello di risposta usando auc_vis_category_all. Quindi, generare le curve ROC per ogni modello utilizzando roc_vis_category. Per la selezione delle caratteristiche principali, identificare i geni principali associati alla prognosi utilizzando ML.Corefeature.Prog.Screen in base a Example.cohort e genelist. Traccia il rango dei geni filtrati con metodi diversi utilizzando core_feature_rank per evidenziare i geni principali identificati di frequente. Tra i 117 modelli prognostici costruiti da Mime, il modello combinato StepCox[Forward] + plsRcox ha mostrato il più alto indice di concordanza in tutte le coorti. I pazienti con punteggi ad alto rischio hanno avuto esiti significativamente peggiori in tutte le coorti. L'area di un anno sotto la curva prevista da SPCOM si è classificata al primo posto tra tutti i modelli con il più alto valore di AUC medio tra le coorti. Tra i sette modelli di previsione della risposta terapeutica, il modello svmRadialWeights ha raggiunto le prestazioni più elevate con un'area sotto la curva di 0,81 nel set di dati di addestramento e 0,68 nel set di dati di convalida. La selezione delle caratteristiche principali ha identificato PSEN2, WNT5B e SKP2 come i geni più importanti in base alla loro ricorrenza in diversi algoritmi.
View the full transcript and gain access to thousands of scientific videos
Mime è un framework computazionale progettato per costruire modelli di integrazione basati sull'apprendimento automatico per prevedere geni associati alle malattie. Questo articolo delinea una procedura passo-passo per sviluppare modelli predittivi ad alta precisione utilizzando dataset complessi.