July 22nd, 2025
Mime is een flexibel computationeel framework om een op machine learning gebaseerd integratiemodel met elegante prestaties te bouwen. Hier bieden we een gedetailleerde stapsgewijze procedure voor het ontwikkelen van voorspellende modellen met hoge nauwkeurigheid, waarbij gebruik wordt gemaakt van complexe datasets om kritieke genen te identificeren die verband houden met ziekteprogressie, patiëntresultaten en therapeutische respons.
High-throughout sequencing-technologie heeft een aanzienlijke invloed op ons begrip van biologie en heterogeniteit van kanker. Met talrijke high-throughout sequencing-gegevens is het echter moeilijk om ziektegerelateerde genen en biomarkers snel te screenen en te identificeren. Er bestaan talloze raamwerken voor machine learning, maar geen van hen biedt geïntegreerde vergelijking voor weloverwogen besluitvorming. Om deze kloof te dichten, hebben we Mime ontwikkeld, een uniform platform voor het evalueren van modelstress en zwakke punten.
Mime biedt vier functies: optimale prognosemodellering, voorspelling van binaire respons, co-prognostische functie-identificatie en visualisatie van modelprestaties, waarbij gebruik wordt gemaakt van zelfgetrainde machine learning-algoritmen voor geïntegreerde interkritische analyse.
Onderzoekers worstelen vaak met het kiezen van voorspellende algoritmen en het beheren van machine learning-omgevingen. Mime open-source R-packaging vereenvoudigt het instellen van modellen, het selecteren van parameters en de implementatie, waardoor gebruikers eenvoudig hun eigen gegevens kunnen analyseren.
Mime markeert een mijlpaal in het toepassen van AI op biogeneeskunde om machine learning te integreren in een single-cell sequencing-laag om intratumorale heterogeniteit bloot te leggen met behulp van intratumorale diversiteit.
[Verteller] Open om te beginnen de GitHub-website op een desktopcomputer. Installeer de ontwikkelingsversie van Mime van GitHub met behulp van het devtools-pakket in R. Bereid meerdere cohorten voor met transcriptionele sequencinggegevens met informatie over overleving of klinische respons. Gebruik de voorbeeldgegevenssets, Example.cohort en Example.ici, die toegankelijk zijn vanuit de Mime GitHub-opslagplaats. Het Example.cohort bevat twee glioomdatasets met willekeurig geselecteerde 100 monsters uit respectievelijk de TCGA- en CGGA-database. Neem meerdere gegevenssets op om voorspellende modellen voor prognose te maken in Example.cohort. Controleer of de gegevenssetindeling de voorbeeld-ID in de eerste kolom, de overlevingstijd en -status in de tweede en derde kolom bevat en registreer de getransformeerde genexpressieniveaus in de overige kolommen. Controleer of Dataset1 wordt gebruikt voor training en andere datasets voor validatie. Laad vervolgens de Example.ici-gegevensset en controleer of de indeling voorbeeld-ID in de eerste kolom en therapeutische respons in de tweede kolom bevat en getransformeerde genexpressieniveaus in de resterende kolommen registreert. Bereid de genelist voor met behulp van de genenset geassocieerd met Wnt/bèta-catenine-signalering in R uit het genenbestand. Gebruik de functie ML.Dev.Prog.Sig en de gegeven codes om voorspellende modellen voor de prognose te maken op basis van Example.cohort en de genelist. Gebruik vervolgens de functie cindex_dis_all om de C-index van elk model uit te zetten en het optimale model te identificeren. Bereken de overlevingscurves van patiënten met behulp van de risicoscore met behulp van een specifiek model tussen verschillende datasets en verwerk dat in Mime met behulp van de gegeven codes. Bereken de tijdsafhankelijke AUC voor de voorspellende modellen met behulp van de functie cal_AUC_ml_res en de gegeven codes. Teken nu de tijdsafhankelijke AUC voor elk model met behulp van de functie auc_dis_all en de gegeven codes. Verwerk de tijdsafhankelijke ROC-curve van een specifiek model tussen verschillende datasets in Mime met behulp van de functie roc_vis en de gegeven codes. Om voorspellende modellen voor therapeutische respons te construeren, gebruikt u de functie ML.Dev.Pred.Category.Sig op basis van de Example.ici-dataset en de genelist. Visualiseer de AUC voor elk antwoordmodel met behulp van auc_vis_category_all. Genereer vervolgens de ROC-curven voor elk model met behulp van roc_vis_category. Identificeer voor de selectie van de kernkenmerken de kerngenen die verband houden met de prognose met behulp van ML.Corefeature.Prog.Screen op basis van het Example.cohort en de genelist. Plot de rang van genen die door verschillende methoden zijn gefilterd met behulp van core_feature_rank om vaak geïdentificeerde kerngenen te markeren. Van de 117 prognostische modellen die door Mime zijn geconstrueerd, vertoonde het gecombineerde model StepCox[Forward] + plsRcox de hoogste concordantie-index in alle cohorten. Patiënten met hoge risicoscores hadden significant slechtere resultaten in alle cohorten. Het eenjaarsgebied onder de door SPCOM voorspelde curve scoorde het hoogst van alle modellen met de hoogste gemiddelde AUC-waarde in alle cohorten. Van de zeven modellen voor het voorspellen van therapeutische respons behaalde het svmRadialWeights-model de hoogste prestatie met een gebied onder de curve van 0,81 in de trainingsdataset en 0,68 in de validatiedataset. Selectie van kernkenmerken identificeerde PSEN2, WNT5B en SKP2 als de hoogst gerangschikte genen op basis van hun herhaling in verschillende algoritmen.
View the full transcript and gain access to thousands of scientific videos
Mime is een computationeel framework ontworpen om op machine learning gebaseerde integratiemodellen te construeren voor het voorspellen van ziekte-geassocieerde genen. Dit artikel schetst een stapsgewijze procedure voor het ontwikkelen van hoog-nauwkeurige voorspellende modellen met behulp van complexe datasets.