July 22nd, 2025
Mime, zarif performansa sahip makine öğrenimi tabanlı bir entegrasyon modeli oluşturmak için esnek bir hesaplama çerçevesidir. Burada, hastalığın ilerlemesi, hasta sonuçları ve terapötik yanıtla ilişkili kritik genleri belirlemek için karmaşık veri kümelerinden yararlanarak, yüksek doğrulukta tahmine dayalı modeller geliştirmek için ayrıntılı bir adım adım prosedür sunuyoruz.
Yüksek kapsamlı dizileme teknolojisi, biyoloji ve kanser heterojenliği anlayışımızı önemli ölçüde etkiler. Bununla birlikte, çok sayıda yüksek kapsamlı dizileme verisiyle, hastalıkla ilişkili genleri ve biyobelirteçleri hızlı bir şekilde taramak ve tanımlamak zordur. Çok sayıda makine öğrenimi çerçevesi mevcuttur, ancak hiçbiri bilinçli karar verme için entegre karşılaştırma sunmaz. Bu boşluğu gidermek için, model stresini ve zayıflıklarını değerlendirmek için birleşik bir platform olan Mime'ı geliştirdik.
Mime, entegre kritikler arası analiz için kendi kendini eğiten makine öğrenimi algoritmalarından yararlanarak optimal prognoz modelleme, ikili yanıt tahmini, ortak prognostik özellik tanımlama ve model performansı görselleştirme olmak üzere dört işlev sunar.
Araştırmacılar genellikle tahmine dayalı algoritmaları seçme ve makine öğrenimi ortamlarını yönetme konusunda zorluk yaşıyor. Mime açık kaynaklı R paketleme, model kurulumunu, parametre seçimini ve dağıtımını basitleştirerek kullanıcıların kendi verilerini kolayca analiz etmelerine olanak tanır.
Mime, intratümöral çeşitliliği kullanarak intratümöral heterojenliği ortaya çıkarmak için tek hücreli dizileme katmanında makine öğrenimini entegre etmek için yapay zekanın biyotıbba uygulanmasında bir dönüm noktasına işaret ediyor.
[Anlatıcı] Başlamak için bir masaüstü bilgisayarda GitHub web sitesini açın. R'deki devtools paketini kullanarak GitHub'dan Mime'ın geliştirme sürümünü yükleyin. Hayatta kalma veya klinik yanıt bilgileriyle transkripsiyonel dizileme verilerini içeren birden çok kohort hazırlayın. Mime GitHub deposundan erişilebilen Example.cohort ve Example.ici örnek veri kümelerini kullanın. Example.kohortu, sırasıyla TCGA ve CGGA veritabanından rastgele seçilmiş 100 örnek içeren iki glioma veri kümesi içerir. Example.cohort'ta prognoz için tahmine dayalı modeller oluşturmak için birden fazla veri kümesi ekleyin. Veri kümesi formatının ilk sütunda örnek kimliğini, ikinci ve üçüncü sütunlarda hayatta kalma süresini ve durumunu içerdiğini ve kalan sütunlarda dönüştürülmüş gen ekspresyon seviyelerini günlüğe kaydettiğini doğrulayın. Dataset1'in eğitim ve doğrulama için diğer veri kümelerinin kullanıldığını onaylayın. Ardından, Example.ici veri kümesini yükleyin ve formatın ilk sütunda örnek kimliğini, ikinci sütunda terapötik yanıtı ve kalan sütunlarda dönüştürülmüş gen ekspresyon seviyelerini günlüğe kaydettiğini onaylayın. Genlist dosyasından R'de Wnt/beta-katenin sinyali ile ilişkili gen setini kullanarak genilisti hazırlayın. ML.Dev.Prog.Sig işlevini ve verilen kodları kullanarak Example.cohort ve genelist'e dayalı prognoz için tahmine dayalı modeller oluşturun. Ardından, her modelin C-indeksini çizmek ve en uygun modeli belirlemek için cindex_dis_all işlevini kullanın. Farklı veri kümeleri arasında belirli bir model kullanarak riske göre skoru kullanarak hastaların hayatta kalma eğrilerini hesaplayın ve verilen kodları kullanarak Mime'da işleyin. Fonksiyon cal_AUC_ml_res ve verilen kodları kullanarak tahmine dayalı modeller için zamana bağlı AUC'yi hesaplayın. Şimdi, auc_dis_all fonksiyonunu ve verilen kodları kullanarak her model için zamana bağlı AUC'yi çizin. Mime'deki farklı veri kümeleri arasında belirli bir modelin zamana bağlı ROC eğrisini roc_vis işlevini ve verilen kodları kullanarak işleyin. Terapötik yanıt için tahmine dayalı modeller oluşturmak için, Example.ici veri kümesini ve gen listesini temel alan ML.Dev.Pred.Category.Sig işlevini kullanın. auc_vis_category_all kullanarak her yanıt modeli için AUC'yi görselleştirin. Ardından, roc_vis_category kullanarak her model için ROC eğrileri oluşturun. Temel özellik seçimi için, Example.cohort ve genelist'e dayalı olarak ML.Corefeature.Prog.Screen kullanarak prognozla ilişkili çekirdek genleri tanımlayın. Sık tanımlanan çekirdek genleri vurgulamak için core_feature_rank kullanarak farklı yöntemlerle filtrelenen genlerin sıralamasını çizin. Mime tarafından oluşturulan 117 prognostik model arasında, StepCox[Forward] + plsRcox kombine modeli, tüm kohortlarda en yüksek uyum indeksini gösterdi. Yüksek risk skoru olan hastaların sonuçları tüm kohortlarda anlamlı derecede kötüydü. SPCOM tarafından tahmin edilen eğrinin altındaki bir yıllık alan, kohortlar arasında en yüksek ortalama AUC değerine sahip tüm modeller arasında en yüksek sırada yer aldı. Yedi terapötik yanıt tahmin modeli arasında svmRadialWeights modeli, eğitim veri kümesinde 0,81 ve doğrulama veri kümesinde 0,68 eğrisinin altındaki alanla en yüksek performansı elde etti. Temel özellik seçimi, PSEN2, WNT5B ve SKP2'yi farklı algoritmalardaki tekrarlarına göre en üst sıradaki genler olarak tanımladı.
View the full transcript and gain access to thousands of scientific videos
Mime, hastalıkla ilişkili genleri tahmin etmek için makine öğrenimi tabanlı entegrasyon modelleri oluşturmak üzere tasarlanmış bir hesaplama çerçevesidir. Bu makale, karmaşık veri setleri kullanarak yüksek doğruluklu tahmine dayalı modeller geliştirmek için adım adım bir prosedürü ana hatlarıyla belirtmektedir.