Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Rakip Risk Modelinin R Tabanlı Peyzaj Doğrulaması

Published: September 16, 2022 doi: 10.3791/64018
* These authors contributed equally

Summary

Mevcut protokol, rakip bir risk modelinin ayırt etme ve kalibrasyon yeteneklerini değerlendirmek için R'deki kodları ve bunun iç ve dış doğrulaması için kodları açıklamaktadır.

Abstract

Cox orantılı tehlike modeli, klinik ortamlarda sağkalım analizleri için yaygın olarak uygulanmaktadır, ancak çoklu sağkalım sonuçlarıyla baş edememektedir. Geleneksel Cox orantılı tehlike modelinden farklı olarak, rakip risk modelleri, rakip olayların varlığını ve bunların klinisyenlerin kesin bir prognostik tahmin yapmaları için yararlı bir araç olan grafiksel bir hesaplama cihazı olan bir nomogram ile kombinasyonunu göz önünde bulundurur. Bu çalışmada, rakip risk nomogramını oluşturmak için bir yöntem, yani ayırt edicilik (yani, uyum indeksi ve eğri altındaki alan) ve kalibrasyon (yani kalibrasyon eğrileri) yeteneklerinin yanı sıra net faydanın (yani karar eğrisi analizi) değerlendirilmesi için bir yöntem sunuyoruz. Ek olarak, orijinal veri kümesinin bootstrap yeniden örneklerini kullanan dahili doğrulama ve yerleşik rakip risk nomogramının harici bir veri kümesini kullanan harici doğrulama, ekstrapolasyon yeteneğini göstermek için de gerçekleştirilmiştir. Rakip risk nomogramı, klinisyenlerin rakip riskleri göz önünde bulundurarak prognozu tahmin etmeleri için yararlı bir araç olarak hizmet etmelidir.

Introduction

Son yıllarda, hassas tıbbın gelişmesiyle birlikte ortaya çıkan prognostik faktörler belirlenmiş, moleküler ve klinikopatolojik faktörleri birleştiren prognostik modeller klinik ortamlarda giderek daha fazla dikkat çekmektedir. Bununla birlikte, Cox orantılı tehlike modeli gibi grafiksel olmayan modeller, katsayı değerlerinin sonuçlarıyla, klinisyenlerin 1'i anlaması zordur. Buna karşılık, bir nomogram, bir matematiksel fonksiyonun yaklaşık grafik hesaplaması için tasarlanmış iki boyutlu bir diyagram olan regresyon modellerinin (Cox regresyon modeli, rakip risk modeli vb. dahil) bir görselleştirme aracıdır2. Bir klinik modelde farklı değişken seviyelerinin değerlendirilmesini ve prognozu tahmin etmek için risk skorlarının (RS) hesaplanmasını sağlar.

Model yapımında model değerlendirmesi esastır ve değerlendirme için genellikle iki özellik kabul edilir: ayrımcılık ve kalibrasyon. Klinik modellerde ayrımcılık, bir modelin olayları geliştiren bireyleri, ölen hastalara karşı hayatta kalanlar gibi geliştirmeyenlerden ayırma yeteneğini ifade eder ve uyum indeksi (C-indeksi) veya alıcı çalışma karakteristik eğrisi (AUC) altındaki alan tipik olarak karakterize etmek için kullanılır 3,4. Kalibrasyon, bir modelin tahmin edilen olasılıklarını gerçek olasılıklarla karşılaştırma işlemidir ve kalibrasyon eğrileri onu temsil etmek için yaygın olarak kullanılmıştır. Ek olarak, model doğrulaması (iç ve dış doğrulama) model yapımında önemli bir adımdır ve yalnızca doğrulanmış modeller daha fazla tahmin edilebilir5.

Cox orantılı tehlike modeli, prognostik faktörler ile sağkalım durumu arasındaki ilişkileri araştırmak için tıbbi araştırmalarda kullanılan bir regresyon modelidir. Bununla birlikte, Cox orantılı tehlike modeli yalnızca iki sonuç durumunu [Y (0, 1)] dikkate alırken, çalışma denekleri genellikle ikiden fazla durumla karşı karşıya kalır ve rakip riskler ortaya çıkar [Y (0, 1, 2)]1. Menşe tarihinden (örneğin tedavi) herhangi bir nedene bağlı ölüm tarihine kadar geçen süre olarak tanımlanan genel sağkalım (OS), sağkalım analizinde en önemli son noktadır. Bununla birlikte, işletim sistemi kansere özgü ölümü kansere özgü olmayan ölümden (örneğin, kardiyovasküler olaylar ve diğer ilgisiz nedenler) ayırt etmekte başarısız olmakta, böylece rakip riskleri göz ardı etmektedir6. Bu gibi durumlarda, rakip riskler göz önünde bulundurularak sağkalım durumunun tahmin edilmesinde rakip risk modeli tercih edilir7. Cox orantılı tehlike modellerinin oluşturulması ve doğrulanması metodolojisi iyi kurulmuş olsa da, rakip risk modellerinin doğrulanması ile ilgili çok az rapor bulunmaktadır.

Önceki çalışmamızda, spesifik bir rakip risk nomogramı, bir nomogram ve rakip risk modelinin bir kombinasyonu ve rakip bir risk modeline dayalı bir risk puanı tahmini oluşturulmuştur8. Bu çalışma, rakip risk nomogramının farklı değerlendirme ve validasyon yöntemlerini sunmayı amaçlamaktadır ve bu yöntemler, klinisyenlerin rakip riskleri göz önünde bulundurarak prognozu tahmin etmeleri için yararlı bir araç olarak hizmet etmelidir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Sürveyans, Epidemiyoloji ve Son Sonuçlar (SEER) veritabanı, yalnızca tanımlanmamış hasta verilerini içeren açık erişimli bir kanser veritabanıdır (SEER ID: 12296-Kasım 2018). Bu nedenle, bu çalışma Zhejiang Üniversitesi Tıp Fakültesi, Bağlı Jinhua Hastanesi inceleme kurulunun onayından muaf tutulmuştur.

1. Veri hazırlama ve R paketlerinin hazırlanması

  1. Verileri hazırlayın ve içeri aktarın.
    > Veri Kümesi <- read.csv(".../Meme kanseri Verileri.xlsx") #Import veriler.
    NOT: Veriler Ek Dosya 1'e yüklenir.
  2. R paketlerini yükleyin ve yükleyin.
    > paketleri <- c("rms","cmprsk","mstate","survival","riskRegression",,"
    prodlim")
    > req.pcg <- fonksiyonu(pcg){
    Yeni <- PCG[!( pcg %in% installed.packages()[, "Paket"])]
    if (length(new)) install.packages(new, dependencies = T)
    sapply(pcg, require, ch = T)
    }
    > req.pcg(paketler)

    NOT: rms, cmprsk, mstate, survival, riskRegression ve prodlim (http://www.r-projectrg/) paketlerini kullanarak R yazılımını (sürüm 3.6.2) temel alan aşağıdaki yordamları gerçekleştirin.

2. Rakip risk nomogramlarını iki farklı yöntemle oluşturun

  1. Rakip risk nomogramını doğrudan bir yöntemle oluşturun.
    > mod_cph <- cph (Surv (Survivalmonths, durum) ~ faktör1 + faktör2 + ...,
    x=T, y=T, surv=T, data=Veri kümesi)
    > nom <- nomogram(mod_cph, fun=list(function(x) 1-surv_cph(36, x)...),
    funlabel=c("3 yıllık olay1 Prob." ...), lp=F)
    örnek olarak 36. ay #Take.
    > mod_crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov)
    > puanı <- log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)
    > Arsa (Nom)
  2. Rakip risk nomogramını ağırlıklı bir yöntemle oluşturun.
    > df.w <- crprep("Survivalmonths"," fstatus",
    data=Veri kümesi, trans=c(1,2), cens=0,
    keep=c("faktör1"," faktör2"...))
    > mod.w <- cph(Surv(Tstart, Tstop, status==1) ~ factor1+factor2+...,
    data=df.w, weight=weight.cens, subset=failcode==1, surv=T)
    > nom.w <- nomogram(mod.w...)

3. Rakip risk nomogramının ayırt edicilik yeteneği

  1. Ayrımcılık için C-indeksi
    1. Matris kovanını rakip risk modeline mod_crr sığdırın ve tahmin edilen bir matris SUV alın.
      > suv <- predict.crr(mod_crr, cov)
    2. Belirli bir aydaki kümülatif olayları suv'den alın ve rcorr.cens işleviyle C-endeksini hesaplayın.
      > cif36 <- suv[hangi(suv[,1]==36),][-1]
      > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
      > cindex <- rcorr[1]
  2. Ayrımcılık için AUC
    1. Score (riskRegression package) işlevini kullanarak rakip risk modelinin tahmine dayalı performansını puanlayın.
      > fgr.w <- FGR(Hist(Survivalmonths, fstatus) ~ factor1+ factor2+..., data=Dataset, cause=1)
      > skor <- Score(list("Fine-Gray" = fgr.w),
    2. AUC'yi "puan" dan çıkarın.
      > puanı$AUC

4. Rakip risk modellerinin kalibrasyon kabiliyeti

  1. Rakip risk modelinin %95 güven aralığına sahip kalibrasyon eğrileri
    1. Belirli bir başarısızlık süresinde her bireyin kümülatif olaylarını içeren bir veri çerçevesi edinin.
      Örnek olarak 36. ay #Take cif36 <- data.frame(cif36) >.
      > ortak ad(cif36.36_o)<-c("36m")
    2. Kohortu tahmini kümülatif insidanslara göre beş alt gruba ayırın ve her bir alt grubun ortalama öngörülen kümülatif insidanslarını hesaplayın.
      > grubu36 <- kesim (cif36 $ '36 m',
      Kantil (cif36 $ '36m', seq (0, 1, 0.2)),
      include.en düşük = TRUE, etiketler = 1:5)
      > ortalama36 <- as.vector(by(cif36 $'36m', group36, ortalama))
    3. Gözlenen kümülatif insidansı, yani gerçek kümülatif insidansı, kiminc fonksiyonunu kullanarak hesaplayın ve ardından gözlemlenen kümülatif insidansı, belirli bir başarısızlık süresinde% 95'lik bir güven aralığıyla elde edin.
      > cum36 <- cuminc(Dataset$Survivalmonths,Dataset$fstatus,group36)
      > obs36 <- zaman noktaları(cum36,Veri Kümesi$Survivalmonths)$est[c(1:5),36]
      > obs36var <- timepoints(cum36,Dataset$Survivalmonths)$var[c(1:5),36]
      > DF <- data.frame(ortalama36, obs36, obs36var)
    4. Kalibrasyon eğrisini, ggplot fonksiyonunu kullanarak x ekseni olarak tahmin edilen kümülatif insidanslar ve y ekseni olarak gözlemlenen kümülatif insidanslarla çizin.
      > ggplot(df)+ geom_point(aes(x=ortalama36,y=obs36),col="kırmızı")+
      geom_point(AES(x=ortalama36,y=obs36),col="kırmızı",pch=4)+
      geom_line(col="kırmızı",AES(x=ortalama36,y=obs36))+
      geom_errorbar(col="kırmızı",aes(x=ortalama36,y=obs36+1.96
      *sqrt(obs36var)),
      ymin = obs36-1.96 * sqrt (obs36var), ymax = obs36 + 1.96
      *sqrt(obs36var))
      geom_abline(lty=3,lwd=2,col=c(rgb(0,118,192,
      maxColorValue=255)))
  2. Rakip risk modelinin risk puanları ile kalibrasyon eğrisi
    1. Tüm değişkenlerin her seviyesini değerlendirin ve toplam RS'yi elde edin.
      > Veri Kümesi$factor1[Veri Kümesi$faktör1==1] <- faktör1.scale["Factor1_level1"]
      >
      ... #For örnek, Dataset$histology[Dataset$histology==1]<-histology.scale["Histology1"]
      > Dataset$rs <- Dataset$factor1+Dataset$factor2+Dataset$factor3+...
      NOT: Her değişkenin puanlarını toplayarak her hasta için toplam RS'yi elde edin.
    2. Frekansları sayın ve farklı toplam risk puanlarının gözlemlenen kümülatif insidanslarını hesaplayın.
      > rs.freq <- as.data.frame(table(Dataset$rs))
      > obs.36 <- vektör(mode="sayısal", uzunluk=nrow(rs.freq))
      > için (i in 1: nrow(rs.freq)) {
      dataset <- subset(Dataset,Dataset$rs== rs.freq [i,1])
      cif.dataset <- cuminc(dataset$Survivalmonths,dataset$death3)
      cif36.dataset <- zaman noktaları(cif.dataset,36)
      obs.36[i] <- cif36.dataset$est[1]}
    3. X ekseninin aralığını ayarlayın ve toplam risk puanlarının tahmin edilen kümülatif insidanslarını hesaplayın.
      > RS <- aralığı(nom$total.points)
      > x.36 <- seq(min(RS),max(RS),0.01)
      > pre.36 <- 1-(1-cif.min36)^exp(x.36*maxbeta/100)
    4. Kalibrasyon eğrisini risk puanlarıyla çizin.
      > grafiği(x.36, pre.36, type='l'...)
      > par(new=TRUE)
      > arsa(as.vector(rs.freq[,1]), obs.36... )

5. Rakip risk modellerinin karar eğrisi analizi

  1. Karar eğrisi analizini gerçekleştirmek için stdca işlevini kaynaklayın.
    > kaynak("stdca. R")
  2. Hayatta kalma olasılığını hesaplamak için polinom denklemlerini nomogramdan çıkarın.
    > nomogramEx(nomo = nom)
    > Veri Kümesi$tahmincileri <- A * (Veri Kümesi$rs ^3) + B * (Veri Kümesi$rs ^2) + C * Veri Kümesi$rs + D
    #predictors, belirlenen nomogram tarafından hesaplanan kansere özgü ölüm olasılıklarının tahmin edilen olasılıklarıdır
  3. Karar eğrisi analizini gerçekleştirin.
    > stdca(data = Veri kümesi, result = "status", ttoutcome = "Survivalmonths", timepoint = 36,
    tahminciler = "öngörücüler", cmprsk = DOĞRU, pürüzsüz = YANLIŞ, olasılık = YANLIŞ)

    NOT: Rakip bir risk varlığında bir sonucu değerlendirmek için, cmprsk için TRUE seçilmelidir.

6. Bootstrap yöntemini kullanarak dahili doğrulama

  1. Bootstrap yöntemini kullanarak tahmin edilen ortalama kümülatif olayları elde edin.
    1. Bootstrap veri kümesini (Dataset_in) oluşturmak için özgün veri kümesini (Veri Kümesi) replace ile yeniden örnekleyin. Bootstrap veri kümesiyle rakip bir risk modeli (mod.in_crr) oluşturun. mod.in_crr tahmin etmek için predict.crr işlevini kullanın ve suvall.in oluşturmak için b zamanlarını döngüleyin.
      B=b
      suvall.in <- list()
      for(j in 1:B){
      Dataset_in <- Dataset[sample(c(1:nrow(Dataset)),nrow(Dataset),
      değiştir = TRUE),]
      Ekle (Dataset_ içinde)
      cov. <- model.matrix(~faktör1+ faktör2+...) [,-1]
      mod. içinde _crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov.in)
      detach(Veri kümesi. iç)
      SUV. <- predict.crr (mod. in _crr, cov)
      suvall.in[[j]] <- suv.in}
    2. Belirli bir ayda tahmin edilen ortalama kümülatif olayları alın.
      CIF36ALL. <- vektör(mode="sayısal", uzunluk=nrow(Veri kümesi))
      for (k in 1:B) {
      CIF36ALL. İç<- CIF36ALL. iç + suvall. iç[[k]][hangi(suvall. iç[[k]][,1]==36),][-1]
      }
      cif36.in <- cif36all.in/B
  2. C-dizinini, rcorr.cens işleviyle dahili çapraz doğrulamayı kullanarak hesaplayın.
    RCORR. iç <- rcorr.cens(1-cif36.in,Surv(Veri Kümesi$Survivalmonths,Veri Kümesi$tümör ölümü))
    cindex. İç <- RCORR. iç[1]
  3. Çapraz dahili doğrulamayı kullanarak kalibre edin.
    NOT: İç doğrulamalı rakip risk modelinin kalibrasyon eğrisinin kodları, bölüm 4'teki kodlara benzerken, suv suv.in ile değiştirilmiştir.

7. Rakip risk modelinin harici olarak doğrulanması

  1. Dış verileri kullanarak tahmin edilen kümülatif olayları alın. Dış veri değişkenleri matrisi (cov.ex) ile tahmin edilen kümülatif olayları elde edin.
    suv.ex <- predict.crr(mod_crr,cov.ex)
    cif36.ex <- suv.ex [hangi(suv.ex $time=="36"),][-1]
  2. Harici doğrulama kullanarak C-indeksini hesaplayın.
    rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonths,Dataset.ex$tumordeath))
    cindex.ex <- rcorr.ex[1]
  3. Harici doğrulama kullanarak kalibre edin.
    NOT: İç doğrulamalı rakip risk modelinin kalibrasyon eğrisinin kodları, bölüm 4'teki kodlara benzerken, suv, suv.ex ile değiştirilir.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Bu çalışmada meme kanserli hastaların verileri SEER veri tabanından alınmış ve örnek veri olarak sunulmuştur. SEER veritabanı, Amerika Birleşik Devletleri nüfusunun yaklaşık% 34,6'sını temsil eden kanser hakkında veri sağlar ve veritabanına erişim izni alınmıştır (referans numarası 12296-Kasım 2018).

Her ikisi de histolojik tip, farklılaşmış derece, T evresi ve N evresini içeren iki nomogram (Şekil 1), sırasıyla direkt yöntem ve ağırlıklı yöntem kullanılarak oluşturulmuştur. Her değişken seviyesinin noktaları ve toplam noktalara karşılık gelen olasılıklar neredeyse aynıyken, bazı küçük farklılıklar gözlendi. Zhang ve ark., rakip bir risk nomogramı oluşturmak için "ağırlıklı" bir yaklaşım getirmiş, ilk önce orijinal verileri ağırlıklı verilere dönüştürmüş ( crprep fonksiyonunu kullanarak), daha sonra ağırlıklı verilerle bir Cox regresyon modeli oluşturmuş ( coxph fonksiyonunu kullanarak) ve son olarak Cox regresyon modeli ile rakip bir risk nomogramı oluşturmuştur (fonksiyon nomogramı kullanarak)9. Buna karşılık, bu çalışmadaki "doğrudan" yaklaşım, "ağırlıklı" olandan tamamen farklıdır. Kısacası, rakip risk modelinden ( crr fonksiyonu kullanılarak) üretilen parametreler, Cox regresyon modelindeki ( coxph fonksiyonu kullanılarak) parametrelerin yerini aldı ve son olarak rakip risk nomogramını (fonksiyon nomogramı kullanılarak) oluşturmak için kullanıldı. "Ağırlıklı" yöntem ile "doğrudan" yöntemle oluşturulan nomogramların karşılaştırılmasında iki nomogram genel olarak benzerken, bazı küçük farklılıklar gözlenebilmektedir. Çalışmadaki "doğrudan" yöntem daha kesindir, çünkü nomogramı doğrudan oluşturmak için parametreleri elde eder (bölüm 2'deki "score=log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)" formülüyle).

rcorr.cens(X, Surv)'da X, herhangi bir zaman noktasında kümülatif insidansları olan sayısal bir tahmincidir ve Surv, hayatta kalma aylarını ve durumunu içeren bir hayatta kalma nesnesidir. Surv, rakip olayları yaşayan hastaları sansürlü olarak tanımladığında ve ardından bir yaşam tablosu oluşturduğunda, değerli sıralı çift aynıdır. Rakip risk modelinin doğrulama olmaksızın C-indeksi 0.7978 (%95 CI = 0.7650-0.8305) olup, bu modelin orta derecede ayırt etme yeteneğine sahip olduğunu göstermektedir. Bootstrap analizi 500 kez tekrarlandı ve daha sonra C endeksini hesaplamak için tek bir tahmin üretmek üzere 500 sonucun ortalaması alındı. İç doğrulamadaki C-indeksi 0.7978 (% 95 CI = 0.7651-0.8305) idi ve bu da orijinal veri kümesindeki C-indeksine benziyordu. Rakip risk modeline harici bir veri kümesi yerleştirildi ve dış doğrulamadaki C-indeksi 0.5071 idi (% 95 CI = 0.4637-0.5505). Rakip risk modelinin AUC'si, çalışmadaki orijinal veri kümesinden hesaplanmıştır. 36. ay AUC, modelin ayırt etme yeteneğini gösteren 0.8461 (% 95 CI = 0.8232-0.8691) idi.

Şekil 2A'da gösterildiği gibi, kalibrasyon eğrisindeki noktalar eşdeğerlik çizgisine yakındı ve gözlemlenen frekansın% 95 CI'si, modelin doğru kalibrasyon yeteneğini gösteren her gruptaki eşdeğerlik çizgisine düştü. İç ve dış doğrulamayı kullanan kalibrasyon eğrileri sırasıyla Şekil 2B ve Şekil 2C'de gösterilmiştir, bu da inşa edilen modelin dahili doğrulamada iyi bir kalibrasyon kabiliyetine sahip olduğunu, ancak harici doğrulamada zayıf olduğunu gösterir.

Ek Şekil 1'de gösterildiği gibi, gözlemlenen kümülatif insidansları temsil eden noktalar, tahmin edilen kümülatif insidansları temsil eden çizginin etrafına dağılmıştır ve gözlemlenen ve tahmin edilen insidanslar arasında anlamlı bir fark gözlenmemiştir. Karar eğrisi analizinin sonuçları, artan eşik olasılığı ile net faydadaki değişiklikleri gösteren Şekil 3'te gösterilmiştir.

Figure 1
Şekil 1: Rakip risk nomogramının iki yöntemle oluşturulması . (A) Doğrudan yöntem kullanılarak oluşturulan nomogram. (B) Ağırlıklı yöntem kullanılarak oluşturulan Nomogram. Histoloji: 1,invaziv duktal karsinom; 2, invaziv lobüler karsinom; 3, invaziv duktal karsinom + invaziv lobüler karsinom. Sınıf: 1, iyi farklılaştırılmış; 2, orta derecede farklılaşmış; 3, zayıf farklılaşmış. T Aşaması: 1, T1 aşaması; 2, T2 aşaması; 3, T3 aşaması; 4, T4 aşaması. N Aşama: 0, N0 aşaması; 1, N1 aşaması; 2, N2 aşaması; 3, N3 aşaması. Kısaltma: CSD = kansere özgü ölüm. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 2
Şekil 2: Rakip risk nomogramının kalibrasyon eğrileri . (A) Oluşturulan rakip risk modelinin güven aralığına sahip kalibrasyon eğrisi. (B) İç doğrulamada rakip risk modelinin kalibrasyon eğrisi. (C) Dış doğrulamada rakip risk modelinin kalibrasyon eğrisi. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 3
Şekil 3: Rakip risk nomogramının karar eğrisi analizi. Net fayda, eşik olasılığına göre çizilir. "Tümü" çizgisi, kansere özgü ölüm geçiren tüm hastaları göz önünde bulundurarak net faydayı gösterir ve "hiçbiri" çizgisi, kansere özgü ölüm yaşamayan tüm hastaları göz önünde bulundurarak net faydadır. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Ek Dosya 1: Meme kanseri verileri. Başlık tanımı: grademodify, farklılaştırılmış not; histoloji, histolojik tip; evreT, tümör T evresi; evreN, tümör N evresi; Sağkalım ayları, tedavi tarihinden ölüm tarihine kadar geçen süre, herhangi bir nedenle veya sansürcü nedeniyle; ölüm, ölüm (kansere özgü ölüm ve kansere özgü olmayan ölüm dahil) veya sansür; ölüm3, kansere özgü ölüm, kansere özgü olmayan ölüm veya sansür. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 1: Oluşturulan rakip risk modelinin risk puanları ile kalibrasyon eğrisi. Gözlenen kümülatif insidansları temsil eden noktalar, tahmin edilen kümülatif insidansları temsil eden çizginin etrafına dağıtılmıştır. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Bu çalışmada iki farklı yöntemle oluşturulan rakip risk nomogramları karşılaştırılmış ve oluşturulan nomogramların değerlendirilmesi ve validasyonu yapılmıştır. Spesifik olarak, bu çalışma, doğrudan bir yönteme dayalı nomogramı oluşturmak, ayrıca C-indeksini hesaplamak ve kalibrasyon eğrilerini çizmek için adım adım bir öğretici sağlamıştır.

R yazılımındaki rms paketi, Cox orantılı tehlike modellerinin oluşturulması ve değerlendirilmesi için yaygın olarak kullanılmaktadır, ancak rakip risk modelleri için geçerli değildir. Birden fazla sonucu olan modeller için, Zhang ve ark., ayırt etme yeteneğini değerlendirmek için AUC ve Brier puanını hesaplayan ve kalibrasyon yeteneğini doğrulamak için kalibrasyon eğrilerini çizen R yazılımındaki riskRegression paketini kullanarak rakip risk modellerinin doğrulandığını bildirmiştir 9,10.

Bununla birlikte, riskRegression paketinin C-endeksinin hesaplanamaması gibi bazı eksiklikleri vardır. C-indeksi, tüm değerlenmiş sıralı çiftlerdeki uyumlu değerli sıralı çiftlerin oranıdır (C-İndeksi = uyumlu değerli sıralı çiftler/tüm değerli sıralı çiftler)3,11. Geleneksel iki durumlu sonuç sağkalım analizinde, sadece iki hastanın her ikisinin de ölüm yaşadığı (Di = 1, Dj = 1) veya ölüm geçiren hastanın başarısız olan hastadan daha kısa sağkalım aylarına sahip olduğu çiftler, değerli bir sıralı çift haline gelebilir (Di = 1, Dj = 0, Ti < Tj) (i = hasta i, j = hasta j, T = zaman, D = durum, 1 = ölüm, 0 = başarısızlık). Rekabet riskleri bağlamında, rakip riskten başarısız olan hastalar hala risk kümesinde kalırlar, çünkü yalnızca rakip olaylar yaşayan hastaların gözlemlenenden daha uzun sağkalım aylarına sahip oldukları sonucuna varılabilir. Ek olarak, sadece iki hastanın her ikisinin de ölüm yaşadığı (Di = 1, Dj = 1) veya ölüm geçiren hastanın başarısız olan veya rakip bir olay yaşayan hastadan daha kısa sağkalım aylarına sahip olduğu çiftler değerli bir sıralı çift haline gelebilir (Di = 1, Dj = 0|2, Ti < Tj) (i = hasta i, j = hasta j, T = zaman, D = durum, 2 = rakip olay, 1 = ölüm, 0 = başarısızlık). Bu nedenle, bu çalışmada C-indeksini hesaplamak için rcorr.cens fonksiyonu kullanılmıştır.

Rakip risk modelinin iç doğrulamasında, bu çalışma bootstrap yöntemini uygulamış ve inşa edilen model12'nin iyi performansını göstermiştir. Eğitim ve test veri kümelerine rastgele bir bölünme sorunlu olabilir, çünkü test veri kümesinin13'ü tahmin etmesi özellikle kolay (veya zor) olabilir. K-fold yöntemi çapraz doğrulama için de kullanılabilirken, model doğrulama 5,14'te daha az sıklıkla uygulanmıştır. Bu çalışma aynı zamanda rakip risk modelinin dış doğrulamasını da gerçekleştirdi, ancak dış bağlamda iyi performans göstermedi. Bu, harici doğrulama için kullanılan verilerimizin orijinal verilerin yalnızca bir yeniden örneği olduğu gerçeğine bağlanabilir.

Bununla birlikte, bu çalışmada birkaç sınırlama vardır. İlk olarak, metodolojimiz R yazılımına dayanmaktadır; Bu nedenle, kullanıcıların hedef kitlesini sınırlayabilecek belirli bir programlama bilgisine ihtiyaçları vardır. Buna ek olarak, yüzlerce kod satırı vardır ve bazı kodların farklı veriler için değişiklik yapması gerekir; gelecekteki araştırmalarda her türlü veriye uygulanabilecek bir "hepsi bir arada" R paketi geliştirmeyi umuyoruz. Bu çalışma, harici bir doğrulama yapmak için başka meme kanseri verilerine sahip değildir ve orijinal verilerden yeniden örneklemeden başka seçeneği yoktur, ancak harici doğrulama yöntemleri ve kodları aynıdır. En önemlisi, eşdeğişkenler ile çalışmada varsayılan sonuç arasındaki doğrusallık, gerçek dünyadaki bir çalışmada geçerli olmayabilir ve topluluk modellemesinin yararlı olabileceği etkileşim ve doğrusal olmayanlık dikkate alınmalıdır15.

Sonuç olarak, bu çalışma rakip risk nomogramını "doğrudan" bir yöntemle ortaya koymuş ve orijinal, iç ve dış veri setlerinde ayırt etme ve kalibrasyon yeteneklerini değerlendirmiştir. Rakip risk nomogramının R'deki riskRegression paketine ek olarak hizmet edeceği ve klinik rakip risk olaylarının ele alınmasında yardım sağlayacağı umulmaktadır.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar birbiriyle çelişen çıkarları olmadığını beyan ederler.

Acknowledgments

Çalışma, Zhejiang Eyaleti Tıp Bilimi ve Teknoloji Planı Projesi (hibe numaraları 2013KYA212), Zhejiang Eyaleti Doğa Bilimleri Vakfı'nın genel programı (hibe numarası Y19H160126) ve Jinhua Belediyesi Bilim ve Teknoloji Bürosu'nun kilit programından (hibe numarası 2016-3-005, 2018-3-001d ve 2019-3-013) hibelerle desteklenmiştir.

Materials

Name Company Catalog Number Comments
R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

DOWNLOAD MATERIALS LIST

References

  1. Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Tags

Kanser Araştırmaları Sayı 187 Rakip risk modeli nomogram ayrımcılık kalibrasyon model doğrulama
Rakip Risk Modelinin R Tabanlı Peyzaj Doğrulaması
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lin, H., Zheng, H., Ge, C., Ling,More

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter