Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

प्रतिस्पर्धी जोखिम मॉडल का एक आर-आधारित लैंडस्केप सत्यापन

Published: September 16, 2022 doi: 10.3791/64018
* These authors contributed equally

Summary

वर्तमान प्रोटोकॉल एक प्रतिस्पर्धी जोखिम मॉडल के भेदभाव और अंशांकन क्षमताओं के मूल्यांकन के लिए आर में कोड का वर्णन करता है, साथ ही इसके आंतरिक और बाहरी सत्यापन के लिए कोड भी।

Abstract

कॉक्स आनुपातिक जोखिम मॉडल व्यापक रूप से नैदानिक सेटिंग्स में उत्तरजीविता विश्लेषण के लिए लागू किया जाता है, लेकिन यह कई अस्तित्व परिणामों का सामना करने में सक्षम नहीं है। पारंपरिक कॉक्स आनुपातिक जोखिम मॉडल से अलग, प्रतिस्पर्धी जोखिम मॉडल प्रतिस्पर्धी घटनाओं की उपस्थिति और नोमोग्राम, एक ग्राफिकल गणना उपकरण के साथ उनके संयोजन पर विचार करते हैं, जो चिकित्सकों के लिए एक सटीक पूर्वानुमान भविष्यवाणी करने के लिए एक उपयोगी उपकरण है। इस अध्ययन में, हम प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित करने के लिए एक विधि की रिपोर्ट करते हैं, अर्थात्, इसके भेदभाव का मूल्यांकन (यानी, सामंजस्य सूचकांक और वक्र के तहत क्षेत्र) और अंशांकन (यानी, अंशांकन वक्र) क्षमताओं, साथ ही शुद्ध लाभ (यानी, निर्णय वक्र विश्लेषण)। इसके अलावा, मूल डेटासेट के बूटस्ट्रैप रीसैंपल का उपयोग करके आंतरिक सत्यापन और स्थापित प्रतिस्पर्धी जोखिम नोमोग्राम के बाहरी डेटासेट का उपयोग करके बाहरी सत्यापन भी किया गया था ताकि इसकी बहिर्वेशन क्षमता का प्रदर्शन किया जा सके। प्रतिस्पर्धी जोखिम नोमोग्राम को चिकित्सकों के लिए प्रतिस्पर्धी जोखिमों के विचार के साथ पूर्वानुमान की भविष्यवाणी करने के लिए एक उपयोगी उपकरण के रूप में काम करना चाहिए।

Introduction

हाल के वर्षों में, सटीक चिकित्सा के विकास के साथ उभरते रोगसूचक कारकों की पहचान की गई है, और आणविक और क्लिनिकोपैथोलॉजिकल कारकों के संयोजन वाले रोगसूचक मॉडल नैदानिक सेटिंग्स में बढ़ते ध्यान आकर्षित कर रहे हैं। हालांकि, गैर-ग्राफिकल मॉडल, जैसे कि कॉक्स आनुपातिक जोखिम मॉडल, गुणांक मूल्यों के परिणामों के साथ, चिकित्सकों के लिएसमझना मुश्किल है। इसकी तुलना में, एक नोमोग्राम प्रतिगमन मॉडल (कॉक्स रिग्रेशन मॉडल, प्रतिस्पर्धी जोखिम मॉडल आदि सहित) का एक विज़ुअलाइज़ेशन टूल है, एक द्वि-आयामी आरेख जो गणितीय फ़ंक्शन2 की अनुमानित ग्राफिकल गणना के लिए डिज़ाइन किया गया है। यह एक नैदानिक मॉडल में चर के विभिन्न स्तरों के मूल्यांकन और पूर्वानुमान की भविष्यवाणी करने के लिए जोखिम स्कोर (आरएस) की गणना को सक्षम बनाता है।

मॉडल निर्माण में मॉडल मूल्यांकन आवश्यक है, और दो विशेषताओं को आम तौर पर मूल्यांकन के लिए स्वीकार किया जाता है: भेदभाव और अंशांकन। नैदानिक मॉडल में, भेदभाव उन व्यक्तियों को अलग करने के लिए एक मॉडल की क्षमता को संदर्भित करता है जो घटनाओं को उन लोगों से अलग करते हैं जो नहीं करते हैं, जैसे कि रोगी जो जीवित रहते हैं बनाम मर जाते हैं, और सामंजस्य सूचकांक (सी-इंडेक्स) या रिसीवर ऑपरेटिंग विशेषता वक्र (एयूसी) के तहत क्षेत्र का उपयोग आमतौर पर इसे चिह्नित करने के लिए किया जाता है 3,4।. अंशांकन वास्तविक संभावनाओं के साथ एक मॉडल की अनुमानित संभावनाओं की तुलना करने की एक प्रक्रिया है, और अंशांकन वक्रों का व्यापक रूप से इसका प्रतिनिधित्व करने के लिए उपयोग किया गया है। इसके अलावा, मॉडल सत्यापन (आंतरिक और बाहरी सत्यापन) मॉडल निर्माण में एक महत्वपूर्ण कदम है, और केवल मान्य मॉडल को आगे बढ़ाया जासकता है।

कॉक्स आनुपातिक जोखिम मॉडल एक प्रतिगमन मॉडल है जिसका उपयोग चिकित्सा अनुसंधान में रोगसूचक कारकों और जीवित रहने की स्थिति के बीच संबंधों की जांच के लिए किया जाता है। हालांकि, कॉक्स आनुपातिक जोखिम मॉडल केवल परिणाम की दो स्थितियों पर विचार करता है [वाई (0, 1)], जबकि अध्ययन विषयों को अक्सर दो से अधिक स्थितियों का सामना करना पड़ता है, और प्रतिस्पर्धी जोखिम उत्पन्न होते हैं [वाई (0, 1, 2)]1। समग्र उत्तरजीविता (ओएस), जिसे उत्पत्ति की तारीख (जैसे, उपचार) से किसी भी कारण से मृत्यु की तारीख तक के समय के रूप में परिभाषित किया गया है, उत्तरजीविता विश्लेषण में सबसे महत्वपूर्ण समापन बिंदु है। हालांकि, ओएस कैंसर-विशिष्ट मृत्यु को गैर-कैंसर-विशिष्ट मृत्यु (जैसे, हृदय संबंधी घटनाओं और अन्य असंबंधित कारणों) से अलग करने में विफल रहता है, इस प्रकारप्रतिस्पर्धी जोखिमों को अनदेखा करता है। इन स्थितियों में,प्रतिस्पर्धी जोखिम मॉडल को प्रतिस्पर्धी जोखिमों के विचार के साथ जीवित रहने की स्थिति की भविष्यवाणी के लिए प्राथमिकता दी जाती है। कॉक्स आनुपातिक जोखिम मॉडल के निर्माण और सत्यापन की पद्धति अच्छी तरह से स्थापित है, जबकि प्रतिस्पर्धी जोखिम मॉडल के सत्यापन के बारे में कुछ रिपोर्टें हैं।

हमारे पिछले अध्ययन में, एक विशिष्ट प्रतिस्पर्धी जोखिम नोमोग्राम, एक नोमोग्राम और प्रतिस्पर्धी जोखिम मॉडल का एक संयोजन, और एक प्रतिस्पर्धी जोखिम मॉडल के आधार पर एक जोखिम स्कोरअनुमान स्थापित किया गया था। इस अध्ययन का उद्देश्य स्थापित प्रतिस्पर्धी जोखिम नोमोग्राम के मूल्यांकन और सत्यापन के विभिन्न तरीकों को प्रस्तुत करना है, जो चिकित्सकों के लिए प्रतिस्पर्धी जोखिमों के विचार के साथ पूर्वानुमान की भविष्यवाणी करने के लिए एक उपयोगी उपकरण के रूप में काम करना चाहिए।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

निगरानी, महामारी विज्ञान और अंतिम परिणाम (एसईईआर) डेटाबेस एक ओपन-एक्सेस कैंसर डेटाबेस है जिसमें केवल अज्ञात रोगी डेटा (एसईईआर आईडी: 12296-नवंबर 2018) शामिल है। इसलिए, इस अध्ययन को संबद्ध जिन्हुआ अस्पताल, झेजियांग यूनिवर्सिटी स्कूल ऑफ मेडिसिन के समीक्षा बोर्ड की मंजूरी से छूट दी गई थी।

1. डेटा तैयारी और आर पैकेज की तैयारी

  1. डेटा तैयार करें और आयात करें.
    > डेटासेट <- पढ़ें.csv (".../स्तन कैंसर डेटा.xlsx") #Import डेटा
    नोट: डेटा पूरक फ़ाइल 1 में अपलोड किए गए हैं।
  2. R पैकेज स्थापित करें और लोड करें।
    > पैकेज <- सी ("आरएमएस", "सीएमपीआरसके", "एमस्टेट", "सर्वाइवल", "रिस्करिग्रेशन",
    प्रोडलिम")
    > req.pcg <- फ़ंक्शन (PCG){
    नई <- पीसीजी[!) pcg %in% स्थापित.पैकेज()[, "पैकेज"]]
    यदि (लंबाई (नया)) स्थापित करें.पैकेज (नया, निर्भरता= T)
    sapply(pcg, आवश्यकता, ch = T)
    }
    > req.pcg (पैकेज)

    नोट: पैकेज RMS, cmprsk, mstate, उत्तरजीविता, जोखिम प्रतिगमन और प्रोडलिम (http://www.r-projectrg/) का उपयोग कर के R सॉफ़्टवेयर (संस्करण 3.6.2) पर आधारित निम्न कार्यविधियाँ निष्पादित करें।

2. दो अलग-अलग तरीकों में प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित करें

  1. एक प्रत्यक्ष विधि में प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित करें।
    > mod_cph <- सीपीएच (सर्वाइवल महीनें, स्थिति) ~ फैक्टर 1 + फैक्टर 2 +...,
    x=T, y=T, surv=T, data=डेटासेट)
    > नोम <- नोमोग्राम (mod_cph, मज़ा = सूची (फ़ंक्शन(x) 1-surv_cph(36, x)...),
    funlabel=c("3-वर्षीय इवेंट1 Prob। ...), एलपी = एफ)
    एक उदाहरण के रूप में 36 वें महीने #Take।
    > mod_crr <- सीआरआर (उत्तरजीविता माह, स्थिति, फेलकोड = 1, cov1 = cov)
    > स्कोर <- लॉग (log((1-real.3y),(1-cif.min36)))/(maxbeta/100)
    > प्लॉट (nom)
  2. एक भारित विधि में प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित करें।
    > df.w <-crprep ("उत्तरजीविता के महीने", fstatus",
    डेटा = डेटासेट, ट्रांस = सी (1,2), सेन्स = 0,
    Keep = c("कारक 1"," कारक 2"...))
    > mod.w <- cph(Surv(Tstart, Tstop, status==1) ~ factor1+factor2+...,
    डेटा = df.w, वजन = weight.cens, उपसमुच्चय = फेलकोड == 1, surv = T)
    > nom.w <- nomogram (mod.w...)

3. प्रतिस्पर्धी जोखिम नोमोग्राम की भेदभाव क्षमता

  1. भेदभाव के लिए सी-इंडेक्स
    1. मैट्रिक्स कोव को प्रतिस्पर्धी जोखिम मॉडल mod_crr में फिट करें और एक अनुमानित मैट्रिक्स एसयूवी प्राप्त करें।
      > एसयूवी <- predict.crr(mod_crr, cov)
    2. एसयूवी से एक निश्चित महीने में संचयी घटनाओं को प्राप्त करें और फ़ंक्शन rcorr.cens के साथ C-इंडेक्स की गणना करें।
      > CIF36 <- एसयूवी [जो (suv[,1]==36),][-1]
      > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonths,Dataset$Tumordeath))
      > इंडेक्स <- आरकोर[1]
  2. भेदभाव के लिए AUC
    1. फ़ंक्शन स्कोर (रिस्करिग्रेशन पैकेज) का उपयोग करके प्रतिस्पर्धी जोखिम मॉडल के पूर्वानुमानित प्रदर्शन को स्कोर करें
      > fgr.w <- FGR (Hist(उत्तरजीविता माह, fstatus) ~ factor1+ factor2+..., डेटा = डेटासेट, कारण =1)
      > स्कोर <- स्कोर (सूची("फाइन-ग्रे" = fgr.w),
    2. "स्कोर" से एयूसी निकालें।
      > स्कोर $AUC

4. प्रतिस्पर्धी जोखिम मॉडल की अंशांकन क्षमता

  1. प्रतिस्पर्धी जोखिम मॉडल के 95% आत्मविश्वास अंतराल के साथ अंशांकन वक्र।
    1. एक निश्चित विफलता समय में प्रत्येक व्यक्ति की संचयी घटनाओं के साथ एक डेटा फ्रेम प्राप्त करें।
      > cif36 <- data.frame(cif36) एक उदाहरण के रूप में 36 वें महीने #Take।
      > कोनेम (cif36.36_o)<-सी ("36 मीटर")
    2. अनुमानित संचयी घटनाओं के अनुसार कोहोर्ट को पांच उपसमूहों में विभाजित करें और प्रत्येक उपसमूह की औसत अनुमानित संचयी घटनाओं की गणना करें।
      > समूह 36 <-कटौती (cif36$'36m',
      मात्रा (cif36$'36m', seq(0, 1, 0.2)),
      शामिल हैं .निम्नतम = सत्य, लेबल = 1:5)
      > मतलब 36 <- as.वेक्टर (by(cif36 $'36m', समूह 36, माध्य))
    3. देखे गए संचयी घटनाओं की गणना करें, अर्थात, वास्तविक संचयी घटनाएं, फ़ंक्शन क्यूमिंक का उपयोग करके, और फिर एक निश्चित विफलता समय में 95% आत्मविश्वास अंतराल के साथ देखी गई संचयी घटनाओं को प्राप्त करें।
      > cum36 <- cuminc(Dataset$Survivalmonths,Dataset$fstatus,group36)
      > obs36 <- timepoints (cum36, डेटासेट $Survivalmonths)$est[c(1:5),36]
      > obs36var <- timepoints (cum36,डेटासेट $Survivalmonths)$var[c(1:5),36]
      > df <- data.frame(mean36, obs36, obs36var)
    4. एक्स-अक्ष के रूप में अनुमानित संचयी घटनाओं के साथ अंशांकन वक्र को प्लॉट करें और फ़ंक्शन जीजीप्लॉट का उपयोग करके वाई-अक्ष के रूप में देखी गई संचयी घटनाओं को प्लॉट करें।
      > ggplot(df)+ geom_point(aes(x=mean36,y=obs36),col="red")+
      geom_point(aes(x=मीन36,y=obs36),col="red",pch=4)+
      geom_line(col="red",aes(x=mean36,y=obs36))+
      geom_errorbar(col="red",aes(x=mean36,y=obs36+1.96
      *sqrt(obs36var)),
      ymin = obs36-1.96*sqrt(obs36var), ymax = obs36+1.96
      *sqrt(obs36var))
      geom_abline(lty =3,lwd=2,col=c(rgb(0,118,192,
      अधिकतम ColorValue = 255)))
  2. प्रतिस्पर्धी जोखिम मॉडल के जोखिम स्कोर के साथ अंशांकन वक्र
    1. सभी चर के प्रत्येक स्तर का मूल्यांकन करें और कुल आरएस प्राप्त करें।
      > डेटासेट$factor1[डेटासेट$factor1==1] <- factor1.scale["Factor1_level1"]
      >
      ... उदाहरण #For, डेटासेट $हिस्टोलॉजी [डेटासेट$हिस्टोलॉजी==1]<-हिस्टोलॉजी.स्केल["हिस्टोलॉजी1"]
      > Dataset$rs <- Dataset$factor1+Dataset$factor2+Dataset$factor3+...
      नोट: प्रत्येक चर के बिंदुओं को सारांशित करके प्रत्येक रोगी के लिए कुल आरएस प्राप्त करें।
    2. आवृत्तियों की गणना करें और विभिन्न कुल जोखिम स्कोर की देखी गई संचयी घटनाओं की गणना करें।
      > rs.freq <- as.data.frame(table(Dataset$rs))
      > obs.36 <- वेक्टर (मोड = "न्यूमेरिक", लंबाई = nrow (rs.freq))
      के लिए > (i in 1: nrow(rs.freq)) {
      डेटासेट <- उप-समूह (डेटासेट,डेटासेट$rs== rs.freq [i,1])
      cif.dataset <- cuminc(dataset$Survivalmonths,dataset$death3)
      cif36.dataset <- timepoints (cif.dataset,36)
      obs.36[i] <- cif36.dataset$est[1]}
    3. एक्स-अक्ष की सीमा निर्धारित करें और कुल जोखिम स्कोर की अनुमानित संचयी घटनाओं की गणना करें।
      > RS <- रेंज (nom$कुल.अंक)
      > x.36 <- seq (min(RS), अधिकतम (RS), 0.01)
      > पूर्व.36 <- 1-(1-cif.min36)^exp(x.36*maxbeta/100)
    4. जोखिम स्कोर के साथ अंशांकन वक्र को प्लॉट करें।
      > प्लॉट (x.36, पूर्व.36, प्रकार ='l'...)
      > par(नया = TRUE)
      > प्लॉट (जैसा कि वेक्टर (rs.freq[,1]), obs.36...)

5. प्रतिस्पर्धी जोखिम मॉडल का निर्णय वक्र विश्लेषण

  1. निर्णय वक्र विश्लेषण करने के लिए एसटीडीसीए फ़ंक्शन को स्रोत करें।
    > स्रोत ("एसटीडीसीए। R")
  2. जीवित रहने की संभावना की गणना करने के लिए नोमोग्राम से बहुपद समीकरण निकालें।
    > nomogramEx(nomo = nom)
    > डेटासेट$भविष्यवाणियां <- A * (डेटासेट $rs ^3) + B * (डेटासेट $rs ^2) + C * डेटासेट $rs + D
    #predictors स्थापित नोमोग्राम द्वारा गणना की गई कैंसर-विशिष्ट मृत्यु की अनुमानित संभावनाएं हैं।
  3. निर्णय वक्र विश्लेषण करें।
    > stdca(डेटा = डेटासेट, परिणाम = "स्थिति", tresult= "उत्तरजीविता माह", समयबिंदु = 36,
    भविष्यवक्ता = "भविष्यवाणियां", cmprsk = सत्य, चिकनी = गलत, संभावना = गलत)

    नोट: प्रतिस्पर्धी जोखिम की उपस्थिति में परिणाम का मूल्यांकन करने के लिए, ट्रू को सीएमपीआरके के लिए चुना जाना चाहिए।

6. बूटस्ट्रैप विधि का उपयोग कर आंतरिक सत्यापन

  1. बूटस्ट्रैप विधि का उपयोग करके औसत अनुमानित संचयी घटनाओं को प्राप्त करें।
    1. बूटस्ट्रैप डेटासेट (Dataset_in) उत्पन्न करने के लिए प्रतिस्थापन के साथ मूल डेटासेट (डेटासेट) को पुन: नमूना करें। बूटस्ट्रैप डेटासेट के साथ एक प्रतिस्पर्धी जोखिम मॉडल (mod.in_crr) स्थापित करें। mod.in_crr की भविष्यवाणी करने के लिए फ़ंक्शन predict.crr का उपयोग करें और suvall.in उत्पन्न करने के लिए b बार लूप करें।
      B= b
      suvall.in <- सूची()
      (j in 1:B){
      Dataset_in <- Dataset[sample(c(1:nrow(Dataset)),nrow(Dataset),
      प्रतिस्थापन = सत्य),]
      संलग्न करें (Dataset_ में)
      कोव। < में- मॉडल.मैट्रिक्स (~ कारक 1 + कारक 2 + ...) [,-1]
      मॉड। _crr <- सीआरआर (उत्तरजीविता माह, स्थिति, फेलकोड = 1, cov1 = cov.in)
      अलग करें (डेटासेट. इनर)
      एसयूवी। < में- predict.crr (_crr में, cov)
      suvall.in[जे]] <- suv.in}
    2. एक निश्चित महीने में औसत अनुमानित संचयी घटनाओं को प्राप्त करें।
      cif36all. आंतरिक <- वेक्टर (मोड = "सांख्यिक", लंबाई = nrow (डेटासेट))
      (k in 1:B) {
      cif36all. इनर<- सीआईएफ 36 ऑल। आंतरिक + सुवाल। आंतरिक [[k]][जो (सुवाल आंतरिक[[k]][,1]==36]][-1]
      }
      cif36.in <- cif36all.in/B
  2. फ़ंक्शन rcorr.cens के साथ आंतरिक क्रॉस-सत्यापन का उपयोग करके C-इंडेक्स की गणना करें।
    आर.आर.आर. आंतरिक <- rcorr.cens (1-cif36.in,Surv(डेटासेट$उत्तरजीविता महीने, डेटासेट $ट्यूमरडेथ))
    cindex. आंतरिक <- आरकोर। आंतरिक[1]
  3. क्रॉस आंतरिक सत्यापन का उपयोग करके कैलिब्रेट करें।
    नोट: आंतरिक सत्यापन के साथ प्रतिस्पर्धी जोखिम मॉडल के अंशांकन वक्र के कोड अनुभाग 4 में कोड के समान हैं, जबकि एसयूवी को suv.in द्वारा प्रतिस्थापित किया गया था।

7. प्रतिस्पर्धी जोखिम मॉडल का बाहरी सत्यापन

  1. बाहरी डेटा का उपयोग करके अनुमानित संचयी घटनाएं प्राप्त करें। बाह्य डेटा चर (cov.ex) के मैट्रिक्स के साथ अनुमानित संचयी घटनाओं को प्राप्त करें।
    suv.ex <- predict.crr(mod_crr,cov.ex)
    cif36.ex <- suv.ex [जो (suv.ex $time=="36"),][-1]
  2. बाहरी सत्यापन का उपयोग करC-अनुक्रमणिका की गणना करें।
    rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonths,Dataset.ex$Tumordeath))
    cindex.ex <- rcorr.ex[1]
  3. बाहरी सत्यापन का उपयोग करके कैलिब्रेट करें।
    नोट: आंतरिक सत्यापन के साथ प्रतिस्पर्धी जोखिम मॉडल के अंशांकन वक्र के कोड अनुभाग 4 में कोड के समान हैं, जबकि एसयूवी को suv.ex द्वारा प्रतिस्थापित किया गया है।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

इस अध्ययन में, स्तन कैंसर के रोगियों के डेटा को एसईईआर डेटाबेस से पुनर्प्राप्त किया गया था और उदाहरण डेटा के रूप में कार्य किया गया था। एसईईआर डेटाबेस संयुक्त राज्य अमेरिका की आबादी के लगभग 34.6% का प्रतिनिधित्व करने वाले कैंसर पर डेटा प्रदान करता है, और डेटाबेस तक पहुंचने की अनुमति प्राप्त की गई थी (संदर्भ संख्या 12296-नवंबर 2018)।

दो नोमोग्राम (चित्रा 1), दोनों हिस्टोलॉजिकल प्रकार, विभेदित ग्रेड, टी स्टेज और एन स्टेज सहित, क्रमशः प्रत्यक्ष विधि और भारित विधि का उपयोग करके स्थापित किए गए थे। चर के प्रत्येक स्तर के अंक और कुल बिंदुओं के अनुरूप संभावनाएं लगभग समान थीं, जबकि कुछ मामूली अंतर देखे गए थे। झांग एट अल ने एक प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित करने के लिए एक "भारित" दृष्टिकोण पेश किया, जिसने पहले मूल डेटा को भारित डेटा (फ़ंक्शन सीआरप्रेप का उपयोग करके) में बदल दिया, फिर भारित डेटा (फ़ंक्शन कॉक्सफ का उपयोग करके) के साथ कॉक्स रिग्रेशन मॉडल का निर्माण किया, और अंत में कॉक्स रिग्रेशन मॉडल (फ़ंक्शन नोमोग्राम का उपयोग करके) के साथ एक प्रतिस्पर्धी जोखिम नोमोग्राम स्थापित किया।. इसके विपरीत, इस अध्ययन में "प्रत्यक्ष" दृष्टिकोण "भारित" से पूरी तरह से अलग है। संक्षेप में, प्रतिस्पर्धी जोखिम मॉडल (फ़ंक्शन सीआरआर का उपयोग करके) से उत्पन्न मापदंडों ने कॉक्स रिग्रेशन मॉडल (फ़ंक्शन कॉक्सफ का उपयोग करके) में मापदंडों को बदल दिया, जिसका उपयोग अंततः प्रतिस्पर्धी जोखिम नोमोग्राम (फ़ंक्शन नोमोग्राम का उपयोग करके) को स्थापित करने के लिए किया गया था। "भारित" विधि और "प्रत्यक्ष" विधि द्वारा स्थापित नोमोग्राम की तुलना में, दो नोमोग्राम सामान्य रूप से समान थे, जबकि कुछ मामूली अंतर देखे जा सकते थे। अध्ययन में "प्रत्यक्ष" विधि अधिक सटीक है क्योंकि यह सीधे नोमोग्राम के निर्माण के लिए पैरामीटर प्राप्त करता है (खंड 2 में सूत्र "स्कोर = लॉग (लॉग ((1-real.3y),(1-cif.min36)))/(maxbeta/100)" के साथ)।

rcor.cens (X, Surv) में, X किसी भी समय संचयी घटनाओं के साथ एक संख्यात्मक भविष्यवक्ता है, और Surv एक उत्तरजीविता वस्तु है जिसमें जीवित रहने के महीने और स्थिति होती है। जब सुर्व प्रतिस्पर्धी घटनाओं का अनुभव करने वाले रोगियों को सेंसर के रूप में परिभाषित करता है और फिर एक जीवन तालिका उत्पन्न करता है, तो अमूल्य आदेशित जोड़ी समान होती है। सत्यापन के बिना प्रतिस्पर्धी जोखिम मॉडल का सी-इंडेक्स 0.7978 (95% सीआई = 0.7650-0.8305) था, यह दर्शाता है कि इस मॉडल में मध्यम भेदभाव क्षमता थी। बूटस्ट्रैप विश्लेषण को 500 बार दोहराया गया था, और सी-इंडेक्स की गणना के लिए एकल अनुमान का उत्पादन करने के लिए 500 परिणामों का औसत निकाला गया था। आंतरिक सत्यापन में सी-इंडेक्स 0.7978 (95% सीआई = 0.7651-0.8305) था, जो मूल डेटासेट में सी-इंडेक्स के समान था। एक बाहरी डेटासेट प्रतिस्पर्धी जोखिम मॉडल में फिट किया गया था, और बाहरी सत्यापन में सी-इंडेक्स 0.5071 (95% सीआई = 0.4637-0.5505) था। प्रतिस्पर्धी जोखिम मॉडल के एयूसी की गणना अध्ययन में मूल डेटासेट से की गई थी। 36 वें महीने का एयूसी 0.8461 (95% सीआई = 0.8232-0.8691) था, जो मॉडल की भेदभाव क्षमता का प्रदर्शन करता है।

जैसा कि चित्र 2 ए में दिखाया गया है, अंशांकन वक्र पर बिंदु तुल्यता रेखा के करीब थे, और देखी गई आवृत्ति का 95% सीआई प्रत्येक समूह में तुल्यता रेखा में गिर गया, जो मॉडल की सटीक अंशांकन क्षमता को दर्शाता है। आंतरिक और बाहरी सत्यापन का उपयोग करके अंशांकन वक्र क्रमशः चित्रा 2 बी और चित्रा 2 सी में दिखाए गए हैं, यह दर्शाता है कि निर्मित मॉडल में आंतरिक सत्यापन में अच्छी अंशांकन क्षमता थी लेकिन बाहरी सत्यापन में खराब थी।

जैसा कि पूरक चित्र 1 में दिखाया गया है, अनुमानित संचयी घटनाओं का प्रतिनिधित्व करने वाली रेखा के चारों ओर वितरित संचयी घटनाओं का प्रतिनिधित्व करने वाले बिंदु, और देखे गए और अनुमानित घटनाओं के बीच कोई महत्वपूर्ण अंतर नहीं देखा गया। निर्णय वक्र विश्लेषण के परिणाम चित्रा 3 में दिखाए गए हैं, जो बढ़ती थ्रेशोल्ड संभावना के साथ शुद्ध लाभ में परिवर्तन प्रस्तुत करता है।

Figure 1
चित्रा 1: दो तरीकों के साथ प्रतिस्पर्धी जोखिम नोमोग्राम की स्थापना। () प्रत्यक्ष विधि का उपयोग करके नोमोग्राम स्थापित किया गया। (बी) भारित विधि का उपयोग करके स्थापित नोमोग्राम। हिस्टोलॉजी: 1, इनवेसिव डक्टल कार्सिनोमा; 2, आक्रामक लोब्यूलर कार्सिनोमा; 3, इनवेसिव डक्टल कार्सिनोमा + इनवेसिव लोब्यूलर कार्सिनोमा। ग्रेड: 1, अच्छी तरह से विभेदित; 2, मामूली रूप से विभेदित; 3, खराब विभेदित। टी स्टेज: 1, टी 1 स्टेज; 2, टी 2 चरण; 3, टी 3 चरण; 4, टी 4 चरण। एन स्टेज: 0, एन 0 स्टेज; 1, एन 1 चरण; 2, एन 2 चरण; 3, एन 3 चरण। संक्षिप्त नाम: सीएसडी = कैंसर-विशिष्ट मृत्यु। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 2
चित्र 2: प्रतिस्पर्धी जोखिम नोमोग्राम के अंशांकन वक्र। () स्थापित प्रतिस्पर्धी जोखिम मॉडल के आत्मविश्वास अंतराल के साथ अंशांकन वक्र। (बी) आंतरिक सत्यापन में प्रतिस्पर्धी जोखिम मॉडल का अंशांकन वक्र। (सी) बाहरी सत्यापन में प्रतिस्पर्धी जोखिम मॉडल का अंशांकन वक्र। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 3
चित्रा 3: प्रतिस्पर्धी जोखिम नोमोग्राम का निर्णय वक्र विश्लेषण। शुद्ध लाभ को थ्रेशोल्ड संभावना के खिलाफ प्लॉट किया गया है। "सभी" रेखा उन सभी रोगियों पर विचार करके शुद्ध लाभ दिखाती है जो कैंसर-विशिष्ट मृत्यु का सामना करते हैं, और "कोई नहीं" रेखा उन सभी रोगियों पर विचार करके शुद्ध लाभ है जो कैंसर-विशिष्ट मृत्यु से पीड़ित नहीं थे। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

पूरक फ़ाइल 1: स्तन कैंसर डेटा। शीर्षक परिभाषा: ग्रेडमॉडिफाई, विभेदित ग्रेड; हिस्टोलॉजी, हिस्टोलॉजिकल प्रकार; स्टेज टी, ट्यूमर टी स्टेज; स्टेज एन, ट्यूमर एन स्टेज; उत्तरजीविता के महीने, किसी भी कारण या सेंसर के कारण उपचार की तारीख से मृत्यु की तारीख तक का समय; मृत्यु, मृत्यु (कैंसर-विशिष्ट मृत्यु और गैर-कैंसर-विशिष्ट मृत्यु सहित) या सेंसर; मृत्यु 3, कैंसर-विशिष्ट मृत्यु, गैर-कैंसर-विशिष्ट मृत्यु, या सेंसर। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

पूरक चित्रा 1: स्थापित प्रतिस्पर्धी जोखिम मॉडल के जोखिम स्कोर के साथ अंशांकन वक्र। देखी गई संचयी घटनाओं का प्रतिनिधित्व करने वाले बिंदुओं को अनुमानित संचयी घटनाओं का प्रतिनिधित्व करने वाली रेखा के चारों ओर वितरित किया गया था। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

इस अध्ययन ने दो अलग-अलग तरीकों से स्थापित प्रतिस्पर्धी जोखिम नोमोग्राम की तुलना की और स्थापित नोमोग्राम का मूल्यांकन और सत्यापन किया। विशेष रूप से, इस अध्ययन ने प्रत्यक्ष विधि के आधार पर नोमोग्राम स्थापित करने के साथ-साथ सी-इंडेक्स की गणना करने और अंशांकन वक्रों को प्लॉट करने के लिए एक चरण-दर-चरण ट्यूटोरियल प्रदान किया।

आर सॉफ्टवेयर में आरएमएस पैकेज व्यापक रूप से कॉक्स आनुपातिक जोखिम मॉडल के निर्माण और मूल्यांकन के लिए उपयोग किया जाता है, लेकिन यह प्रतिस्पर्धी जोखिम मॉडल के लिए लागू नहीं है। कई परिणामों वाले मॉडल ों के लिए, झांग एट अल ने आर सॉफ्टवेयर में रिस्करिग्रेशन पैकेज का उपयोग करके प्रतिस्पर्धी जोखिम मॉडल के सत्यापन की सूचना दी, जो भेदभाव क्षमता का मूल्यांकन करने के लिए एयूसी और ब्रीर स्कोर की गणना करता है और अंशांकन क्षमता 9,10 को मान्य करने के लिए अंशांकन वक्रों को प्लॉट करता है।

हालांकि, रिस्करिग्रेशन पैकेज में कुछ कमियां हैं, जैसे कि सी-इंडेक्स की गणना करने में विफलता। सी-इंडेक्स सभी अमूल्य ऑर्डर किए गए जोड़े (सी-इंडेक्स = अमूल्य ऑर्डर किए गए जोड़े / सभी अमूल्य ऑर्डर किए गए जोड़े) 3,11 में संगत अमूल्य ऑर्डर किए गए जोड़े का अनुपात है। पारंपरिक दो-स्थिति परिणाम उत्तरजीविता विश्लेषण में, केवल ऐसे जोड़े जिनमें दो रोगी दोनों मृत्यु का सामना करते हैं (डीआई = 1, डीजे = 1) या जिस रोगी को मृत्यु का सामना करना पड़ता है, उसके पास विफल होने वाले रोगी की तुलना में कम जीवित रहने के महीने होते हैं, जो एक मूल्यवान आदेशित जोड़ी बन सकते हैं (डीआई = 1, डीजे = 0, टी < टीजे) (आई = रोगी आई, जे = रोगी जे, टी = समय, डी = स्थिति, 1 = मृत्यु, 0 = विफलता)। प्रतिस्पर्धी जोखिमों के संदर्भ में, प्रतिस्पर्धी जोखिम से विफल होने वाले रोगी अभी भी जोखिम सेट में बने रहते हैं क्योंकि यह केवल यह अनुमान लगा सकता है कि प्रतिस्पर्धी घटनाओं का सामना करने वाले रोगियों के पास देखे जाने की तुलना में लंबे समय तक जीवित रहने के महीने हैं। इसके अतिरिक्त, केवल ऐसे जोड़े जिनमें दो रोगी दोनों मृत्यु का सामना करते हैं (Di = 1, Dj = 1) या जो रोगी मृत्यु से पीड़ित है, उसके पास असफल होने वाले रोगी की तुलना में कम जीवित रहने के महीने होते हैं या प्रतिस्पर्धी घटना का अनुभव करते हैं, एक अमूल्य क्रमित जोड़ी बन सकते हैं (Di = 1, Dj = 0|2, Ti < Tj) (i = रोगी i, j = रोगी j, T = समय, डी = स्थिति, 2 = प्रतिस्पर्धी घटना, 1 = मृत्यु, 0 = विफलता)। इसलिए, इस अध्ययन ने सी-इंडेक्स की गणना करने के लिए फ़ंक्शन rcorr.cens का उपयोग किया।

प्रतिस्पर्धी जोखिम मॉडल के आंतरिक सत्यापन में, इस अध्ययन ने बूटस्ट्रैप विधि को लागू किया और निर्मित मॉडल12 के अच्छे प्रदर्शन का प्रदर्शन किया। प्रशिक्षण और परीक्षण डेटासेट में एक यादृच्छिक विभाजन समस्याग्रस्त हो सकता है क्योंकि परीक्षण डेटासेट13 की भविष्यवाणी करने के लिए विशेष रूप से आसान (या कठिन) होने की संभावना है। के-फोल्ड विधि का उपयोग क्रॉस-सत्यापन के लिए भी किया जा सकता है, जबकि इसे मॉडल सत्यापन 5,14 में कम बार लागू किया गया है। इस अध्ययन ने प्रतिस्पर्धी जोखिम मॉडल का बाहरी सत्यापन भी किया, लेकिन यह बाहरी संदर्भ में अच्छा प्रदर्शन नहीं किया। यह इस तथ्य के लिए विशेषता हो सकती है कि बाहरी सत्यापन के लिए उपयोग किया जाने वाला हमारा डेटा मूल डेटा का केवल एक नमूना था।

हालांकि, इस अध्ययन में कई सीमाएं हैं। सबसे पहले, हमारी पद्धति आर सॉफ्टवेयर पर आधारित है; इसलिए, उपयोगकर्ताओं को एक निश्चित प्रोग्रामिंग ज्ञान की आवश्यकता होती है, जो इसके लक्षित दर्शकों को सीमित कर सकता है। इसके अलावा, कोड की सैकड़ों लाइनें हैं, और कुछ कोड को विभिन्न डेटा के लिए परिवर्तन की आवश्यकता होती है; हम भविष्य के शोध में "ऑल-इन-वन" आर पैकेज विकसित करने की उम्मीद करते हैं जिसे सभी प्रकार के डेटा पर लागू किया जा सकता है। इस अध्ययन में बाहरी सत्यापन करने के लिए अन्य स्तन कैंसर डेटा नहीं है और मूल डेटा से पुन: नमूना लेने के अलावा कोई विकल्प नहीं था, लेकिन बाहरी सत्यापन के लिए तरीके और कोड समान हैं। सबसे महत्वपूर्ण बात, अध्ययन में ग्रहण किए गए कॉवरिएट्स और परिणाम के बीच रैखिकता वास्तविक दुनिया के अध्ययन में सच नहीं हो सकती है, और बातचीत और गैर-रैखिकता पर विचार किया जाना चाहिए, जिसके लिए पहनावामॉडलिंग सहायक हो सकती है।

अंत में, इस अध्ययन ने प्रतिस्पर्धी जोखिम नोमोग्राम को "प्रत्यक्ष" विधि में स्थापित किया और मूल, आंतरिक और बाहरी डेटासेट में इसके भेदभाव और अंशांकन क्षमताओं का मूल्यांकन किया। यह आशा की जाती है कि प्रतिस्पर्धी जोखिम नोमोग्राम आर में जोखिम प्रतिगमन पैकेज के पूरक के रूप में काम करेगा और नैदानिक प्रतिस्पर्धी जोखिम घटनाओं को संभालने में सहायता प्रदान करेगा।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखक ों ने घोषणा की कि उनके पास कोई प्रतिस्पर्धी हित नहीं हैं।

Acknowledgments

अध्ययन को झेजियांग प्रांत के चिकित्सा विज्ञान और प्रौद्योगिकी योजना परियोजना (अनुदान संख्या 2013केवाईए 212), झेजियांग प्रांत प्राकृतिक विज्ञान फाउंडेशन (अनुदान संख्या Y19H160126) के सामान्य कार्यक्रम और जिन्हुआ नगर विज्ञान और प्रौद्योगिकी ब्यूरो के प्रमुख कार्यक्रम (अनुदान संख्या 2016-3-005, 2018-3-001 डी, और 2019-3-013) से अनुदान द्वारा समर्थित किया गया था।

Materials

Name Company Catalog Number Comments
R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

DOWNLOAD MATERIALS LIST

References

  1. Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Tags

कैंसर अनुसंधान अंक 187 प्रतिस्पर्धी जोखिम मॉडल नोमोग्राम भेदभाव अंशांकन मॉडल सत्यापन
प्रतिस्पर्धी जोखिम मॉडल का एक आर-आधारित लैंडस्केप सत्यापन
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lin, H., Zheng, H., Ge, C., Ling,More

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter