Cancer Research

التحقق من صحة المناظر الطبيعية القائمة على R لنموذج مخاطر منافس

Published: September 16, 2022 doi: 10.3791/64018

Haiping Lin*^1,3, Hongjuan Zheng*², Chenyang Ge³, Lixian Ling², Ruihua Yin², Qinghua Wang², Xia Zhang², Shishi Zhou², Xiayun Jin², Xifeng Xu², Jianfei Fu²

¹Department of Hepatobiliary Surgery, Affiliated Jinhua Hospital, Zhejiang University School of Medicine, ²Department of Medical Oncology, Affiliated Jinhua Hospital, Zhejiang University School of Medicine, ³Department of Colorectal Surgery, Affiliated Jinhua Hospital, Zhejiang University School of Medicine

* These authors contributed equally

Summary

يصف هذا البروتوكول الرموز في R لتقييم قدرات التمييز والمعايرة لنموذج مخاطر منافس ، بالإضافة إلى رموز للتحقق الداخلي والخارجي منه.

Abstract

يتم تطبيق نموذج كوكس للمخاطر النسبية على نطاق واسع لتحليلات البقاء على قيد الحياة في البيئات السريرية ، لكنه غير قادر على التعامل مع نتائج البقاء المتعددة. تختلف نماذج المخاطر المتنافسة عن نموذج كوكس التقليدي للمخاطر النسبية ، حيث تأخذ في الاعتبار وجود أحداث متنافسة ودمجها مع رسم بياني ، وهو جهاز حساب رسومي ، وهو أداة مفيدة للأطباء لإجراء تنبؤ تنبؤي دقيق. في هذه الدراسة ، نبلغ عن طريقة لإنشاء مخطط المخاطر المتنافسة ، أي تقييم تمييزها (أي مؤشر التوافق والمنطقة تحت المنحنى) وقدرات المعايرة (أي منحنيات المعايرة) ، بالإضافة إلى الفائدة الصافية (أي تحليل منحنى القرار). وبالإضافة إلى ذلك، أجري أيضا التحقق الداخلي باستخدام إعادة تشكيل مجموعة البيانات الأصلية والتحقق الخارجي باستخدام مجموعة بيانات خارجية لمخطط المخاطر المتنافسة المنشأة لإثبات قدرته على الاستقراء. يجب أن يكون مخطط المخاطر المتنافسة بمثابة أداة مفيدة للأطباء للتنبؤ بالتشخيص مع مراعاة المخاطر المتنافسة.

Introduction

في السنوات الأخيرة ، تم تحديد العوامل النذير الناشئة مع تطور الطب الدقيق ، وتجذب النماذج النذير التي تجمع بين العوامل الجزيئية والسريرية المرضية اهتماما متزايدا في البيئات السريرية. ومع ذلك ، فإن النماذج غير الرسومية ، مثل نموذج كوكس للمخاطر النسبية ، مع نتائج قيم المعامل ، يصعب على الأطباء فهمها¹. وبالمقارنة ، فإن الرسم البياني هو أداة تصور لنماذج الانحدار (بما في ذلك نموذج الانحدار كوكس ، ونموذج المخاطر المتنافسة ، وما إلى ذلك) ، وهو مخطط ثنائي الأبعاد مصمم للحساب الرسومي التقريبي لدالة رياضية². إنه يتيح تقييم مستويات مختلفة من المتغيرات في نموذج سريري وحساب درجات المخاطر (RS) للتنبؤ بالتشخيص.

تقييم النموذج ضروري في بناء النموذج ، وهناك خاصيتان مقبولتان بشكل عام للتقييم: التمييز والمعايرة. في النماذج السريرية ، يشير التمييز إلى قدرة النموذج على فصل الأفراد الذين يصابون بأحداث عن أولئك الذين لا يصابون بها ، مثل المرضى الذين يموتون مقابل أولئك الذين يبقون على قيد الحياة ، وعادة ما يستخدم مؤشر التوافق (C-index) أو المنطقة الواقعة تحت منحنى خصائص تشغيل المتلقي (AUC) لتوصيفه ^3,4. المعايرة هي عملية مقارنة الاحتمالات المتوقعة لنموذج ما بالاحتمالات الفعلية ، وقد استخدمت منحنيات المعايرة على نطاق واسع لتمثيلها. بالإضافة إلى ذلك ، يعد التحقق من صحة النموذج (التحقق الداخلي والخارجي) خطوة مهمة في بناء النموذج ، ويمكن فقط استقراء النماذج التي تم التحقق من صحتها⁵.

نموذج كوكس للمخاطر النسبية هو نموذج انحدار يستخدم في البحوث الطبية للتحقيق في الارتباطات بين العوامل النذير وحالة البقاء على قيد الحياة. ومع ذلك ، فإن نموذج كوكس للمخاطر النسبية يأخذ في الاعتبار حالتين فقط من النتائج [Y (0 ، 1)] ، بينما غالبا ما تواجه موضوعات الدراسة أكثر من حالتين ، وتنشأ مخاطر متنافسة [Y (0 ، 1 ، 2)]¹. البقاء على قيد الحياة بشكل عام (OS) ، والذي يتم تعريفه على أنه الوقت من تاريخ المنشأ (على سبيل المثال ، العلاج) إلى تاريخ الوفاة لأي سبب ، هو أهم نقطة نهاية في تحليل البقاء على قيد الحياة. ومع ذلك ، فشل نظام التشغيل في التمييز بين الوفاة الخاصة بالسرطان والوفاة غير الخاصة بالسرطان (على سبيل المثال ، أحداث القلب والأوعية الدموية وغيرها من الأسباب غير ذات الصلة) ، وبالتالي تجاهل المخاطر المتنافسة⁶. في هذه الحالات ، يفضل نموذج المخاطر المتنافسة للتنبؤ بحالة البقاء مع مراعاة المخاطر المتنافسة⁷. إن منهجية بناء نماذج كوكس للمخاطر النسبية والتحقق من صحتها راسخة ، في حين كان هناك عدد قليل من التقارير المتعلقة بالتحقق من صحة نماذج المخاطر المتنافسة.

في دراستنا السابقة ، تم إنشاء رسم بياني محدد للمخاطر المتنافسة ، ومزيج من الرسم البياني ونموذج المخاطر المتنافسة ، وتقدير درجة المخاطر بناء على نموذج مخاطر منافس⁸. تهدف هذه الدراسة إلى تقديم طرق مختلفة لتقييم والتحقق من صحة مخطط المخاطر المتنافسة المعمول به ، والذي يجب أن يكون بمثابة أداة مفيدة للأطباء للتنبؤ بالتشخيص مع مراعاة المخاطر المتنافسة.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

قاعدة بيانات المراقبة وعلم الأوبئة والنتائج النهائية (SEER) هي قاعدة بيانات مفتوحة الوصول للسرطان تحتوي فقط على بيانات المريض مجهولة الهوية (معرف SEER: 12296-Nov2018). لذلك ، تم إعفاء هذه الدراسة من موافقة مجلس المراجعة لمستشفى جينهوا التابع ، كلية الطب بجامعة تشجيانغ.

1. إعداد البيانات وإعداد حزم R

إعداد واستيراد البيانات.
> مجموعة البيانات <- read.csv (".../بيانات سرطان الثدي.xlsx") #Import البيانات .
ملاحظة: يتم تحميل البيانات في الملف التكميلي 1.
قم بتثبيت وتحميل حزم R.
> الحزم <- ج ("RMS" ، "cmprsk" ، "mstate" ، "البقاء على قيد الحياة" ، "انحدار المخاطر" ،
برودليم")
> req.pcg <- وظيفة (pcg) {
جديد <- PCG[!( pcg٪ in٪ install.packages () [، "Package"])]
إذا (الطول (جديد)) install.packages (جديد ، التبعيات = T)
sapply (pcg ، تتطلب ، ch = T)
}
> req.pcg (حزم)
ملاحظة: قم بتنفيذ الإجراءات التالية استنادا إلى برنامج R (الإصدار 3.6.2) باستخدام الحزم rms و cmprsk و mstate و survival و riskression و prodlim (http://www.r-projectrg/).

2. إنشاء رسوم بيانية للمخاطر المتنافسة بطريقتين متميزتين

إنشاء رسم بياني للمخاطر المتنافسة بطريقة مباشرة.
> mod_cph <- CPH (Surv (أشهر البقاء ، الحالة) ~ factor1 + factor2 + ... ،
x = T ، y = T ، تصفح = T ، بيانات = مجموعة بيانات)
> الاسم <- nomogram (mod_cph ، fun = list (function (x) 1-surv_cph (36 ، x) ...) ،
funlabel = c ("حدث لمدة 3 سنوات 1 Prob." ...) ، lp = F) #Take الشهر 36 كمثال.
> mod_crr <- crr (أشهر البقاء على قيد الحياة ، fstatus ، رمز الفشل = 1 ، cov1 = cov)
> درجة <- سجل (log ((1-real.3y) ، (1-cif.min36))) / (maxbeta / 100)
> مؤامرة (اسم)
إنشاء مخطط المخاطر المتنافسة بطريقة مرجحة.
> df.w <- crprep ("Survivalmonths "،" fstatus" ،
البيانات = مجموعة البيانات ، عبر = c (1،2) ، cens = 0 ،
Keep = c ("factor1"،" factor2"...))
> mod.w <- cph (Surv (Tstart ، Tstop ، الحالة == 1) ~ factor1 + factor2 + ... ،
البيانات = df.w ، الوزن = weight.cens ، المجموعة الفرعية = رمز الفشل == 1 ، تصفح = T)
> nom.w <- رسم بياني (mod.w ...)

3. القدرة على التمييز في رسم المخاطر المتنافسة

جيم - مؤشر التمييز
1. قم بتركيب مصفوفة cov في نموذج المخاطر المتنافس mod_crr. واحصل على مصفوفة SUV متوقعة.
  > سيارات الدفع الرباعي <- predict.crr (mod_crr ، cov)
2. احصل على الحوادث التراكمية في شهر معين من سيارات الدفع الرباعي واحسب مؤشر C باستخدام الوظيفة rcorr.cens.
  > cif36 <- SUV [التي (SUV [، 1] == 36) ،] [-1]
  > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonth,Dataset$tumordeath))
  > سي إندكس <- RCORR[1]
AUC للتمييز
1. سجل الأداء التنبئي لنموذج المخاطر المنافس باستخدام الدالة Score (حزمة انحدار المخاطر).
  > fgr.w <- FGR (Hist (أشهر البقاء على قيد الحياة ، fstatus) ~ factor1 + factor2 + ... ، البيانات = مجموعة البيانات ، السبب = 1)
  > درجة <- النتيجة (قائمة ("غرامة رمادية" = fgr.w) ،
2. استخراج AUC من "النتيجة".
  > النتيجة$AUC

4. قدرة معايرة نماذج المخاطر المتنافسة

منحنيات المعايرة مع فاصل ثقة 95٪ لنموذج المخاطر المنافسة
1. احصل على إطار بيانات مع الحوادث التراكمية لكل فرد في وقت فشل معين.
  > cif36 <- data.frame (cif36) #Take الشهر 36 كمثال.
  > الأسماء (cif36.36_o) <-c ("36 م")
2. قسم المجموعة النموذجية وفقا للحوادث التراكمية المقدرة إلى خمس مجموعات فرعية واحسب متوسط الحوادث التراكمية المتوقعة لكل مجموعة فرعية.
  > المجموعة36 <- قطع (cif36 $ '36m' ،
  الكمية (cif36 $ '36m' ، التسلسل (0 ، 1 ، 0.2)) ،
  include.lower = TRUE ، التسميات = 1: 5)
  > يعني 36 <- as.vector (بواسطة (cif36 $ '36m' ، group36 ، يعني))
3. احسب الحوادث التراكمية المرصودة ، أي الحوادث التراكمية الفعلية ، باستخدام الدالة cuminc ، ثم احصل على الحوادث التراكمية المرصودة بفاصل ثقة 95٪ في وقت فشل معين.
  > cum36 <- cuminc (مجموعة البيانات $ Survivalmonths ، Dataset $ fstatus ، group36)
  > obs36 <- النقاط الزمنية (cum36 ، Dataset $ Survivalmonth) $est [c (1: 5) ، 36]
  > obs36var <- النقاط الزمنية (cum36 ، Dataset $ Survivalmonth) $var [c (1: 5) ، 36]
  > DF <- data.frame (يعني 36 ، obs36 ، obs36var)
4. ارسم منحنى المعايرة مع الحوادث التراكمية المتوقعة مثل المحور السيني والحوادث التراكمية المرصودة كمحور ص باستخدام الدالة ggplot.
  > ggplot(df)+ geom_point(aes(x=mean36,y=obs36),col="red")+
  geom_point(AES(x=mean36,y=obs36),col="red",pch=4)+
  geom_line(col="red"، AES(x=mean36,y=obs36))+
  geom_errorbar(col="red"، AES(x=mean36,y=obs36+1.96
  * مربع (obs36var)) ،
  YMin = OBS36-1.96 * مربع (OBS36var) ، YMAX = OBS36 + 1.96
  * مربع (obs36var))
  geom_abline(lty=3,lwd=2,col=c(rgb(0,118,192,
  maxColorValue = 255)))
منحنى المعايرة مع درجات المخاطر لنموذج المخاطر المتنافس
1. قيم كل مستوى من جميع المتغيرات واحصل على إجمالي RS.
  > مجموعة البيانات $factor1[Dataset$factor1==1] <- factor1.scale["Factor1_level1"]
  > ... #For سبيل المثال ، Dataset $ histology [Dataset $ histology == 1] <-histology.scale ["Histology1"]
  > مجموعة البيانات $ rs <- مجموعة البيانات $ factor1 + Dataset $ factor2 + Dataset $ factor3 + ...
  ملاحظة: احصل على إجمالي RS لكل مريض عن طريق جمع نقاط كل متغير.
2. عد الترددات واحسب الحوادث التراكمية المرصودة لدرجات المخاطر الإجمالية المختلفة.
  > rs.freq <- as.data.frame (الجدول (مجموعة البيانات $ rs))
  > obs.36 <- متجه (الوضع = "رقمي" ، الطول = nrow (rs.freq))
  > ل (i in 1: nrow(rs.freq)) {
  مجموعة البيانات <- مجموعة فرعية (مجموعة البيانات ، مجموعة البيانات $ rs == rs.freq [i ، 1])
  cif.dataset <- cuminc (مجموعة البيانات $ البقاء على قيد الحياة ، مجموعة البيانات $ الموت 3)
  CIF36.Dataset <- النقاط الزمنية (cif.dataset,36)
  obs.36[i] <- cif36.dataset$est[1]}
3. قم بتعيين نطاق المحور السيني وحساب الحوادث التراكمية المتوقعة لإجمالي درجات المخاطر.
  > RS <- النطاق (nom $ total.points)
  > x.36 <- التسلسل (الحد الأدنى (RS) ، الحد الأقصى (RS) ، 0.01)
  > pre.36 <- 1- (1-cif.min36) ^ exp (x.36 * maxbeta / 100)
4. ارسم منحنى المعايرة مع درجات المخاطر.
  > مؤامرة (x.36 ، pre.36 ، type = 'l'...)
  > الاسمية (جديد = صحيح)
  > مؤامرة (as.vector (rs.freq [، 1]) ، obs.36 ...)

5. تحليل منحنى القرار لنماذج المخاطر المتنافسة

مصدر دالة stdca لإجراء تحليل منحنى القرار.
> المصدر("stdca. R")
استخرج المعادلات كثيرة الحدود من الرسم البياني لحساب احتمال البقاء على قيد الحياة.
> نوموغرام إكس (نومو = اسم)
> مجموعة البيانات $ المتنبئون <- A * (مجموعة البيانات $ rs ^ 3) + B * (مجموعة البيانات $ rs ^ 2) + C * مجموعة البيانات $ rs + D #predictors هي احتمالات متوقعة للوفاة الخاصة بالسرطان محسوبة بواسطة الرسم البياني المحدد
إجراء تحليل منحنى القرار.
> stdca (البيانات = مجموعة البيانات ، النتيجة = "الحالة" ، ttresult = "Survivalmonth" ، النقطة الزمنية = 36 ،
المتنبئون = "المتنبئون" ، cmprsk = TRUE ، السلس = خطأ ، الاحتمال = خطأ)
ملاحظة: لتقييم نتيجة في وجود مخاطر منافسة ، يجب اختيار TRUE ل cmprsk.

6. التحقق الداخلي باستخدام طريقة التمهيد

احصل على متوسط الحوادث التراكمية المتوقعة باستخدام طريقة التمهيد.
1. أعد تشكيل مجموعة البيانات الأصلية (مجموعة البيانات) باستخدام استبدال لإنشاء مجموعة بيانات التمهيد (Dataset_in). إنشاء نموذج مخاطر منافس (mod.in_crr) مع مجموعة بيانات التمهيد. استخدم الدالة predict.crr للتنبؤ بأوقات mod.in_crr وتكرار b لإنشاء suvall.in.
  ب = ب
  suvall.in <- قائمة()
  ل(j في 1:B){
  Dataset_in <- مجموعة البيانات [عينة (ج (1: nrow (مجموعة البيانات)) ، nrow (مجموعة البيانات) ،
  استبدال = TRUE) ،]
  إرفاق (Dataset_ بوصة)
  كوف. في <- model.matrix (~ factor1+ factor2 + ...) [,-1]
  وزاره الدفاع. في _crr <- crr (البقاء على قيد الحياة ، fstatus ، رمز الفشل = 1 ، cov1 = cov.in)
  مفرزة (مجموعة البيانات. الداخلية)
  سيارات الدفع الرباعي. في <- predict.crr (وزارة الدفاع في _crr ، cov)
  suvall.in[[ي]] <- suv.in}
2. احصل على متوسط الحوادث التراكمية المتوقعة في شهر معين.
  CIF36ALL. < المتجه الداخلي (الوضع = "رقمي" ، الطول = nrow (مجموعة البيانات))
  ل (k في 1: B) {
  CIF36ALL. الداخلية <- CIF36ALL. الداخلية + سوفال. الداخلية[[k]][التي(suvall. الداخلية[[k]][,1]==36),][-1]
  }
  cif36.in <- cif36all.in/B
احسب مؤشر C باستخدام التحقق المتقاطع الداخلي باستخدام الدالة rcorr.cens.
ركور. الداخلية <- rcorr.cens(1-cif36.in,Surv(Dataset$Survivalmonth,Dataset$tumordeath))
جالفهرس. < الداخلية- ركور. داخلي[1]
قم بالمعايرة باستخدام التحقق الداخلي المتقاطع.
ملاحظة: تتشابه رموز منحنى المعايرة لنموذج المخاطر المتنافسة مع التحقق الداخلي مع الرموز الواردة في القسم 4 ، بينما تم استبدال سيارات الدفع الرباعي ب suv.in.

7. التحقق الخارجي من نموذج المخاطر المتنافسة

احصل على الحوادث التراكمية المتوقعة باستخدام البيانات الخارجية. احصل على الحوادث التراكمية المتوقعة باستخدام مصفوفة متغيرات البيانات الخارجية (cov.ex).
SUV.ex <- predict.crr (mod_crr,cov.ex)
cif36.ex <- suv.ex [الذي (suv.ex $time=="36"),][-1]
احسب مؤشر C باستخدام التحقق الخارجي.
rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonth,Dataset.ex$tumordeath))
cindex.ex <- rcorr.ex[1]
المعايرة باستخدام التحقق الخارجي.
ملاحظة: تتشابه رموز منحنى المعايرة لنموذج المخاطر المتنافس مع التحقق الداخلي مع الرموز الواردة في القسم 4 ، بينما يتم استبدال سيارات الدفع الرباعي ب suv.ex.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

في هذه الدراسة ، تم استرداد بيانات مرضى سرطان الثدي من قاعدة بيانات SEER وكانت بمثابة بيانات مثال. توفر قاعدة بيانات SEER بيانات عن السرطان تمثل حوالي 34.6٪ من سكان الولايات المتحدة ، وتم الحصول على إذن للوصول إلى قاعدة البيانات (الرقم المرجعي 12296-Nov2018).

تم إنشاء اثنين من الرسوم البيانية (الشكل 1) ، كلاهما بما في ذلك النوع النسيجي ، والدرجة المتباينة ، والمرحلة T ، والمرحلة N ، باستخدام الطريقة المباشرة والطريقة المرجحة ، على التوالي. كانت نقاط كل مستوى من المتغيرات والاحتمالات المقابلة لمجموع النقاط هي نفسها تقريبا ، في حين لوحظت بعض الاختلافات الطفيفة. قدم Zhang et al. نهجا "مرجحا" لإنشاء رسم بياني للمخاطر المتنافسة ، والذي حول البيانات الأصلية أولا إلى بيانات مرجحة (باستخدام وظيفة crprep) ، ثم أنشأ نموذج انحدار كوكس مع البيانات المرجحة (باستخدام وظيفة coxph) ، وأخيرا أنشأ مخططا للمخاطر المتنافسة مع نموذج انحدار كوكس (باستخدام رسم بياني للوظيفة)⁹. في المقابل ، يختلف النهج "المباشر" في هذه الدراسة تماما عن النهج "المرجح". باختصار ، حلت المعلمات الناتجة عن نموذج المخاطر المتنافس (باستخدام وظيفة crr) محل المعلمات في نموذج انحدار كوكس (باستخدام وظيفة coxph) ، والتي تم استخدامها أخيرا لإنشاء مخطط المخاطر المتنافس (باستخدام مخطط الدالة). وعند المقارنة بين المخططات التي وضعتها الطريقة "المرجحة" والطريقة "المباشرة"، كان الرمزان متشابهين بوجه عام، في حين يمكن ملاحظة بعض الاختلافات الطفيفة. الطريقة "المباشرة" في الدراسة أكثر دقة لأنها تحصل على المعلمات لبناء الرسم البياني مباشرة (مع الصيغة "score = log (log ((1-real.3y) ، (1-cif.min36))) / (maxbeta / 100)" في القسم 2).

في rcorr.cens (X ، Surv) ، X هو مؤشر رقمي مع حوادث تراكمية في أي نقطة زمنية ، و Surv هو كائن بقاء يحتوي على أشهر البقاء على قيد الحياة والحالة. عندما يعرف Surv المرضى الذين يعانون من أحداث متنافسة على أنهم خاضعون للرقابة ثم يولد جدول حياة ، يكون الزوج المرتب ذو القيمة متطابقا. كان مؤشر C لنموذج المخاطر المنافس دون التحقق من الصحة 0.7978 (95٪ CI = 0.7650-0.8305) ، مما يشير إلى أن هذا النموذج لديه قدرة تمييز معتدلة. تم تكرار تحليل Bootstrap 500 مرة ، ثم تم حساب متوسط نتائج 500 لإنتاج تقدير واحد لحساب مؤشر C. كان مؤشر C في التحقق الداخلي 0.7978 (95٪ CI = 0.7651-0.8305) ، والذي كان مشابها لمؤشر C في مجموعة البيانات الأصلية. تم تركيب مجموعة بيانات خارجية في نموذج المخاطر المتنافسة ، وكان مؤشر C في التحقق الخارجي 0.5071 (95٪ CI = 0.4637-0.5505). تم حساب AUC لنموذج المخاطر المتنافسة من مجموعة البيانات الأصلية في الدراسة. وبلغت قيمة ال 36 من الجامعة الأمريكية بالقاهرة 0.8461 (فاصل الثقة 95٪ = 0.8232-0.8691)، مما يدل على قدرة النموذج على التمييز.

كما هو موضح في الشكل 2 أ ، كانت النقاط على منحنى المعايرة قريبة من خط التكافؤ ، وسقط CI 95٪ للتردد المرصود في خط التكافؤ في كل مجموعة ، مما يشير إلى قدرة المعايرة الدقيقة للنموذج. تظهر منحنيات المعايرة باستخدام التحقق الداخلي والخارجي في الشكل 2B والشكل 2C ، على التوالي ، مما يشير إلى أن النموذج الذي تم إنشاؤه لديه قدرة معايرة جيدة في التحقق الداخلي ولكنه ضعيف في التحقق الخارجي.

كما هو موضح في الشكل التكميلي 1 ، تم توزيع النقاط التي تمثل الحوادث التراكمية المرصودة حول الخط الذي يمثل الحوادث التراكمية المتوقعة ، ولم تلاحظ فروق ذات دلالة إحصائية بين الحوادث المرصودة والمتوقعة. تظهر نتائج تحليل منحنى القرار في الشكل 3 ، والذي يعرض التغييرات في صافي الفائدة مع زيادة احتمال العتبة.

الشكل 1: إنشاء مخطط المخاطر المتنافسة بطريقتين . (أ) مخطط التسمية الذي تم إنشاؤه باستخدام الطريقة المباشرة. (ب) رسم بياني تم إنشاؤه باستخدام الطريقة المرجحة. علم الأنسجة: 1 ، سرطان الأقنية الغازية. 2 ، سرطان مفصص الغازية. 3 ، سرطان الأقنية الغازية + سرطان مفصص الغازية. الصف: 1 ، متباينة بشكل جيد ؛ 2 ، متباينة بشكل معتدل ؛ 3 ، متباينة بشكل سيء. المرحلة T: 1 ، مرحلة T1 ؛ 2 ، مرحلة T2 ؛ 3 ، مرحلة T3 ؛ 4 ، مرحلة T4. المرحلة N: 0 ، المرحلة N0 ؛ 1 ، المرحلة N1 ؛ 2 ، المرحلة N2 ؛ 3 ، مرحلة N3. اختصار: CSD = وفاة خاصة بالسرطان. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل 2: منحنيات معايرة مخطط المخاطر المتنافسة . (أ) منحنى المعايرة مع فاصل ثقة لنموذج المخاطر المنافسة المعمول به. (ب) منحنى معايرة نموذج المخاطر المتنافسة في التحقق الداخلي. (ج) منحنى معايرة نموذج المخاطر المتنافسة في التحقق الخارجي. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل 3: تحليل منحنى القرار لمخطط المخاطر المتنافسة. يتم رسم الفائدة الصافية مقابل احتمال العتبة. يظهر خط "الكل" الفائدة الصافية من خلال النظر في جميع المرضى الذين عانوا من وفاة محددة بسبب السرطان ، والخط "لا شيء" هو الفائدة الصافية من خلال النظر في جميع المرضى الذين لم يعانوا من وفاة محددة بسبب السرطان. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

الملف التكميلي 1: بيانات سرطان الثدي. تعريف العنوان: تعديل الدرجة ، الدرجة المتباينة ؛ علم الأنسجة ، النوع النسيجي. المرحلة T ، مرحلة الورم T. stageN ، مرحلة الورم N. البقاء على قيد الحياةأشهر ، الوقت من تاريخ العلاج إلى تاريخ الوفاة لأي سبب أو رقيب ؛ الوفاة أو الوفاة (بما في ذلك الوفاة الخاصة بالسرطان والوفاة غير الخاصة بالسرطان) أو الرقيب ؛ الوفاة3 أو الوفاة الخاصة بالسرطان أو الوفاة غير الخاصة بالسرطان أو الرقيب. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 1: منحنى المعايرة مع درجات المخاطر لنموذج المخاطر المنافس المعمول به. تم توزيع النقاط التي تمثل الحوادث التراكمية المرصودة حول الخط الذي يمثل الحوادث التراكمية المتوقعة. الرجاء الضغط هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

قارنت هذه الدراسة بين الرسوم البيانية المتنافسة للمخاطر التي تم إنشاؤها بطريقتين متميزتين وأجرت تقييما والتحقق من صحة المخططات المحددة. على وجه التحديد ، قدمت هذه الدراسة برنامجا تعليميا خطوة بخطوة لإنشاء مخطط بياني يعتمد على طريقة مباشرة ، بالإضافة إلى حساب مؤشر C ورسم منحنيات المعايرة.

تستخدم حزمة rms في برنامج R على نطاق واسع لبناء وتقييم نماذج Cox للمخاطر النسبية ، ولكنها لا تنطبق على نماذج المخاطر المنافسة. بالنسبة للنماذج ذات النتائج المتعددة ، أبلغ Zhang et al. عن التحقق من صحة نماذج المخاطر المتنافسة باستخدام حزمة انحدار المخاطر في برنامج R ، والتي تحسب درجة AUC و Brier لتقييم قدرة التمييز ورسم منحنيات المعايرة للتحقق من قدرة المعايرة ^9,10.

ومع ذلك ، فإن حزمة انحدار المخاطر بها بعض أوجه القصور ، مثل الفشل في حساب مؤشر C. مؤشر C هو نسبة الأزواج المرتبة ذات القيمة المتوافقة في جميع الأزواج المرتبة ذات القيمة العالية (C-Index = الأزواج المرتبة ذات القيمة المتوافقة / جميع الأزواج المرتبة ذات القيمة القيمة)^3,11. في تحليل البقاء على قيد الحياة التقليدي ذو الحالتين ، فقط الأزواج التي يعاني فيها المريضان من الموت (Di = 1 ، Dj = 1) أو المريض الذي يعاني من الموت لديه أشهر بقاء أقصر من المريض الذي يفشل يمكن أن يصبح زوجا مرتبا ذا قيمة (Di = 1 ، Dj = 0 ، Ti < Tj) (i = المريض i ، j = المريض j ، T = الوقت ، D = الحالة ، 1 = الوفاة ، 0 = الفشل). في سياق المخاطر المتنافسة ، لا يزال المرضى الذين يفشلون من المخاطر المتنافسة في مجموعة المخاطر لأنه لا يمكن إلا أن يستنتج أن المرضى الذين يعانون من أحداث متنافسة لديهم أشهر بقاء أطول مما هو ملاحظ. بالإضافة إلى ذلك ، فقط الأزواج التي يعاني فيها المريضان من الموت (Di = 1 ، Dj = 1) أو المريض الذي يعاني من الموت لديه أشهر بقاء أقصر من المريض الذي يفشل أو يواجه حدثا منافسا يمكن أن يصبح زوجا مرتبا ذا قيمة (Di = 1 ، Dj = 0|2 ، Ti < Tj) (i = المرضى i ، j = المريض j ، T = الوقت ، D = الحالة ، 2 = حدث منافس ، 1 = وفاة ، 0 = فشل). لذلك ، استخدمت هذه الدراسة الدالة rcorr.cens لحساب مؤشر C.

في التحقق الداخلي من نموذج المخاطر المتنافسة ، طبقت هذه الدراسة طريقة التمهيد وأظهرت الأداء الجيد للنموذج^{المبني 12}. قد يكون التقسيم العشوائي إلى مجموعات بيانات التدريب والاختبار مشكلة نظرا لأن مجموعة بيانات الاختبار من المحتمل أن تكون سهلة (أو صعبة) بشكل خاص للتنبؤ^{ب 13}. يمكن أيضا استخدام طريقة K-fold للتحقق من الصحة ، بينما تم تطبيقها بشكل أقل تكرارا في التحقق من صحة النموذج ^5,14. أجرت هذه الدراسة أيضا التحقق الخارجي من نموذج المخاطر المتنافسة ، لكنها لم تحقق أداء جيدا في السياق الخارجي. قد يعزى هذا إلى حقيقة أن بياناتنا المستخدمة للتحقق الخارجي كانت مجرد إعادة عينة من البيانات الأصلية.

ومع ذلك ، هناك العديد من القيود في هذه الدراسة. أولا ، تعتمد منهجيتنا على برنامج R. لذلك ، يحتاج المستخدمون إلى معرفة برمجة معينة ، مما قد يحد من جمهورها المستهدف. بالإضافة إلى ذلك ، هناك المئات من أسطر التعليمات البرمجية ، وبعض الرموز تحتاج إلى تغييرات لبيانات مختلفة ؛ نأمل في تطوير حزمة R "الكل في واحد" في الأبحاث المستقبلية التي يمكن تطبيقها على جميع أنواع البيانات. لا تحتوي هذه الدراسة على بيانات أخرى عن سرطان الثدي لإجراء تحقق خارجي ولم يكن لديها خيار سوى إعادة العينة من البيانات الأصلية ، ولكن طرق ورموز التحقق الخارجي هي نفسها. الأهم من ذلك ، أن الخطية بين المتغيرات المشتركة والنتيجة المفترضة في الدراسة قد لا تكون صحيحة في دراسة العالم الحقيقي ، ويجب النظر في التفاعل وعدم الخطية ، والتي قد تكون نمذجة المجموعة مفيدة^{لها 15}.

في الختام ، أنشأت هذه الدراسة مخطط المخاطر المتنافس بطريقة "مباشرة" وقيمت قدراتها على التمييز والمعايرة في مجموعات البيانات الأصلية والداخلية والخارجية. ومن المأمول أن يكون مخطط المخاطر المتنافسة بمثابة مكمل لحزمة انحدار المخاطر في R وتقديم المساعدة في التعامل مع أحداث المخاطر المتنافسة السريرية.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

يعلن أصحاب البلاغ أنه ليس لديهم مصالح متنافسة.

Acknowledgments

تم دعم الدراسة بمنح من مشروع خطة العلوم والتكنولوجيا الطبية لمقاطعة تشجيانغ (أرقام المنح 2013KYA212) ، والبرنامج العام لمؤسسة العلوم الطبيعية بمقاطعة تشجيانغ (رقم المنحة Y19H160126) ، والبرنامج الرئيسي لمكتب العلوم والتكنولوجيا لبلدية جينهوا (رقم المنحة 2016-3-005 و 2018-3-001d و 2019-3-013).

Materials

Name	Company	Catalog Number	Comments
R software	None	Not Applicable	Version 3.6.2 or higher
Computer system	Microsoft	Windows 10	Windows 10 or higher

DOWNLOAD MATERIALS LIST

References

Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Cancer Research

التحقق من صحة المناظر الطبيعية القائمة على R لنموذج مخاطر منافس

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.