Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Ландшафтная валидация модели конкурирующего риска на основе R

Published: September 16, 2022 doi: 10.3791/64018
* These authors contributed equally

Summary

В настоящем протоколе описываются коды в R для оценки различающих и калибровочных способностей конкурирующей модели риска, а также коды для ее внутренней и внешней проверки.

Abstract

Модель пропорционального риска Кокса широко применяется для анализа выживаемости в клинических условиях, но она не способна справиться с множественными исходами выживаемости. В отличие от традиционной модели пропорциональной опасности Кокса, конкурирующие модели риска учитывают наличие конкурирующих событий и их комбинацию с номограммой, графическим вычислительным устройством, которое является полезным инструментом для клиницистов для проведения точного прогностического прогнозирования. В этом исследовании мы сообщаем о методе установления номограммы конкурирующего риска, то есть оценки его способности к дискриминации (т. е. индексу соответствия и площади под кривой) и калибровочной (т. е. калибровочные кривые), а также чистой выгоды (т. е. анализ кривой принятия решений). Кроме того, была выполнена внутренняя валидация с использованием начальной выборки исходного набора данных и внешняя валидация с использованием внешнего набора данных установленной номограммы конкурирующего риска, чтобы продемонстрировать его экстраполяционную способность. Номограмма конкурирующего риска должна служить полезным инструментом для клиницистов для прогнозирования прогноза с учетом конкурирующих рисков.

Introduction

В последние годы с развитием прецизионной медицины были выявлены новые прогностические факторы, и прогностические модели, сочетающие молекулярные и клинико-патологические факторы, привлекают все большее внимание в клинических условиях. Однако неграфические модели, такие как модель пропорциональной опасности Кокса, с результатами значений коэффициентов, трудно понятьклиницистам 1. Для сравнения, номограмма — это инструмент визуализации регрессионных моделей (включая регрессионную модель Кокса, конкурирующую модель риска и т. д.), двумерную диаграмму, предназначенную для приближенного графического вычисления математической функции2. Это позволяет оценивать различные уровни переменных в клинической модели и рассчитывать оценки риска (RS) для прогнозирования прогноза.

Оценка модели имеет важное значение при построении модели, и для оценки обычно принимаются две характеристики: дискриминация и калибровка. В клинических моделях дискриминация относится к способности модели отделять людей, у которых развиваются события, от тех, у кого их нет, таких как пациенты, которые умирают, и те, кто остается в живых, и индекс соответствия (C-индекс) или площадь под кривой рабочих характеристик приемника (AUC) обычно используются для его характеристики 3,4. Калибровка — это процесс сравнения предсказанных вероятностей модели с фактическими вероятностями, и для его представления широко используются калибровочные кривые. Кроме того, валидация модели (внутренняя и внешняя валидация) является важным этапом в построении модели, и только проверенные модели могут быть дополнительно экстраполированы5.

Модель пропорциональной опасности Кокса — это регрессионная модель, используемая в медицинских исследованиях для изучения связей между прогностическими факторами и статусом выживаемости. Однако модель пропорционального риска Кокса учитывает только два статуса исхода [Y (0, 1)], в то время как испытуемые часто сталкиваются с более чем двумя статусами, и возникают конкурирующие риски [Y (0, 1, 2)]1. Общая выживаемость (ОВ), которая определяется как время от даты происхождения (например, лечения) до даты смерти по любой причине, является наиболее важной конечной точкой в анализе выживаемости. Тем не менее, ОВ не может дифференцировать смерть, специфичную для рака, от смерти, не связанной с раком (например, сердечно-сосудистые события и другие несвязанные причины), тем самым игнорируя конкурирующие риски6. В этих ситуациях модель конкурирующего риска является предпочтительной для прогнозирования состояния выживания с учетом конкурирующих рисков7. Методология построения и проверки моделей пропорциональной опасности Кокса хорошо зарекомендовала себя, в то время как было мало сообщений о проверке конкурирующих моделей риска.

В нашем предыдущем исследовании была установлена специфическая номограмма конкурирующего риска, комбинация номограммы и модели конкурирующего риска, а также оценка оценки риска на основе модели конкурирующего риска8. Это исследование направлено на то, чтобы представить различные методы оценки и валидации установленной номограммы конкурирующего риска, которые должны служить полезным инструментом для клиницистов для прогнозирования прогноза с учетом конкурирующих рисков.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

База данных эпиднадзора, эпидемиологии и конечных результатов (SEER) представляет собой базу данных о раке с открытым доступом, которая содержит только обезличенные данные пациентов (SEER ID: 12296-Nov2018). Таким образом, это исследование было освобождено от одобрения наблюдательного совета аффилированной больницы Цзиньхуа Медицинской школы Чжэцзянского университета.

1. Подготовка данных и подготовка пакетов R

  1. Подготовьте и импортируйте данные.
    > Набор данных <- чтение.csv(".../Данные о раке молочной железы.xlsx") #Import данные.
    ПРИМЕЧАНИЕ: Данные загружены в дополнительный файл 1.
  2. Установите и загрузите пакеты R.
    > пакеты <- c("rms","cmprsk","mstate","survival","riskRegression","
    продлим»)
    > req.pcg <- function(pcg){
    Новый <- PCG[!( pcg %in% installed.packages()[, "Package"])]
    if (length(new)) install.packages(new, dependencies = T)
    sapply(pcg, требовать, ch = T)
    }
    > req.pcg(пакеты)

    ПРИМЕЧАНИЕ: Выполните следующие процедуры на основе программного обеспечения R (версия 3.6.2), используя пакеты rms, cmprsk, mstate, survival, riskRegression и prodlim (http://www.r-projectrg/).

2. Установите конкурирующие номограммы риска двумя различными методами

  1. Установите номограмму конкурирующего риска прямым методом.
    > mod_cph <- cph(Surv(Месяцы выживания, статус) ~ фактор1+ фактор2+...,
    x=T, y=T, surv=T, data=Dataset)
    > nom <- номограмма(mod_cph, fun=list(function(x) 1-surv_cph(36, x)...),
    funlabel=c("3-year event1 Prob." ...), lp=F)
    #Take 36-й месяц в качестве примера.
    > mod_crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov)
    > оценка <- log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)
    > сюжет(ном)
  2. Установите номограмму конкурирующего риска взвешенным методом.
    > df.w <- crprep("Survivalmonths"," fstatus",
    data=Набор данных, trans=c(1,2), cens=0,
    keep=c("factor1",factor2"...))
    > mod.w <- cph(Surv(Tstart, Tstop, status==1) ~ factor1+factor2+...,
    data=df.w, weight=weight.cens, subset=failcode==1, surv=T)
    > nom.w <- номограмма (mod.w...)

3. Дискриминационная способность номограммы конкурирующего риска

  1. С-индекс дискриминации
    1. Вписать матричный cov в конкурирующую модель риска mod_crr. и получить прогнозируемый матричный внедорожник.
      > внедорожник <- predict.crr(mod_crr, cov)
    2. Получите кумулятивные случаи за определенный месяц из внедорожника и рассчитайте C-индекс с помощью функции rcorr.cens.
      > CIF36 <- SUV[which(suv[,1]==36),][-1]
      > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
      > cindex <- rcorr[1]
  2. AUC за дискриминацию
    1. Оцените прогностическую эффективность конкурирующей модели риска с помощью функции Score (пакет riskRegression).
      > fgr.w <- FGR(Hist(Survivalmonths, fstatus) ~ factor1+ factor2+..., data=Dataset, cause=1)
      > оценка <- Score(list("Fine-Gray" = fgr.w),
    2. Извлеките AUC из «партитуры».
      > оценка$AUC

4. Калибровочная способность конкурирующих моделей риска

  1. Калибровочные кривые с 95% доверительным интервалом конкурирующей модели риска
    1. Получите кадр данных с совокупными случаями каждого человека за определенное время отказа.
      > CIF36 <- data.frame(cif36) #Take 36-м месяце в качестве примера.
      > colnames(cif36.36_o)<-c("36m")
    2. Разделите когорту в соответствии с предполагаемой кумулятивной заболеваемостью на пять подгрупп и рассчитайте среднее прогнозируемое кумулятивное число случаев каждой подгруппы.
      > group36 <- cut(CIF36$'36m',
      quantile(CIF36$'36M', seq(0, 1, 0.2)),
      include.low = ИСТИНА, метки = 1:5)
      > mean36 <- as.vector(by(cif36 $'36m', group36, mean))
    3. Рассчитайте наблюдаемые кумулятивные случаи, то есть фактические кумулятивные случаи, используя функцию cuminc, а затем получите наблюдаемые кумулятивные случаи с 95% доверительным интервалом в определенное время отказа.
      > cum36 <- cuminc(Dataset$Survivalmonths,Dataset$fstatus,group36)
      > obs36 <- timepoints(cum36,Dataset$Survivalmonths)$est[c(1:5),36]
      > obs36var <- timepoints(cum36,Dataset$Survivalmonths)$var[c(1:5),36]
      > df <- data.frame(mean36; obs36; obs36var)
    4. Построите калибровочную кривую с прогнозируемыми кумулятивными случаями в качестве оси x и наблюдаемыми кумулятивными случаями в качестве оси Y, используя функцию ggplot.
      > ggplot(df)+ geom_point(aes(x=mean36,y=obs36),col="red")+
      geom_point(aes(x=mean36,y=obs36),col="red",pch=4)+
      geom_line(col="red",aes(x=mean36,y=obs36))+
      geom_errorbar(col="red",aes(x=mean36,y=obs36+1.96
      *sqrt(obs36var)),
      ymin = obs36-1,96 * sqrt (obs36var), ymax = obs36 + 1,96
      *sqrt(obs36var))
      geom_abline(lty=3,lwd=2,col=c(rgb(0,118,192;
      maxColorValue=255)))
  2. Калибровочная кривая с оценками риска конкурирующей модели риска
    1. Оцените каждый уровень всех переменных и получите общий RS.
      > Dataset$factor1[Dataset$factor1==1] <- factor1.scale["Factor1_level1"]
      >
      ... #For примере, Dataset$histology[Dataset$histology==1]<-histology.scale["Histology1"]
      > Dataset$rs <- Dataset$factor1+Dataset$factor2+Dataset$factor3+...
      ПРИМЕЧАНИЕ: Получите общий RS для каждого пациента, суммируя баллы каждой переменной.
    2. Подсчитайте частоты и рассчитайте наблюдаемые кумулятивные случаи различных общих оценок риска.
      > rs.freq <- as.data.frame(table(Dataset$rs))
      > obs.36 <- vector(mode="numeric", length=nrow(rs.freq))
      > for (i in 1: nrow(rs.freq)) {
      набор данных <- подмножество(Dataset,Dataset$rs== rs.freq [i,1])
      cif.dataset <- cuminc(dataset$Survivalmonths,dataset$death3)
      CIF36.DataSet <- TimePoints(CIF.Dataset,36)
      obs.36[i] <- cif36.dataset$est[1]}
    3. Установите диапазон оси X и рассчитайте прогнозируемую кумулятивную частоту общих оценок риска.
      > RS <- диапазон(nom$total.points)
      > x.36 <- seq(min(RS),max(RS),0.01)
      > pre.36 <- 1-(1-cif.min36)^exp(x.36*maxbeta/100)
    4. Постройте калибровочную кривую с оценками риска.
      > plot(x.36, pre.36, type='l'...)
      > par(new=TRUE)
      > plot(as.vector(rs.freq[,1]), obs.36... )

5. Анализ кривой принятия решений конкурирующих моделей риска

  1. Источник функции stdca для выполнения анализа кривой принятия решений.
    > source("stdca. R")
  2. Извлеките полиномиальные уравнения из номограммы, чтобы вычислить вероятность выживания.
    > номограммаEx(nomo = nom)
    > Набор данных$предикторы <- A * (Dataset$rs ^3) + B * (Dataset$rs ^2) + C * Dataset$rs + D #predictors -
    прогнозируемые вероятности смерти от рака, рассчитанные по установленной номограмме
  3. Выполните анализ кривой принятия решений.
    > stdca(data = Dataset, result = "status", ttresult = "Survivalmonths", timepoint = 36,
    предикторы = "предикторы", cmprsk = ИСТИНА, гладкий = ЛОЖЬ, вероятность = ЛОЖЬ)

    ПРИМЕЧАНИЕ: Для оценки результата при наличии конкурирующего риска для cmprsk следует выбирать TRUE.

6. Внутренняя проверка с использованием метода bootstrap

  1. Получите среднее прогнозируемое кумулятивное число случаев с помощью метода начальной загрузки.
    1. Выполните интерполяцию исходного набора данных (Dataset) с помощью replace для создания набора данных начальной загрузки (Dataset_in). Создайте конкурирующую модель риска (mod.in_crr) с помощью набора данных начальной загрузки. Используйте функцию predict.crr для прогнозирования mod.in_crr и цикла b раз для генерации suvall.in.
      B=b
      suvall.in <- list()
      for(j in 1:B){
      Dataset_in <- Dataset[sample(c(1:nrow(Dataset)),nrow(Dataset),
      replace = TRUE),]
      Прикрепить(Dataset_ дюйма)
      cov. в <- model.matrix(~factor1+ factor2+...) [,-1]
      модуль. в _crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov.in)
      detach(Dataset. inner)
      Внедорожник. в <- predict.crr(мод. в _crr, cov)
      suvall.in[[j]] <- suv.in}
    2. Получите среднее прогнозируемое кумулятивное число случаев за определенный месяц.
      CIF36All. внутренний <- vector(mode="numeric", length=nrow(Dataset))
      for (k in 1:B) {
      CIF36All. внутренний<- cif36all. Внутренний+ Сувалл. inner[[k]][which(suvall. inner[[k]][,1]==36),][-1]
      }
      cif36.in <- cif36all.in/B
  2. Вычислите C-индекс с помощью внутренней перекрестной проверки с помощью функции rcorr.cens.
    РКОРР. внутренний <- rcorr.cens(1-cif36.in,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
    cindex. Внутренний <- rcorr. внутренний[1]
  3. Калибровка с помощью перекрестной внутренней проверки.
    ПРИМЕЧАНИЕ: Коды калибровочной кривой конкурирующей модели риска с внутренней валидацией аналогичны кодам в разделе 4, в то время как внедорожник был заменен на suv.in.

7. Внешняя валидация конкурирующей модели риска

  1. Получите прогнозируемую кумулятивную заболеваемость, используя внешние данные. Получите прогнозируемые кумулятивные случаи с матрицей переменных внешних данных (cov.ex).
    suv.ex <- predict.crr(mod_crr,cov.ex)
    cif36.ex <- suv.ex [which(suv.ex $time=="36"),][-1]
  2. Рассчитайте C-индекс с помощью внешней проверки.
    rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonths,Dataset.ex$tumordeath))
    cindex.ex <- rcorr.ex[1]
  3. Калибровка с помощью внешней проверки.
    ПРИМЕЧАНИЕ: Коды калибровочной кривой конкурирующей модели риска с внутренней валидацией аналогичны кодам в разделе 4, в то время как suv заменен на suv.ex.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

В этом исследовании данные пациентов с раком молочной железы были извлечены из базы данных SEER и послужили примерными данными. База данных SEER предоставляет данные о раке, представляющем около 34,6% населения Соединенных Штатов, и было получено разрешение на доступ к базе данных (ссылочный номер 12296-ноябрь 2018 года).

Две номограммы (рис. 1), включающие гистологический тип, дифференцированную степень, стадию Т и стадию N, были установлены с использованием прямого метода и взвешенного метода, соответственно. Точки каждого уровня переменных и вероятности, соответствующие общему количеству баллов, были почти одинаковыми, в то время как наблюдались некоторые небольшие различия. Zhang et al. ввели «взвешенный» подход к созданию конкурирующей номограммы риска, который сначала преобразовал исходные данные в взвешенные данные (с использованием функции crprep), затем построил регрессионную модель Кокса со взвешенными данными (с использованием функции coxph) и, наконец, установил конкурирующую номограмму риска с регрессионной моделью Кокса (с использованием номограммы функции)9. Напротив, «прямой» подход в этом исследовании полностью отличается от «взвешенного». Короче говоря, параметры, сгенерированные из конкурирующей модели риска (с использованием функции crr), заменили параметры в регрессионной модели Кокса (с использованием функции coxph), которая в конечном итоге была использована для установления конкурирующей номограммы риска (с использованием номограммы функции). При сопоставлении номограмм, установленных «взвешенным» методом и «прямым» методом, обе номограммы в целом были схожими, хотя наблюдались некоторые незначительные различия. «Прямой» метод в исследовании является более точным, поскольку он получает параметры для построения номограммы непосредственно (с формулой «score=log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)» в разделе 2).

В rcorr.cens(X, Surv) X является числовым предиктором с кумулятивными случаями в любой момент времени, а Surv является объектом выживания, содержащим месяцы выживания и статус. Когда Surv определяет пациентов, переживающих конкурирующие события, как подвергнутых цензуре, а затем генерирует таблицу жизни, оцениваемая упорядоченная пара идентична. C-индекс конкурирующей модели риска без валидации составил 0,7978 (95% ДИ = 0,7650-0,8305), что указывает на то, что эта модель обладает умеренной способностью к дискриминации. Анализ начальной загрузки был повторен 500 раз, а затем 500 результатов были усреднены, чтобы получить единую оценку для расчета C-индекса. C-индекс во внутренней проверке составил 0,7978 (95% ДИ = 0,7651-0,8305), что было аналогично C-индексу в исходном наборе данных. Внешний набор данных был встроен в конкурирующую модель риска, и C-индекс во внешней проверке составил 0,5071 (95% ДИ = 0,4637-0,5505). AUC конкурирующей модели риска была рассчитана на основе исходного набора данных в исследовании. AUC на 36-м месяце составил 0,8461 (95% ДИ = 0,8232-0,8691), демонстрируя дискриминирующую способность модели.

Как показано на рисунке 2А, точки на калибровочной кривой были близки к линии эквивалентности, и 95% ДИ наблюдаемой частоты попадали в линию эквивалентности в каждой группе, что указывает на точную калибровочную способность модели. Калибровочные кривые с использованием внутренней и внешней валидации показаны на рисунках 2B и 2C соответственно, что указывает на то, что построенная модель имела хорошую калибровочную способность при внутренней валидации, но плохую при внешней валидации.

Как показано на дополнительном рисунке 1, точки, представляющие наблюдаемую кумулятивную заболеваемость, распределены вокруг линии, представляющей прогнозируемую кумулятивную заболеваемость, и никаких существенных различий между наблюдаемой и прогнозируемой заболеваемостью не наблюдалось. Результаты анализа кривой принятия решений представлены на рисунке 3, где представлены изменения чистой выгоды с возрастающей пороговой вероятностью.

Figure 1
Рисунок 1: Установление конкурирующей номограммы риска двумя методами . (А) Номограмма, установленная прямым методом. (B) Номограмма, установленная с использованием взвешенного метода. Гистология: 1, инвазивная протоковая карцинома; 2, инвазивная лобулярная карцинома; 3, инвазивная протоковая карцинома + инвазивная лобулярная карцинома. Класс: 1, хорошо дифференцированный; 2, умеренно дифференцированные; 3, слабо дифференцированный. Стадия Т: 1, стадия Т1; 2, стадия Т2; 3, стадия Т3; 4, стадия Т4. Стадия N: 0, стадия N0; 1, N1 ступень; 2, N2 ступень; 3, N3 этап. Аббревиатура: CSD = смерть от рака. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Калибровочные кривые номограммы конкурирующего риска. (А) Калибровочная кривая с доверительным интервалом установленной модели конкурирующего риска. (B) Калибровочная кривая конкурирующей модели риска во внутренней валидации. (C) Калибровочная кривая конкурирующей модели риска во внешней валидации. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 3
Рисунок 3: Анализ кривой принятия решений номограммы конкурирующего риска. Чистая выгода строится в зависимости от пороговой вероятности. Строка «все» показывает чистую выгоду, учитывая всех пациентов, которые перенесли смерть от рака, а строка «нет» - это чистая выгода, учитывая всех пациентов, которые не страдали от смерти от рака. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Дополнительный файл 1: Данные о раке молочной железы. Определение названия: grademodifi, дифференцированный сорт; гистология, гистологический тип; стадия Т, стадия опухоли Т; стадия N, стадия опухоли N; Месяцы выживания, время с даты лечения до даты смерти по какой-либо причине или цензору; смерть, смерть (включая смерть, специфичную для рака, и смерть, не специфичную для рака) или цензор; смерть3, смерть от рака, смерть, не связанная с раком, или цензор. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок 1: Калибровочная кривая с оценками риска установленной конкурирующей модели риска. Точки, представляющие наблюдаемые кумулятивные случаи, были распределены вокруг линии, представляющей прогнозируемую кумулятивную заболеваемость. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

В этом исследовании сравнивали конкурирующие номограммы риска, установленные двумя различными методами, и проводили оценку и валидацию установленных номограмм. В частности, это исследование предоставило пошаговое руководство по установлению номограммы на основе прямого метода, а также расчету C-индекса и построению калибровочных кривых.

Среднеквадратичный пакет в программном обеспечении R широко используется для построения и оценки моделей пропорциональной опасности Кокса, но он неприменим для конкурирующих моделей риска. Для моделей с несколькими исходами Zhang et al. сообщили о валидации конкурирующих моделей риска с использованием пакета riskRegression в программном обеспечении R, который вычисляет оценку AUC и Brier для оценки способности к дискриминации и строит калибровочные кривые для проверки калибровочной способности 9,10.

Однако пакет riskRegression имеет некоторые недостатки, такие как невозможность расчета C-индекса. C-индекс — это доля согласованных оцениваемых упорядоченных пар во всех оцениваемых упорядоченных парах (C-индекс = конкордантные оцениваемые упорядоченные пары/все оцениваемые упорядоченные пары)3,11. В традиционном анализе выживаемости с двумя статусными исходами только пары, в которых оба пациента страдают от смерти (Di = 1, Dj = 1) или пациент, перенесший смерть, имеют более короткие месяцы выживаемости, чем пациент, который терпит неудачу, могут стать оцениваемой упорядоченной парой (Di = 1, Dj = 0, Ti < Tj) (i = пациент i, j = пациент j, T = время, D = статус, 1 = смерть, 0 = неудача). В контексте конкурирующих рисков пациенты, которые терпят неудачу из-за конкурирующего риска, по-прежнему остаются в наборе риска, потому что можно только сделать вывод, что пациенты, испытывающие конкурирующие события, имеют более длительные месяцы выживания, чем наблюдалось. Кроме того, только пары, в которых оба пациента страдают от смерти (Di = 1, Dj = 1) или пациент, который страдает от смерти, имеет более короткие месяцы выживания, чем пациент, который терпит неудачу или испытывает конкурирующее событие, могут стать оцениваемой упорядоченной парой (Di = 1, Dj = 0|2, Ti < Tj) (i = пациенты i, j = пациент j, T = время, D = статус, 2 = конкурирующее событие, 1 = смерть, 0 = неудача). Поэтому в этом исследовании использовалась функция rcorr.cens для расчета C-индекса.

При внутренней валидации конкурирующей модели риска в этом исследовании был применен метод начальной загрузки и продемонстрирована хорошая производительность построенной модели12. Рандомизированное разделение на обучающие и тестовые наборы данных может быть проблематичным, поскольку тестовый набор данных, вероятно, будет особенно легко (или трудно) предсказать13. Метод K-fold также может быть использован для перекрестной проверки, в то время как при валидациимодели 5,14 он применяется реже. В этом исследовании также была проведена внешняя проверка модели конкурирующего риска, но она не показала хороших результатов во внешнем контексте. Это может быть связано с тем, что наши данные, использованные для внешней проверки, были просто повторной выборкой исходных данных.

Однако в этом исследовании есть несколько ограничений. Во-первых, наша методология основана на программном обеспечении R; Поэтому пользователям нужны определенные знания в области программирования, что может ограничить их целевую аудиторию. Кроме того, существуют сотни строк кода, и некоторые коды нуждаются в изменениях для разных данных; мы надеемся разработать пакет R «все в одном» в будущих исследованиях, который можно будет применять ко всем видам данных. В этом исследовании нет других данных о раке молочной железы для проведения внешней валидации, и у него не было другого выбора, кроме как перебрать исходные данные, но методы и коды для внешней валидации те же. Самое главное, что линейность между ковариатами и исходом, предполагаемым в исследовании, может не соответствовать действительности в реальном исследовании, и следует учитывать взаимодействие и нелинейность, для которых может быть полезно ансамблевое моделирование15.

В заключение, это исследование установило конкурирующую номограмму риска «прямым» методом и оценило ее способности к различению и калибровке в исходных, внутренних и внешних наборах данных. Есть надежда, что номограмма конкурирующего риска послужит дополнением к пакету riskRegression в R и окажет помощь в обработке клинических конкурирующих событий риска.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторы заявляют, что у них нет конкурирующих интересов.

Acknowledgments

Исследование было поддержано грантами Проекта плана медицинской науки и технологий провинции Чжэцзян (номера грантов 2013KYA212), общей программы Фонда естественных наук провинции Чжэцзян (грант No Y19H160126) и ключевой программы Муниципального научно-технического бюро Цзиньхуа (номера грантов 2016-3-005, 2018-3-001d и 2019-3-013).

Materials

Name Company Catalog Number Comments
R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

DOWNLOAD MATERIALS LIST

References

  1. Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Tags

Исследование рака выпуск 187 Конкурирующая модель риска номограмма дискриминация калибровка валидация модели
Ландшафтная валидация модели конкурирующего риска на основе R
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lin, H., Zheng, H., Ge, C., Ling,More

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter