Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

为生存数据建立竞争风险回归 Nomogram 模型

Published: October 23, 2020 doi: 10.3791/60684

Summary

此处介绍的是基于考克斯比例危险回归模型和竞争风险回归模型构建符号图的协议。竞争方法是在生存分析中存在竞争事件时应用的一种更为合理的方法。

Abstract

卡普兰-迈尔法和考克斯比例危害回归模型是生存框架中最常见的分析方法。这些相对容易应用和解释,可以直观地描绘。但是,当存在竞争事件(如心血管和脑血管事故、治疗相关死亡、交通事故)时,应谨慎应用标准生存方法,无法正确解释真实世界的数据。最好区分可能导致失败的不同类型的事件,并在分析中以不同的方式对待它们。在这里,方法侧重于使用竞争回归模型来识别存在竞争事件时的重大预后因素或风险因素。此外,还建立了基于比例危险回归模型和竞争回归模型的符号图,以帮助临床医生进行个别评估和风险分层,以解释有争议的因素对预后的影响。

Introduction

事件生存分析的时间在临床研究中很常见。生存数据测量从开始时间到发生感兴趣的事件的时间跨度,但感兴趣的事件的发生通常被另一个事件排除。如果存在多种类型的端点,则称为竞争风险终点。在这种情况下,标准危险分析(即 Cox 比例特定危险模型)通常不能很好地工作,因为经历另一种类型的事件的个人受到审查。经历过竞争事件的个人通常仍然处于风险集中,因为竞争风险通常不是独立的。因此,Fine 和Gray1 研究了竞争风险的子分布的回归模型估计。在相互竞争的风险环境中,可以区分三种不同类型的事件。

一个测量整体生存(OS)通过证明从疾病的新治疗方法直接临床利益。OS 测量从起源时间(即诊断或治疗时间)到因任何原因死亡的时间,并一般评估死亡的绝对风险,从而无法区分死亡原因(例如癌症特异性死亡(CSD)或非癌症特异性死亡(非CSD))2。因此,操作系统被认为是最重要的终结点。感兴趣的事件通常与癌症有关,而非癌症特定事件(包括心脏病、交通事故或其他无关原因)则被视为竞争事件。预后良好的恶性患者,预计存活时间更长,往往面临更大的非CSD风险。也就是说,操作系统将被其他死因稀释,不能正确解释临床治疗的真正有效性。因此,操作系统可能不是获取疾病3结果的最佳措施。这种偏差可以通过竞争风险回归模型加以纠正。

竞争风险数据有两种主要方法:特定原因危险模型(考克斯模型)和子分布危险模型(竞争模型)。在以下协议中,我们提出了两种基于原因特定危险模型和子分布危险模型生成声像的方法。特定原因的危险模型可以与 Cox 比例危险模型一起进行,该模型将体验竞争事件的主体视为在发生竞争事件时受到审查的受试者。在 Fine 和 Gray1 于 1999 年引入的子分布危险模型中,可以区分三种不同类型的事件,而遇到竞争事件的个人将始终处于风险设定中。

符号图是三个或更多变量 4 之间关系的数学表示。医学数字图将生物和临床事件视为变量(例如,肿瘤等级和患者年龄),并生成临床事件的概率(例如癌症复发或死亡),这些事件以图形方式描述为给定个体的统计预测模型。一般来说,根据考克斯比例危害模型,,5、6、7、8、9、106,79的结果85个符号。

但是,当存在竞争风险时,基于 Cox 模型的 nomogram 可能无法很好地执行。虽然,以前的几,项研究11、12、13、14都应用了竞争风险数字来估计CSD的概率,但很少有研究描述如何基于竞争风险回归模型建立数字图,而且没有现有的包可以做到这一点。,121314因此,下面介绍的方法将提供一个分步协议,基于竞争风险回归模型建立特定的竞争风险模型,以及风险评分估计,以帮助临床医生进行治疗决策。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

研究方案经浙江大学医学院金华医院伦理委员会批准。对于本实验,这些病例是从监测、流行病学和最终结果(SEER)数据库中获得的。SEER 是一个开放访问数据库,包括来自 18 个基于人口的癌症登记处的人口、发病率和生存数据。我们在 SEER 网站上注册并签署了获取研究数据的保证书 (12296-2018 年 11 月)。

1. 数据源

  1. 从数据库中获取案例以及从注册表中使用案例的权限(如果有)。
    注:队列数据上载在补充文件 1 中。已有具有竞争风险的生存数据的读者可以跳过此部分。

2. 安装和加载包以及导入数据

注:使用包 rms15cmprsk16(http://www.r-project.org/) 执行基于 R 软件(3.5.3 版)http://www.r-project.org/。

  1. 安装 rms 和 cmprsk R 包。
    > 安装.包("rms")
    > 安装. 包 ("cmprsk")
  2. 加载 R 包。
    >库("rms")
    >库("cmprsk")
  3. 导入队列数据。
    >数据集

3. 基于考克斯比例危险回归模型的诺形图

  1. 建立考克斯比例危险回归模型。
    注:独立变量 (X) 包括分类变量(虚拟变量,如种族)和连续变量(如年龄)。将选择单变量分析中重要的因素用于多变量分析。
    1. 将考克斯比例危险模型与数据拟合。使用函数 cph建立考克斯比例硬回归模型。R 中的简化格式如下所示:
      > f0 <- cph(生存月,状态) = 因子 1 = 因子 2]......
      x=T,y=T,surv=T,数据=数据集)
      注:死亡被设置为示例代码中的状态。
  2. 使用下面详述的命令开发考克斯回归号图。
    > nom <- nomogram (f0, fun= 列表 (函数 (x) surv (24, x)...), funlabel_c ("2 年预测生存率"...), 最大尺度 = 100, fun.at)
    > 绘图(nom)
    注:以2年预测成活率为例。

4. 基于竞争风险回归模型的诺图

  1. 建立竞争风险回归模型。
    1. 适合竞争风险回归模型。读者可以包括他们认为重要的因素,可以跳过此步骤。在该示例中,包含了单变量分析中重要的因素。
      注:审查变量被编码为1对感兴趣的事件,2为竞争风险事件。为了便于分析,Scrucca等人17提供了 一个R函数因子 2ind(),它从因子创建指标变量矩阵。
    2. 对于分类变量,在将分类变量包括在竞争模型中时,请仔细对它们进行数字编码。也就是说,对于由 J 级制作的分类变量,创建 J-1 虚拟变量或指标变量。
    3. 要建立相互竞争的风险回归模型,请先将预测变量放在矩阵中。使用 函数 cbind() 按列将变量串联,并将它们放入竞争回归模型中。
      >x <-cbind(因子2ind(因子1,"1"),因子2ind(因子2,"1")...)
      > mod<- crr (生存月, fstatus, 故障代码 = 1 或 2, cov1=x)
  2. 绘制相互竞争的无名图
    注:beta 值(β值)是考克斯比例危险回归公式中变量 (X) 的回归系数。X.score(因变量的综合效应)和X.real(在特殊时间点,例如,60个月,用于预测累积发生率函数)从考克斯回归模型计算,然后建立一个名称图。
    1. 使用函数 号图构造 考克斯 号(如 步骤 3.2 中所示)。
    2. 替换竞争风险回归模型的 X.beta 和 X.point 以及总点、X.real 和 X.score。
      1. 获取基线 cif,这是 cif(分钟)。有关详细信息,请参阅补充文件 2。
        > x0=x
        > x0 <- 作为矩阵(x0)
        > lhat <- 矩阵(0, nrow = 长度(mod$uftime), ncol = nrow(x0))
        > 对于 (j 在 1: nrow (x0) lhat_, j _ < - 暨苏姆 (exp(总和 (x0 _ j, _ mod$coef) _ mod$bfitj)
        > lhat < - cbind (mod$uftime, 1 - exp(- lhat))
        > suv < - as. data. frame(lhat)
        > 高名称 (suv) <- c ("时间")
        > 行 24 < - -(suv$时间="24")
        > cif.min24<-suv=行24,哪个.min(suv=line24,])]
      2. 更换 X.beta 和 X.point。
        > lmaxbeta < - which. max (abs (mod$coef))
        > maxbeta<-abs(mod$coef_lmaxbeta])
        > race0<-0
        > 名称(种族 0)<-"种族:1"
        > race.beta<-c(race0,mod$coef_c("比赛:2","比赛:3")=)
        > race. beta. min < - race. beta = 哪个. min (race. beta)=
        > race.beta1
        > 比赛.scale<-(race.beta1/maxbeta*100) = 如何计算比例
        > nom$Race$Xbeta<- race. beta1
        > nom$Race$点
        注意:以种族为例。
      3. 替换总 X.点和 X.real。
        > nom$总. 点$x<-c(0,50,100,...)
        > real.2y<-c(0.01,0.1,0.2,...)
        注:更换根据最小最大值。
      4. 计算 X.score 并绘制声像。
        > 分数.2y<-log(日志(1-real.2y),(1-cif.min24)/(maxbeta/100)
        > nom$'2 年生存' $x <得分. 2y
        > nom$'2 年生存$x. real < - real. 2y
        > nom$'2 年生存' $fat < - as. 字符 (real.2y)
        > 绘图(nom)
        注: X.score=log(日志(1-X.real)、(1-cif0)))/(maxbeta/100)。X.score和X.real关系的方程可以根据竞争模型(crr)的内在归因进行计算。Cif0 表示基线 cif,将由预测.crr 函数计算。

5. 基于集团风险评分 (GRS) 的分组分析

  1. 计算风险评分 (RS)
    注:计算每个患者的风险评分,通过每个变量的积分总计。截止值用于对队列进行分类。以 3 个子组为例,使用包 绘制林图。
    1. 安装和加载 R 包
      > 安装.包("元")
      > 库("元")
    2. 获取 GRS 并将队列划分为 3 个子组。
      > d1<-数据集
      > d1$X<- nom$X$积分
      > #For,d1$种族\d1$比赛\1\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
      > d1$RS<-d1$种族 = d1$结婚 = d1$组织学 = d1$等级修改 = d1$Tclass 化 = d1$N分类
      > d1$GRS<- 切割(d1$RS,分位数(d1$RS,seq(0,1,1/3),包括.最低 = TRUE,标签 = 1:3)
    3. 绘制林图。通过函数 crr 获取 HR、LCI 和 UCI。
      > 子组<-crr(ftime、fstatus、cov1、故障代码=1)
      > HR<- 摘要(子组)$conf.int[1]
      > LCI<- 摘要(子组)$conf.int[3]
      > UCI<- 摘要(子组)$conf.int[4]
      > LABxx<-c("低风险","中位数风险","高风险")
      > xx< - 元原 (日志 (HR), 下 = 日志 (Lci), 上 + 日志 (Uci), 螺柱 + Labxx, sm = "Hr")
      > 森林 (xx, col. square = "黑色", hetstat = True, 左撇子 = "studlab")

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

示例队列的生存特征
在示例队列中,共有8,550名符合条件的患者被纳入分析,随和时间中位数为88个月(范围为1至95个月)。共 679 (7.94%)患者年龄小于40岁,为7,871人(92.06%)病人年龄超过40岁。在审判结束时,7,483人(87.52%)病人还活着, 662 (7.74%)死于乳腺癌,405 (4.74%)病人死于其他原因(相互竞争的风险)。

两种生存模式的比较
通过卡普兰-迈尔法和竞争风险回归函数分别计算肿瘤死亡/无肿瘤死亡和竞争事件的累积发生率(如图 1所示)。如图 1所示,卡普兰-迈尔方法计算的肿瘤死亡累计发病率和无肿瘤死亡之和高于所有死因估计之和,等于使用竞争方法时CSD的累计发病率之和。显然,卡普兰-迈尔方法高估了肿瘤死亡的累积发生率,并且没有肿瘤死亡。相互竞争的方法可以纠正它对死亡概率的高估。

基于考克斯比例危险回归模型的诺姆图
根据图 2A 和表1所示的重要因素构造 了一个数字图。这包括婚姻状况、种族、组织学类型、差别化等级、T分类和N分类。

基于竞争风险回归模型的诺图
构建了基于种族、婚姻状况、组织类型、差分等级、T分类和N分类等多重因素的竞赛数字图(图2B)。模型中的 beta 系数用于比例分配(表1)。

按风险评分进行分层分析
根据风险评分,该组分为三个子组:低风险评分:0-44;中等风险评分:45-85;和高风险分数:86-299。林图可以清楚地显示GRS与特定因子(年龄)之间的相互作用(图3)。根据GGR分类,年轻女性的预后差只出现在低风险分组,年轻女性可能作为中高风险亚组的预后保护因素。

Figure 1
图1:堆叠累积发生率图。K-M:基于卡普兰-迈尔估计的累积发病率; CR:基于累积发生率竞争风险估计的累计发生率;肿瘤死亡=无肿瘤死亡(K-M):癌症特定死亡和非癌症特定死亡的累计发病率估计之和;CSD = 非 CSD (CR):使用 CR 方法时癌症特异性死亡和非癌症特定死亡的估计总和。 请单击此处查看此图的较大版本。

Figure 2
图2:考克斯比例危险回归模型和竞争风险回归模型的符号图。A) 基于考克斯比例危害回归模型的诺形图。(B) 基于竞争风险回归模型的诺图。对于名称图的应用,每个变量轴显示单个风险因素,向上绘制的线用于确定每个变量的点。然后计算总分,以获得2年、3年和5年癌症特异性生存或累积发病率函数(CIF)的概率。种族: 1=白色,2=黑色,3=其他;婚姻状况:1、已婚、2、单身(从未结婚或家庭伴侣)、3、离婚(分居、离婚、丧偶);组织学类型:1~渗透导管癌,2~渗透性球状癌,3°渗透导管癌和球状癌;肿瘤等级:1°井分化,2~中度分化;3、差别差。T 和 N 分类是根据第 7 AJCC TNM 暂存系统。 请单击此处查看此图的较大版本。

Figure 3
图3:森林分层分析的森林地块,按乳腺癌年轻和老年妇女乳腺癌特定死亡概率的风险评分进行。请单击此处查看此图的较大版本。

(HR:危险比)

变量 得分
(考克斯模型)
估计的可操作性 得分
(竞争模型)
估计的可操作性
比赛
1:白色 10 4
2:黑色 32 31
3:其他 0 0
婚姻状况
1:已婚 0 0
2:未婚 9 5
3:离婚 37 15
组织学
1:腺癌 10 12
2:粘液腺癌 8 5
3:辛吉特环细胞癌 0 0
差分等级
1:等级一 0 0
2:二级 6 36
3:三级 37 77
T 分类a
1:T1 0 0
2:T2 41 50
3:T3 59 68
4:T4 100 98
N 分类a
00:00 0 0
1:0-3 17 42
2:3-6 43 65
3:6-12 74 100
总分
(2年生存)
278 0.6 总分
(2年期CIF)
95 0.01
254 0.7 233 0.1
223 0.8 277 0.2
173 0.9 305 0.3
125 0.95 326 0.4
344 0.5
总分
(3年生存)
281 0.4 总分
(3 年期 CIF)
62 0.01
242 0.6 245 0.2
218 0.7 293 0.4
187 0.8 311 0.5
137 0.9 328 0.6
89 0.95 344 0.7
总分
(5年生存)
303 0.1 总分
(5年期CIF)
29 0.01
279 0.2 212 0.2
241 0.4 260 0.4
203 0.6 295 0.6
179 0.7 328 0.8
148 0.8 349 0.9
98 0.9
50 0.95
aT 和 N 分类根据第 7AJCC 暂存系统
CIF:累积发生函数

表1:基于Cox的比例危害回归模型和竞争风险回归模型的点分配和预测分数。

补充文件 1. 请点击这里下载此文件。

补充文件 2. 请点击这里下载此文件。

补充文件 3. 请点击这里下载此文件。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

目前研究的总体目标是建立一种能够描述真实世界疾病的具体竞争风险图谱,并开发一个方便的个人评估模型,供临床医生处理治疗决定。在这里,我们提供了一个分步教程,用于基于考克斯回归模型和竞争风险回归模型建立声像,并进一步执行子组分析。张等人18日介绍了一种创建竞争风险表谱的方法,但本文中描述的方法的主要概念完全不同。Zhang等人的方法首先通过mstate19中的crprep()函数将原始数据转换为加权数据,然后通过rms包绘制了nomogram。然而,该方法的核心概念却与它完全不同。简单地说,我们将cph生成的参数替换为函数crr的结果,然后在考克斯 nomogram 的框架中绘制一个竞争风险值。在此方法中,考克斯号图更像是一个框架。

预后良好的恶性患者,预期与癌症存活时间较长,其非癌症特异性死亡的风险更大。如图1所示,它们的操作系统将在很大程度上被非CSD的发生 率所稀释。以II期结肠癌13 患者为例,如果我们在根据Kalan-Meier方法生成所有死因的曲线时没有考虑到癌症的成因,这种曲线将主要受到非CSD的累积发病率的影响,而不是CSD的累积发生率。

评估协变量的标准考克斯模型肯定会导致错误和有偏见的结果(例如,对于第二阶段结肠癌13的化疗,化疗是OS的保护因素)。这种偏差可以通过竞争风险回归方法加以纠正,尤其是对于最古老的子组(化疗将被定义为CSD的有害因素)。非CSD事件是癌症患者的不可抑制的竞争风险,尤其是预后良好的患者。

然后,在建立一个名称图后,与每个变量相关的死亡概率被呈现为声像上的一个点。每个患者的风险评分通过所有变量的积分总计计算。根据总分,我们可以进一步将队列分为三个子组(低、中、高),以分层有争议的因素对预后的影响,这可能有助于临床医生解决临床问题。以年龄对乳腺癌的影响为例20。年龄对早期乳腺癌患者结果的影响尚未在临床上确立,而且存在争议。根据GGR分类,年轻女性的预后恶化只出现在中低风险分组,年轻可能作为预后的保护因素。

在限制方面,竞争风险估计在某些情况下可能导致竞争过度。例如,预后不良的疾病(如晚期恶性肿瘤或分化性胰腺癌)和毒性大,将不可避免地对非CSD产生主要影响。在生存分析中应仔细考虑考克斯模型还是子分布比例回归模型(竞争风险)。在估计生存期时,应谨慎处理非可持续发展和过度竞争问题。根据研究结果,我们建议,对于预后良好的疾病和老年患者,在未来的临床试验中应仔细考虑非CSD对OS的影响。基于竞争风险模型的 CSD 可能是替代终结点,而不是始终使用传统操作系统。

总之,我们建议,不仅恶性肿瘤的预后不同,而且同一疾病与不同的阶段可能需要个人选择一个适当的终点。此外,这种方法可用于建立基于适当的模型(考克斯或竞争回归模型)的表图,以量化风险,这需要进一步用于个性化指导,以及更好地解释临床实践中的临床现象。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

没有

Acknowledgments

这项研究得到了浙江省自然科学基金(资助号LY19H160020)和金华市科技局重点项目(资助号2016-3-005、2018-3-001d和2019-3-013)的资助。

Materials

Name Company Catalog Number Comments
no no no

DOWNLOAD MATERIALS LIST

References

  1. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  2. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  3. Kim, H. T. Cumulative incidence in competing risks data and competing risks regression analysis. Clinical Cancer Research. 13, 2 Pt 1 559-565 (2007).
  4. Balachandran, V. P., Gonen, M., Smith, J. J., DeMatteo, R. P. Nomograms in oncology: more than meets the eye. Lancet Oncology. 16 (4), 173-180 (2015).
  5. Han, D. S., et al. Nomogram predicting long-term survival after d2 gastrectomy for gastric cancer. Journal of Clinical Oncology. 30 (31), 3834-3840 (2012).
  6. Karakiewicz, P. I., et al. Multi-institutional validation of a new renal cancer-specific survival nomogram. Journal of Clinical Oncology. 25 (11), 1316-1322 (2007).
  7. Liang, W., et al. Development and validation of a nomogram for predicting survival in patients with resected non-small-cell lung cancer. Journal of Clinical Oncology. 33 (8), 861-869 (2015).
  8. Valentini, V., et al. Nomograms for predicting local recurrence, distant metastases, and overall survival for patients with locally advanced rectal cancer on the basis of European randomized clinical trials. Journal of Clinical Oncology. 29 (23), 3163-3172 (2011).
  9. Iasonos, A., Schrag, D., Raj, G. V., Panageas, K. S. How to build and interpret a nomogram for cancer prognosis. Journal of Clinical Oncology. 26 (8), 1364-1370 (2008).
  10. Chisholm, J. C., et al. Prognostic factors after relapse in nonmetastatic rhabdomyosarcoma: a nomogram to better define patients who can be salvaged with further therapy. Journal of Clinical Oncology. 29 (10), 1319-1325 (2011).
  11. Brockman, J. A., et al. Nomogram Predicting Prostate Cancer-specific Mortality for Men with Biochemical Recurrence After Radical Prostatectomy. European Urology. 67 (6), 1160-1167 (2015).
  12. Zhou, H., et al. Nomogram to Predict Cause-Specific Mortality in Patients With Surgically Resected Stage I Non-Small-Cell Lung Cancer: A Competing Risk Analysis. Clinical Lung Cancer. 19 (2), 195-203 (2018).
  13. Fu, J., et al. De-escalating chemotherapy for stage II colon cancer. Therapeutic Advances in Gastroenterology. 12, 1756284819867553 (2019).
  14. Chen, D., Li, J., Chong, J. K. Hazards regression for freemium products and services: a competing risks approach. Journal of Statistical Computation and Simulation. 87 (9), 1863-1876 (2017).
  15. Frank, E., H, J. rms: Regression Modeling Strategies. R package version 5.1-2. , Available from: https://CRAN.R-project.org/package=rms (2018).
  16. Gray, B. cmprsk: Subdistribution Analysis of Competing Risks. R package version 2.2-7. , Available from: https://CRAN.R-project.org/package=cmprsk (2014).
  17. Scrucca, L., Santucci, A., Aversa, F. Regression modeling of competing risk using R: an in depth guide for clinicians. Bone Marrow Transplantation. 45 (9), 1388-1395 (2010).
  18. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals in Translational Medicine. 5 (20), 403 (2017).
  19. Geskus, R. B. Cause-specific cumulative incidence estimation and the fine and gray model under both left truncation and right censoring. Biometrics. 67 (1), 39-49 (2011).
  20. Fu, J., et al. Young-onset breast cancer: a poor prognosis only exists in low-risk patients. Journal of Cancer. 10 (14), 3124-3132 (2019).
  21. de Glas, N. A., et al. Performing Survival Analyses in the Presence of Competing Risks: A Clinical Example in Older Breast Cancer Patients. Journal of the National Cancer Institute. 108 (5), (2016).

Tags

癌症研究, 问题 164, 生存分析, 癌症特异性死亡, 整体生存, 考克斯回归模型, 竞争风险, 肿瘤图
为生存数据建立竞争风险回归 Nomogram 模型
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wu, L., Ge, C., Zheng, H., Lin, H.,More

Wu, L., Ge, C., Zheng, H., Lin, H., Fu, W., Fu, J. Establishing a Competing Risk Regression Nomogram Model for Survival Data. J. Vis. Exp. (164), e60684, doi:10.3791/60684 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video
Waiting X
Simple Hit Counter