April 18th, 2025
本研究使用机器学习模型和竞争风险分析评估结直肠印戒细胞癌患者的预后系统。与 pN 分期相比,它将阳性淋巴结的对数几率确定为更好的预测因子,展示了强大的预测性能,并通过强大的生存预测工具帮助临床决策。
- 我们的研究使用机器学习和竞争风险模型评估结直肠印戒细胞癌的三个淋巴结分期系统,以优化预后准确性和生存预测。
通过信息学方法,包括机器学习、比较风险模型和 Kaplan-Meier 生存估计,用于提高生存预测和淋巴结分类的准确性。
延长随访期,同时在不同人群中进行测年,完善预后列线图并探索结直肠印章环细胞癌的分子特征,以增强临床决策工具。
[旁白]首先,下载并安装 SEER。然后从仙工智能数据库网站获取统计学8.4.3软件。登录软件,点击案例列表会话,点击数据,选择事件SEER研究加数据,17个登记处,2022年11月,2000年次至2020年数据库。现在,单击选择,然后单击编辑并选择种族、性别、诊断年份等于 2004 年至 2015 年。然后选择站点重新编码 ICD-0-3 WHO 2008。单击表格,然后在可用变量界面中,选择所需的所有诊断详细信息。然后单击输出。命名数据并单击执行以输出并保存数据。接下来,打开 X-Tile 软件,单击文件并选择打开。选择数据文件将其导入软件。加载数据后,映射与生存状态相对应的变量传感器,标记一中的生存时间作为要分析的变量,确保数据正确匹配。现在单击 do,然后单击 Kaplan-Meier 和标记 1 以执行 Kaplan-Meier 生存分析并生成生存曲线。然后以 7-3 的比例将总共 2,409 个符合条件的患者数据与 SRCC 随机分配给训练队列编号 1,686 和验证队列编号 723。使用提供的代码进行随机拆分。下载并安装所需版本的 RStudio 和 R 软件。单击新文件并选择 R 脚本以创建新的 R 编程接口。然后在代码编辑器中输入相关代码,点击运行执行代码。使用提供的代码通过 Cox 回归分析筛选机器学习模型中包含的变量。此外,探索 LODDS、LNR 和 PN 分期对 SRCC 患者癌症特异性生存的影响。使用该代码比较三个淋巴结系统(LODDS、LNR 和 PN 分期)在训练、验证和外部验证队列中的预后预测能力。然后使用代码构建 XGBoost 模型并生成表示变量相对重要性的条形图。生成受试者工作特征曲线和校准曲线,以评估三个淋巴结系统的性能。接下来,使用代码构建随机森林模型并生成变量相对重要性的条形图。同样,生成受试者工作特征曲线和校准曲线,以评估和比较三个淋巴结系统。使用适当的代码,构建神经网络模型并生成变量相对重要性的条形图。生成受试者工作特征和校准曲线,以比较三个淋巴结系统的预测性能。然后,执行单变量分析并使用 data.csv 文件绘制累积事件函数曲线。将站点替换为其他因子,以对每个因子执行单变量分析。对于多变量分析,应用代码并使用 data1.csv 进行可视化。最后,绘制列线图、受试者工作特征曲线和校准曲线。使用训练队列中的数据训练模型,并使用验证和外部验证队列数据来验证模型。基于多因素Cox回归分析,LNR、LODDS和PN分期均与SRCC患者的癌症特异性生存率显著相关。LNR在RF和XGBoost模型中表现出最高的重要性,而LODDS在NN模型中具有最大的预测能力,表明LODDS是总体上最可靠的LN系统。XGBoost、RF和NN模型实现了较高的预测精度,AUC值范围为0.777至0.851,校准曲线与45度线紧密对齐,证实了模型的可靠性。竞争性风险模型分析将 T 分期、N 分期、M 分期、LODDS 分类和原发肿瘤位置确定为独立的预后因素。 竞争风险列线图显示了准确的一年、三年和五年癌症特异性生存预测,并得到了良好对齐的校准曲线和 AUC 高于 0.75 的 ROC 曲线的支持。
View the full transcript and gain access to thousands of scientific videos
本研究使用机器学习模型和竞争风险分析评估结直肠印戒细胞癌患者的预后系统。它确定了阳性淋巴结的对数比值作为优于pN分期的预测因子,展示了强大的预测性能,并通过强大的生存预测工具辅助临床决策。