15.15: 生存树

Survival Tree
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Survival Tree
Please note that all translations are automatically generated. Click here for the English version.

88 Views

01:19 min
January 09, 2025

Overview

生存树是生存分析中使用的一种非参数方法,用于对一组协变量与感兴趣事件发生之前的时间之间的关系进行建模,通常称为”事件发生时间”或”生存时间”。这种方法在处理删失数据时特别有用,因为在研究期结束时某些个体的事件尚未发生。 或者当事件的确切时间未知时。

构建生存树

构建生存树从包含协变量(预测变量)和生存时间以及每个主题的删失指标的数据集开始。该过程包括以下步骤:

  1. 数据准备:数据集的准备方式是确保包含所有必要的协变量并采用适当的格式。可以使用插补等方法处理缺失值,也可以将其视为单独的类别。
  2. Tree Construction:生存树是使用递归分区过程构建的。在每个步骤中,数据集根据最能区分生存结果的协变量分为两个子集。这通常使用拆分标准来完成,例如对数秩检验,该检验比较组之间的生存分布。
  3. 节点评估:树中的每个节点都代表数据的一个子集,终端节点(叶子)根据生存函数的 Kaplan-Meier 估计进行评估。这提供了属于该节点的受试者的生存概率的估计值。
  4. 修剪:为避免过度拟合,通过删除不会显著提高模型准确性的节点来修剪树。此步骤可确保树可泛化到新数据。

的优点和缺点

优势:

  1. 灵活性:生存树可以处理各种数据类型,并且对异常值和缺失值具有很强的稳定性。
  2. 可解释性:树结构易于解释,可以直接可视化协变量与生存时间之间的关系。
  3. 非参数性质:它们不需要对生存时间的分布或协变量与生存之间关系的函数形式进行假设。

弊:

  1. 过度拟合:如果没有适当的修剪,生存树可能会过度拟合训练数据,从而导致泛化效果不佳。
  2. 不稳定性:数据的微小变化会导致树结构发生重大变化,与生存森林等其他方法相比,它们不太稳定

Transcript

生存树用于对一组协变量与感兴趣事件发生之前的时间之间的关系进行建模和可视化。它通常是使用递归分区过程构建的。

树的分支表示变量值的拆分。节点表示数据的子集,终端节点表示节点中的主体数,可以提供分析的最终预测。

构建生存树主要需要协变量、拆分标准、最小节点大小和修剪阈值。

协变量或预测变量可以是连续变量、有序变量或类别变量。

分割标准是一种在每个节点选择最佳分割的方法。应用它是为了最大限度地降低节点内的风险或最大限度地提高节点之间的分离程度。

最小节点大小是进一步拆分节点所需的最小观测值数。这有助于控制树的大小并防止过度拟合。

最后,修剪阈值是决定何时停止修剪树的度量。

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for

Tags