15.15: 생존 트리

Survival Tree
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Survival Tree
Please note that all translations are automatically generated. Click here for the English version.

73 Views

01:19 min
January 09, 2025

Overview

생존 트리는 생존 분석에 사용되는 비모수 방법으로, 공변량 집합과 관심 있는 사건이 발생할 때까지의 시간 간의 관계를 모델링하는 데 사용되며, 이를 “사건까지의 시간” 또는 “생존 시간”이라고 합니다.이 방법은 연구 기간이 끝날 때까지 일부 개인에 대해 사건이 발생하지 않은 경우 중도절단된 데이터를 처리할 때 특히 유용합니다. 또는 이벤트의 정확한 시간을 알 수 없는 경우.

생존 트리 만들기

생존 트리를 구성하는 것은 공변량(예측 변수)과 생존 시간을 포함하는 데이터셋과 함께 각 개체에 대한 관측 중단 지표로 시작합니다. 이 프로세스에는 다음 단계가 포함됩니다.

  1. 데이터 준비: 데이터 세트는 필요한 모든 공변량이 포함되고 적절한 형식이 지정되었는지 확인하여 준비됩니다. 누락된 값은 대치와 같은 방법을 사용하거나 별도의 범주로 처리할 수 있습니다.
  2. 트리 구성: 생존 트리는 재귀적 분할 프로세스를 사용하여 구축됩니다. 각 단계에서 데이터 세트는 생존 결과를 가장 잘 구별하는 공변량을 기반으로 두 개의 하위 집합으로 분할됩니다. 이는 일반적으로 그룹 간의 생존 분포를 비교하는 로그-순위 테스트와 같은 분할 기준을 사용하여 수행됩니다.
  3. 노드 평가: 트리의 각 노드는 데이터의 하위 집합을 나타내며, 터미널 노드(리프)는 생존 함수의 Kaplan-Meier 추정치를 기반으로 평가됩니다. 이것은 해당 노드에 속하는 피험자의 생존 확률을 추정합니다.
  4. 정리: 과적합을 방지하기 위해 모델 정확도가 크게 향상되지 않는 노드를 제거하여 트리를 정리합니다. 이 단계는 트리를 새 데이터로 일반화할 수 있도록 합니다.

장점과 단점

장점:

  1. 유연성: 생존 트리는 광범위한 데이터 유형을 처리할 수 있으며 이상값과 결측값에 대해 견고합니다.
  2. 해석 가능성: 트리 구조는 해석하기 쉬우므로 공변량과 생존 시간 간의 관계를 간단하게 시각화할 수 있습니다.
  3. 비모수적 특성: 생존 시간의 분포 또는 공변량과 생존 간의 관계의 기능적 형태에 대한 가정을 필요로 하지 않습니다.

단점:

  1. 과적합: 적절한 가지치기가 없으면 생존 트리가 훈련 데이터를 과적합하여 일반화가 잘못될 수 있습니다.
  2. 불안정성: 데이터의 작은 변화는 트리 구조에 상당한 변화로 이어질 수 있으며, 이로 인해 생존 숲과 같은 다른 방법에 비해 안정성이 떨어질 수
  3. 있습니다

Transcript

생존 트리는 공변량 집합과 관심 있는 이벤트가 발생할 때까지의 시간 사이의 관계를 모델링하고 시각화하는 데 사용됩니다. 일반적으로 재귀 분할 프로세스를 사용하여 구축됩니다.

트리의 가지는 변수 값의 분할을 나타냅니다. 노드는 데이터의 하위 집합을 나타내고 터미널 노드는 노드의 개체 수를 나타내며 분석의 최종 예측을 제공할 수 있습니다.

생존 트리를 구성하려면 주로 공변량, 분할 기준, 최소 노드 크기 및 가지치기 임계값이 필요합니다.

공변량 또는 예측 변수는 계량형, 순서형 또는 범주형일 수 있습니다.

분할 기준은 각 노드에서 최상의 분할을 선택하는 방법입니다. 노드 내의 위험을 최소화하거나 노드 간의 분리 정도를 최대화하기 위해 적용됩니다.

최소 노드 크기는 노드를 더 분할하는 데 필요한 최소 관측치 수입니다. 이렇게 하면 트리의 크기를 제어하고 과적합을 방지하는 데 도움이 됩니다.

마지막으로, 가지치기 임계값은 나무 가지치기를 중지할 시기를 결정하는 척도입니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for