15.15: Дерево выживания

Survival Tree
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Survival Tree
Please note that all translations are automatically generated. Click here for the English version.

73 Views

01:19 min
January 09, 2025

Overview

Деревья выживаемости – это непараметрический метод, используемый в анализе выживаемости для моделирования взаимосвязи между набором ковариат и временем до наступления интересующего события, часто называемым «временем до события» или «временем выживания». или когда точное время события неизвестно.

Построение дерева выживания

Построение дерева выживания начинается с набора данных, который включает ковариаты (предикторные переменные) и время выживания, а также индикатор цензуры для каждого субъекта. Процесс включает в себя следующие этапы:

  1. Подготовка данных: Набор данных подготавливается путем включения в него всех необходимых ковариат и их надлежащего форматирования. Отсутствующие значения могут быть обработаны с помощью таких методов, как импутация или обработка их как отдельной категории.
  2. Построение дерева: Дерево выживания строится с использованием процесса рекурсивного разбиения. На каждом этапе набор данных разбивается на два подмножества на основе ковариаты, которая наилучшим образом дифференцирует результаты выживаемости. Обычно это делается с использованием критерия расщепления, такого как логарифмический ранговый тест, который сравнивает распределения выживаемости между группами.
  3. Оценка узлов: Каждый узел в дереве представляет собой подмножество данных, а концевые узлы (листья) оцениваются на основе оценки функции выживания по методу Каплана-Мейера. Это дает оценку вероятности выживания для субъектов, попадающих в этот узел.
  4. Обрезка: Чтобы избежать переобучения, дерево обрезается путем удаления узлов, которые не обеспечивают значительного повышения точности модели. Этот шаг гарантирует, что дерево можно обобщить на новые данные.

Достоинства и недостатки

Преимущества:

  1. Гибкость: деревья выживания могут работать с широким спектром типов данных и устойчивы к выбросам и пропущенным значениям.
  2. Интерпретируемость: Древовидная структура легко интерпретируется, что позволяет легко визуализировать взаимосвязь между ковариатами и временем выживания.
  3. Непараметрическая природа: Они не требуют предположений о распределении времен выживания или функциональной форме взаимосвязи между ковариатами и выживаемостью.

Недостатки:

  1. Переобучение: Без надлежащей обрезки деревья выживания могут переподгонять обучающие данные, что приведет к плохому обобщению.
  2. Нестабильность: Небольшие изменения в данных могут привести к значительным изменениям в структуре деревьев, что делает их менее стабильными по сравнению с другими методами, такими как леса для выживания

Transcript

Дерево выживания используется для моделирования и визуализации отношений между набором ковариат и временем до наступления интересующего события. Обычно он создается с использованием процесса рекурсивного секционирования.

Ветви дерева представляют собой разбиения значений переменной. Узлы представляют собой подмножества данных, а конечные узлы указывают количество субъектов в узле и могут предоставить окончательные прогнозы анализа.

Построение дерева выживания в основном требует ковариат, критериев разделения, минимального размера узла и пороговых значений обрезки.

Ковариаты или предикторные переменные могут быть непрерывными, порядковыми или категориальными.

Критерий разбиения — это метод выбора наилучшего разбиения в каждом узле. Он применяется либо для минимизации риска внутри узла, либо для максимизации степени разделения между узлами.

Минимальный размер узла — это наименьшее количество наблюдений, необходимое для дальнейшего разбиения узла. Это помогает в контроле размера дерева и предотвращает переобучение.

Наконец, порог обрезки — это мера, позволяющая решить, когда прекратить обрезку дерева.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for