15.15: Überlebens-Baum

Survival Tree
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Survival Tree
Please note that all translations are automatically generated. Click here for the English version.

88 Views

01:19 min
January 09, 2025

Overview

Überlebensbäume sind eine nicht-parametrische Methode, die in der Überlebensanalyse verwendet wird, um die Beziehung zwischen einem Satz von Kovariaten und der Zeit bis zum Eintreten eines relevanten Ereignisses zu modellieren, die oft als “Zeit bis zum Ereignis” oder “Überlebenszeit” bezeichnet wird. Diese Methode ist besonders nützlich beim Umgang mit zensierten Daten, bei denen das Ereignis bei einigen Personen am Ende des Untersuchungszeitraums noch nicht eingetreten ist. oder wenn die genaue Uhrzeit des Ereignisses unbekannt ist.

Einen Überlebensbaum erstellen

Die Erstellung eines Überlebensbaums beginnt mit einem Datensatz, der Kovariaten (Prädiktorvariablen) und die Überlebenszeit sowie einen Zensurindikator für jedes Subjekt enthält. Der Prozess umfasst die folgenden Schritte:

  1. Datenaufbereitung: Der Datensatz wird vorbereitet, indem sichergestellt wird, dass alle erforderlichen Kovariaten enthalten und entsprechend formatiert sind. Fehlende Werte können mit Methoden wie Imputation oder der Behandlung als separate Kategorie behandelt werden.
  2. Baumkonstruktion: Der Überlebensbaum wird mit einem rekursiven Partitionierungsprozess erstellt. Bei jedem Schritt wird der Datensatz in zwei Teilmengen aufgeteilt, die auf einer Kovariate basieren, die die Überlebensergebnisse am besten unterscheidet. Dies geschieht in der Regel unter Verwendung eines Aufteilungskriteriums wie dem Log-Rank-Test, der die Überlebensverteilungen zwischen den Gruppen vergleicht.
  3. Knotenauswertung: Jeder Knoten im Baum stellt eine Teilmenge der Daten dar, und die Endknoten (Blätter) werden auf der Grundlage der Kaplan-Meier-Schätzung der Überlebensfunktion ausgewertet. Dies liefert eine Schätzung der Überlebenswahrscheinlichkeit für Probanden, die in diesen Knoten fallen.
  4. Beschneiden: Um eine Überanpassung zu vermeiden, wird der Baum beschnitten, indem Knoten entfernt werden, die keine signifikante Verbesserung der Modellgenauigkeit bewirken. Dieser Schritt stellt sicher, dass die Struktur auf neue Daten generalisierbar ist.

Vorteile und Nachteile

Vorteile:

  1. Flexibilität: Überlebensbäume können eine Vielzahl von Datentypen verarbeiten und sind robust gegenüber Ausreißern und fehlenden Werten.
  2. Interpretierbarkeit: Die Baumstruktur ist einfach zu interpretieren und ermöglicht eine einfache Visualisierung der Beziehung zwischen Kovariaten und Überlebenszeit.
  3. Nicht-parametrische Natur: Sie erfordern keine Annahmen über die Verteilung der Überlebenszeiten oder die funktionale Form der Beziehung zwischen Kovariaten und Überleben.

Benachteiligungen:

  1. Überanpassung: Ohne ordnungsgemäßen Rückschnitt können Überlebensbäume die Trainingsdaten überanpassen, was zu einer schlechten Generalisierung führt.
  2. Instabilität: Kleine Änderungen in den Daten können zu erheblichen Veränderungen in der Baumstruktur führen, wodurch sie im Vergleich zu anderen Methoden wie Überlebenswäldern weniger stabil sind

Transcript

Ein Überlebensbaum wird verwendet, um die Beziehung zwischen einem Satz von Kovariaten und der Zeit bis zum Eintreten eines relevanten Ereignisses zu modellieren und zu visualisieren. Es wird in der Regel mit einem rekursiven Partitionierungsprozess erstellt.

Die Zweige des Baums stellen die Aufteilungen in den Werten einer Variablen dar. Die Knoten stellen Teilmengen der Daten dar, und die Endknoten geben die Anzahl der Probanden im Knoten an und können endgültige Vorhersagen der Analyse liefern.

Die Erstellung eines Überlebensbaums erfordert hauptsächlich Kovariaten, Aufteilungskriterien, minimale Knotengröße und Beschneidungsschwellenwerte.

Die Kovariaten oder Prädiktorvariablen können stetig, ordinal oder kategorial sein.

Ein Aufteilungskriterium ist eine Methode zur Auswahl der besten Aufteilung an jedem Knoten. Es wird entweder angewendet, um das Risiko innerhalb des Knotens zu minimieren oder den Grad der Trennung zwischen den Knoten zu maximieren.

Die minimale Knotengröße ist die kleinste Anzahl von Beobachtungen, die erforderlich sind, damit ein Knoten weiter geteilt werden kann. Dies hilft bei der Kontrolle der Größe des Baumes und verhindert eine Überanpassung.

Schließlich ist die Schnittschwelle ein Maß, um zu entscheiden, wann mit dem Beschneiden des Baumes aufgehört werden soll.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for