15.15: Árvore de Sobrevivência

Survival Tree
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Survival Tree
Please note that all translations are automatically generated. Click here for the English version.

74 Views

01:19 min
January 09, 2025

Overview

As árvores de sobrevivência são um método não paramétrico usado na análise de sobrevivência para modelar a relação entre um conjunto de covariáveis e o tempo até que um evento de interesse ocorra, muitas vezes referido como “tempo até o evento” ou “tempo de sobrevivência”. Este método é particularmente útil ao lidar com dados censurados, onde o evento não ocorreu para alguns indivíduos até o final do período de estudo, ou quando a hora exata do evento é desconhecida.

Construindo uma árvore de sobrevivência

A construção de uma árvore de sobrevivência começa com um conjunto de dados que inclui covariáveis (variáveis preditoras) e o tempo de sobrevivência, juntamente com um indicador de censura para cada sujeito. O processo envolve as seguintes etapas:

  1. Preparação de dados: O conjunto de dados é preparado garantindo que todas as covariáveis necessárias sejam incluídas e formatadas adequadamente. Os valores ausentes podem ser tratados usando métodos como imputação ou tratando-os como uma categoria separada.
  2. Construção da árvore: A árvore de sobrevivência é construída usando um processo de particionamento recursivo. Em cada etapa, o conjunto de dados é dividido em dois subconjuntos com base em uma covariável que melhor diferencia os resultados de sobrevivência. Isso normalmente é feito usando um critério de divisão, como o teste de log-rank, que compara as distribuições de sobrevivência entre os grupos.
  3. Avaliação de nós: Cada nó na árvore representa um subconjunto dos dados, e os nós terminais (folhas) são avaliados com base na estimativa de Kaplan-Meier da função de sobrevivência. Isso fornece uma estimativa da probabilidade de sobrevivência para indivíduos que caem nesse nó.
  4. Poda: Para evitar o sobreajuste, a árvore é podada removendo nós que não fornecem melhoria significativa na precisão do modelo. Essa etapa garante que a árvore seja generalizável para novos dados.

Vantagens e desvantagens

Vantagens:

  1. Flexibilidade: as árvores de sobrevivência podem lidar com uma ampla variedade de tipos de dados e são robustas para valores discrepantes e ausentes.
  2. Interpretabilidade: A estrutura da árvore é fácil de interpretar, permitindo a visualização direta da relação entre as covariáveis e o tempo de sobrevivência.
  3. Natureza não paramétrica: Eles não exigem suposições sobre a distribuição dos tempos de sobrevida ou a forma funcional da relação entre covariáveis e sobrevida.

Desvantagens:

  1. Overfitting: Sem poda adequada, as árvores de sobrevivência podem sobreajustar os dados de treinamento, levando a uma generalização ruim.
  2. Instabilidade: Pequenas mudanças nos dados podem levar a mudanças significativas na estrutura das árvores, tornando-as menos estáveis em comparação com outros métodos, como florestas de sobrevivência

Transcript

Uma árvore de sobrevivência é usada para modelar e visualizar a relação entre um conjunto de covariáveis e o tempo até que ocorra um evento de interesse. Normalmente, ele é criado usando um processo de particionamento recursivo.

As ramificações da árvore representam as divisões nos valores de uma variável. Os nós representam subconjuntos dos dados e os nós terminais indicam o número de sujeitos no nó e podem fornecer previsões finais da análise.

A construção de uma árvore de sobrevivência requer principalmente covariáveis, critérios de divisão, tamanho mínimo do nó e limites de poda.

As covariáveis ou variáveis preditoras podem ser contínuas, ordinais ou categóricas.

Um critério de divisão é um método para escolher a melhor divisão em cada nó. É aplicado para minimizar o risco dentro do nó ou para maximizar o grau de separação entre os nós.

O tamanho mínimo do nó é o menor número de observações necessárias para que um nó seja dividido ainda mais. Isso ajuda a controlar o tamanho da árvore e evita o sobreajuste.

Finalmente, o limite de poda é uma medida para decidir quando parar de podar a árvore.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for