생존 분석은 “이벤트”가 사망, 질병 재발, 시스템 장애 또는 회복과 같은 결과를 나타낼 수 있는 이벤트 시간까지의 데이터를 연구하는 데 사용되는 통계적 방법입니다. 생존 데이터의 고유한 특징은 중도절단(censoring)인데, 이는 연구 기간 동안 일부 개인에 대해 관심 있는 사건이 관찰되지 않았을 때 발생합니다. 이를 위해서는 불완전한 데이터를 효과적으로 처리할 수 있는 특수 기술이 필요합니다.
생존 분석의 주요 목표는 생존 시간(지정된 사건이 발생할 때까지의 시간)을 추정하고 이에 영향을 미치는 요인을 이해하는 것입니다. 주요 개념에는 주어진 시간 이후에 생존할 확률을 제공하는 생존 함수(S(t))와 언제든지 순간적인 사건 발생률을 설명하는 위험 함수(h(t))가 포함됩니다. 이러한 함수는 시간 경과에 따른 생존 패턴과 위험에 대한 통찰력을 제공합니다.
일반적인 방법으로는 생존 곡선을 생성하고 그룹 간의 생존율을 비교할 수 있는 비모수 접근법인 Kaplan-Meier 추정기와 생존 시간에 대한 특정 분포를 가정하지 않고 공변량이 생존에 미치는 영향을 조사하는 반모수 방법인 Cox 비례 위험 모형이 있습니다.
생존 분석은 치료 효과를 평가하고 환자 결과를 예측하기 위해 의학에서, 엔지니어링에서 제품 수명을 추정하기 위해, 사회 과학에서 실업 또는 수명 주기와 같은 기간을 분석하기 위해 광범위하게 사용됩니다. 중도절단된 데이터를 처리하고 시간 종속 현상을 모델링하는 능력은 다양한 분야의 결과를 이해하고 예측하는 데 필수적인 도구입니다.
Transcript
생물 의학 연구의 다음 세 가지 예를 고려하십시오.
첫째, 암 연구에서는 환자가 관해에 접어든 시점부터 재발까지의 시간을 분석합니다.
둘째, 치아 건강에 관한 소아과 연구는 아이가 태어날 때부터 충치로 인해 첫 치아를 채울 때까지의 시간을 측정합니다.
셋째, 관상동맥 우회술에 관한 연구는 수술부터 환자의 사망까지의 시간을 분석합니다.
이러한 연구는 미리 결정된 시작 지점부터 특정 이벤트 발생까지의 시간을 캡처하는 종단 데이터를 생성합니다. 생존 분석은 이러한 데이터를 분석하기 위한 프레임워크를 제공합니다.
생존 분석에서 ‘사건’은 질병 재발, 사망 또는 회복과 같은 관심 있는 경험을 나타냅니다.
생존 분석에서 ‘시간’은 연구 시작, 중재 또는 사례의 첫 번째 보고부터 연구 종료, 관심 사건의 발생 또는 환자의 사망 사이의 기간을 측정합니다.