평균으로의 회귀(“RTM”)는 매우 높거나 낮은 값(예: 특정 순간의 개인의 혈압)이 측정 시 그룹의 평균에 더 가깝게 나타나는 현상입니다. 이러한 통계적 특이성은 무작위 오류와 우연의 결과이지만 다양한 의학적, 과학적, 금융적, 심리학적 응용 분야에서 문제가 되어 왔습니다. 특히, RTM을 고려하지 않으면 연구자가 작은 표본에서 관찰된 결과를 더 많은 관심 모집단에 외삽하려고 할 때 방해가 될 수 있습니다.
기술 통계, 추론 통계 및 RTM
통계 분야에는 기술적(descriptive)과 추론적(inferential)이라는 두 가지 주요 하위 범주가 있습니다(검토를 위해 Beins & McCarthy, 2019 및 Franzoi, 2011 참조). 이름에서 알 수 있듯이 전자는 특정 샘플, 예를 들어 임신 중 임산부용 비타민을 복용한 산모가 있는 특정 미국 병원의 신생아와 같은 샘플에서 파생된 데이터를 “설명”하려고 합니다. 기술 통계에는 일반적으로 중심 경향의 측도(예: 평균), 변동성 측도(예: 표준 편차) 및 표본 결과를 요약하는 그래프가 포함됩니다. 예를 들어, 신생아 예제에 대한 설명 통계에는 평균 출생 체중 및 표준 편차뿐만 아니라 작년 이내에 병원에서 태어난 아기의 출생 체중의 빈도 분포 그래프가 포함될 수 있습니다. 중요한 것은, 기술 통계는 조사 대상인 표본에만 관련되며, 그 자체로는 더 많은 모집단(이 경우 미국에서 산전 피임약을 복용한 산모에게서 태어난 모든 신생아)에 대한 결론을 도출하는 데 사용할 수 없다는 것입니다.
대조적으로, 추론 통계는 연구자가 대표 표본에 대해 계산된 결과를 기반으로 모집단에 대한 결론을 “추론”하거나 도출하는 데 사용됩니다. 여기서 연구자들은 병원에서 태어난 아기의 평균 출생 체중을 산전을 산모가 하지 않은 신생아의 평균 출생 체중과 비교할 수 있습니다. 처음에는 태아가 그렇지 않은 아기보다 평균 출생 체중이 더 높다는 것을 관찰할 수 있습니다. 추론 통계는 복잡한 수학 방정식을 사용하여 이 두 평균 간의 차이가 유의한지 여부를 결정할 수 있으며, 과학에서는 우연에 의한 확률이 5% 미만인 것으로 정의됩니다. 만약 이것이 사실이라면, 더 많은 인구에 대한 결론을 이끌어 낼 수 있다 – 이 경우, 전국적으로 산전 피임약을 복용한 어머니의 신생아가 그렇지 않은 신생아보다 출생 체중이 더 높다는 것이다.
불행히도, RTM은 실제로는 의미 있는 차이가 존재하지 않고 모든 불일치가 무작위적인 우연의 결과임에도 불구하고 위의 산전 약물과 같은 치료로 인해 그룹 간에 상당한 차이가 있는 것처럼 보이게 할 수 있습니다. 때때로 연구자들은 특정 요법이 효과적이었다는 데이터를 발표하기도 하지만, 실제로는 이러한 통계적 현상에서 결과가 비롯됩니다. 아동 비만을 대상으로 하는 프로그램들이 이러한 경우였다(Skinner, Heymsfield, Pietrobelli, Faith, & Allison, 2015). 다행히도 RTM을 평가하고 고려하는 추론 통계 방법이 개발되어 연구자들은 데이터의 진실성과 모든 치료의 효능에 대해 더 확신할 수 있습니다(Barnett, van der Pols & Dobson, 2005).
다양한 분야의 RTM
RTM은 광범위한 영향을 미칩니다. 의학 및 과학 연구에서 혈압(Bland & Altman, 1994), 여성의 골밀도(Cummings, Palermo, Browner, et al., 2000), 태아 심박수(Park, Hoh, & Park, 2012), 심지어 정액의 질(Baker & Kovacs, 1985)에서도 관찰되었습니다. 그러나 RTM은 의학적 관찰을 넘어 주식 시장(Murstein, 2003), 비행 학생들의 성과(Kahneman & Tversky, 1973)에 기록되었으며, 특정 부부가 이혼하는 이유에 대한 설명으로 사용되기도 했습니다(Murstein, 2003에서 검토). 따라서 이러한 통계적 현상은 의학에서 금융에 이르기까지 수많은 분야에 영향을 미치며, 연구자들은 통계를 사용하여 결론을 도출하기 위해 신중하게 고려해야 합니다.
때때로 사람들은 특정 사건이 개인적으로 통제할 수 있다고 생각합니다. 예를 들어, 그들은 자신이 좋아하는 운동 선수가 항상 최고의 성과를 낼 것이라고 가정할 수 있으며, 따라서 놀라운 성과가 평균적인 성과로 이어질 때 놀랄 수 있습니다.
특히 이러한 경향은 정규 분포를 가진 다중 변수에서 발생합니다. 예를 들어, 의사가 환자의 혈압을 측정하면 이완기 수치는 95mmHg입니다.
그런 다음 의사는 이 숫자를 입력하여 모든 환자의 숫자와 비교하고, 그래프로 표시했을 때 이 값이 정규 종 모양의 분포를 나타낸다는 점에 주목합니다.
여기서 여성의 결과는 곡선의 맨 끝에 있습니다. 걱정이 된 의사는 그녀의 혈압을 다시 검사합니다. 놀랍게도, 그는 이완기 숫자가 감소했다는 것을 발견한다.
즉, 이전에 관찰된 “극한” 압력이 모든 환자의 평균으로 회귀한 것입니다. 누군가의 결과가 더 높은 수준에서도 반복적으로 평균에서 멀어지는 경우는 드뭅니다.
이러한 경향을 평균으로의 회귀라고 하며, 재평가 시 극단적인 값이 뒤따르고 그 다음에는 덜 급진적인 점수가 뒤따르며 본질적으로 그룹 평균에 더 가까워지는 경향입니다.
결과적으로, 치료법이 초기에 극단적인 결과를 보이는 개인에게만 영향을 미친다면, 이는 비효율적인 전략일 가능성이 높다. 그러나 혈압과 같이 치료법이 그룹의 평균을 낮추는 경우 이는 성공의 강력한 증거입니다.
이러한 통계적 현상을 인식하지 못했다면, 의사는 실제로 환자에게 치료가 필요하지 않았음에도 불구하고 혈압약을 배포했을 수 있습니다.
결국 이상값을 기반으로 한 결과를 너무 심각하게 받아들여서는 안 됩니다.
Related Videos
Research Methods
59.0K views
Research Methods
11.5K views
Research Methods
15.3K views
Research Methods
14.7K views
Research Methods
15.9K views
Research Methods
11.8K views
Research Methods
11.1K views
Research Methods
8.9K views
Research Methods
12.8K views
Research Methods
6.1K views
Research Methods
10.6K views
Research Methods
22.9K views
Research Methods
32.1K views
Research Methods
10.8K views
Research Methods
12.6K views
Research Methods
6.3K views
Research Methods
15.7K views
Research Methods
22.0K views
Research Methods
19.9K views