13.10: 부트스트랩

Bootstrapping
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Bootstrapping
Please note that all translations are automatically generated. Click here for the English version.

593 Views

01:24 min
January 09, 2025

Overview

“부트 스트랩”이라는 용어는 19 세기에 자기 개선 또는 외부의 도움없이 독립적으로 무언가를 성취하는 것에 대한 은유로 시작되었습니다. 이 개념은 통계적 부트스트래핑(statistical bootstrapping)으로 확장되는데, 이는 리샘플링을 통해 모집단 매개변수를 추정하는 독립적인 방법이지만, 계산 집약적일 수 있습니다. 1979년 미국 통계학자 브래들리 에프론(Bradley Efron) 박사가 개발한 부트스트래핑은 원래 표본 크기가 작거나 데이터가 복잡할 때 추론을 수행할 수 있는 강력한 방법을 제공합니다.

부트스트랩 리샘플링이라고도 하는 부트스트래핑은 기존 데이터 세트에서 대체와 함께 여러 무작위 샘플을 추출하여 샘플링 프로세스를 시뮬레이션합니다. 여기서 원래 표본은 대체 “모집단” 역할을 하며 각 재표본은 이 “모집단”에서 추출한 독립 표본으로 취급됩니다. 기본 가정은 원래 표본이 더 넓은 모집단을 잘 대표한다는 것입니다. 이 접근 방식은 희귀 화석, 고대 게놈 샘플, 희귀 질병의 조직, 멸종 위기에 처한 종 연구 및 쉽게 반복할 수 없는 고유한 실험을 사용한 연구와 같이 샘플 크기가 제한된 경우에 특히 유용합니다.

부트스트래핑의 기본 프로세스에는 다음 단계가 포함됩니다.

  1. 모집단에서 크기 n의 초기 표본을 수집하여 관심 있는 모수를 추정합니다.
  2. 이 표본을 “모집단”으로 취급합니다.
  3. 무작위 표본추출을 사용하여 원래 표본에서 n 크기의 새 표본 여러 개를 추출합니다.
  4. 이러한 “부트스트랩 리샘플”을 분석에 사용하여 원하는 매개변수를 추정합니다.

리샘플링은 복원추출이 있기 때문에 각각의 새 샘플에는 원래 데이터의 반복된 값이 포함될 수 있으며, 이는 리샘플링 프로세스의 임의성을 반영합니다. 부트스트래핑은 일반적으로 안정적인 추정치를 얻기 위해 많은 수의 재표본(종종 1,000개 이상)이 필요하며, 이를 사용하여 모집단 모수에 대한 평균, 분산, 표준 오차 또는 신뢰 구간과 같은 통계량을 계산할 수 있습니다.

부트스트래핑은 비용 효율적이고 접근성이 뛰어나 추가 데이터 없이 추론할 수 있는 간단한 방법을 제공합니다. 그러나 원래 샘플에 크게 의존하므로 원본 데이터의 편향이나 오류가 부트스트랩된 결과에도 존재할 수 있습니다.

Transcript

부트스트래핑은 이미 수집된 표본에서 무작위로 추출한 표본을 복원하여 사용하는 리샘플링 방법입니다.

고생물학자가 단지 5개의 화석 표본으로 선사 시대 곤충 종의 평균 날개 길이를 알아내려고 한다고 상상해 보라.

더 나은 추론을 위해서는 더 높은 표본 크기가 바람직하지만, 더 많은 화석을 얻을 수 있는 방법은 없습니다. 이러한 경우 부트스트랩 리샘플링 방법이 유용합니다.

5개 표본에서 얻은 이 데이터는 평균 길이가 10.7cm임을 나타냅니다.

부트스트래핑을 시작하려면 원래 표본 세트에서 표본을 무작위로 추출합니다.

이 샘플은 원래 샘플과 샘플 크기가 동일하지만 일부 값이 반복됩니다. 이는 부트스트랩 리샘플링이 완전히 무작위이기 때문에 발생합니다.

평균 날개 길이 분포를 추정하기 위해 이러한 여러 부트스트랩 샘플이 추출됩니다. 이러한 방식으로 모집단 평균을 보다 정확하게 추정하기 위해 신뢰 구간을 얻을 수도 있습니다.

부트스트래핑은 쉽고 비용 효율적이지만 제한된 샘플에 의존합니다. 이러한 표본이 편향되거나 잘못 수집된 경우 부트스트랩 리샘플링은 원래 표본과 마찬가지로 편향되거나 오류가 있는 상태로 유지됩니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for