“부트 스트랩”이라는 용어는 19 세기에 자기 개선 또는 외부의 도움없이 독립적으로 무언가를 성취하는 것에 대한 은유로 시작되었습니다. 이 개념은 통계적 부트스트래핑(statistical bootstrapping)으로 확장되는데, 이는 리샘플링을 통해 모집단 매개변수를 추정하는 독립적인 방법이지만, 계산 집약적일 수 있습니다. 1979년 미국 통계학자 브래들리 에프론(Bradley Efron) 박사가 개발한 부트스트래핑은 원래 표본 크기가 작거나 데이터가 복잡할 때 추론을 수행할 수 있는 강력한 방법을 제공합니다.
부트스트랩 리샘플링이라고도 하는 부트스트래핑은 기존 데이터 세트에서 대체와 함께 여러 무작위 샘플을 추출하여 샘플링 프로세스를 시뮬레이션합니다. 여기서 원래 표본은 대체 “모집단” 역할을 하며 각 재표본은 이 “모집단”에서 추출한 독립 표본으로 취급됩니다. 기본 가정은 원래 표본이 더 넓은 모집단을 잘 대표한다는 것입니다. 이 접근 방식은 희귀 화석, 고대 게놈 샘플, 희귀 질병의 조직, 멸종 위기에 처한 종 연구 및 쉽게 반복할 수 없는 고유한 실험을 사용한 연구와 같이 샘플 크기가 제한된 경우에 특히 유용합니다.
부트스트래핑의 기본 프로세스에는 다음 단계가 포함됩니다.
리샘플링은 복원추출이 있기 때문에 각각의 새 샘플에는 원래 데이터의 반복된 값이 포함될 수 있으며, 이는 리샘플링 프로세스의 임의성을 반영합니다. 부트스트래핑은 일반적으로 안정적인 추정치를 얻기 위해 많은 수의 재표본(종종 1,000개 이상)이 필요하며, 이를 사용하여 모집단 모수에 대한 평균, 분산, 표준 오차 또는 신뢰 구간과 같은 통계량을 계산할 수 있습니다.
부트스트래핑은 비용 효율적이고 접근성이 뛰어나 추가 데이터 없이 추론할 수 있는 간단한 방법을 제공합니다. 그러나 원래 샘플에 크게 의존하므로 원본 데이터의 편향이나 오류가 부트스트랩된 결과에도 존재할 수 있습니다.
부트스트래핑은 이미 수집된 표본에서 무작위로 추출한 표본을 복원하여 사용하는 리샘플링 방법입니다.
고생물학자가 단지 5개의 화석 표본으로 선사 시대 곤충 종의 평균 날개 길이를 알아내려고 한다고 상상해 보라.
더 나은 추론을 위해서는 더 높은 표본 크기가 바람직하지만, 더 많은 화석을 얻을 수 있는 방법은 없습니다. 이러한 경우 부트스트랩 리샘플링 방법이 유용합니다.
5개 표본에서 얻은 이 데이터는 평균 길이가 10.7cm임을 나타냅니다.
부트스트래핑을 시작하려면 원래 표본 세트에서 표본을 무작위로 추출합니다.
이 샘플은 원래 샘플과 샘플 크기가 동일하지만 일부 값이 반복됩니다. 이는 부트스트랩 리샘플링이 완전히 무작위이기 때문에 발생합니다.
평균 날개 길이 분포를 추정하기 위해 이러한 여러 부트스트랩 샘플이 추출됩니다. 이러한 방식으로 모집단 평균을 보다 정확하게 추정하기 위해 신뢰 구간을 얻을 수도 있습니다.
부트스트래핑은 쉽고 비용 효율적이지만 제한된 샘플에 의존합니다. 이러한 표본이 편향되거나 잘못 수집된 경우 부트스트랩 리샘플링은 원래 표본과 마찬가지로 편향되거나 오류가 있는 상태로 유지됩니다.
Related Videos
Nonparametric Statistics
683 views
Nonparametric Statistics
231 views
Nonparametric Statistics
761 views
Nonparametric Statistics
119 views
Nonparametric Statistics
80 views
Nonparametric Statistics
109 views
Nonparametric Statistics
109 views
Nonparametric Statistics
112 views
Nonparametric Statistics
167 views
Nonparametric Statistics
593 views
Nonparametric Statistics
695 views
Nonparametric Statistics
742 views
Nonparametric Statistics
641 views
Nonparametric Statistics
629 views
Nonparametric Statistics
634 views
Nonparametric Statistics
210 views
Nonparametric Statistics
72 views
Nonparametric Statistics
425 views
Nonparametric Statistics
172 views
Nonparametric Statistics
276 views
Nonparametric Statistics
194 views
Nonparametric Statistics
296 views