표본 크기에 대한 지식은 무작위 표본 추출 또는 실험을 수행하기 위한 첫 번째 요구 사항입니다. 표본 크기는 모집단 모수를 추정하기 위해 데이터를 가져오는 데 사용되는 단위, 관측치 또는 그룹(경우에 따라)의 총 수입니다. 이름에서 알 수 있듯이 표본 크기는 모집단에서 추출한 표본의 표본 크기이며 모집단 크기와 다릅니다.
주어진 실험 또는 표본 추출 노력에 대한 표본 크기는 모든 연구 설계의 기본입니다. 표본 크기는 연구에 활용할 노력, 시간, 자금 또는 기타 자원의 수를 결정합니다. 통계적 테스트의 추정 및 유형도 종종 표본 크기를 기반으로 하기 때문에 결정은 임의적일 수 없습니다. 표본 크기를 임의로 결정하면 결과를 적절하게 해석할 수 없습니다. 표본 크기가 너무 작으면 결론이 편향되거나 잘못된 결론이 나오고, 표본이 너무 크면 데이터를 분석할 때 처리하기 어려운 경우가 많습니다.
표본 크기에 대한 결정은 복잡하게 들리지만 주어진 모집단 매개변수에 대한 적절한 표본 크기를 추정하는 더 간단한 방법이 있습니다. n으로 표시되는 표본 크기(모집단 크기는 N으로 표시)는 오차 한계 공식을 사용하여 추정됩니다. 표본 비율을 알고 있는 경우 점 추정치의 실제 값이 사용됩니다. 모집단 비율을 알 수 없는 경우 0.5로 가정할 수 있으며 표본 크기 계산이 수행됩니다. 마찬가지로, 표본 크기는 모집단 평균 또는 분산을 고려할 때 추정할 수도 있습니다.
표본 크기 결정은 주로 미리 결정된 유의 수준(또는 신뢰 수준), 데이터 및 표본의 분포, 미리 결정된 오차 한계(일반적으로 0.03에서 0.05 사이)에 따라 달라집니다. 표본 크기는 모집단 크기가 아니라 원하는 신뢰 수준과 오차 한계에 따라 달라집니다. 오차 한계와 신뢰 수준은 연구 질문, 가설, 변동량, 표본의 가용성, 모집단의 접근성, 자원 또는 노력의 양에 따라 결정되어야 합니다.
Transcript
통계량에서 n으로 표시되는 표본 크기는 관측치 수 또는 반복실험 수를 나타낼 수 있습니다.
열대우림의 법적 보호를 위한 설문조사의 예시에서 총 응답자 수(10,000명)가 표본 크기입니다. 그러나 이것은 임의로 결정된 숫자입니다.
예를 들어, 더 많은 표본 비율을 얻기 위해 표본 크기를 결정하기 위해 이미 알려진 데이터를 다음과 같은 수정된 오차 한계 방정식에 사용할 수 있습니다.
여기에서는 알려진 표본에서 0.85의 표본 비율과 95% 신뢰 수준에서 1.96의 고정 임계값을 사용할 수 있습니다. 3% 오차 한계는 미리 결정되어 있지만 2%에서 5% 사이에서 선택할 수 있습니다.
따라서 n을 풀면 545가 됩니다.
표본 크기는 오차 한계와 임계값의 영향을 받지만 모집단 크기의 영향은 받지 않습니다. 즉, 신뢰 수준이 높거나 E의 값이 작을 때 표본 크기가 더 높습니다.
표본 크기를 결정하는 데 사용할 수 있는 비율 추정치가 없는 경우 0.5로 가정할 수 있습니다.