데이터 세트에서 5개 숫자 요약에는 최소 데이터 값, 첫 번째 사분위수의 데이터 값, 두 번째 사분위수의 중앙값 또는 데이터 값, 세 번째 사분위수의 데이터 값 및 최대 데이터 값이 포함됩니다. 이러한 5가지 데이터 값은 상자 및 수염 플롯으로 시각화할 수 있습니다.
상자 그림에서 최소 및 최대 데이터 값은 그래프의 아래쪽 및 위쪽 수염을 나타내며 중앙값은 차트에서 상자의 중심으로 지정됩니다. 첫 번째 사분위수 및 세 번째 사분위수 데이터 값은 상자 및 수염 그림에서 상자의 아래쪽 및 위쪽 가장자리로 표시됩니다.
이 5자리 숫자 요약은 데이터의 확산을 빠르게 이해하고 이상값을 식별하는 데 유용합니다.
상점에서 판매된 도넛의 수가 포함된 데이터셋의 예를 생각해 보겠습니다. 5개 숫자 요약을 얻기 위해 연구자는 처음에 데이터 세트의 값을 오름차순으로 정렬하여 최소값, 최대값 및 중앙값 데이터 값을 결정할 수 있습니다. 그런 다음 올바른 공식을 사용하여 연구자는 첫 번째 및 세 번째 사분위수의 데이터 값을 결정할 수 있습니다. 또한 이러한 값을 사용하여 상자 및 수염 플롯을 구성할 수 있습니다.
Transcript
데이터 세트의 5개 숫자 요약에는 최소값, 첫 번째 사분위수, 중앙값 또는 두 번째 사분위수, 세 번째 사분위수 및 최대값이 포함됩니다.
예를 들어, 작은 상점에서 매달 판매되는 도넛의 수를 생각해 보십시오.
먼저 데이터를 낮은 값에서 높은 값으로 재정렬하여 매월 판매되는 최소 및 최대 도넛을 결정합니다. 중앙값은 두 번째 사분위수를 나타냅니다.
이 공식을 사용하여 첫 번째 사분위수와 세 번째 사분위수를 계산하여 5개 숫자 요약의 5개 구성 요소를 모두 결정합니다.
이는 데이터 세트의 개요 이미지를 나타내며, 각 값은 데이터의 특정 부분을 설명합니다: 중앙값은 중심을 식별하고, 상위 및 하위 사분위수는 중간 절반에 걸쳐 있으며, 가장 높은 관측치와 가장 낮은 관측치는 실제 데이터 분산을 설명합니다.
5개 숫자 요약은 상자 그림을 사용하여 시각적으로 표시됩니다. 이를 통해 이상값, 스프레드 및 데이터 범위를 쉽게 파악할