히스토그램은 데이터 세트에서 x-y 형식의 데이터 분포를 그래픽으로 표현한 것입니다. 수평 x축에는 데이터가 나타내는 내용(예: 집에서 학교까지의 거리)이 표시됩니다. 세로 y축은 주파수 또는 상대 주파수(또는 퍼센트 빈도 또는 확률)로 표시됩니다.
히스토그램 그래프는 연속적인(인접한) 상자로 구성됩니다. 막대의 높이는 주파수 값에 해당합니다. 그래프는 각 레이블과 동일한 모양을 갖습니다. 히스토그램(예: stemplot)은 데이터의 모양, 중심 및 분산을 제공할 수 있습니다. 일반적으로 히스토그램을 사용하여 크고 연속적인 정량적 데이터 세트를 표시합니다. 히스토그램의 가장 큰 장점은 큰 데이터 세트를 쉽게 표시할 수 있다는 것입니다. 일반적으로 데이터 세트가 100개 이상의 값으로 구성된 경우 히스토그램을 사용합니다. 히스토그램을 구성하려면 클래스라고도 하는 막대 또는 간격이 데이터를 나타내는 수를 결정할 수 있습니다. 많은 히스토그램은 명확성을 위해 5개에서 15개의 막대 또는 클래스로 구성되지만 필요한 막대 수를 선택할 수 있습니다.
Transcript
빈도 분포 테이블은 서로 다른 가격대의 책 수와 같은 여러 범주로 정량적 데이터를 구성하는 데 도움이 된다는 점을 기억하십시오.
이러한 빈도 분포 테이블은 히스토그램을 사용하여 시각적으로 표현할 수 있으며, 히스토그램은 간격 없이 그려진 동일한 너비의 막대로 구성된 그래프입니다.
세로 축은 각 클래스의 주파수를 나타내고 가로 축은 클래스 경계를 나타냅니다.
그렇다면, 계급 경계란 무엇일까요? 데이터 테이블의 첫 번째 간격은 5달러에서 10달러 사이의 가격을 보여주고 두 번째 간격은 11에서 16 사이의 가격 범위를 제공합니다.
10에서 11 사이의 가격대는 표에서 누락되었습니다. 이 간격은 클래스 경계라고 하는 중간점을 계산하여 채워집니다.
이러한 클래스 경계는 가로 축에 표시되고 해당 주파수는 세로 축에 표시됩니다. Bin이라고 하는 세로 막대는 클래스 경계와 빈도 값을 연결합니다.