RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
ko_KR
Menu
Menu
Menu
Menu
Please note that some of the translations on this page are AI generated. Click here for the English version.
데이터 세트의 "중심"은 위치를 설명하는 방법이기도 합니다. 데이터의 "중심"에 대해 가장 널리 사용되는 두 가지 측정값은 평균(평균)과 중앙값입니다. "평균"과 "평균"이라는 단어는 종종 같은 의미로 사용됩니다. 한 단어를 다른 단어로 대체하는 것이 일반적인 관행입니다. 기술 용어는 "산술 평균"이고 "평균"은 기술적으로 중심 위치입니다. 그러나 실제로 통계학자가 아닌 사람들 사이에서는 "산술 평균"으로 "평균"이 일반적으로 받아들여집니다.
중심의 또 다른 척도는 최빈값입니다. mode는 가장 빈번한 값입니다. 데이터 세트에 동일한 횟수로 발생하는 두 개의 값이 있는 경우 세트는 바이모달입니다.
평균과 중앙값 계산
50명의 평균 체중을 계산하려면 50개의 가중치를 더하고 50으로 나눕니다. 50명의 체중 중앙값을 구하려면 데이터를 정렬하고 데이터를 동일한 두 부분으로 분할하는 숫자를 찾습니다(이 장의 상자 그림에서 이전에 설명). 중앙값은 일반적으로 극단값이나 이상값이 있을 때 중심을 더 잘 측정하는데, 이는 이상값의 정확한 수치에 영향을 받지 않기 때문입니다. 평균은 중심의 가장 일반적인 측도입니다.
평균은 각 고유 값에 빈도를 곱한 다음 합계를 총 데이터 값 수로 나누어 계산할 수도 있습니다. 표본 평균을 나타내는 데 사용되는 문자는 위에 막대가 있는 x입니다("x bar"로 발음).
그리스 문자 μ("mew"로 발음)는 인구 평균을 나타냅니다. 표본 평균이 모집단 평균의 좋은 추정치가 되기 위한 요구 사항 중 하나는 표본이 실제로 랜덤해야 한다는 것입니다.
(n+1)/2 표현식을 사용하여 중앙값의 위치를 빠르게 찾을 수 있습니다. 문자 n은 샘플에 있는 총 데이터 값 수입니다. n이 홀수인 경우 중앙값은 정렬된 데이터의 중간 값입니다(가장 작은 값에서 가장 큰 순으로 정렬). n이 짝수인 경우 중앙값은 데이터를 정렬한 후 두 개의 중간 값을 더하고 2로 나눈 값과 같습니다. 예를 들어, 총 데이터 값 수가 97인 경우 (n+1)/2 = (97+1)/2 = 49입니다. 중앙값은 정렬된 데이터의 49번째 값입니다. 총 데이터 값 수가 100이면 (n+1)/2 = (100+1)/2 = 50.5입니다. 중앙값은 50번째 값과 51번째 값 사이의 중간에 발생합니다. 중앙값의 위치와 중앙값의 값은 동일하지 않습니다.
이 텍스트는 Barbara Illowsky, Ph.D., Susan Dean, Collaborative Statistics에서 발췌한 것입니다. 오픈스택스 CNX.
연구자들은 종종 중심 경향에 대한 특정 척도(전체 데이터 포인트 집합을 나타내는 하나의 점수)를 사용하여 데이터를 요약합니다.
가장 간단한 측정은 가장 자주 발생하는 점수인 최빈번한 방법으로, 전문직과 같은 범주형 데이터의 총계를 계산할 때 유용합니다. 여기서 모드는 보고된 직업의 대부분을 구성하기 때문에 작가로 표시됩니다.
또 다른 측정값은 중앙값으로, 크기 순으로 정렬된 숫자 데이터 집합의 실제 중간점입니다. 여기서 급여의 중간값은 $65,000이며, 직원의 절반은 이 중간 수준 이하로 급여를 받습니다. 값의 수가 짝수인 경우 두 중간 숫자의 평균이 중앙값을 결정합니다.
마지막으로, 숫자 데이터에 대한 가장 일반적인 측정값은 평균(산술 평균)이며, 이는 모든 숫자 점수의 총 합을 데이터 포인트의 수로 나눈 값과 같습니다.
예를 들어, 모든 소득의 총합을 고용된 사람의 수로 나누면 이 경우 평균 $140,000가 됩니다. 이 측정값은 계산을 위해 데이터 세트의 모든 값을 고려하기 때문에 연구자들은 일반적으로 평균을 보고하는 것을 선호합니다.
정규 분포에서 최빈값, 평균, 중위수는 거의 동일한 값을 가지며 곡선의 중심에 정확히 배치됩니다. 그러나 치우친 분포에서는 매우 높거나 매우 낮은 점수가 더 널리 퍼져 있고 가중치가 더 높을 때 이러한 측정값이 동일하지 않습니다.
참가자의 대다수가 낮은 소득을 보고한 경우, 소수의 매우 높은 소득 점수로 인해 평균이 상승할 것입니다. 따라서 극한 값에 대한 평균의 민감도는 데이터가 인위적으로 높거나 낮게 표현되는 결과를 초래할 수 있습니다. 이 경우 중앙값 또는 최빈값이 더 정확한 측정 역할을 합니다.
결국, 중심 경향을 가장 잘 측정하는 방법은 현재 데이터의 분포 패턴을 고려하는 것입니다.
Related Videos
Research Methods
66.7K Views
Research Methods
13.8K Views
Research Methods
17.9K Views
Research Methods
17.2K Views
Research Methods
17.5K Views
Research Methods
13.6K Views
Research Methods
12.8K Views
Research Methods
11.0K Views
Research Methods
15.0K Views
Research Methods
6.9K Views
Research Methods
13.8K Views
Research Methods
26.1K Views
Research Methods
36.9K Views
Research Methods
12.6K Views
Research Methods
14.2K Views
Research Methods
7.3K Views
Research Methods
29.8K Views
Research Methods
23.2K Views