5.5: 四分位数

Quartile
JoVE Core
Statistics
This content is Free Access.
JoVE Core Statistics
Quartile
Please note that all translations are automatically generated. Click here for the English version.

4,276 Views

01:15 min
April 30, 2023

Overview

四分位数是将数据分成季度的数字。四分位数可能是也可能不是数据的一部分。要查找四分位数,首先,找到中位数或第二个四分位数。第一个四分位数 Q1 是数据下半部分的中间值,第三个四分位数 Q3 是数据上半部分的中间值或中位数。要获得这个想法,请考虑相同的数据集:

1; 1; 2; 2; 4; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

中位数或第二个四分位数为 7。数据的下半部分是 1、1、2、2、4、6 和 6.8。下半部分的中间值为 2。1;1;2;2;4;6;6.8. 数字 2 是数据的一部分,是第一个四分位数。整个值集的四分之一等于或小于 2,四分之三的值大于 2。数据的上半部分是 7.2、8、8.3、9、10、10 和 11.5。上半部分的中间值为 9。

第三个四分位数 Q3 是 9。四分之三 (75%) 的有序数据集小于 9。四分之一 (25%) 的有序数据集大于 9。在此示例中,第三个四分位数是数据集的一部分。

四分位间距是一个数字,表示数据的中间部分或中间 50% 的分布。它是第三个四分位数 (Q3) 和第一个四分位数 (Q1) 之间的差值。

IQR = 问题3问题1

IQR 可以帮助确定潜在的异常值。如果某个值比第一个四分位数低 (1.5)(IQR) 或高于第三个四分位数 (1.5)(IQR),则怀疑该值是潜在的异常值。

本文改编自 Openstax, 统计介绍, 第 2.3 节 数据位置的度量

Transcript

四分位数是相对地位的度量,它将一组数据分为四组,每组占 25% 的数据。

例如,要从各种猫科动物的体重调查中查找四分位数,首先,从最低到最高排列数据。然后,找到将较低 50% 的数据与较高的 50% 数据分开的值。这是第二个四分位数或中位数。

第一个和第三个四分位数使用此公式计算。对于第一个四分位数,公式产生第 2.5 个值。这意味着第一个四分位数介于第 2 个和第 3 个值之间,即 43。同样,将计算第三个四分位数。

四分位数间距是第三个和第一个四分位数之间的差值。它表示数据中间一半或中间 50% 数据之间的分布。

四分位间距有助于识别潜在的异常值。所有超出第一四分位数 1.5 倍 IQR 或高于第三个四分位数 1.5 倍 IQR 的数据点都被视为异常值。

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for