JoVE Core
Statistics
Chapter 5: Measures of Relative Standing
5.5:
四分位数
四分位数是将数据分成季度的数字。四分位数可能是也可能不是数据的一部分。要查找四分位数,首先,找到中位数或第二个四分位数。第一个四分位数 Q1 是数据下半部分的中间值,第三个四分位数 Q3 是数据上半部分的中间值或中位数。要获得这个想法,请考虑相同的数据集:
1; 1; 2; 2; 4; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5
中位数或第二个四分位数为 7。数据的下半部分是 1、1、2、2、4、6 和 6.8。下半部分的中间值为 2。1;1;2;2;4;6;6.8. 数字 2 是数据的一部分,是第一个四分位数。整个值集的四分之一等于或小于 2,四分之三的值大于 2。数据的上半部分是 7.2、8、8.3、9、10、10 和 11.5。上半部分的中间值为 9。
第三个四分位数 Q3 是 9。四分之三 (75%) 的有序数据集小于 9。四分之一 (25%) 的有序数据集大于 9。在此示例中,第三个四分位数是数据集的一部分。
四分位间距是一个数字,表示数据的中间部分或中间 50% 的分布。它是第三个四分位数 (Q3) 和第一个四分位数 (Q1) 之间的差值。
IQR = 问题3 – 问题1
IQR 可以帮助确定潜在的异常值。如果某个值比第一个四分位数低 (1.5)(IQR) 或高于第三个四分位数 (1.5)(IQR),则怀疑该值是潜在的异常值。
本文改编自 Openstax, 统计介绍, 第 2.3 节 数据位置的度量
四分位数是相对地位的度量,它将一组数据分为四组,每组占 25% 的数据。
例如,要从各种猫科动物的体重调查中查找四分位数,首先,从最低到最高排列数据。然后,找到将较低 50% 的数据与较高的 50% 数据分开的值。这是第二个四分位数或中位数。
第一个和第三个四分位数使用此公式计算。对于第一个四分位数,公式产生第 2.5 个值。这意味着第一个四分位数介于第 2 个和第 3 个值之间,即 43。同样,将计算第三个四分位数。
四分位数间距是第三个和第一个四分位数之间的差值。它表示数据中间一半或中间 50% 数据之间的分布。
四分位间距有助于识别潜在的异常值。所有超出第一四分位数 1.5 倍 IQR 或高于第三个四分位数 1.5 倍 IQR 的数据点都被视为异常值。
Related Videos
Measures of Relative Standing
7.6K 浏览
9.7K 浏览
9.9K 浏览
6.8K 浏览
4.3K 浏览
4.5K 浏览
8.3K 浏览
3.9K 浏览
9.8K 浏览