JoVE Core
Statistics
Chapter 5: Measures of Relative Standing
5.9:
修改后的箱线图
标准箱须图告诉我们给定样本中数据的分布情况。可以确定最小值、最大值、第一个四分位数值、第二个四分位数或中位数以及第三个四分位数。
但是,箱形图并不能告诉读者离群值 – 远离数据中心的值。我们可以修改标准箱须图来识别异常值并可视化样本中数据的实际分布。
最初,我们计算调整后的最小值和最大值来构建修改后的箱线图。修改后的最小值等于 Q1 的值减去四分位距乘以 1.5。接下来,我们可以计算修改后的最大值。它等于 Q3 的值加上四分位距的值乘以 1.5。
现在,标准箱形图的须线被修改。须线较短,且须线的边缘位于调整后的最小值和最大值处。此外,超出修改后的最小值和最大值的所有值都被视为异常值,并标有星号。
回想一下,数据集可以使用五个数字的摘要来表示,并使用具有最小值、第一个四分位数、第二个四分位数、第三个四分位数和最大值的箱线图进行可视化。
箱形图略有更改,以生成修改后的箱形图,该箱形图提供了对异常值位置和从中心分布的数据的更多可视化见解。
首先,从问题1 中减去 1.5 倍 IQR,然后将 1.5 倍 IQR 与问题3 相加,以获得新的最小值和最大值。超出这些限制的值被视为异常值,并标有星号。
现在修改晶须,仅连接 1.5 倍 IQR 范围内的值。
这将生成一个修改后的箱形图,其中包含明确标识的异常值。
Related Videos
Measures of Relative Standing
7.5K 浏览
9.7K 浏览
9.8K 浏览
6.8K 浏览
4.3K 浏览
4.5K 浏览
8.3K 浏览
3.9K 浏览