3.12: Перекос

Skewness
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Skewness
Please note that all translations are automatically generated. Click here for the English version.

11,003 Views

01:06 min
April 30, 2023

Overview

Меры центральной тенденции, рассчитанные на основе набора данных, могут не раскрывать много информации о его внутреннем распределении. Если график построен из значений набора данных, среднее и медиана могут не только отличаться, но и график может иметь больше значений по одну сторону от центральных тенденций. Говорят, что такой набор данных смещен в эту сторону.

Чем длиннее хвост участка с одной стороны, тем сильнее он перекошен. Асимметрия значений набора данных предполагает, что измерения центральной тенденции несколько грубы, в них отсутствуют более мелкие детали. В симметричном распределении среднее, медиана и мода одинаковы, в то время как в асимметричном распределении или асимметричном наборе данных среднее и медиана лежат слева или справа от моды.

Например, среднее распределение доходов в стране не проливает много света на ее неравенство доходов. В то время как некоторые самые богатые люди могут зарабатывать много, большинство населения может зарабатывать ужасно. Таким образом, распределение доходов представляет собой искаженный набор данных.

Transcript

Сравнение среднего, медианы и моды позволяет получить информацию о том, как распределяются данные.

В этом примере диаграммы левая часть диаграммы является зеркальным отражением правой стороны. Это называется симметричным или нормальным распределением данных.

На таком нормально распределенном графике среднее, медиана и мода лежат в одном и том же положении, обозначенном пунктирной линией.

Предположим, что левая и правая части графика не совпадают; это приводит к асимметрии в распределении. Здесь среднее, медиана и мода не совпадают и отражают разные значения в наборе данных.

Асимметрия указывает на наличие выбросов. Например, в этом случае выбросы присутствуют в правой части графика.

Асимметрия часто используется для принятия инвестиционных решений. Асимметрия в доходности инвестиционной модели указывает на то, будут ли инвестиции давать частые меньшие прибыли и небольшие огромные убытки; или частые проигрыши и несколько крупных выигрышей.

Key Terms and definitions​

  • Skewness in Statistics - Refers to a data set's asymmetry around its mean.
  • Mean - Represents the average value from a data set.
  • Median - The middle value in an ordered data set.
  • Skewed Distribution - Data set where values cluster more on one side of the scale.
  • Income Distribution Skewness - Describes income inequality in a population.

Learning Objectives

  • Define Skewness – Understand its relationship with data set distribution (e.g., skewness in statistics).
  • Contrast Mean and Median – Understand how they can differ in skewed data sets (e.g., skewness mean median).
  • Explore Distribution Examples – Look at income inequality as an example (e.g., income distribution skewness).
  • Explain Skewed Distribution – Understand how data concentrates more on one side of the scale.
  • Apply in Data Analysis Context – Understand how skewness interpretation can influence data analysis.

Questions that this video will help you answer

  • What is skewness in statistics and how does it relate to mean and median?
  • What can a skewed distribution reveal in a dataset?
  • In what way does income distribution skewness demonstrate the concept?

This video is also useful for

  • Data Analysts – Understand how skewness interpretation supports data analysis.
  • Educators – Provides a framework to teach statistical distribution and central tendency.
  • Economists – Relevant for interpreting socioeconomic data like income distribution.
  • Statistics Students – Offers insights into concepts like skewness, mean, and median.