5.7: Diagrama de Caixa (Boxplot)

Boxplot
JoVE Core
Statistics
This content is Free Access.
JoVE Core Statistics
Boxplot

8,105 Views

01:12 min
April 30, 2023

Overview

Os gráficos de caixa (também chamados de gráficos de caixa e bigode ou gráficos de bigode de caixa) fornecem uma excelente imagem gráfica da concentração dos dados. Eles também mostram a que distância os valores extremos estão da maioria dos dados. Um gráfico de caixa é construído a partir de cinco valores: o valor mínimo, o primeiro quartil, a mediana, o terceiro quartil e o valor máximo. Usamos esses valores para comparar o quão próximos outros valores de dados estão deles. Para construir um gráfico de caixa, use uma reta numérica horizontal ou vertical e uma caixa retangular. Os menores e maiores valores de dados rotulam os pontos de extremidade do eixo. O primeiro quartil marca uma extremidade da caixa e o terceiro quartil marca a outra extremidade da caixa. Aproximadamente os 50% intermediários dos dados estão dentro da caixa. Os “bigodes” se estendem das extremidades da caixa até os menores e maiores valores de dados. A mediana ou segundo quartil pode estar entre o primeiro e o terceiro quartis, ou pode ser um, o outro ou ambos. O gráfico de caixa fornece uma imagem boa e rápida dos dados.

Este texto foi adaptado de Openstax, Estatísticas Introdutórias, Seção 2.4 Gráficos de caixa

Transcript

O boxplot, ou diagrama de caixa e bigode, é uma representação visual de um resumo de 5 números. O boxplot mostra o valor mínimo, o primeiro quartil, o segundo quartil, o terceiro quartil e o valor máximo. Ele também fornece informações sobre a disseminação dos dados, bem como os valores discrepantes.

Considere os dez maiores artilheiros das partidas da Copa do Mundo.

Para construir o boxplot, primeiro classifique o número de gols de baixo para alto e encontre o resumo de 5 números.

Crie o boxplot desenhando uma caixa retangular que se estende do quartil um ao quartil três, seguida por uma linha através da caixa no segundo quartil e uma linha conectando os valores mínimo e máximo.

Boxplots de distribuições normais normalmente mostram a mediana no centro de cada caixa, enquanto em uma distribuição assimétrica, a mediana se move para frente ou para trás.

Boxplots geralmente são úteis na comparação de dois ou mais conjuntos de dados diferentes. Por exemplo, comparar o número de gols marcados pela equipe campeã nas duas séries de partidas da copa do mundo revelaria como o desempenho da equipe mudou ao longo do tempo.

Key Terms and definitions​

  • Box Plot - Graphical representation of data concentration and extreme values.
  • Whiskers - Lines extending from the box plot depicting minimum and maximum data values.
  • Quartiles - The minimum, first quartile, median, third quartile, and maximum value shown in a box plot.
  • First Quartile - The value below which a quarter of data falls, depicted in the box plot.
  • Middle 50 - The range within the first and third quartile in a box plot, where approximately half the data points lie.

Learning Objectives

  • Define Box Plot – Explain the graphical representation of data distribution (e.g., box plot).
  • Contrast Min and Max vs Quartiles – Explain their representation in a box plot (e.g., whiskers and quartiles).
  • Explore Box Plots Examples – Understand extreme data values (e.g., whiskers).
  • Explain Quartiles – Significance and representation in the box and whiskers plot.
  • Examine Middle 50 – Analyze the data within the middle 50% range of a box plot.

Questions that this video will help you answer

  • What is a box plot and significance of quartiles in it?
  • How are extreme values represented in a box plot?
  • What is the 'middle 50' in a box plot and why is it important?

This video is also useful for

  • Students – Understand how Box Plots and Whiskers provide insights into data distribution and concentration.
  • Educators – Clearly demonstrate the concept of Quartiles and Middle 50 range in statistics.
  • Researchers – Apply box plots for robust data analysis and visualization in their studies.
  • Statistics Enthusiasts – Explore data distributions and variations through box and whisker plots.