O “centro” de um conjunto de dados também é uma maneira de descrever a localização. As duas medidas mais utilizadas do “centro” dos dados são a média (média) e a mediana. As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. No entanto, na prática entre os não estatísticos, “média” é comumente aceita para “média aritmética”.
Outra medida do centro é o modo. O modo é o valor mais frequente. Se um conjunto de dados tiver dois valores que ocorrem no mesmo número de vezes, o conjunto será bimodal.
Calculando a média e a mediana
Para calcular o peso médio de 50 pessoas, some os 50 pesos e divida por 50. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais (discutido anteriormente em gráficos de caixa neste capítulo). A mediana é geralmente uma medida melhor do centro quando há valores extremos ou outliers porque não é afetada pelos valores numéricos precisos dos outliers. A média é a medida mais comum do centro.
A média também pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é um x com uma barra sobre ela (pronuncia-se “barra x”).
A letra grega μ (pronuncia-se “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.
Você pode encontrar rapidamente o local da mediana usando a expressão (n+1)/2. A letra n é o número total de valores de dados na amostra. Se n for um número ímpar, a mediana será o valor médio dos dados ordenados (ordenados do menor para o maior). Se n for um número par, a mediana será igual aos dois valores médios somados e divididos por 2 após a ordenação dos dados. Por exemplo, se o número total de valores de dados for 97, então (n+1)/2 = (97+1)/2 = 49. A mediana é o 49º valor nos dados ordenados. Se o número total de valores de dados for 100, então (n+1)/2 = (100+1)/2 = 50,5. A mediana ocorre no meio do caminho entre os 50º e 51º valores. A localização da mediana e o valor da mediana não são os mesmos.
Este texto foi adaptado de Barbara Illowsky, Ph.D., Susan Dean, Collaborative Statistics. OpenStax CNX.
Os pesquisadores geralmente resumem seus dados usando uma medida específica de tendência central – uma pontuação que representa todo o conjunto de pontos de dados.
A medida mais direta é a moda – a pontuação que ocorre com mais frequência – que é útil ao calcular totais para dados categóricos, como ocupação profissional. Aqui, o modo é notado como escritor, uma vez que constituem a maioria das carreiras relatadas.
Outra medida é a mediana – o verdadeiro ponto médio em um conjunto de dados numéricos organizados em ordem de magnitude. Aqui, a mediana dos salários é de US $ 65.000 … com metade dos funcionários pagos em ou acima … e a outra metade em ou abaixo … este ponto médio. Nos casos com um número par de valores, a média dos dois números do meio determina a mediana.
Finalmente, a medida mais comum para dados numéricos é a média – a média aritmética – que é igual à soma total de todas as pontuações numéricas, dividida pelo número de pontos de dados.
Por exemplo, a soma total de todas as rendas seria dividida pelo número de pessoas empregadas – neste caso, rendendo uma média de $ 140.000. Como essa medida leva em consideração todos os valores no conjunto de dados para cálculo, os pesquisadores geralmente preferem relatar a média.
Em uma distribuição normal, a moda, a média e a mediana têm valores aproximadamente equivalentes e estão posicionadas exatamente no centro da curva. No entanto, em distribuições distorcidas – quando pontuações muito altas ou muito baixas são mais prevalentes e ponderadas mais fortemente – essas medidas não são iguais.
Se a maioria dos participantes relatasse baixa renda, a média aumentaria devido a algumas pontuações de renda extremamente altas. Assim, a sensibilidade da média a valores extremos pode resultar em uma representação artificialmente alta ou baixa dos dados. Nesse caso, a mediana ou moda serviria como uma medida mais precisa.
No final, a melhor medida de tendência central é aquela que considera o padrão de distribuição nos dados disponíveis.
Related Videos
Research Methods
59.3K Visualizações
Research Methods
11.6K Visualizações
Research Methods
15.4K Visualizações
Research Methods
14.7K Visualizações
Research Methods
16.0K Visualizações
Research Methods
11.9K Visualizações
Research Methods
11.3K Visualizações
Research Methods
8.9K Visualizações
Research Methods
13.0K Visualizações
Research Methods
6.1K Visualizações
Research Methods
10.6K Visualizações
Research Methods
22.9K Visualizações
Research Methods
32.7K Visualizações
Research Methods
10.9K Visualizações
Research Methods
12.7K Visualizações
Research Methods
6.3K Visualizações
Research Methods
16.0K Visualizações
Research Methods
22.2K Visualizações
Research Methods
20.1K Visualizações