16.11:
Microsoft Excel: Encontrando tendência central, inclinação e curtose
A tendência central refere-se ao ponto central ou valor típico de um conjunto de dados. Ele resume o conjunto de dados com um único valor que representa o centro de sua distribuição. As três principais medidas de tendência central são:
Média: a média aritmética de todos os pontos de dados. É calculado somando todos os valores e dividindo pelo número de valores. A média é sensível a valores extremos (outliers).
Mediana: o valor médio quando os pontos de dados são organizados em ordem crescente ou decrescente. Se houver um número par de observações, a mediana é a média dos dois números médios. A mediana é menos afetada por valores discrepantes e dados distorcidos.
Modo: o valor que ocorre com mais frequência em um conjunto de dados. Um conjunto de dados pode ter um modo, mais de um modo ou nenhum modo.
A variação mede a dispersão ou dispersão de um conjunto de pontos de dados. Ele fornece insights sobre o quanto os pontos de dados diferem da média e uns dos outros. As principais medidas de variação incluem:
Intervalo: a diferença entre os valores máximo e mínimo no conjunto de dados. Ele fornece uma noção rápida da propagação, mas é altamente sensível a valores discrepantes.
Variância: A média das diferenças quadradas da média. Ele quantifica o quão espalhados os pontos de dados estão em torno da média.
Desvio padrão: a raiz quadrada da variância. Ele é expresso nas mesmas unidades que os dados e fornece uma medida da distância média de cada ponto de dados em relação à média.
enviesar
A assimetria mede a assimetria da distribuição de dados em torno da média. Indica se os pontos de dados estão mais concentrados em um lado da distribuição ou no lado em que a cauda é mais longa ou mais gorda. Os tipos de assimetria incluem:
Inclinação positiva (inclinação para a direita): A cauda direita é mais longa ou mais gorda que a esquerda. A média é maior que a mediana.
Inclinação negativa (inclinação para a esquerda): A cauda esquerda é mais longa ou mais gorda que a direita. A média é menor que a mediana.
Um valor de assimetria próximo de zero indica que a distribuição de dados é simétrica.
curtose
A curtose mede a “cauda” ou a nitidez do pico de uma distribuição de dados. Ele fornece informações sobre as extremidades (caudas) da distribuição. Os tipos de curtose incluem:
Curtose Positiva (Leptocúrtica): Indica uma distribuição com um pico mais nítido e caudas mais pesadas do que uma distribuição normal. Os pontos de dados estão mais concentrados nas caudas e no pico.
Curtose Negativa (Platicúrtica): Indica uma distribuição com um pico mais plano e caudas mais leves do que uma distribuição normal. Os pontos de dados estão menos concentrados nas caudas e no pico.
Mesoquúrtico: Indica uma distribuição com curtose semelhante à de uma distribuição normal.
A curtose ajuda a entender os valores discrepantes e a probabilidade de valores extremos no conjunto de dados.
Considere os três conjuntos de dados hipotéticos a seguir plotados no Microsoft Excel.
Agora, três medidas da tendência central — média, mediana e moda — podem ser calculadas usando as funções do Excel MÉDIA, MEDIANA e MODA. SNGL para o intervalo de dados selecionado.
Depois de visualizar os conjuntos de dados A e C, suas caudas aparecem estendidas para a esquerda e para a direita.
Quantitativamente, essa assimetria pode ser determinada usando a função do Excel DISTORÇÃO para o intervalo de dados selecionado. Eles são calculados da seguinte forma para os conjuntos de dados A, B e C.
A curtose pode ser medida usando a função KURT do Excel para o intervalo de dados selecionado para os conjuntos de dados A, B e C.
Assimetria e curtose, como medidas de assimetria, determinam o afastamento da simetria. Valores de distorção mais próximos de zero indicam mais simetria nos dados.
Valores positivos de curtose indicam um pico mais alto da distribuição em comparação com uma distribuição normal, com menos valores no centro do que nas caudas.
Por outro lado, os valores negativos mostram a planicidade da distribuição, com mais valores no centro do que nas caudas.
Related Videos
Statistical Softwares
517 Visualizações
Statistical Softwares
431 Visualizações
Statistical Softwares
262 Visualizações
Statistical Softwares
291 Visualizações
Statistical Softwares
257 Visualizações
Statistical Softwares
139 Visualizações
Statistical Softwares
109 Visualizações
Statistical Softwares
111 Visualizações
Statistical Softwares
125 Visualizações
Statistical Softwares
119 Visualizações
Statistical Softwares
146 Visualizações
Statistical Softwares
174 Visualizações
Statistical Softwares
547 Visualizações
Statistical Softwares
373 Visualizações
Statistical Softwares
531 Visualizações
Statistical Softwares
214 Visualizações