7.10: Estimando a Média da População com Desvio Padrão Desconhecido

Estimating Population Mean with Unknown Standard Deviation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Estimating Population Mean with Unknown Standard Deviation

7,656 Views

01:22 min
April 30, 2023

Overview

Na prática, raramente sabemos o desvio padrão da população. No passado, quando o tamanho da amostra era grande, isso não representava um problema para os estatísticos. Eles usaram o desvio padrão da amostra s como uma estimativa para σ e procederam como antes para calcular um intervalo de confiança com resultados próximos o suficiente. No entanto, os estatísticos tiveram problemas quando o tamanho da amostra era pequeno. Um tamanho amostral pequeno causou imprecisões no intervalo de confiança.

William S. Gosset (1876–1937), da cervejaria Guinness em Dublin, Irlanda, encontrou esse problema. Seus experimentos com lúpulo e cevada produziram muito poucas amostras. Apenas substituir σ por s não produziu resultados precisos quando ele tentou calcular um intervalo de confiança. Ele percebeu que não poderia usar uma distribuição normal para o cálculo; Ele descobriu que a distribuição real depende do tamanho da amostra. Esse problema o levou a “descobrir” o que é chamado de distribuição t de Student. O nome vem do fato de que Gosset escreveu sob o pseudônimo de “Student”.

Até meados da década de 1970, alguns estatísticos usavam a aproximação de distribuição normal para grandes tamanhos de amostra e usavam a distribuição t de Student apenas para tamanhos de amostra de no máximo 30. Com calculadoras gráficas e computadores, a prática agora é usar a distribuição t de Student sempre que s for usado como uma estimativa para σ.

Se você desenhar uma amostra aleatória simples de tamanho n de uma população que tem uma distribuição aproximadamente normal com μ médio e desvio padrão da população desconhecida σ e calcular a pontuação t usando o DP da amostra.

Propriedades da distribuição t de Student

  • O gráfico para a distribuição t de Student é semelhante à curva normal padrão.
  • A média para a distribuição t de Student é zero e a distribuição é simétrica em relação a zero.
  • A distribuição t de Student tem mais probabilidade em suas caudas do que a distribuição normal padrão porque a propagação da distribuição t é maior que a propagação da normal padrão. Portanto, o gráfico da distribuição t de Student será mais espesso nas caudas e mais curto no centro do que o gráfico da distribuição normal padrão.
  • A forma exata da distribuição t de Student depende dos graus de liberdade. À medida que os graus de liberdade aumentam, o gráfico da distribuição t de Student torna-se mais parecido com o gráfico da distribuição normal padrão.
  • Supõe-se que a população subjacente de observações individuais seja normalmente distribuída com μ médio da população desconhecida e desvio padrão da população desconhecida σ. O tamanho da população subjacente geralmente não é relevante, a menos que seja muito pequeno. Se for em forma de sino (normal), a suposição é atendida e não precisa de discussão. A amostragem aleatória é assumida, mas essa é uma suposição completamente separada da normalidade.

Calculadoras e computadores podem calcular facilmente as probabilidades t de qualquer aluno. Uma tabela de probabilidade para a distribuição t de Student também pode ser usada. A tabela fornece t pontuações que correspondem ao nível de confiança (coluna) e graus de liberdade (linha). Ao usar uma tabela t, observe que algumas tabelas são formatadas para mostrar o nível de confiança nos títulos de coluna, enquanto os títulos de coluna em algumas tabelas podem mostrar apenas a área correspondente em uma ou ambas as caudas.

A tabela t de um aluno fornece pontuações t, dados os graus de liberdade e a probabilidade de cauda direita. A tabela é muito limitada. Calculadoras e computadores podem calcular facilmente as probabilidades t de qualquer aluno.

A notação para a distribuição t de Student (usando T como variável aleatória) é:

  • T ~ tdf onde df = n – 1.
  • Por exemplo, se tivermos uma amostra de tamanho n = 20 itens, calculamos os graus de liberdade como df = n – 1 = 20 – 1 = 19 e escrevemos a distribuição como T ~ t19.

Se o desvio padrão da população não for conhecido, o limite de erro para uma média populacional é calculado usando o DP da amostra.

Este texto foi adaptado de Openstax, Introductory Statistics, Section 8.2 Uma única população significa usando o t de Student distribuição.

Transcript

Estimar a média da população a partir do intervalo de confiança requer a margem de erro.

É calculado usando o valor z quando o desvio padrão da população é conhecido, o tamanho da amostra é maior que 30 e a população é normalmente distribuída.

Em uma situação realista, a distribuição da população pode ser considerada normal, mas o desvio padrão da população permanece desconhecido.

Portanto, a margem de erro é calculada de forma diferente usando a seguinte equação.

Aqui, o valor crítico é calculado usando a distribuição t e um desvio padrão da amostra é utilizado.

O valor t crítico – tα/2 – não é constante, pois muda com o tamanho da amostra.

Geralmente é maior que o valor z, o que pode gerar uma faixa mais ampla de valores usados para a estimativa média da população.

O uso da distribuição t requer amostras pelo menos aproximadamente normalmente distribuídas e o tamanho da amostra deve ser superior a 30.

Aqui, a média da amostra continua sendo a melhor estimativa pontual, mas o intervalo de confiança fornece uma estimativa confiável do valor real da média da população.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for