7.10:
Stima della media della popolazione con deviazione standard sconosciuta
In pratica, raramente conosciamo la deviazione standard della popolazione. In passato, quando la dimensione del campione era ampia, questo non rappresentava un problema per gli statistici. Hanno utilizzato la deviazione standard del campione s come stima per σ e hanno proceduto come prima a calcolare un intervallo di confidenza con risultati sufficientemente vicini. Tuttavia, gli statistici incontravano problemi quando la dimensione del campione era piccola. Una piccola dimensione del campione ha causato imprecisioni nell’intervallo di confidenza.
William S. Gosset (1876-1937) della birreria Guinness di Dublino, in Irlanda, si imbatté in questo problema. I suoi esperimenti con il luppolo e l’orzo produssero pochissimi campioni. La semplice sostituzione di σ con s non produceva risultati accurati quando cercava di calcolare un intervallo di confidenza. Si rese conto che non poteva usare una distribuzione normale per il calcolo; Ha scoperto che la distribuzione effettiva dipende dalla dimensione del campione. Questo problema lo portò a “scoprire” quella che viene chiamata la distribuzione t di Student. Il nome deriva dal fatto che Gosset scriveva sotto lo pseudonimo di “Student”.
Fino alla metà degli anni ’70, alcuni statistici usavano l’approssimazione della distribuzione normale per campioni di grandi dimensioni e usavano la distribuzione t di Student solo per campioni di dimensioni massime di 30. Con le calcolatrici grafiche e i computer, la pratica ora è quella di utilizzare la distribuzione t di Student ogni volta che s viene utilizzata come stima per σ.
Se si estrae un campione casuale semplice di dimensione n da una popolazione che ha una distribuzione approssimativamente normale con μ media e deviazione standard della popolazione sconosciuta σ e si calcola il punteggio t utilizzando il campione SD.
Proprietà della distribuzione t di Student
Calcolatrici e computer possono facilmente calcolare le probabilità t di qualsiasi studente. Può essere utilizzata anche una tabella di probabilità per la distribuzione t di Student. La tabella fornisce i punteggi t che corrispondono al livello di confidenza (colonna) e ai gradi di libertà (riga). Quando si utilizza una tabella t, si noti che alcune tabelle sono formattate in modo da mostrare il livello di confidenza nelle intestazioni delle colonne, mentre le intestazioni delle colonne in alcune tabelle possono mostrare solo l’area corrispondente in una o entrambe le code.
La tabella t di A Student fornisce i punteggi t dati i gradi di libertà e la probabilità di coda destra. La tabella è molto limitata. Calcolatrici e computer possono facilmente calcolare le probabilità t di qualsiasi studente.
La notazione per la distribuzione t di Student (usando T come variabile casuale) è:
Se la deviazione standard della popolazione non è nota, l’errore associato per una media della popolazione viene calcolato utilizzando il campione SD.
Questo testo è adattato da Openstax, Statistiche introduttive, Sezione 8.2 Una singola popolazione significa usare il <a href=”https://openstax.org/books/introductory-statistics/pages/8-2-a-single-population-mean-using-the-student-t-distribution”>t distribuzione.
La stima della media della popolazione dall’intervallo di confidenza richiede il margine di errore.
Viene calcolato utilizzando il valore z quando la deviazione standard della popolazione è nota, la dimensione del campione è superiore a 30 e la popolazione è normalmente distribuita.
In una situazione realistica, si può presumere che la distribuzione della popolazione sia normale, ma la deviazione standard della popolazione rimane sconosciuta.
Quindi, il margine di errore viene calcolato in modo diverso utilizzando la seguente equazione.
In questo caso, il valore critico viene calcolato utilizzando la distribuzione t e viene utilizzata una deviazione standard del campione.
Il valore t critico, tα/2, non è costante in quanto cambia con la dimensione del campione.
È generalmente maggiore del valore z, il che può generare un intervallo più ampio di valori utilizzati per la stima media della popolazione.
L’uso della distribuzione t richiede che i campioni siano almeno approssimativamente distribuiti normalmente e che la dimensione del campione sia superiore a 30.
In questo caso, la media campionaria rimane la migliore stima puntuale, ma l’intervallo di confidenza fornisce una stima affidabile del valore reale della media della popolazione.
Related Videos
Estimates
5.2K Visualizzazioni
Estimates
5.4K Visualizzazioni
Estimates
6.4K Visualizzazioni
Estimates
7.7K Visualizzazioni
Estimates
5.9K Visualizzazioni
Estimates
7.0K Visualizzazioni
Estimates
4.2K Visualizzazioni
Estimates
3.4K Visualizzazioni
Estimates
8.7K Visualizzazioni
Estimates
8.0K Visualizzazioni
Estimates
7.5K Visualizzazioni