7.10:
Estimation de la moyenne de la population avec un écart-type inconnu
En pratique, nous connaissons rarement l’écart-type de la population. Dans le passé, lorsque la taille de l’échantillon était grande, cela ne posait pas de problème aux statisticiens. Ils ont utilisé l’écart-type de l’échantillon s comme estimation de σ et ont procédé comme précédemment au calcul d’un intervalle de confiance avec des résultats suffisamment proches. Cependant, les statisticiens ont rencontré des problèmes lorsque la taille de l’échantillon était petite. La petite taille de l’échantillon a entraîné des inexactitudes dans l’intervalle de confiance.
William S. Gosset (1876-1937) de la brasserie Guinness à Dublin, en Irlande, a rencontré ce problème. Ses expériences avec le houblon et l’orge ont produit très peu d’échantillons. Le simple fait de remplacer σ par s n’a pas donné de résultats précis lorsqu’il a essayé de calculer un intervalle de confiance. Il s’est rendu compte qu’il ne pouvait pas utiliser une distribution normale pour le calcul ; Il a constaté que la distribution réelle dépend de la taille de l’échantillon. Ce problème l’a amené à « découvrir » ce qu’on appelle la distribution t de Student. Le nom vient du fait que Gosset a écrit sous le nom de plume « Student ».
Jusqu’au milieu des années 1970, certains statisticiens utilisaient l’approximation de la distribution normale pour les grands échantillons et n’utilisaient la distribution t de Student que pour des échantillons d’au plus 30 tailles. Avec les calculatrices graphiques et les ordinateurs, la pratique consiste maintenant à utiliser la distribution t de Student chaque fois que s est utilisé comme estimation de σ.
Si vous tirez un échantillon aléatoire simple de taille n à partir d’une population dont la distribution est approximativement normale avec une μ moyenne et un écart type de population inconnu σ et calculez le score t à l’aide de l’échantillon SD.
Propriétés de la distribution t de Student
Les calculatrices et les ordinateurs peuvent facilement calculer les probabilités t de n’importe quel étudiant. Une table de probabilité pour la distribution t de Student peut également être utilisée. Le tableau donne des scores t qui correspondent au niveau de confiance (colonne) et aux degrés de liberté (ligne). Lorsque vous utilisez une table t, notez que certaines tables sont formatées pour afficher le niveau de confiance dans les en-têtes de colonne, tandis que les en-têtes de colonne dans certaines tables peuvent afficher uniquement la zone correspondante dans l’une ou les deux queues.
La table t d’un Student donne des scores t compte tenu des degrés de liberté et de la probabilité de droite. La table est très limitée. Les calculatrices et les ordinateurs peuvent facilement calculer les probabilités t de n’importe quel élève.
La notation de la distribution t de Student (en utilisant T comme variable aléatoire) est la suivante :
Si l’écart-type de la population n’est pas connu, la borne d’erreur d’une moyenne de population est calculée à l’aide de l’écart-type de l’échantillon.
Ce texte est adapté de Openstax, Introductions aux statistiques, Section 8.2 Une seule moyenne de population utilisant la <a href=”https://openstax.org/books/introductory-statistics/pages/8-2-a-single-population-mean-using-the-student-t-distribution”>t de Student distribution.
L’estimation de la moyenne de la population à partir de l’intervalle de confiance nécessite la marge d’erreur.
Il est calculé à l’aide de la valeur z lorsque l’écart-type de la population est connu, que la taille de l’échantillon est supérieure à 30 et que la population est normalement distribuée.
Dans une situation réaliste, on peut supposer que la distribution de la population est normale, mais l’écart-type de la population reste inconnu.
Ainsi, la marge d’erreur est calculée différemment à l’aide de l’équation suivante.
Ici, la valeur critique est calculée à l’aide de la distribution t et un écart-type d’échantillon est utilisé.
La valeur critique de t (tα/2) n’est pas constante car elle change en fonction de la taille de l’échantillon.
Elle est généralement supérieure à la valeur z, ce qui peut générer une gamme plus large de valeurs utilisées pour l’estimation de la moyenne de la population.
L’utilisation de la distribution t nécessite que les échantillons soient au moins approximativement normalement répartis et que la taille de l’échantillon soit supérieure à 30.
Ici, la moyenne de l’échantillon reste la meilleure estimation ponctuelle, mais l’intervalle de confiance fournit une estimation fiable de la valeur réelle de la moyenne de la population.
Related Videos
Estimates
5.2K Vues
Estimates
5.4K Vues
Estimates
6.4K Vues
Estimates
7.7K Vues
Estimates
5.9K Vues
Estimates
7.0K Vues
Estimates
4.2K Vues
Estimates
3.4K Vues
Estimates
8.7K Vues
Estimates
8.0K Vues
Estimates
7.5K Vues