Le théorème central limite, abrégé en clt, est l’une des idées les plus puissantes et les plus utiles de toutes les statistiques. Le théorème central limite pour les moyennes d’échantillon dit que si vous tirez à plusieurs reprises des échantillons d’une taille donnée et calculez leurs moyennes, et créez un histogramme de ces moyennes, alors l’histogramme résultant aura tendance à avoir une forme de cloche normale approximative. En d’autres termes, à mesure que la taille des échantillons augmente, la distribution des moyennes suit de plus près la distribution normale.
La taille de l’échantillon, n, qui doit être « suffisamment grande » dépend de la population d’origine à partir de laquelle les échantillons sont tirés (la taille de l’échantillon doit être d’au moins 30, ou les données doivent provenir d’une distribution normale). Si la population d’origine est loin d’être normale, il faut davantage d’observations pour que les moyennes ou les sommes de l’échantillon soient normales. L’échantillonnage se fait avec remplacement.
Il serait difficile d’exagérer l’importance du théorème central de la limite dans la théorie statistique. Savoir que les données, même si leur distribution n’est pas normale, se comportent de manière prévisible est un outil puissant.
La distribution normale a la même moyenne que la distribution d’origine et une variance égale à la variance d’origine divisée par la taille de l’échantillon. L’écart-type est la racine carrée de la variance, donc l’écart-type de la distribution d’échantillonnage est l’écart-type de la distribution d’origine divisé par la racine carrée de n. La variable n est le nombre de valeurs dont la moyenne est calculée, et non le nombre de fois où l’expérience est réalisée.
Ce texte est adapté de Openstax, Introductory Statistics, Section 7.0 Central Limit theorem.
Ce texte est adapté de Openstax, Introductory Statistics, Section 7.1 Central Limit Theorem for Sample Means (Averages).
Considérez les diagrammes à points pour les populations ayant une distribution normale et uniforme.
La distribution des moyennes d’échantillon pour différentes tailles d’échantillon montre qu’elle se rapproche d’une distribution normale à mesure que la taille de l’échantillon augmente – c’est le principe de base du théorème central limite.
Bien que la moyenne de l’échantillon soit la même que la moyenne de la population, son écart-type est inférieur à l’écart-type de la population.
Toutefois, cette règle ne s’applique pas aux populations qui ne sont pas normales et dont la taille de l’échantillon est inférieure ou égale à 30.
En sachant que les moyennes de l’échantillon sont normalement distribuées, on peut faire une meilleure analyse statistique en utilisant les propriétés de la distribution normale.
Par exemple, la règle empirique qui s’applique à la distribution normale permet de déterminer la probabilité qu’un groupe de personnes ait des poids moyens à un, deux ou trois écarts-types de la moyenne des moyennes de l’échantillon.
Ces valeurs peuvent également être normalisées en scores z. Ainsi, on pourrait déterminer la probabilité d’un groupe de personnes sélectionnées au hasard avec un poids moyen inférieur à 80 kg.
Related Videos
Probability Distributions
12.6K Vues
Probability Distributions
11.5K Vues
Probability Distributions
6.9K Vues
Probability Distributions
11.2K Vues
Probability Distributions
3.2K Vues
Probability Distributions
3.9K Vues
Probability Distributions
10.3K Vues
Probability Distributions
7.8K Vues
Probability Distributions
4.8K Vues
Probability Distributions
10.7K Vues
Probability Distributions
10.4K Vues
Probability Distributions
5.0K Vues
Probability Distributions
12.4K Vues
Probability Distributions
14.5K Vues