Test de Shapiro-Wilk

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].

Pour les articles homonymes, voir Shapiro et Wilk.

Théorie

La statistique de test est:

  • x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
  • est la moyenne de l'échantillon;
  • la constante ai est donnée par[2]

et sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

Pour conclure, est alors comparé à une table[3].

Interprétation

Sachant que l'hypothèse nulle est que la population est normalement distribuée,

  • si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
  • si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.

Voir aussi Q-Q plot ou droite de Henry.

Voir aussi

Références

  1. (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, nos 3-4, , p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709)
  2. op cit p. 593
  3. op cit p. 605

Liens externes

  • Portail des probabilités et de la statistique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.