Test de Shapiro-Wilk

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon $x_{1},\dots ,x_{n}$ est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].

Théorie

La statistique de test $W$ est:

W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}

où

x_(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
${\overline {x}}={\tfrac {1}{n}}(x_{1}+\cdots +x_{n})$ est la moyenne de l'échantillon;
la constante a_i est donnée par[2]

(a_{1},\dots ,a_{n})={m^{\top }V^{-1} \over (m^{\top }V^{-1}V^{-1}m)^{1/2}}

où

m=(m_{1},\dots ,m_{n})^{\top }\,

et $m_{1},\dots ,m_{n}$ sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

Pour conclure, $W$ est alors comparé à une table[3].

Interprétation

Sachant que l'hypothèse nulle est que la population est normalement distribuée,

si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.

Voir aussi Q-Q plot ou droite de Henry.

Voir aussi

Références

(en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, n^os 3-4,‎ 1965, p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709)
op cit p. 593
op cit p. 605

Liens externes

Portail des probabilités et de la statistique

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[1] (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, n^os 3-4,‎ 1965, p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709)

[2] op cit p. 593

[3] op cit p. 605