Test de Student

En statistique, le test de Student, ou test t, est un ensemble de tests statistiques paramétriques où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Histoire

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[1]. Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues, ou si leurs variances sont différentes et inconnues (Test t de Welch).
Test sur les coefficients dans le cadre d'une régression linéaire.
Test sur des échantillons appariés

Exemple : test de Student sur un échantillon de loi normale

On veut comparer la moyenne $μ$ d'une population de loi normale et d’écart type $σ$ non connu à une valeur déterminée $μ 0$ . Pour ce faire, on tire de cette population un échantillon de taille $n$ dont on calcule la moyenne empirique ${\overline {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}$ et l'on remplace sa variance $σ 2$ par son estimateur sans biais

S_{n}^{\ast ^{2}}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}

.

Selon l’hypothèse nulle, la distribution d’échantillonnage de cette moyenne se distribue elle aussi normalement avec un écart type $σ / \sqrt n$ .

La statistique de test :

Z={\sqrt {n}}{\frac {{\overline {X}}-\mu _{0}}{S_{n}^{\ast }}}

suit alors une loi de Student à $n - 1$ degrés de liberté sous l'hypothèse nulle (c'est le théorème de Cochran).

On choisit un risque $α$ , généralement 0,05 ou 0,01 et l'on calcule la réalisation de la statistique de test :

z={\sqrt {n}}{\frac {{\overline {x}}_{n}-\mu _{0}}{s_{n}^{\ast }}},

où

s_{n}^{\ast }={\sqrt {{\frac {1}{n-1}}\sum \limits _{i=1}^{n}(x_{i}-{\overline {x}}_{n})^{2}}}

Si l'on veut tester $H 0 : μ = μ 0$ :

Si

| z |

est supérieur au quantile d'ordre

1 - α / 2

de la loi de Student à

n - 1

degrés de liberté alors on rejette l'hypothèse nulle.

Si l'on veut tester $H 0 : μ \leq μ 0$ :

Si

z

est supérieur au quantile d'ordre

1 - α

de la loi de Student à

n - 1

degrés de liberté alors on rejette l'hypothèse nulle.

Si l'on veut tester $H 0 : μ \geq μ 0$ :

Si

z

est inférieur au quantile d'ordre

α

de la loi de Student à

n - 1

degrés de liberté alors on rejette l'hypothèse nulle.

Remarque : si l'on note $t k, α$ le quantile d'ordre $α$ de la loi de Student à $k$ degrés de liberté alors on a l'égalité $t k, α = - t k, 1 - α$ .

Implémentation


Langage/Logiciel	Fonction	Notes
R	t.test
SAS	PROC TTEST
Python	scipy.stats.ttest_ind
Matlab	ttest
Mathematica	TTEST
Stata	ttest
Julia	OneSampleTTest EqualVarianceTTest

Notes et références

Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), p. 1-7 DOI:10.1198/016214508000000030 JSTOR:27640017

Voir aussi

Portail des probabilités et de la statistique

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[1] Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), p. 1-7 DOI:10.1198/016214508000000030 JSTOR:27640017