Test de Breusch-Pagan
En statistiques, le test de Breusch-Pagan permet de tester l'hypothèse d'homoscédasticité du terme d'erreur d'un modèle de régression linéaire. Il a été proposé par Trevor Breusch (en) et Adrian Pagan (en) dans un article publié en 1979 dans la revue Econometrica. Il cherche à déterminer la nature de la variance du terme d'erreurs : si la variance est constante, alors on a de l'homoscédasticité ; en revanche, si elle varie, on a de l'hétéroscédasticité.
Par exemple, on estime le modèle suivant
et on obtient alors les valeurs résiduelles : . Les moindres carrés ordinaires (MCO) sont un estimateur faisant en sorte que la moyenne des résidus soit nulle. Ainsi, en supposant que la valeur des résidus ne dépend pas des variables explicatives, on peut exprimer la variance des résidus comme la valeur au carré des résidus. Si cette hypothèse n'est pas tenable, alors on pourrait par exemple exprimer la variance comme une relation linéaire entre les résidus et les variables explicatives. Un modèle de ce genre peut être testé en régressant les carrés des résidus sur les variables explicatives en utilisant une équation auxiliaire de la forme
.
Ceci est la base du test de Breusch-Pagan. C'est un test basé sur un test du χ² : si la statistique du test de Breusch-Pagan est supérieure à celle obtenue par le test du Chi-Deux, c'est-à-dire si la p-value est inférieure à un certain seuil (souvent 5%), alors on rejette l'hypothèse nulle d'homoscédasticité avec un risque d'erreur de première espèce de 5% (si on a choisi ce seuil).
Une des corrections possibles peut alors être l'utilisation des moindres carrés pondérés (si l'on connaît l'origine de l'hétéroscédasticité).
Méthode
Si les conditions du théorème de Gauss-Markov sont respectées, les MCO sont un estimateur dit "BLUE" (Best Linear Unbiased Estimator), c'est-à-dire qu'il est sans biais et à variance minimale. En cas d'hétéroscédasticité, il reste sans biais mais n'est plus à variance minimale. Ainsi, avant de déterminer l'estimateur à utiliser, on peut commencer par appliquer le test de Breusch-Pagan pour déterminer s'il y a présence ou non d'hétéroscédasticité. On pose l'hypothèse nulle et l'hypothèse alternative :
; ;
; où sont des coefficients et un bruit blanc.
Le test se déroule en trois étapes :
- on estime le modèle par les MCO, ce qui nous permet d'obtenir , que l'on élève ensuite au carré
- on estime ensuite par les MCO l'équation de test suivante :
- on calcule la statistique de Breusch-Pagan : qui suit avec le nombre de coefficients à estimer dans l'équation auxiliaire écrite à l'étape précédente (trois ici), le nombre de valeurs utilisées et le coefficient de détermination de l'équation de test (équation obtenue à l'étape précédente).
Si la statistique de Breusch-Pagan est supérieure à celle lue dans la table du Chi-Deux pour un certain niveau de risque d'erreur de première espèce (5% étant la valeur généralement retenue), alors on rejette l'hypothèse nulle d'homoscédasticité.
Application du test dans les logiciels de statistique
Dans R, il est possible d'appliquer ce test avec les fonctions ncvTest disponible dans le package car, bptest dans le package lmtest ou plmtest dans le package plm.
Dans Stata, après avoir défini l'équation de régression, la commande estat hettest suivie de toutes les variables explicatives permet d'appliquer ce test.
Dans SAS, on peut l'utiliser avec l'option Proc Model.
Dans Python, ce test est applicable avec la méthode het_breuschpagan dans statsmodels.stats.diagnostic[1] (le package de modèle statistique).
Voir aussi
Notes et références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Breusch-Pagan Test » (voir la liste des auteurs).
- (en) Trevor Breusch et Adrian Pagan, « Simple test for heteroscedasticity and random coefficient variation », Econometrica, The Econometric Society, vol. 47, no 5, , p. 1287–1294 (DOI 10.2307/1911963, JSTOR 1911963, Math Reviews 545960)
- « StatsModels: Statistics in Python — statsmodels 0.9.0 documentation », sur www.statsmodels.org (consulté le )
- Portail des probabilités et de la statistique