Quartile
En statistique descriptive, un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population. Le quartile fait partie des quantiles.
Calcul des quartiles
Le quartile est calculé en tant que 4-quartiles.
- le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des données (notation Q1) ;
- le 2e quartile est la donnée de la série qui sépare les 50 % inférieurs des données (notation Q2) ; il est également appelé médiane ;
- le 3e quartile est la donnée de la série qui sépare les 75 % inférieurs des données (notation Q3) ;
- Par extension : le 0e quartile est la donnée de la série qui sépare les 0 % inférieurs des données (notation Q0, c'est le minimum) et le 4e quartile est la donnée de la série qui sépare les 0 % supérieurs des inférieurs des données (notation Q4, c'est le maximum)
La différence entre le troisième quartile et le premier quartile s'appelle écart interquartile ; c'est un critère de dispersion de la série.
Pour le détail des différentes méthodes de calcul, voir l'article quantile,
Dans le cas discret, on range les données par ordre croissant : s'il y a N valeurs :
- le quartile zéro (minimum) est celui qui a le rang 1
- le premier quartile est celui qui a le rang (N)/4
- le deuxième quartile (médiane) est celui qui a le rang (2N+2)/4 que l'on simplifie en (N+1)/2
- le troisième quartile est celui qui a le rang (3N)/4
- le quatrième quartile est celui qui a le rang N
Exemple :
Les valeurs dans l'ordre croissant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 61, 68.
Le nombre de valeurs est N = 13.
Calcul de Q1 : on divise (l'effectif total plus 3) par 4 (quartile)
Le 1er quartile est la 4e valeur, c'est-à-dire 19.
Calcul de Q3 : Pour Q3 on procède de la même façon mais on multiplie le rang obtenu par 3 :
La 10e valeur est 47 donc Q3 = 47.
Calcul de la médiane : on divise (l'effectif total plus 1) par 2 (quartile)
La médiane est la 7e valeur soit 28 (c'est la valeur du milieu).
Les cinq quartiles : finalement, les cinq quartiles de la série sont 1, 19, 28, 47 et 68.
Quand le rang d'un quartile n'est pas une valeur entière : quand les fractions (N+3)/4, (N+1)/2 ou (3N+1)/4 ne sont pas des valeurs entières, on procède par interpolation linéaire. On fait la moyenne de la valeur situé au-dessus du rang et de celle situé au dessous du rang, en affectant chaque valeur d'un coefficient. Plus précisément, on note R_inf la valeur située en dessous du rang et R_sup la valeur situé au-dessus :
- Si le rang se termine par 0,25, alors le quartile est la moyenne entre R_inf affecté du coefficient 3 et de R_sup affecté du coefficient 1.
- Si le rang se termine par 0,5, alors le quartile est la moyenne entre R_inf et R_sup (sans coefficient).
- Si le rang se termine par 0,75, alors le quartile est la moyenne entre R_inf affecté du coefficient 1 et de R_sup affecté du coefficient 3.
Exemple :
Les valeurs dans l'ordre ascendant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 61.
Le nombre de valeurs est N = 12.
Calcul de Q1 : on divise (l'effectif total plus 3) par 4 (quartile)
Le 1er quartile est la moyenne entre 15 affecté du coefficient 1 et 19 affecté du coefficient 3.
Le quartile Q1 est 18.
Calcul de Q3 : Pour Q3 on procède de la même façon :
Le 3e quartile est la moyenne entre 37 affecté du coefficient 3 et 47 affecté du coefficient 1.
Le quartile Q3 est 39,5.
Calcul de la médiane : on divise (l'effectif total plus 1) par 2 (quartile)
La médiane est la moyenne entre la 6e et la 7e valeur soit la moyenne entre 24 et 28 et donc Q2 = 26.
Les cinq quartiles : finalement, les cinq quartiles de la série sont 1 ; 18 ; 26 ; 39,5 et 61.
Voir aussi
- Portail des probabilités et de la statistique