Loi de Pareto

En théorie des probabilités, la loi de Pareto, d'après Vilfredo Pareto, est un type particulier de loi de puissance qui a des applications en sciences physiques et sociales. Elle permet notamment de donner une base théorique au «principe des 80-20», aussi appelé principe de Pareto.

Ne pas confondre avec le principe de Pareto ou loi des 80-20.

Pareto

Densité de probabilité
Fonctions de masse pour plusieurs k  avec xm = 1. L'axe horizontal symbolise le paramètre x . Lorsque k→∞ la distribution s'approche de δ(x  xm) où δ est la « fonction » delta de Dirac.


Fonction de répartition
Fonctions de répartition pour plusieurs k  avec xm = 1. L'axe horizontal symbolise le paramètre x'

Paramètres location (réel)
forme (réel)
Support
Densité de probabilité
Fonction de répartition
Espérance pour
Médiane
Mode
Variance pour
Asymétrie pour
Kurtosis normalisé pour
Entropie
Fonction génératrice des moments non définie pour les réels strictement positifs
Fonction caractéristique

Définition

Soit la variable aléatoire X qui suit une loi de Pareto de paramètres (xm,k), avec k un réel positif, alors la distribution est caractérisée par :

Densité de probabilité

Les distributions de Pareto sont des distributions continues[réf. nécessaire]. La loi de Zipf, et son cas limite, la loi zêta, peuvent être considérées comme l'équivalent discret de la loi de Pareto.

Il suit, de la définition donnée précédemment, que la densité de probabilité de X vérifie : pour

Le paramètre k est souvent nommé indice de Pareto.

Moments

L'espérance d'une variable aléatoire suivant une loi de Pareto est

(si k  1, l'espérance est infinie).

Sa variance est

(De nouveau : si k  2, la variance est infinie).

Les moments d'ordre supérieur sont donnés par :

mais ils ne sont définis que pour .

Cela signifie que la fonction génératrice (la série de Taylor en x où les sont pris pour coefficients) n'est pas définie. Cette propriété est vraie en général pour les variables aléatoires présentant une « longue traîne ».

La fonction caractéristique est donnée par :

Γ(a,x) est la fonction gamma incomplète .

La distribution de Pareto est reliée à la distribution exponentielle par :

La distribution de Dirac est un cas limite de la distribution de Pareto :

Propriétés

La loi de Pareto est à longue traîne, ce qui signifie que :

, [réf. nécessaire].

Par exemple, si X est le temps de vie d'un composant, plus il a vécu (X > x) plus il a de chances de vivre longtemps : le système rajeunit.

On peut pallier l'inconvénient « longue traîne » dans d'autres applications des distributions de Pareto telles que la distribution par taille des entreprises exprimée en nombre d'employés ou en chiffre d'affaires ou d'autres entités mesurables par taille dont la limite théorique est infinie en utilisant une échelle log-log après transformations appropriées des données analysées. Le phénomène longue traîne est causé par une variable pouvant atteindre des valeurs très grandes, valeurs pour lesquelles le nombre d'observations devient très petit ; en revanche le nombre d'observations pour les petites valeurs de la taille analysée sont souvent très élevées. Dans ce cas, on a le phénomène symétrique de la longue traîne : le long pic initial. Dans le cas de distributions de Pareto, le passage en coordonnées log-log transforme en ligne droite la courbe dont la forme originale est une hyperbole très étirée en abscisse (longue traîne ou long-tailed) et ordonnée (hautes valeurs à la base)...

Applications

Cette loi est un outil fondamental en gestion de la qualité. Dans ce domaine elle permet de :

  • hiérarchiser les problèmes en fonction du nombre d'occurrences (nombre d'apparitions)
  • définir des priorités dans le traitement des problèmes.

Cet outil met en évidence la loi des 80/20. Autrement dit, agir sur 20 % de causes permet de résoudre 80 % du problème. Le pareto est utile pour identifier sur quelle cause agir en priorité pour améliorer de façon significative la situation.

Elle est aussi utilisée en réassurance. La théorie des files d'attente s'est intéressée à cette distribution, lorsque des recherches des années 1990 ont montré que cette loi régissait aussi nombre de grandeurs observées dans le trafic Internet (et plus généralement sur tous les réseaux de données à grande vitesse). Ce phénomène a de sévères répercussions sur les performances des systèmes (routeurs en particulier).

Cette loi permet aussi d'analyser les phénomènes de concentration des entreprises industrielles et commerciales en fonction de leur taille exprimée en nombres d'employés. Une des représentations graphiques habituelles est obtenue en utilisant une double échelle logarithmique (log-log), représentation qu'avait lui-même utilisée Vilfredo Pareto. Dans ce cas la courbe se transforme en une ligne droite au-delà d'une certaine taille (tout comme pour la distribution des revenus des ménages qu'avait étudiée Pareto).

Autres domaines d'application : la distribution des ordinateurs en fonction de diverses mesures de leur taille (taille de la mémoire centrale, taille de la mémoire du disque dur), distribution des centraux téléphoniques privés en fonction du nombre de postes connectés.

Notes et références

      Voir aussi

      Sources et bibliographie

      Articles connexes

      • Portail de l’économie
      • Portail de la sociologie
      • Portail des probabilités et de la statistique
      Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.