Tri comptage

Le tri comptage (counting sort en anglais), appelé aussi tri casier, est un algorithme de tri par dénombrement qui s'applique sur des valeurs entières.

Définition

Le principe repose sur la construction de l'histogramme des données, puis le balayage de celui-ci de façon croissante, afin de reconstruire les données triées. Ici, la notion de stabilité n'a pas réellement de sens, puisque l'histogramme factorise les données – plusieurs éléments identiques seront représentés par un unique élément quantifié. Ce tri ne peut donc pas être appliqué sur des structures complexes, et il convient exclusivement aux données constituées de nombres entiers compris entre une borne min et une borne max connues. Dans un souci d'efficacité, celles-ci doivent être relativement proches l'une de l'autre, ainsi que le nombre d'éléments doit être relativement grand.

Dans cette configuration, et avec une distribution de données suivant une loi uniforme discrète, ce tri est le plus rapide (on troque, en quelque sorte, du temps de calcul contre de la mémoire). La restriction très particulière imposée à ses valeurs d'entrée en fait un tri en temps linéaire, alors qu'un tri par comparaisons optimal nécessite un nombre d'opérations de l'ordre de .

Exemple

On suppose qu'on dispose d'un tableau tab composé de 100 entiers entre 0 et 30 (bornes comprises). Le procédé du tri par comptage est le suivant : on compte le nombre de « 0 », le nombre de « 1 », ..., le nombre de « 30 » présents dans tab, et on reconstruit tab en y ajoutant les valeurs selon leur quantité croissante (on ne trie pas les valeurs mais le comptage de ces valeurs au sein du tableau).

Le tableau de 5 entiers 1, 27, 3, 1, 3 contient 2 fois 1, 2 fois 3 et 1 fois 27, le tableau trié par la méthode du tri comptage est donc : 1, 1, 3, 3, 27.

Tableau avant et après triage :

x 1 2 3 4 5
tab[x] 127313
tab[x] trié 113327

Tableau de comptage :

x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
tabComptage[x] 0 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1

Algorithme

L'algorithme présenté ici n'est pas la seule solution au problème, et n'est peut-être pas optimal. On considère que l'index des tableaux commence à 0. Le signe = est utilisé pour les affectations. Le tableau tab est le tableau à trier, et est passé en paramètre de la fonction triParComptage. La variable borneSuperieure, est la valeur entière maximale présente dans tab.

La fonction triParComptage utilise des variables intermédiaires :

  • tabComptage, est un tableau contenant n éléments, n étant la valeur maximale dans tab.
  • i et j sont des variables de type entier, servant à parcourir les tableaux tab et tabComptage.
fonction triParComptage(tab, borneSuperieure):
   // Initialisation des variables
   tabComptage[borneSuperieure + 1]
   tailleTab = taille(tab) - 1
   x = 0

   // Initialisation du tableau de comptage à 0
   pour i = 0 à borneSuperieure:
      tabComptage[i] = 0
   finPour

   // Création du tableau de comptage
   pour i = 0 à tailleTab:
      tabComptage[tab[i]]++
   finPour

   // Création du tableau trié
   pour i = 0 à borneSuperieure:
      pour j = 0 à tabComptage[i] - 1:
         tab[x++] = i
     finPour
  finPour
  retourne tab

Références

    • Portail de l’informatique
    • Portail de l'informatique théorique
    Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.