< Arbres de décision
fin de la boite de navigation du chapitre

Pourquoi mettre en place un arbre de décision ?

Le but de la construction d’un arbre de décision est de déterminer les meilleurs attributs à placer à chaque nœud, afin d’obtenir un arbre le plus petit possible et qu’il permette d’en retirer les meilleures prédictions.

Il est nécessaire de connaitre les étapes de la conception d’un arbre de décision. Comment fait-on pour mettre en place et pour mettre en application cet outil ?

Confection à partir d'un algorithme

À partir d’un ensemble d’observations T = {(x, y)}, on souhaite construire un arbre de décision prédisant l’attribut y en fonction de nouvelles instances x. Pour ce faire, il existe essentiellement deux familles d’algorithmes à ce jour : les arbres de Quinlan et les arbres CART. Les deux approches peuvent être schématisés comme ci-dessous :

 ArbreDecision(T)
    si "condition d'arret"
        retourner feuille(T)
    sinon 
        choisir le "meilleur" attribut i entre 1 et m
        pour chaque valeur v de l'attribut i
            T[v] = {(x, y) de T tels que x_i = v}
            t[v] = ArbreDecision(T[v])
        fin pour
        retourner noeud(i, {v -> t[v]})
    fin si

Il est donc nécessaire, avant toute chose, d'élaborer l'algorithme pour la mise en application de l'arbre décisionnel.

Finition à partir d'un tableau récapitulatif

Ensuite, pour mettre sur pied un arbre de décision, il est nécessaire d’élaborer un tableau, récapitulant toutes les questions qu’il faut se poser, les conséquences qui découlent des réponses à ces questions et de mettre en avant la réponse qui permettra de planifier au mieux notre dessein (base d’apprentissage).

Finalisation d'un arbre de décision

Dès que le tableau regroupant toutes les options et solutions est finalisé,l'arbre de décision peut être élaboré.

Une fois l’arbre construit, il faut effectuer un test sur l’ensemble des données (base de test).

Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.