Réduction de la dimensionnalité

La réduction de la dimensionnalité (ou réduction de (la) dimension) est un processus étudié en mathématiques et en informatique, qui consiste à prendre des données dans un espace de grande dimension, et à les remplacer par des données dans un espace de plus petite dimension. Pour que l'opération soit utile il faut que les données en sortie représentent bien les données d'entrée.

Définition et buts

La réduction de dimensionnalité consiste à prendre des données dans un espace de grande dimension, et à les remplacer par des données dans un espace de plus petite dimension[1]^,[2].

La raison pour laquelle une telle opération est utile est que les données de plus petites dimension peuvent être traitées plus rapidement[1]. Cette opération est cruciale en apprentissage automatique par exemple, pour lutter contre le fléau de la dimension.

Approches

Il existe plusieurs approches pour faire cette opération, et plusieurs objectifs possibles à atteindre. Les méthodes classiques sont la sélection de caractéristiques qui consiste à sélectionner un ensemble de variables qui vont être conservées, et l'extraction de caractéristiques qui consiste à créer de nouvelles variables plus pertinentes[1].

Notes et références

Christian Gagné, « Réduction de la dimensionnalité », sur Université de Laval
Hassan Chouaib, Sélection de caractéristiques : méthodes et applications (thèse de doctorat), 2011 (lire en ligne).

Articles connexes

Lemme de Johnson-Lindenstrauss

Portail de l'informatique théorique
Portail des probabilités et de la statistique
Portail des données

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[gagné-1] Christian Gagné, « Réduction de la dimensionnalité », sur Université de Laval

[chouaib-2] Hassan Chouaib, Sélection de caractéristiques : méthodes et applications (thèse de doctorat), 2011 (lire en ligne).