Extraction de connaissances
L'extraction de connaissances est le processus de création de connaissances à partir d'informations structurées (bases de données relationnelles, XML) ou non structurées (textes, documents, images). Le résultat doit être dans un format lisible par les ordinateurs.
Le groupe RDB2RDF W3C[1] est en cours de standardisation d'un langage d'extraction de connaissances au format RDF à partir de bases de données.
En français on parle d'« extraction de connaissances à partir des données » (ECD)[2].
Description
L'extraction de connaissances se déroule en plusieurs étapes, avant le « data mining » (Exploration de données) proprement dit.
Le prétraitement consiste à construire des corpus de données spécifiques et met en forme les données suivant leur type (textes, images, sons, etc.)[3]. Suit une phase de nettoyage des données, et de traitement des données éventuellement manquantes.
Bibliographie
- Collectif Cépaduès, Extraction et gestion des connaissances - EGC'2009 : Actes des neuvièmes journées Extraction et Gestion des Connaissances (EGC'2009), Paris, Eyrolles, coll. « Revue des Nouvelles Technologies de l'Information », , 518 p. (ISBN 9782854288780)
- Processus d'extraction de connaissances à partir de données: Représentation et gestion des connaissances multi-points de vue, EL Moukhtar Zemmouri, PAF, 2014 (ISBN 9783838140483)
Voir aussi
Notes et références
Liens externes
- (en) « Knowledge Extraction Based on Discourse Representation Theory and Linguistic_Frames », sur researchgate.net,
- Portail du Web sémantique