Informations non structurées

Les informations non structurées ou données non structurées sont des données représentées ou stockées sans format prédéfini. Ces informations sont toujours destinée à des humains. Elles sont typiquement constituées de documents textes ou multimédias, mais peuvent également contenir des dates, des nombres et des faits[1]. Cette absence de format entraîne des irrégularités et des ambiguïtés qui peuvent rendre difficile la compréhension des données, contrairement au cas des données stockées dans des tableurs ou des bases de données par exemple, qui sont des informations structurées.

Un nouveau paradigme

Dans un livre blanc publié en octobre 2007, l'Association de promotion de l'informatique libre (APIL), l'Aproged et le Cigref indiquent que les informations non structurées correspondent à un nouveau paradigme, tant sur le plan de l'évolution des techniques, que de l'évolution des structures de gouvernance et de l'évolution des rapports à l'information. Concernant ce dernier point, les informations non structurées correspond à une tendance qui s'étend avec l'apparition de ce que l'on appelle le web 2.0, qui comprend un volet technique et un volet social (voire sociétal), le second étant prépondérant. Le volet social s'organise autour de la démocratisation du Net, par la prise en compte des communautés et des réseaux sociaux, et par la promotion de la contribution des internautes[2].

Enjeux

Les enjeux pour l'entreprise sont[3] :

Types d'applications qui gèrent des informations non structurées

Les traitements de texte, le web 2.0 (notamment les wikis), les systèmes de gestion des connaissances, les systèmes de gestion de contenu et les outils d'intelligence économique travaillent essentiellement avec des informations non structurées.

Notes et références

  1. Jean-Louis Monino et Soraya Sedkaoui, Big Data, Open Data et valorisation des données, Londres, ISTE Editions, , 158 p. (ISBN 978-1-78405-122-8, lire en ligne), p. 13
  2. Livre blanc - Valorisation de l'information non structurée, p. 15
  3. Livre blanc - Valorisation de l'information non structurée, p. 15-16

Voir aussi

Articles connexes

Liens externes

  • Portail des bases de données
  • Sciences de l’information et bibliothèques
  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.