Données brutes

Les données brutes (aussi connu comme données primaires) sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation.

Les données brutes peuvent être entrées dans un programme informatique ou utilisées dans des procédures manuelles telles que l'analyse statistique d'une enquête.

Il peut s'agir des données binaires des périphériques de stockage électroniques comme les lecteurs de disque dur[1].

Limites

Les données brutes contiennent des informations plus ou moins factuelles. Elles sont souvent quantitatives[2], supposées fiables si l'instrument qui les a produites a été convenablement étalonné et si le processus de collecte n'est pas biaisé et si elles sont correctement contextualisées.

Dans le domaine de la recherche scientifique (où il faut pouvoir répéter une expérience pour la contrôler ou valider), les faits présentés ou validés sans fournir un accès aux données brutes sont de plus en plus soumis à caution[3]. Il devient suspect de ne pas les conserver car depuis quelques années, les coûts de stockage ont diminué et il y a eu une multiplication des scandales portant sur les erreurs des connaissances induites à partir de données brutes[4].

Cependant, selon Geoffrey C. Bowker (2005), « Nous devons ouvrir le débat – alors qu’il n’en existe aucun de sérieux actuellement – à propos des différentes temporalités, spatialités et matérialités que nous sommes susceptibles de représenter grâce à nos bases de données, avec, en vue, une conception permettant une flexibilité maximum, et autorisant, autant que possible, l’émergence d’une polyphonie et d’une polychronie. L’expression “données brutes” est un oxymore autant qu’une mauvaise idée; au contraire, les données devraient être cuisinées avec soin. »[5].

Notes et références

  1. Dans tous les articles, les auteurs s’attachent scrupuleusement aux faits, aux données brutes et concrètes : pas de bavardage, pas d’interprétations oiseuses, mais des informations précises étayées par des citations sourcées.'Bulletin critique du livre français, no  666-669, Association pour la diffusion de la pensée française, 2005, p. 5
  2. Le Manuel du Knowledge Management, mettre en réseau les hommes et les savoirs pour créer de la valeur, Dunod 2007
  3. [PDF]Promouvoir une recherche intègre et responsable, Comité d’éthique du CNRS, juillet 2014
  4. Reinhart et Rogoff corrigent leurs erreurs de calcul sur l'austérité, l'Expansion.com, publié le 10/05/2013
  5. Bowker, G. C. (2005) Memory Practices in the Sciences. MIT Press, Cambridge, Massachusetts(voir p. 183-184)
  • Portail de l’informatique
  • Portail d’Internet
  • Portail du Web sémantique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.