Base de données bibliographiques

Les bases de données bibliographiques répertorient toute catégorie d'objets bibliographiques livres, collections, revues, articles de revues grâce à leurs métadonnées telles que leur titre, auteur, résumé, descripteur sujet. Elles sont le fruit de l'informatisation des catalogues de bibliothèque, et permettent des recherches à l'aide de mots-clefs ainsi que l'analyse des données (bibliométrie, etc.). WorldCat est l'exemple d'une telle base de données.

Historique et terminologie

Les bases bibliographiques ou plus précisément les bases de références bibliographiques se créent à partir des années 1960[1].

Dans les années 1960-70, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives « à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs »[2],[3]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).

Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :

Caractéristiques

Structure des données

Le terme base de données utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.

La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.

Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.

Indexation et référentiels

De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus documentaire ou ontologie.

Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme les titres de périodique ou les affiliations.

Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.

Thématique et couverture

Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codification des gènes).

Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées.

Exemples

  • Chemical Abstracts — Articles scientifiques en chimie — Origine américaine, Chemical Abstracts Service (CAS).
  • Francis — Articles scientifiques en sciences humaines et sociales — Origine française (CNRS, INIST) — résumés en français — indexation bilingue (Français, Anglais). (La base Francis n'est plus mise à jour).
  • Google Scholar — Origine société Google, États-Unis.
  • Index Theologicus — Théologie et Sciences des Religions — Origine allemande (Bibliothèque de l'Université de Tübingen).
  • Medline — Science de la vie et médecine — Origine administration américaine (National Library of Medecine).
  • Pascal — Science Technique et Médecine — Origine française (CNRS, INIST) — indexation bilingue (Français, Anglais) (La base Pascal n'est plus mise à jour).
  • WorldCat — catalogue collectif OPAC ((monographies et périodiques) — Origine OCLC (États-Unis) — parfois citée comme la plus grande base bibliographique mondiale.
  • Open Library — Catalogue collectif du projet Internet Archive.
  • Urbamet — base de données bibliographiques — origine association Urbamet, France — la principale base de données française sur l'urbanisme, l'aménagement du territoire, les villes, l'habitat et le logement, l'architecture, les équipements collectifs, les transports, les collectivités locales etc. qui rassemble et diffuse la mémoire de l’aménagement, de l’urbanisme et de l’habitat.
  • SantéPsy — base de données bibliographiques — origine Ascodocpsy — principale base de données française sur la psychiatrie et la santé mentale.

Notes et références

  1. Carbone Pierre, Les bibliothèques, Paris, Presses Universitaires de France « Que sais-je ? », 2012, 128 pages. (ISBN 9782130594550)
  2. Définition donnée dans l'arrêté du 22 décembre 1981, Journal Officiel, 17 janvier 1982, p. 624. Consultable sur France Terme, la base des termes recommandés au Journal officiel de la République française - http://www.culture.fr/franceterme (consulté le 22 novembre 2014)
  3. Voir aussi la définition donnée dans le Vocabulaire de la documentation, ADBS, 2004 - http://www.adbs.fr/banque-de-donnees-16252.htm (consulté le 22 novembre 2014)
  4. Histoire des bases de données juridiques en France (1) - les origines, Infostratèges, 2005
  5. Des formes éditoriales composites: Les revues Françaises de chimie, Sylvie Dalbin, Revue de Synthèse, , Volume 135, n°2-3, pp 221-238. DOI - 10.1007/s11873-014-0254-y (consulté le )

Articles connexes

  • Sciences de l’information et bibliothèques
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.