Glottolog

Glottolog est un projet de base de données bibliographiques des langues du monde, en particulier des moins connues, de l'Institut Max Planck d'anthropologie évolutionniste de Leipzig, en Allemagne. Depuis 2015, l’Institut Max-Planck de science de l’histoire humaine de Iéna a repris la tâche de maintenance du Glottolog. C'est une tentative pour atteindre une couverture bibliographique complète pour les langues du monde (soit 95 % de la diversité linguistique mondiale) et fournir une base empirique solide pour les définitions des langues et les classifications linguistiques[1]. Il est composé du catalogue de langues et familles de langues du monde nommé « Languoid » et de sa bibliographie « Langdoc ». Il affecte un identifiant unique et stable, le Glottocode, à toutes les familles, langues, et dialectes, nommés « langoids », qu'il recense. Ceux-ci sont organisées via une classification généalogique (l'arbre Glottolog) qui est basée sur les recherches les plus récentes disponibles. Il donne accès à plus de 180 000 références d'œuvres descriptives telles que grammaires, dictionnaires, listes de mots, textes, etc.[2],[3],[4]

Il utilise une licence Creative Commons Paternité et partage des conditions initiales à l'identique (CC-BY-SA 3.0) analogue à celle de Wikipédia[2].

Contributeurs

Alain Fabre, Jouni Maho et la Société internationale de linguistique (SIL) sont des contributeurs très importants de Glottolog[2]. Harald Hammarström a recueilli les bibliographies de nombreuses personnes et les a compilées dans une bibliographie principale, il a également compilé les informations détaillées sur les relations généalogiques prouvées des langues du monde. Son classement de haut niveau est fusionné avec celui de bas niveau (dialectes) provenant de Linguist List. Le linguiste Sebastian Nordhoff s'est chargé de l'importation des bibliographies et avec l'aide de Hagen Jung et Robert Forkel, il a conçu et programmé la base de données et la première version de l'application Web, tandis que Robert Forkel s'est occupé de la seconde version. Martin Haspelmath (en) a quant à lui donné des conseils et aidé à la coordination à chaque étape tout au long du projet, c'est actuellement le responsable des noms de dialectes[5].

Différences par rapport à Ethnologue

Glottolog diffère de la base de données plus connue Ethnologue, Languages of the World de plusieurs façons.

D'une manière positive, il tente de classer uniquement les langues dont les spécialistes ont été capables de déterminer à la fois qu'elles existent et qu'elles sont distinctes des autres. Si cela est prouvé mais qu'aucune information grammaticale ou lexicale n'est disponible, elles sont classées comme « non attestées », et celles qui ont seulement été rapportées par d'autres sources sans avoir été prouvées réellement sont étiquetées comme « douteuses »[N 1]. Une bibliographie étendue est fournie, surtout pour les langues moins connues. Le classement des langues et dialectes ne se fait que dans des familles considérées comme valides, avec un code ISO ou un Glottocode quand c'est possible et une liste des noms alternatifs.

Glottolog comporte aussi des aspects négatifs, notamment qu'en dehors d'un simple point sur la carte à son centre géographique, aucune donnée ethnographique ni démographique n'est fournie pour les langues ou les dialectes (par exemple, le français « standard » est représenté par un point dans une forêt au nord d'Orléans[6]).

Partenariat avec De Gruyter

L'Institut Max Planck et l'éditeur académique allemand De Gruyter ont conclu un accord pour partager les données bibliographiques. Selon l'accord, De Gruyter fournira à l'institut l'ensemble des notices bibliographiques de ses publications sur la langue et la linguistique, passées et futures, en vue de les intégrer à la base de données de Glottolog. En contrepartie, un lien vers le site web de De Gruyter sera fourni dans chaque référence. Le professeur Martin Haspelmath de l'Institut Max-Planck d'anthropologie évolutionniste explique qu'« il semble clair que cet accord bénéficiera aux deux parties : Glottolog obtiendra encore plus de références bibliographiques et De Gruyter aura toutes ses œuvres présentées dans cette importante base de données »[7].

Notes et références

Notes

  1. « unattested » et « spurious », voir le glossaire de Glottolog

Références

Annexes

Liens externes

Bibliographie

  • (en) Sebastian Nordhoff, « Linked Data for Linguistic Diversity Research: Glottolog/Langdoc and ASJP Online », dans Christian Chiarcos, Sebastian Nordhoff, Sebastian Hellmann, Linked Data in Linguistics : Representing and Connecting Language Data and Language Metadata, Springer Science+Business Media, , 218 p. (ISBN 3642282490 et 9783642282492, présentation en ligne, lire en ligne), p. 191-200.
  • (en) Sebastian Nordhoff et Harald Hammarström, « Glottolog/Langdoc: Increasing the visibility of grey literature for low-density languages », dans N. Calzolari (dir.), Proceedings of the 8th International Conference on Language Resources and Evaluation, European Language Resources Association, , 3289-3294 p. (lire en ligne).
  • (en) Sebastian Nordhoff et Harald Hammarström, « Glottolog/Langdoc: Defining dialects, languages, and language families as collections of resources », Proceedings of the First International Workshop on Linked Science, vol. 783, (lire en ligne).

Articles connexes

  • Portail des langues
  • Portail de la linguistique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.