Ortolang

ORTOLANG est un équipement d’excellence dans le domaine des ressources et outils de traitement de la langue. Il s'inscrit en France dans le cadre des « Investissements d'avenir ». Le nom ORTOLANG est d'abord apparu comme l'acronyme anglais de Open Resources and TOols for LANGuage (« Ressources ouvertes et outils pour la langue »), puis il a été transcrit en un acronyme français de signification un peu différente : « Outils et Ressources pour un Traitement Optimisé de la LANGue »[1].

Cet article possède un paronyme, voir Ortolan.


Outils et Ressources pour un Traitement Optimisé de la LANGue

Adresse www.ortolang.fr
Description Outils et Ressources pour un Traitement Optimisé de la LANGue
Commercial non
Publicité non
Type de site Enseignement supérieur et recherche
Langue Multilingue (2 langues)
Inscription gratuite
Nombre d'inscrits 953 (janvier 2017)
Créé par CNRS
Lancement 2015
État actuel En activité

Enjeux

Dans un contexte de Recherche en linguistique où le traitement de la langue est de plus en plus informatisé, tout en nécessitant encore un travail important d'annotation et de production de métadonnées (fait de manière "manuelle" ou semi-automatisée), Ortolang est un « réservoir de données » conçu comme une infrastructure en réseau, contenant des corpus, lexiques, dictionnaires, etc. associés à divers outils d'analyse lexicale et linguistique, qui se veut accessible à tous.

Objectif

Les buts affichés de ce nouvel outil sont :

  • mieux recenser, valider[2], cataloguer[2], enrichir[2] archiver (de manière interopérable, selon le modèle OAIS (« Open Archival Information System » « Open Archival Information System » (OAIS, article anglophone de Wikipedia), et mutualiser les moyens et contenus de recherche sur « l’analyse, la modélisation et le traitement automatique de notre langue de se hisser au meilleur niveau international », en s'appuyant sur les moyens français que sont LORIA[3], LPL[4], ATILF[5], LLL[6], Modyco[7];
  • améliorer les usages, (notamment en accompagnant les utilisateurs[2]), améliorer les transferts de ressources et outils, surtout des laboratoires publics vers les partenaires industriels (PME qui souvent manquent de moyens pour accéder à ces données et outils) ;
  • valoriser « le français et les langues de France à travers un partage des connaissances sur notre langue accumulées par les laboratoires publics ».
  • pérenniser et généraliser les résultats des deux Centres de Ressources Numériques (centres numériques de qualité certifiée ; Trusted Digital Repository) sur la langue ; le CNRTL (Centre National de Ressources Textuelles et Lexicales[8]) et le SLDR[9]

Positionnement dans les infrastructures de recherche

En complément des efforts de la DGLFLF et de la BNF sur les corpus en langues de France, ORTOLANG doit devenir le « nœud français de l’infrastructure CLARIN » (Common Language Resources and Technology Infrastructure) et la principale plateforme technique sur l'écrit et l'oral, en coordonant le travail de la TGIR Huma-Num[10]

Notes et références

  1. Accueil d'Ortolang
  2. Présentation d'Ortolang
  3. Loria
  4. LPL
  5. ATILF
  6. LLL
  7. MODYCO
  8. Portail du CNRTL (Centre National de Ressources Textuelles et Lexicales)
  9. portail du SLDR (Banque de données parole et langage)(SLDR qui se prononce ‘SpLanDR’ étant l'acronyme de Speech and Language Data Repository)
  10. Huma-Num

Voir aussi

Articles connexes

Liens externes

Bibliographie

  • Durrer, Sylvie, 1998, Introduction à la linguistique de Charles Bally, Delachaux & Niestlé, (ISBN 978-2-603-01088-4).
  • Martin, Robert, 2002, Comprendre la linguistique, PUF, coll. « Quadrige », (ISBN 978-2-13-054549-1)
  • Normier, Bernard, 2007, L'apport des technologies linguistiques au traitement et à la valorisation de l'information textuelle, éditions ADBS, (ISBN 978-2-84365-092-5).
  • Portail de la linguistique
  • Langue française et francophonie
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.