Cordial

Cordial est un logiciel de correction grammaticale et d'aide à la rédaction pour la langue française pour Microsoft Windows.

Cet article concerne l'informatique. Pour les autres significations, voir Cordial (homonymie).
Cordial

Informations
Développé par Synapse Développement
Dernière version ()
Environnement Windows
Langues Multilingue (d)
Type Correcteur grammatical (en)
Correcteur orthographique
Licence Logiciel propriétaire
Site web cordial.fr

Il existe en deux versions : référence et professionnelle. Les deux versions disposent du même correcteur mais la version professionnelle propose en plus un dictionnaire de définitions incluant les termes techniques des différents métiers, la correction orthographique multilingue, un contrôle éditorial pour identifier les obstacles à la transmission d’informations, des modes de correction adaptés aux professionnels et un outil de diagnostic de l'orthographe pour envisager des formations.

Historique

Conçu par la société toulousaine Synapse Développement, Cordial est le fruit de l'effort d'une équipe d'une dizaine de développeurs et de linguistes[1]. Né d'un correcteur orthographique intégré en 1988 dans le logiciel de traitement de texte Le Rédacteur (sur Atari ST), qui se mua en correcteur grammatical en 1992 dans Le Rédacteur 4, Cordial a connu sa première version sous Windows en février 1995. Depuis la version Cordial 2013, Mac OS X est également supporté.

En fait, le mot « Cordial » est un acronyme pour « CORrecteur D'Imprécisions et Analyseur Lexico-syntaxique »[2].

De 1997 à 2007, le correcteur orthographique, le dictionnaire de synonymes et l'outil de césure fournis avec la suite Office de Microsoft sont des outils développés par la même société, Synapse Développement. Sur Macintosh, tous ces outils et le correcteur grammatical pour le français sont également issus de cette société. Différentes versions du logiciel se sont succédé jusqu'à la version commercialisée en , qui portait le no 21[3],[4].

En 2020, l'éditeur commercialise la version Cordial Néo, qui utilise « une toute nouvelle technologie de Machine Learning adaptée à la correction des textes »[5].

L'éditeur vend des licences mais privilégie le mode Software as a service (SaaS)[6],[5].

Le logiciel Cordial

Les principales caractéristiques du logiciel Cordial ont été présentées lors de la journée d'étude de l'ATALA du 3 juin 2006[7].

Interface

Cordial est directement intégré dans les logiciels d'édition comme Word ou OpenOffice. En effet Cordial « bénéficie d'une parfaite intégration aux applications MS Office, OpenOffice, Internet Explorer, Firefox, Opera, aux messageries instantanées et aux outils de PAO »[8].

L'analyseur

Pour corriger automatiquement un texte, il faut analyser grammaticalement chaque phrase. Cette analyse ne peut s'effectuer comme une analyse grammaticale logique habituelle. En effet, pour repérer les fautes, l'analyseur est contraint d'utiliser des règles d'analyse floues. Ainsi, dans la phrase « ils sont grandes consommateurs de pâtisseries », un analyseur formaliste ne constituera jamais un groupe entre les mots « grandes » et « consommateurs », car ils sont de genres différents, donc soit il raccordera « grandes » à « pâtisseries », soit il laissera « grandes » comme un groupe à part hors contrainte grammaticale. Un analyseur flou, comme celui qu'utilise Cordial, prenant en compte la position des mots dans la phrase et les régularités statistiques, placera dans un même groupe l'adjectif « grandes » et le nom « consommateurs », ce qui lui permet de déceler la faute d'accord et de proposer de remplacer « grandes » par « grands ».

L'analyseur de Cordial peut être observé dans le logiciel, qui propose l'analyse de chaque phrase. L'une des principales caractéristiques de Cordial est sa rapidité : Cordial peut analyser un ouvrage entier en quelques secondes (les auteurs annoncent une vitesse d'analyse de 15 000 mots par seconde sur Pentium GHz).

Le correcteur

Le correcteur applique les règles de grammaire sur l'analyse effectuée par l'analyseur[9]. Lorsqu'un mot est inconnu des dictionnaires (c'est-à-dire le plus souvent lorsqu'il est fautif car les dictionnaires de Cordial sont très complets), il propose un ou plusieurs mots de remplacement, généralement un seul et presque toujours le bon. C'est ce qu'on appelle en informatique la correction orthographique. Lorsqu'un mot est dans les dictionnaires mais correspond à une faute d'accord ou, plus généralement, à une faute de grammaire, le correcteur propose de le remplacer par le bon mot.

Le correcteur corrige de très nombreux types de fautes et, en particulier, les fautes d'homophonie et d’homographie. Ainsi, si vous écrivez « La page demande de la confiture de coins. », Cordial vous proposera « Le page demande de la confiture de coings. », en repérant la faute d'homographie entre « la page » et « le page » et la faute d'homonymie entre « coin » et « coing ». Ces fonctions de correction sont obtenues grâce à l'analyseur sémantique associé à l'analyseur grammatical. Le logiciel repère en effet le sens de chacun des mots qui peuvent avoir plusieurs sens (les sens trouvés sont présentés dans l'analyse de la phrase proposée par Cordial).

Le correcteur a été utilisé pour traiter de nombreux ouvrages de la littérature classique. Il a ainsi trouvé des erreurs, par exemple chez Alexandre Dumas, Victor Hugo, Honoré de Balzac, Stendhal[10]

La correction orthographique est proposée pour l'anglais, l'espagnol et l'allemand. Dans la version professionnelle, les corrections grammaticales pour l'italien et le portugais s'y ajoutent. Depuis la version 2012, la version professionnelle de Cordial propose la correction orthographique dans 70 langues grâce à une adaptation de Hunspell.

L'imperfection éventuelle de la correction s'explique par le fait que l'analyse grammaticale et le repérage des sens des mots ne sont pas des sciences exactes. Ce sont des domaines de recherche. De plus, les spécialistes de la grammaire française débattent encore de certains accords du participe passé, en particulier les accords relatifs aux verbes pronominaux figés comme « se faire fort ».

Les bases lexicales

Cordial offre plusieurs dictionnaires[7]. Dans la version Cordial 21, le dictionnaire de noms communs intègre 342 787 lemmes correspondant à 2 081 580 mots, et le dictionnaire de noms propres contient 833 205 entrées. Le correcteur s'appuie aussi sur des dictionnaires de locutions contenant plus de 100 000 expressions, sur un dictionnaire de sigles de 40 584 termes et sur un dictionnaire de 24 700 abréviations. La plupart de ces mots, expressions, sigles et abréviations ont leur définition. Il s'agit d'une des plus grandes bases lexicales existantes pour le français, selon les informations fournies par les éditeurs[11],[12]. Le dictionnaire de l'Encyclopædia Universalis reprend celui de Cordial[13] de même que le dictionnaire des tablettes Amazon[14].

Cordial Pocket est une version gratuite pour Android[15] et IOS[16], qui offre la correction, plusieurs dictionnaires de définitions ainsi qu'une base de conjugaisons très complète.

Autres dictionnaires

Cordial est accompagné de 18 dictionnaires dans sa version référence et de 68 dans sa version professionnelle. Le dictionnaire de synonymes et d'antonymes comporte plus de 50 000 entrées pour un total de 4 millions de synonymes. Dans sa version professionnelle, Cordial donne accès au dictionnaire Littré. Des dictionnaires de faux-amis et de traduction mot à mot ou expression à expression sont également disponibles dans la version professionnelle, pour n'importe quel couple de langues entre français, anglais, allemand, espagnol, italien et portugais. Dans la version professionnelle, Cordial indique les noms faisant l'objet d'une marque déposée et les noms de société[17].

Corpus de base

Le corpus de base est un ensemble d'œuvres et de textes utilisés par Cordial pour son développement (repérage des fautes usuelles, des mots utilisés et de leur fréquence, etc.) et pour des fonctions de comparaison entre ces textes et ceux de l'utilisateur.

Dans ses premières versions, Cordial utilisait un « petit » corpus de 2 600 œuvres et de textes de journaux, représentant environ 500 millions de mots. À partir de 2008, ce corpus a été porté à 5 000 ouvrages et plus d'1,2 milliard de mots[18]. En 2013, il comporte maintenant plus de 10 000 ouvrages et plus de 3,5 milliards de mots. Par comparaison avec les corpus utilisés en linguistique informatique[19],[20], ce corpus se distingue par sa taille mais également par la part importante d'œuvres récentes et très récentes (plusieurs centaines d'œuvres sont postérieures à 2000)[21].

Analyse des textes

Grâce aux dictionnaires et au corpus, Cordial propose de nombreuses options d'analyse de texte : recherche de mots-clés, de concepts-clés, de phrases-clés, analyse statistique, analyse sémantique, analyse stylistique, cooccurrences, segments répétés. Il est également possible de comparer chacun de ses textes aux 5 000 œuvres du corpus de base décrit ci-dessus ainsi qu'à de grandes catégories de texte (journalistique, commercial, juridique, technique).

Intégration dans d'autres logiciels

Cordial s'intègre dans Microsoft Office en remplaçant son correcteur. Ainsi les soulignements en rouge (orthographe) et en vert (grammaire) effectués lors de la frappe dans Word sont ceux de Cordial, une fois installé le logiciel. Par ailleurs, les fonctions de Cordial sont disponibles dans le ruban de MS Word, MS Excel, MS PowerPoint et MS Outlook.

Cordial s'intègre également dans de nombreux logiciels sous Windows comme les logiciels de messagerie, Internet Explorer, les logiciels de mise en page, etc.

Depuis la version 2010 de Cordial, l'intégration dans OpenOffice.org 3.1 est complète avec soulignement en rouge des fautes d'orthographe et soulignement en bleu des fautes de grammaire[22].

Clients

Cordial s'adresse à l'ensemble des francophones. Il dispose de mots de vocabulaires canadien, belge, suisse, africain et antillais, et plusieurs paramètres permettent de prendre en compte ou de signaler les termes issus de ces vocabulaires.

Les clients de la version professionnelle semblent être surtout des « professionnels de la langue » (journalistes, écrivains, avocats, correcteurs, traducteurs…) qui l'intègrent dans leurs applications[23][source insuffisante] tandis que la version référence touche un public beaucoup plus large, en particulier les enseignants, les étudiants et lycéens, cette version étant commercialisée à la moitié du prix de la version professionnelle[24]. Dès 1999, Cordial était utilisé par l'Agence France-Presse, l’Encyclopædia Universalis et une dizaine d'universités[25].

Le dictionnaire de définitions de Cordial est par ailleurs intégré dans le Kindle d'Amazon depuis septembre 2011[26].

Une version spécifique de Cordial, Cordial Analyseur, s'adresse aux laboratoires de traitement automatique du langage naturel. Il est commercialisé à petit prix[27] et il est très utilisé par les chercheurs en linguistique informatique[28],[29] et en lettres[30],[31]. Cette version fournit un analyseur morpho-syntaxique, outil de base des linguistes pour l'étiquetage : « Cordial étant très vraisemblablement le meilleur étiqueteur morpho-syntaxique disponible pour le français écrit »[32]. « Cet analyseur est accessible à un utilisateur totalement néophyte. De plus, il est extrêmement rapide (moins d’une seconde pour un article d’une page) »[33]. C'est ce même analyseur qui est intégré dans l'outil Qristal, logiciel de recherche en langage naturel (sur disque dur et sur le Web) de cette même société Synapse Développement[34].

Utilisations singulières

Peu d'utilisateurs de Cordial utilisent la totalité des outils proposés[7], certains ne se servent même pas de sa fonction première de correcteur. Ainsi des traducteurs du français vers une autre langue ont mis au point une formule de calcul de devis à partir de l'analyse statistique de Cordial, du degré de lisibilité et de la complexité grammaticale des phrases. Des éditeurs et des cabinets de traduction l'utilisent pour comparer les graphies des noms propres, via l'option « occurrences » et vérifier que, pour une œuvre, la même graphie est toujours utilisée pour un même mot; les enseignants utilisent les fonctions d'analyse grammaticale et d'analyse de texte, mais également les dictionnaires de définitions et de synonymes[35].

Depuis sa version 2008, Cordial peut aussi être utilisé pour résoudre des anagrammes, des mots croisés ou de nombreux jeux de lettres.

Amélioration de la correction, grâce à Wikipédia, aux textes de littérature, et aux utilisateurs

Afin d’améliorer les règles de correction, une base de plusieurs millions de fautes a permis de déterminer les fautes d'orthographe, de grammaire et de typographie les plus communes. Cette base a notamment été complétée par l’exploitation intensive des révisions du corpus de la Wikipédia en français[alpha 1]. Le principe a consisté à comparer automatiquement les révisions entre elles pour en extraire les différences minimes correspondant à des corrections. Ont ainsi été extraites 1,2 million de fautes d’orthographe, 1,5 million de fautes de grammaire et plus de 900 000 fautes de typographie (trait d’union et capitale). Grâce à ce corpus très important, les développeurs ont pu tester et améliorer leurs algorithmes, provoquant un véritable bond en avant du niveau de correction et, en parallèle, une réduction du taux de « fausses erreurs » (messages inappropriés). Les fautes détectées ont été analysées et intégrées à la base de connaissance afin d'améliorer le fonctionnement du correcteur. Ce travail a ensuite été étendu à des textes de grands auteurs de la littérature française[36],[37],[38],[39].

L’évolution du correcteur est également dictée par l’analyse des erreurs de millions d’utilisateurs de la technologie de correction Cordial via la puissance de l'apprentissage automatique. Cette innovation permet de réaliser un observatoire des erreurs[40],[41]. Cet observatoire permet d'analyser des erreurs d’une population qui n'est pas forcément en confiance avec l’orthographe et la grammaire, mais qui reste soucieuse de bien écrire. Cette population, assez différente de celle analysée par la plupart des études, permet de relever de nouveaux indices issus de productions réelles et non de tests sur les irrégularités et autres « pièges » de la langue française. Ses conclusions ont été proposées lors de la définition du choix du nom de la région « Occitanie »[42].

Concurrents

Dans son analyse des produits du marché, un journaliste indépendant, François Coulaud, conclut à la fin de 2013 que pour lui le logiciel Cordial est le plus efficace, a le meilleur rapport qualité/prix, dispose de la plus grande richesse d'assistances rédactionnelles et enfin qu'il est le moins coûteux[43],[44] ; quant au produit pour smartphone, il le qualifie de « synthétique, efficace et peu onéreux »[45].

Distinctions

Cordial a reçu plusieurs prix ou nominations de la part de revues informatiques[46],[47] :

  • 1997 : nomination de Cordial pour le « prix d'excellence technique » par le magazine PC Expert
  • 2001 : produit de l'année pour la catégorie « aide à la rédaction » par Windows News
  • 2001 : nomination de Cordial 7 au « Palmarès des Meilleurs Produits Micro 2001 »
  • 2011 : Cordial 2012, « choix de la rédaction » de la revue Micro actuel
  • 2013 : « Cordial, meilleur correcteur du marché »[48].

Le fondateur de la société éditrice, Dominique Laurent, a été élu « personnalité française de l'année » en 2001 dans le dossier annuel Excellences techniques du magazine PC Expert[49].

Pour approfondir

Bibliographie

  • Dominique Laurent, Les vraies difficultés du français au XXIe siècle, 2012, 192 page (ISBN 978-2-95415-070-3)
    L'ouvrage est une étude des erreurs les plus courantes au sein des articles de la wikipédia francophone.
    L'ouvrage « représente un outil très utile pour comprendre les fautes les plus courantes en français contemporain et améliorer son orthographe » (analyse critique de Valerio Emanuele, in « Ouvrages », Études de linguistique appliquée, 2013/2 (n°170), [lire en ligne]

Liens externes

Notes et références

Notes

  1. Les révisions de la Wikipédia en français sont fournies par la fonctionnalité http://download.wikimedia.org/frwiki/.

Références

  1. Jérôme Cartegini, « Quel est le meilleur correcteur orthographique ? », (consulté le ).
  2. Nadine Vincent, Présence et description d’emplois québécois dans des dictionnaires disponibles gratuitement en ligne, Université de Sherbrooke - Centre de recherche interuniversitaire sur le français en usage au Québec (CRIFUQ) [lire en ligne].
  3. « Ecriture intelligente et logiciel de traitement de texte – Synapse Développement annonce la sortie de la dernière version de son logiciel phare : Cordial », (consulté le ).
  4. Stéphane Le Troëdec, « Cordial Pro, correcteur d'orthographe et de grammaire », (consulté le ).
  5. « Cordial Néo, le correcteur orthographique boosté à l’intelligence artificielle », (consulté le ).
  6. Emma Bao, « CORRECTEURS D'ORTHOGRAPHE ET DE GRAMMAIRE : Conçu par Synapse Développement, Cordial séduit la presse ! », (consulté le ).
  7. « Présentation du logiciel CORDIAL à la journée d'étude ATALA » [ppt], (consulté le ).
  8. Revue SVM, no 277, janvier 2009, p. 68.
  9. « À propos de la correction grammaticale française et des correcteurs informatiques », sur site de la société Synapse Développement (consulté le ).
  10. Paul Carcenac, « Orthographe : ils traquent les fautes des grands auteurs », sur le site du quotidien La Dépêche du Midi, (consulté le ).
  11. « Les dictionnaires d'Antidote : 125 000 mots dont 13 000 noms propres », sur le site de la société Druide informatique (consulté le ).
  12. « Correction du français : Pro Lexis détecte plus de 703 000 flexions de mots », sur le site des éditions Diagonal (consulté le ).
  13. Le site de l'Encyclopædia Universalis.
  14. « Le dictionnaire des tablettes Amazon est toulousain », sur le site du quotidien La Dépêche du Midi, (consulté le ).
  15. « Correcteur d'orthographe pour Androïd », sur le play store Google (consulté le )
  16. « Correcteur d'orthographe pour IOS », sur iTunes (consulté le )
  17. Revue PC Expert, décembre 2008, p. 23
  18. « Le corpus de base », sur site de la société Synapse Développement (consulté le ).
  19. « Corpus Frantext », sur site du Centre national de ressources textuelles et lexicales (CNRTL) (consulté le ).
  20. « Principes de constitution du corpus TALN », sur site du laboratoire MoDyCo de l'UMR 7114 de l'Université Paris Ouest Nanterre La Défense (consulté le ).
  21. « Les 5 000 ouvrages du corpus de Synapse Développement par auteur », sur site de la société Synapse Développement (consulté le ).
  22. « Toute la puissance de l'analyse et la correction de Cordial dans l'ensemble de la suite OpenOffice 3.2 ! », sur site de la société Synapse Développement (consulté le ).
  23. « Références pour l'intégration de la correction dans un logiciel propriétaire », sur site de la société Synapse Développement (consulté le ).
  24. « Pro 2009: La correction revue et corrigée », sur www.bluewin.ch (consulté le ).
  25. Xavier Bihan, Les correcteurs orthographiques, janvier 2000, [lire en ligne].
  26. Agnès Fremiot, « Synapse : la PME toulousaine s’installe dans les tablettes d’Amazon », sur le site du premier quotidien de l'économie toulousaine, (consulté le ).
  27. « Session "Show & Tell" Démonstration et Applications industrielles », sur site de l'Association francophone de la communication parlée (consulté le ).
  28. Nathalie Gasiglia, Faire coopérer deux concordanciers-analyseurs pour optimiser les extractions en corpus, Revue française de linguistique appliquée 1/2004 (Vol. IX), p. 45-62, [lire en ligne].
  29. Rachel Panckhurst, Une La glose, le document électronique et l'extraction automatisée, U.M.R. 5475 C.N.R.S. « Discours, textualité et production de sens », Praxiling, Université Paul-Valéry Montpellier 3, publié dans Langues et langages, Le mot et sa glose, A. Steucckardt et A. Niklas-Salminen, no 9, p. 271 à 294, 2004, [lire en ligne].
  30. Thierry Selva, Une étude quantitative du vocabulaire de Maupassant, article paru dans la revue L’Angélus no 12 daté décembre 2001, paru en janvier 2002, p. 41-48, [lire en ligne].
  31. Tamara This-Rogatcheva, Étude lexicométrique du conte fantastique de Ludwig Tieck : Le Runenberg, université Paris-XII, 2004, [lire en ligne].
  32. Sarah Leroy, Extraire sur patrons : allers et retours entre analyse linguistique et repérage automatique, université Paris X-Nanterre / CNRS-UMR 7114 (Modèles, Dynamiques, Corpus), CAIRN, Revue Française de Linguistique Appliquée 2004-1 (Vol. IX)], [lire en ligne].
  33. André Valli & Jean Véronis, Étiquetage grammatical des corpus de parole : problèmes et perspectives, université de Provence, 2000, [lire en ligne].
  34. Dominique Laurent, Sophie Nègre, Patrick Séguéla, QRISTAL, le QR à l'épreuve du public, TAL volume 46 no 3, 2005, p. 1 à 32, [lire en ligne]
  35. « Quelques utilisations étonnantes de Cordial », sur site de la société Synapse Développement (consulté le ).
  36. Didier Sanz, « Alexandre Dumas et Victor Hugo dénoncés par un logiciel de correction », sur le site du quotidien Le Figaro, (consulté le ).
  37. David Feugey, « Cordial 2012 : la correction de texte gagne en précision », sur le site silicon.fr d’« informations en ligne sur les nouvelles technologies » (consulté le ).
  38. Eve Jouffroy-Notelet, « Cordial : Correcteur d’orthographe », sur le site correctionfacile.eu (consulté le ).
  39. Dominique Laurent, « Wikipédia, une mine d’or pour les chercheurs en TALN », sur le site wikimedia.fr (consulté le ).
  40. M.-C. W., « "Languedoc" : un nom de région qui limite les pièges d'orthographe », sur le site du quotidien L'Indépendant, (consulté le ).
  41. « L'observatoire des écrits par Cordial », sur Site ITexpresso, actualité sur les nouvelles technologies pour les entrepreneurs et les TPE-PME (consulté le ).
  42. Ph. E., « Région : le casse-tête de l'orthographe », sur le site du quotidien La Dépêche du Midi, (consulté le ).
  43. « Correcteurs d'orthographe sur le grill 2/2 », sur site de François Coulaud, (consulté le ).
  44. « Correcteurs d'orthographe sur le grill 1/2 », sur site de François Coulaud, (consulté le ).
  45. « Correcteurs d'orthographe sur le grill 1/2 », sur site de François Coulaud, (consulté le ).
  46. « Prix et récompenses reçus par Cordial », sur Cordial le correcteur (consulté le ).
  47. Micro actuel, no 84, décembre 2011, p. 66.
  48. Journal 01net Micro hebdo, no 780 du 29 août au 11 septembre 2013.
  49. « Excellences techniques 2001 », sur site de la société Synapse Développement (consulté le ).
  • Langue française et francophonie
  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.