Cobol

Cobol est un langage de programmation créé en 1959 (officiellement le 18 septembre 1959)[2]. Son nom est l’acronyme de COmmon Business Oriented Language qui révèle sa vocation originelle : être un langage commun pour la programmation d'applications de gestion. Aujourd'hui, il est surtout utilisé dans les secteurs de la banque, des assurances, des grandes administrations[3].

Cet article possède un paronyme, voir Kobol.

Cobol

Date de première version 1959
Développeurs Short Range Committee
Dernière version 2014[1]
Influencé par FLOW-MATIC, COMTRAN (en)
Extension de fichier cbl, cob et cpy

Histoire et spécifications

Le Cobol a initialement été créé en 1959 par le Short Range Committee, un des trois comités proposés à une rencontre au Pentagone en mai 1959 organisée par Charles Phillips du département de la défense des États-Unis. Le comité a été formé pour recommander une approche à court terme pour un langage commun, indépendant des constructeurs, pour les applications de gestion de l'administration américaine. Il était constitué de membres représentant six constructeurs d'ordinateurs et trois agences gouvernementales. Les six constructeurs informatiques étaient Burroughs Corporation, IBM, Minneapolis-Honeywell, RCA, Sperry Rand, et Sylvania Electric Products. Les trois agences du gouvernement étaient le US Air Force, le David Taylor Model Basin, et l’Institut national des standards. Ce comité était présidé par un membre du NBS. Des comités à moyen et long terme ont également été proposés au Pentagone. En revanche, même si le premier a été fondé, il n'a jamais été opérationnel, et le dernier n'a jamais été fondé. En fin de compte, un sous-comité du Short Range Committee a été formé avec six membres :

  • William Selden et Gertrude Tierney de IBM ;
  • Howard Bromberg et Howard Discount de RCA ;
  • Vernon Reeves et Jean E. Sammet de Sylvania Electric Products.

Ce sous-comité a terminé les spécifications de Cobol fin 1959. Elles étaient largement inspirées par le langage FLOW-MATIC inventé par Grace Hopper, surnommée « la mère du langage Cobol », et par le langage COMTRAN d'IBM, inventé par Bob Bemer.

Ce langage ayant été conçu aux débuts de l'informatique, sa relative complexité rebute nombre de programmeurs de notre époque, ce qui lui a valu deux interprétations ironiques de son acronyme : Compiles Only Because Of Luck (fonctionne uniquement par chance) et Completely Obsolete Business Oriented Language (Langage orienté gestion complètement obsolète)[4].

En outre, le language Cobol a permis le traitement des gros fichiers sur supports séquentiels ou sélectifs à l'aide d'un vocabulaire et d'une syntaxe censés rappeler l'anglais courant[5].

Histoire des standards Cobol

Ces spécifications furent approuvées par le comité complet, puis par le comité exécutif (CODASYL) en janvier 1960 et envoyées au bureau d'impression du gouvernement qui les édita et imprima en les nommant Cobol 60. Le langage fut développé en moins de six mois de travail, et il est toujours utilisé aujourd'hui, après plusieurs révisions standardisées par l'ANSI et l'ISO, dont

  • Cobol-68 (1968) : gestion des tables, accès séquentiel, accès aléatoire, random processing, tri, report writer, segmentation et bibliothèque
  • Cobol-74 (1974)
  • Cobol-85 (1985) qui témoigne d'un grand pas vers l'adoption de la programmation structurée par l'industrie informatique
  • En 1989, les fonctions intrinsèques sont ajoutées au langage ; elles permettent des opérations mathématiques (ACOS, pour calculer l'arc cosinus par exemple), logiques (MAX, MIN) ou sur des chaînes de caractères (UPPER-CASE).
  • Cobol 2002 (ISO/CEI 1989:2002) : introduit la programmation orientée objet, le support de l'Unicode, du XML, etc[5]

Traits principaux

La totalité des variables et des structures de données utilisées sont définies au début du programme, avant la division procédurale contenant les instructions. La manière dont sont définies les variables, c'est-à-dire les espaces de stockage temporaire, est très particulière. C'est une structure arborescente définie par une suite de lignes de code. Chaque ligne commence par un nombre qui définit le niveau d'imbrication du champ ou du groupe de variables.

Par exemple :

      01 NomPrenom.
        05 Prenom PIC X(20).
        05 Nom    PIC X(20).

qui définit une structure NomPrenom contenant les champs Prenom et Nom sur 20 caractères.

Autre exemple :

       01 CodePostal.
         02 Depart  PIC 99.
         02 Commune PIC 999.

qui définit un code postal de France, et qui permet d'utiliser le département sans aucun MOVE.

Comme défini dans la spécification originale, Cobol possédait déjà les nombreuses fonctionnalités qui ont fait son succès : d'excellentes capacités d'auto-documentation, des méthodes pratiques de gestion des fichiers et des types de données variés, dont le format est précisé par la clause PICTURE. Comme la plupart des autres langages de l'époque, il ne permet pas de définir de variables locales, de fonctions récursives et d'allouer de la mémoire dynamiquement.

La gestion des décimales en Cobol (nombres en virgule fixe), et la maîtrise des arrondis et des dépassements, permettent d'éviter les nombreux problèmes qui arriveraient en utilisant des nombres à virgule flottante pour les calculs financiers. Ce sont ses capacités arithmétiques en virgule fixe, notamment pour les traitements par lots où il présente d'excellentes performances, qui ont rendu le Cobol particulièrement populaire pour les traitements comptables.

Il intègre également un générateur de rapports, défini de la même manière que les autres structures de données. Sont intégrées des fonctions de tri, de fusion et de communication. Un module optionnel permettait également une forme de communication inter-processus par file de messages.

Le parti-pris initial de définir un langage de programmation proche du langage naturel (comme pour FLOW-MATIC) devait faciliter, sinon la programmation, du moins l'audit des programmes Cobol par des gestionnaires non-informaticiens. Ce choix a eu pour conséquence une syntaxe complexe (le langage naturel n'est pas simple), avec de nombreux mots réservés, et de nombreuses options (les opérations de gestion ne sont pas simples non plus) qui valent à Cobol une réputation de verbosité, qui n'est pas forcément fondée sur des faits.

Par exemple en Cobol l'instruction

       ADD montant TO total-jour total-mois total-annee.

s'exprimerait, en C ou autres langages dérivés, par

total_jour += montant; 
total_mois += montant; 
total_annee += montant;

Comme d'autres langages de l'époque (par exemple Fortran II[réf. nécessaire]), Cobol offrait la possibilité de modifier du code pendant l'exécution à l'aide de la fameuse instruction ALTER X TO PROCEED TO Y (altérer X pour aller vers Y). Cette possibilité dangereuse, qui transposait une technique courante de la programmation en langage machine, a été éliminée des spécifications du langage. Rendant possible la modification à la volée de l'exécution d'un programme, cette commande permettait d'outrepasser des ordres GO TO, complexifiant ainsi la maintenance.

Les versions successives du standard ont modernisé le langage, par exemple en ajoutant des structures de contrôle améliorées et le support de la programmation objet, tout en préservant au maximum la compatibilité avec les versions précédentes, de façon à éviter d'avoir à modifier l'énorme stock de programmes Cobol en service.

Le poids de l'héritage

Le langage Cobol était de loin le langage le plus employé des années 1960 à 1980, et reste très utilisé dans de grandes entreprises, notamment dans les institutions financières qui disposent (et développent encore) de nombreux logiciels et applications en Cobol[6].

Écrites à une époque où les octets coûtaient cher, et où l'an 2000 était encore fort loin, ces applications ont fait craindre le fameux bogue de l'an 2000. Souvent, en effet, par mesure d'économie de mémoire, les services informatiques et programmeurs avaient codé les années et les tests d'année sur deux chiffres plutôt que sur quatre. De sorte que la préparation du passage à l'an 2000 coûta finalement d'énormes moyens humains, matériels et financiers. Pourtant, les banques, assurances et autres institutions financières géraient depuis très longtemps des dossiers sur dix, vingt voire trente ans (prêts, par exemple), mais sans systématiquement prendre en compte dans les tests de date la notion de siècle.

En 2005, le Gartner Group estimait que 75 % des données du monde des affaires étaient traitées par des programmes en Cobol et que 15 % des nouveaux programmes développés le seraient dans ce langage[7]. Cependant, en juillet 2017, le Cobol est 25e dans l'Index TIOBE, qui mesure les langages de programmation selon leur popularité, avec une note de 1,135 %[8].

Structure d'un programme en Cobol

Un programme comporte quatre divisions. La norme Cobol-85 ne rend obligatoire que la première.

  •        IDENTIFICATION DIVISION.
    
    Contient des informations générales sur le programme (dont le nom).
  •        ENVIRONMENT DIVISION.
    
    Contient des informations sur l'environnement (matériel et logiciel) dans lequel le programme s'exécute.
  •        DATA DIVISION.
    
    Contient les descriptions de données (variables, fichiers, paramètres et parfois description d'écran).
  •        PROCEDURE DIVISION.
    
    Contient la description des traitements effectués.

Chaque division est composée de 'sections', formées de 'paragraphes' composés de 'phrases' qui peuvent être des phrases impératives ou des clauses. Chaque phrase doit être terminée par un point.

Les six premières colonnes de chaque ligne de programme sont considérées comme une zone de commentaire, servant autrefois à numéroter les cartes perforées (en cas de chute du paquet, il suffisait de les passer sur une trieuse pour reconstituer la version correcte du programme). La septième colonne contient un caractère de contrôle : espace pour les lignes actives, étoile pour les commentaires, tiret comme caractère de continuation.

La huitième colonne est le début des titres de paragraphes.

La douzième colonne est le début des instructions.

Les compilateurs Cobol modernes permettent l'emploi d'un format libre qui n'impose plus le colonnage.

Exemple de programme (Bonjour !)

Écrit dans le style typique des programmes sur cartes perforées (années 1960-70), avec lignes numérotées

000100 IDENTIFICATION DIVISION.
000200 PROGRAM-ID. SALUTTOUS.
000300 DATE-WRITTEN. 21/05/05 19:04.
000400 AUTHOR UNKNOWN.
000500 ENVIRONMENT DIVISION.
000600 CONFIGURATION SECTION.
000700 SOURCE-COMPUTER. RM-COBOL.
000800 OBJECT-COMPUTER. RM-COBOL.
000900
001000 DATA DIVISION.
001100 FILE SECTION.
001200
100000 PROCEDURE DIVISION.
100100
100200 DEBUT.
100300 DISPLAY " " LINE 1 POSITION 1 ERASE EOS.
100400 DISPLAY "BONJOUR !" LINE 15 POSITION 10.
100500 STOP RUN.

Note : ERASE EOS signifie « 'Erase End Of Screen' » La commande ligne 100300 a donc pour effet d'effacer l'écran.

Exemple en format libre

Autre version du même exemple en Cobol-85 format libre :

Identification division. 
Program-id. Hello.
Procedure division.
Display "Hello world!" line 15 position 10.
Stop run.

Return codes à l'exécution

Return code 203 : vérifier l'emplacement de l'ordre d'ouverture du fichier.

Limitation de Cobol

Des limites existent dans ce langage malgré sa grande flexibilité et ses nombreuses versions (61, 65, 68, 74, 85, etc.), Cobol n'ayant pas la puissance de langages tels qu'Algol ou PL/1. Cobol ne possède pas de gestion dynamique de la mémoire et ne gère pas la récursivité. Il exige un codage important, et un temps de compilation relativement long. Toutefois, son indépendance par rapport aux systèmes (machines et périphériques) l'a fait adopter par un grand nombre d'utilisateurs soucieux de minimiser les problèmes de migration d'une machine à l'autre[5].

Annexes

Articles connexes

  • Pacbase et TELON sont des AGL qui génèrent du Cobol.
  • CODASYL Conference On DAta SYstems Language

Liens externes

Références

  1. « http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?csnumber=51416 »
  2. (en) www.microfocus.com
  3. http://www.evoliris.be/fr/content/lh%C3%A9ritage-cobol-un-d%C3%A9fi-pour-la-formation-continue
  4. Basé sur : J.E. Sammet. « The Early History of Cobol. », dans ACM SIGPLAN Notices, Volume 13, Issue 8 (août 1978) Numéro spécial : History of programming languages conference, pp. 121-161, 1978. Également publié dans History of Programming Languages, rk: ACM Monograph Series, 1981.
  5. Encyclopædia Universalis, « COBOL », sur Encyclopædia Universalis (consulté le )
  6. « Les banques restent fidèles à Cobol, plus performant que Java » Le Monde Informatique
  7. (en) William M. Ulrich, « Remember Cobol? If You Don't, Get Reacquainted », Computerworld, vol. 35, no 21, , p. 30 (ISSN 0010-4841, lire en ligne, consulté le )
  8. Juillet 2017, TIOBE Index
  • Portail de la programmation informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.