Gestion électronique des documents

La gestion électronique des documents (GED ou en anglais DMS pour Document Management System ou EDM[1] pour Electronic Document Management) désigne un procédé informatisé visant à définir, concevoir, produire, organiser, diffuser et gérer des informations et des documents papier ou des documents électroniques au sein d'une organisation. Le terme GED désigne également les logiciels permettant la gestion de ces contenus documentaires.

Pour les articles homonymes, voir GED et EDM.

La GED met principalement en œuvre des systèmes d'acquisition (exemple d’utilisation : la numérisation de masse de documents en papier), d'indexation, de classement, de stockage d'information, d'accès (navigation et recherche) et de diffusion des documents. La GED participe ainsi aux processus de collaboration, de capitalisation et d'échange d'informations. Elle prend en compte le besoin de gestion des documents selon leur cycle de vie, de la création à l'archivage en passant par la revue, l'approbation électronique et la gestion des différentes versions[2].

Les solutions et projets de GED peuvent permettre des gains en qualité et en coût rapide pour les organisations, qu'il s'agisse d'entreprises privées ou d'administrations. À titre d'exemple, le retour sur investissement d'un projet « standard » de dématérialisation de factures est inférieur à un an.

Une GED dispose de fonctions de classement / navigation et également d'un moteur de recherche qui permettent de retrouver les contenus gérés, au moyen de vues, de recherches structurées ou plein texte (« full text »).

Il existe quatre étapes majeures dans la gestion électronique des documents : acquisition, traitement, stockage et diffusion. Pour diffuser des documents nouveaux, il convient d'ajouter une cinquième étape : la conception.

Acquisition des documents

L'acquisition peut s'effectuer par :

Les documents en papier peuvent ensuite être détruits (soit parce qu'ils n'ont pas d'intérêt, soit parce que la valeur probatoire des copies électroniques est certaine) ou archivés. Attention cependant, pour ce qui est des archives publiques, la copie électronique de document n'autorise pas obligatoirement sa destruction ;

  • l'intégration de documents électroniques existants : une autre famille de documents est constituée des documents électroniques comme les fichiers bureautiques, les fichiers PDF… Enfin, la dernière famille de documents intégrable est constituée des documents COLD qui proviennent de systèmes d'éditique ;
  • la production de documents électroniques : elle peut être le résultat d'une ou de plusieurs procédures gérées par différents agents de l'entreprise grâce à un logiciel de groupe (groupware ou collecticiel). Le document peut aussi être obtenu par un logiciel d'informatique décisionnelle à partir d'un modèle disponible via l'outil ;
  • l'échange de documents électroniques : il s'effectue lorsque deux organismes partenaires souhaitent partager des documents électroniques. Ils peuvent alors procéder à une interconnexion de leurs systèmes d'information par un dispositif d'échange de données informatisées (EDI) moyennant le respect d'un même format de données normalisé.

Quel que soit le moyen par lequel le document intègre le système de gestion, il peut souvent passer par une chaîne de validation ou workflow afin d'aboutir à une version finale approuvée par les utilisateurs concernés[3]. Le workflow lié à la validation d'un document est paramétrable et prend en compte les droits d'accès et les profils des utilisateurs du système ; il agit le plus souvent sur le statut, la version et la visibilité du document[2].

Traitement des documents

L'indexation constitue la description du document et de son contenu en vue de faciliter son exploitation. La récupération rapide des documents est conditionnée à la création du schéma d'index[4]. On distingue à ce titre :

  • L'indexation par type : elle offre une description formelle du document en utilisant ses métadonnées (type, auteur, titre, source, date, etc.)[5] dont le vocabulaire est standardisé afin de permettre l'utilisation de ces métadonnées par le plus grand nombre d'outils de recherche.
  • L'indexation par concepts ou mots-clés : elle vise plutôt le contenu du document pour faciliter les opérations de recherche. Il peut s'agir ici, pour le concepteur du système ou le créateur du document, de recenser les termes qui apparaissent le plus souvent[4] ; on parle alors d'indexation statistique. Il peut aussi s'agir d'un système plus évolué où le concepteur sélectionne les termes dans un thésaurus (liste de mots liés par des relations de hiérarchie ou d'équivalence) en rapport avec le document pour vous familiariser avec l'édition.

Stockage des documents

La problématique du stockage est incontournable. La non prise en compte de cet aspect peut entraîner des situations critiques. Les problématiques sont les suivantes:

  • Le support de stockage doit être adapté le mieux possible avec le volume des documents. Il doit aussi, en fonction de la fréquence de consultation et de l'importance des données, offrir un faible temps d'accès.
  • L'organisation du stockage peut être hiérarchisée en fonction du contenu des documents (texte, vidéo, image, etc.) de leurs provenances, états, types, etc.
  • La durée de conservation doit aussi être considérée afin de permettre une épuration périodique du système, en vue de faciliter le stockage et d'alimenter les archives. À cet effet, le système doit prendre en compte une sortie vers un archivage définitif dans une plateforme d'archivage électronique destinée à cet usage.
  • Le lieu de stockage doit être différent pour plus de sécurité de données en cas d'incendie.
  • Les sauvegardes doivent être mises en œuvre avec une périodicité en adéquation avec les impératifs de l'entreprise.

Diffusion des documents

La diffusion des documents peut se faire via l'internet ou l'intranet. Certains éditeurs de logiciels GED proposent une consultation client léger qui fournit tout ou une partie des fonctionnalités de consultation et d'indexation des documents dans un navigateur web. Selon une étude serdaLAB, l'amélioration de l'accès à l'information et le partage des informations sont les principales motivations dans les projets de gestion électronique de documents[6].

Valorisation des documents

Dans le périmètre de la gestion électronique des documents, l'analyse des contenus non structurés (en anglais Content analytics ou Content analysis) permet de passer de la gestion à la valorisation des documents. L'analyse de contenu consiste à extraire de cette masse d’information une forme compréhensible et intelligible d’information. L’analyse syntaxique, sémantique et morphologique des contenus[7] et la réconciliation sont alors possibles en prenant en compte l’identification des exceptions. Le résultat de ce travail ne serait pas audible sans la mise en œuvre de systèmes de représentation qui permettent une navigation progressive et multidimensionnelle dans la connaissance extraite. Les solutions d'analyse de contenus numériques proposent cette valorisation. La transformation des documents en indicateurs, d’indicateurs en tendances, de tendances en situations, de situations en décision, représente l’enjeu du marché du Content Analytics.

Enjeux

Amélioration de l'accès aux documents

La GED est avant tout la mise en œuvre d'une méthodologie de travail (collaboratif). Une petite, moyenne ou grande organisation qui n'envisagerait la GED que sous l'angle logiciel risquerait de connaître une perte financière énorme. C'est la mise en œuvre efficace de cette méthodologie qui est le garant du succès d'une solution de GED et non le produit « seul » qui ne sert que de « support » à cette méthode. Pour être correctement appliquée et efficace, toute solution de GED nécessite que l'on consacre un budget « prestation d'accompagnement et de mise en œuvre » en rapport avec l’investissement logiciel.

Bien qu'encore peu connue de la plus grande majorité des entreprises, notamment des PME et des TPE, la GED est un enjeu économique réel. Elle peut améliorer la rentabilité de l'ordre de 3 à 5 % (du chiffre d'affaires)[réf. nécessaire]. La ruée vers la GED découle du coût de la composante (traitement, production, stockage, recherche, etc.) dite « papier » dans une entreprise.

Limites

Il est important de noter que la diversité des « contenants » ou des sources de données non structurées ou semi-structurées font que les enjeux associés à la GED deviennent de plus en plus complexes. Les entreprises doivent en effet tenir compte du volume croissant de contenus ou de données issus d’applications web, de systèmes de messagerie électronique (instantanée ou non), de formulaires ou catalogues électroniques, de nouvelles formes d’applications collaboratives comme les wikis ou les blogs, ou encore d’applications « rich media » incluant des images vidéos et du son.

Dématérialisation et aspects environnementaux

La dématérialisation (passage du support de l'information du papier à un support électronique), est la pierre angulaire d'un projet de GED. Elle est souvent présentée comme un avantage d'un point de vue environnemental, car elle serait supposée diminuer la consommation de papier. En réalité, les choses ne sont pas si simples, car si l'on fait un bilan des ressources naturelles consommées (bois dans le cas du papier, métaux dans le cas des équipements électroniques) et des déchets produits (vieux papiers d'un côté, déchets électroniques de l'autre), et des déchets papier qui continuent d'être produits, il n'est pas évident que le bilan global soit favorable en coûts matière.[réf. souhaitée]

Marché

Le marché français de la GED et de la gestion de contenu s'élevait à 1,1 milliard d’euros en 2008, en progression de 8 % par rapport à 2007[8]. Les intégrateurs et SSII représentaient en 2009 la part la plus importante du marché, à 83 %, les éditeurs de logiciels 16 % du marché et les sociétés de conseil ne représentaient que 1%[8].

Le marché reste en pleine expansion. Selon les prévisions réalisées par Global Market Insights, il devrait croître à plus de 15 % pour atteindre plus de 5 milliards d’euros en 2024[9].

Histoire

Les prémices de la GED peuvent être perçus dès les années 1940 et années 1950.

Vannevar Bush imagine en 1945 les bases d'une machine, appelée le Memex, permettant d'archiver, de lier, d'annoter des documents multimédia[10], préfigurant la GED et les liens hypertexte. Suzanne Briet pose en 1951 les premiers fondements de l'indexation par la production de métadonnées documentaires : elle décompose livre en unités plus élémentaires, et introduit la notion de « documents seconds » et de contenu « inter-documentaire ». De plus, elle considère qu'un document est un « objet qui informe quelle que soit sa forme matérielle »[11].

Le terme de GED apparaît dans les années 1980 pour désigner l'informatisation de la recherche de documents imprimés au sein de collections[12]. Michael Buckland montre notamment l'impact de l'ordinateur sur la gestion des bibliothèques et la recherche d'information[13].

Les premières bases des outils de gestion électronique de documents apparaissent à la fin des années 1980 et dans les années 1990[14].

En 1995, le premier logiciel à avoir été développé pour la GED fut dénommé Taurus[15]. Ce logiciel documentaire, créé pour les besoins de la documentation technique, présente aussi la particularité d’avoir été le premier logiciel directement développé sous Windows ; auparavant les logiciels étaient développés sous MS-DOS. Il fut inventé par Jacques Guérin. Un des plus grands projets mis en place grâce au logiciel Taurus consistait en la numérisation, le classement, le stockage et l'archivage des 740 000 documents composant les registres d’état civil de la mairie de Bordeaux. L'étape de dématérialisation des registres dura 6 mois et coûta plus de 3,5 millions de francs[16]. Elle permit de sauvegarder les documents originaux et d'améliorer la recherche des informations contenues dans ces registres.

Tendances

La mobilité est un axe de développement et de différenciation pour les éditeurs de gestion de contenu. Les premières solutions de gestion de contenu sur mobile sont apparues en 2009[17].

Les solutions de gestion de contenu intègrent de plus en plus de fonctionnalités collaboratives, comme la possibilité de créer des communautés et d'échanger des informations et documents. Le développement de conseil d'administration sans papier en figure un intéressant exemple en entreprise.

Représentant encore une part minime du marché, les solutions open source de gestion de contenu gagnent du terrain. Les éditeurs open source enregistrent des taux de croissance cinq fois plus élevés que les éditeurs propriétaires.[réf. souhaitée]

On observe également de nouvelles tendances notamment dans le domaine des SaaS (Logiciels en tant que Services) avec l'apparition de solutions plus spécifiques telles que les logiciels de collecte de documents[18].

Organisation de la profession en France

Il existe une association des professionnels autour des métiers de la gestion de contenu : e-Futura[19] (l'APROGED a été mise en liquidation judiciaire).

D'autres associations et fédérations œuvrent pour le métier : Xplor France[20], la FNTC, FedISA.

Notes et références

  1. « Définition du Journal du net », sur le JDN (consulté le ).
  2. SerdaLab 2009, p. 55
  3. (en) Deborah Morley et Charles S. Parker, Understanding Computers : Today and Tomorrow, Comprehensive, Cengage Learning, (ISBN 978-1-285-76727-7, lire en ligne), p. 558–559
  4. (en) William B. Green, Introduction to Electronic Document Management Systems, Academic Press, , 250 p. (ISBN 978-0-323-14062-1, lire en ligne), p. 120
  5. (en) Matthew Parsons, Effective Knowledge Management for Law Firms, Oxford University Press, , 250 p. (ISBN 978-0-19-516968-3, lire en ligne[archive du 2018-08-24consulté le=24 août 2018]), p. 234
  6. SerdaLab 2009, p. 170
  7. Anne Abeillé, Traitement des langues naturelles, CNET,
  8. Nathalie Silvinon, « Ged et gestion de contenu : marché, besoins et tendances en 2010-2011 » [archive du ], sur DOCaufutur, (consulté le )
  9. « Les tendances du marché de la GED pour 2024 » [archive du ], sur SerdaLAB, (consulté le )
  10. (en) Vannevar Bush, « As we may think » [archive du ], sur https://www.theatlantic.com/world/, (consulté le )
  11. Suzanne Briet, « Qu'est ce que la documentation ? » [archive du ], Editions Documentaires Industrielles et Techniques - EDIT, (consulté le )
  12. Stéphane Crozat, Gestion de contenu : GED, ECM et au delà..., (lire en ligne[archive du ] [PDF])
  13. (en) Michael Keeble Buckland, « Library services in theory and context » [archive du ] [PDF], Berkeley digital library sunsite, (ISBN 0-08-035754-7, consulté le )
  14. SerdaLab 2009, p. 52-56
  15. Informatique documentaire defidoc.com - octobre 2003.
  16. « Taurus - Premier logiciel de gestion électronique de documents », sur www.gestion-documents.fr (consulté le )
  17. SerdaLab 2009, p. 181-184
  18. (en) « Document Collection Management: Definition, Processes, Strategies and Resources », Blog • Clust, (lire en ligne, consulté le )
  19. « Objet de l'association eFutura » [archive du ], sur https://www.efutura.fr/
  20. « Le rendez-vous du document » [archive du ]

Voir aussi

Articles connexes

Liens externes

Bibliographie

  • SerdaLab, Ged et Gestion de contenu : Marché et tendances en 2009-2010, Serda, , 214 p.
  • Sciences de l’information et bibliothèques
  • Portail du logiciel
  • Portail du management
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.