Portable Document Format
Le Portable Document Format, communément abrégé en PDF, est un langage de description de page présenté par la société Adobe Systems en 1992 et qui est devenu une norme ISO en 2008.
« PDF » redirige ici. Pour les autres significations, voir PDF (homonymie).
La spécificité du PDF est de préserver la mise en page d’un document — polices de caractère, images, objets graphiques, etc. — telle qu'elle a été définie par son auteur, et cela quels que soient le logiciel, le système d'exploitation et l'ordinateur utilisés pour l’imprimer ou le visualiser.
Description
Généralités
Le Portable Document Format qui se traduit de l'anglais en « format de document portable », généralement abrégé en PDF, est un format de fichier informatique créé par Adobe Systems.
L'avantage du format PDF est qu'il préserve les polices de caractères, les images, les objets graphiques et la mise en forme de tout document source, quelles que soient l'application et la plate-forme utilisées pour le lire.
Le format PDF peut aussi être interactif. Il est possible (grâce à des logiciels tels Adobe Acrobat Pro, LibreOffice ou Scribus) d'incorporer des champs de textes, des notes, des corrections, des menus déroulants, des choix, des calculs, etc. On parle alors de formulaire PDF.
C'est pourquoi ce format est utilisé dans un ensemble large et varié de logiciels, de l'exportation dans les suites bureautiques grand public, aux manipulations par des programmes spécialisés de l'industrie artistique, en passant par la génération de factures électroniques ou documents officiels via Internet.
Plus techniquement, les fichiers PDF peuvent être créés avec des options personnalisées, tant aux niveaux de la compression des images et des textes, de la qualité d'impression du fichier, que du verrouillage (interdiction d'impression, de modification…).
Le PDF s'est imposé comme format d'échange (consultation d'écran, impression, etc.) et d'archivage de documents électroniques, il est devenu un « standard international »[1].
Historique
Le format PDF est né de l'imagination de l'un des fondateurs d'Adobe, John Warnock. C'est à l'origine un projet destiné à répondre aux besoins de fonctionnement interne de sa société. Adobe étant déjà propriétaire et utilisateur du format PostScript, c'est naturellement ce format qui a servi de base au projet.
Avant sa première présentation officielle, le nom utilisé pour définir le projet était IPS, pour Interchange PostScript, et le logiciel destiné à l'exploitation de ce format portait le nom de code Carousel. C'est pour cette raison que le type de fichier Macintosh attribué au format PDF est CARO.
Annoncé lors de la conférence du Seybold à San-Jose (Californie) en 1991, le PDF 1.0 a été présenté au Comdex en 1992, où il a remporté le Best of Comdex Award. Depuis, le format a évolué à plusieurs reprises jusqu'à sa normalisation ISO en 2008.
Cette première version gérait déjà les liens, les signets et l'incorporation des polices de caractère mais ne reconnaissait que l'espace colorimétrique RVB. Ce qui la rendait inutilisable par les professionnels du prépresse.
Le prix de la première version d'Acrobat Exchange était élevé et la version Reader coûtait 50 US$. À cause de cette politique tarifaire, Acrobat et le PDF ont d'abord connu une diffusion confidentielle. Qui plus est, il y avait des formats concurrents, comme Envoy (WordPerfect), Common Ground Digital Paper et même le format PostScript (.ps) d'Adobe.
Ensuite, Adobe a révisé le tarif d'Acrobat Exchange (devenu depuis Acrobat Pro) à la baisse et diffusé Acrobat Reader gratuitement.
Fonctions notables (innovantes à l'époque) :
- Display PostScript
- Portabilité
- Compression (ZIP pour les textes et les éléments vectoriels, ZIP ou JPEG pour les images matricielles)
- Indépendance par rapport aux polices de caractère (incorporées)
- Modifications incrémentielles
- Extensibilité du code interne
Le format de fichier PDF a changé plusieurs fois, et continue d'évoluer, parallèlement à la sortie de nouvelles versions d'Adobe Acrobat. Il y a eu neuf versions de PDF et la version correspondante du logiciel :
- 1993, PDF 1.0 / Acrobat 1
- 1994, PDF 1.1 / Acrobat 2
- 1996, PDF 1.2 / Acrobat 3
- 1999, PDF 1.3 / Acrobat 4
- 2001, PDF 1.4 / Acrobat 5
- 2003, PDF 1.5 / Acrobat 6
- 2005, PDF 1.6 / Acrobat 7
- 2006, PDF 1.7 / Acrobat 8
- 2008, PDF 1.7, Adobe Extension Level 3, Acrobat 9
- 2009, PDF 1.7, Adobe Extension Level 5, Acrobat 9.1
Le format ouvert « ISO 32000-1:2008 PDF » a été publié par l'Organisation internationale de normalisation (ISO) le . PDF est à présent une norme ISO, intitulée « Gestion de documents - - Format de document portable - - Partie 1: PDF 1.7 »[2].
Le , le projet de norme ISO 32000-2 a atteint le stade d'approbation en étant publié par l'ISO en tant que texte final (FDIS en anglais), intitulé « Gestion de documents - - Format de document portable - - Partie 2 : PDF 2.0 »[3].
Atouts et limites
Reconstitution à l’identique
Le format PDF préserve la mise en forme du document source parce qu’il intègre dans un seul et même fichier les polices, les images, et autres éléments utilisés pour la création du document.
Portabilité
Le PDF est consultable sur de nombreux appareils communicants (ordinateurs, tablettes, smartphones…).
Le lecteur diffusé gratuitement par Adobe, nommé Adobe Reader est disponible sur de très nombreuses plates-formes et systèmes d’exploitation : Android, iOS, Windows, Mac OS, Linux, Palm OS, Pocket PC, Symbian OS, Sun Solaris Sparc, IBM AIX, HP-UX, OS/2 / Warp…
De nombreux autres lecteurs, dont certains sont des logiciels libres, existent également (Xpdf, gv, Foxit…).
Interactivité
Le format PDF peut aussi être interactif : il est en effet possible, grâce à des logiciels tels Adobe Acrobat Pro, Scribus ou OpenOffice.org, d’incorporer des champs de textes, des notes, des corrections, des menus déroulants, des choix, des calculs, etc. On parle alors de formulaire PDF, ou de PDF multimédia.
Standard ouvert
Le format PDF a toujours été un standard ouvert et, en 2008, il est devenu une norme sous l’appellation ISO 32000. Gérée par l’ISO (Organisation internationale de normalisation), la norme ISO 32000 est développée dans le but de protéger l’intégrité et la longévité du format PDF, qui constitue un standard ouvert pour plus d’un milliard de fichiers PDF actuellement en circulation.
Évolutivité
Plus de 2000 fournisseurs à travers le monde proposent des solutions basées sur le format PDF : outils de création, modules externes et outils de conseil, de formation et de support.
Fiabilité
La technologie PDF est de plus en plus utilisée pour la collecte d’informations, comme en attestent les millions de documents PDF actuellement publiés sur le web et un nombre incalculable de fichiers PDF circulant dans les entreprises et administrations du monde entier.
Intégrité des fichiers garantie
Les fichiers PDF sont fidèles aux documents originaux et conservent les informations du fichier source — texte, dessins, contenu multimédia, vidéo, éléments 3D, cartes, images couleur, photos et même fonctions de traitement — quelle que soit l’application utilisée pour le créer et même lorsque plusieurs formats sont regroupés au sein d’un Porte-document PDF. Les fichiers PDF sont donc orientés présentation, contrairement aux fichiers HTML et XML qui dissocient fondamentalement le contenu de sa présentation[4].
Sécurité
On peut apposer une signature numérique ou protéger par mot de passe des documents PDF avec de nombreux logiciels.
Indexation
Les fonctions de recherche de texte - à la condition qu'on ait utilisé un programme de reconnaissance optique de caractères - dans les documents et métadonnées facilitent l’indexation des documents PDF.
Accessibilité
Compatibles avec les technologies d’assistance, les documents PDF facilitent l’accès aux informations électroniques pour les personnes souffrant de handicaps.
3D
Il est possible depuis un logiciel de dessin CAO 3D d'insérer des fenêtres 3D dans les fichiers PDF. Différents outils existent pour ajouter de la 3D : Adobe Acrobat Pro supporte par défaut les formats U3D et PRC.
Des sociétés comme Tetra4D proposent des outils d'import/export gérant de nombreux formats. La nouvelle tendance en 2016 consiste à créer des PDF riches et interactifs permettant d'exploiter de manière aussi complète que possible les informations contenues dans les fichiers 3D. Les PDF 3D sont surtout utilisés pour effectuer de la revue de projets et échanger des informations avec les différents intervenants. La lecture de ces fichiers 3D est possible nativement avec Acrobat Reader.
Gestion des droits d'auteurs
Avec l'acquisition en de Glassbook Reader[5], une interface de mise en forme du livre basée sur le format PDF[6], Adobe peut offrir aux éditeurs un système de gestion des droits numériques (DRM), qui permet de limiter la lecture ou la modification du document. À l'image de l'industrie de la musique ou du cinéma, l'industrie du livre s'intéresse à une technologie qui lui permet de diffuser des œuvres soumises au droit d'auteur en ayant la garantie que le fichier ne se diffuserait pas en dehors des ordinateurs « autorisés ».
Le premier livre massivement diffusé sur le Glassbook Reader est Riding the Bullet de Stephen King, en [7].
Il existe également différents outils de DRM permettant la distribution de fichiers PDF tout en conservant une parfaite maîtrise des droits des utilisateurs des documents (copier/coller, modification, impression, etc.) :
- CodeAndSoft distribue la solution DRM Ownerguard[8] ;
- Locklizard[9] ;
- FileOpen : permet de contrôler l'accès aux documents PDF.
Fin 2018, on ne parle clairement plus de PDF pour lire des livres. La mode est au eBooks dont le format le plus répandu est le ePub. Ces formats sont très adaptés aux liseuses électroniques.
Format
Versions
La création du format PDF date de 1992. Depuis, le format a évolué à plusieurs reprises jusqu'à sa normalisation. La dernière version en date porte le numéro 1.7.
Normalisation
Le format PDF dans sa version 1.7 est normalisé par l’Organisation internationale de normalisation (ISO) sous la référence ISO 32000-1:2008. La norme a été publiée le . La société Adobe Systems n'est donc plus maitre de l'évolution du format qu'elle a créé, dont les spécifications ont cependant toujours été publiques et gratuites. La publication de cette norme est maintenant à la charge de l'Organisation internationale de normalisation, qui la délivre contre 198 CHF.
Pour maintenir l'universalité du format, la société Adobe a cependant obtenu de l'ISO de pouvoir diffuser gratuitement sa propre version de cette publication : à condition qu'elle ne soit pas identique à l'original pour que son apparence ne puisse pas prêter à confusion quant à sa provenance. C'est donc une version différente dans la forme mais strictement identique sur le fond que la société Adobe délivre gratuitement au format PDF[10].
Prévue à l'origine pour début 2012 la version ISO 32000-2, alias PDF 2.0, a finalement été publiée en [11].
Des sous-ensembles du format PDF ont également été normalisés par l’ISO, il s'agit des formats PDF/A-1 (PDF for Archive, référencé par la norme ISO 19005-1), PDF/X (PDF for eXchange), PDF/VT (PDF for Volume Transactional Output), PDF/E (PDF for Engineering)[12], PDF/UA (PDF for Universal Access) et d'autres sous-ensembles sont actuellement en proposition pour devenir des normes ISO.
Format ouvert
PDF est un format ouvert, c’est-à-dire que ses spécifications sont connues et que son créateur Adobe Systems autorise des programmes tiers à réutiliser son format.
Bien qu'Adobe détienne un certain nombre de brevets portant sur le format PDF, il accorde une licence gratuite à tous les développeurs pour mettre en œuvre les fonctions de lecture et de création de PDF dans des logiciels tiers[13].
Logiciels manipulant les PDF
Les listes suivantes sont non exhaustives.
Affichage
Quelques exemples de logiciels permettant d'afficher un fichier PDF.
Logiciel | Créateur(s) / Développeur(s) | Système(s) d'exploitation | Licence |
---|---|---|---|
Adobe Acrobat | Adobe | Windows, macOS, Android, iOS, BlackBerry Tablet OS, Windows Phone | Propriétaire |
Aperçu | Apple | macOS | Propriétaire |
Evince | L'équipe Evince | GNU/Linux, macOS, BSD, Unix, Windows | GPL (logiciel libre) |
Foxit Reader | Foxit Corporation | GNU/Linux, macOS, Windows | Propriétaire |
Sumatra PDF | Krzysztof Kowalczyk | Windows | GPL (logiciel libre) |
GSView | L. Peter Deutsch / Artifex Software | Multiplateforme | GPL, Aladdin Free Public License (logiciel libre) |
Microsoft Edge | Microsoft Corporation | Windows, Android, iOS, macOS | Propriétaire |
MuPDF | Tor Andersson / Artifex Software | GNU/Linux, Unix, BSD, Windows, Android, iOS | AGPL (logiciel libre) |
Okular | L'équipe Okular | GNU/Linux, BSD, Unix, Windows, macOS | GPL (logiciel libre) |
OnlyOffice | Ascensio System SIA | GNU/Linux, macOS, Windows | SaaS, GNU Affero General Public License3, Apache (logiciel libre) |
Google Chrome | Google Inc. | Android, GNU/Linux, macOS, Windows | Propriétaire |
Mozilla Firefox | Mozilla | Android, GNU/Linux, macOS, Windows | GPLv3 (logiciel libre) |
PDF-XChange Viewer | Tracker Software Products | Windows | Propriétaire |
STDU Viewer | STDUtility | Windows | Propriétaire (gratuit) |
Skim | macOS | BSD (logiciel libre) | |
Soda | LULU Software | Windows et macOS | Propriétaire |
WPS Office | Kingsoft Corp | Windows, GNU/Linux et macOS | Propriétaire |
xournal | Denis Auroux, Andreas Butti et al. | GNU/Linux, Unix, Windows | GPL (logiciel libre) |
Xpdf | Foo Labs | GNU/Linux, Unix | GPL2 (logiciel libre) |
DigiSigner | Microsoft Windows, macOS, GNU/Linux | Propriétaire | |
XnView | Pierre-Emmanuel Gougelet | Windows, macOS, GNU/Linux x86, GNU/Linux ppc, OpenBSD x86, NetBSD x86, FreeBSD x86, Solaris sparc, Solaris x86, Irix mips, HP-UX et AIX | Gratuiciel (utilisation privée, dans l'éducation ou les organisations à but non lucratif). |
Zathura (en) | pwmt | macOS, GNU/Linux x86, GNU/Linux ppc, OpenBSD x86 | Licence zlib (logiciel libre) |
Création
Ces logiciels créent des fichiers dans différents formats et peuvent exporter dans le format PDF. Liste non exhaustive.
- Adobe Acrobat
- WPS Office
- Apache OpenOffice
- FineReader
- Ghostscript
- LibreOffice
- Certaines versions de Microsoft Office
- iWork
- Scribus
- ClibPDF
- 3D Turbo
- Adobe InDesign
- MuseScore
- Google Docs
Conversion vers le PDF
Ces logiciels permettent de générer des fichiers PDF depuis certains types de formats :
- Gestionnaires d'impressions
- les gestionnaires d'impression, notamment sur Mac OS/X et Linux, permettent d'« imprimer dans un fichier », au format PostScript ou PDF
- Le gestionnaire d'impression PDFCreator permet d'imprimer dans un fichier au format PDF sous Windows.
- Autres
- certains navigateurs web possèdent souvent une fonction d'export dans un fichier en PDF (on peut retrouver les mêmes fonctions avec l'outil en ligne de commande html2pdf)
- pdflatex, luatex, laTeX permettent de convertir depuis LaTeX vers du PDF
- Joplin exporte des documents HTML ou Markdown, notamment en PDF
- Sphinx et docutils peuvent générer des fichiers PDF à partir de sources écrites en reStructuredText
- OCamlDoc permet de générer une version PDF d'une documentation d'un projet OCaml
- SodaPDF Online permet de convertir certains types de documents (par ex : Word, Excel, html, gif...) vers le format PDF
- Les suites bureautiques dérivées d'OpenOffice.org permettent d'exporter les documents compatibles avec celles-ci vers différents formats PDF (hybride, PDF/A, FDF, etc.)
- Les suites bureautiques Microsoft Office et WPS Office permettent d'exporter ou de convertir les types de documents Word, Excel, PowerPoint vers le format PDF
Édition
- Adobe Acrobat
- Adobe Illustrator
- LibreOffice
- Apache OpenOffice
- Inkscape
- Microsoft Word
- WPS Office (en)
- PDFedit (en)
- Pdftk (en)
Conversion
- Apache OpenOffice
- WPS Office (en)
- GIMP
- LibreOffice
- pdf-parser (en)
- pdf2ps en ligne de commande
- pdf2djvu en ligne de commande
- pdf2djvu GUI avec une interface graphique
Notes et références
- L'Ordinateur individuel no 203, mars 2008.
- « Le PDF 1.7 devient la norme ISO/DIS 32000 », Vincent Hermann, www.pcinpact.com - 5 décembre 2007, consulté le 28 février 2015.
- « ISO/DIS 32000-2.4 - Gestion de documents -- Format de document portable -- Partie 2: PDF 2.0 », sur www.iso.org (consulté le )
- Jacquesson, Alain., Bibliothèques et documents numériques : concepts, composantes, techniques et enjeux, Editions du Cercle de la librairie, (ISBN 9782765409151, OCLC 65194606, lire en ligne), p. 119
- (en) « Adobe Announces E-Book Acquisition, Partnerships, New Product », Information Today, vol. 17, no 9, octobre 2000.
- Christian Vandendorpe, « Livre virtuel ou codex numérique ? Les nouveaux prétendants »,Bulletin des bibliothèques de France, novembre 2000, no 6.
- (en) « PDF eBooks are Here to Stay »
- http://www.codeandsoft.com/
- Solution de protection pour PDF, Fichiers et Ebook.
- (en) Adobe System Incorporated, « Document management — Portable document format — Part 1: PDF 1.7 »,
- (en) « ISO 32000-2:2017 - Document management -- Portable document format -- Part 2: PDF 2.0 », sur www.iso.org (consulté le )
- « Norme ISO 24517-1:2008 intitulée Gestion de documents — Format de documents d’ingénierie utilisant le PDF – Partie 1 : Utilisation du PDF 1.6 (PDF/E-1) »
- (en) « Legal notices for developers. », partners.adobe.com - consulté le 28 février 2015.
Voir aussi
Articles connexes
- Formats similaires
Liens externes
- « ISO/DIS 32000-2.4 - Gestion de documents -- Format de document portable -- Partie 2: PDF 2.0 », sur www.iso.org (consulté le )
- L'histoire du PDF, l'invention « la plus stupide » devenue incontournable
- Spécifications fournies par Adobe pour les développeurs tiers :
- Liste exhaustive d'outils de création, d'édition et de conversion de documents PDF
- Portail de l’informatique
- Portail de l’édition numérique