Dans notre blog, nous avons déjà discuté des spécificités des
normes DjVu ,
FB2 et FB3 . Aujourd'hui, nous parlons du format PDF, qui est devenu l'incarnation du rêve d'un «bureau sans papier».
/ Flickr / Kim Siever / PDUn bref historique du format
Le créateur de PDF, ou Portable Document Format, a été créé par John Warnock, l'un des fondateurs d'Adobe, qui souhaitait faciliter le processus d'impression de texte et d'images à partir d'un ordinateur. En 1984, Warnock a
introduit le langage de description de page
PostScript .
Wikipedia fournit un exemple de code PostScript qui dessine quelques
mots Wikipedia dans un cercle .
%!PS-Adobe-1.0 % , 1 =1/72 , % . 72 25.4 div % 1 = 72/25.4 dup % scale % 100 100 translate % (100 , 100 ) /Times-Roman findfont % Times-Roman 10 scalefont % 10 ( - !) setfont % 0 30 330 { % 0 330 30 gsave % rotate % ( ) 15 0 moveto % (15 , 0 ) (Wikipedia) show % grestore % } for % for showpage %
Initialement, PostScript a été développé comme un outil pour imprimer des documents sur une imprimante, mais plus tard, Warnock a décidé qu'avec l'aide d'un nouveau langage, il était possible non seulement d'imprimer des documents, mais aussi de «numériser» complètement le système de workflow.
Dans le cadre de cette vision, Adobe (fondé par Warnock) a créé le format IPS (pour Interchange PostScript). Pour travailler avec lui, Adobe Illustrator a été créé - un éditeur graphique multiplateforme pour Windows et Mac.
IPS a été présenté pour la première fois à la conférence Seybold à San Jose en 1991, mais avec ce nom, le format a duré deux ans - en 1993, il a été renommé PDF. Viennent ensuite Acrobat Distiller et Acrobat Reader (renommé plus tard Adobe Reader).
Au début, le PDF n'était pas populaire. La faute était le prix élevé du logiciel: Acrobat Distiller pour un usage personnel a
coûté 700
$ et pour un usage professionnel - 2 500 $. Pour Acrobat Reader, ils ont demandé 50 dollars supplémentaires. Au fil du temps, Adobe a baissé les prix et la popularité du PDF a commencé à prendre de l'ampleur.
Au début de zéro, Acrobat Reader 4.0 a été
téléchargé par cent millions de personnes, et de grandes sociétés informatiques telles que Microsoft et Apple ont commencé à utiliser le format PDF.
Comment fonctionne le PDF?
L'approche de base pour présenter des graphiques et du texte au format PDF est très similaire à celle
utilisée par PostScript. Les soi-disant éléments de texte sont chargés d'afficher du texte sur une page. Ils indiquent où les personnages doivent être dessinés. Wikipedia fournit le
code pour écrire Hello World:
/Courier % 20 selectfont % 72 500 moveto % 72, 500 (Hello world!) show % showpage %
Pour tracer des graphiques vectoriels au format PDF, des chemins sont utilisés: des lignes droites ou
des courbes de Bézier cubiques . Les formes construites à l'aide de contours peuvent être remplies de couleur ou ombrées. Quant aux images tramées, elles sont représentées sous forme de
dictionnaires et de
flux . Les dictionnaires décrivent les propriétés et le flux contient des informations binaires sur l'image.
La taille du fichier PDF dépend de la résolution des images, des paramètres de police, de l'utilisation d'hyperliens, de vidéos, etc. Jusqu'aux années 2000, la taille des fichiers PDF était mesurée en mégaoctets, car la plupart des documents étaient composés d'images JPEG. Pour résoudre ce problème, Adobe a proposé la technologie de compression MRC (
Mixed Raster Content ).
MRC «
divise » le fichier numérisé en couches: une couche d'arrière-plan, une couche de texte et un masque de couleur. Pour la compression des informations disponibles sur chaque couche, son propre codec est responsable. Par exemple,
JBIG2 peut être utilisé pour du texte, qui forme des groupes de lettres similaires et en fait un dictionnaire. Ainsi, les mêmes caractères sont codés une fois, et à d'autres endroits, seules des références à eux sont utilisées.
Les codecs JPEG, JPEG2000 ou ZIP sont utilisés pour compresser d'autres contenus. À l'aide d'eux, l'arrière-plan de l'image, la répartition des couleurs du texte, des images et des photos sont enregistrés. En raison de cette approche, la taille de chaque page est réduite de moitié ou plus. Des exemples illustratifs de compression PDF sont fournis par Abbyy dans leur
blog sur Habré .
Avantages PDF
L'un des principaux avantages des fichiers PDF est le fait que toutes les pages ressemblent exactement à ce que l'auteur du document a voulu. Le format
conserve l' arrière-plan, les polices et les images d'origine dans leur forme d'origine, quel que soit l'appareil ou le système d'exploitation. Dans le même temps, PDF vous permet de travailler avec des éléments interactifs: des
hyperliens pour naviguer dans les notes de bas de page. De plus
, des fichiers multimédias
sont ajoutés au document: musique, GIF et même des vidéos.
Dans le même temps, le fichier PDF peut être rendu en lecture seule, ce qui permet de protéger le contenu du document contre la copie et les modifications. Pour une protection supplémentaire, il est possible de mettre un mot de passe ou une signature électronique.
Un autre avantage du format est son accessibilité. Le programme de lecture d'un document PDF Adobe Acrobat Reader se
trouve aujourd'hui sur le réseau en libre accès. Vous pouvez ouvrir un PDF sur des livres électroniques. La plupart d'entre eux sont «capables» de travailler avec ce format par défaut. Il est
pris en charge par de nombreuses applications de lecture, par exemple,
FBreader ou NEO Reader.
Format Contre
L'immuabilité du format PDF, bien que ce soit son avantage, s'avère également être un gros inconvénient. Ces fichiers (en particulier les grands diagrammes et graphiques, les notes, les documents de grand format) sont difficiles à lire sur les appareils avec de petits écrans - smartphones ou lecteurs électroniques compacts. La page
ne tient tout simplement
pas sur l'écran de l'appareil ou le texte s'affiche trop petit.
Il existe des lecteurs électroniques sur le marché avec une résolution d'affichage de 13,3 ou 10,3 pouces, ce qui vous permet de travailler confortablement avec des feuilles A4 au format PDF. Des exemples de tels gadgets peuvent être
ONYX BOOX MAX 2 (un examen que nous avons préparé
dans notre blog ),
ONYX BOOX Note ou
ONYX BOOX Gulliver (il a également
un examen ). Ils offrent la possibilité de considérer tous les détails des dessins et des illustrations dans la taille originale et conviennent à ceux qui doivent souvent lire la littérature technique. Cependant, le coût de ces gadgets est assez élevé.
Il y a un autre problème avec l'affichage des pages de documents. Il est associé au format JBIG2. Bien que le codec vous permette de compresser le texte plusieurs fois, il est soumis à l'influence du problème "yin" (nous l'avons écrit dans le matériel
sur DjVu ). Lors de la compression du texte et de la compilation du dictionnaire, certains caractères sont remplacés par des caractères similaires (par exemple, «et» se transforme en «n»), ce qui entraîne une distorsion de l'essence du texte.
Il y a aussi des problèmes avec l'édition de fichiers PDF, car vous devez installer des programmes spéciaux qui sont souvent payés (par exemple,
Acrobat DC ). Il existe également des services d'édition gratuits sur le
net comme
PDF2GO , mais ils vous permettent uniquement d'ajouter du texte ou des images "au-dessus" du fichier d'origine.
Développement ultérieur
Malgré ses défauts, le PDF reste aujourd'hui un format populaire. La société de marketing HubSpot a
demandé à trois mille visiteurs de son site ce qu'ils font des livres électroniques: lire en ligne ou télécharger en PDF. Il s'est avéré que 90% des répondants préfèrent télécharger un fichier PDF.
Les développeurs ajoutent constamment de nouvelles fonctionnalités, notamment pour lire sur des gadgets portables. Par exemple, au début de 2018, l'équipe Adobe a
fourni à l'application Acrobat DC des fonctionnalités améliorées d'affichage et d'édition sur les appareils mobiles.
En outre, en août, il y avait des informations sur un nouveau projet -
PDF audible . Il combinera les capacités du PDF et les fonctionnalités des assistants vocaux: Alexa, Google Home et Siri. Jusqu'à présent, seul un prototype est prêt, mais les développeurs promettent de publier une version fonctionnelle dans un avenir proche.
Adobe suit de nouvelles directions et a l'intention de rendre le format plus interactif, par exemple, d'ajouter des fonctionnalités de réalité augmentée. Son aspect n'est pas encore clair, mais les développeurs
promettent que l'écosystème PDF atteindra un nouveau niveau d'interaction avec les utilisateurs dans les années à venir.
Lecture supplémentaire - avis des lecteurs ONYX BOOX: