Livres électroniques et leurs formats: parler d'EPUB - son histoire, ses avantages et ses inconvénients

Plus tôt dans le blog, nous avons écrit sur l'apparence des formats de livres électroniques DjVu et FB2 .

Le sujet de l'article d'aujourd'hui est EPUB.


Image: Nathan Oakley / CC BY

Historique du format


Dans les années 90, les solutions propriétaires dominaient le marché du livre électronique. Et de nombreux fabricants de lecteurs ont leur propre format. Par exemple, NuvoMedia a utilisé des fichiers avec l'extension .rb. Il s'agissait de conteneurs avec un fichier HTML et un fichier .info contenant des métadonnées. Cette situation compliquait le travail des éditeurs - ils devaient composer des livres pour chaque format séparément. Un groupe d'ingénieurs de Microsoft, déjà mentionné par NuvoMedia et SoftBook Press, s'est emparé de la situation.

À cette époque, Microsoft allait conquérir le marché du livre électronique et développait une application de lecture pour Windows 95. On peut dire que la création d'un nouveau format faisait partie de la stratégie commerciale du géant informatique.

Si nous parlons de NuvoMedia, cette société est considérée comme le fabricant du premier lecteur électronique de masse Rocket eBook . La mémoire interne de l'appareil n'était que de huit mégaoctets et la durée de vie de la batterie ne dépassait pas 40 heures. Quant à la SoftBook Press, ils ont également développé des lecteurs électroniques. Mais leurs appareils avaient une caractéristique distinctive - un modem intégré - qui vous permettait de télécharger de la littérature numérique directement depuis la boutique SoftBookstore.

Au début des années 2000, les deux sociétés - NuvoMedia et SoftBook - ont été achetées par la société de médias Gemstar et fusionnées dans le Gemstar eBook Group. Cette organisation vend des lecteurs depuis plusieurs années (par exemple, RCA REB 1100 ) et des livres numériques, mais en 2003, elle a cessé ses activités .

Mais revenons au développement d'une norme unique. En 1999, Microsoft, NuvoMedia et SoftBook Press ont fondé l'Open eBook Forum, qui comprenait l'élaboration d'un projet de document marquant le début d'EPUB. Initialement, la norme s'appelait OEBPS (signifie Open EBook Publication Structure). Il a permis de distribuer une publication numérique dans un seul fichier (archive ZIP) et a simplifié le transfert de livres entre différentes plateformes matérielles.

Plus tard, Adobe, IBM, HP, Nokia, Xerox et les éditeurs McGraw Hill et Time Warner ont rejoint l'Open eBook Forum. Ensemble, ils ont continué à développer OEBPS et développé l'écosystème de la littérature numérique dans son ensemble. En 2005, l'organisation a été renommée Forum international des publications numériques, ou IDPF .

En 2007, IDPF a changé le nom du format OEBPS en EPUB et a commencé à développer sa deuxième version. Elle a été présentée au grand public en 2010. La nouveauté n'était presque pas différente de son prédécesseur, mais a reçu un support pour les graphiques vectoriels et les polices intégrées.

À cette époque, EPUB avait conquis le marché et était devenu la norme par défaut pour de nombreux éditeurs et fabricants de gadgets électroniques. Le format était déjà utilisé par O'Reilly et Cisco Press, et il était pris en charge par les appareils Apple, Sony, Barnes & Noble, ONYX BOOX.

En 2009, le projet Google Books a annoncé la prise en charge d'EPUB - il a été utilisé pour distribuer plus d'un million de livres gratuits. Le format a commencé à gagner en popularité parmi les écrivains. En 2011, Joan Rowling a parlé de son intention de lancer le site Web Pottermore et d'en faire le seul point de vente numérique pour les livres Potteriana.

EPUB a été choisi comme standard pour la distribution de la littérature, principalement en raison de sa capacité à mettre en œuvre la protection contre la copie ( DRM ). Tous les livres de la boutique en ligne de l'auteur ne sont toujours disponibles que dans ce format .

La troisième version du format EPUB est sortie en 2011. Les développeurs ont ajouté la possibilité de travailler avec des fichiers audio et vidéo et des notes de bas de page. Aujourd'hui, la norme continue d'évoluer - en 2017, IDPF a même rejoint le consortium W3C, qui met en œuvre des normes technologiques pour le World Wide Web.

Comment fonctionne EPUB?


Le livre au format EPUB est une archive ZIP. Il stocke le texte de publication sous forme de pages XHTML ou HTML ou de fichiers PDF. Les archives contiennent également du contenu multimédia (audio, vidéo ou images), des polices et des métadonnées. Il peut également contenir des fichiers supplémentaires avec des documents de style CSS ou PLS avec des informations pour les services de génération de la parole.

Le balisage XML est responsable de l'affichage du contenu. Un fragment d'un livre avec audio et image intégrés peut ressembler à ceci :

<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops" xmlns:ev="http://www.w3.org/2001/xml-events" epub:prefix="media: http://idpf.org/epub/vocab/media/#"> <head> <meta charset="utf-8" /> <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" /> </head> <body> <section class="base"> <h1>the entire transcript</h1> <audio id="bgsound" epub:type="media:soundtrack media:background" src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop=""> <div class="errmsg"> <p>Your Reading System does not support (this) audio</p> </div> </audio> <p>What does it mean to be human if we don't have a shared culture? What does a shared culture mean if we can't share it? It's only in the last 100, or 150 years or so, that we started tightly restricting how that culture gets used.</p> <img class="left" src="../images/326261902_3fa36f548d.jpg" alt="child against a wall" /> </section> </body> </html> 

Outre les fichiers de contenu, l'archive contient un document de navigation spécial (document de navigation). Il décrit la disposition du texte et des images dans un livre. Les applications de lecture y accèdent si le lecteur veut «sauter» plusieurs pages.

Un autre fichier requis dans l'archive est package. Il comprend des métadonnées - informations sur l'auteur, l'éditeur, la langue, le titre, etc. Il comprend également une colonne vertébrale de sous-sections du livre. Un exemple de document de package peut être trouvé dans le référentiel IDPF sur GitHub .

Les avantages


L'avantage du format est sa flexibilité. EPUB vous permet de créer une mise en page dynamique d'un document qui s'adapte à la taille d'écran de l'appareil. C'est l'une des principales raisons pour lesquelles le format prend en charge un grand nombre de lecteurs (et d'autres appareils électroniques). Par exemple, tous les lecteurs ONYX BOOX fonctionnent «prêts à l'emploi» d'EPUB: de la base et du Caesar 3 de 6 pouces au Euclid haut de gamme et de 9,7 pouces.


/ ONYX BOOX Caesar 3

Étant donné que le format est basé sur des normes populaires (XML), il est facile à convertir pour une lecture sur Internet. EPUB prend également en charge les éléments interactifs. Oui, ce sont des éléments similaires dans le PDF, mais vous ne pouvez les ajouter au document PDF qu'en utilisant un logiciel propriétaire. Dans le cas d'EPUB, ils sont ajoutés au livre avec des balises de balisage et XML dans n'importe quel éditeur de texte.

Les autres points forts de l'EPUB sont ses caractéristiques pour les personnes ayant des problèmes de vision ou une dyslexie. La norme vous permet de modifier l'affichage du texte à l'écran - par exemple, de mettre en évidence certaines combinaisons de lettres.

EPUB, comme nous l'avons déjà noté, donne également à l'éditeur la possibilité de définir la protection contre la copie. Si vous le souhaitez, les vendeurs de livres électroniques peuvent utiliser leurs mécanismes pour restreindre l'accès au document. Pour ce faire, modifiez le fichier rights.xml dans l'archive.

Inconvénients


Pour créer une publication EPUB, vous devez comprendre la syntaxe de XML, XHTML et CSS. Dans le même temps, vous devez travailler avec un grand nombre de balises d'identification. A titre de comparaison, la même norme FB2 ne comprend que le jeu de balises minimalement nécessaire - suffisant pour la composition de fiction. Et pour créer des documents PDF, aucune connaissance particulière n'est nécessaire - un logiciel spécialisé est responsable de tout.

EPUB est également critiqué pour la complexité de la conception de bandes dessinées et d'autres livres avec de nombreuses illustrations. Dans ce cas, l'éditeur doit créer une mise en page statique avec des coordonnées fixes pour chaque image - cela peut prendre beaucoup de temps et d'efforts.

Et ensuite


L'IDPF travaille actuellement sur de nouvelles spécifications pour le format. Par exemple, l'un d'eux aidera à créer des didacticiels interactifs avec des sections masquées . Le même livre sera différent pour l'enseignant et l'élève - dans le deuxième cas, par exemple, les réponses aux tests ou aux questions de contrôle seront masquées.


Image: Guian Bolisay / CC BY-SA

La nouvelle fonctionnalité devrait aider à réorganiser le processus éducatif. Aujourd'hui, EPUB est assez activement utilisé par les grandes universités, par exemple l'Université d'Oxford. Il y a quelques années, ils ont ajouté le support EPUB 3.0 à leur application de bibliothèque numérique.

IDPF crée également une spécification pour l'incorporation de notes de bas de page d'annotation ouverte dans EPUB. Cette norme a été développée au W3C en 2013 - elle simplifie le travail avec des types d'annotations complexes. Par exemple, avec son aide, vous pouvez mettre une note dans une section spécifique d'une image JPEG. De plus, la norme implémente un mécanisme de synchronisation des modifications d'annotations entre les copies d'un document EPUB. Des notes au format Open Annotation peuvent être ajoutées aux fichiers EPUB maintenant, cependant, une spécification formelle pour celles-ci n'a pas encore été adoptée.

Des travaux sont également en cours sur une nouvelle version de la norme - EPUB 3.2. Des formats WOFF 2.0 et SFNT y apparaîtront, qui sont utilisés pour compresser les polices (dans certains cas, ils peuvent réduire la taille des fichiers de 30%). De plus, les développeurs remplaceront certains attributs HTML obsolètes. Par exemple, au lieu d'un élément déclencheur distinct pour activer les fichiers audio et vidéo, la nouvelle norme aura des éléments audio et vidéo HTML natifs.

Un projet de spécification et une liste de modifications sont déjà disponibles dans le référentiel GitHub du W3C.



Avis pour les lecteurs ONYX-BOOX:

Source: https://habr.com/ru/post/fr456958/


All Articles