E-Books und ihre Formate: Über EPUB sprechen - seine Geschichte, Vor- und Nachteile

Zu Beginn des Blogs haben wir darüber geschrieben, wie die E-Book-Formate DjVu und FB2 erschienen.

Das Thema des heutigen Artikels ist EPUB.


Bild: Nathan Oakley / CC BY

Verlauf formatieren


In den 90er Jahren dominierten proprietäre Lösungen den E-Book-Markt. Und viele Hersteller von Lesern haben ihr eigenes Format. Beispielsweise verwendete NuvoMedia Dateien mit der Erweiterung .rb. Dies waren Container mit einer HTML-Datei und einer .info-Datei, die Metadaten enthielt. Dieser Zustand erschwerte die Arbeit der Verlage - sie mussten Bücher für jedes Format separat setzen. Eine Gruppe von Ingenieuren von Microsoft, die bereits von NuvoMedia und SoftBook Press erwähnt wurde, nahm die Situation auf.

Zu dieser Zeit wollte Microsoft den E-Book-Markt erobern und entwickelte eine Reader-Anwendung für Windows 95. Wir können sagen, dass die Erstellung eines neuen Formats Teil der Geschäftsstrategie des IT-Riesen war.

Wenn wir über NuvoMedia sprechen, dann gilt dieses Unternehmen als Hersteller des ersten elektronischen Massenlesegeräts Rocket eBook . Der interne Speicher des Geräts betrug nur acht Megabyte, und die Akkulaufzeit betrug nicht mehr als 40 Stunden. Für die SoftBook Press entwickelten sie auch elektronische Lesegeräte. Ihre Geräte hatten jedoch eine Besonderheit - ein eingebautes Modem -, mit dem Sie digitale Literatur direkt aus dem SoftBookstore-Store herunterladen konnten.

In den frühen 2000er Jahren wurden beide Unternehmen - NuvoMedia und SoftBook - vom Gemstar-Medienunternehmen gekauft und in die Gemstar eBook Group integriert. Diese Organisation verkauft seit mehreren Jahren Leser (z. B. RCA REB 1100 ) und digitale Bücher, ging jedoch 2003 aus dem Geschäft .

Aber zurück zur Entwicklung eines einzigen Standards. 1999 gründeten Microsoft, NuvoMedia und SoftBook Press das Open eBook Forum, in dem an einem Dokumententwurf gearbeitet wurde, der den Beginn von EPUB markierte. Ursprünglich hieß der Standard OEBPS (steht für Open EBook Publication Structure). Es ermöglichte die Verteilung einer digitalen Publikation in einer einzigen Datei (ZIP-Archiv) und vereinfachte die Übertragung von Büchern zwischen verschiedenen Hardwareplattformen.

Später traten Adobe, IBM, HP, Nokia, Xerox und die Herausgeber McGraw Hill und Time Warner dem Open eBook Forum bei. Gemeinsam entwickelten sie OEBPS weiter und entwickelten das gesamte Ökosystem der digitalen Literatur. Im Jahr 2005 wurde die Organisation in International Forum on Digital Publications ( IDPF) umbenannt .

2007 änderte IDPF den Namen des OEBPS-Formats in EPUB und begann mit der Entwicklung seiner zweiten Version. Sie wurde 2010 der Öffentlichkeit vorgestellt. Die Neuheit unterschied sich kaum von ihrer Vorgängerin, erhielt jedoch Unterstützung für Vektorgrafiken und eingebettete Schriftarten.

Zu diesem Zeitpunkt hatte EPUB den Markt erobert und wurde zum Standard für viele Verlage und Hersteller von elektronischen Geräten. Das Format wurde bereits von O'Reilly und Cisco Press verwendet und von Geräten von Apple, Sony, Barnes & Noble und ONYX BOOX unterstützt.

Im Jahr 2009 kündigte das Google Books-Projekt die Unterstützung von EPUB an - es wurde verwendet, um mehr als eine Million kostenlose Bücher zu verteilen. Das Format wurde bei Schriftstellern immer beliebter. Im Jahr 2011 sprach Joan Rowling über Pläne , die Pottermore-Website zu starten und sie zur einzigen digitalen Verkaufsstelle für Potteriana-Bücher zu machen.

EPUB wurde als Standard für die Verbreitung von Literatur gewählt, vor allem wegen seiner Fähigkeit, Kopierschutz ( DRM ) zu implementieren. Alle Bücher im Online-Shop des Autors sind weiterhin nur in diesem Format verfügbar .

Die dritte Version des EPUB-Formats wurde 2011 veröffentlicht. Die Entwickler haben die Möglichkeit hinzugefügt, mit Audio- und Videodateien und Fußnoten zu arbeiten. Heute entwickelt sich der Standard weiter - 2017 trat IDPF sogar dem W3C-Konsortium bei, das Technologiestandards für das World Wide Web implementiert.

Wie funktioniert EPUB?


Das Buch im EPUB-Format ist ein ZIP-Archiv. Es speichert Veröffentlichungstext in Form von XHTML- oder HTML-Seiten oder PDF-Dateien. Im Archiv befinden sich auch Medieninhalte (Audio, Video oder Bilder), Schriftarten und Metadaten. Es kann auch zusätzliche Dateien mit CSS- oder PLS- Dokumenten mit Informationen für Sprachgenerierungsdienste enthalten.

XML-Markup ist für die Anzeige von Inhalten verantwortlich. Ein Fragment eines Buches mit integriertem Audio und Bild kann folgendermaßen aussehen :

<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops" xmlns:ev="http://www.w3.org/2001/xml-events" epub:prefix="media: http://idpf.org/epub/vocab/media/#"> <head> <meta charset="utf-8" /> <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" /> </head> <body> <section class="base"> <h1>the entire transcript</h1> <audio id="bgsound" epub:type="media:soundtrack media:background" src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop=""> <div class="errmsg"> <p>Your Reading System does not support (this) audio</p> </div> </audio> <p>What does it mean to be human if we don't have a shared culture? What does a shared culture mean if we can't share it? It's only in the last 100, or 150 years or so, that we started tightly restricting how that culture gets used.</p> <img class="left" src="../images/326261902_3fa36f548d.jpg" alt="child against a wall" /> </section> </body> </html> 

Das Archiv enthält neben Inhaltsdateien ein spezielles Navigationsdokument (Navigationsdokument). Es beschreibt das Layout von Text und Bildern in einem Buch. Reader-Anwendungen greifen darauf zu, wenn der Reader über mehrere Seiten „springen“ möchte.

Eine weitere erforderliche Datei im Archiv ist das Paket. Es enthält Metadaten - Informationen zu Autor, Herausgeber, Sprache, Titel usw. Es enthält auch eine Reihe von Unterabschnitten des Buches. Ein Beispiel für ein Paketdokument finden Sie im IDPF-Repository auf GitHub .

Vorteile


Der Vorteil des Formats ist seine Flexibilität. Mit EPUB können Sie ein dynamisches Layout eines Dokuments erstellen, das sich an die Bildschirmgröße des Geräts anpasst. Dies ist einer der Hauptgründe, warum das Format eine große Anzahl von Lesegeräten (und anderen elektronischen Geräten) unterstützt. Zum Beispiel arbeiten alle ONYX BOOX-Lesegeräte von EPUB „out of the box“: von der Basis über 6-Zoll- Caesar 3 bis hin zu Premium- und 9,7-Zoll- Euklid .


/ ONYX BOOX Caesar 3

Da das Format auf gängigen Standards (XML) basiert, ist es einfach zum Lesen im Internet zu konvertieren. EPUB unterstützt auch interaktive Elemente. Ja, es handelt sich um ähnliche Elemente in der PDF-Datei, aber Sie können sie nur mit proprietärer Software zum PDF-Dokument hinzufügen. Im Fall von EPUB werden sie dem Buch mit Markup- und XML-Tags in einem beliebigen Texteditor hinzugefügt.

Die anderen Stärken von EPUB sind die Merkmale für Menschen mit Sehproblemen oder Legasthenie. Mit dem Standard können Sie die Anzeige von Text auf dem Bildschirm ändern - beispielsweise bestimmte Buchstabenkombinationen hervorheben.

Wie bereits erwähnt, bietet EPUB dem Verlag auch die Möglichkeit, den Kopierschutz festzulegen. Auf Wunsch können Verkäufer elektronischer Bücher mithilfe ihrer Mechanismen den Zugriff auf das Dokument einschränken. Ändern Sie dazu die Datei rights.xml im Archiv.

Nachteile


Um eine EPUB-Publikation zu erstellen, müssen Sie die Syntax von XML, XHTML und CSS verstehen. Gleichzeitig müssen Sie mit einer großen Anzahl von Identifier-Tags arbeiten. Zum Vergleich enthält derselbe FB2-Standard nur den minimal erforderlichen Satz von Tags - ausreichend für das Setzen von Fiktionen. Und um PDF-Dokumente zu erstellen, sind keine besonderen Kenntnisse erforderlich - spezielle Software ist für alles verantwortlich.

EPUB wird auch für die Komplexität der Gestaltung von Comics und anderen Büchern mit vielen Abbildungen kritisiert. In diesem Fall muss der Herausgeber für jedes Bild ein statisches Layout mit festen Koordinaten erstellen - dies kann viel Zeit und Mühe kosten.

Was weiter


IDPF arbeitet derzeit an neuen Spezifikationen für das Format. Eine davon hilft beispielsweise beim Erstellen interaktiver Tutorials mit ausgeblendeten Abschnitten . Das gleiche Buch sieht für Lehrer und Schüler unterschiedlich aus - im zweiten Fall werden beispielsweise Antworten auf Tests oder Kontrollfragen ausgeblendet.


Bild: Guian Bolisay / CC BY-SA

Die neue Funktion soll dazu beitragen, den Bildungsprozess neu zu organisieren. Heute wird EPUB von großen Universitäten, beispielsweise der Universität Oxford, sehr aktiv genutzt. Vor einigen Jahren haben sie ihre digitale Bibliotheksanwendung um EPUB 3.0-Unterstützung erweitert.

IDPF erstellt auch eine Spezifikation zum Einbetten von Open Annotation-Fußnoten in EPUB. Dieser Standard wurde 2013 am W3C entwickelt - er vereinfacht die Arbeit mit komplexen Arten von Anmerkungen. Mit seiner Hilfe können Sie beispielsweise einem bestimmten Abschnitt eines JPEG-Bildes eine Notiz hinzufügen. Darüber hinaus implementiert der Standard einen Mechanismus zum Synchronisieren von Änderungen in Anmerkungen zwischen Kopien eines EPUB-Dokuments. Notizen im Open Annotation-Format können jetzt zu EPUB-Dateien hinzugefügt werden , eine formale Spezifikation für diese wurde jedoch noch nicht übernommen.

An einer neuen Version des Standards - EPUB 3.2 - wird ebenfalls gearbeitet. Darin werden die Formate WOFF 2.0 und SFNT angezeigt , mit denen Schriftarten komprimiert werden (in einigen Fällen können sie die Dateigröße um 30% reduzieren). Außerdem werden Entwickler einige veraltete HTML-Attribute ersetzen. Anstelle eines separaten Triggerelements zum Aktivieren von Audio- und Videodateien verfügt der neue Standard beispielsweise über native HTML-Audio- und -Videoelemente.

Ein Entwurf einer Spezifikation und eine Liste der Änderungen sind bereits im W3C GitHub-Repository verfügbar.



Bewertungen für ONYX-BOOX-Leser:

Source: https://habr.com/ru/post/de456958/


All Articles