E-Books und ihre Formate: FB2 und FB3 - Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien

Im letzten Artikel haben wir über die Funktionen des DjVu-Formats gesprochen . Heute haben wir uns entschlossen, uns mit dem FictionBook2-Format, besser bekannt als FB2, und seinem „Nachfolger“ FB3 zu befassen.


/ Flickr / judit klein / cc

Formatieren Sie das Erscheinungsbild


Mitte der 90er Jahre begannen Enthusiasten , sowjetische Bücher zu digitalisieren. Sie übersetzten und speicherten Literatur in einer Vielzahl von Formaten. Eine der ersten Bibliotheken in Runet - die Maxim Moshkov Library - verwendete eine formatierte Textdatei (TXT).

Die Entscheidung zu seinen Gunsten wurde aufgrund der Beständigkeit gegen Byteschäden und der Vielseitigkeit getroffen - TXT wird auf jedem Betriebssystem geöffnet. Es machte es jedoch schwierig, gespeicherte Textinformationen zu verarbeiten. Um beispielsweise zur tausendsten Zeile zu gelangen, mussten Sie 999 Zeilen davor verarbeiten. Bücher wurden auch in Word-Dokumenten und PDFs gespeichert - letztere waren schwer in andere Formate zu konvertieren, und schwache Computer öffneten und zeigten PDF-Dokumente mit Verzögerungen an.

Auch für die "Speicherung" elektronischer Literatur wird HTML verwendet. Er vereinfachte die Indizierung, konvertierte in andere Formate und erstellte Dokumente (Text mit Tags versehen), führte jedoch seine eigenen Mängel ein. Eine der wichtigsten war die „ Unbestimmtheit “ des Standards: Er erlaubte bestimmte Freiheiten beim Schreiben von Tags. Einige von ihnen mussten geschlossen werden, andere (zum Beispiel <p>) - es war nicht notwendig zu schließen. Tags selbst können eine beliebige Verschachtelungsreihenfolge haben.

Und obwohl eine solche Arbeit mit Dateien nicht gefördert wurde - solche Dokumente wurden als falsch angesehen -, forderte der Standard die Leser auf, zu versuchen, den Inhalt anzuzeigen. Hier traten Schwierigkeiten auf, da in jeder Anwendung der Prozess der „Spekulation“ auf seine eigene Weise implementiert wurde. Darüber hinaus verstanden zu diesem Zeitpunkt die auf dem Markt zum Lesen verfügbaren Geräte und Anwendungen ein oder zwei spezielle Formate. Wenn das Buch in einem Format vorliegt, muss es neu formatiert werden, um es zu lesen. FictionBook2 oder FB2, das das primäre „Kämmen“ des Textes und die Konvertierung übernahm, wurde aufgerufen, um all diese Mängel zu beheben.

Beachten Sie, dass das Format die erste Version hatte - FictionBook1 - es war jedoch nur experimenteller Natur, hielt nicht lange an, wird heute nicht unterstützt und ist nicht abwärtskompatibel. Daher bedeutet FictionBook meistens seinen "Nachfolger" - das FB2-Format.

FB2 wurde von einer Gruppe von Entwicklern unter der Leitung von Dmitry Gribov , dem technischen Direktor für Liter, und Mikhail Matsnev, dem Erfinder des Haali Reader Readers, erstellt. Das Format basiert auf XML, das strenger als HTML ist und die Arbeit mit offenen und verschachtelten Tags regelt. Ein XML-Dokument wird von einem sogenannten XML-Schema begleitet. Ein XML-Schema ist eine spezielle Datei, die alle Tags enthält und die Regeln für ihre Anwendung beschreibt (Reihenfolge, Verschachtelung, obligatorisch und optional usw.). In FictionBook befindet sich das Schema in der Datei FictionBook2.xsd. Ein Beispiel für ein XML-Schema finden Sie unter dem Link (es wird vom Liter-E-Bookstore verwendet).

Dokumentenstruktur FB2


Der Text im Dokument wird in speziellen Tags gespeichert - Absatztypelemente: <p>, <v> und <Untertitel>. Es gibt auch ein <leer-Linie> -Element, das keinen Inhalt hat und zum Einfügen von Lücken verwendet wird.

Alle Dokumente beginnen mit dem Root-Tag <fictionbook>, unter dem <stylesheet>, <description>, <body> und <binary> angezeigt werden können.

Das <stylesheet> -Tag enthält Stylesheets, um die Konvertierung in andere Formate zu erleichtern. Die <binary> enthält base64- codierte Daten, die möglicherweise zum Rendern des Dokuments erforderlich sind.

Das Element <description> enthält alle erforderlichen Informationen zum Buch: Genre des Werks, Liste der Autoren (F. I. O., E-Mail-Adresse und Website im Internet), Titel, Block mit Schlüsselwörtern, Anmerkung. Es kann auch Informationen zu Änderungen des Dokuments und Informationen über den Herausgeber des Buches enthalten, sofern es auf Papier herausgegeben wurde.

So sieht der Teil des <description> -Blocks im FictionBook-Eintrag für Arthur Conan Doyles Studie in Scharlachroten Tönen aus dem Gutenberg-Projekt aus:

<?xml version="1.0" encoding="iso-8859-1"?> <FictionBook xmlns:xlink="http://www.w3.org/1999/xlink" xmlns="http://www.gribuser.ru/xml/fictionbook/2.0"> <description> <title-info> <genre match="100">detective</genre> <author> <first-name>Arthur</first-name> <middle-name>Conan</middle-name> <last-name>Doyle</last-name> </author> <book-title>A Study in Scarlet</book-title> <annotation> </annotation> <date value="1887-01-01">1887</date> </title-info> </description> 

Eine Schlüsselkomponente eines FictionBook-Dokuments ist <body>. Es enthält den Text des Buches selbst. Das Dokument kann mehrere dieser Tags enthalten. In zusätzlichen Blöcken werden Fußnoten, Kommentare und Notizen gespeichert.

FictionBook bietet auch mehrere Tags für die Arbeit mit Hyperlinks. Sie basieren auf der XLink- Spezifikation, die vom W3C- Konsortium speziell entwickelt wurde, um Verknüpfungen zwischen verschiedenen Ressourcen in XML-Dokumenten herzustellen.

Vorteile des Formats


Der FB2-Standard enthält nur den minimal erforderlichen Satz von Tags (ausreichend für das "Design" der Fiktion), was die Verarbeitung durch die Leser vereinfacht. Darüber hinaus hat der Benutzer bei direkter Bedienung des Lesegeräts mit dem FB-Format die Möglichkeit, nahezu alle Anzeigeparameter selbst zu konfigurieren.

Die strikte Struktur des Dokuments ermöglicht es Ihnen, den Konvertierungsprozess vom FB-Format in ein anderes zu automatisieren. Die gleiche Struktur ermöglicht es, mit einzelnen Elementen von Dokumenten zu arbeiten - Filter nach Buchautoren, Titel, Genre usw. anpassen. Aus diesem Grund hat das FB2-Format in RuNet an Popularität gewonnen und ist zum Standard in russischen elektronischen Bibliotheken und Bibliotheken der GUS-Staaten geworden.

Format Nachteile


Die Einfachheit des FB2-Formats ist gleichzeitig sein Vor- und Nachteil. Dies schränkt die Funktionalität für den komplexen Satz von Text ein (z. B. Randnotizen). Es gibt keine Vektorgrafiken oder Unterstützung für nummerierte Listen. Aus diesem Grund ist das Format für Lehrbücher, Nachschlagewerke und technische Literatur nicht sehr geeignet (der Name des Formats spricht sogar von diesem - Fiktionsbuch oder "Kunstbuch").

Gleichzeitig muss das Programm fast das gesamte XML-Dokument verarbeiten, um nur minimale Informationen über das Buch anzuzeigen - Titel, Autor und Cover. Dies liegt daran, dass sich Metadaten am Anfang des Textes und Bilder am Ende befinden.

FB3 - Formatentwicklung


Aufgrund der gestiegenen Anforderungen an die Textformatierung von Büchern (und um einige der Mängel von FB2 auszugleichen) begann Gribov mit der Arbeit am FB3-Format. Die spätere Entwicklung wurde eingestellt, aber 2014 wieder aufgenommen .

Den Autoren zufolge untersuchten sie die tatsächlichen Bedürfnisse bei der Veröffentlichung technischer Literatur, schauten sich Lehrbücher, Nachschlagewerke und Handbücher an und skizzierten einen spezifischeren Satz von Tags, mit denen jedes Buch angezeigt werden kann.

In der neuen Spezifikation ist das FictionBook-Format ein Zip-Archiv, in dem Metadaten, Bilder und Text in separaten Dateien gespeichert werden. Die Anforderungen für das Format der Zip-Datei und die Vereinbarungen zu ihrer Organisation sind im ECMA-376- Standard festgelegt, der Open XML definiert.

Eine Reihe von Verbesserungen in Bezug auf die Formatierung (Entladen, Unterstreichen) wurden vorgenommen, und ein neues Objekt wurde hinzugefügt - der „Block“ - der ein beliebiges Fragment eines Buches in Form eines Vierecks bildet und mit einem Fluss um ihn herum in Text eingebettet werden kann. Es gibt Unterstützung für nummerierte Listen und Listen mit Aufzählungszeichen.

FB3 wird unter einer kostenlosen Lizenz vertrieben und verfügt über Open Source-Code, sodass alle Dienstprogramme für Publisher und Benutzer verfügbar sind: Konverter, Cloud-Editoren und Leser. Die aktuelle Version des Formats, des Readers und des Editors finden Sie im Projekt-Repository auf GitHub.

Im Allgemeinen ist FictionBook3 immer noch weniger verbreitet als sein älterer Bruder. Einige elektronische Bibliotheken bieten jedoch bereits Bücher in diesem Format an. Und vor ein paar Jahren haben sie in Litern angekündigt, ihren gesamten Katalog in ein neues Format zu übertragen. Einige Leser unterstützen bereits alle erforderlichen FB3-Funktionen. Beispielsweise können alle modernen ONYX-Lesemodelle, z. B. Darwin 3 oder Cleopatra 3 , mit diesem Format „out of the box“ arbeiten.


/ ONYX BOOX Cleopatra 3

Mit einer breiteren Verbreitung von FictionBook3 können Sie ein Ökosystem erstellen, das sich auf die vollständige und effektive Arbeit mit Text auf jedem Gerät mit begrenzten Ressourcen konzentriert: Schwarzweiß- oder kleines Display, wenig Speicher usw. Nach Ansicht der Entwickler ist ein einmal kompiliertes Buch in jeder Umgebung am bequemsten.



PS Wir machen Sie auf einige Bewertungen von ONYX BOOX-Lesern aufmerksam:

Source: https://habr.com/ru/post/de411755/


All Articles