E-Books und ihre Formate: Erzählen von PDF - Geschichte, Vor- und Nachteile

In unserem Blog haben wir bereits die Besonderheiten der Standards DjVu , FB2 und FB3 besprochen . Heute sprechen wir über das PDF-Format, das zum Inbegriff des Traums von einem "papierlosen Büro" wurde.


/ Flickr / Kim Siever / PD

Eine kurze Geschichte des Formats


Der Ersteller von PDF oder Portable Document Format wurde von John Warnock, einem der Gründer von Adobe, entwickelt, der das Drucken von Text und Bildern von einem Computer aus vereinfachen wollte. 1984 führte Warnock die PostScript- Seitenbeschreibungssprache ein.

Wikipedia verwendet als Beispiel den PostScript-Code, der einige Wikipedia-Wörter in einem Kreis zeichnet.

%!PS-Adobe-1.0 %  ,     1 =1/72 , %    . 72 25.4 div % 1  = 72/25.4  dup %      scale %         100 100 translate %     (100 , 100 ) /Times-Roman findfont %   Times-Roman 10 scalefont %    10 (  - !) setfont %    0 30 330 { %     0  330   30 gsave %     rotate %    (      ) 15 0 moveto %    (15 , 0 ) (Wikipedia) show %     grestore %    } for %   for showpage %   

Ursprünglich wurde PostScript als Werkzeug zum Drucken von Dokumenten auf einem Drucker entwickelt. Später entschied Warnock, dass mit Hilfe einer neuen Sprache nicht nur Dokumente gedruckt, sondern auch das Workflow-System vollständig „digitalisiert“ werden kann.

Als Teil dieser Vision hat Adobe (gegründet von Warnock) das IPS-Format erstellt (steht für Interchange PostScript). Um damit zu arbeiten, wurde Adobe Illustrator erstellt - ein plattformübergreifender Grafikeditor für Windows und Mac.

IPS wurde erstmals 1991 auf der Seybold-Konferenz in San Jose gezeigt, aber mit diesem Namen dauerte das Format zwei Jahre - 1993 wurde es in PDF umbenannt. Dann kamen Acrobat Distiller und Acrobat Reader (später in Adobe Reader umbenannt).

PDF war zunächst nicht beliebt. Der Fehler war der hohe Preis für Software: Acrobat Distiller für den persönlichen Gebrauch kostete 700 US-Dollar und für den Unternehmensgebrauch 2.500 US-Dollar. Für Acrobat Reader baten sie um weitere 50 Dollar. Im Laufe der Zeit senkte Adobe die Preise und die Popularität von PDF gewann zunehmend an Bedeutung.

Zu Beginn von Null wurde Acrobat Reader 4.0 von hundert Millionen Menschen heruntergeladen , und große IT-Unternehmen wie Microsoft und Apple begannen, das PDF-Format zu verwenden.

Wie funktioniert PDF?


Der grundlegende Ansatz zur Darstellung von Grafiken und Text in PDF ist dem von PostScript sehr ähnlich. Die sogenannten Textelemente sind für die Anzeige von Text auf einer Seite verantwortlich. Sie geben an, wo die Zeichen gezeichnet werden sollen. Wikipedia bietet Code zum Schreiben von Hello World:

 /Courier %   20 selectfont %     72 500 moveto %     72, 500 (Hello world!) show %     showpage %     

Zum Zeichnen von Vektorgrafiken in PDF werden Pfade verwendet: gerade Linien oder kubische Bezier-Kurven . Mit Konturen konstruierte Formen können mit Farbe gefüllt oder schattiert werden. Rasterbilder werden in Form von Wörterbüchern und Streams dargestellt . Die Wörterbücher beschreiben die Eigenschaften, und der Stream enthält binäre Informationen zum Bild.

Die Größe der PDF-Datei hängt von der Auflösung der Bilder, den Schriftarteinstellungen, der Verwendung von Hyperlinks, Videos usw. ab. Bis in die 2000er Jahre wurde die Größe von PDF-Dateien in Megabyte gemessen, da die meisten Dokumente aus JPEG-Bildern bestanden. Um dieses Problem zu lösen, schlug Adobe die Technologie der Komprimierung von MRC ( Mixed Raster Content ) vor.

MRC „ unterteilt “ die gescannte Datei in Ebenen: eine Hintergrundebene, eine Textebene und eine Farbmaske. Für die Komprimierung der auf jeder Ebene verfügbaren Informationen ist ein eigener Codec verantwortlich. Beispielsweise kann JBIG2 für Text verwendet werden, der Gruppen ähnlicher Buchstaben bildet und daraus ein Wörterbuch erstellt. Daher werden dieselben Zeichen einmal codiert, und an anderen Stellen werden nur Verweise auf sie verwendet.

JPEG-, JPEG2000- oder Postleitzahl-Codecs werden zum Komprimieren anderer Inhalte verwendet. Mit ihrer Hilfe werden der Hintergrund des Bildes, die Farbzuordnung von Text, Bildern und Fotos gespeichert. Aufgrund dieses Ansatzes wird die Größe jeder Seite um die Hälfte oder mehr reduziert. Illustrative Beispiele für die PDF-Komprimierung werden von Abbyy in ihrem Blog auf Habré bereitgestellt.

PDF-Vorteile


Einer der Hauptvorteile von PDF-Dateien ist die Tatsache, dass alle Seiten genau so aussehen, wie es der Autor des Dokuments beabsichtigt hat. Das Format behält den ursprünglichen Hintergrund, die Schriftarten und Bilder in ihrer ursprünglichen Form bei, unabhängig vom Gerät oder Betriebssystem. Gleichzeitig können Sie mit PDF mit interaktiven Elementen arbeiten: Hyperlinks zum Navigieren in Fußnoten. Außerdem werden dem Dokument Mediendateien hinzugefügt : Musik, GIF und sogar Videos.

Gleichzeitig kann die PDF-Datei schreibgeschützt werden, wodurch der Inhalt des Dokuments vor dem Kopieren und Vornehmen von Änderungen geschützt wird. Für zusätzlichen Schutz kann ein Passwort oder eine elektronische Signatur eingegeben werden.

Ein weiterer Vorteil des Formats ist seine Zugänglichkeit. Das Programm zum Lesen eines PDF-Dokuments Adobe Acrobat Reader liegt heute im Netzwerk im freien Zugriff. Sie können PDF in E-Books öffnen. Die meisten von ihnen können standardmäßig mit diesem Format arbeiten. Es wird von vielen Reader-Anwendungen unterstützt, z. B. FBreader oder NEO Reader.

Format Cons


Die Unveränderlichkeit des PDF-Formats ist zwar ein Vorteil, stellt sich jedoch auch als großer Nachteil heraus. Solche Dateien (insbesondere große Diagramme und Diagramme, Notizen, großformatige Dokumente) sind auf Geräten mit kleinen Bildschirmen - Smartphones oder kompakten elektronischen Lesegeräten - schwer zu lesen. Die Seite passt einfach nicht auf den Gerätebildschirm oder der Text wird zu klein angezeigt.

Es gibt elektronische Lesegeräte auf dem Markt mit einer Bildschirmauflösung von 13,3 oder 10,3 Zoll, mit denen Sie bequem mit A4-PDF-Blättern arbeiten können. Beispiele für solche Gadgets können ONYX BOOX MAX 2 (eine Überprüfung, die wir in unserem Blog vorbereitet haben), ONYX BOOX Note oder ONYX BOOX Gulliver (es gibt auch eine Überprüfung ) sein. Sie bieten die Möglichkeit, alle Details der Zeichnungen und Abbildungen in Originalgröße zu betrachten und eignen sich für diejenigen, die häufig technische Literatur lesen müssen. Die Kosten für solche Geräte sind jedoch recht hoch.

Es gibt ein weiteres Problem bei der Anzeige von Dokumentseiten. Es ist dem JBIG2-Format zugeordnet. Obwohl Sie mit dem Codec den Text mehrmals komprimieren können, unterliegt er dem Einfluss des "Yin" -Problems (darüber haben wir im Material über DjVu geschrieben ). Beim Komprimieren des Textes und Kompilieren des Wörterbuchs werden einige Zeichen durch ähnliche ersetzt (z. B. wird aus „und“ „n“), was zu einer Verzerrung des Textes führt.

Es gibt auch Probleme beim Bearbeiten von PDF-Dateien, da Sie spezielle Programme installieren müssen, die häufig bezahlt werden (z. B. Acrobat DC ). Es gibt auch kostenlose Bearbeitungsdienste im Internet wie PDF2GO , mit denen Sie jedoch nur Text oder Bilder „über“ der Originaldatei hinzufügen können.

Weiterentwicklung


Trotz seiner Mängel ist PDF bis heute ein beliebtes Format. Das Marketingunternehmen HubSpot hat dreitausend Besucher seiner Website gefragt, was sie mit E-Books machen: online lesen oder als PDF herunterladen. Es stellte sich heraus, dass 90% der Befragten es vorziehen, eine PDF-Datei herunterzuladen.

Entwickler fügen ständig neue Funktionen hinzu, unter anderem zum Lesen auf tragbaren Geräten. Anfang 2018 stellte das Adobe-Team der Acrobat DC-Anwendung beispielsweise erweiterte Anzeige- und Bearbeitungsfunktionen auf Mobilgeräten zur Verfügung.

Darüber hinaus gab es im August Informationen zu einem neuen Projekt - PDF hörbar . Es wird die Funktionen von PDF und die Funktionen von Sprachassistenten kombinieren: Alexa, Google Home und Siri. Bisher ist nur ein Prototyp fertig, aber die Entwickler versprechen, in naher Zukunft eine funktionierende Version zu veröffentlichen.

Adobe folgt neuen Richtungen und beabsichtigt, das Format interaktiver zu gestalten, z. B. Augmented-Reality-Funktionen hinzuzufügen. Wie es aussehen wird, ist noch nicht klar, aber die Entwickler versprechen, dass das PDF-Ökosystem in den kommenden Jahren eine neue Ebene der Benutzerinteraktion erreichen wird.



Zusätzliche Lektüre - Rezensionen von Lesern ONYX BOOX:

Source: https://habr.com/ru/post/de435308/


All Articles