E-book dan formatnya: menceritakan tentang PDF - sejarahnya, pro dan kontra

Di blog kami, kami telah membahas spesifikasi standar DjVu , FB2 dan FB3 . Hari ini kita berbicara tentang format PDF, yang menjadi perwujudan impian "kantor tanpa kertas".


/ Flickr / Kim Siever / PD

Sejarah singkat format


Pencipta PDF, atau Portable Document Format, dibuat oleh John Warnock, salah satu pendiri Adobe, yang ingin memfasilitasi proses pencetakan teks dan gambar dari komputer. Pada tahun 1984, Warnock memperkenalkan bahasa deskripsi halaman PostScript .

Wikipedia memberikan contoh kode PostScript yang menarik beberapa kata Wikipedia dalam lingkaran .

%!PS-Adobe-1.0 %  ,     1 =1/72 , %    . 72 25.4 div % 1  = 72/25.4  dup %      scale %         100 100 translate %     (100 , 100 ) /Times-Roman findfont %   Times-Roman 10 scalefont %    10 (  - !) setfont %    0 30 330 { %     0  330   30 gsave %     rotate %    (      ) 15 0 moveto %    (15 , 0 ) (Wikipedia) show %     grestore %    } for %   for showpage %   

Awalnya, PostScript dikembangkan sebagai alat untuk mencetak dokumen pada printer, tetapi kemudian Warnock memutuskan bahwa dengan bantuan bahasa baru tidak hanya mungkin untuk mencetak dokumen, tetapi juga untuk sepenuhnya "mendigitalkan" sistem alur kerja.

Sebagai bagian dari visi ini, Adobe (didirikan oleh Warnock) menciptakan format IPS (singkatan dari Interchange PostScript). Untuk bekerja dengannya, Adobe Illustrator telah dibuat - editor grafis lintas platform untuk Windows dan Mac.

IPS pertama kali ditampilkan pada konferensi Seybold di San Jose pada tahun 1991, tetapi dengan nama ini formatnya bertahan dua tahun - pada tahun 1993 diubah namanya menjadi PDF. Kemudian muncul Acrobat Distiller dan Acrobat Reader (kemudian berganti nama menjadi Adobe Reader).

Pada awalnya, PDF tidak populer. Kesalahannya adalah tingginya harga perangkat lunak: Acrobat Distiller untuk penggunaan pribadi berharga $ 700, dan untuk penggunaan perusahaan - $ 2.500. Untuk Acrobat Reader mereka meminta 50 dolar lagi. Seiring waktu, Adobe menurunkan harga, dan popularitas PDF mulai mendapatkan momentum.

Pada awal nol, Acrobat Reader 4.0 diunduh oleh seratus juta orang, dan perusahaan IT besar seperti Microsoft dan Apple mulai menggunakan format PDF.

Bagaimana cara kerja PDF?


Pendekatan dasar untuk menyajikan grafik dan teks dalam PDF sangat mirip dengan yang digunakan oleh PostScript. Elemen teks yang disebut bertanggung jawab untuk menampilkan teks pada halaman. Mereka menunjukkan di mana karakter harus digambar. Wikipedia menyediakan kode untuk menulis Hello World:

 /Courier %   20 selectfont %     72 500 moveto %     72, 500 (Hello world!) show %     showpage %     

Untuk menggambar grafik vektor dalam PDF, digunakan jalur: garis lurus atau kurva Bezier kubik . Bentuk yang dibangun menggunakan garis dapat diisi dengan warna atau teduh. Adapun gambar raster, mereka diwakili dalam bentuk kamus dan aliran . Kamus menggambarkan properti, dan aliran berisi informasi biner tentang gambar.

Ukuran file PDF tergantung pada resolusi gambar, pengaturan font, penggunaan hyperlink, video, dan sebagainya. Sampai tahun 2000-an, ukuran file PDF diukur dalam megabyte, karena sebagian besar dokumen terdiri dari gambar JPEG. Untuk mengatasi masalah ini, Adobe mengusulkan teknologi kompresi MRC ( Mixed Raster Content ).

MRC “ membagi ” file yang dipindai menjadi beberapa lapisan: lapisan latar belakang, lapisan teks, dan topeng warna. Untuk kompresi informasi yang tersedia di setiap lapisan, codec-nya sendiri bertanggung jawab. Misalnya, JBIG2 dapat digunakan untuk teks, yang membentuk kelompok-kelompok huruf yang sama dan membuat kamus dari mereka. Jadi, karakter yang sama dikodekan sekali, dan di tempat lain hanya referensi yang digunakan.

JPEG, JPEG2000, atau ZIP codec digunakan untuk mengompresi konten lain. Dengan bantuan mereka, latar belakang gambar, alokasi warna teks, gambar dan foto disimpan. Karena pendekatan ini, ukuran setiap halaman berkurang setengah atau lebih. Contoh-contoh ilustrasi kompresi PDF disediakan oleh Abbyy di blog mereka di Habré .

Keuntungan PDF


Salah satu keuntungan utama dari file PDF adalah kenyataan bahwa semua halaman terlihat persis seperti yang dimaksudkan oleh penulis dokumen tersebut. Format mempertahankan latar belakang asli, font dan gambar dalam bentuk aslinya, terlepas dari perangkat atau sistem operasi. Pada saat yang sama, PDF memungkinkan Anda untuk bekerja dengan elemen interaktif: hyperlink untuk menavigasi catatan kaki. Juga , file media ditambahkan ke dokumen: musik, GIF dan bahkan video.

Pada saat yang sama, file PDF dapat dibuat hanya-baca, yang membantu melindungi konten dokumen dari penyalinan dan membuat perubahan. Untuk perlindungan tambahan, dimungkinkan untuk memasukkan kata sandi atau tanda tangan elektronik.

Keuntungan lain dari format ini adalah aksesibilitasnya. Program untuk membaca dokumen PDF Adobe Acrobat Reader hari ini terletak pada jaringan dalam akses gratis. Anda dapat membuka PDF di e-book. Sebagian besar dari mereka “dapat” bekerja dengan format ini secara default. Ini didukung oleh banyak aplikasi pembaca, misalnya, FBreader atau NEO Reader.

Format Kontra


Kekekalan dari format PDF, meskipun merupakan keuntungannya, juga ternyata menjadi kelemahan besar. File seperti itu (terutama diagram dan bagan besar, catatan, dokumen format besar) sulit dibaca pada perangkat dengan layar kecil - smartphone, atau pembaca elektronik ringkas. Halaman itu tidak pas di layar perangkat, atau teks yang ditampilkan terlalu kecil.

Ada pembaca elektronik di pasaran dengan resolusi layar 13,3 atau 10,3 inci, yang memungkinkan Anda bekerja dengan nyaman dengan lembaran PDF berukuran A4. Contoh gadget tersebut dapat berupa ONYX BOOX MAX 2 (review yang telah kami siapkan di blog kami ), ONYX BOOX Note atau ONYX BOOX Gulliver (ini juga memiliki ulasan ). Mereka memberikan kesempatan untuk mempertimbangkan semua detail gambar dan ilustrasi dalam ukuran aslinya dan cocok untuk mereka yang sering harus membaca literatur teknis. Namun, biaya gadget semacam itu cukup tinggi.

Ada masalah lain dengan tampilan halaman dokumen. Itu terkait dengan format JBIG2. Meskipun codec memungkinkan Anda untuk mengompres teks beberapa kali, itu tergantung pada pengaruh masalah "yin" (kami menulisnya dalam materi tentang DjVu ). Saat mengompresi teks dan menyusun kamus, beberapa karakter diganti dengan yang serupa (misalnya, "dan" berubah menjadi "n"), yang mengarah pada distorsi esensi teks.

Ada juga masalah dengan pengeditan file PDF, karena Anda harus menginstal program khusus yang sering dibayar (misalnya, Acrobat DC ). Ada juga layanan pengeditan gratis di internet seperti PDF2GO , tetapi mereka hanya memungkinkan Anda untuk menambahkan teks atau gambar "di atas" dari file asli.

Pengembangan lebih lanjut


Terlepas dari kekurangannya, PDF tetap menjadi format yang populer saat ini. Perusahaan pemasaran HubSpot meminta tiga ribu pengunjung ke situsnya tentang apa yang mereka lakukan dengan e-book: baca online atau unduh dalam PDF. Ternyata 90% responden lebih suka mengunduh file PDF.

Pengembang terus menambahkan fitur baru, termasuk membaca pada gadget portabel. Misalnya, pada awal 2018, tim Adobe memberi aplikasi Acrobat DC tampilan yang ditingkatkan dan fitur pengeditan pada perangkat seluler.

Selain itu, pada bulan Agustus ada informasi tentang proyek baru - PDF terdengar . Ini akan menggabungkan kemampuan PDF dan fungsi asisten suara: Alexa, Google Home, dan Siri. Sejauh ini, hanya prototipe yang siap, tetapi pengembang berjanji untuk merilis versi yang berfungsi dalam waktu dekat.

Adobe mengikuti arahan baru dan bermaksud untuk membuat format lebih interaktif, misalnya, menambahkan fitur augmented reality. Tampilannya belum jelas, tetapi pengembang berjanji bahwa ekosistem PDF akan mencapai tingkat baru interaksi pengguna di tahun-tahun mendatang.



Bacaan tambahan - ulasan pembaca ONYX BOOX:

Source: https://habr.com/ru/post/id435308/


All Articles