E-book dan formatnya: FB2 dan FB3 - sejarah, pro, kontra, dan prinsip kerja

Pada artikel terakhir, kami berbicara tentang fitur format DjVu . Hari ini kami memutuskan untuk memikirkan format FictionBook2, lebih dikenal sebagai FB2, dan "penggantinya" FB3.


/ Flickr / judit klein / cc

Memformat penampilan


Pada pertengahan 90-an, para penggemar mulai mendigitalkan buku-buku Soviet. Mereka menerjemahkan dan menyimpan lektur dalam berbagai format. Salah satu perpustakaan pertama di Runet - Perpustakaan Maxim Moshkov - menggunakan file teks yang diformat (TXT).

Pilihan yang menguntungkannya dibuat karena resistensi terhadap kerusakan byte dan fleksibilitas - TXT terbuka pada sistem operasi apa pun. Namun, itu membuatnya sulit untuk memproses informasi teks yang tersimpan. Misalnya, untuk menuju ke garis keseribu, Anda harus memproses 999 garis di depannya. Buku-buku juga disimpan dalam dokumen Word dan PDF - yang terakhir sulit dikonversi ke format lain, dan komputer yang lemah membuka dan menampilkan dokumen PDF dengan penundaan.

Juga untuk "penyimpanan" literatur elektronik yang digunakan HTML. Dia menyederhanakan pengindeksan, mengkonversi ke format lain dan membuat dokumen (menandai teks dengan tag), tetapi memperkenalkan kekurangannya sendiri. Salah satu yang paling signifikan adalah " ketidakjelasan " standar: itu memungkinkan kebebasan tertentu ketika menulis tag. Beberapa dari mereka harus ditutup, yang lain (misalnya, <p>) - itu tidak perlu ditutup. Tag sendiri dapat memiliki urutan penyarang yang sewenang-wenang.

Dan meskipun pekerjaan dengan file seperti itu tidak dianjurkan - dokumen seperti itu dianggap salah - standar mengharuskan pembaca untuk mencoba menampilkan konten. Di sinilah kesulitan muncul, karena dalam setiap aplikasi proses "spekulasi" dilaksanakan dengan caranya sendiri. Selain itu, pada saat itu, perangkat dan aplikasi yang tersedia di pasar untuk membaca memahami satu atau dua format khusus. Jika buku itu dalam satu format, harus diformat ulang untuk membacanya. FictionBook2 , atau FB2, yang mengambil alih "combing" utama dari teks dan konversi, dipanggil untuk menyelesaikan semua kekurangan ini.

Perhatikan bahwa format memiliki versi pertama - FictionBook1 - namun, itu hanya bersifat percobaan, tidak bertahan lama, hari ini tidak didukung dan tidak memiliki kompatibilitas ke belakang. Oleh karena itu, FictionBook paling sering berarti "pengikut" - format FB2.

FB2 diciptakan oleh sekelompok pengembang yang dipimpin oleh Dmitry Gribov , yang merupakan direktur teknis liter, dan Mikhail Matsnev, pencipta pembaca Haali Reader. Formatnya didasarkan pada XML, yang lebih ketat dari HTML, mengatur pekerjaan dengan tag terbuka dan bersarang. Dokumen XML disertai dengan skema XML. Skema XML adalah file khusus yang berisi semua tag dan menjelaskan aturan untuk aplikasi mereka (urutan, bersarang, wajib dan opsional, dll.). Di FictionBook, skema ada di file FictionBook2.xsd. Anda dapat menemukan contoh skema XML di tautan (ini digunakan oleh toko buku elektronik liter).

Struktur Dokumen FB2


Teks dalam dokumen disimpan dalam tag khusus - elemen jenis paragraf: <p>, <v> dan <subtitle>. Ada juga elemen <empty-line> yang tidak memiliki konten dan digunakan untuk memasukkan celah.

Semua dokumen dimulai dengan tag root <fictionbook>, di bawahnya <stylesheet>, <description>, <body> dan <binary> dapat muncul.

Tag <stylesheet> berisi style sheet untuk memfasilitasi konversi ke format lain. <binary> berisi data yang disandikan base64 yang mungkin diperlukan untuk membuat dokumen.

Elemen <description> berisi semua informasi yang diperlukan tentang buku: genre karya, daftar penulis (F. I. O., alamat email dan situs web di Internet), judul, blokir dengan kata kunci, anotasi. Mungkin juga berisi informasi tentang perubahan dokumen dan informasi tentang penerbit buku, jika diterbitkan di atas kertas.

Inilah bagian dari blok <description> dalam entri FictionBook untuk Studi Arthur Conan Doyle di Scarlet yang diambil dari Proyek Gutenberg :

<?xml version="1.0" encoding="iso-8859-1"?> <FictionBook xmlns:xlink="http://www.w3.org/1999/xlink" xmlns="http://www.gribuser.ru/xml/fictionbook/2.0"> <description> <title-info> <genre match="100">detective</genre> <author> <first-name>Arthur</first-name> <middle-name>Conan</middle-name> <last-name>Doyle</last-name> </author> <book-title>A Study in Scarlet</book-title> <annotation> </annotation> <date value="1887-01-01">1887</date> </title-info> </description> 

Komponen utama dari dokumen FictionBook adalah <body>. Ini berisi teks dari buku itu sendiri. Mungkin ada beberapa tag ini di seluruh dokumen - blok tambahan digunakan untuk menyimpan catatan kaki, komentar, dan catatan.

FictionBook juga menyediakan beberapa tag untuk bekerja dengan hyperlink. Mereka didasarkan pada spesifikasi XLink yang dikembangkan oleh konsorsium W3C khusus untuk membuat tautan antara berbagai sumber daya dalam dokumen XML.

Keuntungan format


Standar FB2 hanya mencakup set tag minimal yang diperlukan (cukup untuk "desain" fiksi), yang menyederhanakan pemrosesannya oleh pembaca. Selain itu, dalam hal operasi langsung pembaca dengan format FB, pengguna mendapat kesempatan untuk mengkonfigurasi hampir semua parameter tampilan untuk dirinya sendiri.

Struktur dokumen yang ketat memungkinkan Anda untuk mengotomatiskan proses konversi dari format FB ke yang lain. Struktur yang sama memungkinkan untuk bekerja dengan elemen individual dokumen - menyesuaikan filter oleh penulis buku, judul, genre, dll. Karena alasan ini, format FB2 telah mendapatkan popularitas di RuNet, menjadi standar standar di perpustakaan elektronik Rusia dan perpustakaan negara-negara CIS.

Format kerugian


Kesederhanaan format FB2 adalah kelebihan dan kekurangan pada saat yang sama. Ini membatasi fungsionalitas untuk penyusunan huruf teks yang kompleks (misalnya, catatan pinggir). Tidak memiliki grafik vektor atau dukungan untuk daftar bernomor. Karena alasan ini, formatnya tidak sesuai untuk buku teks, buku referensi, dan literatur teknis (nama formatnya bahkan berbicara tentang ini - buku fiksi, atau "buku seni").

Pada saat yang sama, untuk menampilkan informasi minimal tentang buku - judul, penulis, dan sampul - program perlu memproses hampir seluruh dokumen XML. Ini disebabkan oleh fakta bahwa metadata terletak di awal teks, dan gambar di bagian akhir.

FB3 - pengembangan format


Karena meningkatnya persyaratan untuk memformat teks buku (dan untuk mengimbangi beberapa kekurangan FB2), Gribov mulai bekerja pada format FB3. Kemudian pengembangan berhenti, tetapi pada tahun 2014 dilanjutkan .

Menurut penulis, mereka mempelajari kebutuhan nyata dalam penerbitan literatur teknis, melihat buku pelajaran, buku referensi, buku pedoman dan menguraikan satu set tag yang lebih spesifik yang akan memungkinkan setiap buku ditampilkan.

Dalam spesifikasi baru, format Buku Fiksi adalah arsip zip tempat metadata, gambar, dan teks disimpan dalam file terpisah. Persyaratan untuk format file zip dan perjanjian pada organisasinya ditentukan dalam standar ECMA-376 yang mendefinisikan Open XML.

Sejumlah perbaikan terkait dengan pemformatan (pemakaian, menggarisbawahi) dibuat dan objek baru ditambahkan - "blok" - yang membentuk fragmen buku yang sewenang-wenang dalam bentuk segi empat dan dapat disematkan dalam teks dengan aliran di sekitarnya. Ada dukungan untuk daftar bernomor dan berpoin.

FB3 didistribusikan di bawah lisensi gratis dan memiliki kode sumber terbuka, sehingga semua utilitas tersedia untuk penerbit dan pengguna: konverter, editor cloud, dan pembaca. Versi format, pembaca , dan editor saat ini dapat ditemukan di repositori proyek di GitHub.

Secara umum, FictionBook3 masih kurang tersebar luas daripada kakaknya, namun, beberapa perpustakaan elektronik sudah menawarkan buku dalam format ini. Dan dalam liter beberapa tahun yang lalu mereka mengumumkan niat mereka untuk mentransfer seluruh katalog mereka ke format baru. Beberapa pembaca sudah mendukung semua fungsi FB3 yang diperlukan. Misalnya, semua model pembaca ONYX modern, misalnya, Darwin 3 atau Cleopatra 3 , dapat bekerja dengan format ini “out of the box”.


/ ONYX BOOX Cleopatra 3

Distribusi yang lebih luas dari FictionBook3 akan memungkinkan Anda untuk membuat ekosistem yang berfokus pada kerja penuh dan efektif dengan teks pada perangkat apa pun dengan sumber daya terbatas: layar hitam dan putih atau kecil, memori rendah, dll. Menurut pengembang, sekali buku tata letak akan paling nyaman di lingkungan apa pun.



NB Kami berikan beberapa ulasan kepada pembaca ONYX BOOX:

Source: https://habr.com/ru/post/id411755/


All Articles