在博客的前面,我们写了
DjVu和
FB2电子书格式的出现方式。
今天的文章主题是EPUB。
图片: 内森·奥克利 ( Nathan Oakley) / CC BY格式记录
在90年代,专有解决方案主导了电子书市场。 许多阅读器制造商都有自己的格式。 例如,NuvoMedia使用扩展名为.rb的文件。 这些是带有HTML文件和包含元数据的.info文件的容器。 这种情况使出版商的工作变得复杂-他们不得不分别为每种格式排版书籍。 NuvoMedia和SoftBook Press已经提到了Microsoft的一组工程师来处理这种情况。
那时,微软将征服电子书市场,并正在开发Windows 95的阅读器应用程序。可以说,创建新格式是IT巨头业务战略的一部分。
如果我们谈论NuvoMedia,则该公司被视为第一批大众电子阅读器
Rocket eBook的制造商。 设备的内部存储器只有8兆字节,电池寿命不超过40小时。 至于SoftBook Press,他们还开发了电子阅读器。 但是他们的设备具有独特的功能-内置调制解调器-它使您可以直接从SoftBookstore商店下载数字文学。
在2000年代初期,NuvoMedia和SoftBook这两家公司被Gemstar媒体公司收购,并合并为Gemstar电子书集团。 该组织已经销售了几年的读者(例如,
RCA REB 1100 )和数字书籍,但在2003年
停业 。
但是回到单一标准的制定。 1999年,Microsoft,NuvoMedia和SoftBook Press成立了“开放电子书论坛”,其中包括起草标志着EPUB诞生的文档草案。 最初,该标准
称为 OEBPS(代表开放式电子书出版结构)。 它允许在单个文件(ZIP存档)中分发数字出版物,并简化了不同硬件平台之间的书籍传输。
后来,Adobe,IBM,HP,诺基亚,施乐以及出版商McGraw Hill和Time Warner加入了开放电子书论坛。 他们一起继续开发OEBPS,并整体发展了数字文学生态系统。 在2005年,该组织改名为国际数字出版物论坛(
IDPF) 。
2007年,IDPF将OEBPS格式的名称更改为EPUB,并开始开发其第二版。 她于2010年被介绍给公众。 新颖之处几乎与以前的没什么不同,但是
得到了对矢量图形和嵌入式字体的支持。
到这个时候,EPUB征服了市场,并成为许多电子产品发行商和制造商的默认标准。 该格式已经被O'Reilly和Cisco Press使用,并且得到了Apple,Sony,Barnes&Noble和ONYX BOOX设备的支持。
2009年,Google图书项目
宣布了对EPUB的支持-它被用来分发超过一百万本免费图书。 这种格式开始在作家中流行。 2011年,琼·罗琳(Joan Rowling)
谈论了启动Pottermore网站的
计划 ,并使其成为Potteriana图书的唯一数字销售点。
选择EPUB作为分发文献的标准,主要是因为它具有实现复制保护(
DRM )的能力。 作者在线商店中的所有书籍仍然
仅以这种格式提供 。
EPUB格式的第三版于2011年发布。 开发人员增加了使用音频和视频文件以及脚注的功能。 如今,标准在不断发展-在2017年IDPF
甚至加入了W3C联盟,该联盟实现了万维网的技术标准。
EPUB如何运作?
EPUB格式的书籍是ZIP档案。 它以XHTML或HTML页面或PDF文件的形式存储出版物文本。 存档中还包含媒体内容(音频,视频或图像),字体和元数据。 它还可能包含带有CSS或
PLS样式文档的其他文件,以及有关语音生成服务的信息。
XML标记负责显示内容。 带有内置音频和图像的书的片段
可能看起来像这样 :
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops" xmlns:ev="http://www.w3.org/2001/xml-events" epub:prefix="media: http://idpf.org/epub/vocab/media/#"> <head> <meta charset="utf-8" /> <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" /> </head> <body> <section class="base"> <h1>the entire transcript</h1> <audio id="bgsound" epub:type="media:soundtrack media:background" src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop=""> <div class="errmsg"> <p>Your Reading System does not support (this) audio</p> </div> </audio> <p>What does it mean to be human if we don't have a shared culture? What does a shared culture mean if we can't share it? It's only in the last 100, or 150 years or so, that we started tightly restricting how that culture gets used.</p> <img class="left" src="../images/326261902_3fa36f548d.jpg" alt="child against a wall" /> </section> </body> </html>
除内容文件外,存档还包含一个特殊的导航文档(Navigation Document)。 它描述了一本书中文本和图像的布局。 如果阅读器想要“跳过”几页,则阅读器应用程序可以访问它。
存档中的另一个必需文件是包。 它包括元数据-有关作者,发布者,语言,标题等的信息。 它还包括书中各部分的内容。 可以
在GitHub的IDPF存储库中找到打包文档的示例。
优势优势
该格式的优点是其灵活性。 EPUB允许您创建适应设备屏幕尺寸的文档动态布局。 这是该格式支持大量阅读器(和其他电子设备)的主要原因之一。 例如,所有ONYX BOOX阅读器都可以从EPUB“开箱即用”地工作:从基础和6英寸的
Caesar 3到高级和9.7英寸的
Euclid 。
/ ONYX BOOX凯撒3由于该格式基于流行标准(XML),因此很容易转换以在Internet上阅读。 EPUB还支持交互元素。 是的,它们是PDF中的相似元素,但是您只能使用专有软件将它们添加到PDF文档中。 就EPUB而言,它们可以在任何文本编辑器中通过标记和XML标签添加到书中。
EPUB的其他优势是针对视力障碍或阅读障碍者的功能。 该标准允许您修改屏幕上文本的显示-例如,突出显示某些字母组合。
正如我们已经指出的,EPUB还使发布者能够设置复制保护。 如果需要,电子书的卖方
可以使用其机制来限制对文档的访问。 为此,请修改存档中的right.xml文件。
缺点
要创建EPUB发布,您需要了解XML,XHTML和CSS的语法。 同时,您必须使用大量的标识符标签。 为了进行比较,同一
FB2标准仅包含最少必需的标签集-足以进行小说排版。 创建
PDF文档完全不需要专门的知识-专门的软件负责一切。
EPUB还因漫画和其他带有许多插图的书籍设计的复杂性而受到批评。 在这种情况下,发布者必须为每个图像创建具有固定坐标的静态布局-这会花费大量时间和精力。
接下来是什么
IDPF目前正在为该格式制定新的规范。 例如,其中之一将帮助创建
带有隐藏部分的交互式教程。 对于老师和学生来说,同一本书看起来会有所不同-例如,在第二种情况下,测试或控制问题的答案将被隐藏。
图片: Guian Bolisay / CC BY-SA新功能有望帮助重新组织教育过程。 如今,大型大学(例如牛津大学)已经非常积极地使用EPUB。 几年前,他们在其数字图书馆应用程序中增加了对 EPUB 3.0的支持。
IDPF还创建了用于在EPUB中嵌入“开放注释”脚注的规范。 该标准是在2013年W3C上开发的-它简化了复杂类型的注释的工作。 例如,在其帮助下,您可以在JPEG图像的特定部分添加注释。 此外,该标准
实现了一种机制,用于同步一个EPUB文档的副本之间的注释中的更改。 现在
可以将开放注释格式注释
添加到EPUB文件中,但是尚未采用针对它们的正式规范。
该标准的新版本-EPUB 3.2的工作也在进行中。
WOFF 2.0和
SFNT格式将出现在其中,用于压缩字体(在某些情况下,它们可以将文件大小减少30%)。 同样,开发人员将替换一些过时的HTML属性。 例如,代替用于激活音频和视频文件的单独触发元素,新标准将具有本机HTML音频和视频元素。
W3C GitHub存储库
中已经提供了
规范草案和
更改列表 。
ONYX-BOOX读者评论: