电子书及其格式:谈论EPUB-历史,利弊

在博客的前面,我们写了DjVuFB2电子书格式的出现方式。

今天的文章主题是EPUB。


图片: 内森·奥克利Nathan Oakley) / CC BY

格式记录


在90年代,专有解决方案主导了电子书市场。 许多阅读器制造商都有自己的格式。 例如,NuvoMedia使用扩展名为.rb的文件。 这些是带有HTML文件和包含元数据的.info文件的容器。 这种情况使出版商的工作变得复杂-他们不得不分别为每种格式排版书籍。 NuvoMedia和SoftBook Press已经提到了Microsoft的一组工程师来处理这种情况。

那时,微软将征服电子书市场,并正在开发Windows 95的阅读器应用程序。可以说,创建新格式是IT巨头业务战略的一部分。

如果我们谈论NuvoMedia,则该公司被视为第一批大众电子阅读器Rocket eBook的制造商。 设备的内部存储器只有8兆字节,电池寿命不超过40小时。 至于SoftBook Press,他们还开发了电子阅读器。 但是他们的设备具有独特的功能-内置调制解调器-它使您可以直接从SoftBookstore商店下载数字文学。

在2000年代初期,NuvoMedia和SoftBook这两家公司被Gemstar媒体公司收购,并合并为Gemstar电子书集团。 该组织已经销售了几年的读者(例如, RCA REB 1100 )和数字书籍,但在2003年停业

但是回到单一标准的制定。 1999年,Microsoft,NuvoMedia和SoftBook Press成立了“开放电子书论坛”,其中包括起草标志着EPUB诞生的文档草案。 最初,该标准称为 OEBPS(代表开放式电子书出版结构)。 它允许在单个文件(ZIP存档)中分发数字出版物,并简化了不同硬件平台之间的书籍传输。

后来,Adobe,IBM,HP,诺基亚,施乐以及出版商McGraw Hill和Time Warner加入了开放电子书论坛。 他们一起继续开发OEBPS,并整体发展了数字文学生态系统。 在2005年,该组织改名为国际数字出版物论坛( IDPF)

2007年,IDPF将OEBPS格式的名称更改为EPUB,并开始开发其第二版。 她于2010年被介绍给公众。 新颖之处几乎与以前的没什么不同,但是得到了对矢量图形和嵌入式字体的支持。

到这个时候,EPUB征服了市场,并成为许多电子产品发行商和制造商的默认标准。 该格式已经被O'Reilly和Cisco Press使用,并且得到了Apple,Sony,Barnes&Noble和ONYX BOOX设备的支持。

2009年,Google图书项目宣布了对EPUB的支持-它被用来分发超过一百万本免费图书。 这种格式开始在作家中流行。 2011年,琼·罗琳(Joan Rowling) 谈论了启动Pottermore网站的计划 ,并使其成为Potteriana图书的唯一数字销售点。

选择EPUB作为分发文献的标准,主要是因为它具有实现复制保护( DRM )的能力。 作者在线商店中的所有书籍仍然仅以这种格式提供

EPUB格式的第三版于2011年发布。 开发人员增加了使用音频和视频文件以及脚注的功能。 如今,标准在不断发展-在2017年IDPF 甚至加入了W3C联盟,该联盟实现了万维网的技术标准。

EPUB如何运作?


EPUB格式的书籍是ZIP档案。 它以XHTML或HTML页面或PDF文件的形式存储出版物文本。 存档中还包含媒体内容(音频,视频或图像),字体和元数据。 它还可能包含带有CSS或PLS样式文档的其他文件,以及有关语音生成服务的信息。

XML标记负责显示内容。 带有内置音频和图像的书的片段可能看起来像这样

<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops" xmlns:ev="http://www.w3.org/2001/xml-events" epub:prefix="media: http://idpf.org/epub/vocab/media/#"> <head> <meta charset="utf-8" /> <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" /> </head> <body> <section class="base"> <h1>the entire transcript</h1> <audio id="bgsound" epub:type="media:soundtrack media:background" src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop=""> <div class="errmsg"> <p>Your Reading System does not support (this) audio</p> </div> </audio> <p>What does it mean to be human if we don't have a shared culture? What does a shared culture mean if we can't share it? It's only in the last 100, or 150 years or so, that we started tightly restricting how that culture gets used.</p> <img class="left" src="../images/326261902_3fa36f548d.jpg" alt="child against a wall" /> </section> </body> </html> 

除内容文件外,存档还包含一个特殊的导航文档(Navigation Document)。 它描述了一本书中文本和图像的布局。 如果阅读器想要“跳过”几页,则阅读器应用程序可以访问它。

存档中的另一个必需文件是包。 它包括元数据-有关作者,发布者,语言,标题等的信息。 它还包括书中各部分的内容。 可以在GitHub的IDPF存储库中找到打包文档的示例。

优势优势


该格式的优点是其灵活性。 EPUB允许您创建适应设备屏幕尺寸的文档动态布局。 这是该格式支持大量阅读器(和其他电子设备)的主要原因之一。 例如,所有ONYX BOOX阅读器都可以从EPUB“开箱即用”地工作:从基础和6英寸的Caesar 3到高级和9.7英寸的Euclid


/ ONYX BOOX凯撒3

由于该格式基于流行标准(XML),因此很容易转换以在Internet上阅读。 EPUB还支持交互元素。 是的,它们是PDF中的相似元素,但是您只能使用专有软件将它们添加到PDF文档中。 就EPUB而言,它们可以在任何文本编辑器中通过标记和XML标签添加到书中。

EPUB的其他优势是针对视力障碍或阅读障碍者的功能。 该标准允许您修改屏幕上文本的显示-例如,突出显示某些字母组合。

正如我们已经指出的,EPUB还使发布者能够设置复制保护。 如果需要,电子书的卖方可以使用其机制来限制对文档的访问。 为此,请修改存档中的right.xml文件。

缺点


要创建EPUB发布,您需要了解XML,XHTML和CSS的语法。 同时,您必须使用大量的标识符标签。 为了进行比较,同一FB2标准仅包含最少必需的标签集-足以进行小说排版。 创建PDF文档完全不需要专门的知识-专门的软件负责一切。

EPUB还因漫画和其他带有许多插图的书籍设计的复杂性而受到批评。 在这种情况下,发布者必须为每个图像创建具有固定坐标的静态布局-这会花费大量时间和精力。

接下来是什么


IDPF目前正在为该格式制定新的规范。 例如,其中之一将帮助创建带有隐藏部分的交互式教程。 对于老师和学生来说,同一本书看起来会有所不同-例如,在第二种情况下,测试或控制问题的答案将被隐藏。


图片: Guian Bolisay / CC BY-SA

新功能有望帮助重新组织教育过程。 如今,大型大学(例如牛津大学)已经非常积极地使用EPUB。 几年前,他们在其数字图书馆应用程序中增加了对 EPUB 3.0的支持。

IDPF还创建了用于在EPUB中嵌入“开放注释”脚注的规范。 该标准是在2013年W3C上开发的-它简化了复杂类型的注释的工作。 例如,在其帮助下,您可以在JPEG图像的特定部分添加注释。 此外,该标准实现了一种机制,用于同步一个EPUB文档的副本之间的注释中的更改。 现在可以将开放注释格式注释添加到EPUB文件中,但是尚未采用针对它们的正式规范。

该标准的新版本-E​​PUB 3.2的工作也在进行中。 WOFF 2.0SFNT格式将出现在其中,用于压缩字体(在某些情况下,它们可以将文件大小减少30%)。 同样,开发人员将替换一些过时的HTML属性。 例如,代替用于激活音频和视频文件的单独触发元素,新标准将具有本机HTML音频和视频元素。

W3C GitHub存储库已经提供了规范草案和更改列表



ONYX-BOOX读者评论:

Source: https://habr.com/ru/post/zh-CN456958/


All Articles