No início do blog, escrevemos sobre como os formatos de e-book
DjVu e
FB2 apareceram.
O tópico do artigo de hoje é EPUB.
Imagem: Nathan Oakley / CC BYFormatar histórico
Nos anos 90, soluções proprietárias dominavam o mercado de livros eletrônicos. E muitos fabricantes de leitores têm seu próprio formato. Por exemplo, o NuvoMedia usou arquivos com a extensão .rb. Estes eram contêineres com um arquivo HTML e um arquivo .info contendo metadados. Esse estado de coisas complicou o trabalho dos editores - eles tiveram que escrever os livros para cada formato separadamente. Um grupo de engenheiros da Microsoft, já mencionado pela NuvoMedia e SoftBook Press, assumiu a situação.
Naquela época, a Microsoft conquistava o mercado de livros eletrônicos e desenvolvia um aplicativo de leitura para Windows 95. Podemos dizer que a criação de um novo formato fazia parte da estratégia de negócios da gigante de TI.
Se falamos sobre o NuvoMedia, essa empresa é considerada o fabricante do primeiro leitor eletrônico de massa
Rocket eBook . A memória interna do dispositivo era de apenas oito megabytes e a duração da bateria não excedeu 40 horas. Quanto à SoftBook Press, eles também desenvolveram leitores eletrônicos. Mas seus dispositivos tinham uma característica distinta - um modem embutido - que permitia o download de literatura digital diretamente da loja da SoftBookstore.
No início dos anos 2000, as duas empresas - NuvoMedia e SoftBook - foram compradas pela empresa de mídia Gemstar e incorporadas ao Gemstar eBook Group. Essa organização vende leitores há vários anos (por exemplo,
RCA REB 1100 ) e livros digitais, mas em 2003
saiu do negócio .
Mas voltando ao desenvolvimento de um único padrão. Em 1999, a Microsoft, NuvoMedia e SoftBook Press fundaram o Open eBook Forum, que incluiu o trabalho em um rascunho de documento que marcou o início do EPUB. Inicialmente, o padrão
foi chamado OEBPS (sigla para Open EBook Publication Structure). Permitiu distribuir uma publicação digital em um único arquivo (arquivo ZIP) e simplificou a transferência de livros entre diferentes plataformas de hardware.
Mais tarde, Adobe, IBM, HP, Nokia, Xerox e os editores McGraw Hill e Time Warner ingressaram no Open eBook Forum. Juntos, eles continuaram a desenvolver o OEBPS e desenvolveram o ecossistema da literatura digital como um todo. Em 2005, a organização foi renomeada para o Fórum Internacional de Publicações Digitais, ou
IDPF .
Em 2007, o IDPF mudou o nome do formato OEBPS para EPUB e começou a desenvolver sua segunda versão. Ela foi apresentada ao público em geral em 2010. A novidade quase não foi diferente de seu antecessor, mas
recebeu suporte para gráficos vetoriais e fontes incorporadas.
Nessa época, o EPUB havia conquistado o mercado e se tornado o padrão padrão para muitos editores e fabricantes de aparelhos eletrônicos. O formato já era usado pela O'Reilly e Cisco Press, além de ser suportado pela Apple, Sony, Barnes & Noble, dispositivos ONYX BOOX.
Em 2009, o projeto do Google Livros
anunciou o suporte ao EPUB - foi usado para distribuir mais de um milhão de livros gratuitos. O formato começou a ganhar popularidade entre os escritores. Em 2011, Joan Rowling
falou sobre planos para lançar o site Pottermore e torná-lo o único ponto de venda digital para livros Potteriana.
O EPUB foi escolhido como padrão para a distribuição de literatura, principalmente devido à sua capacidade de implementar proteção contra cópia (
DRM ). Todos os livros na loja online do escritor ainda estão
disponíveis apenas neste formato .
A terceira versão do formato EPUB foi lançada em 2011. Os desenvolvedores adicionaram a capacidade de trabalhar com arquivos de áudio e vídeo e notas de rodapé. Hoje, o padrão continua a evoluir - em 2017, o IDPF
chegou a se juntar ao consórcio W3C, que implementa padrões de tecnologia para a World Wide Web.
Como o EPUB funciona?
O livro no formato EPUB é um arquivo ZIP. Ele armazena o texto da publicação na forma de páginas XHTML ou HTML ou arquivos PDF. Também no arquivo está o conteúdo da mídia (áudio, vídeo ou imagens), fontes e metadados. Também pode conter arquivos adicionais com documentos no estilo CSS ou
PLS com informações para serviços de geração de fala.
A marcação XML é responsável pela exibição do conteúdo. Um fragmento de um livro com áudio e imagem integrados
pode ser assim :
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops" xmlns:ev="http://www.w3.org/2001/xml-events" epub:prefix="media: http://idpf.org/epub/vocab/media/#"> <head> <meta charset="utf-8" /> <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" /> </head> <body> <section class="base"> <h1>the entire transcript</h1> <audio id="bgsound" epub:type="media:soundtrack media:background" src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop=""> <div class="errmsg"> <p>Your Reading System does not support (this) audio</p> </div> </audio> <p>What does it mean to be human if we don't have a shared culture? What does a shared culture mean if we can't share it? It's only in the last 100, or 150 years or so, that we started tightly restricting how that culture gets used.</p> <img class="left" src="../images/326261902_3fa36f548d.jpg" alt="child against a wall" /> </section> </body> </html>
Além dos arquivos de conteúdo, o arquivo contém um documento de navegação especial (Documento de Navegação). Ele descreve o layout de texto e imagens em um livro. Os aplicativos do Reader acessam-no se o leitor quiser "pular" várias páginas.
Outro arquivo necessário no arquivo morto é o pacote. Inclui metadados - informações sobre o autor, editor, idioma, título e assim por diante. Ele também inclui uma coluna de subseções do livro. Um exemplo de documento de pacote pode ser encontrado
no repositório IDPF no GitHub .
Vantagens
A vantagem do formato é sua flexibilidade. O EPUB permite criar um layout dinâmico de um documento que se adapte ao tamanho da tela do dispositivo. Essa é uma das principais razões pelas quais o formato suporta um grande número de leitores (e outros dispositivos eletrônicos). Por exemplo, todos os leitores ONYX BOOX trabalham “fora da caixa” do EPUB: da base e do
Caesar 3 de 6 polegadas ao
Euclídeo premium e de 9,7 polegadas.
/ ONYX BOOX César 3Como o formato é baseado em padrões populares (XML), é fácil converter para leitura na Internet. O EPUB também suporta elementos interativos. Sim, eles são elementos semelhantes no PDF, mas você pode adicioná-los ao documento PDF apenas usando software proprietário. No caso do EPUB, eles são adicionados ao livro com marcações e tags XML em qualquer editor de texto.
Outros pontos fortes do EPUB são suas características para pessoas com problemas de visão ou dislexia. O padrão permite modificar a exibição do texto na tela - por exemplo, realce determinadas combinações de letras.
Além disso, o EPUB, como já observamos, permite ao editor definir a proteção contra cópia. Se desejado, os vendedores de livros eletrônicos
podem usar seus mecanismos para restringir o acesso ao documento. Para fazer isso, modifique o arquivo rights.xml no arquivo morto.
Desvantagens
Para criar uma publicação EPUB, você precisa entender a sintaxe de XML, XHTML e CSS. Ao mesmo tempo, você deve trabalhar com um grande número de identificadores. Para comparação, o mesmo
padrão FB2 inclui apenas o conjunto minimamente necessário de tags - suficiente para escrever ficção. E para criar
documentos PDF, não é necessário nenhum conhecimento especial - o software especializado é responsável por tudo.
O EPUB também é criticado pela complexidade do design de quadrinhos e outros livros com muitas ilustrações. Nesse caso, o editor precisa criar um layout estático com coordenadas fixas para cada imagem - isso pode levar muito tempo e esforço.
O que vem a seguir
O IDPF está atualmente trabalhando em novas especificações para o formato. Por exemplo, um deles ajudará a criar tutoriais interativos
com seções ocultas . O mesmo livro parecerá diferente para o professor e o aluno - no segundo caso, por exemplo, respostas a testes ou perguntas de controle serão ocultadas.
Imagem: Guian Bolisay / CC BY-SAEspera-se que o novo recurso ajude a reorganizar o processo educacional. Hoje, o EPUB é usado ativamente por grandes universidades, por exemplo, Universidade de Oxford. Alguns anos atrás, eles adicionaram o suporte ao EPUB 3.0 ao seu aplicativo de biblioteca digital.
O IDPF também cria uma especificação para incorporar notas de rodapé da Open Annotation no EPUB. Esse padrão foi desenvolvido no W3C em 2013 - simplifica o trabalho com tipos complexos de anotações. Por exemplo, com sua ajuda, você pode colocar uma nota em uma seção específica de uma imagem JPEG. Além disso, o padrão
implementa um mecanismo para sincronizar alterações nas anotações entre cópias de um documento EPUB. As notas no formato Open Annotation
podem ser adicionadas aos arquivos EPUB agora, no entanto, uma especificação formal para eles ainda não foi adotada.
Também está em andamento o trabalho em uma nova versão do padrão - EPUB 3.2.
Os formatos
WOFF 2.0 e
SFNT aparecerão nele, que são usados para compactar fontes (em alguns casos, eles podem reduzir o tamanho do arquivo em 30%). Além disso, os desenvolvedores substituirão alguns atributos HTML obsoletos. Por exemplo, em vez de um elemento acionador separado para ativar arquivos de áudio e vídeo, o novo padrão terá elementos de áudio e vídeo HTML nativos.
Um rascunho de
especificação e uma
lista de alterações já
estão disponíveis no repositório W3C GitHub.
Avaliações do ONYX-BOOX Reader: