Libros electrónicos y sus formatos: DjVu: su historia, pros, contras y características

A principios de los años 70, el escritor estadounidense Michael Hart (Michael Hart) pudo obtener acceso ilimitado a una computadora Xerox Sigma 5, instalada en la Universidad de Illinois. Para utilizar adecuadamente los recursos de la máquina, decidió crear el primer libro electrónico, reimprimiendo la Declaración de Independencia de los Estados Unidos.

Hoy en día, la literatura digital se ha generalizado, en gran parte debido al desarrollo de dispositivos portátiles (teléfonos inteligentes, lectores, computadoras portátiles). Esto ha llevado a la aparición de una gran cantidad de formatos de libros electrónicos. Intentemos comprender sus características y contar la historia de las más populares: comencemos con el formato DjVu.


/ Flickr / Lane Pearman / cc

La aparición del formato.


DjVu fue desarrollado en 1996 por AT&T Labs con un objetivo: proporcionar a los desarrolladores web una herramienta para distribuir imágenes de alta resolución a través de Internet.

El hecho es que en ese momento el 90% de toda la información todavía se almacenaba en papel, y muchos de los documentos importantes tenían imágenes y fotografías en color. Para preservar la legibilidad del texto y la calidad de las imágenes, era necesario realizar escaneos en alta resolución.

Los formatos web clásicos (JPEG, GIF y PNG) permiten trabajar con tales imágenes, pero a costa del volumen. En el caso de JPEG, para que el texto se lea en la pantalla del monitor, tuve que escanear un documento con una resolución de 300 ppp. La página en color de la revista al mismo tiempo ocupaba unos 500 KB. La descarga de archivos de este tamaño de Internet en ese momento era un proceso bastante lento.

La alternativa era digitalizar documentos en papel utilizando tecnologías de reconocimiento de texto, pero hace 20 años su precisión estaba lejos de ser ideal: después del procesamiento, el resultado final tuvo que ser editado seriamente de forma manual. Al mismo tiempo, los gráficos e imágenes permanecieron "al agua". E incluso si fuera posible incrustar la imagen escaneada en un documento de texto, se perdieron algunos detalles visuales, por ejemplo, el color del papel, su textura, y estos son componentes importantes de los documentos históricos.

Para resolver estos problemas, AT&T desarrolló DjVu. Permitía comprimir documentos en color escaneados con una resolución de 300 ppp a 40-60 Kb, con un tamaño original de 25 MB. DjVu redujo el tamaño de las páginas en blanco y negro a 10-30 KB.

Cómo DjVu comprime los documentos


DjVu puede trabajar con documentos escaneados en papel y otros formatos digitales, como PDF. La base de DjVu es la tecnología que divide la imagen en tres componentes: primer plano, fondo y máscara en blanco y negro (bit).

La máscara se guarda con la resolución del archivo fuente y contiene la imagen del texto y otros detalles claros, líneas finas y esquemas, así como imágenes contrastantes.

Tiene una resolución de 300 ppp para que las líneas finas y los contornos de las letras permanezcan claros, y se comprime utilizando el algoritmo JB2, que es una variación del algoritmo JBIG2 propuesto por AT&T para enviar faxes. Una característica de JB2 es que busca caracteres duplicados en la página y guarda su imagen solo una vez. Por lo tanto, en documentos de varias páginas, cada pocas páginas consecutivas utilizan un "diccionario" común.

El fondo contiene la textura de la página y la ilustración, y su resolución es menor que la de la máscara. El fondo sin pérdidas para la percepción se almacena con una resolución de 100 ppp.

El primer plano almacena información de color sobre la máscara, y su resolución generalmente disminuye aún más, ya que en la mayoría de los casos el color del texto es negro e igual para el mismo carácter de impresión. La compresión Wavelet se usa para comprimir el primer plano y el fondo.

El último paso para crear un documento DjVu es la codificación de entropía, cuando un codificador aritmético adaptativo convierte secuencias de caracteres idénticos en un valor binario.

Ventajas del formato


La tarea de DjVu era preservar las "propiedades" de un documento en papel en forma digital, permitiendo que incluso las computadoras débiles trabajen con dichos documentos. Por lo tanto, el software para ver archivos DjVu tiene la capacidad de "renderizar rápidamente". Gracias a ello, solo la parte de la página de DjVu que debe mostrarse en la pantalla se carga en la memoria.

También permite ver archivos "subdescargados", es decir, páginas individuales de un documento DjVu de varias páginas. En este caso, la representación progresiva de los detalles de la imagen se utiliza cuando los componentes parecen "aparecer" a medida que se carga el archivo (como en JPEG).

Hace 20 años, cuando se introdujo este formato, la página se cargó en tres etapas: primero se cargó el componente de texto, después de un par de segundos se cargaron las primeras versiones de las imágenes y el fondo. Después de que "apareció" toda la página del libro.

La presencia de una estructura de tres niveles también le permite buscar libros escaneados (ya que hay una capa de texto especial). Esto resultó conveniente cuando se trabaja con literatura técnica y libros de referencia, por lo que DjVu se convirtió en la base de varias bibliotecas de libros científicos. Por ejemplo, en 2002, fue elegido por Internet Archive como uno de los formatos (junto con TIFF y PDF) para un proyecto para guardar libros escaneados de fuentes abiertas.

Desventajas de formato


Sin embargo, como todas las tecnologías, DjVu tiene sus inconvenientes. Por ejemplo, al codificar escaneos de libros en el formato DjVu, algunos caracteres en el documento pueden ser reemplazados por otros que se parecen. La mayoría de las veces esto sucede con las letras "y" y "n", por lo que este problema se llama "problema yin". No depende del idioma del texto y afecta, entre otros, los números y otros caracteres pequeños que se repiten.

Su causa son los errores de clasificación de caracteres en el codificador JB2. Él "divide" los escaneos en grupos de 10–20 piezas y forma un diccionario de caracteres comunes para cada grupo. El diccionario contiene muestras de letras y números comunes con páginas y las coordenadas de su apariencia. Cuando explora un libro de DjVu, los símbolos del diccionario se sustituyen en los lugares correctos.

Esto le permite reducir el tamaño del archivo DjVu, sin embargo, si la visualización de las dos letras es visualmente similar, el codificador puede mezclarlas o tomarlas por el mismo. A veces esto lleva a dañar las fórmulas en un documento técnico. Para resolver este problema, puede abandonar los algoritmos de compresión, pero esto aumentará el tamaño de la copia digital del libro.

Otra desventaja del formato es que no es compatible de manera predeterminada en muchos sistemas operativos modernos (incluidos los móviles). Por lo tanto, para trabajar con él, debe instalar programas de terceros, como DjVuReader, WinDjView, Evince, etc. Sin embargo, me gustaría señalar que algunos lectores electrónicos (por ejemplo, ONYX BOOX) admiten el formato DjVu "listo para usar", ya que las aplicaciones necesarias ya están allí. instalado

Por cierto, podemos hablar sobre qué más pueden hacer las aplicaciones para lectores basados ​​en Android en uno de los materiales anteriores.


Lector ONYX BOOX Chronos

Otro problema de formato se manifiesta al trabajar con documentos DjVu en pantallas pequeñas de dispositivos móviles: teléfonos inteligentes, tabletas, lectores. A veces, los archivos DjVu se presentan en forma de escaneado de libros, y la literatura profesional y los documentos de trabajo a menudo están en formato A4, por lo que debe "mover" la imagen en busca de información.

Sin embargo, notamos que este problema también es solucionable. La forma más fácil, por supuesto, es buscar un documento en un formato diferente, pero si esta opción no es posible (por ejemplo, necesita trabajar con mucha literatura técnica en DjVu), puede usar lectores electrónicos con una gran diagonal de 9.7 a 13.3 pulgadas, que especialmente "afilado" para trabajar con documentos similares.

Por ejemplo, en la línea ONYX BOOX, tales dispositivos son Chronos y MAX 2 (por cierto, hemos preparado una revisión de este modelo del lector, y pronto lo publicaremos en nuestro blog), así como Note , que tiene una pantalla E Ink Mobius Carta con una diagonal de 10.3 pulgadas y mayor resolución. Dichos dispositivos le permiten considerar con seguridad todos los detalles de las ilustraciones en su tamaño original y son adecuados para aquellos que a menudo tienen que leer literatura educativa o técnica. Para ver archivos DjVu y PDF , se utiliza NEO Reader, que le permite ajustar el contraste y el grosor de las fuentes digitalizadas.

A pesar de las deficiencias del formato, hoy DjVu sigue siendo uno de los formatos más populares para la "preservación" de las obras literarias. Esto se debe en gran parte al hecho de que es abierto, y las tecnologías y desarrollos modernos permiten sortear algunas de sus limitaciones tecnológicas.

En los siguientes materiales continuaremos la historia sobre la historia de la aparición de formatos de libros electrónicos y las características de su trabajo.



Extracciones múltiples del lector de ONYX BOOX de PS:

Source: https://habr.com/ru/post/es411545/


All Articles