Digitalización del patrimonio mundial del libro utilizando teléfonos inteligentes
Hay más de dos mil quinientos millones de usuarios de teléfonos inteligentes en el planeta. Si cada uno de ellos digitalizara al menos un libro, solo necesitaríamos un día para todas las obras escritas. Kalev Litaru, especialista en sistemas de procesamiento de datos con veinte años de experiencia, ofrece una nueva forma de digitalizar libros basados en crowdsourcing y teléfonos inteligentes convencionales. En enero de 2015, un incendio dañó el 15% de los fondos.
Biblioteca científica de INION en Moscú. Luego se quemaron 2000 metros cuadrados y se derrumbó parte del techo. La biblioteca albergaba 14 millones de libros y documentos, incluidas ediciones raras de los siglos XVI y principios del XX. Según el director de la biblioteca, Yuri Pivovarov, casi no se asignó dinero para la digitalización. El problema de la digitalización completa de libros, documentos y manuscritos no se ha resuelto a nivel mundial, aunque hay proyectos que se ocupan de esto, y las bibliotecas en Rusia y otros países están tratando de convertir las copias existentes a formato digital.Para digitalizar libros con escáneres voluminosos que valen más de diez mil dólares. Para estos escáneres son operadores profesionales cuyo tiempo cuesta dinero. Los operadores pasan las páginas de un libro y el escáner fotografía dos páginas al mismo tiempo. La velocidad del trabajo suele ser de hasta quinientas páginas por hora, es decir, en una hora el empleado escaneará uno o dos libros.Kalev Litaru ofrece pedir ayuda a los entusiastas de todo el mundo con sus teléfonos inteligentes. Como ejemplo de la efectividad del crowdsourcing, habla sobre el proyecto eBird , que rastrea las migraciones de aves. En el transcurso de trece años, más de cien mil voluntarios han estado trabajando en este proyecto, lo que permitió registrar 275 millones de observaciones desde 2,87 millones de ubicaciones únicas. Ahora en la gente del planeta2.600 millones de teléfonos inteligentes , para 2020 su número aumentará a 6.100 millones, incluso debido a los países en desarrollo.
Los empleados de la compañía rusa "Elar" están trabajando en la digitalización de libros queLitar propone dividir el proyecto en dos partes. En la primera etapa, debe hacer una lista de libros para digitalizar. Para hacer esto, use el catálogo de WorldCat y otras herramientas: la lista inicial incluirá todos los libros que están en las bibliotecas y que no han sido digitalizados. Las copias frágiles y aquellos libros que están protegidos por derechos de autor serán excluidos de esta lista. La compilación de la lista se puede entregar parcialmente al crowdsourcing: las bibliotecas publicarán una lista de libros cuyo estado con respecto a la protección de los derechos de autor es desconocido, y los voluntarios revisarán las primeras páginas de los libros y enviarán esta información a las bibliotecas.Solo la primera etapa le permitirá comprender cuál es el porcentaje de libros digitalizados en el mundo. Según los propios datos de Google, la compañía ha digitalizado el 6% de todos los libros publicados en el marco del proyecto Ngram , pero se desconoce su lista exacta.Después de compilar una lista completa de obras no digitales, comienza la parte principal del proyecto de crowdsourcing. Los voluntarios irán a la biblioteca, tomarán un libro, obtendrán un teléfono inteligente y fotografiarán la portada. Reconocimiento óptico de caracteres como el de Google, determinará el autor y el título del libro y lo comparará con la lista en el servidor, después de lo cual le informará sobre la necesidad de digitalizar la copia o que este trabajo ya se ha realizado. Si se va a digitalizar el libro, el voluntario tomará una fotografía de las primeras páginas: en esta etapa, el sistema debe determinar cómo se obtienen fotografías de alta calidad, si todo está bien con la luz, si se pueden reconocer los caracteres o si las manos del fotógrafo tiemblan demasiado. Luego, el usuario recibe un comando para continuar trabajando o tomar otro libro.Litaru realizó varias pruebas y descubrió que de esta manera un usuario, habiéndose adaptado, podrá digitalizar un libro de 600 páginas en cinco a diez minutos. En 2004, para su trabajo de diploma, él mismo digitalizó manualmente treinta mil páginas de materiales de más de setecientos documentos usando una cámara digital ordinaria y una lámpara de mesa barata. Litaru completó la mayor parte de este trabajo en quince horas en un fin de semana.Las imágenes de los teléfonos inteligentes no serán de la misma calidad que se logra con tecnología profesional. Pero habrá suficiente para leerlos , y el sistema óptico de reconocimiento de caracteres hará que se pueda buscar el texto. Estas paginasFueron fotografiados hace diez años, y hoy los teléfonos inteligentes tienen mejores cámaras y flash LED.Las bibliotecas pueden permitir que los voluntarios utilicen escáneres de documentos disponibles en la institución para este trabajo. Todos los resultados se enviarán al servidor central del proyecto, donde se traducirán a PDF y otros formatos para leer libros electrónicos, y donde el texto se procesará y estará disponible para su búsqueda.El factor de gamificación se puede incluir en el proceso de digitalización. Los voluntarios recibirán puntos por trabajos digitalizados, y las organizaciones podrán organizar "días de digitalización" y dar regalos a los mejores participantes en el proyecto. Incluso los escolares pueden unirse al trabajo. Las bibliotecas recibirán comentarios de los usuarios sobre páginas mal digitalizadas. Los voluntarios se convertirán en algo así como editores de Wikipedia, y las bibliotecas coordinarán su trabajo.Wikipedia y otros proyectos de crowdsourcingHan demostrado su eficacia. Y el crowdsourcing puede mostrar una vez más su eficacia en la digitalización del patrimonio del libro, Kalev Litaru está seguro. En lugar de tomar selfies y fotos de comida en Instagram, los usuarios de dos mil quinientos millones de teléfonos inteligentes pueden ayudar a ahorrar muchos trabajos y crear una enorme base de datos de todos los libros publicados para dejarlos a nuestros descendientes. Source: https://habr.com/ru/post/es386581/
All Articles