"Tipografia digital" ou minha experiência em digitalização móvel de livros

Você gosta de livros do jeito que eu os amo ...


Infância e juventude passados ​​em uma cidade pequena, onde na biblioteca distrital das enciclopédias havia apenas o "Grande Dicionário Enciclopédico" acostumado a uma atitude cuidadosa, quase reverente, de qualquer livro técnico. Entendo por que as pessoas que sobreviveram ao bloqueio mantiveram um suprimento de comida em casa o tempo todo. No começo, tendo acesso a uma Internet mais ou menos de alta velocidade o tempo todo, eu queria baixar novos livros e salvá-los no seu disco rígido, salvar, salvar :). Então twirpx apareceu e eu percebi que os livros, como o conhecimento, devem participar de um ciclo constante, caso contrário, eles estão mortos. Vale a pena digitalizar a monografia de seu supervisor e ouvir dezenas de resenhas baixadas, pois a avalanche não pode ser interrompida. Notei que hoje, depois de compartilhar um livro raro, amanhã verei dois, se não três, livros raros que outros compartilharam.


imagem

Durante os anos estudantis, devido a uma especialização bastante estreita, a biblioteca era quase o segundo lar. Mas a biblioteca, como sempre, discórdia e outras coisas são iguais, é muito mais conveniente para ler (além de reconhecer e copiar imediatamente o termo) páginas, embora digitais, mas sentadas em casa. Portanto, a princípio, havia um scanner de mesa Mystek BearPaw2400, fino, alimentado por USB, mas terrivelmente lento. Com uma diminuição no custo das câmeras digitais (e um aumento na resolução), ela foi substituída pela excelente e rápida câmera Canon PowerShot A720IS (IMHO, uma das melhores da linha PowerShot). Foi com a ajuda dele que senti todo o poder da estabilização óptica :). O problema com a velocidade da digitalização foi resolvido, mas por uma questão de pressa, a qualidade sofreu. Para não andar cinquenta vezes e não tirar fotos de mimadas / superexpostas / subexpostas, etc. páginas, foi decidido resolver os problemas programaticamente.


A experiência obtida como resultado da pesquisa (e dezenas de livros digitalizados) resultou em toda uma série de artigos dedicados aos recursos de processamento de material de livro-prima e ajustando-o ao estado de uma "boa cópia de djvu". Incluindo o motivo da escrita, havia perguntas de amigos e conhecidos ", mas como fazer djvu em geral, eles me deram um bom livro por alguns dias". Abaixo estão apenas os links:


  • "Tipografia" digital. Reserve em 5 minutos. Parte 1 , Parte 2
  • "Tipografia digital" Um guia passo a passo para digitalizar livros. Parte 1 , Parte 2 , Parte 3
  • "Tipografia" digital. Câmera em vez de scanner Artigo

A paixão pela digitalização chegou no momento em que o twirpx estava começando a encher e o avaxhome funcionou bem . Depois de digitalizar cerca de cinquenta livros, os algoritmos começaram a se cristalizar gradualmente, o que tornaria possível obter material conveniente para leitura em um tablet de 10 "(para não mencionar o monitor do computador) de qualidade suficientemente alta e, ao mesmo tempo, economizar tempo gasto no processamento de um livro.


Honestamente, várias vezes eu realmente queria criar um scanner de livros real, como o descrito em Habré ( scanner de livros com minhas próprias mãos ), ou melhor ainda, como fiz com um avô alemão legal (vídeo parte 1 , parte 2 , parte 3 ). Mas pensamentos sobre produtos caseiros são visitados quando há muito tempo livre para pensar (material e ferramenta, etc., etc.). Na maioria das vezes, isso não está à mão, mas é necessário um livro. E urgentemente necessário, e mesmo em uma qualidade aceitável.


Portanto, há algum tempo eu uso um complexo simples de hardware e software que me permite criar cópias de livros de alta qualidade em pouco tempo. Por exemplo, leva cerca de uma hora para processar um livro de 300 páginas (começando de fotografar e terminando com codificação em djvu) usando um PC baseado no disco rígido AMD Athlon II X4 640/16 Gb RAM / 4 Tb SATA 3.0.



A mesma coisa, mas filmado de um ângulo diferente :)

Os seguintes itens estão incluídos no conjunto de ferro para cavalheiro de uma impressora digital móvel:


1) Smartphone Nokia PureView 808
2) Braçadeira de tripé móvel
3) montagem para smartphone
4) Controle remoto Bluetooth Coco CC-PC101


O smartphone da Nokia é selecionado por sua confiabilidade e tamanho máximo da matriz. Bem, eu o amo muito :) (e em Habré eles cantaram louvores ). Entre as deficiências, pode-se notar que, ao contrário dos smartphones Android, eu tive que procurar por um controle remoto adequado por um longo tempo que funcionasse com o meu telefone. No final, eu decidi pelo Coco CC-PC101 . Além disso, este controle remoto funciona apenas com o CameraPro (o aplicativo padrão não o atende). Ao usar o Android, qualquer penny remote com Aliexpress é adequado.



O princípio de 'menor livro-tripé menor' funciona


A barra móvel, com a qual você pode ajustar a altura do smartphone em relação ao livro, é uma pega autoadesiva comum , mas com uma rosca padrão de 1/4 "na parte inferior para parafusar um grampo / qualquer outro rack. Existem muitas opções no aliexpress, o preço é de / parâmetros como " monopé para GoPro Hero 5 4 3 "



O suporte para smartphone também é o primeiro a ser fornecido com roscas de 1/4 ", não o mais barato (ao contrário das opções de cabos), mas gostei da minha forma. E até agora não há problemas com isso.


Braçadeira para tripé - UTM LSNH de fabricação soviética. Duralumínio puro, uma verdadeira alegria para o engenheiro, bem, apenas uma ferramenta muito confiável com muitos ajustes.


imagem

Meu smartphone é bastante pesado, + o peso da haste telescópica, por isso não confio nos grampos chineses de plástico. Mas eles têm um lugar para estar.


Além disso : ao fotografar livros em preto e branco no campo, a iluminação é um fator muito importante. Natural (luz na biblioteca) geralmente não é suficiente. As lâmpadas de foto portáteis com aliexpress podem ajudar a resolver este problema:



Entre as vantagens estão o peso leve e um sapato embutido com rosca de 1/4 "para montagem em um tripé padrão. Você pode pegar várias dessas lâmpadas e colocá-las ao redor do objeto para criar uma iluminação uniforme. Para tornar as lâmpadas mais convenientes de instalar, você pode adquirir clipes de fotos além deles com montagem de 1/4 "no mesmo aliexpress:



O processo de fotografia em si não é particularmente difícil. O livro está posicionado de forma a cair no foco da câmera e usar o controle remoto focaliza / dispara. Páginas viradas - "foco / fotografia". Ao mesmo tempo, tento organizar o livro para que todas as bordas fiquem visíveis (isso é necessário para nivelar a dobra das páginas no ScanTailor). Algumas palavras de elogio sobre ela. Anteriormente, eu tinha que usar um tanto caprichoso (geralmente travava com um erro) e o programa pago BookRestorer ou o ScanKromsator "atolado" (embora eu tenha mais certeza de que ele terá seus fãs :)). Mas graças a Deus o ScanTailor apareceu e a vida de tais "impressoras" como eu foi bastante simplificada. Aqui está o que a Wikipedia diz sobre isso:


Scan Tailor (por. Scan - scan, tailor - tailor) - um programa de computador para processar imagens obtidas usando um scanner. É um programa de plataforma cruzada e roda nos sistemas operacionais Microsoft Windows, Linux e Mac OS X. Um alto nível do programa foi observado após os resultados do primeiro concurso "Melhor Projeto Gratuito da Rússia" em 2009, realizado pela revista Linux Format
A principal vantagem do programa é o corte, limpeza e alisamento automático de linhas. Além disso, a correção funciona com o mesmo princípio do "robô para digitalizar livros" sobre o qual eles escreveram no Habré (o scanner japonês digitaliza o livro a 250 páginas por minuto ). Permito-me um trecho deste artigo:
Um livro aberto é fotografado usando lasers (eles formam uma grade na superfície). Ao mesmo tempo, a fotografia é realizada imediatamente de vários ângulos, após o que os três quadros são automaticamente mesclados. Os desenvolvedores afirmam que seu método evita as distorções que geralmente ocorrem com a varredura padrão.
. O mesmo princípio é usado no ScanTailor, apenas o layout da grade na página é regulado pelo usuário. Alinhei a grade com as bordas das páginas (para isso, elas devem estar visíveis ao fotografar).



Página de exemplo sem endireitar linhas

Página de exemplo usando alinhamento de linha

Após o final do programa na pasta out serão finalizadas as páginas. Nós os carregamos em qualquer conversor DJVU (você pode escolher no site ). Uso o DEE - Document Express Editor v6.0.1 Build 1320 LE (para NT) (Light Edition para NT) por seu tamanho pequeno e trabalho rápido. Em princípio, após o DEE, um livro pode ser jogado no seu leitor / smartphone favorito e usado para a finalidade a que se destina. Se o tempo e o esforço permitirem, você pode adicionar uma camada e um índice de OCR. Esses procedimentos são descritos em detalhes no meu artigo, ao qual me referi no início do artigo.

Espero que minha experiência seja útil para todos aqueles que fotografam livros por telefone e depois os leem das fotos da galeria :)


PS: Havia um artigo sobre Habré ( digitalização do patrimônio mundial do livro usando smartphones ). Onde:
Litaru realizou vários testes e descobriu que, dessa maneira, um usuário, após se adaptar, poderá digitalizar um livro de 600 páginas em cinco a dez minutos. Em 2004, por seu diploma, ele próprio digitalizou manualmente trinta mil páginas de materiais de mais de setecentos documentos usando uma câmera digital comum e uma lâmpada de mesa barata. Litaru concluiu a maior parte desse trabalho em quinze horas em um fim de semana.
Então, querido Kalev Litar, se você ler o Habr - escreva para mim, talvez eu recomende o que :)

Importante! Todas as atualizações e notas provisórias a partir das quais os artigos de habr são formados sem problemas podem agora ser vistas no meu laboratório de canais de telegrama66. Assine para não esperar o próximo artigo, mas para saber imediatamente sobre toda a pesquisa :)

Source: https://habr.com/ru/post/pt425113/


All Articles