«Typographie numérique» ou mon expérience dans la numérisation mobile de livres

Aimez-vous les livres comme je les aime ...


L'enfance et la jeunesse passaient dans une petite ville, où, dans la bibliothèque du district des encyclopédies, il n'y avait que le «grand dictionnaire encyclopédique» habitué à une attitude prudente, presque respectueuse envers tout livre technique. Je comprends pourquoi les personnes qui ont survécu au blocus ont gardé un approvisionnement en nourriture à la maison tout le temps. Au début, ayant toujours eu accès à un Internet plus ou moins haut débit, je voulais télécharger de nouveaux livres et les sauvegarder sur votre disque dur, sauvegarder, sauvegarder :). Puis twirpx est apparu et j'ai réalisé que les livres, comme la connaissance, doivent participer à un cycle constant, sinon ils sont morts. Cela valait la peine de scanner la monographie de son superviseur et d'entendre des dizaines de critiques téléchargées, car l'avalanche ne pouvait pas être arrêtée. J'ai remarqué qu'aujourd'hui, après avoir partagé un livre rare, demain je verrai deux, sinon trois, livres rares que d'autres ont partagés.


image

Pendant les années étudiantes, en raison d'une spécialisation assez étroite, la bibliothèque était presque la résidence secondaire. Mais la bibliothèque, comme d'habitude, la discorde et toutes autres choses étant égales, est beaucoup plus pratique pour lire (ainsi que reconnaître et copier immédiatement le terme) des pages, bien que numériques, mais assis à la maison. Par conséquent, au début, il y avait un scanner à plat Mystek BearPaw2400, mince, alimenté par USB, mais terriblement lent. Avec une diminution du coût des appareils photo numériques (et une augmentation de la résolution), il a été remplacé par l'excellent appareil photo Canon PowerShot A720IS rapide (à mon humble avis, l'un des meilleurs de la gamme PowerShot). C'est avec son aide que j'ai ressenti toute la puissance de la stabilisation optique :). Le problème de la vitesse de numérisation a été résolu, mais par souci de précipitation, la qualité a souffert. Afin de ne pas marcher cinquante fois et de ne pas prendre de photos de gâté / surexposé / sous-exposé, etc. pages, il a été décidé de résoudre les problèmes par programme.


L'expérience acquise à la suite de la recherche (et des dizaines de livres numérisés) a abouti à toute une série d'articles consacrés aux caractéristiques du traitement de la matière première du livre et de son affinement à l'état d'une «bonne copie djvu». Y compris la raison de l'écriture étaient des questions d'amis et de connaissances "mais comment faire du djvu en général, ils m'ont donné un bon livre pendant quelques jours." Vous trouverez ci-dessous des liens au cas où:


  • "Typographie" numérique. Réservez en 5 minutes. Partie 1 , partie 2
  • "Typographie" numérique Un guide étape par étape pour numériser des livres. Partie 1 , partie 2 , partie 3
  • "Typographie" numérique. Appareil photo au lieu de scanner Article

La passion pour la numérisation est arrivée à un moment où twirpx commençait à peine à se remplir et avaxhome fonctionnait bien . Après avoir scanné une cinquantaine de livres, les algorithmes ont progressivement commencé à se cristalliser, ce qui permettrait d'obtenir du matériel pratique pour la lecture sur une tablette 10 "(sans oublier l'écran d'ordinateur) d'une qualité suffisamment élevée et en même temps de gagner du temps sur le traitement d'un livre.


Honnêtement, à plusieurs reprises, je voulais vraiment faire un vrai scanner de livres, tel que décrit sur Habré ( Scanner de livres de mes propres mains ), ou mieux encore comme j'ai fait un grand-père allemand cool ( partie vidéo 1 , partie 2 , partie 3 ). Mais les pensées sur les produits faits maison sont visitées quand il y a beaucoup de temps libre pour réfléchir (à la fois le matériel et les outils, etc., etc.). Le plus souvent, ce n'est pas à portée de main, mais un livre est nécessaire. Et urgemment nécessaire, et même dans une qualité acceptable.


Par conséquent, depuis un certain temps, j'utilise un simple complexe matériel-logiciel qui me permet de créer des copies de livres de haute qualité en peu de temps. Par exemple, il faut environ une heure pour traiter un livre de 300 pages (à partir de la photographie et se terminant par le codage en djvu) à l'aide d'un PC basé sur AMD Athlon II X4 640/16 Go de RAM / 4 To SATA 3.0 HDD.



La même chose, mais filmée sous un angle différent :)

Les articles suivants sont inclus dans l'ensemble de fer à repasser pour homme d'une imprimante numérique mobile:


1) Smartphone Nokia PureView 808
2) Pince de trépied mobile
3) Support pour smartphone
4) Télécommande Bluetooth Coco CC-PC101


Le smartphone de Nokia est sélectionné pour sa fiabilité et sa taille de matrice maximale. Eh bien, je l'aime beaucoup :) (et sur Habré ils ont chanté des louanges ). Parmi les lacunes, on peut noter que, contrairement aux smartphones Android, j'ai dû chercher pendant longtemps une télécommande adaptée qui fonctionnerait avec mon téléphone. Au final, je me suis installé sur Coco CC-PC101 . De plus, cette télécommande ne fonctionne qu'avec CameraPro (l'application standard ne la prend pas). Lorsque vous utilisez Android, toute télécommande penny avec Aliexpress convient.



Le principe des «petits livres-trépied inférieurs» fonctionne


La barre mobile avec laquelle vous pouvez régler la hauteur du smartphone au-dessus du livre est une auto-adhésive ordinaire, mais avec la présence d'un filetage standard 1/4 "en bas pour visser sur une pince / tout autre rack. Il existe de nombreuses options sur aliexpress, j'ai un prix / paramètres comme " monopode pour GoPro Hero 5 4 3 "



Le support pour smartphone est également le premier à être équipé de fils 1/4 ", pas le moins cher (contrairement aux options de fil), mais j'ai aimé ma forme. Et jusqu'à présent, il n'y a pas de problème avec.


Pince pour trépied - UTM LSNH de fabrication soviétique. Du duralumin pur, un vrai bonheur pour l'ingénieur, enfin, juste un outil très fiable avec de nombreux réglages.


image

Mon smartphone est assez lourd, + le poids de la tige télescopique, donc je ne fais pas confiance aux pinces chinoises en plastique. Mais ils ont un endroit où aller.


Addition : Lors de la photographie de livres n / b sur le terrain, l'éclairage est un facteur très important. Le naturel (la lumière dans la bibliothèque) ne suffit souvent pas. Les lampes photo portables avec aliexpress peuvent aider à résoudre ce problème:



Parmi les avantages, il y a un poids léger et un sabot intégré avec filetage 1/4 "pour le montage sur un trépied standard. Vous pouvez prendre plusieurs de ces lampes et les placer autour du sujet pour créer un éclairage uniforme. Pour rendre les lampes plus faciles à fixer, vous pouvez acheter des clips photo en plus d'eux avec montage 1/4 "sur le même aliexpress:



Le processus de photographie lui-même n'est pas particulièrement difficile. Le livre est positionné de manière à tomber dans la mise au point de l'appareil photo et à l'aide de la télécommande se concentre / prend la photo. Pages tournées - "mise au point / prise de vue". En même temps, j'essaie d'organiser le livre de manière à ce que tous les bords soient visibles (cela est nécessaire pour égaliser le pliage des pages dans ScanTailor). Quelques éloges à son sujet. Auparavant, je devais utiliser soit plutôt capricieux (souvent planté avec une erreur) et le programme payant BookRestorer, soit le ScanKromsator "à la langue" (même si je suis plus que sûr qu'il aura ses fans :)). Mais Dieu merci ScanTailor est apparu et la vie de ces "imprimantes" comme moi a été grandement simplifiée. Voici ce que Wikipedia en dit:


Scan Tailor (eng. Scan - scan, tailor - tailor) - un programme informatique pour le traitement d'images obtenues à l'aide d'un scanner. Il s'agit d'un programme multiplateforme et fonctionne sur les systèmes d'exploitation Microsoft Windows, Linux et Mac OS X. Un niveau élevé du programme a été noté à la suite des résultats du premier concours «Meilleur projet russe gratuit» en 2009, organisé par le magazine Linux Format.
Le principal avantage du programme est le recadrage automatique, le nettoyage et le redressement des lignes. De plus, le lissage fonctionne sur le même principe que le "robot de numérisation de livres" japonais sur lequel ils ont écrit sur Habré (un scanner japonais numérise le livre à 250 pages par minute ). Je me permets un extrait de cet article:
Un livre ouvert est photographié à l'aide de lasers (ils forment une grille à la surface). Dans le même temps, la photographie est effectuée immédiatement sous plusieurs angles, après quoi les trois cadres sont automatiquement fusionnés. Les développeurs affirment que leur méthode évite les distorsions qui se produisent généralement avec le scan standard.
. Le même principe est utilisé dans ScanTailor, seule la disposition de la grille sur la page est réglée par l'utilisateur. J'aligne la grille sur les bords des pages (pour cela, elles doivent être visibles lors de la prise de vue).



Exemple de page sans redresser les lignes

Exemple de page utilisant l'alignement des lignes

Après la fin du programme dans le dossier de sortie, les pages seront terminées. Nous les chargeons dans n'importe quel convertisseur DJVU (vous pouvez choisir sur le site ). J'utilise DEE - Document Express Editor v6.0.1 Build 1320 LE (pour NT) (Light Edition pour NT) pour sa petite taille et son travail rapide. En principe, après DEE, un livre peut être jeté sur votre lecteur / smartphone préféré et utilisé conformément à sa destination. Si le temps et l'effort le permettent, vous pouvez ajouter une couche OCR et une table des matières. Ces procédures sont décrites en détail dans mon article, auquel j'ai fait référence au début de l'article.

J'espère que mon expérience sera utile à tous ceux qui photographient des livres au téléphone, puis les lisent à partir des photos de la galerie :)


PS: Il y avait un article sur Habré ( Numérisation du patrimoine mondial du livre à l'aide de smartphones ). Où:
Litaru a effectué plusieurs tests et a découvert que de cette façon, un utilisateur, après s'être adapté, pourra numériser un livre de 600 pages en cinq à dix minutes. En 2004, pour son travail de diplôme, il a lui-même numérisé manuellement trente mille pages de documents à partir de plus de sept cents documents à l'aide d'un appareil photo numérique ordinaire et d'une lampe de table bon marché. Litaru a réalisé la plupart de ces travaux en quinze heures au cours d'un week-end.
Alors ceci, cher Kalev Litar, si vous lisez le Habr - écrivez-moi, je conseillerai peut-être quoi :)

Important! Toutes les mises à jour et notes provisoires à partir desquelles les habr-articles sont correctement formés peuvent maintenant être vues dans mon laboratoire de télégramme66. Abonnez-vous pour ne pas vous attendre au prochain article, mais pour être immédiatement au courant de toutes les recherches :)

Source: https://habr.com/ru/post/fr425113/


All Articles