“数字印刷术”或我在书籍移动数字化方面的经验

你喜欢我爱书的方式吗...


童年和青年时代在一个小镇上度过,在该地区的百科全书库中,只有“大百科全书词典”习惯于对任何技术书籍都采取谨慎,几乎崇敬的态度。 我理解为什么在封锁中幸存下来的人总是在家里供应食物。 刚开始时,一直想访问或多或少的高速互联网,所以我想下载新书并将它们保存到硬盘上,然后保存:)。 然后出现了twirpx ,我意识到书本和知识一样,必须参与一个恒定的周期,否则它们就死了。 值得一次浏览主管的专着并听到数十条评论下载,因为雪崩无法停止。 我注意到今天分享了一本稀有的书,明天我将看到其他人分享的两本(如果不是三本)稀有书。


图片

在学生时代,由于专业范围狭窄,图书馆几乎是第二故乡。 但是,与往常一样,不和谐和其他条件相同时,图书馆更方便阅读(以及识别并立即复制到该术语)页面,尽管这些页面是数字的,但是却坐在家里。 因此,起初有一台Mystek BearPaw2400平板扫描仪,它很薄,由USB驱动,但是速度很慢。 随着数码相机成本的降低(以及分辨率的提高),它被性能卓越的佳能PowerShot A720IS快速相机(IMHO,PowerShot系列中最好的相机之一)取代。 在他的帮助下,我感受到了光学稳定的全部力量:)。 扫描速度的问题已解决,但为了仓促行事,质量受到影响。 为了不走五十次,也不要给变质/曝光过度/曝光不足等拍照。 页面,因此决定以编程方式解决问题。


通过研究(以及数十本扫描的书)获得的经验导致了一系列有关处理原始书材料并将其微调到“好djvu副本”状态的文章。 包括写作原因在内的都是朋友和熟人的问题,“但是一般来说,如何做djvu,他们给了我一本好书几天。” 以下是为防万一的链接:



twirpx刚开始写满并且avaxhome正常工作时就出现了对扫描的热情。 扫描了大约50本书之后,算法逐渐开始具体化,这将有可能获得便于在足够高质量的10英寸平板电脑(更不用说计算机监视器)上阅读的材料,同时节省处理一本书的时间。


老实说,有几次我真的想制作一个真正的书本扫描仪,例如在Habré上描述( 用我自己的手的书本扫描仪 ),或者甚至更好,例如我做一个酷酷的德国祖父(视频第1 部分第2 部分第3部分 )。 但是,如果有很多空闲时间(包括材料,工具等),可以访问有关自制产品的想法。 大多数情况下,这不是手头的,但是需要一本书。 并且迫切需要,甚至可以接受的质量。


因此,一段时间以来,我一直在使用简单的硬件-软件组合,使我可以在短时间内创建相当高质量的书籍副本。 例如,使用基于AMD Athlon II X4 640/16 Gb RAM / 4 Tb SATA 3.0 HDD的PC处理一本300页的书(从拍照开始,以djvu编码结束)大约需要一个小时。



同一件事,但从不同角度拍摄:)

便携式数码打印机的绅士套装中包括以下物品:


1)诺基亚PureView 808智能手机
2)可移动的三脚架夹
3)智能手机支架
4) Coco CC-PC101蓝牙遥控器


选择诺基亚的智能手机是因为其可靠性和最大的矩阵尺寸。 好吧,我非常爱他:)(在哈布雷(Habré)上他们赞美了 )。 在缺点中,应该指出的是,与Android智能手机不同,我不得不长时间寻找适合我的手机的合适遥控器。 最后,我选择了Coco CC-PC101 。 此外,此遥控器仅适用于CameraPro(标准应用程序不支持)。 当使用Android时,任何带有Aliexpress的便士遥控器都适用。



“小书架式三脚架较低”的原理


可移动的横杆,可以用来调节智能手机在书上的高度,它是一种常规的自粘式自粘杆 ,但底部有一个标准的1/4“螺纹,可用于拧到一个夹子/任何其他架子上。速卖通上有很多选件,我的价格为/参数,例如“ GoPro Hero 5 4 3的独脚架



智能手机支架也是第一个具有1/4“螺纹的支架,不是最便宜的(不同于电线选件),但我喜欢我的外形。到目前为止,它没有任何问题。


三脚架夹-苏联制造的UTM LSNH。 纯硬铝,对工程师来说真是一件乐事,只是一个经过很多调整的非常可靠的工具。


图片

我的智能手机很重,加上伸缩杆的重量,所以我不相信中国的塑料夹子。 但是他们有一个地方。


另外 :在野外拍摄黑白书籍时,照明是一个非常重要的因素。 自然(库中的光线)通常是不够的。 带有速卖通的便携式照相灯可以帮助解决此问题:



优点包括重量轻和带有1/4英寸螺纹的内置鞋垫,可安装在标准三脚架上。您可以将其中的几盏灯放置在照片对象周围以产生均匀的照明。要使灯安装起来更方便,您还可以购买照片夹在同一速卖通上使用1/4“支架:



拍摄过程本身并不特别困难。 本书的位置应使其落入相机的焦点并使用遥控器进行对焦/拍摄。 翻页-“对焦/拍摄”。 同时,我尝试对书籍进行排列,以使所有边缘都可见(这对于使ScanTailor中的页面弯曲均匀非常必要)。 赞美她几句话。 以前,我不得不使用反复无常(经常因错误而崩溃)和付费的BookRestorer程序,或者使用“ ton舌的” ScanKromsator(尽管我非常确定她会拥有她的粉丝:))。 但是谢天谢地,ScanTailor出现了,像我这样的“打印机”的生活大大简化了。 这是维基百科对此的评价:


扫描裁缝(英语:扫描裁缝-扫描,裁缝-裁缝)-一种计算机程序,用于处理使用扫描仪获取的图像。 它是一个跨平台程序,可在Microsoft Windows,Linux和Mac OS X操作系统上运行,在2009年由Linux Format杂志举办的第一届“俄罗斯最佳免费项目”竞赛的结果中得到了高度评​​价。
该程序的主要优点是自动修剪,清洁和拉直线条。 而且,校直的工作原理与他们在哈布雷(Habré)上写过的日本“书籍扫描机器人”的原理相同( 日本扫描仪以每分钟250页的速度对书籍进行数字化处理 )。 我允许自己摘录自这篇文章:
一本打开的书用激光照相(它们在表面形成网格)。 同时,立即从几个角度进行拍摄,然后自动合并所有三个帧。 开发人员声称,他们的方法避免了通常在标准扫描中出现的失真。
。 ScanTailor使用相同的原理,只有页面上网格的布局由用户控制。 我将网格与页面的边缘对齐(为此,在拍摄时它们应该可见)。



没有拉直线的示例页面

使用行对齐的示例页面

程序结束后,在out文件夹中将完成页面。 我们将它们加载到任何DJVU转换器中(您可以在站点上选择)。 我使用DEE -Document Express Editor v6.0.1 Build 1320 LE(用于NT)(用于Windows的Light Edition)是因为它的体积小且工作迅速。 原则上,在DEE之后,可以将一本书扔到您喜欢的阅读器/智能手机上,并用于预定目的。 如果时间和精力允许,则可以添加OCR层和目录。 这些过程在我的文章中有详细描述,我在本文的开头提到了这些过程。

我希望我的经验对所有在电话上拍照并从图库中的图片阅读的人有用:)


PS:有一篇关于Habré( 使用智能手机对世界图书遗产进行数字化 )的文章。 其中:
利塔鲁(Litaru)进行了几项测试,结果发现,以此方式适应的用户可以在五到十分钟内将一本600页的书籍数字化。 2004年,为了完成毕业文凭,他本人使用一台普通的数码相机和一台便宜的台灯,将700多个文档中的三万页材料手动数字化。 Litaru在一个周末的十五小时内完成了大部分工作。
因此,亲爱的Kalev Litar,如果您阅读了《哈伯尔》,请写信给我,也许我会建议您:)

重要! 现在可以在我的电报频道lab66中看到所有更新和临时注释,然后可以轻松地形成habr文章。 订阅以免期望下一篇文章,而立即了解所有研究信息:)

Source: https://habr.com/ru/post/zh-CN425113/


All Articles