神经网络学会了通过封面来判断一本书

持久的表达方式“不要凭封面判断书”警告不要仅凭外观来评价某人或某人。但是,当读者看到这本书时,一切都是一样的:相识通常始于封面。是她留下了内容的第一印象,并开始在一个人的脑海中绘制历史。好的掩盖只是要进行判断。

人们几乎不用看书的视觉设计就可以很好地定义流派。同意只看封面就可以选择食谱,传记或指南,这非常容易。然后出现一个有趣的问题:人工智能能否像人一样成功地通过书的封面判断一本书?

日本九州大学的科学家试图得到 答案他们放在了卷积神经网络(CNN)研究书籍封面并确定与它们相关的类别的任务。培训的方法非常简单:研究人员从Amazon.com下载了超过1.35万份封面,以及书名,作者的名字和体裁。除了定义类别之外,该数据集在将来还可用于训练神经网络来识别和分析字体以及解决其他设计问题。在他们的实验中,科学家仅使用流派,而从集合中丢弃所有其他数据。神经网络可理解20种类型。如果将这本书同时在几个类别中重复,科学家只是简单地指出了第一本书。



然后,研究小组使用了80%的数据集来训练神经网络,以根据封面图像识别流派。他们在实验中使用的神经网络由四层组成,每层中有512个神经元。他们一起学习了确定封面设计和风格之间的相关性。数据集的另外10%用于检查网络。在最后阶段,剩余的10%用于确定网络对陌生图像的分类程度。

结果非常有趣。该算法正确地确定了40%的情况下最常遇到的三种类型。对于所有其他类型,准确性约为20%。这比意外事故要好得多。神经网络的相对正确的操作表明,按封面分类书籍是一项真实的任务,尽管很困难。

已证明某些类型比其他类型更容易识别。例如,旅行书或有关计算机和技术的书相对容易定义,因为设计师通常使用含义相似的封面图像。此外,科学家发现,如果在设计中使用照片,则神经网络可以轻松识别食谱。



但是,神经网络开始怀疑它是否值得出现在厨师照片或与烹饪间接相关的其他物体的封面上。

传记和回忆录在神经网络中也造成了困难:很多时候这类书籍被送往历史类别。有趣的是,对于许多此类书籍而言,历史被证明是Amazon.com上的次要类型。因此,不能说该算法是100%错误的。



CNN还把儿童读物与漫画和图画小说相混淆,而医学书籍与数学教科书相混淆。考虑到这些类别之间的某些相似性,这不足为奇。该网络还被本质上不同但设计相似的法律和宗教书籍所误解。通常,它们的封面是用一种没有任何图纸的颜色制作的,或者是用抽象图像制作的。

日本科学家提出的工作有一个重大缺陷。他们没有将神经网络的性能与人们通过掩护识别类型的能力进行比较。这将是一个有趣的实验,通过众包在线平台可以很容易地进行组织。并且,在进行该实验之前,我们将不知道人工智能是否比人更能胜任这项任务。但是尽管有这种令人讨厌的遗漏,无论我们如何通过封面定义流派,汽车一天都将能够更快地做到这一点。这只是时间问题。

但是,这项研究的结果值得注意。它可以帮助设计师提高书籍封面的技能。您甚至可以进一步讲授设计封面的技术,而无需人工干预。将来,这可能意味着由人创建封面设计是另一个将进入历史档案的任务。

相对而言,图形设计已成为机器学习的对象。在神经网络的实际应用中,最著名的经验首先与对著名画家作品的艺术风格的认可及其进一步的转移有关。到其他图像。九州大学的研究人员追求了类似的目标,但走得更远:他们试图揭示设计风格背后的隐藏含义。如果我们谈论分类,已经有尝试教神经网络按类型对音乐图片文本进行分类

科学工作发表在arXiv.org(ArXiv:1610.09204 [cs.CV])

Source: https://habr.com/ru/post/zh-CN398965/


All Articles