电脑写散文,但不如人。 怎么了



两年前,在一次日本文学比赛中,我几乎赢得了一个由人工智能编写的故事。 它被称为“计算机写小说的日子”。 即使这听起来像是一个愚蠢的笑话,“赚一百万美元的最佳方法是写一本书,如何赚一百万美元”,但故事还是到了结局,绕开了人们写的大约一千五百篇文字。 但是突破没有发生。 小说文本仍然是由人撰写的,非小说文本仍然是由人撰写的。

几个月前,Menototek试图让一位AI助手进行写作,并与他合作编写一个故事。 剧透-他没有成功。 该项目的创建者告诉我们这个主意是什么以及如何实现。 我们试图弄清楚为什么诗人比散文作家更好地摆脱汽车。

我了解您不了解,我们也不了解任何内容


今年夏天,Sistema基金会举办了一场科幻短篇小说比赛“未来时间”。 参与者被问到“永生”的话题,获胜者被保证要获得稳定的头奖,奖金为五十万卢布。 数千个故事被发送给组织者,其中一个故事是使用人工智能编写的。


人工智能在短篇小说中表现最好-诗歌,明智的语录,动机和模因。 但是,并非总是一切都按预期进行。 例如, InspiroBot创建激励性海报,将文字放入奇怪的甚至是令人毛骨悚然的事物中。

这个故事叫做“青蛙展开翅膀” 。 这是一个关于工程师女孩Fotino的故事,他是计算机朋克黑色英雄英雄般的绅士风范的拥有者:吸毒,黑暗的过去,精神错位,自杀倾向以及对世界虚幻本质的无休止反思。 在迷幻之旅之间,Fotino试图修复运行城市的AI。
这不是一个完全由AI编写的故事,只有在他的参与下才能写。 实验是不使用特殊程序创建文本,而是将几个代码块拧在一起,最初是为了解决其他问题。

该系统使用了自己设计的库,该库又使用了Pytorch。 对话框是由以前开发的聊天机器人编写的,用于标题和描述-一个非常大的循环网络,接受了从lib.ru下载的文本的培训。

  • Meanotek首席执行官Denis Tarasov( Durham )。

写作最重要的方面-思想和情节-仍然由人承担。 据丹尼斯说,他们试图创建一种仅对作者有用而对他不起作用的工具。
与AI的对话完全由系统生成,并以接收对话的形式保留。 角色之间的对话部分生成,并且粗糙程度在那里得到消除。 从“我了解您不了解,我们什么都不了解”等短语中删除了重播。 尽管仍保留了一定比例的此类表达。 子标题也全部生成。 我们试图纠正拼写和语法,但添加的错误可能比纠正的更多。

  • Meanotek首席执行官Denis Tarasov( Durham )。

在最后的文本中,很难确定机器和人工文本的数量。 根据丹尼斯(Denis)的说法,有些段落中一个句子是由一个人组成的,第二个句子是一种算法。 如果没有AI标题和“种子”,就不会在故事中出现一系列情节。 总的来说,AI片段的风格影响着人们的写作风格。”

这部作品提醒人们,如果有人称呼它,那就是意识的某种扩展。 写完一个句子或一段之后,一个人不仅转向他的想象力,而且看起来还根据他的话语生成了计算机。 丹尼斯说:“这名男子试图适应所产生的东西,并在可能的情况下将它们放在一起进行有意义的绘制。”



但是,日本同事的成功失败了。 这个故事甚至没有引起人们的关注。 陪审团成员尼古拉·科诺诺夫(Nikolai V. Kononov)这样写道“青蛙”:
编辑者的手太引人注目-通常是人的手。 机器人开发人员与算法合作编写了一个故事,该故事不太可能引起小说读者的拒绝。 从这个意义上说,实验是成功的。

丹尼斯说:“今天大多数人喜欢的不一定是高质量的故事。文本的质量仍然可以提高,但是主要问题是缺乏情节。 事实证明,文本的各个部分甚至可能包含含义,但它们没有开始和结束,也没有共同的想法。 只是正在发生某事,某人正在做某事,在讲话,而它并没有以任何事情结尾。”

但是您不明白自己将要解决一个问题,该问题将使您提出一些建议


当“机器人”一词首次出现时,它已经在哲学问题“将人造人视为人是公平的”的语境中使用。 这是KarelapekRUR的作品。任何单词都是思想,含义以及其背后的语境。 作家首先以一种很好的方式找到思想和含义,然后为它们选择字母。

尽管如此,这些单词本身仅是白色背景上的墨水或像素花体。



机器文本的最大问题是该过程正朝着相反的方向发展。 系统从较大的单词集中选择一小部分单词,然后一个人(阅读)试图在其中找到含义,并反复遍历这些单词,直到找到他认为有意义的单词为止。
到目前为止,计算机已经很熟练地学习诗歌。 这可以在botpoet.com网站上看到,该网站上进行了一项测试,清楚地表明,很难将“人类”诗人与计算机区分开。 但是反过来说,读者会想到很多逻辑上的联系。 在散文中(尤其是在情节中),它通常更为明显,而计算机在此方面的表现仍然很差。 神经网络通常由一个或另一位作者对一系列作品进行训练,但是它们只能产生外观相似的文本,也就是说,它们模仿样式,但不会创造新的故事。

  • 亚历山大·派珀斯基( apiperski ),语言学家。


Yandex的员工创建了一个神经网络,该神经网络接受了一系列俄罗斯诗歌的培训,然后提供了民防文献并以Yegor Letov的风格发行了诗歌。 他们还录制了音乐专辑“ 404”,并将乐队称为“神经防御”

如何正式安排地块是一个长期的研究课题。 在IT鼎盛时期之前,研究人员手动搜索了数千种文本,以寻找通用模式。 最著名的例子之一是约瑟夫·坎贝尔(Joseph Campbell)的著作《千面英雄》。 这是一种推论一种一般结构,一系列情况的尝试,这种结构在大多数人的神话中或多或少相似。 弗拉基米尔·普罗普(Vladimir Propp)从事类似的工作。 在《童话的形态》一书中,他试图描述民间传说故事的一般组成部分。

根据这些知识,人们被教导人们做故事。 对情节形式的研究落入有关写作和编剧的书籍中,并在其中转变为具体的说明。 例如,编剧布莱克·斯奈德(Blake Snyder)在《救救猫》一书中描述了一部好电影的清晰结构,他将必要的绘图功能分配到时间和页数上。

但是,人们的指示尚未变成汽车的指示。
理解文本的情节结构和情节曲折更加困难,因为从一开始,最好是就我们如何正式呈现它们然后再思考如何从文本中提取它们达成共识。 作家教科书中的指示可能会以规则的形式放入车中,并带有一些随机填充的变量(例如,以便从欧洲首都的列表中选择行动城市),但这很难使我们更接近于创作原创故事。 我认为到目前为止,可以教一台计算机来分析特定的新文本是更接近成功的文本还是不成功的旧文本,并为作者提供一些建议,但仅此而已。

  • 亚历山大·派珀斯基( apiperski ),语言学家。

Denis Tarasov说:“目前,人工智能无法评估故事的质量,因为从原则上讲,质量标准尚不明确。” 但是,如果将质量与成功等同起来非常不礼貌,那么AI可以胜任。

去年,《畅销书密码》问世,编剧乔迪·阿彻(Jodi Archer)和马修·乔克斯(Matthew Jokers)试图描述成功书籍之间的相似之处。 他们将书籍的文本输入到基于机器学习的计算机系统上(尽管该机器没有描述),将它们与商业成功进行比较,并列举了可以促成这一成功的模式-主题,设置,英雄特征以及改变状态的顺序。
派生一个主题并不难:为此,有一些算法可以提取关键词,以构建频率词典,并查看在该语言中发现的单词比平均单词更常见。 没错,为了学习如何将关键字转换为主题,我们仍然必须尝试:例如,如果我们知道在文本中发现“亲吻”,“嫩”,“夜”和“丁香”的频率异常高,一种将这些词简化为“爱”主题的算法。 或者,您可以按主题(“爱”,“冒险”)将文本预先分类,然后解决对新文本进行分类的问题-例如,在新闻聚合商中,您需要了解文本是否涉及经济,政治等。总的来说,这个任务似乎可以解决。

英雄的特征也得到很好的分析。 数字人文科学做了很多工作,这通常转向数字文学研究。 例如,该地区的经典作品Franco Moretti是自动构建的,然后分析了Hamlet角色之间的联系网络 。 以俄罗斯资料为例,由高等经济学院的弗兰克·菲舍尔(Frank Fischer)组成的小组对此进行了处理,该小组由俄罗斯话剧RusDraCor组成

  • 亚历山大·派珀斯基( apiperski ),语言学家。


产生这样的故事不是一个大的科学问题。 互联网上有基于此原理的故事生成器,甚至还有故事生成器,您可以在其中选择参数并获取不同质量的文本。 这是要解决的所有任务,只需要花费时间和精力。

首先,将生成一系列顶级事件,然后每个事件将展开直到达到句子和字母的级别。 或者,通常,您可以“重写”一个受欢迎的故事,在此处更改详细信息,现在就可以准备新的受欢迎的故事。

  • Meanotek首席执行官Denis Tarasov( Durham )。

您需要做您不知道的事吗?


另一个问题是这是否有意义。 当人们尝试实现自动化和机器人化的繁重生产时,目标很明确-在许多行业中,人们的身体能力早已达到极限。 书面上没有这样的问题-这些问题与实际的劳动强度相差甚远。

相反,读者更多地抱怨任何试图使写作自动化以使其达到通用模式和模式的尝试。 例如,在观看电影时,如果每次在明确的分钟发生一次已知的情节扭曲,人们就更可能会感到失望。 在昂贵的商业电影院中,这种情况越来越多地发生,但是似乎我们不认为这是戏剧艺术中令人难以置信的突破。


我认为,文献中的这种系统会造成极大的危害,因为它将传播各种文学垃圾,并根据读者的要求对其进行优化。 这种垃圾在没有发电机的情况下是完美产生的,而有了发电机,根本没有东西可以呼吸。 要写一个好的故事,您需要从一个好的角度理解人际关系的复杂性,了解生物学,物理学等等,而不仅仅是增加能引起读者特定情感反应的单词链。

任何简单的算法都无法解决这个问题。 我们需要一个人的才能和知识水平,以及一个杰出的人。 人工智能本身应该能够建立世界模型,并具有预测各种事件结果的能力,这是一个目前尚未解决的问题,科学才刚刚开始接近它。

因此,我们在实验中的方向是尝试将AI和人结合起来。

  • Meanotek首席执行官Denis Tarasov( Durham )。

一方面,自动化确实可以破坏文学。 另一方面,如果人工智能只是想像力的扩展,如果它提供了作者本人从未发明过的东西,那么计算机可以真正摆脱个人和全球性创意危机。

Source: https://habr.com/ru/post/zh-CN430116/


All Articles