解决理解人工智能环境问题的解决方案。第一部分



了解自然语言是AI的一项完整任务这种理解的一方面是理解上下文。在本文中,我将解释我们的思维所保留的上下文类型,它如何与一种上下文一起使用以及如何在人工智能技术中重新创建此过程。

奖杯不适合棕色手提箱,因为它太大了。
什么(小/大)?
答:手提箱/奖杯。
Winograd模式挑战

前面的文章中介绍了我们对人工智能的发展,我们所做的最新方法。让我提醒您,我们是通过直接复制人类心理的结构和过程来创建AI的。

两种背景


从上一篇文章的评论中,我们看到术语“上下文”用于描述非常不同的情况。我们考虑这个术语,将其分为两种类型。

第一种背景是涉及从该词组表达的概念引起的理解时。这些情况包括选择同音异义的一种含义,选择同义异义,选择一种含义的细微差别等。例如:“当她为切洋葱做洋葱时,她的眼睛是水汪汪的”和“现代射箭被分为几个方向”。一个在空中的人会理解何时涉及洋葱,植物以及关于洋葱的各种武器。

第二种类型的上下文是在需要理解时必须将某些类别单独选出来的类别,这些类别通常未在文本中表示或未特别突出显示。正是这一类别使我们能够制定某种“想法”,概括性地表达正在说的话。

例如,如果在列夫·托尔斯泰的书中碰到“他印了一封信...”这个短语,为了正确理解文本,您使用“ 19世纪”类别,并得出结论,这与打印机无关。这种上下文意味着,为了理解和解释文本,不仅可以分析整个文本,还可以分析与之关联的数据。

完全不同的思维过程可以解决与不同类型的上下文相关的问题。我们在AI开发中重复相同的部分。在解决第一类问题中,使用了一种基于知识存储特征的方法。在解决第二类问题时,实现了一种基于经验的更复杂的算法(在人工智能的情况下,我们正在讨论的是可以弥补系统中实际人类经验不足的算法),并建议进行大量计算。

人们通常最先尝试应用第一种方法,因为 它需要更少的计算资源。如果解决方案看起来不足够,则使用第二种方法。此外,智能程度越高,使用第二种方法的频率就越高,并且考虑到的可能情况越多。考虑到第二种方法的复杂性和资源强度,儿童以及不习惯脑力劳动的成年人都喜欢第一种方法。

我们将描述我们的AI技术如何在第一种情况下工作。下一篇文章将描述我们如何处理第二个更复杂的问题。

编织较少的辫子越长


为了说明这一点,让我们来讨论一个对话情况:

“我沿着长廊走,看到了一把镰刀。我想知道哪个辫子最长?”

由于方法本身的局限性,基于神经网络构建的解决方案很可能无法充分响应。即使在国民议会中载入了大量文本来寻找答案,基于这种可能性,“ 5.6米”这个数字也会响起。

让我提醒您,我们通过顺序复制心理及其过程来开发AI技术。我们用来存储知识的语义网络反映了人类存储和处理信息的特殊性。因此,在我们的方法框架内,可以很简单地解决问题。

在对应于七岁的解决方案中,该算法访问语义网络并找到位于较早听到的单词所属的节点处的顶点。在上面的示例中,必须正确选择一个同音异义词:辫子(发型)和辫子(连接到海岸的陆地带)辫子(工具)。为此,将分析语义网络的哪个节点。即执行最简单的过程,以计算到本文前面所用概念的最小距离。在我们的网络中,距离是连接数量(成正比)和连接概率(成反比)的函数。

从“编织层(地带)”到“路堤”的距离比从“编织层(发型)”到任何这些概念的距离小两个数量级。 AI将给出“ 110公里”的答案。

应当指出,这个问题也可以通过第二种方式解决,方法是将类别分开,例如“我们的对话者旁边的伏尔加河”。

搬家者对行李箱的看法不同


让我们从文章开头的Vinohrad方案中看一个例子:

“奖杯不适合棕色手提箱,因为它太小了。太小了?”

“不适合”和“太小”-“手提箱”的组合之间的联系比“不适合”和“太小”-“奖杯”之间的联系要高一个数量级。 AI将给出答案“手提箱”。

出现这种关系的可能性很高,这是由于人类的经验导致链中距离“不适合”-“太小”-“手提箱”的距离小一个数量级。像大多数人一样,我经常遇到一种情况,因为手提箱太小,所以无法放入手提箱。因此,我有这样的联系。在学习AI的过程中会形成相同的连接(我们将在以下有关语义网络的文章之一中更详细地描述心理中各种类型的连接的形成)。

“奖杯不适合棕色手提箱,因为它太大了。太大了吗?”

“不合适”与“太大”-“奖杯”的组合之间的联系比“不合适”和“太大”-“手提箱”之间的联系更有可能。 AI将给出答案“奖杯”。

我注意到一个特征-在动车中,当您经常需要放一个太大的手提箱时会遇到这种情况,因此心理使用第二种理解上下文的方法。因为对于他们来说,“太大”-“手提箱”链接更相关。同时,另一个系统为游客服务-随着人们难以将行李箱放在某处的情况的体验增加,建造的可能性增加了“您不能将任何东西放进行李箱,因为行李箱太大”。

对于相当于12岁的解决方案,公式有些复杂。而且,由这个年龄形成的方法也适用于成年人-12年后,算法网络的这一部分不会变得更加复杂。

实际上,决定的难易程度取决于我们旅行的细节。与交流有关的所有情况,所有语言学都是在人类心理结构的参与下形成的。实际上,语言领域的所有细节都是由这些结构决定的。的确,当语言确定结构时,有一个相反的过程。有相互影响。毫不奇怪,借助这些结构(心理),可以最轻松地解决出现的问题。螺母必须用扳手拧开,它们是相互制造的。不是汤匙

我注意到,除了巨大的优势外,我们开发AI的方法还带来了一些困难。计算架构与生理基础不符,我们会定期解决技术问题,以数字形式定性显示心理过程和结构。同样,由于现有的假设和调整,一些资源被用于确保语义网络和AI算法与真实心理的结构和算法的身份相同。

下一篇文章将涉及第二种类型的上下文,但是不幸的是,它将更加繁重。当描述在我们的技术中使用第二种情境的算法时,我们不能完全沉浸在心理过程中。

Source: https://habr.com/ru/post/zh-CN399111/


All Articles