DeepMind AI无法准确识别荷马·辛普森的举动



神经网络的类型越来越多,它们确实可以帮助人们的生活和工作。 有些系统可以预测天气,有些则可以学习进行诊断,而部分系统则可以开展大型业务。 人工智能(其形式薄弱)已经知道如何分析大量数据,乍看之下不相关因素之间存在依赖性。 但是,当然,仍然存在许多问题-人工智能无法应对像荷马·辛普森这样的“神秘”卡通人物的行为进行分析。

不可以,系统可以识别其某些动作,但不是全部。 同时,神经网络接受了来自《辛普森一家》的大量YouTube视频的培训。 值得注意的是,DeepMind对于各种AI系统的开发来说还不是很新。 例如,这家公司的发展之一(以前是Google的一部分,现在转移到了软银的管辖权)能够在游戏中击败 世界冠军。

DeepMind系统以及其他公司的此类开发能够分析大量信息。 随着时间的流逝,神经网络的自学习功能变得越来越完善。 无论是人脸识别还是英语翻译成中文,反之亦然,结果都在不断改善。 为了教他们称为动力学的系统,以了解人们的行为,DeepMind员工“喂食”了300,000多个YouTube视频,学会区分400种人类行为。

DeepMind的代表说:“人工智能系统现在非常擅长识别图像中的各种对象,但是它们的弱点是可以处理视频。” “主要原因之一是缺乏大量高质量的视频样本。”

为了解决此问题,DeepMind员工决定创建自己的样本 。 YouTube上的一个人针对这400种动作中的每一种,都“剪切”了至少400个视频,持续了大约10秒钟。 结果是为教学AI设计的首批高质量专业数据集之一。 当然,DeepMind公司(仍是Google的一个部门)形成了这个示例,它很幸运,因为Google(现在是Alphabet的所有者)是YouTube的所有者。 因此,Deepmind员工可能可以使用专用工具来处理视频服务材料。 其他公司将在这方面遇到困难,因为找到公开可用的高质量视频来汇编专业数据集并不像看起来那样容易。

识别人们的动作视频中看到的各种动力学的准确度约为80%,这并不是很多。 没错,这适用于普通视频,例如打网球,安抚哭泣的孩子,进行天气预报等。 对于荷马·辛普森(Homer Simpson),一切都更加复杂,这里的准确度立即下降了四倍,高达20%。 神经网络很难识别荷马的行为,例如扔硬币,梳理不存在的头发(剩下的那对头发不计算在内)和其他行为。

除了荷马之外,如果仅显示一部分菜品或产品,动力学公司将很难识别它。 已经定义了一个吃了一半的汉堡比起一个整体要精确得多。 如果显示物体很小,也会出现问题。 根据DeepMind的代表,为了教导神经网络正确,准确地确定某些动作,有时只有几个视频就足够了。 但是有时甚至一百个也无助于提高确定特定动作的准确性。



所有这些都是众所周知的问题。 例如, 较早时 ,同一神经网络在识别属于某些种族群体的人的面部时遇到困难。 一些专家认为,动力学基础的算法能够根据语音和文本的某些特征确定一个人的性别。

DeepMind的神经网络能够确定视频中人物的性别(尽管在所有情况下都并非如此),并能够评估许多视频的“性别平衡”。 例如,剃刮胡须和胡须的视频大多为男性(可能会感到惊讶),而眉毛或啦啦队的视频是女性。 没错,性别识别问题仍然存在,开发人员还有一些工作要做。

将来,在此类系统上进行的工作不仅可能确定人们对视频所做的事情,而且还会确定他们采取行动的原因。 例如,神经网络可以确定一个人为什么大叫“哦”,解释造成此动作的原因。 这需要扎实的额外工作和许多许多培训数据集。

也许,如果您对动力学进行了更好的训练,那么该系统将学习确定荷马·辛普森的动作。 尽管谁知道,这是一个非常不可预测的角色。 能行吗

Source: https://habr.com/ru/post/zh-CN404523/


All Articles