DeepMind AI未通过学校数学考试



如今,流行科学甚至娱乐媒体都充斥着有关AI项目成功的新闻。 人工智能要么打败一个忙碌的人,要么学会玩《星际争霸》,并在与知名冠军的战斗中胜出。 这只是成就的一小部分,实际上还有很多。 一个普通人(在某种意义上,与IT领域无关)可能会认为一种真正的“大”人工智能将要出现,我将为此写科幻小说并拍摄电影。

但是一切都不是那么乐观。 例如,前几天有信息表明AI试图通过高等数学考试(学校考试,英国标准),但未能通过。

原则上,可以很容易地解释故障原因。 因此,一个人在解决数学问题时涉及以下能力。

它从本质上自己修改了符号,例如数字,算术运算符,变量(构成复数形式的函数)和单词(定义问题,任务的含义等)。

  • 计划(例如,按解决数学问题的必要顺序对功能进行排序)。
  • 使用辅助算法来组成函数(加法,乘法)。
  • 使用短期内存来存储中间值(例如h(f(x)))。
  • 在实践中获得了有关规则,转换,过程和公理的知识。

DeepMind在选择不同类型的数学问题和问题上经过培训和测试。 开发人员没有使用众包;相反,他们合成了一个数据集以生成大量测试任务,控制其复杂性等。 开发团队使用了“自由格式”文本数据格式。

初始数据基于为英国学校(16岁以下)的学生选择的作业中的任务。 这些任务是从算术,代数,概率论等方向进行的。

DeepMind团队选择了用于解决数学问题的神经网络架构,决定采用LSTM( 长期短期记忆 )和Transformer (用于处理序列的神经网络架构)。

DeepMind测试了两个用于解决数学问题的LSTM模型:一个简单的LSTM和一个注意LSTM,其操作方案如下图所示。



下面是Transformer模型的示意图。



结果不是很好。 只有35%的AI答案是正确的,根据任何学校的标准,这都是不令人满意的评估。



当然,来自DeepMind的研究人员才刚刚开始从事数学和AI的研究。 将来,与相同的AlphaGo一样,可以期待更大的成功。

完整的研究数据可以在此链接上找到。


Source: https://habr.com/ru/post/zh-CN447120/


All Articles