AI本身学会了如何构建魔方



长期以来,计算机程序都能够下象棋,而Deep Mind相对较新的专业平台甚至已经受过训练,可以进行专业围棋 。 如此专业,以至于没有人像计算机这样的人,而且很可能不会。

几天前,人们知道机器独立学习了解决另一个复杂的难题-Rubik's Cube。 而且,在培训期间,他们没有向她展示如何正确组装立方体,由美国科学家创建的软件平台是独立学习所有东西的。 一些专家认为,另一个“堡垒被认为是人类的财产”落在了机器的前面。

魔方,或者说是它的装配算法 ,很复杂,因为每个装配动作都有一定的后果,但是很难预测它们对整个装配过程的影响。 即使是汽车。 人们通常会学习如何根据以前开发的算法组装立方体,该算法可以在最短的时间内解决难题。

一些学生在这一领域取得了惊人的成就。 因此,在今年5月又创下了用两只手组装魔方的新记录。 冠军,一个22岁的澳大利亚人,名叫Felix Zemdegs,能够在短短4.22秒内收集到立方体。 他从12岁开始接受培训,在YouTube上观看汇编记录。


至于汽车,机器人可以更快地收集立方体。 今年的纪录是0.38秒。 它本来可以更快一些,但是多维数据集本身的机制无法承受。 为了创造一个记录,开发人员必须加强多维数据集的设计,否则它只能与对机器的过快操作相分离。


在上述平台上,工作是根据先前输入到系统内存中的算法进行的。 但是麻省理工学院的科学家能够训练自己的系统,以自行组装多维数据集。



在创建多维数据集本身时,其发明者最有趣的任务是开发一种从任何位置解决难题的方法。 工程师Rubik设法在一个月内做到了这一点。 将来,组装算法已得到反复改进。

最近,AI专家开始寻找一种方法来教机器如何制作模具。 使用了深度机器学习。 给系统一个任务,并解释了规则。 接下来,机器人必须自己行动。 在进步的情况下,机器会获得奖励-这样的东西并教授弱形式的AI。 毕竟,计算机必须知道正确方向的移动。 他们通过奖励制度让他知道了这一点。 所有这些都有助于机器学习。

就魔方而言,这比通常情况下要复杂得多。 事实是,直到某个时刻,才可能了解系统是否正常运行。 而且,对不带结果的不道德面孔的奖励是没有意义的。 在国际象棋中,一切都变得更简单-从第二或第三步开始,您就可以了解游戏朝哪个方向移动以及机器是否运行良好。 因此,有一些奖励。

为了教计算机如何制作魔方,我们使用了一种专门的深度学习技术,称为“自动学迭代”。 这项技术使您可以“旋转”已组装的多维数据集,以实现与当前多维数据集相似的配置。 如果该术语适用于机器学习,那么结果类似于逆向工程。 将创建一个专用的“决策树”,机器将使用该决策树来计算每种配置的步骤。

结果令人印象深刻。 根据开发人员自己的观点,该算法可以解决约30步的难题。 而且,无论遇到什么版本的拆卸难题,机器都会100%收集箱子。 通常,要组装一个片段完整的拼图,您需要19到23步。 一些解决方案比其他解决方案更快地获得了预期的结果。 最快的构建算法包括21个步骤。

由MIT工程师开发的平台称为DeepCube。 报告说:“我们的平台能够在复杂的环境中自学,在整个工作过程中仅获得一个奖项。”

现在,同一批科学家正在研究其教学方法的实施,以解决其他复杂的组合问题。 其中包括对蛋白质三级结构的预测。

Source: https://habr.com/ru/post/zh-CN414463/


All Articles