👩‍👧‍👧 🌌 👨‍❤️‍💋‍👨 AI本身学会了如何构建魔方 ✋🏽 👨‍👩‍👦 🛕

长期以来，计算机程序都能够下象棋，而Deep Mind相对较新的专业平台甚至已经受过训练，可以进行专业围棋。如此专业，以至于没有人像计算机这样的人，而且很可能不会。

几天前，人们知道机器独立学习了解决另一个复杂的难题-Rubik's Cube。而且，在培训期间，他们没有向她展示如何正确组装立方体，由美国科学家创建的软件平台是独立学习所有东西的。一些专家认为，另一个“堡垒被认为是人类的财产”落在了机器的前面。

魔方，或者说是它的装配算法，很复杂，因为每个装配动作都有一定的后果，但是很难预测它们对整个装配过程的影响。即使是汽车。人们通常会学习如何根据以前开发的算法组装立方体，该算法可以在最短的时间内解决难题。

一些学生在这一领域取得了惊人的成就。因此，在今年5月，又创下了用两只手组装魔方的新记录。冠军，一个22岁的澳大利亚人，名叫Felix Zemdegs，能够在短短4.22秒内收集到立方体。他从12岁开始接受培训，在YouTube上观看汇编记录。

至于汽车，机器人可以更快地收集立方体。今年的纪录是0.38秒。它本来可以更快一些，但是多维数据集本身的机制无法承受。为了创造一个记录，开发人员必须加强多维数据集的设计，否则它只能与对机器的过快操作相分离。

在上述平台上，工作是根据先前输入到系统内存中的算法进行的。但是麻省理工学院的科学家能够训练自己的系统，以自行组装多维数据集。

在创建多维数据集本身时，其发明者最有趣的任务是开发一种从任何位置解决难题的方法。工程师Rubik设法在一个月内做到了这一点。将来，组装算法已得到反复改进。

最近，AI专家开始寻找一种方法来教机器如何制作模具。使用了深度机器学习。给系统一个任务，并解释了规则。接下来，机器人必须自己行动。在进步的情况下，机器会获得奖励-这样的东西并教授弱形式的AI。毕竟，计算机必须知道正确方向的移动。他们通过奖励制度让他知道了这一点。所有这些都有助于机器学习。

就魔方而言，这比通常情况下要复杂得多。事实是，直到某个时刻，才可能了解系统是否正常运行。而且，对不带结果的不道德面孔的奖励是没有意义的。在国际象棋中，一切都变得更简单-从第二或第三步开始，您就可以了解游戏朝哪个方向移动以及机器是否运行良好。因此，有一些奖励。

为了教计算机如何制作魔方，我们使用了一种专门的深度学习技术，称为“自动学迭代”。这项技术使您可以“旋转”已组装的多维数据集，以实现与当前多维数据集相似的配置。如果该术语适用于机器学习，那么结果类似于逆向工程。将创建一个专用的“决策树”，机器将使用该决策树来计算每种配置的步骤。

结果令人印象深刻。根据开发人员自己的观点，该算法可以解决约30步的难题。而且，无论遇到什么版本的拆卸难题，机器都会100％收集箱子。通常，要组装一个片段完整的拼图，您需要19到23步。一些解决方案比其他解决方案更快地获得了预期的结果。最快的构建算法包括21个步骤。

由MIT工程师开发的平台称为DeepCube。报告说：“我们的平台能够在复杂的环境中自学，在整个工作过程中仅获得一个奖项。”

现在，同一批科学家正在研究其教学方法的实施，以解决其他复杂的组合问题。其中包括对蛋白质三级结构的预测。

AI本身学会了如何构建魔方

More articles: