La IA misma aprendió a construir un cubo de Rubik



Los programas de computadora han sido capaces de jugar al ajedrez durante mucho tiempo, y una plataforma especializada relativamente reciente de Deep Mind incluso ha sido entrenada para jugar profesionalmente. Tan profesional que no hay jugadores entre personas iguales a una computadora, y muy probablemente no.

El otro día se supo que la máquina aprendió independientemente a resolver otro rompecabezas complejo: el Cubo de Rubik. Además, durante el entrenamiento, no le demostraron cómo ensamblar correctamente el cubo, la plataforma de software creada por científicos de los EE. UU. Aprendió todo de forma independiente. Algunos expertos creen que otro "bastión, que se consideraba la posesión del hombre", cayó frente a las máquinas.

El Cubo de Rubik, o más bien, su algoritmo de ensamblaje , es complicado porque cada acción de ensamblaje tiene ciertas consecuencias, pero es bastante difícil predecir su efecto en el proceso general de ensamblaje. Incluso para el auto. La gente generalmente aprende a armar un cubo de acuerdo con algoritmos desarrollados previamente que permiten resolver el rompecabezas en el menor tiempo posible.

Algunos de los estudiantes están teniendo éxitos asombrosos en este campo. Entonces, en mayo de este año , se estableció otro récord para ensamblar el cubo de Rubik con las dos manos. El campeón, un australiano de 22 años llamado Felix Zemdegs, pudo recoger el cubo en solo 4.22 segundos. Comenzó a entrenar desde los 12 años, viendo los registros de la asamblea en YouTube.


En cuanto al automóvil, los robots recogen el cubo aún más rápido. Este año el récord se estableció en 0,38 segundos. Pudo haber sido más rápido, pero la mecánica del cubo en sí no podía soportarlo. En un intento por establecer un récord, los desarrolladores tuvieron que fortalecer el diseño del cubo, de lo contrario, simplemente se desmoronó de las manipulaciones demasiado rápidas de la máquina.


En el caso de la plataforma descrita anteriormente, el trabajo se lleva a cabo de acuerdo con algoritmos previamente ingresados ​​en la memoria del sistema. Pero los científicos del MIT pudieron entrenar su propio sistema para ensamblar el Cubo por su cuenta.



Al crear el cubo en sí, la tarea más interesante de su inventor fue desarrollar una forma de resolver el rompecabezas desde cualquier posición. El ingeniero Rubik logró hacer esto en un mes. En el futuro, el algoritmo de ensamblaje se ha mejorado repetidamente.

Recientemente, los expertos en IA han comenzado a buscar una manera de enseñarle a la máquina cómo hacer un dado. Se utilizó el aprendizaje automático profundo. El sistema recibió una tarea y se explicaron las reglas. Luego, el robot tuvo que actuar por su cuenta. En el caso del progreso, la máquina recibió una recompensa, algo así y enseñar formas débiles de IA. Después de todo, la computadora debe saber qué se mueve en la dirección correcta. Y le hicieron saber esto a través del sistema de recompensas. Todo esto ayuda a la máquina a aprender.

En el caso del Cubo de Rubik, esto es algo más complicado que en el caso habitual. El hecho es que hasta cierto momento es imposible entender si el sistema funciona correctamente o no. Y no tiene sentido recompensar un giro accidental de una cara que no trae resultados. En ajedrez, todo es más simple: ya desde el segundo o tercer movimiento puedes entender en qué dirección se mueve el juego y si la máquina funciona bien o no. En consecuencia, hay algo que recompensar.

Para enseñarle a una computadora cómo hacer un cubo de Rubik, se utilizó una tecnología especializada de aprendizaje profundo, que se denominó "iteración autodidacta". Esta tecnología le permite "girar" el cubo ya ensamblado para lograr una configuración similar a la actual. Resulta algo así como ingeniería inversa, si este término es aplicable al aprendizaje automático. Se crea un "árbol de decisión" especializado, que la máquina utiliza para calcular los pasos para cada configuración.

El resultado fue impresionante. Según los propios desarrolladores, el algoritmo puede resolver el rompecabezas en aproximadamente 30 movimientos. Además, la máquina recoge el cubo en el 100% de los casos, sin importar la versión del rompecabezas desmontado que encuentre. En general, para armar un rompecabezas bien fragmentado, necesita de 19 a 23 pasos. Algunas soluciones conducen al resultado deseado más rápido que otras. El algoritmo de construcción más rápido consta de 21 pasos.

La plataforma, desarrollada por los ingenieros del MIT, se llama DeepCube. "Nuestra plataforma es capaz de autoaprendizaje en entornos complejos, recibiendo solo un premio por todo el proceso de trabajo", dice el informe.

Ahora el mismo equipo de científicos está trabajando en la implementación de su método de enseñanza para resolver otros problemas combinatorios complejos. Entre otros, la predicción de la estructura terciaria de la proteína .

Source: https://habr.com/ru/post/es414463/


All Articles