Minecraft solía entrenar robots



El juego de computadora de mundo abierto Minecraft es popular entre los niños de todo el mundo, y los adultos usan estos cubos para proyectos más serios. Por ejemplo, para la construcción de circuitos digitales, ROM y procesadores: el más rápido de los procesadores Minecraft DjCPU8 tiene 256 bytes de memoria, admite 42 instrucciones y ensamblador.

Ahora para Minecraft hemos encontrado otra aplicación: entrenar robots.

Tales experimentos son realizados por Stefanie Tellex, profesora de la Universidad de Brown. Ella usa el sandbox de Minecraft para entrenar robots (más precisamente, sus copias virtuales) para formas más rápidas y eficientes de resolver problemas.

Hoy en día, estas no son tareas demasiado urgentes, ya que la mayoría de los robots funcionan en un entorno constante, casi siempre se fijan en un solo lugar y realizan tareas similares. Pero en el futuro, tales estudios pueden volverse relevantes cuando los robots ingresen a un mundo abierto aún más complejo que Minecraft y comiencen a operar en un entorno complejo.

En el mundo real, los robots pueden tener problemas. “Puedes decirle al robot que prepare café y, después de un minuto, lavar la ropa. En tal situación, cuando las tareas no se conocían de antemano, surge el problema de la planificación ”, dice el profesor Tlex. - Es muy difícil determinar la secuencia necesaria de acciones adecuadas para este entorno en particular. Nuestro enfoque es aprender esto más rápido ".

En un entorno complejo hay una gran cantidad de opciones, especialmente si se configuran varias tareas para el robot. La computadora simplemente no tiene suficiente poder de cómputo para clasificar todas las opciones. Stephanie Tellex y un grupo de estudiantes han desarrollado un algoritmo que ayuda a descartar algunas opciones posibles al comprender qué dirección requiere cada tarea en particular.

En el mundo de Minecraft, el algoritmo se está probando. El programa autodidacta recibió la tarea de colocar un bloque de oro en el horno para quemarlo, evitando el lago con lava (en las capturas de pantalla anteriores). A través de prueba y error, el programa se dio cuenta de que la opción con el bloque cayendo al suelo antes de que se puedan excluir otras acciones de la enumeración de opciones.

Puede tener lugar una capacitación similar en un entorno virtual y robots reales en el futuro, antes de que se les permita ingresar al mundo real.

Otros investigadores dicen que las pruebas en un entorno virtual ya son una parte importante de la capacitación de robots. Obviamente, un robot real no puede aprender a subir las escaleras en el mundo real por prueba y error, por lo que el modelo se ejecuta primero en virtualidad.



El video muestra al robot Baxter, cuyo programa ha aprendido varias acciones en el mundo real. También por prueba y error, aunque Minecraft no estuvo involucrado aquí.

Source: https://habr.com/ru/post/es381589/


All Articles