Los concursantes competirán en varios juegos en la plataforma Minecraft. Izquierda: juego Build Battle donde los jugadores necesitan recrear la estructura (en este caso, la estructura se encuentra en el suelo). Derecha: juego Pig Chase donde los agentes de IA deben trabajar juntos para arrinconar a un cerdoMicrosoft Research está completando la etapa de calificación de la
competencia MarLÖ 2018 Multi-Agent Reinforcement Learning en MalmÖ. Los competidores introdujeron agentes de IA capaces de reforzar el aprendizaje que podían jugar varios juegos 3D como se define en la plataforma
MalmO .
El objetivo del concurso es fomentar la investigación en el campo de la inteligencia general. Los agentes de IA no están entrenados en un solo juego específico, sino en varios. Además, deben cooperar, lo que requiere una comprensión de las intenciones y objetivos de cada uno (esta es una propiedad importante de la conciencia humana). Entonces el sistema estará más adaptado para sobrevivir en el mundo real.
Con el fin de estimular un enfoque más general para entrenar a un agente de IA universal, la tarea consiste no en uno sino en varios juegos, en cada uno de los cuales varias tareas de diversa complejidad y configuración. Algunas de estas tareas son de naturaleza pública, y los participantes podrían aprender de ellas. Otros, sin embargo, permanecieron cerrados, se usarán solo para determinar la calificación final de la competencia.
Los organizadores de la competencia son Microsoft, la Universidad Queen Mary de Londres y la plataforma
crowdAI . La competencia comenzó el 27 de julio de 2018. La ronda de clasificación finaliza el 31 de diciembre de 2018. El torneo final se llevará a cabo fuera de línea una semana después del final de la ronda de clasificación.

Juegos y tareas
Una de las principales características de la competencia es que los agentes juegan varios juegos. Por lo tanto, se ofrecen varias tareas para la competencia. Las tareas en el juego pueden diferir entre sí en la ubicación de los niveles, el tamaño, la complejidad y otros parámetros que dependen del juego. La figura muestra cómo se organizan los juegos y las tareas en la competencia.

Como puede ver, cada juego tiene cuatro tareas, de las cuales dos se publican en el dominio público y dos son secretas.
Para participar en el concurso, debes registrarte en crowdAI y luego clonar el
kit de inicio del concurso en GitHub .
La plataforma Malmö proporciona una API que proporciona acceso a acciones, observaciones (es decir, ubicación, alrededores, cuadros de video, estadísticas de juegos) y otros datos comunes que se encuentran en la plataforma Minecraft. Marlo, por otro lado, es un shell para Malmö que proporciona un mayor nivel de API y un entorno de aprendizaje más estandarizado con refuerzo para la investigación.
El marco está escrito como una adición al
marco OpenAI Gym , que es un juego de herramientas para desarrollar y comparar algoritmos de aprendizaje de refuerzo, proporcionando así una plataforma estándar y familiar para científicos, desarrolladores y marcos populares.
El proyecto Malmö fue lanzado en 2015 por la investigadora de IA Katya Hoffmann en Microsoft Research Cambridge, Reino Unido. Aunque los agentes modernos de IA han demostrado muchos logros en diferentes juegos, Katya estaba buscando un juego que permitiera a la IA dominar una gama más amplia de habilidades: "En el momento en que comenzamos a hablar de Minecraft, era obvio que este era un entorno ideal para la investigación de la IA". ella es. "Este es un mundo al que las personas se unen sin un propósito específico". Por lo tanto, el proyecto Malmö es una plataforma construida sobre Minecraft, donde los investigadores pueden realizar muchos experimentos diferentes con IA, así como comparar sus resultados de manera estandarizada.
Al probar el concurso Marlo en 2017, a los participantes se les ofreció un solo juego: atrapar un cerdo. La competencia de 2018 es mucho más complicada: ahora se han desarrollado tres misiones, cada una de las cuales requiere cooperación. Los agentes deben comprender cómo reconocer a otro agente de IA en el entorno y luego encontrar una manera de trabajar juntos para lograr su objetivo común.
Si un agente de IA formula la hipótesis de los objetivos de otro agente, esto puede llamarse una forma rudimentaria de lo que los psicólogos llaman un "
modelo de estado mental ": la capacidad humana de comprender los estados mentales y las intenciones de otras personas. Katya Hoffman espera que los agentes de IA eventualmente perfeccionen esta habilidad colaborando con jugadores humanos en Minecraft. "Entonces los algoritmos aprenderán cómo colaborar con las personas y descubrir qué quieren las personas", dice ella.