
Los científicos de Microsoft Research (MSR) Asia
han creado un sistema de inteligencia artificial (IA) que ha aprendido las complejidades del mahjong. Mahjong es considerado uno de los juegos más difíciles en términos de dominar algoritmos, ya que Hay un factor aleatorio en él.
Super Phoenix (Suphx) fue el primer sistema de IA en recibir el décimo dan (rango) en
Tenhou , una plataforma de competencia en línea
riichi mahjong con más de 300,000 participantes de todo el mundo. Solo 180 personas tienen tales calificaciones. Esta es la descarga máxima para el algoritmo en este momento, solo unos pocos profesionales reconocidos juegan a un nivel superior.
Para crear el sistema, se utilizó el aprendizaje de refuerzo profundo, un principio integral de algoritmos de aprendizaje basado en una combinación de aprendizaje profundo y aprendizaje de refuerzo. Suphx dominó las complejidades del mahjong al participar en 5,000 juegos en 4 meses. El sistema aumentó gradualmente la calidad y la velocidad del juego. Ahora el algoritmo tiene su propia estrategia, que incluye movimientos deliberadamente débiles, lo que al final permite obtener una mayor ventaja.
A diferencia del ajedrez y el ir, en el que la IA ya ha progresado significativamente, Mahjong es un juego con información incompleta. Los participantes no conocen todos los factores, por ejemplo, es imposible ver imágenes en los nudillos del oponente. El proceso del juego se parece al póker: los participantes necesitan una buena memoria, observación, pensamiento estratégico y la capacidad de farolear.
Según los científicos de MSR, la presencia de un factor aleatorio en mahjong es un desafío único para los sistemas de IA, y la experiencia adquirida en la enseñanza de algoritmos a problemas no lineales puede encontrar su aplicación en situaciones de la vida real que involucran un conjunto de factores desconocidos.
Microsoft Research y Maluuba previamente
entrenaron inteligencia artificial en Ms. Pac-Man, que fue lanzado para una de las primeras consolas domésticas Atari 2600. El algoritmo rompió el récord mundial con 999,990 puntos, mientras que el mejor resultado para una persona fue 266,360 puntos.