Inteligência Artificial Microsoft domina mahjong



Cientistas da Microsoft Research (MSR) Ásia criaram um sistema de inteligência artificial (IA) que aprendeu os meandros do mahjong. Mahjong é considerado um dos jogos mais difíceis em termos de algoritmos de masterização, pois há um fator aleatório nele.

Super Phoenix (Suphx) foi o primeiro sistema de IA a receber o 10º dan (ranking) no Tenhou , uma plataforma online de competição de riichi mahjong com mais de 300.000 participantes de todo o mundo. Apenas 180 pessoas têm essas qualificações. Esta é a descarga máxima para o algoritmo no momento, apenas alguns profissionais reconhecidos jogam em um nível superior.

Para criar o sistema, o aprendizado por reforço profundo foi usado - um princípio abrangente de algoritmos de aprendizado baseado em uma combinação de aprendizado profundo e aprendizado por reforço. Suphx dominou os meandros do mahjong participando de 5.000 jogos em 4 meses. O sistema aumentou gradualmente a qualidade e a velocidade do jogo. Agora, o algoritmo tem sua própria estratégia, que inclui movimentos deliberadamente fracos, permitindo ao final obter uma vantagem maior.

Ao contrário do xadrez e da partida, em que a IA já fez um progresso significativo, o mahjong é um jogo com informações incompletas. Nem todos os fatores são conhecidos pelos participantes, por exemplo, é impossível ver imagens nas articulações do oponente. O processo do jogo se assemelha ao poker - os participantes precisam de uma boa memória, observação, pensamento estratégico e capacidade de blefar.

De acordo com cientistas da MSR, a presença de um fator aleatório no mahjong é um desafio único para os sistemas de IA, e a experiência adquirida no ensino de algoritmos para problemas não lineares pode ser aplicada em situações da vida real que envolvem um conjunto de fatores desconhecidos.
A Microsoft Research e Maluuba treinaram anteriormente inteligência artificial em Ms. Pac-Man, lançado para um dos primeiros consoles domésticos Atari 2600. O algoritmo quebrou o recorde mundial com 999.990 pontos, enquanto o melhor resultado para uma pessoa foi 266.360 pontos.

Source: https://habr.com/ru/post/pt469071/


All Articles