Giraffe Neural Network aprendió a jugar ajedrez al nivel de un maestro internacional de la FIDE en 72 horas
El estudiante del Imperial College London Matthew Lai desarrolló el programa informático Giraffe , que jugó al ajedrez durante tres días consigo mismo, y fue capaz de extraer todo el conocimiento específico del dominio necesario para jugar al nivel de un maestro internacional de la FIDE. Para esto, los recursos informáticos de una computadora normal son suficientes para ella. El entrenamiento de la red neuronal tomó 72 horas en 20 hilos en una máquina con dos procesadores Xeon E5-2660 de 10 núcleos.En el trabajo científico, el autor escribe que después de entrenar durante 72 horas, el programa eligió el mejor movimiento posible en el 46% de los casos, y uno de los tres mejores movimientos en el 70% de los casos. Este es un muy buen resultado incluso para los programas regulares de ajedrez.Todos saben que las computadoras juegan al ajedrez mejor que las personas, pero no todos entienden por qué logran la victoria, porque una fuerza bruta simple no es suficiente para clasificar los 10 123 posibles movimientos y respuestas del oponente.En primer lugar, los programas de ajedrez limitan la profundidad máxima de cálculo de las ramas. En segundo lugar, comenzando desde Deep Blue y terminando con el actual campeón entre el ajedrez informático de Komodo, es poco probable que derroten a una persona si el gran maestro no configuró el módulo de evaluación de posicióno personas que saben mucho de ajedrez, como el equipo de desarrollo de Deep Blue de IBM. Inicialmente, el programa establece la base de aperturas y trucos característicos del juego, como defender al rey con un peón o atacar al rey en una posición abierta con elefantes coloridos.Una evaluación competente de la posición le permite al programa elegir la rama más preferida para el desarrollo de la fiesta.En este sentido, queda claro por qué el nuevo programa Giraffe es tan diferente del resto. Nadie la sintonizó, ella misma aprendió a tocar. Además, en lugar de una fuerza bruta banal de ramas con un límite de profundidad, el programa utiliza un enfoque "probabilístico". Ella estudia más profundamente aquellas ramas para las cuales la probabilidad de una larga continuación es más probable.La ilustración muestra el árbol de decisión. Los nodos del árbol son visibles en amarillo, que son visibles para el algoritmo estándar con una restricción en la longitud de las ramas. Verde: nodos visibles solo para el algoritmo de probabilidad limitada (Jirafa). El color rojo indica los nodos visibles para ambos algoritmos.
Tal algoritmo se basa en la premisa de que el oponente también responderá con el mejor movimiento entre los posibles, y el juego se retrasará por la cantidad máxima de movimientos. Estas son las ramas que Giraffe elige para un análisis más profundo. En cierto sentido, la lógica del programa es similar a la lógica de los jugadores de ajedrez experimentados que "intuitivamente" sienten las formas más rentables de desarrollar un juego.Resulta que hasta la fecha, el progreso en el desarrollo de redes neuronales ha alcanzado un nivel tal que un estudiante puede escribir un programa que puede aprender a jugar ajedrez a un nivel muy alto de forma independiente en tres días. El siguiente diagrama muestra la arquitectura de la red neuronal que el autor estableció originalmente. También compiló un conjunto de posiciones iniciales para el programa de capacitación.
Así es como se presenta el puesto en el programa.
El profesor de informática de PS, Sebastian Thrun, fue uno de los primeros en el mundo en utilizar redes neuronales en programas de ajedrez. A mediados de los 90, desarrolló el programa NeuroChess . Sin embargo, al igual que el programa Giraffe actual, ese desarrollo tampoco podría vencer a los mejores representantes de la "escuela clásica".Source: https://habr.com/ru/post/es384253/
All Articles