
La ciencia popular e incluso los medios de entretenimiento ahora están abrumados con noticias sobre el éxito de los proyectos de IA. O bien, la inteligencia artificial derrota a una persona, luego aprende a jugar a StarCraft y sale victorioso de una batalla con campeones reconocidos. Y esto es solo una pequeña fracción de los logros, de hecho, hay mucho más. Una persona común (en cierto sentido, no relacionada con la esfera de TI) podría pensar que está por aparecer una inteligencia artificial real, "grande", sobre la cual escribo ciencia ficción y hago películas.
Pero todo está lejos de ser tan color de rosa. Por ejemplo, el otro día hubo información de que la IA intentó pasar la prueba en matemáticas superiores (prueba escolar, estándar para el Reino Unido) y no pudo hacerlo.
En principio, las causas del fracaso pueden explicarse sin mucha dificultad. Entonces, una persona para resolver problemas matemáticos involucra las siguientes habilidades y capacidades.
Modifica por sí mismo los símbolos en esencia, como números, operadores aritméticos, variables (que forman funciones en un complejo) y palabras (que definen una pregunta, el significado de una tarea, etc.).
- Planificación (por ejemplo, clasificación de funciones en el orden necesario para resolver un problema matemático).
- Uso de algoritmos auxiliares para componer funciones (suma, multiplicación).
- Usar memoria a corto plazo para almacenar valores intermedios (por ejemplo, h (f (x))).
- Poner en práctica conocimientos previamente adquiridos sobre reglas, transformaciones, procesos y axiomas.
DeepMind fue entrenado y probado en una selección de diferentes tipos de problemas y problemas matemáticos. Los desarrolladores no usaron crowdsourcing; en cambio, sintetizaron un conjunto de datos para generar una gran cantidad de tareas de prueba, controlar su complejidad, etc. El equipo de desarrollo utilizó un formato de datos de texto de "forma libre".
Los datos iniciales se basaron en tareas de una selección de tareas para estudiantes en escuelas del Reino Unido (menores de 16 años). Las tareas se tomaron de direcciones tales como aritmética, álgebra, teoría de la probabilidad, etc.
El equipo de DeepMind, eligiendo una arquitectura de red neuronal para resolver problemas matemáticos, se decidió por LSTM (
memoria a corto plazo a largo plazo ) y
Transformer (una arquitectura de red neuronal para trabajar con secuencias).
DeepMind probó dos modelos LSTM para trabajar con problemas matemáticos: un LSTM simple y LSTM atencional cuyo esquema de operación se muestra en la figura a continuación.

A continuación se muestra un diagrama del modelo Transformer.

El resultado no fue demasiado bueno. Solo el 35% de las respuestas de IA fueron correctas, esta es una evaluación insatisfactoria según los estándares de cualquier escuela.

Por supuesto, los investigadores de DeepMind acaban de comenzar a trabajar con las matemáticas y la IA. En el futuro, se puede esperar un mayor éxito, como fue el caso con el mismo AlphaGo.
Los datos completos del estudio se pueden encontrar en
este enlace .

