Ha pasado poco más de un mes desde que la organización sin fines de lucro OpenAI Ilona Mask introdujo el middleware Universe para entrenar y enseñar una IA fuerte. Teóricamente, la capacitación puede llevarse a cabo sobre toda la información de la humanidad, accesible a través de Internet. Al usar la plataforma de software Universe, un agente inteligente usa una computadora exactamente de la misma manera que una persona: mirará los píxeles de la pantalla de la computadora e interactuará usando el teclado y el mouse virtuales.Ahora, a las docenas de juegos disponibles para entrenamiento de IA, se ha agregado el juego Grand Theft Auto V , que se distingue por un realismo excepcional.Puede crear un agente de inteligencia artificial para vehículos no tripulados en cualquier marco de aprendizaje automático y es relativamente fácil conectarse al juego en una computadora con GTA V.
El agente de inteligencia artificial está en la encrucijada. En el diagnóstico de la consola, el estado de presionar el pedal del freno (verdadero) y otros parámetros actuales del piloto automático se muestran a la izquierdaEl juego GTA V, incluso con la violencia desactivada, brinda ricas oportunidades para entrenar IA para un vehículo no tripulado. Este es uno de los mundos abiertos más grandes y ricos. La acción del juego tiene lugar en el territorio de la isla de San Andreas, con un área de casi el 20% de este Los Ángeles. Aquí puede ejecutar una variedad de escenarios para probar la IA. Los agentes tienen acceso a 257 tipos diferentes de automóviles, 7 tipos de bicicletas, 14 tipos de clima y se puede cambiar el entorno durante la simulación.
La isla de San AndreasGracias a las numerosas modificaciones en el juego GTA V, puedes cargar edificios de ciudades reales, autos reales, señales de tráfico reales y otros objetos. En consecuencia, su agente de IA estará capacitado para conducir en condiciones reales de la carretera.Plataforma del universo
La apertura de la plataforma universal universal Universe es una continuación de las acciones planificadas de OpenAI para crear una IA universal abierta en todo el mundo. En abril de este año, la organización lanzó una versión beta pública del kit de herramientas OpenAI Gym para desarrollar y comparar algoritmos de aprendizaje de refuerzo. El "gimnasio" OpenAI Gym consta de una gran cantidad de entornos (desde un simulador de robot humanoide hasta juegos de Atari ). Hay un sitio para comparar y reproducir los resultados .OpenAI cree que el aprendizaje por refuerzo es una forma importante de aprendizaje automático que mejorará en gran medida la inteligencia artificial. En el proceso de aprendizaje mediante este método, el sistema de prueba (agente) aprende interactuando con un determinado entorno. A diferencia de la enseñanza tradicional con un maestro, la respuesta a las decisiones de IA tomadas son señales de refuerzo, mientras que algunas reglas de refuerzo se forman dinámicamente y son difíciles de entender, es decir, en función de la actividad simultánea de las neuronas formales.Ejecutar un agente de IA en su computadora con GTA V
La integración de Universe con Grand Theft Auto V fue creada y es compatible con el proyecto DeepDrive , que ahora se ha cambiado a código abierto. El proyecto proporciona la capacidad de ejecutar el agente de Universe en su propia computadora con una copia del juego instalada.
A través de Universe, el agente de inteligencia artificial obtiene acceso al mundo de juego tridimensional realista de GTA V. El siguiente video muestra los fotogramas del juego que se transfirieron al agente de IA para su procesamiento (artificialmente ralentizado a 8 FPS, arriba a la izquierda), información de diagnóstico del agente y entorno (abajo a la izquierda) , así como una vista amigable para los humanos desde la cámara (a la derecha).La integración de AI en el juego prohíbe cualquier acción violenta en GTA V.Porque en sus aperturas Adjunto de trabajo necesario para ejecutar proceso de servidor GTA V . Primero debe instalar el universo de la biblioteca de Python y luego conectar el agente con el siguiente código.import gym
import universe
from universe.spaces import joystick_event
env = gym.make('gtav.SaneDriving-v0')
env.configure(remotes='vnc://$host:$port')
observation_n = env.reset()
while True:
steer = joystick_event.JoystickAxisXEvent(-1)
throttle = joystick_event.JoystickAxisZEvent(-1)
action_n = [[steer, throttle] for _ in observation_n]
observation_n, reward_n, done_n, info = env.step(action_n)
env.render()
Como es habitual en los agentes de Universe, AI usa un teclado virtual, pero en este caso, también hay disponible un joystick virtual. AI demuestra los mejores resultados con el joystick.Impulsión profunda
DeepDrive es una plataforma de desarrollo de IA especializada para vehículos no tripulados de código abierto. Utiliza marcos de modding y técnicas especiales para convertir GTA V en un simulador de automóvil normal. Están disponibles agentes previamente capacitados con capacidades de gestión de transporte y conjuntos de datos en los que fueron capacitados.Aunque la plataforma DeepDrive apareció antes que el Universo, ahora su desarrollador decidió que sería prudente transferir su trabajo a esta plataforma abierta universal. Ese fue el paso correcto. Anteriormente, para ejecutar el agente, se requería una computadora con Windows y muchas horas de configuración del entorno ( se utilizó la intercepción DirectX allípara capturar la pantalla y escribir agentes, tenía que usar la interfaz C ++ para Caffe en Windows). Ahora DeepDrive se instala en 20 minutos, se ejecuta en Linux y OS X, y los agentes se pueden escribir en cualquier marco de aprendizaje automático.Código fuente publicado de código abierto y AMI para GTA V, un controlador-agente previamente capacitado . Su entrenamiento duró 21 horas (600 mil imágenes). El agente tiene habilidades básicas de manejo y es un buen comienzo para sus propios experimentos.Juntos, miles de agentes de IA pueden crear un conductor verdaderamente sofisticado, un programa que puede conducir un vehículo no tripulado real en el mundo real.