La red neuronal de Nvidia convierte bocetos simples en hermosos paisajes


Cascada del fumador y Cascada del hombre sano

Todos sabemos cómo dibujar un búho. Primero necesitas dibujar un óvalo, luego otro círculo, y luego obtienes un hermoso búho. Por supuesto, esto es una broma, y ​​es muy antiguo, pero los ingenieros de Nvidia intentaron hacer realidad la fantasía.

El nuevo desarrollo , llamado GauGAN, crea paisajes elegantes a partir de bocetos muy simples (realmente simples: círculos, líneas y todo). Por supuesto, esta tecnología se basa en tecnologías modernas, a saber, redes neuronales adversas generativas.

GauGAN le permite crear mundos virtuales coloridos, y no solo para el entretenimiento, sino también para el trabajo. Entonces, arquitectos, paisajistas, desarrolladores de juegos: todos pueden aprender algo útil. La inteligencia artificial inmediatamente "comprende" lo que una persona quiere y complementa la idea original con una gran cantidad de detalles.

"La lluvia de ideas en términos de desarrollo de diseño se hace mucho más fácil con la ayuda de GauGAN, ya que un pincel inteligente puede complementar el boceto inicial al agregar imágenes de alta calidad", dijo uno de los desarrolladores de GauGAN.

Los usuarios de esta herramienta pueden cambiar la idea inicial, modificar el paisaje u otra imagen, agregar el cielo, las arenas, el mar, etc. Todo lo que tu corazón desea, y la adición se lleva a cabo en solo un par de segundos.

La red neuronal se entrenó utilizando una base de datos de millones de imágenes. Gracias a esto, el sistema puede entender lo que una persona quiere y cómo lograr lo que quiere. Además, la red neuronal no se olvida de los detalles más pequeños. Entonces, si dibujas el estanque y algunos árboles al lado, luego de que el paisaje reviva, todos los objetos cercanos se reflejarán en el espejo del agua del estanque.

Se puede especificar el sistema de la superficie visible: se puede cubrir con hierba, nieve, agua o arena. Todo esto se puede transformar en un segundo, de modo que la nieve se convierta en arena y, en lugar de un páramo nevado, el artista recibirá un paisaje desértico.

“Es como un libro para colorear que dice dónde colocar un árbol, dónde está el sol y dónde está el cielo. Luego, después de la tarea inicial, la red neuronal da vida a la imagen, agrega los detalles y texturas necesarios, dibuja reflexiones. Todo esto se basa en imágenes reales ”, dice uno de los desarrolladores.


A pesar de que el sistema carece de una "comprensión" del mundo real, el sistema crea paisajes impresionantes. Esto se debe a que aquí se usan dos redes neuronales, un generador y un discriminador. El generador crea una imagen y se la muestra al discriminador. Eso, basado en millones de imágenes vistas anteriormente, elige las opciones más realistas.

Es por eso que el generador "sabe" dónde deberían estar los reflejos. Vale la pena señalar que la herramienta es muy flexible y está equipada con una gran cantidad de configuraciones. Por lo tanto, con su ayuda, puede pintar cuadros, ajustarse al estilo de un determinado artista, o simplemente disfrutar de la rápida adición del amanecer o el atardecer.

Los desarrolladores afirman que el sistema no solo toma imágenes de algún lugar, las agrega y obtiene el resultado. No, se generan todas las "imágenes" recibidas. Es decir, la red neuronal "crea" como un artista real (o incluso mejor).

Hasta ahora, el programa no está en el dominio público, pero pronto será posible probarlo en el trabajo. Esto se puede hacer en la GPU Technology Conference 2019, que se celebra en California en este momento. Los afortunados que pudieron visitar la exposición ya pueden probar GauGAN.

Las redes neuronales han sido enseñadas durante mucho tiempo para participar en el proceso creativo. Por ejemplo, el año pasado, algunos de ellos pudieron crear modelos 3D . Además, los desarrolladores de DeepMind entrenaron a la red neuronal para restaurar espacios tridimensionales y objetos a partir de dibujos, fotografías y bocetos. Para recrear una figura simple, una imagen es suficiente para la red neuronal, para crear objetos más complejos, se necesitan cinco imágenes para "arrastrar".

En cuanto a GauGAN, esta herramienta obviamente encontrará una aplicación comercial digna: muchas áreas de los negocios y la ciencia necesitan estos servicios.

Source: https://habr.com/ru/post/444468/


All Articles