La red neuronal Deep Photo Style Transfer transfiere el estilo en fotos



Algún día en el futuro podremos ponernos gafas y caminar por la ciudad, que se representa en tiempo real en el estilo que nos gusta. Luz del sol o neblina, puesta del sol de la tarde, lo que sea. No importa cuán aburrida sea la arquitectura, con gafas será hermosa. El increíble programa Deep Photo Style Transfer , que se publica en el dominio público, y el trabajo científico subyacente (arXiv: 1703.07511) abren estas posibilidades de renderizar con la transferencia de estilos.

La transferencia de estilo de una imagen a otra es un viejo problema que los desarrolladores han intentado resolver con bastante éxito en el pasado. Al elegir el modelo adecuado para transferir el estilo, puede transformar bellamente su foto, como si se hubiera tomado en otro momento del día, bajo diferentes luces, en diferentes climas o de una manera especial, procesada artísticamente. Hasta ahora, las técnicas para transferir estilos usando redes neuronales han sido relativamente limitadas: o solo podían funcionar con ciertas escenas, o la plausibilidad de la transferencia de estilos sufría. Los autores del nuevo programa Deep Photo Style Transfer intentaron resolver todos estos problemas.

La red neuronal Deep Photo Style Transfer está construida de acuerdo con la técnica de transferencia de estilo neuronal descrita por Gatis , pero se ha rediseñado y mejorado significativamente. La mejora principal es el fotorrealismo. Gatis incluso si la imagen original y la muestra son fotografías, la imagen final todavía se parece a una imagen donde las líneas claras y los bordes se vuelven borrosos y las texturas se superponen a los objetos vecinos. Se ve hermoso, pero no muy real.

Solo espacio de color


El resultado de Deep Photo Style Transfer es estrictamente fotorrealista. Se eliminaron los "efectos de pintura" debido a la prohibición de la distorsión espacial. Aquí, la transferencia de estilos está limitada solo por el espacio de color. En otras palabras, las formas de los objetos siguen siendo exactamente las mismas que en el original. Es por esta razón que en el futuro los "puntos" que se mencionaron al principio del artículo serán posibles. Todos los objetos en la realidad circundante conservarán su forma, solo se verán en un estilo diferente.

Los autores lograron esta tarea utilizando una capa específica de la red neuronal en el espíritu de la matriz de Kirchhoff (matriz de Laplacia), que representa el gráfico en forma de matriz. Como se muestra mediante la verificación en fotografías con varias escenas, este enfoque suprime con éxito la distorsión, mientras que al mismo tiempo ejerce una influencia mínima en la fiabilidad de las fotografías.

El principio más claramente descrito se manifiesta en dos ejemplos especialmente seleccionados.



Como puede ver, los límites de los objetos se conservan claramente. La conversión tiene lugar solo en el espacio de color. En el primer caso, el estilo de fuego se transfiere a la botella de perfume, y en el segundo caso, la textura de las manzanas cambia según el patrón.

Segmentación semántica


El segundo logro de los autores del programa es resolver el problema de transferir el estilo entre objetos inapropiados en la foto original y la muestra de estilo. Esto se hace a través de la segmentación semántica. Por lo tanto, los estilos de casa se transfieren solo entre casas, y el estilo del cielo afecta solo al cielo. En muchos casos, la segmentación semántica funciona de manera muy eficiente, siempre que la muestra de estilo tenga los mismos objetos semánticos que en la imagen original.

Dos de los enfoques anteriores han proporcionado una conversión de fotos extremadamente realista.

El original


Patrón de estilo


Imagen final


Aquí hay algunos ejemplos más.

El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final




El original


Patrón de estilo


Imagen final

La calidad de este algoritmo solo puede determinarse mediante una encuesta a los usuarios que evalúan el fotorrealismo y la fiabilidad de la transmisión del estilo. Tal encuesta se llevaría a cabo. Mostró que, en términos de fotorrealismo, Deep Photo Style Transfer supera significativamente los desarrollos presentados anteriormente de Neural Style y CNNMRF, pero inferior al sistema de reproducción de color de Pete . La fiabilidad de la transferencia de estilo Deep Photo Style Transfer es mucho mejor que otros métodos.



Los autores del trabajo científico tienen la intención de continuar la investigación para superar las limitaciones existentes de la segmentación de imágenes. También consideran prometedor el procesamiento de fotos en tiempo real utilizando una red neuronal pre-entrenada.

Source: https://habr.com/ru/post/es402665/


All Articles