¿Dos por ciento del "gato" o quién fotografió al Maestro Yoda?

En 2016, debido al antiguo sueño de los videojuegos y la "exageración" en torno a la IA, comencé a aprender Python.
La informática es divertida porque hace solo una semana entrené el primer modelo de reconocimiento, pero sin usar Python (hay muchas tentaciones en informática). Como predijo Andrei Sebrant (Yandex), se ha producido una nueva revolución tecnológica. Por qué Hacer una aplicación de reconocimiento de imágenes más fácil que un juego de computadora. Suficiente por una o dos horas.



Fui por el camino "difícil": no elegí entre cuatro modelos ya entrenados, pero entrené el mío. La biblioteca Core ML de Apple le permite hacer esto con 6 líneas de código o mediante la GUI en áreas de juego.

import CreateMLUI let builder = MLImageClassifierBuilder() builder.showInLiveView() 

La mayor parte del tiempo se dedicó a recopilar y filtrar datos para el entrenamiento, 70 fotos de perros, gatos y personas, pero un guión escrito rápidamente hizo que este proceso fuera semiautomático.

Solía ​​leer sobre el aprendizaje automático. Cuando lo intenté yo mismo, me encontré con tres problemas / conclusiones esperados:

  1. Los datos son la parte más importante.
  2. Interfaz fácil de usar (CoreML). Todo funciona y realmente no quiero entrar en el código fuente para descubrir los detalles. El aprendizaje automático es accesible para cualquier usuario, pero los ingenieros de Apple intentaron ocultar detalles complejos.
  3. El modelo es una caja negra. No conozco las reglas por las cuales el modelo cree que el dos por ciento del "gato" en la fotografía.

El experimento con el reconocimiento de "gatos humanos" ha llevado a la idea de que el algoritmo de clasificación hará frente al "estilo".

Seleccioné cuatro fotógrafos y alrededor de cien fotografías de cada uno. No intenté elegir cuidadosamente los ejemplos, sino que simplemente copié de mi colección las primeras o últimas cien imágenes de Evgeny Mokhorev y Oleg Videnin . No había suficientes fotografías de Maxim Shumilin , porque no solo se seleccionaron retratos. Pero las fotos de Yegor Voinov fueron elegidas con más cuidado, ya que descargué dos secciones dedicadas al retrato en su sitio web.

Comencé a entrenar el algoritmo y, en promedio, obtuve un 80% de precisión de reconocimiento (resultados de la prueba durante la creación).

Hubo un momento extraño. Dupliqué el número de fotos de Oleg Videnin y el sistema aprendió solo el 30%, y la precisión del reconocimiento disminuyó al 20%.

El sistema tuvo que verificarse para evitar sesgos, le pedí a Yegor Voinov que enviara fotos que no están en el sitio. Como resultado, el algoritmo confirmó que 20 de las 26 fotos son similares a cómo Yegor Voinov toma un retrato.

Esto confirmó el 77% de precisión de reconocimiento obtenida al crear el clasificador.



Y entonces comienza la diversión.

Primero, el sistema puede ser entrenado volviendo a agregar "errores" al conjunto de entrenamiento. Los resultados cambian, pero el sistema no recuerda las fotografías, pero encuentra signos comunes para un autor en particular. Algunas fotos después de "trabajar en errores" fueron reconocidas por el sistema como fotos de Yegor Voinov, y otras no.



En segundo lugar, el sistema tiende a atribuir el "desnudo" a las fotografías de Yevgeny Mokhorev, por lo tanto, escribe bajo el raro "desnudo" de Oleg Videnin que se trata de fotografías de Mokhorev. Y tan pronto como se muestra el "vestido Mokhorev", el sistema puede "ver Voinov". Y reconozca la foto de Yegor Voynov como una foto de Oleg Videnin.



La selección de las fotografías de Maxim Shumilin resultó ser muy heterogénea. Por lo tanto, pequeñas figuras y retratos con un pronunciado "desenfoque" el sistema se refiere a las fotografías de Maxim.



En tercer lugar, el sistema puede ver la foto del Maestro Yoda.


Y puede tomar una foto rápida y descubrir en qué "estilo" se tomó la foto


Y aquí está el momento de la verdad. Subí mis retratos para descubrir cuánto Mokhorev, Videnin, Voinov y Shumilin hay en mí.



El borrador de la aplicación PhotoGuru está listo. Hasta ahora me parece que este es un juguete divertido, pero trabajaré en el diseño y ampliaré las muestras de entrenamiento.

En una palabra, debe elegir un marco para seguir estudiando ML.

Source: https://habr.com/ru/post/437332/


All Articles