Detección rápida de contornos en video 4K: color y formas complejas

En la parte anterior, “Conjuntos de entrenamiento de video, de manera rápida y eficiente”, hablamos sobre la complejidad del uso de redes neuronales para cualquier tarea asociada con objetos raros, inusuales o simplemente complejos. Asegúrese de mirar los ejemplos, valen la pena.


Resultó que los algoritmos clásicos de visión por computadora pueden ser de gran ayuda para obtener conjuntos de entrenamiento de alta calidad. Naturalmente, este enfoque no es aplicable en todos los casos, con lo cual es necesario entenderlo.

Cual es la dificultad?


Como se muestra en la parte anterior , el diseño manual detallado de los conjuntos es un proceso que consume mucho tiempo y, francamente, no es una opción para ninguna persona sensata. El marcado automático, especialmente cuando se trata de contornos, parece mucho más interesante, pero ¿cómo obtener el contorno de interés de forma rápida y precisa?

Función de membresía


Quizás valga la pena comenzar con la función de membresía. Supongamos que el objeto de interés para nosotros se caracteriza por un color brillante que, además, es exclusivo del objeto en el contexto de una escena en particular:


Dadas las características específicas del enfoque (es decir, la necesidad de escenas que sean fáciles de "analizar"), es bastante fácil formular una regla para seleccionar ejemplos para obtener un conjunto de entrenamiento: las escenas para las que se cumplirá la regla de unicidad del color del objeto deseado serán muy útiles (recuerde, con todos los casos difíciles tendrá que lidiar con una red neuronal que ha sido entrenada con éxito utilizando el conjunto generado).

En realidad, la condición de unicidad es un mínimo necesario, ya que el color puede y también debe trabajarse en:


Distancia de color


Trabajar con color, en este caso, es una parte muy importante de todo el enfoque. De hecho, la función de pertenencia puede implementarse como una función de proximidad a un color dado con un valor umbral establecido:



La solución existente utiliza varias implementaciones de Delta E como el estándar más preciso. Por ejemplo, CIE94 en el espacio de color LCH (L * C * h):



Es probable que un umbral demasiado grande, para la distancia de color, "rompa" el camino, capturando píxeles que no están relacionados con el objeto deseado. Demasiado pequeño: selecciona solo una parte del objeto deseado. En este sentido, las escenas complejas requieren atención, por ejemplo:



La ballena en la foto aún se puede ver a simple vista (con dificultad, por supuesto), pero el contorno ya está construido incorrectamente. Ejemplo completo:


Restaurar el circuito


Supongamos que todo está bien con el color, ¿cómo obtener el contorno deseado? La tarea no es simple, ya que es probable que el resultado sea bastante complejo, con cavidades, elementos menores, etc. ¿Cuál de las opciones para el contorno restaurado para un solo objeto es correcta?


La iluminación es compleja, las sombras, los reflejos son una parte integral del mundo tridimensional, etc. Usamos un ejemplo más complejo:


El algoritmo para obtener dicho resultado es el siguiente:



  1. imagen fuente
  2. Selección de paso de escaneo (rendimiento crítico)
  3. escaneo horizontal
  4. escaneo vertical y análisis de intersección para buscar "objetos" aislados
  5. construir una matriz de metapíxeles (para identificar tanto la forma como las características internas del objeto) y el procesamiento posterior (filtrado, suavizado, etc.)
  6. "Vectorización" de la forma restaurada del objeto

El análisis de intersección facilita la localización de áreas separadas y no relacionadas. Al activar el modo de visualización de la línea de exploración, puede ver fácilmente tanto el enfoque en sí como el efecto del paso de exploración en el resultado final. Presta atención a un truco muy simple con un borde que mejora significativamente la impresión que haces:



La precisión del circuito reconstruido es fácil de evaluar utilizando el siguiente ejemplo:



Prueba final


Más objetos, más contornos, mejor precisión, cabello y en 4K: si verifica su implementación, así es con canciones y bailes.


Hasta la próxima, y ​​otros detalles igualmente interesantes.

Otros resultados





Seguir el desarrollo del proyecto.


YouTube: RobotsCanSee
Telegram: RobotsCanSeeUs

Source: https://habr.com/ru/post/473780/


All Articles