Dominar la visión por computadora: 8 pasos básicos

Hola lector

Para ti, el hecho de que todos hayan probado máscaras de envejecimiento a través de la aplicación Face ya no es una novedad. A su vez, para la visión por computadora hay tareas más interesantes que esta. A continuación, presentaré 8 pasos que lo ayudarán a dominar los principios de la visión por computadora.

imagen

Antes de comenzar con los pasos, comprendamos qué tareas podemos resolver usted y yo con la ayuda de la visión por computadora. Los ejemplos de tareas pueden incluir lo siguiente:


El conocimiento mínimo requerido para dominar la visión por computadora



Así que ahora vamos a los pasos.

Paso 1 - Técnicas básicas de imagen


Este paso es sobre los fundamentos técnicos.

Echa un vistazo a esta gran lista de reproducción de YouTube, The Ancient Secrets of Computer Vision, de Joseph Redmon.





Lea el tercer capítulo del libro de Richard Sheliski Computer Vision: Algorithms and Applications.

imagen

Desarrolle conocimiento: intente transformar imágenes con OpenCV. El sitio tiene muchos manuales electrónicos paso a paso , guiados por los cuales puede descubrir todo.

Paso 2: seguimiento de movimiento y análisis de flujo óptico


Una corriente óptica es una secuencia de imágenes de objetos obtenidos al mover un observador u objetos en relación con una escena.

Tome el curso: un curso de visión por computadora en Udacity , especialmente la lección 6.
Eche un vistazo: el octavo video en la lista de YouTube y una conferencia sobre flujo óptico y seguimiento.


Leer - secciones 10.5 y 8.4 del libro de texto Sheliski.

imagen

Como proyecto de capacitación, descubra cómo usar OpenCV para rastrear un objeto en un cuadro de video.

Paso 3 - Segmentación básica


En la visión por computadora, la segmentación es el proceso de dividir una imagen digital en varios segmentos (superpíxeles). El propósito de la segmentación es simplificar y / o cambiar la presentación de una imagen para que sea más fácil y más fácil de analizar.

Entonces, la transformación Hough le permite encontrar círculos y líneas.

Mira estos videos:





Echa un vistazo: un excelente proyecto cuyas tareas similares son extremadamente importantes para la visión por computadora de los vehículos eléctricos autónomos.



Paso 4 - Ajuste


Los diferentes datos requieren un enfoque de ajuste específico y sus propios algoritmos.

Mira el video:


Leer - secciones 4.3.2 y 5.1.1 del libro de texto Sheliski.

Como tarea para el trabajo independiente, analice el problema de determinar las coordenadas del lugar donde las líneas convergen en el horizonte de perspectiva.

Paso 5 - Combinando imágenes obtenidas de diferentes puntos de inspección


Mira la lista de reproducción de Youtube


Lee la carta de presentación.

Para el proyecto, puede tomar sus propios datos. Por ejemplo, tome una foto de muebles desde diferentes lados y haga un objeto 3D en OpenCV a partir de un álbum de imágenes planas.

Paso 6 - Escenas 3D


Al poder crear objetos 3D a partir de imágenes planas, puede intentar crear una realidad tridimensional.

Take - Curso de seguimiento y visión estéreo

Mira el video:




Como proyecto, intente reconstruir la escena o rastrear un objeto en un espacio tridimensional .

Paso 7 - Reconocimiento de objetos y clasificación de imágenes


Es conveniente usar TensorFlow como marco para el aprendizaje profundo. Este es uno de los marcos más populares, por lo que puede encontrar fácilmente suficientes ejemplos. Para comenzar con las imágenes en TensorFlow, siga este tutorial .

Además, utilizando enlaces, considere los siguientes temas:


Como proyecto, cree una red neuronal en TensorFlow que determine la marca del automóvil o la raza del perro a partir de la imagen .

Paso 8 - Aprendizaje profundo moderno


Leer - Conferencias del curso de Stanford

Mira el video:




En esto, nuestros pasos en el estudio de la visión por computadora llegaron a su fin. Espero que hayas aprendido algo nuevo por ti mismo. Como es habitual en Habré, me gustó la publicación: poner un plus. No te olvides de compartir con colegas. Además, si tiene algo que puede compartir, escriba en los comentarios. Más información sobre aprendizaje automático y ciencia de datos en Habré y en el canal de telegramas Neuron (@neurondata).

Todo el conocimiento!

Source: https://habr.com/ru/post/461365/


All Articles