Dominar a visão computacional - 8 etapas básicas

Olá leitor.

Para você, o fato de todos terem experimentado máscaras de envelhecimento por meio do aplicativo Face não é mais novidade. Por sua vez, para visão computacional, existem tarefas mais interessantes que isso. Abaixo, apresentarei 8 etapas que ajudarão você a dominar os princípios da visão computacional.

imagem

Antes de começar com as etapas, vamos entender quais tarefas você e eu podemos resolver com a ajuda da visão por computador. Exemplos de tarefas podem incluir o seguinte:


O conhecimento mínimo necessário para dominar a visão computacional



Então agora vamos descer as etapas.

Etapa 1 - Técnicas básicas de imagem


Esta etapa é sobre o básico técnico.

Confira esta ótima lista de reprodução do YouTube, The Ancient Secrets of Computer Vision, de Joseph Redmon.





Leia o terceiro capítulo do livro de Richard Sheliski, Computer Vision: Algorithms and Applications.

imagem

Desenvolva conhecimento - tente transformar imagens com o OpenCV. O site possui muitos manuais eletrônicos passo a passo , orientados pelos quais você pode descobrir tudo.

Etapa 2 - Rastreamento de movimento e análise de fluxo óptico


Um fluxo óptico é uma sequência de imagens de objetos obtidos movendo um observador ou objetos em relação a uma cena.

Faça o curso - um curso de visão computacional na Udacity , especialmente a lição 6.
Veja o oitavo vídeo da lista do YouTube e uma palestra sobre fluxo e rastreamento ópticos.


Leia as seções 10.5 e 8.4 do livro de Sheliski.

imagem

Como um projeto de treinamento, descubra como usar o OpenCV para rastrear um objeto em um quadro de vídeo.

Etapa 3 - Segmentação básica


Na visão computacional, a segmentação é o processo de dividir uma imagem digital em vários segmentos (super pixels). O objetivo da segmentação é simplificar e / ou alterar a apresentação de uma imagem para facilitar e facilitar a análise.

Portanto, a transformação Hough permite encontrar círculos e linhas.

Confira estes vídeos:





Confira - um excelente projeto cujas tarefas semelhantes são extremamente importantes para a visão computacional de veículos elétricos autônomos.



Etapa 4 - Montagem


Dados diferentes requerem uma abordagem de ajuste específica e seus próprios algoritmos.

Assista ao vídeo:


Leia as seções 4.3.2 e 5.1.1 do livro de texto Sheliski.

Como tarefa de trabalho independente, analise o problema de determinar as coordenadas do local onde as linhas convergem no horizonte da perspectiva.

Etapa 5 - Combinando imagens obtidas de diferentes pontos de inspeção


Confira a lista de reprodução do YouTube


Leia a carta de apresentação.

Para o projeto, você pode levar seus próprios dados. Por exemplo, tire uma foto de móveis de lados diferentes e faça um objeto 3D no OpenCV a partir de um álbum de imagens planas.

Etapa 6 - cenas 3D


Sendo capaz de criar objetos 3D a partir de imagens planas, você pode tentar criar uma realidade tridimensional.

Take - Curso de Visão e Rastreamento Estéreo

Assista ao vídeo:




Como projeto, tente reconstruir a cena ou rastrear um objeto no espaço tridimensional .

Etapa 7 - Reconhecimento de objetos e classificação de imagens


É conveniente usar o TensorFlow como uma estrutura para aprendizado profundo. Essa é uma das estruturas mais populares, para que você possa encontrar facilmente exemplos suficientes. Para começar com imagens no TensorFlow, siga este tutorial .

Além disso, usando links, considere os seguintes tópicos:


Como projeto, crie uma rede neural no TensorFlow que determine a marca do carro ou a raça do cachorro a partir da imagem .

Etapa 8 - Aprendizado profundo e moderno


Ler - Palestras do Curso de Stanford

Assista ao vídeo:




Sobre isso, nossos passos no estudo da visão por computador chegaram ao fim. Espero que você tenha aprendido algo novo para si mesmo. Como é habitual em Habré, gostei do post - coloque um plus. Não se esqueça de compartilhar com os colegas. Além disso, se você tiver algo que possa compartilhar, escreva nos comentários. Mais informações sobre aprendizado de máquina e ciência de dados em Habré e no canal de telegrama Neuron (@neurondata).

Todo conhecimento!

Source: https://habr.com/ru/post/pt461365/


All Articles