As 5 principais áreas de aplicação para sistemas de reconhecimento de objetos



As tentativas de ensinar vários sistemas a ver e entender o mundo da maneira como uma pessoa começou começaram há várias décadas, mas agora essas tecnologias se tornaram tão perfeitas que são usadas ativamente em muitas áreas de nossas vidas. Habré já possui artigos detalhados sobre visão de máquina, redes neurais e algoritmos de reconhecimento. Portanto, não iremos aprofundar e descrever novamente essas tecnologias complexas; falaremos sobre o uso prático desses sistemas no mundo real.

Como isso funciona? Brevemente


O que é fotografia para nós, para um sistema de reconhecimento de imagem, é apenas um conjunto de pixels com diferentes parâmetros de cor. Para ensinar o sistema a reconhecer objetos individuais em uma imagem, você deve fornecer um conjunto de dados - um conjunto de milhares de imagens que indicam exatamente onde o objeto desejado está localizado. Por exemplo, se queremos que o sistema aprenda a reconhecer pessoas em imagens, precisamos mostrar muitas fotos de pessoas de diferentes idades, em diferentes poses e roupas, em diferentes condições. Após esse treinamento, o sistema poderá reconhecer com precisão a pessoa nas fotografias. No entanto, outra pergunta é implacável: se para um sistema uma fotografia é apenas uma coleção de pixels, como uma rede neural entende exatamente o que é retratado em uma foto?

Vários métodos são usados ​​para reconhecer objetos na imagem, mas um dos métodos mais promissores é o método do histograma de gradiente orientado (HOG). A imagem é descolorida e, em blocos de 16x16 pixels, o sistema encontra a direção da mudança de cor (vetor gradiente), constrói um mapa desses vetores sobre toda a imagem e, assim, "captura instantânea" dos sinais do objeto, que não mudam dependendo da posição / posição e iluminação. Uma versão aprimorada do algoritmo é chamada CoHOG - leva em consideração os limites dos objetos, ou seja, reconhece a forma e não apenas os vetores de gradiente.

A Toshiba aprimorou o método CoHOG, melhorando significativamente o reconhecimento em condições de pouca luz - o CoHOG tradicional, por exemplo, se sai mal com o rápido reconhecimento no escuro, quando os pedestres quase não são visíveis nos faróis. O método ECoHOG (tecnologia de histogramas da presença combinada de gradientes orientados) determina uma pessoa através de uma análise adicional das direções e tamanhos de seus contornos, encontrando sua cabeça, pernas, braços, ombros. Se o CoHOG simplesmente isola contornos antropométricos da imagem (análise “limite do objeto - vetores de limite”), para o ECoHOG, as dimensões dos limites do objeto são importantes.

Cinco áreas principais de aplicação


Marketing


O reconhecimento de padrões é uma área promissora em publicidade e marketing. As redes neurais podem aprender coisas em questão de horas, o que, em outros casos, exige uma grande equipe de profissionais e semanas ou mesmo meses de pesquisa. Por exemplo, o serviço russo YouScan, um sistema de monitoramento de mídia social, rastreia a menção de marcas nas redes sociais. Além disso, ele faz isso não apenas no texto das postagens, mas também nas fotografias, e também ajuda a tirar certas conclusões sobre o produto. Com a ajuda do reconhecimento de padrões, um padrão interessante foi encontrado na foto, cuja busca nunca teria ocorrido a ninguém: entre os animais, os gatos são mais frequentemente encontrados com a tecnologia Apple e os cães com a marca Adidas. Essas informações incomuns podem ser úteis para a segmentação de publicidade.


Ao procurar o logotipo da Adidas, o serviço YouScan filtrava fotos com smartphones nas mãos dos proprietários. Direitos autorais: YouScan

Vigilância por vídeo


O reconhecimento de padrões nas câmeras de vigilância urbana é talvez a perspectiva mais inevitável do uso da visão por máquina. Desde 2017, um sistema inteligente de vigilância por vídeo foi testado em Moscou para identificar criminosos em locais lotados. A tecnologia da empresa russa NTechLab, que já ajudou a deter várias dezenas de criminosos, está conectada à rede de câmeras da cidade. Na China, esse sistema de videovigilância é capaz de reconhecer não apenas rostos, mas também marcas de carros e roupas em público, que podem ser posteriormente utilizados pelos profissionais de marketing para suas pesquisas.

O vídeo mostra o verdadeiro trabalho de reconhecimento de imagens e enfrenta o SenseTime

Remédio


O reconhecimento de padrões já se tornou um verdadeiro avanço na medicina - em muitos casos, os computadores percebem coisas que até os médicos mais experientes sentem falta. Eles atuam como assistentes peculiares, cuja opinião "técnica" confirma a hipótese do médico ou gera pesquisas mais profundas.

Na Rússia, está em andamento o desenvolvimento de sistemas de software para o diagnóstico de câncer em imagens de tomografia computadorizada, ressonância magnética e PET. Para fazer isso, milhares de imagens marcadas são direcionadas pela rede neural, após o que a precisão do reconhecimento de novas imagens aumenta para 95-97%. Entre outros, o desenvolvimento dessa plataforma é realizado pelo Departamento de Tecnologia da Informação de Moscou, usando a biblioteca aberta do Google TensorFlow.

Uma rede neural criada pelo Google analisa um exame microscópico de uma biópsia de linfonodo em busca de células cancerígenas nas glândulas mamárias. Para uma pessoa, esse é um processo muito longo e trabalhoso, durante o qual é fácil cometer um erro ou perder algo importante, pois em alguns casos o tamanho da imagem é de 100.000 x 100.000 pixels. A rede neural inicial fornece uma sensibilidade de cerca de 92% contra 72% no médico. A rede neural não perde de vista todas as áreas suspeitas das imagens, embora sejam permitidos alarmes falsos, que o médico posteriormente filtrará.

Carros


O reconhecimento de objetos em carros é uma parte necessária dos sistemas de segurança ADAS (Sistemas avançados de assistência ao motorista). O ADAS pode ser implementado com ferramentas sofisticadas, como sensores de radar e infravermelho, ou com uma câmera monocular. Em um artigo anterior, já dissemos que uma câmera de vídeo é suficiente para que um carro reconheça pedestres, sinais e semáforos em tempo real. No entanto, esse reconhecimento "on the fly" é uma tarefa que consome muitos recursos, o que requer um processador especializado. A Toshiba desenvolve uma série de processadores há vários anos. Eles constroem um modelo tridimensional baseado em uma imagem em movimento de uma única câmera e, assim, percebem obstáculos desconhecidos na estrada. De fato, se uma rede neural for treinada para reconhecer apenas pessoas, marcações e sinais, um pneu ou um pedaço de cerca caído no asfalto não será reconhecido e considerado perigoso.


Os processadores Visconti identificam zonas na imagem, classificam-nas e ajudam o piloto automático ou o ADAS a tomar uma decisão. Fonte: Toshiba

Drones


Nos drones, o reconhecimento de objetos é usado para fins de entretenimento e científicos. Em 2015, o zangão Lily fez muito barulho com o arranque automático do motor ao lançar e rastrear a função do proprietário. Lily apontou a lente para o dono, independentemente da trajetória e velocidade do movimento dele. É verdade que essa função de Lily não tem nada a ver com o reconhecimento de padrões, já que o drone observava não apenas a imagem de uma pessoa, mas o painel de controle, que era colocado na mão do proprietário.


Os drones de reconhecimento de imagem também são usados ​​para coisas mais sérias. Por exemplo, a empresa norueguesa eSmart Systems desenvolveu soluções de redes inteligentes. Em um de seus projetos, o Connected Drone, os drones são usados ​​para solucionar problemas de linhas de energia. Treinados no reconhecimento de elementos da rede elétrica, eles verificam a integridade de fios, isoladores e outras partes das linhas elétricas. Isso é especialmente importante para localizar rapidamente um mau funcionamento quando a fonte de alimentação de uma cidade ou empresa depende da linha. Considerando que as linhas de energia costumam ser construídas em locais de difícil acesso, enviar uma equipe de drones para encontrar uma falha em algum lugar da taiga ou nas montanhas é muito mais eficaz do que enviar uma equipe de pessoas.


Os drones ESmart encontram elementos da infraestrutura de energia e, em caso de dano, marcam o objeto, deixando um aviso para o operador. Fonte: eSmart Systems

Source: https://habr.com/ru/post/pt433544/


All Articles