Os carros do Google reconhecerão os pedestres com alta precisão



Antes do advento de veículos não tripulados à venda, não resta muito tempo. O Google lembra a tecnologia da visão de máquina e um dos elementos mais importantes - o reconhecimento de pedestres em tempo real.

Os pesquisadores da Pesquisa do Google, Alex Krizhevsky, Anelia Angelova e colegas, apresentaram um novo método para detectar pedestres usando redes neurais . O método mostrou um resultado encorajador: um pedestre pode ser detectado com alta precisão em 73,8% dos casos pelo teste Caltech Pedestrian, que contém um banco de dados de 50.000 pedestres marcados em condições urbanas e rurais. Esse resultado é comparável aos melhores projetos alternativos.

Especialistas dizem que uma das áreas promissoras nos últimos anos tem sido o uso de aceleradores de GPU em redes neurais para executar algoritmos complexos quase em tempo real para reconhecimento de padrões, PNL e análise fluente do fluxo de vídeo.

Na recente Nvidia GPU Technology Conference, várias dessas soluções foram introduzidas . O progresso tecnológico nessa área é melhor observado no teste ImageNet Large Scale Visual Recognition Challenge , realizado desde 2010. Desde então, o nível de erros na classificação de imagens por algoritmos de visão de máquina diminuiu drasticamente.



O reconhecimento de pedestres é uma das tarefas práticas em que novas tecnologias são usadas. No futuro, é provável que redes neurais com aceleração de GPU sejam aplicadas em câmeras de vigilância, sistemas de controle de tráfego de veículos etc.

Voltando ao desenvolvimento do Google, o reconhecimento de pedestres é uma tarefa muito difícil, porque precisa ser resolvida em constantes mudanças nas condições ambientais em tempo quase real. Objetos ao redor do carro estão em movimento. As tecnologias existentes resolvem com sucesso esse problema com relativamente êxito. Por exemplo, um dos métodos mostra uma precisão de 58% no teste Caltech Pedestrian.Um outro método chamado VeryFast fornece gravação de vídeo a 100 quadros / s (para comparação, o Google grava a 15 quadros / s), mas a precisão é menor. Existem métodos com maior precisão, mas eles funcionam muito mais devagar, reduzindo a velocidade para 195 vezes.

A Pesquisa do Google estabeleceu uma meta para melhorar a precisão do reconhecimento sem sacrificar a velocidade. A 15 quadros / s, eles mostraram um aumento dramático na precisão, para 73,8% .

A frase “taxa média de erros de 26,2%” de um artigo científico não deve ser enganosa: não estamos falando sobre o fato de o carro ter perdido um pedestre e não ter ganho pontos como no Carmageddon. Pelo contrário, a frase significa que esse algoritmo “errou” e não reconheceu a pessoa para frear na sua frente.

Na Pesquisa do Google, o sistema de visão de máquina foi lançado no acelerador gráfico GPU Nvidia K20 Tesla da geração anterior. Agora, foram lançadas novas versões do K40 e K80, usadas em alguns supercomputadores da classificação Top500.

A equipe de pesquisa do Google pretende melhorar o resultado aumentando a profundidade da cascata de redes neurais e otimizando a taxa de desempenho e precisão.

De uma maneira ou de outra, mas com o advento de carros robóticos nas ruas, é melhor vestir-se com mais brilho do que com camuflagem, para que a visão de máquina do carro não o confunda com o fundo. Por outro lado, esse conselho pode ser dado até agora, quando os carros são freqüentemente dirigidos por motoristas meio cegos, meio bêbados e distraídos.

Source: https://habr.com/ru/post/pt382879/


All Articles