Los autom贸viles de Google reconocer谩n a los peatones con alta precisi贸n



Antes de la llegada de veh铆culos no tripulados a la venta, no queda mucho tiempo. Google recuerda la tecnolog铆a de la visi贸n artificial y uno de los elementos m谩s importantes: el reconocimiento de los peatones en tiempo real.

Los investigadores de Google Research Alex Krizhevsky, Anelia Angelova y sus colegas presentaron un nuevo m茅todo para detectar peatones usando redes neuronales . El m茅todo mostr贸 un resultado alentador: la prueba Caltech Pedestrian, que contiene una base de datos de 50,000 peatones marcados en condiciones urbanas y rurales, puede detectar a un peat贸n con alta precisi贸n en el 73.8% de los casos. Este resultado es comparable con los mejores dise帽os alternativos.

Los expertos dicen que una de las 谩reas prometedoras en los 煤ltimos a帽os ha sido el uso de aceleradores de GPU en redes neuronales para ejecutar algoritmos complejos casi en tiempo real para reconocimiento de patrones, PNL y an谩lisis fluido de la transmisi贸n de video.

En la reciente Conferencia de Tecnolog铆a de GPU Nvidia, se introdujeron varias de estas soluciones . El progreso tecnol贸gico en esta 谩rea se ve mejor en la prueba del desaf铆o de reconocimiento visual a gran escala ImageNet , que se lleva a cabo desde 2010. Desde entonces, el nivel de errores en la clasificaci贸n de im谩genes por algoritmos de visi贸n artificial ha disminuido dr谩sticamente.



El reconocimiento de peatones es una de las tareas pr谩cticas donde se utiliza la nueva tecnolog铆a. En el futuro, es probable que las redes neuronales con aceleraci贸n de GPU encuentren aplicaciones en c谩maras de vigilancia, sistemas de control de tr谩fico de veh铆culos, etc.

Volviendo al desarrollo de Google, el reconocimiento de los peatones es una tarea muy dif铆cil, ya que debe resolverse en condiciones ambientales en constante cambio en tiempo casi real. Los objetos alrededor del autom贸vil est谩n en movimiento. Las tecnolog铆as existentes resuelven este problema de manera relativamente exitosa. Por ejemplo, uno de los m茅todos muestra una precisi贸n del 58% en la prueba de Caltech Pedestrian. Otro m茅todo llamado VeryFast proporciona grabaci贸n de video a 100 cuadros / s (en comparaci贸n, Google dispara a 15 cuadros / s), pero all铆 la precisi贸n es menor. Existen m茅todos con mayor precisi贸n, pero funcionan mucho m谩s lentamente, reduciendo la velocidad a 195 veces.

Google Research se ha fijado el objetivo de mejorar la precisi贸n del reconocimiento sin sacrificar la velocidad. A 15 cuadros / s, mostraron un aumento dram谩tico en la precisi贸n al 73.8% .

La frase "26,2% de 铆ndice de fallas promedio" de un art铆culo cient铆fico no debe ser enga帽osa: no estamos hablando del hecho de que el autom贸vil perdi贸 a un peat贸n y no gan贸 puntos como en Carmageddon. Por el contrario, la frase significa que este algoritmo "fall贸" y no reconoci贸 a la persona que frenaba frente a 茅l.

En Google Research, el sistema de visi贸n artificial se lanz贸 en el acelerador de gr谩ficos GPU Nvidia K20 Tesla de la generaci贸n anterior. Ahora se lanzaron nuevas versiones de K40 y K80, que se utilizan en algunas supercomputadoras de la clasificaci贸n Top500.

El equipo de Google Research tiene la intenci贸n de mejorar el resultado al aumentar la profundidad de la cascada de redes neuronales y optimizar la relaci贸n de rendimiento y precisi贸n.

De una forma u otra, pero con el advenimiento de los autom贸viles rob贸ticos en las calles, es mejor vestirse m谩s brillante que camuflado para que la visi贸n artificial del autom贸vil no lo confunda con el fondo. Por otro lado, estos consejos se pueden dar incluso ahora, cuando los autom贸viles a menudo son conducidos por conductores medio ciegos, medio borrachos y distra铆dos.

Source: https://habr.com/ru/post/es382879/


All Articles