👩🏿‍⚕️ 😋 👩🏿‍✈️ Las 5 áreas principales de aplicación para sistemas de reconocimiento de objetos 👳 🗒️ 🏩

Los intentos de enseñar varios sistemas para ver y comprender el mundo como lo hace una persona, comenzaron hace varias décadas, pero ahora estas tecnologías se han vuelto tan perfectas que se utilizan activamente en muchas áreas de nuestras vidas. Habré ya tiene artículos detallados sobre visión artificial, redes neuronales y algoritmos de reconocimiento, por lo que no profundizaremos y describiremos nuevamente estas tecnologías complejas, hablaremos sobre el uso práctico de estos sistemas en el mundo real.

Como funciona Brevemente

Lo que para nosotros es fotografía, para un sistema de reconocimiento de imágenes, es solo un conjunto de píxeles con diferentes parámetros de color. Para enseñar al sistema a reconocer objetos individuales en una imagen, debe proporcionarle un conjunto de datos, un conjunto de miles de imágenes que indican exactamente dónde se encuentra el objeto deseado. Por ejemplo, si queremos que el sistema aprenda a reconocer a las personas en imágenes, debemos mostrarle muchas fotos de personas de diferentes edades, en diferentes poses y ropas, en diferentes condiciones. Después de dicha capacitación, el sistema podrá reconocer con precisión a la persona en las fotografías. Sin embargo, surge otra pregunta: si para un sistema una fotografía es solo una colección de píxeles, ¿cómo entiende una red neuronal qué se representa exactamente en una foto?

Se utilizan varios métodos para reconocer objetos en la imagen, pero uno de los métodos más prometedores es el método de histograma de gradiente orientado (HOG). La imagen se decolora y luego, en bloques de 16x16 píxeles, el sistema encuentra la dirección del cambio de color (vector de gradiente), construye un mapa de estos vectores sobre toda la imagen y, por lo tanto, "captura" los signos del objeto, que no cambian dependiendo de la posición / posición y la iluminación. Una versión mejorada del algoritmo se llama CoHOG: tiene en cuenta los límites de los objetos, es decir, reconoce la forma y no solo los vectores de gradiente.

Toshiba ha mejorado el método CoHOG, mejorando significativamente el reconocimiento con poca luz: el CoHOG tradicional, por ejemplo, funciona mal con un reconocimiento rápido en la oscuridad, cuando los peatones apenas son visibles en los faros. El método ECoHOG (tecnología de histogramas de la presencia combinada de gradientes orientados) determina a una persona a través de un análisis adicional de las direcciones y tamaños de sus contornos, encontrando su cabeza, piernas, brazos, hombros. Si CoHOG simplemente aísla los contornos antropométricos en la imagen (análisis "límite de objeto - vectores de límite"), entonces para ECoHOG las dimensiones de los límites de objeto entre sí son importantes.

Cinco áreas clave de aplicación

Comercialización

El reconocimiento de patrones es un área prometedora en publicidad y marketing. Las redes neuronales pueden aprender cosas en cuestión de horas, lo que en otros casos requiere un gran equipo de profesionales y semanas, o incluso meses de investigación, para encontrar. Por ejemplo, el servicio ruso YouScan, un sistema de monitoreo de redes sociales, rastrea la mención de marcas en las redes sociales. Además, hace esto no solo en el texto de las publicaciones, sino también en las fotografías, y también ayuda a sacar ciertas conclusiones sobre el producto. Con la ayuda del reconocimiento de patrones, se encontró un patrón interesante en la foto, cuya búsqueda nunca se le habría ocurrido a nadie: entre los animales, los gatos se encuentran con mayor frecuencia con la tecnología de Apple y los perros con la marca Adidas. Esta información inusual puede ser útil para la orientación publicitaria.

Al buscar el logotipo de Adidas, el servicio YouScan filtró fotos con teléfonos inteligentes en manos de los propietarios. Copyright: YouScan

Video vigilancia

El reconocimiento de patrones en las cámaras de vigilancia urbana es quizás la perspectiva más inevitable de utilizar la visión artificial. Desde 2017, se ha probado un sistema de videovigilancia inteligente en Moscú para identificar delincuentes en lugares concurridos. La tecnología de la empresa rusa NTechLab, que ya ha ayudado a detener a varias docenas de delincuentes, está conectada a la red de cámaras de la ciudad. En China, dicho sistema de videovigilancia es capaz de reconocer no solo rostros, sino también marcas de automóviles y ropa en público, que posteriormente pueden ser utilizados por los vendedores para su investigación.

El video muestra el verdadero trabajo de reconocimiento de imágenes y rostros SenseTime

Medicina

El reconocimiento de patrones ya se ha convertido en un verdadero avance en la medicina: en muchos casos, las computadoras notan cosas que incluso los médicos más experimentados extrañan. Actúan como asistentes peculiares, cuya opinión "técnica" confirma la hipótesis del médico o da lugar a una investigación más profunda.

En Rusia, el desarrollo de sistemas de software para el diagnóstico de cánceres en imágenes de CT, MRI y PET está en marcha. Para hacer esto, miles de imágenes etiquetadas son conducidas a través de la red neuronal, después de lo cual la precisión de reconocimiento de nuevas imágenes aumenta a 95-97%. Entre otros, el desarrollo de dicha plataforma es llevado a cabo por el Departamento de Tecnología de la Información de Moscú, utilizando la biblioteca abierta Google TensorFlow.

Una red neuronal Inception creada por Google analiza un examen microscópico de una biopsia de ganglio linfático en busca de células cancerosas en las glándulas mamarias. Para una persona, este es un proceso muy largo y laborioso, durante el cual es fácil cometer un error o perder algo importante, ya que en algunos casos el tamaño de la imagen es de 100,000 x 100,000 píxeles. La red neuronal de inicio proporciona una sensibilidad de aproximadamente 92% versus 72% en el médico. La red neuronal no perderá de vista todas las áreas sospechosas de las imágenes, aunque se permiten falsas alarmas, que el médico luego filtrará.

Autos

El reconocimiento de objetos en los automóviles es una parte necesaria de los sistemas de seguridad ADAS (sistemas avanzados de asistencia al conductor). ADAS se puede implementar con herramientas sofisticadas, como sensores de radar e infrarrojos, o con una cámara monocular. En un artículo anterior, ya dijimos que una cámara de video es suficiente para que un automóvil reconozca a los peatones, las señales y los semáforos en tiempo real. Sin embargo, dicho reconocimiento "sobre la marcha" es una tarea que requiere muchos recursos y requiere un procesador especializado. Toshiba lleva varios años desarrollando una serie de procesadores. Construyen un modelo tridimensional basado en una imagen en movimiento de una sola cámara y, por lo tanto, notan obstáculos desconocidos en el camino. De hecho, si una red neuronal está entrenada para reconocer solo personas, marcas y signos, entonces una llanta o un pedazo de una cerca que esté sobre el asfalto no será reconocido y considerado como un peligro.

Los procesadores Visconti identifican zonas en la imagen, las clasifican y ayudan al piloto automático o al ADAS a tomar una decisión. Fuente: Toshiba

Drones

En los drones, el reconocimiento de objetos se usa tanto para fines de entretenimiento como científicos. En 2015, el dron Lily hizo mucho ruido con el arranque automático del motor al lanzar y rastrear la función para el propietario. Lily apuntó la lente hacia el propietario, independientemente de la trayectoria y la velocidad de su movimiento. Es cierto que esta función de Lily no tenía nada que ver con el reconocimiento de patrones, ya que el dron no solo miraba la imagen de una persona, sino también el panel de control, que se puso en la mano del propietario.

Los drones de reconocimiento de imagen también se usan para cosas más serias. Por ejemplo, la empresa noruega eSmart Systems ha desarrollado soluciones de red inteligente. En uno de sus proyectos, Connected Drone, los drones se utilizan para solucionar problemas de líneas eléctricas. Formados en el reconocimiento de elementos de la red eléctrica, verifican la integridad de los cables, aislantes y otras partes de las líneas eléctricas. Esto es especialmente importante para localizar rápidamente un mal funcionamiento cuando el suministro de energía a una ciudad o empresa depende de la línea. Dado que las líneas eléctricas a menudo se construyen en lugares difíciles de alcanzar, enviar una tripulación de drones para encontrar un mal funcionamiento en algún lugar de la taiga o en las montañas es mucho más efectivo que enviar un equipo de personas.

Los drones ESmart encuentran elementos de la infraestructura energética y, en caso de daños, marcan el objeto, dejando una advertencia para el operador. Fuente: eSmart Systems

Las 5 áreas principales de aplicación para sistemas de reconocimiento de objetos