
Las cámaras nos miran casi continuamente, pero esto tiene poco sentido. Si una persona no analiza la imagen, la cámara sigue siendo solo un dispositivo que produce terabytes de horas de transmisión inadecuada. Una alternativa es equipar la cámara con herramientas de IA. Y dicho sistema de videovigilancia podrá reemplazar al guardia de seguridad que duerme frente al monitor, el jefe en la oficina y el vendedor en el supermercado. Te contamos exactamente cómo.
Una cámara "inteligente" es un concepto condicional, y la mente misma en la mayoría de los casos no está montada en la cámara, sino instalada en un servidor donde el flujo de video de la cámara se analiza utilizando tecnología de inteligencia artificial. La cámara no tiene la potencia informática para realizar análisis de imágenes complejos. En lo sucesivo, analizaremos con precisión dichos dispositivos, por lo tanto, una cámara "inteligente" es solo el "ojo" de una computadora verdaderamente inteligente, que tiene toda la carga intelectual.
Room Scout: ¿Cuál es la utilidad del Gran Hermano en casa?
En 2014, Google anunció la Nest Cam, una pequeña cámara diseñada para monitorear la seguridad del hogar. Pudo reconocer los rostros de las personas, ver en la oscuridad, escuchar voces y también transmitir sus impresiones de lo que estaba sucediendo en la aplicación móvil de los anfitriones. Con la llegada del altavoz Home de Google activado por voz en 2016, fue posible integrar una cámara inteligente en el ecosistema de otros dispositivos inteligentes de Good Corporation.
Y a finales de 2017 y 2018. Pequeñas nuevas empresas ingresaron al mercado, dice Lighthouse, creado específicamente para el desarrollo y la promoción de cámaras "inteligentes", que ahora tienen varias docenas en el mercado. ¿Cómo funcionan estos dispositivos?
En el interior, la Nest Indoor IQ Cam tiene un procesador de seis núcleos, sensor 4K, micrófono y altavoz. Fuente: Nest.com
La cámara "inteligente" crea un modelo 3D dinámico de la habitación y todos los objetos que contiene. Cualquier cambio en la situación (movimiento, movimiento, apariencia de un nuevo objeto) se registra y se refleja en el modelo. El aprendizaje automático permite que la cámara clasifique los objetos y sus acciones. Cuanto más tiempo funciona la cámara, mejor comprende quién está frente a ella, reconoce a sí misma y a los demás, aprende a distinguir entre un niño y, por ejemplo, un perro. Se presta especial atención a las personas: la cámara reconoce caras, crea una base de visitantes con sus fotos en alta resolución y en diferentes ángulos, las compara y las numera. A veces, la cámara le pide al propietario a través de la aplicación que aclare el estado de una persona, mostrando fotos de sus rostros embarazosos. La cámara analiza lo que sucede sin parar, transfiere datos al servicio en la nube y a la aplicación del cliente.
Estas cámaras, tanto como parte de una casa inteligente como fuera de ella, permiten implementar una serie de nuevas características y escenarios. Si su querido perro se despertó antes que usted y comenzó a deambular por la casa, la cámara "inteligente" no lo despertará con buenos deseos, porque lo distingue del animal. Si el viento sacudió el árbol fuera de la ventana, la cámara no llama a la policía, creyendo que la casa se está rompiendo, porque los automóviles u objetos naturales también son identificados por ella. Un sensor de movimiento convencional podría responder fácilmente a tales eventos, causando problemas innecesarios.
Si no está en casa y, por ejemplo, un mensajero debe acudir a usted, puede abrirle la puerta de forma remota, seguir su movimiento con Nest, decirle a través del altavoz dónde dejar el paquete y luego despedirse cortésmente. Fuente: canal de YouTube de Google Nest
Pero la cámara "inteligente" presta atención a un nuevo vecino que vino a pedir sal. Cuando ve a una persona por primera vez, recuerda su rostro y también envía una notificación sobre el extraño a su casa. Por supuesto, si un vecino en su ausencia tomó prestado sal o más caro, la cámara daría una alarma. Si posteriormente una vecina jura por su madre que no iba a robar nada, la cámara aún la recordará, así como a todos los demás invitados que se han distinguido por un comportamiento inusual, especialmente los dispositivos avanzados que distinguen entre situaciones normales y de emergencia en el hogar.
Situación anormal en el hogar. Fuente: Canal de YouTube Wyze
Al regresar a casa del trabajo, le gustaría jugar a la Xbox, pero descubre que la consola no está en su lugar. ¿Vecino de nuevo? Mensajero? "No", la cámara informará. "Esta es tu amada madre, durante su visita de ayer, pon el dispositivo en el armario". La cámara puede informar la desaparición del sujeto del entorno habitual. Al salir de casa, le pide a la cámara que le notifique la visita de su madre en su ausencia. Tan pronto como esto suceda, recibirás un mensaje y llamarás a mamá para que no toques más la Xbox.
La funcionalidad descrita anteriormente ya es la capacidad real de las cámaras inteligentes, como Nest, Wyze Cam, Arlo, Simplisafe, etc. En 2018, el mercado de dichos dispositivos alcanzó los $ 7 mil millones, según Strategy Analytics. Para 2023, esta cifra puede crecer a $ 9.7 mil millones, y en "piezas" sus ventas pueden aumentar de los actuales 57 millones a 120 millones de unidades durante el mismo período.
Todo estará bien, donde quiera que vaya: cámaras inteligentes en las calles
En la década de 1980, una cámara que distinguía las placas por primera vez ayudó a encontrar un automóvil robado, pero solo en la década de 2010 las cámaras "inteligentes" aprendieron a analizar no una, sino miles de características de los objetos observados. Entonces, en agosto de 2017, el motor de búsqueda chino Baidu anunció que podía reconocer varias acciones de las personas, desde caminar con un perro y lavar ventanas hasta talar árboles, etc. - para 300 mil videos con una precisión del 88%.
Sin embargo, las cámaras inteligentes domésticas pueden hacer esto, pero observan una situación estacionaria, y las personas se mueven constantemente en la calle, y disparan sus diferentes lentes. ¿Cómo armar una sola imagen para el análisis?
Toshiba ha desarrollado la tecnología SATLYS. Identifica a una persona específica que ha caído bajo los lentes de diferentes cámaras. Para esto, la inteligencia artificial identifica una pequeña cantidad de características distintivas del individuo y las compara con los signos de otros transeúntes, que podrían entrar en la corriente de las cámaras vecinas.
SATLYS hace que las cámaras de calle funcionen en equipo para que pueda construir el camino de cualquier persona que use diferentes transmisiones. Fuente: Toshiba
La computadora no tiene en cuenta todas las características, para no sobrecargarse con comparaciones de millones de características de apariencia, sino que selecciona una o más características significativas. Son ellos los que está buscando en otros registros. Además, el sistema puede buscar a una persona mediante un atributo externo que se puede ingresar en el sistema, como en la línea de Google, por ejemplo, "mochila roja", "vestido blanco", "niña", etc.
La principal dificultad es que diferentes cámaras dan una imagen diferente de una persona debido a una falta de coincidencia en la calidad del disparo, el ángulo de visión, la ubicación de la luz, etc. Toshiba ha creado una tecnología que puede resaltar una característica específica de un individuo y buscar una coincidencia con ella en otras transmisiones de video. Fuente: Toshiba
Entonces, las cámaras "inteligentes" de la calle pueden reconocernos, entender lo que estamos haciendo y hacia dónde vamos. Que da Por ejemplo, esto es lo siguiente: salir de su casa por la mañana para llegar a su oficina ("inteligente", por supuesto, ¡qué más!), No le daba importancia al extraño que giraba en torno a la vecina Bentley, sino a la cámara "inteligente" de la casa (o más bien , el sistema de videovigilancia del que forma parte) ya ha transmitido información al respecto a la policía, porque sabe cómo identificar a los usuarios. Fumas un cigarrillo y lo arrojas a la acera: tendrás que pagar una multa por este pecador, porque los sistemas pueden distinguir entre delitos, incluso los más pequeños.
Decide ir a la oficina en el tren eléctrico de la ciudad. En la estación de tren, estás esperando un tren y ves a una persona tambaleándose por las vías. Tal vez esté borracho o se haya enfermado; esto también se informa al personal de la estación mediante un sistema de videovigilancia que determina el comportamiento humano inapropiado en lugares de mayor peligro.
En el tren, hablaste amablemente con una hermosa desconocida, y cuando te separaste, descubriste que tu reloj se evaporó. Lo único que recuerdas es la mochila roja sobre los hombros de la niña. Un policía de la estación hace una solicitud al sistema de video vigilancia "mochila roja", "niña" y encuentra a todos los hermosos extraños con mochilas rojas que aparecieron hoy en las grabaciones. Señalas con el dedo al tuyo: la policía la buscará.
Hitachi ha creado un sistema de videovigilancia para grandes espacios públicos (centros comerciales o estadios) que puede rastrear el movimiento de varias personas a la vez y analizar su apariencia (longitud del cabello, color de la ropa, etc.). Fuente: canal de YouTube CGTN
Desde la estación hasta tu trabajo favorito, unos dos kilómetros, y tomas una bicicleta. Estás conduciendo y todavía no sabes que un Gelendvagen está corriendo bajo el control de un tipo barbudo muy ocupado que ignora las señales de tráfico. Las cámaras inteligentes en la intersección te notaron a ti y a él hace mucho tiempo y te enviaron a ti y a otros transeúntes (y a la policía) una advertencia sobre un conductor peligroso en una aplicación móvil. Los semáforos detienen una señal roja para los peatones, y todos evitan problemas con seguridad, lo que no se puede decir sobre el conductor de un Gelendvagen. Y aquí está mi oficina favorita. Pero primero, sobre las imágenes de las hermosas ciudades del futuro y la realidad.
En la dura realidad, los chinos han logrado el mayor progreso en los sistemas públicos de videovigilancia inteligente, que están implementando tres proyectos en esta área a la vez. Las redes de cámaras con el nombre ominoso "Vigilant Eye" (más de 180 millones de dispositivos), así como Sky Net (no, esto no es una broma; más de 20 millones de lentes) y "Safe Cities" (no, esto no es ironía; más de 2 millones de cámaras) no son solo monitorean regularmente a los habitantes de la RPC, pero ya pueden reconocer y buscar criminales. Además, el Gran Hermano chino puede incluso castigar a los ciudadanos automáticamente. La transición a una luz roja implica fotografiar al intruso, reconocer su rostro y publicar automáticamente la vergüenza en la pizarra electrónica de la ciudad.
Pero la integración de la videovigilancia en la Internet urbana de las cosas aún se está desarrollando: es más costosa y más complicada. Entonces, en Detroit, una de las calles está equipada con un sistema de vigilancia inteligente asociado con semáforos y una aplicación móvil especial para ciudadanos. Identifica a los peatones descuidados y los informa en notificaciones a los conductores. También es capaz de extender el semáforo verde para los ciclistas que se acercan rápidamente a la transición.
Jefe tuerto: los pros y los contras de las cámaras inteligentes en el trabajo
Las cámaras en el lugar de trabajo han sido durante mucho tiempo parte del espacio de la oficina, pero en muchos sentidos siguen siendo decorativas si el jefe no está sentado al otro lado de la lente 24/7. Sin embargo, ahora puede ser reemplazado por inteligencia artificial.
En 2017, Microsoft presentó un sistema integral para la vigilancia inteligente del espacio de trabajo. Las cámaras, las computadoras y los periféricos están conectados a una "nube inteligente" remota que utiliza inteligencia artificial para analizar lo que está sucediendo en términos de seguridad y productividad. En este caso, las cámaras inteligentes funcionan como parte del ecosistema de Internet de las cosas. Además de analizar más de 27 millones de eventos diferentes en la imagen, las herramientas de IA en la nube reciben señales de computadoras de trabajo, máquinas herramientas y otros equipos.
¿Cómo se siente trabajar en una oficina así? El escenario puede ser así. Vas a trabajar sin pases porque la cámara corporativa te conoce a simple vista. Se presenta un colega: nunca saluda, pone su taza sobre tus documentos y bromea sobre tu madre. La cámara inteligente considera la expresión agria de su rostro y transmitirá información sobre un posible conflicto al departamento de recursos humanos. Inmerso en los pensamientos de un nuevo vecino, olvida por completo adjuntar una insignia con un nombre y una foto a un lugar destacado, según lo exigen las normas corporativas. Vaya descuidadamente al lugar de trabajo, sin saber que ya se ha encontrado con una multa, porque la cámara inteligente grabó su violación y transmitió información al respecto al jefe del departamento, quien, después de unos minutos, le recordará la importancia de cumplir con las normas de la empresa (de manera aguda y poco agradable). manera), porque recibió una notificación sobre un empleado sin una insignia en su teléfono inteligente. Pero las cámaras también lo siguen y saben: últimamente ha estado durmiendo con demasiada frecuencia frente al monitor apagado, y olvida dónde dejó la placa, aunque la cámara "inteligente" lo ayuda a encontrarla.
Un jefe inteligente puede ser útil no solo en la oficina, sino también en el hospital: un paciente con una afección cardíaca decidió caminar por el departamento. Una cámara inteligente captura esto. Un dispositivo que mide su ritmo cardíaco también transmite información a la "nube inteligente". Tan pronto como el corazón del paciente comienza a cansarse, suena una alarma y una de las enfermeras se acerca al paciente. Fuente: canal de YouTube de Microsoft
Al salir del trabajo, obtiene un informe sobre su rendimiento durante el día: en función de los datos de video, los gráficos de actividad compilados por AI, así como una lista de errores.
Estamos lejos de ser un sistema integral de análisis de flujo de trabajo en el que las cámaras tengan un papel destacado. Si bien controlan principalmente el cumplimiento de las normas de seguridad. Por ejemplo, en la sucursal australiana de la compañía internacional de construcción Laing O'Rourke, se ha introducido un sistema para monitorear y advertir situaciones peligrosas en un sitio de construcción. Tan pronto como las cámaras inteligentes ven un posible peligro para los trabajadores, envían mensajes de amenaza a sus teléfonos inteligentes o relojes inteligentes.
Pero el análisis de la productividad de los empleados se basa principalmente no en la observación directa de ellos, sino en el monitoreo de operaciones de trabajo específicas. Dichos datos son más fáciles de "tomar" de las computadoras y otros equipos de trabajo que observar a un empleado cuyo brazo entero solo puede mover el mouse.
Está bien, es hora de mudarse a casa de la oficina, pero primero debe buscar en la tienda.
Bajo la mirada de los especialistas en marketing: por qué las cámaras "inteligentes" en un centro comercial
Las cámaras han estado observando a los ladrones sin robar nada de la tienda. Pero para esto, la inteligencia "natural" de un guardia de seguridad sentado todo el turno frente al monitor suele ser suficiente. Mientras tanto, la mayoría de las cámaras ven a los clientes respetuosos de la ley, y esta información de video puede ser mucho más útil para los minoristas.
En particular, la red estadounidense Walmart se dio cuenta de esto, que abrió en abril de 2019 una tienda equipada con cámaras, cuya imagen es procesada por inteligencia artificial. Las cámaras y sensores en el supermercado generan 1,6 TB de información por segundo, que el servidor procesa directamente en la tienda.
Para impresionar a los visitantes de un hipermercado inteligente, Walmart colocó un centro de datos que recibe datos de cámaras y sensores justo en el área de ventas detrás del cristal. Fuente: Walmart
La videovigilancia en este caso no implica la identificación de los clientes: las cámaras monitorean principalmente las acciones de los clientes, así como los productos en los estantes. En los rincones oscuros (por ejemplo, en las profundidades de los estantes) hay sensores que ayudan al sistema a comprender si los productos están en su lugar o no. Además, las cámaras pueden reconocer el género, la edad y el tipo de figura del cliente y mostrar señalización digital para él en la que pasa, ofertas especiales y anuncios correspondientes a estas características.
¿Qué se puede comprar debajo de la cámara? Amablemente: una vez que fue a la tienda, las cámaras "inteligentes" ya determinaron el sexo, la edad e incluso asumieron el estado inactivo. Te diriges al departamento de bebidas para tomar jugo, pero aquí te encuentras con juguetes y te quedas un poco en los autos controlados por radio, olvidando a dónde fuiste. El próximo mes, por recomendación de AI, los departamentos cambiarán de lugar, porque siempre compras jugos y cosas por el estilo, y nunca juguetes. Llegas a los estantes con jugo y, al descubrir que tu querida manzana no está allí, te vas a ir, pero aquí ves a un empleado de la tienda que enrolla un carrito con tu jugo favorito. Las cámaras y los sensores encontraron una falta de este producto en el estante y se los hicieron saber en el almacén.
Los sistemas inteligentes de videovigilancia de Toshiba pueden capturar los recorridos más lentos de los clientes en los escaparates que le interesan. Esta información se puede utilizar para optimizar aún más la ubicación de varias tiendas en centros comerciales. Fuente: Toshiba
Ahora es el momento de la salchicha: ya buscó su Cracovia favorita, pero aquí nuevamente el empleado de la tienda interviene en sus compras pacíficas. Saca la salchicha del estante porque su fecha de vencimiento fue determinada por su color y forma de la cámara. Tomas un doctorado, sigues adelante, y luego un empleado de la tienda trae una canasta que olvidaste llevar en la entrada: las cámaras notaron que tus manos estaban ocupadas con cerveza y salchichas, y enviaron una señal al personal. Además, fueron ellos quienes le dieron la canasta, no el carro, porque las cámaras vieron cómo llegó a pie y no llegaron en automóvil, de lo que concluimos que no necesita muchos productos. Está a punto de irse, pero ve a una persona extraña: mira sospechosamente a su alrededor y mira una botella de buen whisky por 100,500 rublos. Este es el mismo extraño que pasó el rato en la vecina Bentley por la mañana. Pero luego un guardia se acerca a él y comienza una conversación con él. Las cámaras reconocieron el comportamiento sospechoso característico de los pequeños ladrones y alertaron al personal antes de que ocurriera el crimen.
Hasta la fecha, lejos de todas las características descritas se han implementado. El hipermercado "inteligente" de Walmart mencionado anteriormente sigue siendo un solo ejemplo, y los minoristas usan cámaras "inteligentes" principalmente para analizar el tráfico de los consumidores y optimizar su negocio. Dichas soluciones ya son suministradas por empresas como GoodVision. Se han desarrollado cámaras de predicción de robo (startup japonesa Vaak), pero aún no se han implementado ampliamente. Finalmente, la tecnología de control de calidad visual del producto y su variedad es una cuestión de futuro, ya que aún es más rentable para los minoristas atraer mano de obra relativamente barata para estos fines.
Epílogo: Gran Hermano, ¿bueno o malo?
En mayo de 2019, las autoridades de San Francisco prohibieron que la policía y otros servicios municipales usaran cámaras inteligentes con reconocimiento facial. San Francisco, amigable con la innovación, fue la primera ciudad de los Estados Unidos en imponer tal prohibición. El ayuntamiento decidió que esta tecnología amenaza los derechos de la población. Mientras tanto, en otra ciudad estadounidense, Boston, fueron estos sistemas los que ayudaron a encontrar a los autores del ataque en el maratón dos años antes, y no hay prohibición allí. ¿Quién tiene la razón? Quizás el que comprende que la técnica es imparcial y que solo el usuario final de sus capacidades es importante.
Son sus motivos los que determinan si la lente de una cámara inteligente está dirigida a nosotros o si solo nos mira con cuidado.