Google Clips: primera cámara con IA

Google celebró recientemente una conferencia en la que presentó las últimas noticias, entre las cuales la cámara Google Clips causó sensación. Imagine una cámara digital ordinaria: mire la pantalla, ajuste la configuración, presione el botón para hacer una foto ... ¡Entonces, en Clips no hay nada de esto! En lugar de una persona, la inteligencia artificial es responsable de la foto, y solo tiene que mirar los clips que resultaron al final. La cámara no tiene pantalla en absoluto: mira el mundo con su propia lente y piensa que sería eliminada.


GoPro comparte el día después de que la presentación de Google Clips cayó un 5% y aún no ha regresado a los niveles anteriores. Y la IA en la cámara ya ha conmocionado a Ilon Mask, por el hecho de que ahora "ni siquiera está tratando de parecer inocente". El paquete está mirando de dónde viene todo este ruido.



Que bestia


Google Clips: un pequeño dispositivo de plástico, un cuadrado con lados de cinco centímetros, que se puede fijar en una camisa como un clip o poner sobre una mesa. Exteriormente, la cámara parece un ícono de Instagram que apareció en el mundo real. Color: blanco por delante y turquesa por detrás.


Para encender el dispositivo, solo necesita girar la lente. Además, según Google, puedes olvidarte de la cámara. Clips rastrea todo lo que sucede en su campo de visión de 130 grados y graba clips de siete segundos de lo que le parece interesante. Con el tiempo, el dispositivo recuerda caras e intenta tomar más fotos de personas "familiares" y menos fotos de transeúntes aleatorios. La misma IA se aplica a los animales. Los clips no fotografiarán a un gato alienígena desconocido, quemado si no hizo nada especial. Y aquí está tu mascota favorita: por favor, es suficiente para voltear la cabeza bellamente o levantar la pata.


Google cree que será muy agradable: deje la cámara para cuidar a los niños o las mascotas y regrese a los clips cliqueados con los momentos más divertidos. Además, la cámara se hace cargo de los hábitos de sus propietarios y finalmente reconoce los rostros de esas personas y animales que a menudo caen en su lente.

El dispositivo es similar a una cámara tradicional a menos que sea por la presencia de una lente. No hay un obturador y un visor familiares, el dispositivo no está diseñado para ser sujetado con las manos. Todo lo que es es un clip de silicona, gracias al cual el dispositivo se puede colocar en una superficie horizontal o adherirse a la ropa en cualquier ángulo, y el puerto de abajo para recargar. Los clips se transfieren al teléfono inteligente a través de Wi-Fi y se abren allí en una aplicación especial. Entre ellos, puede deslizar para dejar los marcos que desee. También hay una sección con esas imágenes que el sistema considera "menos interesante". Los clips se exportan a JPEG, GIF, formatos de video y Motion Photos (para teléfonos inteligentes Samsung).


¿Cómo toma la decisión de disparar la inteligencia artificial en Google Clips? En la presentación, Juston Payne , el jefe del equipo de desarrollo del dispositivo, describió el tren de pensamiento de la máquina de la siguiente manera:

Todo comienza con la pregunta: “¿Hay una cara en el marco? ¿Conozco esta cara? ¿Esta persona tiene ciertas propiedades? Ojos abiertos, sonrisa y cosas así. Luego, la IA piensa en lo bien que se verá el marco ahora. ¿Es adecuada la iluminación? ¿El marco será borroso?
De hecho, todo, por supuesto, es un poco más complicado. Por ejemplo, Clips tiene una necesidad de novedad: intentará no darte lo mismo y tomar en cuenta las imágenes que te gustaron.


El usuario también puede actuar como operador. Delante, debajo de la lente, hay un pequeño obturador, cuando se presiona, se hace un clip. Y en la aplicación en el teléfono inteligente funciona "transmisión en vivo". Puede ver todo lo que mira la cámara y ordenarla remotamente para que comience a disparar.



Big Brother te está mirando


Después de la presentación en los Estados Unidos, naturalmente hubo un escándalo por el espionaje de Google. Por ejemplo, poner un ojo que todo lo ve en tu habitación, que también piensa algo allí, es espeluznante. Hay otro campamento: los que encuentran las cámaras de diseño muy lindas, por lo que sospechan de un objeto tan bonito en la vigilancia como la blasfemia. Google dice que siempre estará claro si la cámara toma fotos, ya que parpadeará un LED blanco.


Tratando de evitar rumores innecesarios, los desarrolladores también hicieron todo lo posible para proteger la información personal del usuario. Primero, todo el trabajo de Clips se realiza localmente. No envía ningún dato al "cerebro" de Google, excepto las imágenes que usted mismo guarda en Google Photos. El reconocimiento facial también lo realiza la propia cámara. Ella no sabe dónde vive una persona y no compara caras con nombres en ninguna base de datos. En segundo lugar, los clips creados no se envían a ningún lado. Se almacenan en la cámara, hasta que se sincroniza con su teléfono inteligente, y usted mismo no solicita verlos. En tercer lugar, estos clips están encriptados. Si el clip se cae repentinamente durante una caminata, la gente no podrá ver lo que hay debajo de su caja.


Hablando de eso ...

Que hay dentro


A diferencia de la columna inteligente Google Home, que se basa completamente en conectarse a la nube, Google Clips es un objeto completamente autónomo. Mira lo que sucede a su alrededor, elige un momento, toma una foto, la envía a un teléfono inteligente, y todo esto por su cuenta. Para un dispositivo un poco más grande que una caja de fósforos, las posibilidades son muy impresionantes. Esto lo contó Remy El-Ouzzana, jefe del equipo de Intel, que trabajó en un procesador de procesamiento de imágenes (VPU) de baja potencia para Clips:

Todos nos sorprendimos de cuánta inteligencia Google podría caber en un dispositivo tan pequeño. Esta cámara inteligente muestra el nivel de inteligencia artificial incorporado con el que solo podíamos soñar antes.

Para que el cerebro electrónico que trabaja dentro de Clips aprenda a distinguir la fotografía buena de la mala, Google colaboró ​​con editores profesionales y todo un ejército de evaluadores de imágenes. "No existe un modelo de aprendizaje automático que pueda decir: un niño está gateando en el piso, probablemente se ve bien", explicó Juston Payne. Por lo tanto, Google recopiló terabytes de su propio video. Y luego los evaluadores le dieron puntos, fue marcado y se convirtió en una base de entrenamiento para la inteligencia artificial. Con el tiempo, el dispositivo comenzó a comprender la psicología de las personas, a sentir que les gusta, que les interesa. Este proceso no se ha completado: Google Clips suministrado de fábrica todavía está aprendiendo. Si entregas dos cámaras idénticas a ti y a tu amigo, en un par de semanas comenzarán a disparar cosas diferentes.



El aprendizaje automático de Google tiene un inconveniente. Hasta ahora, Clips solo reconoce bien a personas y animales (de hecho, solo gatos y perros: los hámsters o cerdos domésticos no son interesantes para la cámara). No puede llevar el dispositivo de vacaciones y esperar que se deleite con la puesta de sol o haga clips con palmeras que se mecen. Con el tiempo, Google ampliará el modelo de aprendizaje automático, hará que admita más situaciones y pueda comprender el mundo.


En cuanto a las especificaciones técnicas , el dispositivo está equipado con un sensor de 12 megapíxeles; Es capaz de grabar una serie de cuadros a una velocidad de 15 fps. El almacenamiento interno: 16 GB parece muy modesto, pero de hecho es suficiente para almacenar dos días completos de clips. No hay micrófono, el dispositivo solo puede grabar imágenes. La batería dura más o menos tres horas de trabajo activo; depende de si hay algo interesante que pueda disparar. Si no hay nada allí, la cámara, como dicen los representantes de Google, "se aburre".


Residuo seco


Hasta ahora, los clips solo pueden funcionar con los teléfonos inteligentes Pixel, iPhone, Samsung Galaxy S7 y Galaxy S8. Los gerentes de proyecto prometen que el soporte para otros teléfonos inteligentes está a la vuelta de la esquina. La fecha oficial de lanzamiento de la cámara en la presentación no se llamó. Solo sabemos que costará $ 249 y estará disponible en los Estados Unidos en un "futuro cercano".



Google espera que el dispositivo tenga demanda entre las familias jóvenes, los dueños de perros o gatos y solo aquellos que desean tomas interesantes, pero están demasiado ocupados para sentarse y esperar la toma perfecta. Clips tiene el potencial de combinar las funciones de GoPro, una "caja de jabón" normal y una cámara para "registro de vidas". Confunde solo la baja calidad de las imágenes. Pero todos los revisores que obtuvieron acceso al dispositivo están de acuerdo en que la inteligencia artificial no es una estratagema de marketing, sino un asistente realmente útil e interesante. Pones la cámara en la habitación y juegas tranquilamente con tus hijos, olvidando todo lo superfluo. Y después de un par de horas, la cámara está llena de clips con los momentos más interesantes.


Sobre el suministro de Google Clips a Rusia no se habla. Pero todos los otros dispositivos populares, incluido el más barato "séptimo" o el nuevo "octavo" iPhone , de los Estados Unidos a las mejores tarifas, ofrecen un paquete . Ahorre dinero comprando dispositivos directamente en Estados Unidos. Hasta el 31 de octubre, ayudamos a realizar pedidos en 7 tiendas estadounidenses de forma gratuita (puede comprar, por ejemplo, buena ropa a precios razonables). Y los lectores de Geektimes que se registren en este enlace recibirán un descuento del 7% en su primera entrega. El Black Friday está por delante, ¡es hora de comenzar a prepararse!




Algunos artículos más del paquete:


Source: https://habr.com/ru/post/es407739/


All Articles