Programa de reconocimiento de imágenes de autoaprendizaje de Disney Research



Un equipo de investigadores de la división de Pittsburgh de Disney Research ha desarrollado un sistema de visión por computadora que utiliza algunos principios de la visión humana ( pdf ). En particular, contiene algoritmos para el autoaprendizaje y es capaz de mejorar el reconocimiento de objetos con el tiempo.

Como la mayoría de los otros sistemas de visión por computadora, el desarrollo de Disney Research construye un modelo conceptual para cada objeto, ya sea un avión o un dispensador de jabón. En este caso, se utiliza un algoritmo entrenado que analiza muchas fotos de un objeto dado.

Una característica distintiva del algoritmo de Disney Research es que posteriormente utiliza este modelo para reconocer objetos en el video, mientras extrae simultáneamente nueva información sobre estos objetos y complementa el modelo establecido originalmente. Esto le permite reconocer objetos en un rango más amplio, incluso si se ven diferentes a las muestras encontradas previamente.

Las ilustraciones (clicables) muestran el resultado del reconocimiento de patrones. En la fila superior hay imágenes de prueba de la base de datos ImageNet, que se usaron para entrenar el modelo original. En la fila inferior hay ejemplos de reconocimiento correcto de objetos por parte del programa IDE-LME. Los investigadores señalan que los objetos reconocidos en las fotografías difieren significativamente en apariencia de los utilizados para entrenar el sistema. "El proceso [de autoaprendizaje] continúa, potencialmente indefinidamente, durante toda la vida del sistema de reconocimiento", dice Leonid Sigal, miembro principal de Disney Research Pittsburgh. "Este es un sistema de autoaprendizaje que evoluciona continuamente a través de la adquisición incontrolada de experiencia, conformando un modelo de mundo cada vez más completo y complejo".







El modelo conceptual para cada objeto se expande y refina gradualmente a medida que el sistema encuentra nueva información. Teóricamente, dicho método puede llevar al hecho de que actuando sin supervisión, el sistema asignará características que son inusuales para el objeto, lo que resultará en errores de reconocimiento. Pero los autores del programa dicen que tal problema aún no se ha notado.

Además de Sigal, los autores del trabajo científico incluyen a Alina Kuznetsova, Bodo Rosenhahn de la Universidad de Wilhelm Leibniz (Hannover, Alemania) y el ex empleado de Disney Sen Hwan Yu (ahora trabajando en el Instituto Nacional de Ciencia) y tecnología en Ulsan (Corea del Sur).

La presentación del trabajo científico tuvo lugar en la conferencia IEEE sobre visión por computadora y reconocimiento de patrones en Boston (7-12 de junio de 2015).

Source: https://habr.com/ru/post/es380363/


All Articles