¿Cuál es la "interfaz intuitiva" en chatbots, asistentes virtuales, avatares y robots sociales?

imagen

Mientras preparamos un artículo técnico completo para usted, hablaremos sobre negocios y tendencias en el campo de los sistemas inteligentes.

A un ritmo muy rápido, trabajar con big data y sistemas inteligentes entra en nuestras vidas. Y, como cualquier tendencia, un cuello de botella se revela inmediatamente de inmediato aquí, es decir, la interfaz. No importa cuán "inteligente" pueda ser el sistema, con cualquier información y sin importar cuán alta calidad funcione, el resultado de su trabajo debe ser comprensible para el hombre. El mismo trabajo con dicho sistema debería ser conveniente para el usuario. Junto con la introducción de la transformación digital, Big Data, sistemas IoT, la empresa requerirá explícitamente la creación de una interfaz ergonómica y más intuitiva para la interacción humana con estos sistemas. El problema de las soluciones de interfaz de alta calidad se manifestará cada vez más claramente. Y este problema es especialmente grave cuando el sistema no es tratado por un "profesional especialmente capacitado", sino por un usuario común.


Luego nos preguntamos: ¿qué es una "solución de interfaz de alta calidad"? Comenzamos a buscar la respuesta en casos específicos. Y la lógica nos llevó a mirar de cerca los casos de la reciente conferencia internacional CES2018, aquí están:


Sí, este es el mismo video sobre hablar con LG Cloi (pero el video es interesante, no solo eso)

Aquí hay algunos ejemplos más:


Los asistentes virtuales vuelven a dominar el CES 2018


Honda trae dispositivos robóticos al CES 2018

Hay muchos casos, en primer lugar, indican una gran variedad de soluciones de interfaz, que son bastante difíciles de organizar. A veces, en tales decisiones puede ser difícil encontrar un componente comercial: qué tareas comerciales específicas (tareas del cliente) deben resolver y en qué funcionalidad debe expresarse.

Veamos algunos puntos en el informe de la famosa agencia de análisis de Gartner "Tendencias principales en el ciclo de bombo de Gartner para las tecnologías emergentes, 2018" . En la cima de las expectativas tecnológicas (Expectativas), vemos asistentes virtuales (Asistentes virtuales) y robots inteligentes (Smart Robots). También debe prestar atención a este informe "Guía de mercado de Gartner para plataformas conversacionales, 20 de junio de 2018" .

Una buena experiencia en la sistematización de lo que está sucediendo en el mercado para nosotros fue un documento de PwC: "La relevancia y el encaje emocional" PwC Digital Services, Holobotics Practice " .

El análisis combina Chatbots, Asistentes virtuales y Robots interactivos humanoides en un tipo de solución de interfaz: Humanoid Companion. Además, divide esta solución en 2 subtipos: Robótica física y Robótica en línea. Tenga en cuenta que ahora los subsegmentos de mercado indicados, que esencialmente resuelven la tarea similar de crear una solución de interfaz ergonómica y de alta calidad, están significativamente divorciados: a menudo son manejados por varios fabricantes y proveedores especializados, varios analistas, etc. El subtipo en el documento PwC se basa en el criterio "qué hardware es la base de la solución": robot físico, columna, computadora.

imagen
Inteligencia de red automatizada para acceso múltiple. Crédito: PWC. Disponible aquí

Proponemos introducir otro criterio, que, en nuestra opinión, proporcionará una imagen más clara y una sistematización más clara de este tipo de decisión. Este criterio es una modalidad de interacción, una modalidad que se incluye en la solución de interfaz. Consideremos con más detalle.

Hay 4 niveles / modalidades principales en los que tiene lugar la interacción (cómoda y ergonómica para una persona): palabras, voz, cara, cuerpo. Al comunicarnos entre nosotros, incluimos en la comunicación parte de estas modalidades o todas las modalidades a la vez. Esto es exactamente lo que vemos ahora en los sistemas front-end: diversas soluciones dirigidas a la misma tarea, pero que difieren según las modalidades incluidas en ellos.

imagen
Crédito: Neurodata Lab.

Estos son ejemplos (las empresas, por ejemplo, se toman de la revisión de Forrester de " Los 10 mejores chatbots para el servicio al cliente empresarial "):

Chatbot : en tales soluciones solo se usa una modalidad: palabras, interacción de texto.


Asistente : un asistente virtual supone la presencia de una segunda modalidad: voz, interacción a través del habla:


Avatar es soluciones más complejas y raras, ahora se pueden ver principalmente en la esfera de recursos humanos:



También hay algunas, digamos, soluciones intermedias que usan diferentes modalidades dependiendo del lado de la interacción (por ejemplo, una persona escribe, un asistente habla y se mueve, etc.). Curiosos ejemplos:


Robot , y nuestros queridos robots humanos, agentes de comunicación multimodal que trabajan de inmediato en el nivel de 4 modalidades: palabras, voz, cara y cuerpo.


imagen
Vector de Anki. Crédito: Anki

Lo que es especialmente importante: la inclusión de nuevas modalidades, por un lado, abre posibilidades completamente nuevas para el sistema, y ​​por otro lado requiere tecnologías adicionales: tecnologías nuevas y avanzadas en el campo de la IA, en particular en el campo de la inteligencia artificial emocional, destinadas a trabajar con el procesamiento del lenguaje natural ( procesamiento de lenguaje natural) y enfocado en soluciones (interfaz) de este tipo.

Si desea recibir nuestras nuevas publicaciones directamente, si el artículo le interesa y desea obtener acceso al stand de demostración que muestra el trabajo de nuestros productos Emotion AI, puede contactar al autor del artículo:

Olga Serdiukova
Director de Marketing y Director de Desarrollo de Socios
Neurodata Lab LLCCorreo electrónicoLinkedIn

Source: https://habr.com/ru/post/es421037/


All Articles