El primer asistente de voz "neutral en género" del mundo presentado en el SXSW IT Festival

En SXSW introdujo un asistente virtual cuya voz en el sonido no se parece ni femenina ni masculina. Contamos cómo se creó y miramos las perspectivas.


Foto Gareth Halfacree / CC BY-SA

¿Por qué se necesita una voz de "neutralidad de género"?


Según los estudios, los usuarios de altavoces inteligentes y asistentes de voz carecen de una versión "neutral" de la voz sin características femeninas o masculinas pronunciadas. En la encuesta de I + D de Space10, casi la mitad de los 12,000 encuestados preferiría escuchar la voz "asexual" de un asistente. En este diseño, las personas lo asocian mejor con sistemas de inteligencia artificial ocultos "bajo el capó" de un asistente. La voz neutral es más adecuada para la imagen del "automóvil". Sin embargo, los grandes jugadores en este mercado no tienen esa opción.

Los expertos de Virtue propusieron su solución: en la conferencia SXSW en Austin, presentaron un nuevo asistente de voz "asexual" llamado Q. Fue desarrollado conjuntamente con la organización sin fines de lucro Equal AI, treintasoundsgood y Koalition Interactive, así como expertos en lingüística.

Cómo funciona Q Assistant y cómo se creó


Para crear un nuevo asistente, las voces de cinco personas se "combinaron" en una sola. La "voz" final se dio para escuchar a los usuarios potenciales de un asistente de diferentes países de Europa: las personas tenían que calificar en una escala de cinco puntos cuánto se parecía a una mujer. De acuerdo con los resultados de la prueba, se corrigió la voz (se hizo más baja o más alta) y luego nuevamente se les permitió escuchar a los usuarios.

El trabajo iterativo con un grupo focal de cuatro mil quinientos encuestados llevó a los autores del proyecto a una interpretación de voz "neutral".

Según los desarrolladores, el sonido de Q parece a las personas "sin sexo", porque la voz del asistente se encuentra en el rango de frecuencia entre las voces masculinas y femeninas. Para el primero, el espectro de frecuencia es 80–180 Hz, y para el segundo, 140–255 Hz. La voz Q cae en el rango neutral de 145-175 Hz, lo que no permite determinar de manera única el género.

Puede escuchar cómo suena el asistente en el video en este enlace , así como en el sitio web del proyecto.


Opiniones y potencial


Los periodistas responden positivamente al proyecto Q. Según el columnista de CNBC, el asistente suena bastante "confiado", pero al mismo tiempo parece amable y receptivo. Los autores del proyecto hablaron sobre las perspectivas del asistente. Creen en el éxito de la idea, porque Q amplía las posibilidades de elección para los usuarios de altavoces inteligentes y asistentes de voz.

Los desarrolladores no planean lanzar su propio dispositivo o aplicación, pero quieren atraer la atención de las compañías de TI y ofrecerles que agreguen una voz neutral para sus asistentes. Los creadores de Q planean informar a las compañías de transporte, el estado y otras organizaciones que usan anuncios de voz sobre su producto.

Sin embargo, el futuro del proyecto sigue sin estar claro. Ninguna compañía de tecnología ha anunciado aún su deseo de trabajar con los creadores de Q y, tal vez, después del ruido en los medios tecnológicos, los gigantes de TI desarrollarán un asistente "neutral en cuanto al género" de forma independiente.

¿Quién más está desarrollando asistentes asexuales?


En el área de asistentes de voz, todavía no hay análogos Q. Sin embargo, la capacidad de elegir el "género" de la votación ya está presente en todos los proyectos notables en esta área. Para los usuarios de habla inglesa en el Asistente de Google , hay disponibles diez voces masculinas y femeninas diferentes, y en Siri, una voz masculina y femenina con diferentes acentos. Puede cambiar el sonido en Amazon Alexa: hay diferentes voces disponibles en las "habilidades" del altavoz inteligente.


Foto Tony Webster / CC BY-SA

Los análogos Q se pueden encontrar en el área de chatbot. Uno de los primeros bots "neutrales al género" fue desarrollado en la compañía británica Sage, se llamaba Pegg. Según el gerente del proyecto, Kriti Sharma, el asistente se hizo asexual para crear la identidad de un bot para él, no un bot que pretendiera ser humano .

Los bots de chat neutros también se están desarrollando para la cadena de tiendas GoDaddy y Lowe's; ambos bots se utilizarán en el campo del servicio al cliente.

Conclusiones


Aunque los creadores de altavoces inteligentes y asistentes amplían la gama de voces disponibles, el sonido "predeterminado" del asistente no se modifica. Según Slate, esta persistencia puede estar relacionada con el reconocimiento de marca: si la voz del asistente cambia drásticamente, provocará una reacción negativa para los usuarios que están acostumbrados a distinguir entre los diferentes servicios de oído.

Lo más probable es que las voces "neutrales" no se conviertan en el estándar generalmente aceptado en el mercado de los asistentes de voz grandes. Sin embargo, la popularidad de tales soluciones entre los usuarios puede llevar a la aparición de nuevos jugadores que pueden ofrecer una amplia variedad de imágenes de asistentes virtuales.



Lectura adicional: sobre sonido y música de nuestro blog y canal de Telegram:

Como dicen los árboles y otras plantas
Cómo convertir gráficos en sonido y por qué lo necesita
A. Grabar y editar un podcast
A. ¿Cuáles son las características y tareas del acompañamiento sonoro de los juegos?


Source: https://habr.com/ru/post/444002/


All Articles