O primeiro assistente de voz “neutro em gĂȘnero” do mundo apresentado no SXSW IT Festival

Na SXSW introduziu um assistente virtual cuja voz no som nĂŁo se parece com mulher ou homem. Contamos como foi criado e olhamos para as perspectivas.


Foto Gareth Halfacree / CC BY-SA

Por que Ă© necessĂĄria uma voz "neutra em termos de gĂȘnero"


Segundo estudos, os usuĂĄrios de alto-falantes inteligentes e assistentes de voz nĂŁo possuem uma versĂŁo "neutra" da voz, sem caracterĂ­sticas pronunciadas de homem ou mulher. Na pesquisa de P&D do Space10, quase metade dos 12.000 participantes prefere ouvir a voz "assexual" de um assistente. Nesse design, as pessoas o associam melhor a sistemas de IA ocultos "sob o capĂŽ" de um assistente. A voz neutra Ă© mais adequada para a imagem do "carro". No entanto, grandes players neste mercado nĂŁo tĂȘm essa opção.

Os especialistas em virtude propuseram sua solução - na conferĂȘncia SXSW em Austin, eles introduziram um novo assistente de voz "assexual" chamado Q. Foi desenvolvido em conjunto com a organização sem fins lucrativos Equal AI, trintasoundsgood e Koalition Interactive, alĂ©m de especialistas em linguĂ­stica.

Como o assistente Q funciona e como foi criado


Para criar um novo assistente, as vozes de cinco pessoas foram "combinadas" em uma. A "voz" final foi dada para ouvir os usuĂĄrios em potencial de um assistente de diferentes paĂ­ses da Europa - as pessoas tinham que avaliar em uma escala de cinco pontos o quanto ele parecia uma mulher. De acordo com os resultados do teste, a voz foi corrigida - tornada mais baixa ou mais alta - e novamente permitida a escuta dos usuĂĄrios.

O trabalho iterativo com um grupo de foco de quatro mil e quinhentos entrevistados levou os autores do projeto a um desempenho de voz “neutro”.

Segundo os desenvolvedores, o som de Q parece para as pessoas "sem sexo", porque a voz do assistente estĂĄ na faixa de frequĂȘncia entre as vozes masculina e feminina. Para o primeiro, o espectro de frequĂȘncia Ă© de 80 a 180 Hz e, para o segundo, a 140 a 255 Hz. A voz Q cai na faixa neutra de 145-175 Hz, o que nĂŁo permite determinar exclusivamente o sexo.

VocĂȘ pode ouvir como o assistente soa no vĂ­deo neste link , bem como no site do projeto.


OpiniÔes e Potencial


Jornalistas respondem positivamente ao projeto Q. Segundo o colunista da CNBC, o assistente parece bastante "confiante", mas ao mesmo tempo parece amigĂĄvel e receptivo. Os autores do projeto falaram sobre as perspectivas do assistente. Eles acreditam no sucesso da ideia, porque Q expande as possibilidades de escolha para usuĂĄrios de alto-falantes inteligentes e assistentes de voz.

Os desenvolvedores nĂŁo planejam lançar seu prĂłprio dispositivo ou aplicativo, mas querem atrair a atenção das empresas de TI e oferecer-lhes uma voz neutra para seus assistentes. Os criadores do Q planejam informar as empresas de transporte, o estado e outras organizaçÔes que usam anĂșncios de voz sobre seus produtos.

No entanto, o futuro do projeto permanece incerto. Nenhuma empresa de tecnologia anunciou ainda seu desejo de trabalhar com os criadores do Q e, talvez, apĂłs o barulho da mĂ­dia tecnolĂłgica, um assistente "neutro em gĂȘnero" seja desenvolvido por gigantes de TI de forma independente.

Quem mais estĂĄ desenvolvendo assistentes assexuais


Na ĂĄrea de assistentes de voz, ainda nĂŁo existem anĂĄlogos Q. No entanto, a capacidade de escolher o "gĂȘnero" da votação jĂĄ existe em todos os projetos notĂĄveis ​​nesta ĂĄrea. Para usuĂĄrios que falam inglĂȘs no Google Assistant , dez vozes masculinas e femininas diferentes estĂŁo disponĂ­veis e, no Siri, uma voz masculina e feminina com sotaques diferentes. VocĂȘ pode alterar o som no Amazon Alexa - vozes diferentes estĂŁo disponĂ­veis nas "habilidades" do alto-falante inteligente.


Foto Tony Webster / CC BY-SA

Os anĂĄlogos Q podem ser encontrados na ĂĄrea de chatbot. Um dos primeiros robĂŽs "neutros em gĂȘnero" foi desenvolvido na empresa britĂąnica Sage - foi chamado Pegg. Segundo o gerente de projeto Kriti Sharma, o assistente foi feito assexuado para criar a identidade de um bot para ele, nĂŁo um bot que finge ser humano .

TambĂ©m estĂŁo sendo desenvolvidos bots de bate-papo neutros para a rede de lojas GoDaddy e Lowe - ambos os bots serĂŁo usados ​​no campo de atendimento ao cliente.

ConclusÔes


Embora os criadores de alto-falantes e assistentes inteligentes expandam o leque de vozes disponĂ­veis, o som "padrĂŁo" do assistente permanece inalterado. Segundo Slate, essa persistĂȘncia pode estar relacionada ao reconhecimento da marca - se a voz do assistente mudar drasticamente, causarĂĄ uma reação negativa para os usuĂĄrios que estĂŁo acostumados a distinguir entre diferentes serviços de ouvido.

Muito provavelmente, vozes “neutras” nĂŁo se tornarĂŁo o padrĂŁo geralmente aceito no mercado de grandes assistentes de voz. No entanto, a popularidade de tais soluçÔes entre os usuĂĄrios pode levar ao surgimento de novos jogadores, que podem oferecer uma ampla variedade de imagens de assistentes virtuais.



Leitura adicional - sobre som e mĂșsica do nosso blog e canal Telegram:

Como as ĂĄrvores e outras plantas dizem
Como transformar grĂĄficos em som e por que vocĂȘ precisa
A. Gravar e editar um podcast
A. Quais sĂŁo as caracterĂ­sticas e tarefas do acompanhamento sonoro dos jogos


Source: https://habr.com/ru/post/pt444002/


All Articles