Na
SXSW introduziu um assistente virtual cuja voz no som nĂŁo se parece com mulher ou homem. Contamos como foi criado e olhamos para as perspectivas.
Foto Gareth Halfacree / CC BY-SAPor que Ă© necessĂĄria uma voz "neutra em termos de gĂȘnero"
Segundo estudos, os usuĂĄrios de alto-falantes inteligentes e assistentes de voz nĂŁo possuem uma versĂŁo "neutra" da voz, sem caracterĂsticas pronunciadas de homem ou mulher. Na pesquisa de P&D
do Space10, quase metade dos 12.000 participantes prefere ouvir a voz "assexual" de um assistente. Nesse design, as pessoas o associam melhor a sistemas de IA ocultos "sob o capĂŽ" de um assistente. A voz neutra Ă© mais adequada para a imagem do "carro". No entanto, grandes players neste mercado nĂŁo tĂȘm essa opção.
Os especialistas em virtude propuseram sua solução - na conferĂȘncia SXSW em Austin, eles introduziram um novo assistente de voz "assexual" chamado Q. Foi
desenvolvido em conjunto com a organização sem fins lucrativos Equal AI, trintasoundsgood e Koalition Interactive, alĂ©m de especialistas em linguĂstica.
Como o assistente Q funciona e como foi criado
Para criar um novo assistente, as vozes de cinco pessoas foram "combinadas" em uma. A "voz" final foi dada para ouvir os usuĂĄrios em potencial de um assistente de diferentes paĂses da Europa - as pessoas tinham que avaliar em uma escala de cinco pontos o quanto ele parecia uma mulher. De acordo com os resultados do teste, a voz foi corrigida - tornada mais baixa ou mais alta - e novamente permitida a escuta dos usuĂĄrios.
O trabalho iterativo com um grupo de foco de quatro mil e quinhentos entrevistados levou os autores do projeto a um desempenho de voz âneutroâ.
Segundo os desenvolvedores, o som de Q parece para as pessoas "sem sexo", porque a voz do assistente estĂĄ na faixa de frequĂȘncia entre as vozes masculina e feminina. Para o primeiro, o espectro de frequĂȘncia Ă© de 80 a 180 Hz e, para o segundo, a 140 a 255 Hz. A voz Q cai na faixa neutra de 145-175 Hz, o que nĂŁo permite determinar exclusivamente o sexo.
VocĂȘ pode ouvir como o assistente soa no vĂdeo neste
link , bem como no
site do projeto.
OpiniÔes e Potencial
Jornalistas respondem positivamente ao projeto Q. Segundo o colunista da CNBC, o assistente parece bastante "confiante", mas ao mesmo tempo parece amigĂĄvel e receptivo. Os autores do projeto falaram sobre as perspectivas do assistente. Eles acreditam no sucesso da ideia, porque Q
expande as possibilidades de escolha para usuĂĄrios de alto-falantes inteligentes e assistentes de voz.
Os desenvolvedores
nĂŁo planejam lançar seu prĂłprio dispositivo ou aplicativo, mas querem atrair a atenção das empresas de TI e oferecer-lhes uma voz neutra para seus assistentes. Os criadores do Q planejam informar as empresas de transporte, o estado e outras organizaçÔes que usam anĂșncios de voz sobre seus produtos.
No entanto, o futuro do projeto permanece incerto. Nenhuma empresa de tecnologia anunciou ainda seu desejo de trabalhar com os criadores do Q e, talvez, apĂłs o barulho da mĂdia tecnolĂłgica, um assistente "neutro em gĂȘnero" seja desenvolvido por gigantes de TI de forma independente.
Quem mais estĂĄ desenvolvendo assistentes assexuais
Na ĂĄrea de assistentes de voz, ainda nĂŁo existem anĂĄlogos Q. No entanto, a capacidade de escolher o "gĂȘnero" da votação jĂĄ existe em todos os projetos notĂĄveis âânesta ĂĄrea. Para usuĂĄrios que falam inglĂȘs no Google Assistant
, dez vozes masculinas e femininas diferentes estĂŁo disponĂveis e, no Siri, uma voz masculina e feminina com sotaques diferentes. VocĂȘ pode alterar o som no Amazon Alexa - vozes diferentes estĂŁo disponĂveis nas "habilidades" do alto-falante inteligente.
Foto Tony Webster / CC BY-SAOs anĂĄlogos Q podem ser encontrados na ĂĄrea de chatbot. Um dos primeiros robĂŽs "neutros em gĂȘnero" foi desenvolvido na empresa britĂąnica Sage - foi chamado Pegg. Segundo o gerente de projeto Kriti Sharma, o assistente foi feito assexuado para criar a identidade de um bot para ele, nĂŁo um
bot que finge ser humano .
Também estão
sendo desenvolvidos bots de bate-papo neutros para a rede de lojas GoDaddy e Lowe - ambos os bots serĂŁo usados ââno campo de atendimento ao cliente.
ConclusÔes
Embora os criadores de alto-falantes e assistentes inteligentes expandam o leque de vozes disponĂveis, o som "padrĂŁo" do assistente permanece inalterado. Segundo Slate, essa persistĂȘncia pode estar relacionada ao reconhecimento da marca - se a voz do assistente mudar drasticamente, causarĂĄ uma reação negativa para os usuĂĄrios que estĂŁo acostumados a distinguir entre diferentes serviços de ouvido.
Muito provavelmente, vozes âneutrasâ nĂŁo se tornarĂŁo o padrĂŁo geralmente aceito no mercado de grandes assistentes de voz. No entanto, a popularidade de tais soluçÔes entre os usuĂĄrios pode levar ao surgimento de novos jogadores, que podem oferecer uma ampla variedade de imagens de assistentes virtuais.
Leitura adicional - sobre som e mĂșsica do nosso blog e canal Telegram:
Como as ĂĄrvores e outras plantas dizem
Como transformar grĂĄficos em som e por que vocĂȘ precisaA.
Gravar e editar um podcastA.
Quais sĂŁo as caracterĂsticas e tarefas do acompanhamento sonoro dos jogos