Aimybox na pesquisa: a estrutura para criar assistentes de voz precisa de um assistente para iOS

Todo mundo falando sobre assistentes de voz, Alice, Assistente do Google, que eles sabem como, o que não sabem ... E nós pegamos e escrevemos uma estrutura para a criação de assistentes de voz móveis. Sim, e código aberto! Até agora, fizemos isso apenas para Android e agora estamos procurando um desenvolvedor iOS legal que possa facilmente portar o código Kotlin para o Swift.

Por trás do corte, dizemos por que fazemos isso, o que fizemos e quem exatamente procuramos na equipe do Aimybox.



Aconteceu


que nós da Just AI desenvolvemos robôs falantes, assistentes de voz e todos os tipos de chatbots há muito tempo. Sob o capô, temos nossas próprias tecnologias de PNL (processamento de linguagem natural) e uma plataforma inteira, designers visuais e tudo em tudo.

Enquanto isso, o mercado de dispositivos falantes


e as aplicações estão crescendo e florescendo ! Não apenas Amazon, Google, Yandex - dezenas de empresas, de pequenas a grandes, estão se esforçando para criar e lançar seu assistente ou dispositivo de voz.

―Por quê? Quem precisa disso?


- exclamar usuários. E eles dizem: “O assistente de voz é legal! Em breve todos falarão apenas com eles! . Não, é claro que é conveniente. Se o assistente é inteligente, entende tudo e trabalha de maneira rápida e rápida. Mas se você olhar para este assunto de outra perspectiva, veremos que ...

A empresa precisa de um recurso de voz


Bem, ou um casal. Mas, o mais importante, você precisa adicionar rápida e facilmente um assistente de voz a um aplicativo móvel existente . E para que depois disso você possa personalizar como quiser.

Como fica na prática. Há um aplicativo móvel, possui muitos botões e todos os tipos de outros elementos da interface do usuário. Por exemplo, um banco móvel. O que o banco quer? Para que o botão do microfone apareça no aplicativo, o usuário clica nele e diz: "Transferir dinheiro para a mãe" . Em vez de três tapas na tela - um. Além disso, o aplicativo pode simplesmente abrir uma de suas telas com o campo do destinatário já preenchido.

Ou aqui: "Onde eles distribuem dólares?" . E o aplicativo abre um cartão com caixas eletrônicos do nosso banco, que pode emitir esse negócio em um raio de um quilômetro do usuário.

O que é tão difícil?


Parece que ele simplesmente adicionou um botão ao aplicativo, conectou algum tipo de reconhecimento de fala, um sintetizador de fala, o mecanismo da PNL, criou uma GUI bonita com um pergaminho, mostrando o processo de reconhecimento de fala (não pior que o Google), sincronizou tudo, testou. Erros capturados. Percebi que nem tudo é tão simples ...



Então pensamos


podemos criar uma estrutura que oculta toda essa complexidade (coberta com testes) e permite que o desenvolvedor adicione rapidamente um assistente de voz com as funções necessárias ao seu aplicativo móvel já em funcionamento. Comemos todos os cães no caminho de criar aplicativos de voz por um longo tempo e sabemos quais são as armadilhas.

O que aconteceu




Aimybox ! SDK aberto, gratuito e personalizado e assistente de voz pronto , que você pode adicionar ao seu aplicativo móvel, como um bate-papo on-line no site. Nele, incorporamos toda a nossa experiência na criação de soluções de fala. Mas, ao mesmo tempo, não vinculamos o assistente a nenhum mecanismo específico de reconhecimento, síntese e PNL. Bem, para que você possa usar qualquer mecanismo em seu assistente independentemente um do outro, e o Aimybox sincroniza corretamente o trabalho deles. Ele também tem uma interface bonita!

Aqui está o que conversamos sobre o Aimybox na conferência de conversação AI Conversations:


O código aberto realmente dirige,


porque desenvolvedores de terceiros (os mesmos bancos) devem ter controle total sobre o que incorporam em seus aplicativos. Ainda é uma interface de voz, você nunca sabe o que faz por dentro ...

E lá dentro


Existem módulos prontos de vários mecanismos de reconhecimento e síntese de voz, PNL e ativações de voz. Existe um assistente GUI personalizável pronto . Há documentação e um exemplo de como é fácil e simples implementá-lo em seu aplicativo. Mas tudo isso é apenas para Android!

Portanto, estamos procurando mestres para iOS,


que está ansioso para não participar do projeto de graça e transportar Kotlin para Swift. E estou pronto para criar o primeiro assistente de voz aberta do mundo para iOS, cujo código não é uma vergonha para publicar no Github com a condenação geral da comunidade.

E se você é quem sabe ler o Kotlin bonito e escrever Swift não menos bonito? Escreva para che@just-ai.com . Você está esperando a equipe Just AI, o mundo dos assistentes de voz, reconhecimento e síntese de fala, PNL e um ótimo motivo para adicionar outro projeto interessante ao seu portfólio!

Source: https://habr.com/ru/post/pt470259/


All Articles