
Recentemente, a Amazon abriu uma
loja totalmente automatizada, onde não há vendedores, caixas. Esse evento desencadeou uma nova rodada de discussões sobre a tendência dos robôs substituirem pessoas em muitas áreas de negócios (por exemplo, aqui está
um artigo sobre o tópico no The Guardian). Consegui conversar com Dmitry Plotnikov, especialista em automação de processos de negócios (Microsoft MVP), sobre quem realmente deveria começar a se preocupar com seus trabalhos.
Você trabalha muito no campo da automação de processos de negócios. Você pode compartilhar algumas observações sobre quais funcionários serão substituídos por robôs?
Em geral, várias listas de profissões que destroem robôs são publicadas na Internet há vários anos (por exemplo,
aqui e
ali ) - trabalhadores de fábricas, motoristas ou garçons são sempre chamados por lá. De fato, pelo que vemos, antes de outros problemas, os trabalhadores de escritório podem ter problemas.
Por exemplo, de quem?
Por exemplo, funcionários de call centers que lidam com vendas frias usando telefonemas. Normalmente, o operador tem um cenário de conversação claro (script), que indica o que e como ele deve falar. Desviar-se dele é frequentemente proibido. E mesmo que surja uma situação que não seja processada pelo script, os operadores devem repetir apenas as frases que estão no script - o resto é proibido.
Ou seja, uma pessoa, como um robô, repetirá as mesmas palavras. Se sim, por que não substituí-lo por um robô, porque economizará dinheiro: o programa não precisa ser treinado? Ele pode funcionar 24 horas por dia e sete dias por semana.
Mas, neste caso, acontece que o sistema terá que conduzir uma conversa por voz, e isso é ainda mais complicado do que um robô de bate-papo. Existe algum sucesso notável nesta área agora?
Sim, pude participar de um projeto em que era necessário implementar exatamente esse sistema - um aplicativo que usa o banco de dados do SharePoint como um CRM e se comunica durante chamadas frias. Esse sistema já foi lançado e está funcionando para um dos clientes da região oeste (infelizmente não sei o nome da empresa).
Existem muitas soluções semelhantes no mercado; a maioria delas usa uma abordagem na qual um computador sintetiza a voz de uma pessoa. Quase sempre soa antinatural; conversar com um robô assim não é muito agradável para uma pessoa.
Portanto, em nosso projeto, foi decidido abandonar a síntese da fala e usar a voz pré-gravada de uma pessoa viva nas comunicações. Como resultado, o sistema lê o interlocutor das propostas no script da empresa e descriptografa suas respostas rapidamente, convertendo-as em texto. Uma das tarefas mais importantes aqui é a análise do conteúdo da chamada. Usando palavras-chave, você pode entender como exatamente uma pessoa reage ao que ouve (isso também ajuda a pesquisar na base de conhecimento) e, dependendo disso, constrói mais comunicação - encerra a conversa, reproduz a próxima frase de um texto pré-gravado etc. .
Quão eficaz é isso?
Surpreendentemente, o sistema funciona de maneira bastante eficiente e permite salvar e aumentar seriamente a produtividade de chamadas frias. O próprio aplicativo pode definir o status de acordo com os resultados das conversas no CRM, o que é muito conveniente, e um programa por dia pode ligar para centenas de clientes. O custo de um call center que poderia executar a mesma quantidade de trabalho seria muito significativo.
Há alguma dificuldade em criar esse tipo de aplicativo?
Sim claro. A abordagem que usamos tem suas próprias dificuldades - por exemplo, reproduzir um discurso gravado para que pareça natural não é tão simples. Por exemplo, durante uma conversa entre duas pessoas, pausas longas raramente ocorrem; portanto, o robô deve responder às réplicas do interlocutor rapidamente. Além disso, na vida real, a pessoa que recebe a chamada pode estar em um local barulhento - e não é fácil para o robô entender em tempo real quando a frase endereçada a ele terminou e você precisa responder a ela.
Da mesma forma, algumas palavras podem soar iguais, mas têm significados diferentes e são gravadas de maneira diferente (homofones). Por exemplo, em inglês, as palavras bot e buy soam iguais, mas significam conceitos completamente diferentes.
Como você pode resolver esses problemas e melhorar a precisão?
Aprendizado de máquina, redes neurais. Qualquer central de atendimento possui uma base de conhecimento, geralmente bastante extensa: existem scripts de conversa e seus registros (geralmente são feitos, por exemplo, para avaliar a qualidade do trabalho dos operadores). Para começar, você pode criar uma rede neural e treiná-la nessas gravações de conversas descriptografadas por dados. O resultado é uma operadora virtual completa para fazer chamadas frias.
Em conclusão, é possível dar algum conselho àqueles que criarão sistemas de automação similares para tarefas rotineiras do escritório?
Nesse caso, talvez o mais importante seja escolher as tecnologias e ferramentas apropriadas. É improvável que você tenha recursos suficientes para fazer tudo do zero por conta própria; portanto, você precisará usar produtos prontos e todos os tipos de APIs. E aqui é importante que eles tenham a funcionalidade necessária e boa documentação.
Por exemplo, durante o projeto, queríamos usar ferramentas do Google e da Microsoft, mas descobrimos que um deles não suporta os idiomas de que precisamos, e a documentação do segundo acabou sendo tão ruim que alguns pontos foram esclarecidos apenas durante os experimentos. Se isso puder ser evitado, você economizará muito tempo e esforço.
Artigos interessantes sobre o impacto da automação no mercado de trabalho: