
Recientemente, Amazon ha abierto una
tienda totalmente automatizada donde no hay vendedores, cajeros. Este evento desencadenó una nueva ronda de discusiones sobre la tendencia de los robots a reemplazar a las personas en muchas áreas de los negocios (por ejemplo, aquí hay
un artículo sobre el tema en The Guardian). Me las arreglé para hablar con Dmitry Plotnikov, un experto en automatización de procesos de negocios (Microsoft MVP), sobre quién realmente debería comenzar a preocuparse por sus trabajos.
Trabajas mucho en el campo de la automatización de procesos empresariales. ¿Puedes compartir algunas observaciones sobre qué empleados serán reemplazados por robots?
En general, desde hace varios años, se han publicado en Internet varias listas de profesiones que destruirán robots (por ejemplo,
aquí y
allá ): siempre se llama a los trabajadores de fábricas, conductores o camareros. De hecho, por lo que vemos, antes que otros problemas, los trabajadores de oficina pueden tener problemas.
Esto, por ejemplo, de quién?
Por ejemplo, los empleados de los centros de llamadas que se ocupan de las ventas en frío mediante llamadas telefónicas. Por lo general, el operador tiene un escenario de conversación claro (secuencia de comandos), que establece qué y cómo debe hablar. Desviarse de él es a menudo prohibido. E incluso si surge una situación que no es procesada por el script, se supone que los operadores repiten solo las frases que están en su script; el resto está prohibido.
Es decir, una persona, como un robot, repetirá las mismas palabras. Y si es así, ¿por qué no reemplazarlo con un robot? Porque ahorrará dinero: el programa no necesita capacitación, puede funcionar las 24 horas del día y los siete días de la semana.
Pero en este caso, resulta que el sistema tendrá que conducir una conversación de voz, y esto es aún más complicado que un bot de chat. ¿Hay algún éxito notable en esta área ahora?
Sí, pude participar en un proyecto en el que era necesario implementar un sistema de este tipo, una aplicación que utiliza la base de datos de SharePoint como CRM y se comunica durante las llamadas en frío. Este sistema ya se lanzó y está funcionando para uno de los clientes de la región occidental (desafortunadamente, no puedo nombrar la compañía).
Hay muchas soluciones similares en el mercado; la mayoría de ellas utilizan un enfoque en el que una computadora sintetiza la voz de una persona. Casi siempre suena poco natural; hablar con un robot así no es muy agradable para una persona.
Por lo tanto, en nuestro proyecto, se decidió abandonar la síntesis del habla y usar la voz pregrabada de una persona viva en las comunicaciones. Como resultado, el sistema lee al interlocutor las propuestas del guión de la compañía y descifra sus respuestas sobre la marcha, convirtiéndolas en texto. Una de las tareas más importantes aquí es el análisis del contenido de la llamada. Usando palabras clave, puede comprender cómo reacciona exactamente una persona a lo que escucha (esto también ayuda a buscar en la base de conocimiento) y, dependiendo de esto, construir una mayor comunicación: finalizar la conversación, reproducir la siguiente oración de un texto pregrabado, etc. .
¿Qué tan efectivo es esto?
Sorprendentemente, el sistema funciona de manera bastante eficiente y le permite ahorrar seriamente y aumentar la productividad de las llamadas en frío. La aplicación en sí misma puede establecer el estado de acuerdo con los resultados de las conversaciones en CRM, lo cual es muy conveniente, y un programa por día puede llamar a cientos de clientes. El costo de un centro de llamadas que podría realizar la misma cantidad de trabajo sería muy significativo.
¿Hay alguna dificultad para crear este tipo de aplicación?
Si por supuesto. El enfoque que utilizamos tiene sus propias dificultades: por ejemplo, reproducir un discurso grabado para que suene natural no es tan simple. Por ejemplo, durante una conversación entre dos personas, raramente ocurren largas pausas, por lo tanto, el robot debe responder a las réplicas del interlocutor rápidamente. Además, en la vida real, la persona que recibe la llamada puede estar en un lugar ruidoso, y no es fácil para el robot comprender en tiempo real cuándo la frase dirigida a él ha terminado y usted debe responderla.
Del mismo modo, algunas palabras pueden sonar igual, pero tienen significados diferentes y se registran de manera diferente (homófonos). Por ejemplo, en inglés, las palabras bot y adquirido suenan igual, pero significan conceptos completamente diferentes.
¿Cómo puede resolver estos problemas y mejorar la precisión?
Aprendizaje automático, redes neuronales. Cualquier centro de atención telefónica tiene una base de conocimiento, que generalmente es bastante extensa: hay guiones de conversación y sus registros (a menudo se hacen, por ejemplo, para evaluar la calidad del trabajo de los operadores). Para empezar, puede crear una red neuronal y entrenarla con estos datos: grabaciones descifradas de conversaciones. El resultado es un operador virtual completo para hacer llamadas en frío.
En conclusión, ¿es posible dar algún consejo a quienes van a crear sistemas de automatización similares para las tareas rutinarias de la oficina?
En este caso, quizás lo más importante es elegir las tecnologías y herramientas adecuadas. Es poco probable que tenga suficientes recursos para hacer todo desde cero por sí mismo, por lo que tendrá que usar productos listos y todo tipo de API. Y aquí es importante que tengan la funcionalidad necesaria y buena documentación.
Por ejemplo, durante el proyecto queríamos usar herramientas de Google y Microsoft, pero descubrimos que uno de ellos no admite los idiomas que necesitamos, y la documentación del segundo resultó ser tan pobre que algunos puntos se aclararon solo durante los experimentos. Si esto puede evitarse, ahorrará mucho tiempo y esfuerzo.
Artículos interesantes sobre el impacto de la automatización en el mercado laboral: