
¿Qué impide combinar con éxito las matemáticas y los negocios?
Este texto es el primero de una serie de artículos sobre cómo integrar correctamente las herramientas de Big Data para beneficio empresarial.
Pequeño spoiler: todo funcionará, si recuerdas el negocio en sí.
Incluso hace 5 años, las grandes empresas querían presentar un bigdat nuevo y novedoso. Pero había pocos experimentadores reales. Las excepciones fueron aquellos que definitivamente poseían una gran cantidad de datos: telecomunicaciones, banca, compañías de Internet. Y en 2018, las empresas buscan experiencia en big data, y de los sectores más inesperados: metalurgia, seguros, industria aeronáutica.
¿Dónde comienza el modelo?
Big data ha dejado de ser un mantra mágico (ahora la cadena de bloques lleva esta corona). Pero hasta que se deshizo del mito principal:
"Un matemático más o menos adecuado puede esbozar un modelo en un trozo de papel, lo implementarán rápidamente y luego podrá tomar un cóctel y observar el crecimiento de las ventas".
Exagero, por supuesto, pero no demasiado. Daré un ejemplo de nuestra práctica.
Hay un fabricante de ladrillos de construcción. Pequeño, con experiencia y ventas establecidas. En esos momentos, las compañías a menudo se hacen la pregunta: ¿cómo podríamos reducir aún más los costos y aumentar las ganancias?
El candidato a la mejora era la logística. Hubo mucho caos en las entregas de ladrillos, fue difícil estimar la demanda de los clientes por adelantado, por lo que los costos de combustible y lubricantes y la depreciación de los vehículos eran desconcertantes. Habiendo aprendido sobre big data, la compañía decidió: vamos a predecir cuándo se agotará el ladrillo en los sitios de construcción del cliente para enviarlo rápidamente allí. Analizamos los datos anteriores, elaboramos un modelo que prometía porcentajes interesantes de optimización.
Toda la alegría rompió el orden habitual. En primer lugar, era necesario encontrar máquinas para la entrega rápida y pensar en las rutas. En segundo lugar, estas máquinas solo podían ingresar al almacén para cargar en franjas horarias estrictamente definidas, porque el horario de llegada de las máquinas cliente se había elaborado con varias semanas de anticipación. Era imposible mover clientes. Por lo tanto, la eficiencia fue cenizas.
Resultó que comenzamos con el habitual "vamos a predecir" y terminamos transformando el proceso comercial.
El problema de Big Data tiene dos configuraciones: negocios y matemáticas. Y su orden es solo eso. Antes de plantar un analista para construir un modelo, debe pasar por tres etapas.
1. Defina la tarea desde el punto de vista del negocio.
Digamos que queremos luchar contra la salida de clientes. Y decidieron predecir que cierto grupo de compradores está cerca de ir a un competidor. Para ellos, formaremos todo tipo de bollos para guardar.
La tarea a primera vista es trivial. El analista construye el modelo a partir de datos históricos (clientes difuntos y habituales) para obtener signos de ambos. Por ejemplo, en un caso real de un operador de telefonía móvil, la salida de un suscriptor anónimo = el suscriptor ha dejado de usar la comunicación. Pero, ¿cuánto tiempo, una semana, un mes, un año, no debería encenderse para ser registrado en el "filtrado"?
Hay varias formas de definir esta tarea. Es posible según una plantilla comercial preparada. O según datos históricos: ¿con qué frecuencia regresan los suscriptores que no han usado la conexión durante un mes? Y si es así, ¿tanto como el 10%? Por ejemplo, el suscriptor estaba en un largo viaje de negocios o fue llevado a una participación limitada de otro operador.
Aquí es importante: quién debe considerarse como "honores", una decisión completamente comercial.
El mínimo necesario de cualquier unidad de big data es de 2 roles. El primero es un científico de datos, en quien las matemáticas y la construcción de modelos. El segundo se conoce de manera diferente de un equipo a otro: propietario del producto, gerente de producto, analista de negocios. La conciencia de esta persona es la declaración correcta del problema. Su misión es profundizar en las complejidades del negocio del cliente y seleccionar las herramientas que necesita. Además, profundizar en la comunicación activa con todas las partes.
2. Verifique el caso de negocios.
Bien, decidiremos sobre el modelo. Pero, ¿cuánto nos costará la optimización?
Tome el mismo flujo de salida. Para evitar que los clientes potenciales se vayan, puede llamar o avisar con el mensaje correcto. O, si hay un recurso, ofrezca un bono. Puede decirle al cliente una tarifa económicamente más interesante analizando sus gastos.
Pero dado que estamos pensando en bonos, este es nuestro gasto en dichos clientes. Y bueno, sabríamos con certeza que este cliente se iría si no se hiciera nada. Pero los modelos no son ideales en sus predicciones. Sostendremos a alguien bien. Y, por ejemplo, el 20% de los potenciales "astilladores" de hecho no lo serán. En este caso, les ofreceremos bonificaciones. ¿Cuánto dinero se gastará en esto? ¿Es permisible en nuestro caso? Debe observar el volumen de la base de clientes, la escala del flujo de salida y considerar los números absolutos.
Esto se llama errores del primer y segundo tipo. Debemos entender que los resultados de la implementación del modelo darán más que quitar. Y esto debería ser una diferencia aceptable para nosotros. Los requisitos para el modelo se forman antes de su construcción. Tal vez saldrán de tal manera que no hay necesidad de pasar tiempo como científico.
3. Planifique cómo se utilizarán los resultados.
"La economía ha convergido", nos dice el caso de negocios. "¿Podemos finalmente construir el modelo?"
Antes Necesitamos pensar en lo que sucederá con los resultados.
Aquí nos dará un modelo de 200,000 personas que pueden convertirse en "honores" cada mes. Y decidiremos llamarlos. ¿Tenemos tiempo para pasar por todo? Después de todo, el centro de contacto no es de goma.
Otro punto: debe comprender qué intervalo de tiempo tendremos entre la predicción de salida y la salida real del cliente. ¿Por qué necesitamos una predicción si el cliente "se hincha" en un futuro muy cercano? Después de todo, es posible que no tengamos tiempo para contactarlos. Pero cuanto más lejos desde el momento en que nos vamos, damos la respuesta, menor es la precisión de la predicción. Aquí nuevamente, debe calcular el óptimo entre las ventajas y los riesgos.
Y el tercer punto: ¿con qué rapidez podemos implementar innovaciones en nuestros procesos comerciales? Para no funcionar, como con el ejemplo de un fabricante de ladrillos.
En conclusión
El camino hacia una tarea clara para un científico de datos es una tarea en sí misma.
Si verificamos los tres puntos, todo resultó y apareció un modelo, estamos esperando la próxima etapa divertida: la integración. La construcción de modelos y las matemáticas relacionadas generalmente toman alrededor del 20% del tiempo. El 80% restante (y a veces mucho más, dependiendo de la flexibilidad de la empresa) - implementación en el productivo. Hasta varios meses.
Un modelo es solo un MVP. A todos les encanta construirlos, porque a todos les gustan los resultados hipotéticos. Y luego introducirlos en puestos de procesos comerciales reales en la mayoría de las empresas. Después de todo, lo más difícil es cambiar las órdenes depuradas.
Por lo tanto, en cualquier proyecto de Big Data, debe haber un científico de datos, en el cual las matemáticas, un gerente de producto responsable de los negocios y un gerente de proyecto con un equipo de proyecto. Este último tendrá que implementar y agitar el proceso comercial. A veces es doloroso y difícil. Pero solo en esta configuración, trabajar con big data puede ser beneficioso.
Enseñamos estas y otras características de la aplicación de análisis de datos en los negocios en nuestra Escuela de Datos en cursos para
analistas y
gerentes .
La publicación fue preparada
por la School of Data sobre la base de la publicación del fundador de la School in the
Business HUB de Kyivstar PJSC