Utilizamos la ciencia de datos para determinar el ciclo de vida de un cliente.

Hola Habr! Le presento la traducción de mi artículo "Comprender el valor de la vida del cliente con la ciencia de datos" .


Las relaciones con los clientes son importantes para cada empresa y juegan un papel clave en el crecimiento del negocio. Una de las métricas más importantes en esta área es el valor de por vida del cliente (en lo sucesivo denominado LTV): la predicción de los ingresos netos asociados con todas las relaciones futuras con los clientes. Mientras más tiempo los clientes continúen usando los productos de la compañía, aumentando las ganancias, mayor será su LTV.

Hay muchos artículos de marketing sobre la importancia de LTV y la segmentación de clientes. Pero, como Data Scientist, estoy más interesado en las fórmulas y quiero entender cómo funciona realmente el modelo. ¿Cómo predecir LTV usando solo 3 atributos? En esta publicación, mostraré algunos modelos que se utilizan para la segmentación de clientes de marketing y explicaré las matemáticas en las que se basan. Habrá muchas fórmulas aquí, pero no se preocupe: todo está listo en las bibliotecas de Python. El propósito de este blog es mostrar cómo las matemáticas hacen todo el trabajo.


Modelo binomial beta-geométrico / negativo para determinar la probabilidad de que el cliente esté "vivo"


Considere este ejemplo [del servicio en línea para ordenar viajes (taxi) en la ciudad]: el usuario se registró hace 1 mes, realizó 4 viajes y el último viaje se realizó hace 20 días. Basado solo en estos datos, este modelo puede predecir la probabilidad de que el cliente esté activo durante un cierto período de tiempo (como se muestra en el gráfico), así como la cantidad de transacciones en el futuro (que es la base para comprender el valor del cliente a lo largo de su "vida" - relaciones con clientes y empresas).



El modelo proporciona una guía directa de acción para el negocio: tome medidas de marketing en relación con el usuario cuando su probabilidad de actividad disminuya por debajo de cierto nivel para evitar su partida.


Este modelo fue propuesto por Fader, Hardie y Lee y se llama modelo de distribución binomial beta geométrico / negativo (BG / NBD).


El modelo BG / NBD tiene las siguientes propiedades:


Cuando el usuario está activo, la distribución de Poisson describe el número de sus transacciones durante el período t con el parámetro de transacción λ .


La distribución de Poisson ayuda a predecir eventos que ocurren usando datos sobre la frecuencia con la que ocurrieron eventos en el pasado. Por ejemplo, si el usuario realizó un promedio de 2 viajes por semana ( λ=2 en la tabla a continuación), entonces la probabilidad de que haga 3 pedidos la próxima semana es 0.18.



  1. La heterogeneidad del parámetro de transacción entre los usuarios (lo que significa cómo los clientes difieren entre sí en el comportamiento de compra) tiene una distribución Gamma con parámetros r (forma) y α (escala) .

La distribución gamma es adecuada para procesos con un tiempo de espera entre eventos con una distribución de Poisson (en nuestro caso, para el parámetro de transacción λ ). Por ejemplo, considere un usuario que realiza un promedio de 2 transacciones por semana. En este caso, la probabilidad de que el tiempo de espera antes de que el usuario realice 3 compras sea superior a 4 semanas es igual al área en el gráfico a la derecha de la línea discontinua vertical (debajo de la línea de distribución azul) - 0.13.



  1. Los usuarios pueden volverse inactivos después de cualquier transacción con probabilidad p , y el punto de partida (cuando se vuelven inactivos) se distribuye entre las compras de acuerdo con la ley geométrica.

La distribución geométrica es similar a los resultados de Bernoulli y se utiliza para modelar el número de resultados antes (e incluyendo) el primer resultado exitoso. Si para algún usuario p=0.2 , entonces su probabilidad de estar inactivo después de 3 transacciones es 0.12 (línea azul en el gráfico).



  1. La heterogeneidad (variación entre usuarios) en la probabilidad de abstinencia tiene una distribución Beta con los parámetros de forma α y β .

La distribución beta es la más adecuada para representar distribuciones probabilísticas de probabilidad: el caso cuando no conocemos la probabilidad de antemano, pero tenemos algunos supuestos razonables a priori descritos por α y β (mat. Expectativa de la distribución beta α/(α+β)) .


Para el ejemplo anterior con un usuario cuya probabilidad a priori de retiro es 0.2, la línea naranja en el gráfico con α=2 y β=8 describe la función de densidad de probabilidad para la probabilidad de que un usuario se vaya.



  1. El parámetro de transacción y la probabilidad de retiro se distribuyen independientemente entre los usuarios.

Notación matemática para atributos de usuario X :


X=x,tx,T


donde x - el número de transacciones por un cierto período de tiempo (0,T] y tx(<=T) - hora de la última compra.
Basado solo en estas características, el modelo predice los antecedentes de compras futuras de los usuarios:
P(X(t)=x) - probabilidad x transacciones para el período t en el futuro
E(Y(t)|X=x,tx,T) - El número esperado de transacciones por período para un usuario con un comportamiento específico.


Ahora podemos encontrar estos dos indicadores principales. Sin entrar en detalles, mostraré las fórmulas finales (más cálculos en los artículos).


Probabilidad de estar activo:



Transacciones esperadas:



donde 2F1 - Función hipergeométrica de Gauss



Modelo gamma-gamma para evaluar LTV


Hasta este momento, utilizamos solo la frecuencia y las compras recientes del cliente. Pero además de esto, podemos aplicar el componente monetario de sus transacciones. Agregue nuevos datos a nuestro ejemplo: el usuario realizó estos 4 viajes a un precio de 10, 12, 8, 15. El modelo gamma-gamma ayuda a predecir el valor más probable de una transacción en el futuro.
Para resumir todo junto, ahora tenemos todos los elementos para determinar el cliente LTV:


LTV = número esperado de transacciones precio de transacción margen


donde el primer elemento es del modelo BG / NB, el segundo es del modelo Gamma-Gamma y la empresa establece el margen.


Notación matemática para modelos gamma-gamma:
Usuario comprometido x transacciones de valor z1,z2,... y mx=Zi/x - el valor promedio observado de la transacción.
E(M) - el promedio oculto del valor de la transacción, y lo que nos interesa es E(M|mx,x) - el valor monetario esperado del usuario en función de su comportamiento de compra.


Propiedades del modelo gamma gamma:
El valor monetario de las transacciones del usuario es aleatorio y se encuentra dentro de sus valores promedio de transacción.


El valor promedio de la transacción varía entre los usuarios, pero no varía para un usuario en particular a lo largo del tiempo.


El valor promedio de la transacción tiene una distribución gamma entre los usuarios.


Los artículos describen en detalle la derivación de la fórmula a través de varias distribuciones más Gamma. El resultado es:



donde p es el parámetro de forma y v es el parámetro de escala de la distribución gamma para transacciones Zi,q parámetro de forma y γ el parámetro de escala para la distribución gamma v (suposición del modelo de que p es constante; los coeficientes de variación a nivel individual son los mismos para los usuarios). Para encontrar los parámetros del modelo, podemos usar el método de máxima verosimilitud.


Hemos terminado con las matemáticas y ahora podemos evaluar el LTV de los usuarios. Pero, ¿qué pasa con la precisión de este modelo?


Evaluación de precisión del modelo


El enfoque tradicional sugiere dividir los datos en dos grupos: parte para capacitación y parte para prueba. En los artículos, los autores muestran que su enfoque funciona bien. También probé estos modelos con datos reales y también obtuve resultados similares.


El gráfico muestra la distribución de transacciones reales y pronosticadas para datos del grupo de prueba: el error aquí es 2.8%.



Cómo aplicar


Como dije al principio, todos los modelos ya están implementados. Por ejemplo, la biblioteca de “ vidas ” de Python contiene todas las funciones y métricas necesarias para definir LTV. La documentación detallada contiene muchos ejemplos y explicaciones. También hay ejemplos de consultas sql para recibir datos en el formato requerido. Para que pueda ponerse a trabajar en solo unos minutos.


Conclusión


En esta publicación, mostré en detalle cómo los usuarios de LTV pueden ser evaluados usando solo unos pocos atributos.


Quiero señalar que a veces puedes alejarte de los árboles impulsados ​​por gradientes de uso frecuente y probar otros enfoques que tienen un nivel de precisión comparable. La capacitación estadística aún se puede poner en práctica y puede ayudar a las empresas a comprender mejor a los clientes.


Referencias


Fader, Peter y GS Hardie, Bruce y Lok Lee, Ka. (2005) "Contando a sus clientes" de la manera fácil: una alternativa al modelo Pareto / NBD. Ciencias de marketing.
Fader, Peter y GS Hardie, Bruce (2013). El modelo gamma-gamma del valor monetario.
Fader, Peter S., Bruce GS Hardie y Ka Lok Lee (2005), "RFM y CLV: Uso de curvas de valor iso para el análisis de la base de clientes", Journal of Marketing Research.

Source: https://habr.com/ru/post/es436236/


All Articles