Nous utilisons la science des données pour déterminer le cycle de vie d'un client

Bonjour, Habr! Je vous présente la traduction de mon article "Comprendre la valeur à vie du client avec Data Science" .


La relation client est importante pour chaque entreprise et joue un rôle clé dans la croissance de l'entreprise. L'une des mesures les plus importantes dans ce domaine est la valeur à vie du client (ci-après dénommée LTV) - la prédiction du revenu net associé à toutes les relations futures avec le client. Plus les clients continuent à utiliser les produits de l'entreprise, augmentant leurs bénéfices, plus leur LTV est élevé.

Il existe de nombreux articles marketing sur l'importance du LTV et de la segmentation de la clientèle. Mais, en tant que Data Scientist, je suis plus intéressé par les formules et je veux comprendre comment le modèle fonctionne réellement. Comment prédire LTV en utilisant seulement 3 attributs? Dans cet article, je vais montrer quelques modèles utilisés pour la segmentation de la clientèle marketing et expliquer les mathématiques sur lesquelles ils sont basés. Il y aura de nombreuses formules ici, mais ne vous inquiétez pas: tout est prêt dans les bibliothèques Python. Le but de ce blog est de montrer comment les mathématiques font tout le travail.


Modèle binomial bêta-géométrique / négatif pour déterminer la probabilité que le client soit «vivant»


Prenons cet exemple [du service en ligne pour commander des voyages (taxi) dans la ville]: l'utilisateur s'est inscrit il y a 1 mois, a fait 4 voyages et le dernier voyage a eu lieu il y a 20 jours. En se basant uniquement sur ces données, ce modèle peut prédire la probabilité que le client soit actif pendant une certaine période de temps (comme indiqué dans le graphique), ainsi que le nombre de transactions à l'avenir (qui est la base pour comprendre la valeur du client tout au long de sa «vie» - relation client / entreprise).



Le modèle fournit un guide d'action direct pour l'entreprise: prendre des mesures de marketing vis-à-vis de l'utilisateur lorsque sa probabilité d'activité diminue en dessous d'un certain niveau pour éviter son départ.


Ce modèle a été proposé par Fader, Hardie et Lee et s'appelle le modèle de distribution binomiale géométrique / négative bêta (BG / NBD).


Le modèle BG / NBD a les propriétés suivantes:


Lorsque l'utilisateur est actif, le nombre de ses transactions sur la période t est décrit par la distribution de Poisson avec le paramètre de transaction λ .


La distribution de Poisson permet de prédire les événements qui se produisent en utilisant des données sur la fréquence des événements survenus dans le passé. Par exemple, si l'utilisateur effectue en moyenne 2 trajets par semaine ( λ=2sur le graphique ci-dessous), alors la probabilité qu'il passe 3 commandes la semaine prochaine est de 0,18.



  1. L'hétérogénéité du paramètre de transaction entre les utilisateurs (ce qui signifie que les clients diffèrent les uns des autres dans le comportement d'achat) a une distribution Gamma avec les paramètres r (forme) et α (échelle) .

La distribution gamma convient aux processus avec un temps d'attente entre les événements avec une distribution de Poisson (dans notre cas, pour le paramètre de transaction λ ). Par exemple, considérons un utilisateur qui effectue en moyenne 2 transactions par semaine. Dans ce cas, la probabilité que le temps d'attente avant que l'utilisateur effectue 3 achats soit supérieur à 4 semaines est égale à la zone du graphique à droite de la ligne verticale en pointillés (sous la ligne de distribution bleue) - 0,13.



  1. Les utilisateurs peuvent devenir inactifs après toute transaction de probabilité p , et le point de départ (lorsqu'ils deviennent inactifs) est réparti entre les achats selon la loi géométrique.

La distribution géométrique est similaire aux résultats de Bernoulli et est utilisée pour modéliser le nombre de résultats avant (et y compris) le premier résultat réussi. Si pour un utilisateur p=0,2, alors sa probabilité d'être inactif après 3 transactions est de 0,12 (ligne bleue sur le graphique).



  1. L'hétérogénéité (variation entre les utilisateurs) de la probabilité de retrait a une distribution bêta avec les paramètres de forme α et β .

La distribution bêta est la mieux adaptée pour représenter des distributions de probabilité probabilistes - le cas où nous ne connaissons pas la probabilité à l'avance, mais nous avons quelques hypothèses a priori raisonnables décrites par α et β (mat. Attente de la distribution bêta α/(α+β)).


Pour l'exemple précédent avec un utilisateur dont la probabilité de retrait a priori est de 0,2, la ligne orange du graphique avec α=2et β=8décrit la fonction de densité de probabilité pour la probabilité de départ d'un utilisateur.



  1. Le paramètre de transaction et la probabilité de retrait sont distribués indépendamment entre les utilisateurs.

Notation mathématique des attributs utilisateur X :


X=x,tx,T


x- le nombre de transactions pour une certaine période de temps (0,T]et tx(<=T)- heure du dernier achat.
En se basant uniquement sur ces caractéristiques, le modèle prédit le futur contexte d'achat des utilisateurs:
P(X(t)=x)- probabilité xtransactions pour la période tà l'avenir
E(Y(t)|X=x,tx,T)- Le nombre attendu de transactions par période pour un utilisateur avec un comportement spécifique.


Maintenant, nous pouvons trouver ces deux principaux indicateurs. Sans entrer dans les détails, je montrerai les formules finales (plus de calculs dans les articles).


Probabilité d'être actif:



Transactions attendues:



2F1- Fonction hyper-géométrique de Gauss



Modèle gamma-gamma pour évaluer la LTV


Jusqu'à présent, nous n'avons utilisé que la fréquence et les achats récents du client. Mais en plus de cela, nous pouvons appliquer la composante monétaire de ses transactions. Ajoutez de nouvelles données à notre exemple: l'utilisateur a effectué ces 4 voyages au prix de 10, 12, 8, 15. Le modèle gamma-gamma permet de prédire la valeur la plus probable d'une transaction à l'avenir.
Pour résumer tout ensemble, nous avons maintenant tous les éléments pour déterminer le client LTV:


LTV = nombre attendu de transactions prix de transaction marge


où le premier élément provient du modèle BG / NB, le second provient du modèle Gamma-Gamma et la marge est définie par l'entreprise.


Notation mathématique pour les modèles gamma-gamma:
Utilisateur engagé xtransactions de valeur z1,z2,...et mx=Zi/x- la valeur moyenne observée de la transaction.
E(M)- la moyenne cachée de la valeur de la transaction, et ce qui nous intéresse c'est E(M|mx,x)- la valeur monétaire attendue de l'utilisateur en fonction de son comportement d'achat.


Propriétés du modèle gamma-gamma:
La valeur monétaire des transactions des utilisateurs est aléatoire et se situe dans leurs valeurs de transaction moyennes.


La valeur de transaction moyenne varie selon les utilisateurs, mais ne varie pas pour un utilisateur particulier au fil du temps.


La valeur de transaction moyenne a une distribution gamma entre les utilisateurs.


Les articles décrivent en détail la dérivation de la formule à travers plusieurs autres distributions Gamma. Le résultat est:



p est le paramètre de forme et v est le paramètre d'échelle de la distribution gamma pour les transactions Zi,qparamètre de forme et γle paramètre d'échelle pour la distribution gamma v (hypothèse du modèle que p est constant - les coefficients de variation au niveau individuel sont les mêmes pour les utilisateurs). Pour trouver les paramètres du modèle, nous pouvons utiliser la méthode du maximum de vraisemblance.


Nous avons terminé avec les mathématiques et maintenant nous pouvons évaluer le LTV des utilisateurs. Mais qu'en est-il de la précision de ce modèle?


Évaluation de la précision du modèle


L'approche traditionnelle suggère de diviser les données en deux groupes - une partie pour la formation, une partie pour le test. Dans les articles, les auteurs montrent que leur approche fonctionne bien. J'ai également essayé ces modèles sur des données réelles et j'ai également obtenu des résultats similaires.


Le graphique montre la distribution des transactions réelles et prévues pour les données du groupe de test: l'erreur ici est de 2,8%.



Comment postuler


Comme je l'ai dit au début, tous les modèles sont déjà implémentés. Par exemple, la bibliothèque Python « lifetimes » contient toutes les fonctions et métriques nécessaires pour définir LTV. La documentation détaillée contient de nombreux exemples et explications. Il existe également des exemples de requêtes SQL pour recevoir des données au format requis. Vous pouvez donc vous mettre au travail en quelques minutes.


Conclusion


Dans cet article, j'ai montré en détail comment les utilisateurs de LTV peuvent être évalués en utilisant seulement quelques attributs.


Je tiens à noter que, parfois, vous pouvez vous éloigner des arbres boostés par le gradient souvent utilisés et essayer d'autres approches qui ont un niveau de précision comparable. La formation statistique peut encore être mise en pratique et peut aider les entreprises à mieux comprendre les clients.


Les références


Fader, Peter et GS Hardie, Bruce et Lok Lee, Ka. (2005). «Compter vos clients» en toute simplicité: une alternative au modèle Pareto / NBD. Science du marketing.
Fader, Peter et GS Hardie, Bruce (2013). Le modèle Gamma-Gamma de la valeur monétaire.
Fader, Peter S., Bruce GS Hardie et Ka Lok Lee (2005), «RFM and CLV: Using Iso-value Curves for Customer Base Analysis», Journal of Marketing Research.

Source: https://habr.com/ru/post/fr436236/


All Articles