Wir verwenden Data Science, um den Lebenszyklus eines Kunden zu bestimmen

Hallo Habr! Ich präsentiere Ihnen die Übersetzung meines Artikels "Den Wert der Kundenlebensdauer mit Data Science verstehen" .


Kundenbeziehungen sind für jedes Unternehmen wichtig und spielen eine Schlüsselrolle für das Geschäftswachstum. Eine der wichtigsten Kennzahlen in diesem Bereich ist der Wert der Kundenlebensdauer (im Folgenden: LTV) - die Vorhersage des Nettoeinkommens, das mit allen zukünftigen Beziehungen zum Kunden verbunden ist. Je länger Kunden die Produkte des Unternehmens nutzen und den Gewinn steigern, desto höher ist ihr LTV.

Es gibt viele Marketingartikel über die Bedeutung von LTV und Kundensegmentierung. Als Data Scientist interessiere ich mich jedoch mehr für Formeln und möchte verstehen, wie das Modell tatsächlich funktioniert. Wie kann man den LTV mit nur 3 Attributen vorhersagen? In diesem Beitrag werde ich einige Modelle zeigen, die für die Vermarktung der Kundensegmentierung verwendet werden, und die Mathematik erläutern, auf der sie basieren. Hier wird es viele Formeln geben, aber keine Sorge: In den Python-Bibliotheken ist alles bereit. Der Zweck dieses Blogs ist es zu zeigen, wie Mathe die ganze Arbeit macht.


Beta-geometrisches / negatives Binomialmodell zur Bestimmung der Wahrscheinlichkeit, dass der Client „lebt“


Betrachten Sie dieses Beispiel [aus dem Onlinedienst für die Bestellung von Reisen (Taxi) in der Stadt]: Der Benutzer hat sich vor 1 Monat registriert, 4 Reisen unternommen und die letzte Reise hat vor 20 Tagen stattgefunden. Basierend auf diesen Daten kann dieses Modell die Wahrscheinlichkeit vorhersagen, dass der Kunde für einen bestimmten Zeitraum aktiv sein wird (wie in der Grafik dargestellt), sowie die Anzahl der Transaktionen in der Zukunft (die Grundlage für das Verständnis des Werts des Kunden während seines gesamten „Lebens“). Kunden- und Unternehmensbeziehungen).



Das Modell bietet einen direkten Leitfaden für Maßnahmen für das Unternehmen: Ergreifen Sie Marketingmaßnahmen in Bezug auf den Benutzer, wenn seine Wahrscheinlichkeit einer Aktivität unter ein bestimmtes Niveau sinkt, um seine Abreise zu verhindern.


Dieses Modell wurde von Fader, Hardie und Lee vorgeschlagen und heißt Beta Geometric / Negative Binomial Distribution Model (BG / NBD).


Das BG / NBD-Modell hat die folgenden Eigenschaften:


Wenn der Benutzer aktiv ist, wird die Anzahl seiner Transaktionen über den Zeitraum t durch die Poisson-Verteilung mit dem Transaktionsparameter λ beschrieben .


Die Poisson-Verteilung hilft bei der Vorhersage von Ereignissen anhand von Daten darüber, wie oft Ereignisse in der Vergangenheit aufgetreten sind. Zum Beispiel, wenn der Benutzer durchschnittlich 2 Fahrten pro Woche unternommen hat ( λ=2in der Tabelle unten) beträgt die Wahrscheinlichkeit, dass er nächste Woche 3 Bestellungen tätigt, 0,18.



  1. Die Heterogenität des Transaktionsparameters unter den Benutzern (dh wie sich Kunden im Kaufverhalten voneinander unterscheiden) hat eine Gammaverteilung mit den Parametern r (Form) und α (Skala) .

Die Gammaverteilung eignet sich für Prozesse mit einer Wartezeit zwischen Ereignissen mit einer Poisson-Verteilung (in unserem Fall für den Transaktionsparameter λ ). Stellen Sie sich beispielsweise einen Benutzer vor, der durchschnittlich 2 Transaktionen pro Woche ausführt. In diesem Fall entspricht die Wahrscheinlichkeit, dass die Wartezeit, bevor der Benutzer 3 Einkäufe tätigt, mehr als 4 Wochen beträgt, dem Bereich in der Tabelle rechts von der vertikalen gestrichelten Linie (unter der blauen Verteilungslinie) - 0,13.



  1. Benutzer können nach jeder Transaktion mit der Wahrscheinlichkeit p inaktiv werden, und der Abgangspunkt (wenn sie inaktiv werden) wird gemäß dem geometrischen Gesetz auf die Käufe verteilt.

Die geometrische Verteilung ähnelt den Bernoulli-Ergebnissen und wird verwendet, um die Anzahl der Ergebnisse vor (und einschließlich) dem ersten erfolgreichen Ergebnis zu modellieren. Wenn für einen Benutzer p=0,2Dann beträgt die Wahrscheinlichkeit, nach 3 Transaktionen inaktiv zu sein, 0,12 (blaue Linie im Diagramm).



  1. Die Heterogenität (Variation zwischen Benutzern) in der Wahrscheinlichkeit des Entzugs hat eine Beta-Verteilung mit den Formparametern α und β .

Die Beta-Verteilung ist am besten geeignet, um probabilistische Wahrscheinlichkeitsverteilungen darzustellen - der Fall, wenn wir die Wahrscheinlichkeit nicht im Voraus kennen, aber einige vernünftige a priori-Annahmen haben, die durch α und β beschrieben werden (mat. Erwartung der Beta-Verteilung α/(α+β)).


Für das vorherige Beispiel mit einem Benutzer, dessen a priori Widerrufswahrscheinlichkeit 0,2 beträgt, ist die orange Linie in der Grafik mit α=2und β=8beschreibt die Wahrscheinlichkeitsdichtefunktion für die Wahrscheinlichkeit, dass ein Benutzer das Unternehmen verlässt.



  1. Der Transaktionsparameter und die Wahrscheinlichkeit einer Auszahlung werden unabhängig voneinander auf die Benutzer verteilt.

Mathematische Notation für Benutzer- X- Attribute:


X=x,tx,T


wo x- die Anzahl der Transaktionen für einen bestimmten Zeitraum (0,T]und tx(<=T)- Zeitpunkt des letzten Kaufs.
Basierend auf diesen Merkmalen sagt das Modell den zukünftigen Kaufhintergrund der Benutzer voraus:
P(X(t)=x)- Wahrscheinlichkeit xTransaktionen für den Zeitraum tin der Zukunft,
E(Y(t)|X=x,tx,T)- Die erwartete Anzahl von Transaktionen pro Periode für einen Benutzer mit einem bestimmten Verhalten.


Jetzt können wir diese beiden Hauptindikatoren finden. Ohne auf Details einzugehen, werde ich die endgültigen Formeln zeigen (weitere Berechnungen in den Artikeln).


Wahrscheinlichkeit aktiv zu sein:



Erwartete Transaktionen:



wo 2F1- Hypergeometrische Gauß-Funktion



Gamma-Gamma-Modell zur Beurteilung des LTV


Bis zu diesem Zeitpunkt haben wir nur die Häufigkeit und die letzten Einkäufe des Kunden verwendet. Darüber hinaus können wir jedoch die monetäre Komponente ihrer Transaktionen anwenden. Fügen Sie unserem Beispiel neue Daten hinzu: Der Benutzer hat diese 4 Fahrten zu einem Preis von 10, 12, 8, 15 durchgeführt. Das Gamma-Gamma-Modell hilft dabei, den wahrscheinlichsten Wert einer Transaktion in der Zukunft vorherzusagen.
Um alles zusammenzufassen, haben wir jetzt alle Elemente, um den LTV-Client zu bestimmen:


LTV = erwartete Anzahl von Transaktionen Transaktionspreis Marge


Wenn das erste Element aus dem BG / NB-Modell stammt, stammt das zweite aus dem Gamma-Gamma-Modell, und die Marge wird vom Unternehmen festgelegt.


Mathematische Notation für Gamma-Gamma-Modelle:
Benutzer verpflichtet xWerttransaktionen z1,z2,...und mx=Zi/x- den beobachteten Durchschnittswert der Transaktion.
E(M)- der versteckte Durchschnitt des Wertes der Transaktion, und was uns interessiert, ist E(M|mx,x)- der erwartete Geldwert des Nutzers basierend auf seinem Kaufverhalten.


Eigenschaften des Gamma-Gamma-Modells:
Der Geldwert von Benutzertransaktionen ist zufällig und liegt innerhalb ihrer durchschnittlichen Transaktionswerte.


Der durchschnittliche Transaktionswert variiert zwischen den Benutzern, variiert jedoch nicht für einen bestimmten Benutzer im Laufe der Zeit.


Der durchschnittliche Transaktionswert hat eine Gammaverteilung unter den Benutzern.


Die Artikel beschreiben detailliert die Ableitung der Formel durch mehrere weitere Gammaverteilungen. Das Ergebnis ist:



Dabei ist p der Formparameter und v der Skalierungsparameter der Gammaverteilung für Transaktionen Zi,qFormparameter und γder Skalierungsparameter für die Gammaverteilung v (Annahme des Modells, dass p konstant ist - die Variationskoeffizienten auf individueller Ebene sind für Benutzer gleich). Um die Modellparameter zu finden, können wir die Maximum-Likelihood-Methode verwenden.


Wir sind mit Mathe fertig und können jetzt den LTV der Benutzer bewerten. Aber was ist mit der Genauigkeit dieses Modells?


Bewertung der Modellgenauigkeit


Der traditionelle Ansatz schlägt vor, die Daten in zwei Gruppen zu unterteilen - teils für das Training, teils für den Test. In den Artikeln zeigen die Autoren, dass ihr Ansatz gut funktioniert. Ich habe diese Modelle auch an realen Daten ausprobiert und ähnliche Ergebnisse erzielt.


Die Grafik zeigt die Verteilung der realen und vorhergesagten Transaktionen für Daten aus der Testgruppe: Der Fehler beträgt hier 2,8%.



Wie bewerbe ich mich?


Wie eingangs gesagt, sind alle Modelle bereits implementiert. Beispielsweise enthält die Python-Bibliothek " Lebensdauern " alle Funktionen und Metriken, die zum Definieren des LTV erforderlich sind. Die ausführliche Dokumentation enthält viele Beispiele und Erklärungen. Es gibt auch Beispiele für SQL-Abfragen zum Empfangen von Daten im erforderlichen Format. So können Sie in wenigen Minuten zur Arbeit gehen.


Fazit


In diesem Beitrag habe ich detailliert gezeigt, wie LTV-Benutzer mit nur wenigen Attributen bewertet werden können.


Ich möchte darauf hinweisen, dass Sie sich manchmal von den häufig verwendeten gradientenverstärkten Bäumen entfernen und andere Ansätze ausprobieren können, die eine vergleichbare Genauigkeit aufweisen. Statistische Schulungen können weiterhin in die Praxis umgesetzt werden und Unternehmen dabei helfen, Kunden besser zu verstehen.


Referenzen


Fader, Peter und GS Hardie, Bruce und Lok Lee, Ka. (2005). Einfache Zählung Ihrer Kunden: Eine Alternative zum Pareto / NBD-Modell. Marketingwissenschaft.
Fader, Peter und GS Hardie, Bruce (2013). Das Gamma-Gamma-Modell des Geldwerts.
Fader, Peter S., Bruce GS Hardie und Ka Lok Lee (2005), Journal of Marketing Research, „RFM und CLV: Verwenden von Isowertkurven für die Kundenbasisanalyse“.

Source: https://habr.com/ru/post/de436236/


All Articles