
Seit der Einführung von Machine Learning bei Mindbox ist der Big Green Button ein gemeinsames Ziel. Dies ist eine solche Schaltfläche im Vollbildmodus. Wenn Sie darauf klicken, funktioniert alles von selbst und macht Gewinn.
Im Analyseprojekt „RFM“ ist das Ziel weniger ehrgeizig - Ein kleiner grüner Knopf . Sie klicken auf und die Datenbank wird automatisch in Segmente unterteilt, nach denen das Senden von E-Mails beginnt (zum Beispiel).
Um das Ziel zu erreichen, haben wir einen automatischen RFM-Segmentierer geschrieben und einen speziellen Bericht entwickelt, um die Ergebnisse zu visualisieren.
Wir erzählen, wie alles passiert ist und warum es jetzt möglich ist auf Analysten verzichten Nehmen Sie sich mehr Zeit für weniger triviale Aufgaben.
Was ist RFM-Analyse?
Das Ergebnis des E-Mail-Newsletters hängt von der Reichweite des Publikums und der Qualität des Newsletters selbst ab. Die Unendlichkeit kann nicht auf unbestimmte Zeit erhöht werden, was bedeutet, dass die Qualität erhöht werden muss. Dazu müssen Sie den Newsletter personalisieren, da alle Menschen unterschiedlich sind und jeder etwas anderes braucht.

Es gibt normalerweise viele Verbraucher, es ist schwierig, für jeden einen eigenen Brief zu schreiben. Um das Problem zu lösen, teilen Vermarkter die Verbraucher in Gruppen ein - Segmente.
Sie können auf verschiedene Arten teilen. Eine Option ist die RFM-Analyse .
Das heißt, die RFM-Analyse ist eine Art der Segmentierung. Segmente werden als disjunkte Verbrauchergruppen bezeichnet. Die RFM-Analyse schlägt drei Attribute für jeden Kunden vor:
- R (Aktualität) - Wie lange hat der Kunde die letzte Bestellung getätigt?
- F (Häufigkeit) - wie viele Bestellungen der Kunde gemacht hat.
- M (Geld) - wie viel Geld der Kunde ausgegeben hat.
Viele Marketingunternehmen erstellen und verwenden RFM-Analysen. Wir schließen ein. In einem Artikel über die RFM-Segmentierung wurde erläutert, welche Art von Bericht wir erstellen können und wie er Marketingfachleuten helfen kann.
Bestehende RFM-Analyseansätze
Bestehende Ansätze zur RFM-Analyse sind für alle ungefähr gleich.

Kunden werden nach jedem Merkmal in Gruppen eingeteilt. Normalerweise gibt es nicht mehr als fünf solcher Gruppen. Gruppenschnittpunkte werden als Segmente bezeichnet.
Wenn Sie beispielsweise für jedes der drei Merkmale in vier Gruppen unterteilen, werden 64 (4x4x4) Verbrauchersegmente und für fünf - bereits 125 Segmente - gebildet.
Die Hauptschwierigkeit besteht darin, die Grenzen der Gruppen zu bestimmen, da es keine spezifische Regel dafür gibt.
Betrachten Sie die beliebtesten Ansätze am Beispiel eines Kundenstamms:

Hier verwenden wir nur zwei der drei Dimensionen (R und M) zur Erleichterung der Wahrnehmung.
In unserem Beispiel:
- Die Anzahl der Einkäufe liegt im Bereich von 0 bis 15 Tausend Rubel.
- Die Verordnungsfrist reicht von 1 Stunde bis 240 Tagen.
Ansatz 1. Aufteilung in gleiche Teile durch Wertebereiche
Bei diesem Ansatz basiert die Trennung auf den Werten der Merkmale. In unserem Fall unterscheiden wir drei Gruppen nach Ausgaben: bis zu 5.000 Rubel, von 5 bis 10 Tausend und von 10 Tausend. Und drei Gruppen nach Rezept des Kaufdatums: bis zu 80 Tage, von 80 bis 160 Tage, von 160 Tagen.
Wir bekommen neun Segmente:

Vorteile der Methode:
- Einfach zu automatisieren.
- Sie können die "am meisten" identifizieren: diejenigen, die am häufigsten und am häufigsten kaufen und die nicht am längsten gekauft haben.
Nachteile der Methode:
- Die Verteilung zwischen den Gruppen ist ungleichmäßig: Im Beispiel waren 86% der Verbraucher in einem Segment, 13% im zweiten und 1% in den verbleibenden sieben Segmenten verteilt.
- Die Anzahl der Gruppen für jedes Attribut ist gleich.
- Viele Segmente (denken Sie daran, dass es 27 Segmente gibt, selbst wenn sie gemäß jedem Attribut in 3 Teile unterteilt sind).
Ansatz 2. Aufteilung in gleiche Teile nach Anzahl der Verbraucher
Bei diesem Ansatz wird die Trennung jedes Merkmals so durchgeführt, dass die gleiche Anzahl von Verbrauchern in die Gruppen fällt.
So werden die Käufer aus unserem Beispiel verteilt (wie zuvor teilen wir jedes Attribut in drei Teile):

Vorteile der Methode:
- Einfach zu automatisieren.
- Normalerweise gibt es kein starkes Ungleichgewicht zwischen den Gruppen.
Nachteile der Methode:
- "Besondere" Kunden fallen schlecht auf.
In dem Beispiel gab es in einem Segment Verbraucher, die 1000 Rubel und 15 Tausend kauften. Gleichzeitig stachen diejenigen, die für wirklich große Mengen kauften, nicht in einer separaten Gruppe hervor (im Gegensatz zur vorherigen Methode). - Die Anzahl der Gruppen für jedes Attribut ist gleich.
- Viele Segmente.
Ansatz 3. Handbuch
Der Analyst untersucht die Datenbank und wählt die richtige Partition aus.
Vorteile der Methode:
Nachteile der Methode:
- Benötigen Sie einen Spezialisten.
- Es braucht viel Zeit.
Ein-Knopf-RFM-Bericht mit maschinellem Lernen
Wir haben uns entschlossen, die Mängel der alten Ansätze zu beseitigen. Dazu musste ich auf Algorithmen für maschinelles Lernen zurückgreifen.
Mithilfe von Clustering-Methoden ermitteln wir automatisch, wie viele Consumer-Segmente sich tatsächlich in der Datenbank befinden und wie diese Segmente sind. Und mit Hilfe eines Entscheidungsbaums bringen wir diese Segmente in eine Form, die für die Wahrnehmung geeignet ist. Wie es funktioniert, erfahren Sie in einem separaten Artikel über den Gerätesegmentator .
Für das obige Beispiel haben wir folgendes Ergebnis erhalten:

Um dies für Vermarkter bequem und verständlich zu machen, haben wir einen Bericht entwickelt, in dem die Segmentierungsergebnisse bequem und klar beschrieben werden (wie es uns scheint).
Um es zu bekommen, klicken Sie einfach auf eine Schaltfläche - und das System erledigt alles selbst.
Der Bericht befindet sich auf einer Seite und besteht aus drei Tabellen.
Teil 1. Bewertung des Zustands der Basis
Die erste Tabelle ist eine Zusammenfassung. Es enthält Informationen zu allen Segmenten der Datenbank, die auf der Grundlage einer RFM-Analyse ermittelt wurden. Schlüsselindikatoren: Verbraucheraktivität im Segment und deren Wert.
Die Aktivität wird durch die Verschreibung des letzten Kaufs bestimmt, und der Wert wird durch den ausgegebenen Betrag bestimmt.
Jedes Segment gehört zu einer der Kategorien. Jede Kategorie kann mehrere oder gar keine Segmente haben. Die Zellen geben die Gesamtzahl der Verbraucher aus allen Segmenten der Kategorie an.

Die Indikatoren "Aktivität" und "Wert" bilden neun Kategorien von Segmenten. Eine andere Kategorie: "Nie gekauft"
PS Hier werden die Ausdrücke "Abfluss" und "Abflussrisiko" als Abkürzungen für "Vor langer Zeit keine Kunden kaufen" und "Kunden, die vor durchschnittlich langer Zeit gekauft haben" verwendet und bedeuten nicht Abfluss im wahrsten Sinne des Wortes. Ebenso ist "Aktiv" die Bezeichnung für "Kunden, die kürzlich einen Kauf getätigt haben".
Im obigen Beispiel haben 80% der Kunden keine Einkäufe, fast ein Drittel der hochwertigen Kunden befindet sich im Abfluss und ein weiteres Drittel in der Risikogruppe.
Wenn Sie den Status der Datenbank beurteilen, können Sie die Kategorie auswählen, mit der Sie zuerst arbeiten möchten.
Um zu zeigen, wie der Bericht verwendet wird, nehmen wir Kunden mit hohem Wert, dh Kunden, die das meiste Geld ausgegeben haben.
Teil 2. Die Untersuchung von Segmenten
In der zweiten Tabelle des Berichts werden Folgendes angezeigt: Segmentgröße, Umsatz, dh der von allen Verbrauchern im Segment ausgegebene Betrag und der durchschnittliche Scheck.
Alle Verbrauchersegmente werden durch eine Liste dargestellt. Hier ist zum Beispiel eine Liste von Segmenten von Käufern, die Einkäufe tätigen:

Um nur Verbraucher mit hohem Wert zu melden, verwenden wir einen Filter.

Durch die Anwendung des Filters erhalten wir sieben Verbrauchersegmente mit hohem Wert.

Basierend auf diesen Informationen können verschiedene Schlussfolgerungen gezogen werden.
Zum Beispiel hat Segment Nr. 2 einen deutlich größeren Umsatz als andere mit einer moderaten Durchschnittsrechnung. Dies weist auf eine große Anzahl von Verbraucherkäufen in diesem Segment und deren hohe Loyalität hin. Ohne Angst vor einem Abfluss von Kunden können Sie ihnen Briefe senden und beispielsweise über neue Produkte berichten.
Achten wir nun auf den Durchschnittsscheck: Segment Nr. 7 mit dem größten Durchschnittsscheck fließt ab, und Segment Nr. 9 mit dem zweitgrößten Durchschnittsscheck befindet sich in der Risikogruppe. Verbraucher aus diesen Segmenten sind bereit, große Mengen zu kaufen, haben aber schon lange nicht mehr gekauft. Vielleicht ist es sinnvoll, sie zu ermutigen, mit einem Aktionscode oder Newsletter zu handeln.
Das Studium der Segmente ist notwendig, um zu verstehen, welche Segmente es wert sind, hart gearbeitet zu werden.
Die letzte Tabelle zeigt die Grenzen der Segmente für jedes Merkmal (R, F, M) und die Durchschnittswerte für sie.

Diese Tabelle zeigt, dass Verbraucher aus Segment 2 tatsächlich mehr Einkäufe tätigen als andere - durchschnittlich 12
Wir müssen zuerst auswählen, mit welchem Segment wir arbeiten möchten. Nehmen wir an, wir interessieren uns für die Segmente mit den größten durchschnittlichen Einnahmen: Nr. 7 und Nr. 9. Betrachten wir sie genauer.
In Segment 7 haben Kunden fast ein Jahr lang keine Einkäufe getätigt - es wird nicht einfach sein, sie zurückzugeben. Aber vielleicht ist es einen Versuch wert, denn im Durchschnitt haben Verbraucher aus diesem Segment 2,1-mal gekauft - dies bedeutet, dass der erste Kauf sie nicht enttäuscht hat. Es ist wahrscheinlich, dass ein guter Rabatt ihnen hilft, sich wieder aktiv für die Marke zu interessieren.
Mit Segment Nr. 9 ist es einfacher - die durchschnittliche Verschreibung von Einkäufen bei Kunden beträgt nur drei Monate, und die durchschnittliche Anzahl von Einkäufen beträgt 2,8. Höchstwahrscheinlich sind diese Kunden sehr loyal und erfordern keine Handlungen in Bezug auf sich selbst. Sie können jedoch eine E-Mail mit einer Anzeige oder einem kleinen Rabatt senden, um an die Marke zu erinnern.
Wenn Segmente für weitere Aktionen ausgewählt sind, können Sie die erforderlichen Marketingkampagnen ausführen.
Der gegenwärtige grüne Knopf hat sehr wenig
Wir haben einen automatischen RFM-Segmentierer erstellt und waren zufrieden. Es dauert 20 Sekunden, bis eine Person den Kundenstamm nach Segmenten verteilt hat.
Wir werden die Einrichtung von Marketingkampagnen für Segmente automatisieren, damit eine Person keine Zeit damit verschwenden muss.
Natürlich wird es schade sein, dass niemand sonst unseren Bericht braucht, aber der technologische Fortschritt verschont niemanden.