
Desde que o Machine Learning foi introduzido pela primeira vez na Mindbox, o Big Green Button se tornou um objetivo comum. Esse é um botão em tela cheia, quando clicado, tudo funciona por si só e gera lucro.
No projeto analítico “RFM”, o objetivo é menos ambicioso - Um pequeno botão verde . Você clica e o banco de dados é automaticamente dividido em segmentos pelos quais o envio de e-mails é iniciado (por exemplo).
Para atingir o objetivo, escrevemos um segmentador automático de RFM e desenvolvemos um relatório especial para visualizar os resultados.
Contamos como tudo aconteceu e por que agora é possível dispensar analistas dedicar mais tempo a tarefas menos triviais.
O que é análise de RFM?
O resultado do boletim de e-mail depende do alcance do público e da qualidade do próprio boletim. O infinito não pode ser aumentado indefinidamente, o que significa que a qualidade deve ser aumentada. Para fazer isso, você precisa personalizar o boletim, pois todas as pessoas são diferentes e todos precisam de algo diferente.

Geralmente existem muitos consumidores, é difícil fazer uma letra individual para cada um. Para lidar com o problema, os profissionais de marketing dividem os consumidores em grupos - segmentos.
Você pode compartilhar de diferentes maneiras. Uma opção é a análise de RFM .
Ou seja, a análise de RFM é uma forma de segmentação. Os segmentos são chamados de grupos de consumidores independentes. A análise de RFM sugere três atributos para cada cliente:
- R (Recência) - há quanto tempo o cliente fez o último pedido.
- F (Frequência) - quantos pedidos o cliente fez.
- M (Monetário) - quanto dinheiro o cliente gastou.
Muitas empresas de marketing fazem e usam a análise RFM. Nós estamos incluindo. Em um artigo sobre a segmentação por RFM, eles disseram que tipo de relatório podemos fazer e como pode ajudar os profissionais de marketing.
Abordagens de análise de RFM existentes
As abordagens existentes para análise de RFM são aproximadamente as mesmas para todos.

Os clientes são divididos em grupos de acordo com cada característica. Normalmente, não existem mais do que cinco desses grupos. As interseções de grupo são chamadas de segmentos.
Por exemplo, ao dividir em quatro grupos para cada uma das três características, 64 segmentos de consumidor (4x4x4) são formados e para cinco - já 125 segmentos.
A principal dificuldade é determinar os limites dos grupos, porque não existe uma regra específica sobre como fazer isso.
Considere as abordagens mais populares no exemplo de uma base de clientes:

Aqui usamos apenas duas das três dimensões (R e M) para facilitar a percepção.
No nosso exemplo:
- A quantidade de compras está na faixa de 0 a 15 mil rublos.
- O período de prescrição varia de 1 hora a 240 dias.
Abordagem 1. Divisão em partes iguais por faixas de valores
Com essa abordagem, a separação é baseada nos valores das características. No nosso caso, distinguimos três grupos gastando: até 5 mil rublos, de 5 a 10 mil e de 10 mil. E três grupos de acordo com a prescrição da data da compra: até 80 dias, de 80 a 160 dias, a partir de 160 dias.
Temos nove segmentos:

Vantagens do método:
- Fácil de automatizar.
- Você pode identificar o "maior número": quem compra mais, com mais frequência e que não compra mais.
Contras do método:
- A distribuição entre grupos é desigual: no exemplo, 86% dos consumidores em um segmento, 13% no segundo, 1% foi distribuído nos sete segmentos restantes.
- O número de grupos para cada atributo é o mesmo.
- Muitos segmentos (lembre-se de que, mesmo quando dividido em três partes, de acordo com cada atributo, haverá 27 segmentos).
Abordagem 2. Divisão em partes iguais pelo número de consumidores
Com essa abordagem, a separação de cada característica é realizada para que o mesmo número de consumidores se enquadre nos grupos.
É assim que os compradores do nosso exemplo são distribuídos (como antes, dividimos em três partes para cada atributo):

Vantagens do método:
- Fácil de automatizar.
- Geralmente, não há forte desequilíbrio entre os grupos.
Contras do método:
- Clientes “especiais” se destacam mal.
No exemplo, em um segmento, havia consumidores que compraram 1 mil rublos e 15 mil. Ao mesmo tempo, quem comprou por quantidades realmente grandes não se destacou em um grupo separado (ao contrário do método anterior). - O número de grupos para cada atributo é o mesmo.
- Muitos segmentos.
Abordagem 3. Manual
O analista examina o banco de dados e seleciona a partição correta.
Vantagens do método:
Contras do método:
- Precisa de um especialista.
- Leva muito tempo.
Relatório RFM de um botão com aprendizado de máquina
Decidimos nos livrar das deficiências das antigas abordagens. Para fazer isso, tive que recorrer aos algoritmos de Machine Learning .
Usando métodos de cluster, determinamos automaticamente quantos segmentos de consumo realmente existem no banco de dados e quais são esses segmentos. E com a ajuda de uma árvore de decisão, levamos esses segmentos a um formato conveniente para a percepção. Como funciona, contamos em um artigo separado sobre o segmentador de dispositivos .
Para o exemplo acima, obtivemos este resultado:

Para tornar tudo isso conveniente e compreensível para os profissionais de marketing, desenvolvemos um relatório no qual os resultados da segmentação são descritos de maneira conveniente e clara (como nos parece).
Para obtê-lo, basta clicar em um botão - e o sistema fará tudo sozinho.
O relatório é colocado em uma página e consiste em três tabelas.
Parte 1. Avaliação do estado da base
A primeira tabela é um resumo. Ele contém informações sobre todos os segmentos do banco de dados, obtidas com base na análise de RFM. Principais indicadores: atividade do consumidor no segmento e seu valor.
A atividade é determinada pela prescrição da última compra e o valor é determinado pelo valor gasto.
Cada segmento pertence a uma das categorias. Cada categoria pode ter vários segmentos ou nenhum. As células indicam o número total de consumidores de todos os segmentos da categoria.

Os indicadores "Atividade" e "Valor" formam nove categorias de segmentos. Outra categoria: "Nunca comprei"
PS Aqui, as expressões "Saída" e "Risco de saída" são usadas como abreviações para "Há muito tempo que não compramos clientes" e "Clientes que compraram a quantidade média de tempo atrás" e não significam saída no sentido literal da palavra. Da mesma forma, "Ativo" é a designação para "Clientes que fizeram uma compra recentemente".
No exemplo acima, 80% dos clientes não têm compras, quase um terço dos de alto valor está em saída e outro terço está no grupo de risco.
A avaliação do estado do banco de dados ajuda a escolher a categoria com a qual é importante trabalhar em primeiro lugar.
Para mostrar como usar o relatório, levamos clientes de alto valor, ou seja, clientes que gastaram mais dinheiro.
Parte 2. O estudo de segmentos
A segunda tabela do relatório exibe: tamanho do segmento, rotatividade, ou seja, o valor gasto por todos os consumidores no segmento e a verificação média.
Todos os segmentos de consumidores são representados por uma lista. Por exemplo, aqui está uma lista de segmentos de compradores que fazem compras:

Para relatar apenas consumidores com alto valor, usamos um filtro.

Como resultado da aplicação do filtro, obtemos sete segmentos de consumidores com alto valor.

Com base nessas informações, várias conclusões podem ser tiradas.
Por exemplo, o segmento nº 2 tem uma rotatividade significativamente maior do que outros com uma fatura média moderada. Isso indica um grande número de compras de consumidores nesse segmento e sua alta lealdade. Sem medo de uma saída de clientes, você pode enviar cartas e contar, por exemplo, sobre novos produtos.
Agora, vamos prestar atenção à verificação média: o segmento n ° 7 com a maior média de verificação está em saída e o segmento n ° 9 com a segunda maior média de verificação está no grupo de risco. Os consumidores desses segmentos estão prontos para comprar grandes quantidades, mas não compram há muito tempo. Talvez faça sentido incentivá-los a agir com um código promocional ou boletim informativo.
O estudo de segmentos é necessário para entender quais segmentos valem a pena trabalhar duro.
A última tabela mostra os limites dos segmentos para cada característica (R, F, M) e os valores médios para eles.

Esta tabela mostra que os consumidores do segmento 2 realmente têm mais compras que outros - uma média de 12
Precisamos escolher com qual segmento queremos trabalhar primeiro. Digamos que estamos interessados nos segmentos com as maiores receitas médias: 7 e 9. Vamos considerá-los com mais detalhes.
No segmento 7, os clientes não realizam compras há quase um ano - não será fácil devolvê-las. Mas talvez valha a pena tentar, porque, em média, os consumidores deste segmento compraram 2,1 vezes - isso significa que a primeira compra não os decepcionou. É provável que um bom desconto os ajude novamente a se interessar ativamente pela marca.
Com o segmento nº 9, é mais fácil: a prescrição média de compras dos clientes é de apenas três meses e o número médio de compras é de 2,8. Muito provavelmente, esses clientes são bastante leais e não exigem nenhuma ação em relação a si mesmos. Mas você pode enviar um e-mail com um anúncio ou um pequeno desconto para lembrar a marca.
Quando segmentos para ações adicionais são selecionados, você pode executar as campanhas de marketing necessárias.
Há muito pouco no atual botão verde
Criamos um segmentador automático de RFM e ficamos satisfeitos - leva 20 segundos do tempo de uma pessoa para obter a distribuição da base de clientes por segmentos.
Vamos automatizar a criação de campanhas de marketing para segmentos, para que uma pessoa não precise perder tempo com isso.
Obviamente, será uma pena que ninguém mais precise do nosso relatório, mas o progresso tecnológico não poupa ninguém.