O que fornece o aprendizado de máquina no varejo: um exemplo de projeto

O varejo tem um círculo muito diversificado de clientes. Existem muitos deles - várias profissões e níveis de renda, desde jovens a idosos. Essa variedade não pode ser descrita corretamente por duas ou três regras de negócios, porque você simplesmente não pode cobrir todas as combinações de critérios e inevitavelmente perde alguns clientes. Portanto, para o varejo, é muito importante segmentar seu público com a maior precisão possível, mas isso inevitavelmente complica os modelos. As tecnologias de aprendizado de máquina são úteis aqui, fornecendo às empresas previsões e respostas mais precisas para perguntas importantes.





Que perguntas você quer dizer? Por exemplo: o cliente sairá? Muitas vezes, os clientes saem se a loja não tiver o produto certo. Por exemplo, uma mulher compra um creme especial todos os meses por 10 mil rublos e pode escolher entre duas lojas de cosméticos. Em um deles, o produto necessário geralmente está ausente e no segundo não há problemas com a disponibilidade. Provavelmente, ela comprará constantemente no segundo, embora um pouco mais caro.

Outra pergunta urgente: como otimizar o trabalho da equipe? Por exemplo, você precisa planejar turnos de trabalho para caixas e consultores de vendas. Uma maneira envolve o uso de análise estatística. O analista avalia a atividade dos clientes, dependendo do dia da semana, e percebe que no sábado eles compram mais, e na sexta e domingo um pouco menos. Essa hipótese é verificada por testes estatísticos e as conclusões são passadas à gerência.

Mas essa análise pode não levar em consideração muitas combinações de fatores. Por exemplo, se 7 de março for quarta-feira - eles comprarão mais neste dia do que na sexta-feira (afinal, em horários normais, sexta-feira é um dia mais popular do que em outros dias da semana)? E formatura? Ou feriados locais? Quanto mais fatores, mais difícil é levar todos em consideração com a ajuda de regras simples. E, em vez de complicar infinitamente as regras, você pode criar um modelo que preveja a demanda para um dia específico.



Nosso projeto no varejo não alimentar


Nesse caso, foi necessário analisar a base de clientes (aproximadamente 2,5 milhões de pessoas) e prever qual deles retornaria à loja nas próximas duas semanas. Adotamos dois métodos da biblioteca CatBoost - CatBoostClassifier e CatBoostRegressor, o primeiro - para prever a composição do público, o segundo - para selecionar os produtos mais populares nas próximas duas semanas. O CatBoost surgiu no começo do nosso projeto, era uma nova abordagem para trabalhar com atributos categóricos. E como a variedade de produtos de nossos clientes contém muitos recursos categóricos, tentamos com prazer o novo produto. Após selecionar os parâmetros, o modelo atendeu imediatamente nossas expectativas com previsão precisa. Não é de admirar que o CatBoost seja um dos modelos de aumento de gradiente mais populares da atualidade.

Para o modelo, fizemos estatísticas para 2017:

  • cheques: quem possui o cartão de bônus do cheque, quando a compra é feita, o que eles compraram, tamanho do desconto, compra ou reembolso.
  • demografia: região e cidade de residência do cliente, data de nascimento e sexo, consentimento para envio por telefone ou correio.
  • produtos: qual categoria ou segmento inclui compras, escopo etc.

Limpamos os dados de ruído (cartões do vendedor, devoluções, compras de serviços, não mercadorias) e calculamos os critérios necessários (porcentagem de desconto, idade). Depois disso, calculamos o maior e o menor recebimento para cada cliente, os descontos médios, medianos e máximos, quantas vezes uma pessoa entrou e quantos produtos de quais categorias ele comprou. Esses parâmetros foram contados em intervalos: na semana passada, duas semanas, um mês, três meses. Esse trabalho meticuloso possibilitou a construção de modelos com alta precisão de previsão.

Dados agregados para modelos e cálculos iniciados. O primeiro modelo previu qual dos compradores viria nas próximas duas semanas e o segundo emitiu recomendações: quais produtos (até o nível do artigo) uma determinada pessoa compraria. A propósito, o requisito de prever a popularidade de artigos específicos complicou bastante a tarefa (geralmente as empresas precisam de previsões baseadas em categorias e nomes de produtos, em vez de posições).

Os clientes recomendados pelo modelo para mala direta tiveram uma verificação mediana maior em uma visita e, durante o período analisado, compraram uma quantia total superior a outros clientes.



Como resultado, após o envio, cerca de 30% dos clientes compraram pelo menos um dos três produtos previstos pelo modelo.

Agora a empresa pode prever com mais precisão as vendas: o varejista sabe quem o procurará no futuro próximo e o que comprará. Isso ajuda não apenas a otimizar a logística, mas também a reduzir os custos associados. Por exemplo, se um cliente em particular normalmente não compra nada no inverno, você não precisa enviar um SMS para ele em janeiro. Os modelos também otimizam as correspondências: um especialista com base em uma previsão entende imediatamente quem deve enviar um email e para quem - um SMS urgente.

Armadilhas


Eles estão em qualquer tarefa de ML - eles estavam na nossa. Por exemplo, testamos se as correspondências de recomendações de produtos ajudam a aumentar as vendas. Para isso, o segmento de clientes previsto foi dividido em três grupos:

  1. Controle - não recebeu o boletim.
  2. Grupo com lembretes - recebeu um texto comum da loja.
  3. Grupo com recomendações - recebeu SMS com três produtos específicos previstos pelo modelo.

Verificou-se que as pessoas que receberam recomendações compraram menos do que os clientes que não receberam boletins. A fatura média e a quantidade de mercadorias compradas eram menores. O teste T mostrou que as diferenças foram estatisticamente significantes (pvalor = 0,017).



Para dizer o mínimo, esses resultados desanimaram todos. Eles começaram a procurar o motivo e descobriram que as lojas enviavam mensagens aos clientes em um mensageiro específico, e seus usuários em nosso segmento compravam inicialmente menos do que outros clientes. Até os profissionais de marketing do cliente não sabiam disso. Portanto, o experimento mostrou-se incorreto, mas, de acordo com seus resultados, adicionamos o parâmetro "usuário do messenger" ao modelo. Este caso demonstra como selecionar cuidadosamente os canais de comunicação com os clientes.
Que outras conclusões podem ser tiradas?

  • Não há muitos dados.
  • Às vezes, a visão do analista de lado leva a uma nova idéia.

Segmentação de clientes


A análise de dados permite detectar padrões ocultos nas informações disponíveis anteriormente. Um bom exemplo é comparar grupos de clientes usando a segmentação RFM (frequência de frequência recente) e a segmentação usando algoritmos ML.

A segmentação RFM usa três métricas principais:

  • Prescrição da última compra
  • frequência de compras para o período
  • quantia gasta pelo cliente.

Com base nesses dados, destacam-se os principais grupos: “desperdiçadores”, “clientes fiéis”, “clientes quase perdidos” etc. E os profissionais de marketing já incluem o grupo-alvo desejado em um boletim específico ou fazem uma oferta especificamente para esse grupo.

Por exemplo, usando a segmentação RFM, você pode selecionar segmentos de clientes e representá-los como pontos no espaço tridimensional:



Isso permite que você veja visualmente a localização de certos grupos na massa total de clientes, em suas proporções e na dinâmica das mudanças.

Agora projete a distribuição tridimensional dos segmentos no plano. Os clientes podem ser divididos pela receita gerada pela empresa para incluir os mais rentáveis ​​nas campanhas de marketing, mas será suficiente para um planejamento eficaz?

Mesmo nesses dados, o algoritmo de aprendizado de máquina encontra possibilidades adicionais: divide os clientes em novos grandes grupos. Você pode analisar esta partição para descobrir por que o algoritmo dividiu os clientes dessa maneira. Por exemplo, alguns clientes altamente lucrativos são especialistas que acompanham seus clientes nas compras e usam seus cartões de desconto; alguns compartilham ativamente seus cartões com amigos e conhecidos. Ou seja, após o primeiro uso do ML, você pode obter informações adicionais sobre seus clientes com base nos mesmos dados.



Vamos expandir o conjunto de características do cliente: adicione sexo, idade, comportamentos e muito mais. Como agora o algoritmo distribuirá os compradores?

Por exemplo, existe um grupo que cobre os melhores clientes (os mais rentáveis) e seus "vizinhos", que trazem menos lucro. Por que o algoritmo alocou esse grupo é uma pergunta para o analista. Talvez esses clientes com estímulo adicional mostrem maior lucratividade. Ou, pelo contrário, esses clientes não são particularmente promissores e o aumento da lucratividade foi um desvio aleatório - estimulá-los também é inútil. Várias teorias podem ser apresentadas, mas precisam ser verificadas experimentalmente.



Planejamento de depósito - Previsão de vendas


Além disso, o projeto possui várias opções de desenvolvimento. Por exemplo, você pode prever compras em uma loja específica para o próximo período. Em seguida, o administrador da loja poderá solicitar as mercadorias necessárias no armazém central a tempo.

A análise das compras em uma loja específica ajudará a formular a exibição de mercadorias nas vitrines. Por exemplo, se muitos compradores masculinos vierem à loja, o departamento de produtos masculinos não deverá ser colocado no canto oposto.

Não se esqueça da chamada canibalização de lojas. Ou seja, se dois pontos de venda da mesma rede estiverem próximos (por exemplo, em extremos diferentes da mesma rua), um deles poderá afastar os clientes e o segundo ficará ocioso. Você pode criar um modelo que rastreie esses fenômenos e sinalize sobre eles.

***

Em resumo, o aprendizado de máquina é uma ferramenta poderosa que pode fazer muito. Muitas vezes, ao criar modelos, são revelados padrões não óbvios que nem mesmo os usuários corporativos sabiam. No entanto, a qualidade do modelo depende muito da qualidade e quantidade de dados.

Analistas da Diretoria de Desenvolvimento e Implementação de Software, Jet Infosystems

Source: https://habr.com/ru/post/pt430448/


All Articles