Este artigo abre o ciclo de varejo. A ideia de usar análises no varejo pode ser retratada como um círculo de marketing:
A idéia básica, à primeira vista, de uma imagem inútil, é mostrar que a análise permite prever as consequências de tomar certas decisões de negócios com base na mudança subsequente na demanda do cliente. E quanto melhor entendermos a demanda, agregando informações de diferentes canais, melhor preveremos o resultado. Em suma, uma imagem de um mundo ideal, e todo mundo segue seu próprio caminho para este mundo.
Hoje falaremos sobre análise de preços no varejo offline.
1. Introdução
O Wiki fornece uma definição concisa de preço . Do ponto de vista da empresa, o preço é outra ferramenta que permite gerenciar a demanda por bens / serviços e, consequentemente, os KPIs da empresa. Por que não aproveitar os avanços da digitalização e da ciência de dados para ajudar as empresas a estabelecer preços com mais eficiência.
O preço típico de varejo das mercadorias é o seguinte:
- Produtos pelos quais o preço é limitado devido a regulamentação governamental: tabaco, alguns medicamentos. Nesse caso, eles geralmente não se incomodam e definem o preço máximo permitido
- Produtos indicadores para o comprador. Eles têm um preço estrito dos concorrentes com base em regras como "nosso preço = preço do competidor - 2%" (KVI, primeiro preço, locomotivas etc.)
- Os bens restantes ( cesta traseira ), cada um com o melhor preço possível. É sobre eles hoje que falaremos sobre como definir o preço desses produtos da melhor maneira. Destes, em média, cerca de metade da receita permanece
Vá direto ao ponto
Resumidamente, todo o processo de otimização de preços pode ser descrito nas seguintes etapas:
- Construindo um modelo de demanda do consumidor em dados históricos
- Coletamos regras de preços de negócios (mais sobre elas abaixo) e as transformamos em limitações matemáticas de otimização
- Iniciamos a otimização de acordo com o KPI fornecido (margem, receita, unidades) e obtemos os preços ideais
Não parece muito difícil, mas aqui os detalhes começam.
Para simplificar, considere o processo de otimização de preços a partir do final. Se os dois primeiros pontos forem atendidos (ou seja, os modelos de demanda forem construídos e as regras de preços formalizadas), o terceiro será uma etapa puramente técnica (é claro, se você souber qual KPI precisa otimizar). Os métodos de otimização foram inventados para muitas tarefas diferentes . No final, você pode simplesmente revisar a grade de preços e encontrar o melhor, embora essa não seja a abordagem do verdadeiro Jedi.
O segundo ponto é uma tarefa separada e muito difícil de coletar regras para automatizar os preços. Não há muitos analistas de matemática, mas o principal problema é formalizar e concordar com as regras que estão na mente de várias dezenas de Nikolaev Sergeyevichs. Felizmente, existe um conjunto mais ou menos bem estabelecido de modelos de regras a partir dos quais você pode iniciar:
- Margem não inferior / não superior a N [%] ou N [rublos]
- Alteração de preço não superior a N [%] ou N [rublos]
- O preço dentro do conjunto de preços é o mesmo
- O preço dentro da linha de produtos é o mesmo
- O preço unitário é mais barato para itens maiores.
- O preço não pode ser menor / maior que N [%], em relação aos concorrentes
- STM é mais barato que a marca por N [%]
- Formato de preço ##. 00, # 9.95 (sim, esses preços ainda gostam muito, e não apenas na Rússia)
Bem, aqui está o primeiro ponto mais interessante - construir um modelo de demanda do consumidor
Tipo e dados do modelo
O modelo deve ser construído levando em consideração que será usado para otimização adicional. I.e. os aumentos de árvores são bons quando você tem um pequeno número de pares de "produto / loja", mas tente otimizar aumentando 10.000.000 pares de "produto / loja" por uma janela noturna de 5 horas (além disso, você viu como os conjuntos de árvores representam os preços?).
Veja como os conjuntos de árvores levam em consideração os preçosO preço é mostrado no eixo x, a demanda prevista no eixo y
Exemplo de Times:

Dois exemplos:

Nesta área, os modelos lineares ainda prevalecem. Como mostra a prática, um modelo linear bem ajustado não é inferior em precisão ao aumento da "data" média satanista Cientista. Mas mesmo que a regressão linear seja ligeiramente inferior a outro modelo, não é tão assustador, porque a tarefa final é determinar o melhor preço, e não a previsão mais precisa.
Nossa tarefa é obter modelos (ou um modelo) que prevejam a demanda de cada produto em cada loja. Os dados típicos necessários para isso são histórico de vendas, histórico residual, histórico de preços, histórico promocional. Opcionalmente, você pode adicionar outros dados, como preços dos concorrentes, previsão do tempo, dados de fidelidade ou dados de transações. Nesse caso, geralmente em boas condições, há apenas um histórico de vendas. As sobras podem saltar devido a baixas contábeis, roubo e apenas problemas levando em consideração (geralmente há casos em que pode haver -0,4 latas de ervilhas verdes nas sobras, pense no que isso significa). A história dos preços e promoções é uma história completamente diferente - eles são difíceis de encontrar nas profundezas do ERP (e às vezes simplesmente não estão lá). Obviamente, é possível restaurar os preços das vendas, mas isso afetará a qualidade da simulação e, é claro, não para melhor.
Offtopic pequeno
Muitas vezes, é difícil explicar que a análise geralmente pode ajudar nos preços. Aqui estão dois casos típicos:
Caso 1. A cor azul mostra as vendas em [unidades] no tempo, vermelho - preço. Aqui o cliente nos mostra este gráfico e diz: não temos dependência clássica do preço, porque o preço está crescendo e a demanda está crescendo, o preço está caindo e a demanda está caindo. No final do artigo, ficará claro o que fazer nesse caso (e não - este não é o produto da Giffen ).
Aqui, além do preço, fatores adicionais devem ser levados em consideração. Esses fatores podem incluir (mas não estão limitados a):
- Preços próprios e preços dos concorrentes
- Eventos Promocionais
- Feriados
- Sazonalidade
- Tendências
- Ciclo de vida do produto
- Inventário
A tarefa que estamos resolvendo é entender como as mudanças de preço afetam a demanda com outros fatores conhecidos.
Caso 2. O gráfico mostra a venda de mercadorias ao longo do tempo. É difícil encontrar uma dependência do preço se os produtos forem vendidos um de cada vez por semana.
A resposta está na superfície - é necessário agregar dados para obter um sinal útil.
Vamos agora examinar em detalhes esses dois casos.
Factoring e Agregação
Para que o modelo possa levar em consideração fatores externos e ser otimizado em um tempo razoável, vamos usar a regressão linear. Nenhuma dissertação foi escrita sobre o tópico “qual modelo é o melhor para usar”, mas, na prática, dois modelos muito simples do tipo a seguir se mostraram bem:
Vamos em frente e usá-los.
Com a falta de dados, é lógico usar a agregação. Ao mesmo tempo, por agregação, podemos entender as seguintes etapas:
- Agrupamento vertical de informações (agrupamento vertical de informações) - agregação no sentido clássico, por exemplo, para observar as vendas de mercadorias no nível da cidade, em vez de em uma loja específica.
- Pool de informações horizontais - o uso de modelos econométricos com efeitos fixos , aleatórios e mistos usando dados em painel.
Depois de decidirmos sobre o modelo de previsão e o método de agregação, podemos prosseguir para a decomposição da demanda - ou seja, avaliar os coeficientes de regressão no nível mais apropriado da hierarquia geográfica das mercadorias. Ao mesmo tempo, acreditamos que todos os níveis mais baixos na hierarquia herdam dependências obtidas em níveis mais altos. Muitas vezes, você precisa voltar ao estágio de escolha de um modelo e método de agregação e tentar várias opções de decomposição.
A decomposição da demanda consiste nas seguintes etapas:
- Nos níveis superiores da hierarquia geográfica das mercadorias, avaliamos os componentes sazonais, cíclicos e de tendência usando métodos de séries temporais.
- Em níveis intermediários, subtraímos a sazonalidade obtida, construímos o próprio modelo de regressão de que falamos acima - avaliamos a influência de fatores externos.
- Nos níveis mais baixos, subtraímos a sazonalidade e a influência de fatores. Como resultado, temos sobras inexplicáveis. Nós as chamamos de tendências locais e novamente prevemos as séries temporais.
O resultado da decomposição da demanda é seu próprio modelo de previsão para cada par de “loja de mercadorias”.
Parece que todos os problemas foram resolvidos; para cada par de “loja de mercadorias” que construíram seu próprio modelo linear, resta impor restrições e enviar tudo ao otimizador. De fato, a principal dificuldade na decomposição da demanda é construir a hierarquia correta e determinar os níveis ótimos de construção da regressão. Para fazer isso, precisamos criar hierarquias geográficas e de produtos adequadas. Muitas vezes, as hierarquias da empresa são mais adequadas para tarefas de gerenciamento (por exemplo, uma hierarquia financeira ou hierarquia vinculada a fornecedores, etc.). Eles são inadequados para a tarefa de modelar a demanda, portanto, você precisa construir sua hierarquia de classes.
Para criar uma hierarquia de produtos, você precisa estudar como o comprador decide comprar mercadorias. E nos perguntando essa questão, chegamos a um novo conceito - a Árvore de Decisão do Cliente (CDT) . Ele mostra quais atributos do produto são importantes para o comprador e em que ordem eles devem estar localizados.
Na maioria dos casos, um CDT é construído com base nos atributos do produto. Quanto menor o nível de CDT, mais fortes os produtos se substituem. Os gerentes de categoria podem ser de grande ajuda na construção de um CDT, como entender bem suas categorias. Existem maneiras analíticas de criar um CDT, por exemplo, analisando um gráfico de transação. A descrição desses métodos é um artigo separado.
Exemplo de gráfico de transação de um varejista para propagaçãoCada ponto é um produto,
O peso das bordas é caracterizado pelo número de transações nas quais os dois produtos estavam juntos

Construir uma hierarquia geográfica é geralmente uma tarefa mais simples. O cluster pode ajudar aqui pela estrutura de sazonalidade, estrutura de vendas por categoria e movimentos de clientes.
Um caso interessante ocorreu em um varejista de alimentos: a estrutura da demanda variava muito, dependendo do lado das principais estradas em que as lojas estavam localizadas - para a região em que levavam mais vodka, cerveja e cigarro, para o centro - mais produtos de limpeza, iogurtes infantis e ração animal - Era um padrão estável de consumo.
Tendo construído separadamente o CDT e a hierarquia geográfica, combinamos-os em uma hierarquia geográfica de mercadorias. Assim, construímos uma nova hierarquia que é ótima para modelar a demanda.
Qual é o resultado
Como resultado, construímos uma nova hierarquia que é adequada para modelagem de demanda e também obtivemos uma sequência de ações que precisam ser executadas para construir os próprios modelos de demanda para otimização adicional. Aqui está um breve resumo dos procedimentos de criação de modelo:
- Avaliar sazonalidade, tendência, componentes cíclicos
- Agregamos os dados ao nível da hierarquia geográfica das mercadorias, na qual avaliamos a sazonalidade, tendência e componentes cíclicos
- Todos os níveis hierárquicos abaixo herdam os valores obtidos.
- Agregamos os dados no nível em que avaliaremos a influência de fatores externos
- Subtrair sazonalidade e tendência
- Avaliamos a influência de fatores externos
- Todos os níveis hierárquicos abaixo herdam uma estimativa calculada do impacto de fatores externos
- Subtraia os valores sazonais obtidos e avalie a influência de fatores externos no nível mais detalhado - produto / loja
- Os resíduos são suavizados e previstos por métodos simples. Restauramos a sazonalidade, as férias, a influência de promoções e preços.
Como resultado, para cada produto em cada loja, temos nossa própria fórmula:
As pessoas de negócios perguntam imediatamente, mas como é levada em consideração a influência mútua de mercadorias? Isso pode ser levado em consideração na fase de modelagem de várias maneiras, mas aqui estão duas das mais populares:
Método direto - levamos em consideração os preços dos produtos que exercem maior influência um sobre o outro na fórmula da demanda:
Modelando a participação das vendas - prevemos as vendas do grupo e a participação de cada produto dentro do grupo:
Em seguida, enviamos as fórmulas para cada par de “loja de mercadorias” ao otimizador e obtemos os preços ideais na produção.

Mas e esse exemplo?
Voltamos ao exemplo do primeiro caso
Demanda (azul) e preço (vermelho) ao longo do tempo

Demanda (eixo Y) dependendo do preço (eixo X)
Sim, à primeira vista, a dependência da demanda sobre os preços está realmente ausente, defina o preço máximo e alegre-se.
Mas, tendo construído uma nova hierarquia de previsão, calculado a sazonalidade em um nível superior, subtraímos no nível das mercadorias.
Obter a seguinte imagem
Demanda com ajuste sazonal (azul) e preço (vermelho) ao longo do tempo

Demanda por ajuste sazonal (eixo Y) versus preço (eixo X)
Dependência típica da demanda em relação ao preço (quanto maior o preço, menor a demanda). I.e. neste caso, a influência da sazonalidade é claramente visível, levando em conta o que é imediatamente óbvio que o produto é bastante elástico.
Conclusão
Otimizar preços não é apenas benéfico para a empresa (alguns por cento da margem ainda não incomodaram ninguém), mas também é interessante. Existem regressões, otimização e análise de gráficos, e tudo isso em um grande invólucro de data - há espaço para a alma do analista se virar. Mas não esqueça que a modelagem de demanda e a otimização de preços são apenas uma pequena parte do processo de precificação de grandes empresas e, além do restante, são de pouca utilidade.
Otimize processos, otimize preços, otimize o armazenamento de dados (afinal, Garbage In - Garbage Out) e obtenha resultados interessantes.