Cet article ouvre le cycle de vente au détail. L'idée d'utiliser l'analytique dans le commerce de détail peut être présentée comme un cercle marketing:
L'idée principale, à première vue, d'une image inutile, est de montrer que l'analyse vous permet de prédire les conséquences de la prise de certaines décisions commerciales en fonction du changement ultérieur de la demande des clients. Et mieux nous comprenons la demande, en agrégeant les informations de différents canaux, mieux nous prédirons le résultat. Bref, une image d'un monde idéal, et chacun suit son propre chemin vers ce monde.
Aujourd'hui, nous parlerons de l'analyse des prix dans la vente au détail hors ligne.
Présentation
Le wiki donne une définition concise des prix . Du point de vue de l'entreprise, la tarification est un autre outil qui vous permet de gérer la demande de biens / services et, en conséquence, les KPI de l'entreprise. Pourquoi ne pas profiter des progrès de la numérisation et de la science des données pour aider les entreprises à fixer leurs prix plus efficacement.
Le prix de détail typique des marchandises est le suivant:
- Produits dont le prix est limité en raison de la réglementation gouvernementale: tabac, certains médicaments. Dans ce cas, ils ne dérangent généralement pas et fixent le prix maximum autorisé
- Produits indicateurs pour l'acheteur. Ils sont strictement facturés par les concurrents sur la base de règles telles que "notre prix = prix du concurrent - 2%" (KVI, premier prix, locomotives, etc.)
- Les marchandises restantes ( panier arrière ), dont chaque prix au meilleur de leurs capacités. C'est à leur sujet aujourd'hui que nous parlerons de la meilleure façon de fixer le prix de ces biens. De ce nombre, environ la moitié des revenus restent en moyenne
Aller droit au but
En bref, l'ensemble du processus d'optimisation des prix peut être décrit dans les étapes suivantes:
- Construire un modèle de demande des consommateurs sur des données historiques
- Nous collectons les règles de tarification des entreprises (plus d'informations à leur sujet ci-dessous) et les transformons en limitations mathématiques de l'optimisation
- Nous commençons l'optimisation en fonction du KPI donné (marge, chiffre d'affaires, unités) et obtenons les prix optimaux
Cela ne semble pas très difficile, mais ici les détails commencent.
Pour plus de simplicité, considérez le processus d'optimisation des prix de la fin. Si les deux premiers points sont remplis (c'est-à-dire que les modèles de demande sont construits et les règles de tarification sont formalisées), alors le troisième est une étape purement technique (bien sûr, si vous savez quel KPI vous devez optimiser). Des méthodes d'optimisation ont été inventées pour de nombreuses tâches différentes . En fin de compte, vous pouvez simplement parcourir la grille des prix et trouver le meilleur, bien que ce ne soit pas l'approche du vrai Jedi.
Le deuxième point est une tâche distincte et très difficile de collecte de règles pour automatiser la tarification. Il n'y a pas beaucoup d'analystes en mathématiques, mais le problème principal est de formaliser et de convenir des règles qui sont dans l'esprit de plusieurs dizaines de Nikolaev Sergeyevichs. Heureusement, il existe un ensemble de modèles de règles plus ou moins bien établi à partir duquel vous pouvez commencer:
- Marge non inférieure / non supérieure à N [%] ou N [roubles]
- Changement de prix pas plus de N [%] ou N [roubles]
- Le prix dans le groupe de prix est le même
- Le prix dans la gamme de produits est le même
- Le prix unitaire est moins cher pour les articles plus gros.
- Le prix ne peut pas être inférieur / supérieur à N [%] par rapport à ses concurrents
- STM est moins cher que la marque de N [%]
- Format de prix ##. 00, # 9.95 (oui, ces prix sont toujours très appréciés, et pas seulement en Russie)
Eh bien, voici le premier point le plus intéressant - construire un modèle de demande des consommateurs
Type de modèle et données
Le modèle doit être construit en tenant compte du fait qu'il sera utilisé pour une optimisation ultérieure. C'est-à-dire les boosters d'arbres sont bons lorsque vous avez un petit nombre de paires «produit / magasin», mais essayez d'optimiser en augmentant 10 000 000 de paires «produit / magasin» pour une fenêtre de nuit de 5 heures (en outre, avez-vous vu comment les ensembles d'arbres tiennent compte des prix?).
Voici comment les ensembles d'arbres tiennent compte des prixLe prix est affiché sur l'axe des x, la demande prévue sur l'axe des y
Exemple de temps:

Deux exemples:

Dans ce domaine, les modèles linéaires règnent toujours. Comme le montre la pratique, un modèle linéaire bien réglé n'est pas inférieur en précision à l'augmentation de la «date» moyenne sataniste Scientifique. " Mais même si la régression linéaire est légèrement inférieure à un autre modèle, ce n'est pas si effrayant, car la dernière tâche consiste à déterminer le meilleur prix et non la prévision la plus précise.
Notre tâche consiste à obtenir des modèles (ou un modèle) qui prédisent la demande pour chaque produit dans chaque magasin. Les données typiques qui sont nécessaires pour cela sont l'historique des ventes, l'historique résiduel, l'historique des prix, l'historique promotionnel. En option, vous pouvez ajouter d'autres données telles que les prix des concurrents, la météo, les données de fidélité ou les données de transaction. Dans ce cas, généralement en bon état, il n'y a qu'un historique de vente. Les restes peuvent sauter en raison de radiations, de vols et simplement de problèmes à prendre en compte (il y a souvent des cas où il peut y avoir -0,4 boîte de pois verts sur les restes, alors pensez à ce que cela signifie). L'histoire des prix et des promotions est une tout autre histoire - ils sont difficiles à trouver dans les profondeurs de l'ERP (et parfois ils ne sont tout simplement pas là). Bien sûr, il est possible de rétablir les prix des ventes, mais cela affectera en conséquence la qualité de la simulation et, bien sûr, pas pour le mieux.
Petit hors-sujet
Il est souvent difficile d'expliquer que l'analyse peut généralement aider à la tarification. Voici deux cas typiques:
Cas 1. La couleur bleue indique les ventes en [unités] dans le temps, rouge - prix. Ici, le client nous montre ce graphique et dit: nous n'avons aucune dépendance classique à l'égard du prix, car le prix augmente et la demande augmente, le prix baisse et la demande diminue. À la fin de l'article, il deviendra clair quoi faire dans ce cas (et non - ce n'est pas le produit de Giffen ).
Ici, en plus du prix, des facteurs supplémentaires doivent être pris en compte. Ces facteurs peuvent inclure (mais sans s'y limiter):
Comment ça se passe sans lui :) - Prix propres et prix concurrents
- Événements promotionnels
- Vacances
- Saisonnalité
- Les tendances
- Cycle de vie du produit
- Inventaire
La tâche que nous résolvons est de comprendre comment les changements de prix affectent la demande avec d'autres facteurs connus.
Cas 2. Le graphique montre la vente de marchandises au fil du temps. Il est difficile de trouver une dépendance au prix si les marchandises sont vendues une à la fois par semaine.
La réponse se trouve à la surface - il est nécessaire d'agréger les données pour obtenir un signal utile.
Examinons maintenant en détail ces deux cas.
Affacturage et agrégation
Pour que le modèle puisse prendre en compte des facteurs externes et être optimisé dans un délai raisonnable, utilisons une régression linéaire. Aucune thèse n'a été rédigée sur le thème «quel modèle est le meilleur à utiliser», mais dans la pratique, deux modèles très simples du type suivant ont fait leurs preuves:
Allons de l'avant et utilisons-les.
Avec un manque de données, il est logique d'utiliser l'agrégation. Dans le même temps, par agrégation, nous pouvons comprendre les étapes suivantes:
- Mise en commun verticale des informations (mise en commun verticale des informations) - agrégation au sens classique, par exemple, pour surveiller les ventes de marchandises au niveau de la ville, plutôt que d'un magasin particulier.
- Mise en commun horizontale des informations - utilisation de modèles économétriques à effets fixes , aléatoires et mixtes utilisant des données de panel.
Après avoir décidé du modèle de prévision et de la méthode d'agrégation, nous pouvons procéder à la décomposition de la demande - c'est-à-dire évaluer les coefficients de régression au niveau le plus approprié de la hiérarchie géographique des produits. Dans le même temps, nous pensons que tous les niveaux inférieurs de la hiérarchie héritent des dépendances obtenues aux niveaux supérieurs. Souvent, vous devez revenir à l'étape du choix d'un modèle et d'une méthode d'agrégation et essayer plusieurs options de décomposition.
La décomposition de la demande comprend les étapes suivantes:
- Aux niveaux supérieurs de la hiérarchie géographique des produits, nous évaluons les composantes saisonnières, cycliques et tendancielles à l'aide de méthodes de séries chronologiques.
- Aux niveaux intermédiaires, nous soustrayons la saisonnalité obtenue, construisons le modèle même de régression dont nous avons parlé plus haut - évaluons l'influence des facteurs externes.
- Aux niveaux inférieurs, nous soustrayons la saisonnalité et l'influence des facteurs. En conséquence, nous avons des restes inexpliqués. Nous les appelons tendances locales et prédisons à nouveau les séries chronologiques.
Le résultat de la décomposition de la demande est son propre modèle de prévision pour chaque paire de «magasin de marchandises».
Il semblerait que tous les problèmes aient été résolus, pour chaque paire de «produit-magasin» ils ont construit leur propre modèle linéaire, il reste à imposer des restrictions et tout envoyer à l'optimiseur. En fait, la principale difficulté de la décomposition de la demande est de construire la bonne hiérarchie et de déterminer les niveaux optimaux de construction de régression. Pour ce faire, nous devons créer des hiérarchies de produits et géographiques appropriées. Souvent, les hiérarchies d'entreprise sont plus adaptées aux tâches de gestion (par exemple, une hiérarchie financière ou une hiérarchie liée aux fournisseurs, etc.). Ils sont mal adaptés à la tâche de modélisation de la demande, vous devez donc créer votre hiérarchie de classes.
Pour créer une hiérarchie de produits, vous devez étudier comment l'acheteur décide d'acheter des marchandises. Et en nous posant cette question, nous arrivons à un nouveau concept - l' Arbre de décision client (CDT) . Il montre quels attributs de produit sont importants pour l'acheteur et dans quel ordre ils doivent être localisés.
Dans la plupart des cas, un CDT est construit sur la base des attributs du produit. Plus le niveau de CDT est bas, plus les produits se remplacent les uns les autres. Les gestionnaires de catégorie peuvent être d'une grande aide dans la construction d'un CDT, comme bien comprendre leurs catégories. Il existe des moyens analytiques de créer un CDT, par exemple, en analysant un graphique de transaction. La description de ces méthodes est un article distinct.
Exemple de graphique de transaction d'un détaillant pour l'amorçageChaque point est un produit,
Le poids des bords est caractérisé par le nombre de transactions dans lesquelles les deux produits étaient ensemble

Construire une hiérarchie géographique est généralement une tâche plus simple. Le clustering peut aider ici par la structure de la saisonnalité, la structure des ventes par catégorie et les mouvements des clients.
Un cas intéressant était dans un détaillant alimentaire: la structure de la demande variait considérablement selon le côté des routes principales où les magasins étaient situés - dans la région où ils transportaient plus de vodka, de bière et de cigarettes, vers le centre - plus de produits de nettoyage, de yaourts pour enfants et d'aliments pour animaux - C'était un modèle de consommation stable.
Ayant construit séparément le CDT et la hiérarchie géographique, nous les combinons en un produit-géographique. Ainsi, nous avons construit une nouvelle hiérarchie idéale pour modéliser la demande.
Quel est le résultat
En conséquence, nous avons construit une nouvelle hiérarchie bien adaptée à la modélisation de la demande, et nous avons également obtenu une séquence d'actions qui doivent être effectuées pour construire les modèles de demande eux-mêmes pour une optimisation supplémentaire. Voici un bref résumé des procédures de construction du modèle:
- Évaluer la saisonnalité, la tendance et les composantes cycliques
- Nous agrégons les données au niveau de la hiérarchie géographique des produits de base, à laquelle nous évaluons la saisonnalité, la tendance et les composantes cycliques
- Tous les niveaux de hiérarchie ci-dessous héritent des valeurs obtenues.
- Nous agrégons les données au niveau auquel nous évaluerons l'influence des facteurs externes
- Soustraire la saisonnalité et la tendance
- Nous évaluons l'influence de facteurs externes
- Tous les niveaux hiérarchiques ci-dessous héritent d'une estimation calculée de l'impact des facteurs externes
- Soustraire les valeurs saisonnières obtenues et évaluer l'influence des facteurs externes au niveau le plus détaillé - produit / magasin
- Les résidus sont lissés et prédits par des méthodes simples. Nous restaurons la saisonnalité, les vacances, l'influence des promotions et des prix.
En conséquence, pour chaque produit dans chaque magasin, nous avons obtenu notre propre formule:
Les gens d'affaires demanderont immédiatement, mais comment l'influence mutuelle des marchandises les unes sur les autres est-elle prise en compte? Il peut être pris en compte au stade de la modélisation de plusieurs manières, mais voici deux des plus populaires:
Méthode directe - nous prenons en compte les prix des biens qui ont le plus d'influence les uns sur les autres dans la formule de demande:
Modélisation de la part des ventes - nous prédisons les ventes du groupe et la part de chaque produit au sein du groupe:
Ensuite, nous envoyons les formules pour chaque paire de «magasin de marchandises» à l'optimiseur et obtenons les prix optimaux à la sortie.

Mais qu'en est-il de cet exemple?
Nous revenons à l'exemple du premier cas
Demande (bleu) et prix (rouge) au fil du temps

Demande (axe Y) en fonction du prix (axe X)
Oui, à première vue, la dépendance de la demande sur les prix est vraiment absente, fixez le prix maximum et réjouissez-vous.
Mais après avoir construit une nouvelle hiérarchie de prévision, ayant calculé la saisonnalité à un niveau supérieur, nous la soustrayons au niveau des biens.
Obtenez l'image suivante
Demande désaisonnalisée (bleu) et prix (rouge) au fil du temps

Demande corrigée des variations saisonnières (axe Y) par rapport au prix (axe X)
Dépendance typique de la demande par rapport au prix (plus le prix est élevé, moins la demande). C'est-à-dire dans ce cas, l'influence de la saisonnalité est clairement visible, compte tenu du fait qu'il est immédiatement évident que le produit est assez élastique.
Conclusion
L'optimisation des prix est non seulement bénéfique pour l'entreprise (quelques pour cent de la marge n'a encore dérangé personne), mais elle est également intéressante. Il y a des régressions, une optimisation et une analyse graphique, et tout cela dans une enveloppe de grande date - il y a de la place pour que l'âme de l'analyste se retourne. Mais n'oubliez pas que la modélisation de la demande et l'optimisation des prix ne sont qu'une petite partie du processus de tarification des grandes entreprises et, à part le reste, sont de peu d'utilité.
Optimisez les processus, optimisez les prix, optimisez le stockage des données (après tout, Garbage In - Garbage Out) et obtenez des résultats sympas.