L'utilisation de l'apprentissage automatique n'est pas difficile. Assez pour ça pendant une semaine ...

image


Dans des articles précédents, j'ai essayé de parler des bases de la tarification et de la création d'un arbre de décision client pour la vente au détail classique. Dans cet article, je vais vous parler d'un cas très non standard et essayer de vous convaincre que l'utilisation du machine learning n'est pas aussi difficile qu'il y paraît. L'article est moins technique et est plus susceptible de montrer que vous pouvez commencer petit et que cela apportera déjà des avantages tangibles à l'entreprise.


Problème initial


Il y a une chaîne de magasins sur notre continent qui change son assortiment une fois par semaine, par exemple, vend d'abord des overlock puis des vêtements de sport pour hommes. Toutes les marchandises invendues sont envoyées dans des entrepôts et retournées six mois plus tard dans les magasins. Dans le même temps, le magasin compte environ 6 catégories différentes de produits. C'est-à-dire L'assortiment de magasins chaque semaine est le suivant:


image


Le réseau a demandé un système de planification des gammes avec une condition préalable à l'aide à la décision analytique pour les gestionnaires de catégorie. Après avoir discuté avec l'entreprise, nous avons proposé deux solutions potentielles très rapides qui peuvent apporter des résultats pendant le déploiement du système de planification:


  • ventes de biens non vendus lors des ventes principales
  • améliorer la précision des prévisions de la demande dans les magasins

Le premier point du client n'était pas satisfait - l'entreprise est fière de ne pas organiser ses ventes et de maintenir un niveau de marge constant. Dans le même temps, d'énormes sommes d'argent sont dépensées pour la logistique et le stockage des marchandises. En conséquence, il a été décidé d'améliorer la précision des prévisions de la demande pour une distribution plus précise des magasins et des entrepôts.


Processus en cours


En raison de la nature de l'entreprise, chaque produit individuel n'est pas vendu depuis longtemps et il est problématique d'obtenir suffisamment d'historique pour une analyse classique. Le processus de prévision actuel est très simple et est structuré comme suit - quelques semaines avant le début des ventes principales dans une petite partie des magasins, les ventes de test commencent. Sur la base des résultats des ventes test, une décision est prise d'introduire des marchandises dans l'ensemble du réseau et il est supposé que chaque magasin vendra en moyenne autant que ce qui a été vendu dans les magasins test.


En arrivant au client, nous avons analysé les données actuelles, réalisé ce qui se passait et proposé une solution très simple pour améliorer la précision des prévisions.


Analyser les données


À partir des données qui nous ont été fournies:


  • Historique des transactions pendant 1 an et 2 mois
  • Hiérarchie des produits pour la planification. Malheureusement, il manquait presque complètement les attributs des marchandises, mais plus à ce sujet plus tard
  • Informations sur la gamme et les prix pour des semaines spécifiques
  • Informations sur les villes où se trouvent les magasins

Nous n'avons pas pu décharger les informations sur les soldes en peu de temps, ce qui est essentiel dans ce type d'analyse (si vous ne stockez pas ces informations, commencez), par conséquent, à l'avenir, nous avons utilisé l'hypothèse selon laquelle les marchandises sont sur les étagères et il n'y a pas de pénurie de marchandises.


Immédiatement, nous avons séparé 2 mois en un échantillon de test pour démontrer les résultats. Ensuite, nous avons combiné toutes les données disponibles dans une grande vitrine, en les éliminant des retours et des ventes étranges (par exemple, le montant du chèque est de 0,51 par pièce). Cela a pris plusieurs jours. Après avoir préparé la vitrine, nous avons examiné la vente de marchandises [unités] au plus haut niveau et avons vu l'image suivante:


image


Comment cette image peut-elle nous aider? .. Mais avec quoi:


  • Évidemment, il y a une saisonnalité - les ventes à la fin de l'année sont plus élevées qu'au milieu
  • Il y a une saisonnalité au cours du mois - au milieu du mois, les ventes sont plus élevées qu'au début et à la fin
  • Il y a une saisonnalité dans la semaine - ce n'est pas si intéressant, car en conséquence, la prévision a été faite par semaines

Les éléments décrits ont confirmé l'entreprise. Mais ce sont aussi d'excellentes fonctionnalités pour améliorer les prévisions! Avant de les ajouter au modèle de prévision, réfléchissons aux autres caractéristiques des ventes à prendre en compte ... Des idées «évidentes» me viennent à l'esprit:


  • Les ventes varient en moyenne entre les différents groupes de produits
  • Les ventes varient entre les différents magasins
  • (Similaire au paragraphe précédent) Les ventes varient entre les différentes villes
  • (Idée moins évidente) en raison des spécificités de l'entreprise, la relation suivante est visible: si l'assortiment futur et l'assortiment précédent sont similaires, les ventes du nouvel assortiment seront plus faibles.

Sur ce, nous avons décidé d'arrêter et de construire un modèle.


Building ABT ( table de base analytique )


Dans le cadre de la construction du modèle, toutes les fonctionnalités trouvées ont été traduites en «fonctionnalités» du modèle. Voici la liste des fonctionnalités utilisées en conséquence:


  • prévisions actuelles, c.-à-d. ventes moyennes des magasins d'essai en [unités] réparties dans tous les magasins
  • numéro de mois et numéro de semaine dans le mois
  • toutes les variables catégorielles (ville, magasin, catégories de produits) ont été codées en utilisant la probabilité lissée (technique utile - celui qui ne l'utilise pas encore, l'utilise)
  • décalage calculé 4 ventes moyennes des catégories de produits. C'est-à-dire si l'entreprise prévoit de vendre un T-shirt bleu, un décalage des ventes moyennes de la catégorie T-shirt a été calculé

ABT s'est avéré être simple, chaque paramètre était compréhensible pour les entreprises et n'a pas causé de malentendu ou de rejet. Ensuite, il a fallu comprendre comment nous comparerons la qualité des prévisions.


Sélection métrique


Le client a mesuré l'exactitude actuelle des prévisions à l'aide de la métrique MAPE . La métrique est populaire et simple, mais elle présente certains inconvénients lorsqu'il s'agit de prévoir la demande. Le fait est que lorsque vous utilisez MAPE, les erreurs de type de prévision ont le plus grand impact sur l'indicateur final:


image


Une erreur de prévision relative de 900% - cela semble important, mais regardons les ventes d'un autre produit:


image


L'erreur relative de prévision est de 33%, ce qui est bien inférieur à 900%, mais l'écart absolu de l'écart de 100 [unités] est beaucoup plus important pour l'entreprise que l'écart de 18 [unités]. Pour prendre en compte ces fonctionnalités, vous pouvez proposer vos propres mesures intéressantes, ou vous pouvez utiliser une autre mesure populaire dans la prévision de la demande - WAPE . Cette mesure donne plus de poids aux marchandises avec des ventes plus élevées, ce qui est idéal pour la tâche.


Nous avons informé la société de diverses approches pour mesurer les erreurs de prévision, et le client a volontiers convenu que l'utilisation de WAPE dans cette tâche est plus raisonnable. Après cela, nous avons lancé Random Forest presque sans régler les paramètres hyper et avons obtenu les résultats suivants.


Résultats


Après avoir prévu la période de test, nous avons comparé les valeurs prévues avec les valeurs réelles, ainsi qu'avec les prévisions de l'entreprise. En conséquence, MAPE a diminué de plus de 15%, WAPE de plus de 10% . Après avoir calculé l'impact de l'amélioration des prévisions sur les indicateurs d'activité, une réduction des coûts d'un montant assez important de millions de dollars a été obtenue.
1 semaine a été consacrée à tout le travail!


Etapes supplémentaires


En prime pour le client, nous avons mené une petite expérience DQ . Pour un groupe de produits, à partir des noms de produits, nous avons analysé les caractéristiques (couleur, type de produit, composition, etc.) et les avons ajoutés à la prévision. Le résultat a été inspirant - dans cette catégorie, les deux mesures d'erreur se sont améliorées de plus de 8%.


En conséquence, le client a reçu une description de chaque caractéristique, les paramètres du modèle, les paramètres d'assemblage de la vitrine ABT et décrit les étapes supplémentaires pour améliorer la prévision (utiliser les données historiques pendant plus d'un an; utiliser les soldes; utiliser les caractéristiques des marchandises, etc.).


Conclusion


Pendant une semaine de collaboration avec le client, il a été possible d'augmenter significativement la précision des prévisions, sans pratiquement changer le processus métier.
Certes, beaucoup de gens pensent maintenant que ce cas est très simple et ils ne peuvent pas s'en sortir avec cette approche dans l'entreprise. L'expérience montre qu'il existe presque toujours des endroits où seules des hypothèses de base et des avis d'experts sont utilisés. À partir de ces endroits, vous pouvez commencer à utiliser l'apprentissage automatique. Pour ce faire, vous devez soigneusement préparer et étudier les données, parler avec l'entreprise et essayer d'appliquer des modèles populaires qui ne nécessitent pas de réglage long. Et l'empilement, les fonctionnalités d'intégration, les modèles complexes - c'est tout pour plus tard. J'espère que je vous ai convaincu que ce n'est pas aussi difficile que cela puisse paraître, il vous suffit de réfléchir un peu et de ne pas avoir peur de commencer.


N'ayez pas peur de l'apprentissage automatique, recherchez des endroits où il peut être utilisé dans les processus, n'ayez pas peur de rechercher vos données et de laisser les consultants les consulter et obtenir des résultats sympas.


PS Nous recrutons de jeunes étudiants étudiants Padawan pour des stages de vente au détail sous la direction de Jedi expérimentés. Pour commencer, le bon sens et la connaissance du SQL suffisent, nous allons enseigner le reste. Vous pouvez devenir un expert en affaires ou un consultant technique, selon ce qui est le plus intéressant. S'il y a un intérêt ou des recommandations - écrivez dans un

Source: https://habr.com/ru/post/fr433896/


All Articles