Géoanalytique dans le commerce de détail, partie 1: nous automatisons le processus de choix d'un lieu pour une entreprise. 2GIS + MS Azure + ML



Bonjour à tous!

Je m'appelle Sergey Konkov - je suis architecte de données chez Business reports & Data.
Cet article parle des possibilités d'utilisation de la géo-analyse et de l'apprentissage automatique dans une entreprise de vente au détail et est basé sur un véritable projet de notre client - un grand réseau de salons de beauté. Il n'y aura pas beaucoup de code et de détails techniques, une attention sera portée à la revue des technologies, à leur application et à leur intégration.

Défi


Il existe une entreprise en plein développement dans le secteur des services. L'entreprise ouvre plusieurs salons de beauté mensuels principalement dans des centres commerciaux (TC).

La tâche consiste à choisir les meilleurs endroits pour les découvertes, en réduisant le temps et les coûts de prise de décision.

Exemple de plan de mise en œuvre


  1. Nous recevrons des données sur les centres commerciaux qui peuvent nous aider à évaluer l'attractivité des lieux;
  2. Essayons de trouver un lien entre les données obtenues et les résultats du travail des salons dans les centres commerciaux où l'entreprise est déjà implantée;
  3. Nous allons créer une méthodologie pour évaluer l'attractivité d'un nouveau centre commercial;
  4. Nous allons créer un modèle d'apprentissage automatique pour calculer cette estimation pour les centres commerciaux où notre entreprise n'existe pas encore;
  5. Nous allons créer des outils pour automatiser le travail des spécialistes dans la sélection des lieux d'ouverture des points de vente;

Nous collectons des données géographiques


Alors, quelles données sur les centres commerciaux peuvent aider.

Réfléchir:

  • Par exemple, dans quelle zone et ville est-elle située - Moscou ou Samara, Barvikha ou Vykhino;
  • La taille du centre commercial - combien y a-t-il de magasins, restaurants, salons?
  • Et quels sont ces magasins - matériaux de construction ou boutiques de mode?
  • Y a-t-il des concurrents là-bas? Et combien y en a-t-il? Et lequel?
  • Peut-être y a-t-il des informations sur le nombre de visiteurs dans le centre commercial?
  • Y a-t-il d'autres centres commerciaux à proximité? Dans un rayon de 5 km, pas un ou deux n'est mieux que cela de l'autre côté de la route;
  • Et quoi d'autre y a-t-il à proximité? Peut-être un grand centre d'affaires avec de nombreux employés de bureau ou une zone de couchage?

C'est ce que pense une personne «expérimentée» qui doit décider d'un lieu d'affaires. Une personne avancée a également à sa disposition des analyses qui, dans Excel ou SQL, peuvent faire une justification compétente basée sur tous ces facteurs.

La collecte et le traitement de ces données prennent du temps. Essayons d'optimiser cela.

Où obtenir les données? Examinons les services géographiques qui sont sur le marché. Les principaux sont: Yandex Maps, 2GIS, Google Maps. Après avoir comparé les fonctionnalités, nous nous sommes installés sur 2GIS.
Les principaux avantages du service à notre avis: exactitude, pertinence et exhaustivité des données, API conviviale. Mais vous pouvez utiliser les solutions d'autres fabricants.

L'accès à l'API 2GIS peut être obtenu via le formulaire sur le site Web du service. L'accès est payant et dépend du nombre de demandes, séparément il sera nécessaire de stipuler dans le contrat avec 2GIS comment utiliser les données, c'est pourquoi nous les demandons, ce que nous en ferons, etc.

Je vais vous expliquer un peu comment travailler avec l'API 2GIS.

Le service vous permet de choisir l'emplacement des organisations sur un certain territoire (ville, quartier, rue, etc.). En tant que filtre, vous pouvez spécifier la rubrique de l'organisation (type d'activité). Nous vous demanderons de rechercher toutes les organisations sous la rubrique Centres commerciaux. En conséquence, nous obtenons une liste des centres commerciaux sur le territoire. Dans la réponse pour chaque centre commercial, les soi-disant identifiants de maison - building_id viendront également. Nous ferons une demande à toutes les organisations situées dans le bâtiment avec l'un des building_id reçus. Nous obtenons une liste de toutes les organisations de ce centre commercial, y compris leurs noms et en-têtes.



Ainsi, nous avons reçu une liste de tous les magasins, salons, restaurants et autres organisations dans un centre commercial particulier. Nous pouvons faire une telle demande pour chaque centre commercial qui nous intéresse.

Infrastructure du projet


Pour l'implémentation, nous avons choisi le cloud de MS Azure . Il y a tout ce dont nous avons besoin, à savoir:


Toutes les données obtenues à partir de 2GIS seront chargées dans les tables de base de données Azure SQL.
Nous mettons tous les scripts à télécharger dans les packages Azure Data Factory. Cela nous permettra de télécharger des données en masse (par exemple, pour tous les centres commerciaux d'une ville particulière) selon un calendrier pour maintenir la pertinence des données, ainsi que sur demande pour un centre commercial spécifique.

Exemples de tâches d'intégration:



Travailler avec des données


Nous pouvons commencer à rechercher la relation entre les données de 2GIS et les résultats réels des salons. Pour ce faire, téléchargez les données des centres commerciaux dans le magasin où l'entreprise est déjà présente. Nous y téléchargerons des données sur le travail des salons à partir de l'ERP - revenus, nombre de contrôles, marge, nombre de visiteurs.

À ce stade, nous connectons des spécialistes au projet Data Science. Pour eux, nous déployons un cube OLAP basé sur les données collectées et l'environnement Azure Machine Learning.

Des études menées par des scientifiques des données ont montré que les facteurs suivants affectent le plus fortement les résultats du travail des salons (revenus et marginalité):

  • La ville où se trouve le centre commercial;
  • Le nombre de magasins dans le centre commercial;
  • Le nombre de concurrents dans le centre commercial;
  • La présence de certaines marques;
  • Le nombre d'autres centres commerciaux dans un rayon de 2 km;

Pour évaluer l'attractivité des centres commerciaux, nous introduisons une échelle de 1 à 10. Pour la transparence de l'évaluation de l'attractivité, nous devons montrer à l'utilisateur exactement quels facteurs et comment ils ont influencé la note finale. Voici un exemple d'évaluation d'un des centres commerciaux:



Connecter l'apprentissage automatique


Nous calculons cette estimation pour tous les centres commerciaux où l'entreprise est déjà implantée. L'ensemble de données résultant (facteurs + évaluation) sera utilisé pour créer un modèle d'apprentissage automatique. A terme, le modèle devrait déterminer l'appréciation de l'attractivité du centre commercial pour l'ouverture d'un nouveau salon.

Un exemple de création d'une expérience dans Azure ML Studio:



La figure montre un exemple simple de création d'une expérience d'apprentissage automatique basée sur un modèle de régression linéaire.

Après avoir déployé le modèle créé sous la forme d'un service Web, nous pourrons recevoir des notes d'attractivité pour les centres commerciaux où il n'y a pas de salons de notre entreprise.

Donc, nous avons des données, nous savons comment travailler avec eux et nous avons un moyen de classer les centres commerciaux. Nous allons maintenant transférer tout cela aux utilisateurs en fonctionnement.

Nous automatisons le travail du personnel du service de sélection des locaux


Pour commencer, créez des rapports analytiques.

Par exemple, nous devons évaluer la possibilité d'ouvrir plusieurs points de vente au détail dans N.
Nous sommes intéressés par les données suivantes:

  • Tous les centres commerciaux de la ville (nombre de magasins dans chacun, nombre de concurrents, nos magasins);
  • Tous les centres commerciaux de la ville où il y a des concurrents, mais pas nous;
  • Tous les concurrents de la ville (dans quels centres commerciaux sont représentés, combien de points de vente au détail au total);

Voici un exemple de l'un des rapports effectués dans MS Power BI. Les sources de données sont notre entrepôt de données sur MS Azure.



Ensuite, nous allons créer un outil pour afficher les données collectées sur les centres commerciaux sur une carte. L'API 2GIS familière nous y aidera. Dans l'application Web, créez un widget de carte et appliquez des marqueurs avec des marques de centres commerciaux dessus. Exemple (données réelles modifiées):



Pour résumer


Nous avons donc fait ce qui suit:

  • Nous avons construit le processus d'obtention de données sur les centres commerciaux à partir du service 2GIS.
  • Nous avons trouvé un lien entre les données obtenues et les résultats des salons dans les centres commerciaux où l'entreprise opère déjà.
  • Ils ont créé une méthodologie pour évaluer l'attractivité des centres commerciaux.
  • Nous avons développé des rapports et des outils pour automatiser le travail des spécialistes dans la sélection des lieux d'ouverture des points de vente.

Regardons l'architecture de la solution que nous avons.



Dans la prochaine partie de l'article, j'ai l'intention de dire comment réaliser un bot-géoanalytique pour aider les employés responsables de la sélection des locaux.

Merci de votre attention!

Si quelqu'un s'intéresse aux détails techniques de la mise en œuvre des composants individuels de la solution, alors je serai heureux de répondre aux questions dans les commentaires ou dans un message personnel.

Source: https://habr.com/ru/post/fr483722/


All Articles