Geoanalytik für den Einzelhandel, Teil 1: Wir automatisieren den Prozess der Standortwahl für ein Unternehmen. 2GIS + MS Azure + ML



Hallo allerseits!

Mein Name ist Sergey Konkov - ich bin ein Datenarchitekt bei Business Reports & Data.
Dieser Artikel spricht über die Möglichkeiten des Einsatzes von Geoanalytik und maschinellem Lernen in einem Einzelhandelsunternehmen und basiert auf einem realen Projekt unseres Kunden - einem großen Netzwerk von Schönheitssalons. Es wird nicht viel Code und technische Details geben, der Überprüfung der Technologien, ihrer Anwendung und Integration wird besondere Aufmerksamkeit geschenkt.

Herausforderung


Es gibt ein sich aktiv entwickelndes Unternehmen im Dienstleistungssektor. Das Unternehmen eröffnet mehrere monatliche Schönheitssalons, hauptsächlich in Einkaufszentren (TC).

Die Aufgabe besteht darin, die besten Orte für Entdeckungen auszuwählen, um den Zeit- und Kostenaufwand für Entscheidungen zu verringern.

Beispiel eines Implementierungsplans


  1. Wir erhalten Daten zu Einkaufszentren, anhand derer wir die Attraktivität von Orten beurteilen können.
  2. Versuchen wir, einen Zusammenhang zwischen den erhaltenen Daten und den Ergebnissen der Salonarbeit in den Einkaufszentren herzustellen, in denen das Unternehmen bereits tätig ist.
  3. Wir werden eine Methode zur Bewertung eines neuen Einkaufszentrums auf Attraktivität entwickeln.
  4. Wir werden ein Modell für maschinelles Lernen erstellen, um diese Schätzung für die Einkaufszentren zu berechnen, in denen unser Unternehmen noch nicht existiert.
  5. Wir werden Tools zur Automatisierung der Arbeit von Spezialisten bei der Auswahl von Orten für die Eröffnung von Einzelhandelsgeschäften entwickeln.

Wir sammeln Geodaten


Welche Daten zu Einkaufszentren können also helfen?

Reflektieren:

  • Zum Beispiel, in welchem ​​Gebiet und in welcher Stadt befindet es sich - Moskau oder Samara, Barvikha oder Vykhino;
  • Die Größe des Einkaufszentrums - wie viele Geschäfte, Restaurants, Salons gibt es?
  • Und was sind diese Läden - Baumaterialien oder Modeboutiquen?
  • Gibt es dort Konkurrenten? Und wie viele gibt es? Und welcher von ihnen?
  • Vielleicht gibt es Informationen über die Anzahl der Besucher im Einkaufszentrum?
  • Gibt es noch andere Einkaufszentren in der Nähe? Innerhalb eines Radius von 5 km ist nicht einer oder zwei besser als dieser auf der anderen Straßenseite;
  • Und was gibt es sonst noch in der Nähe? Vielleicht ein großes Business Center mit vielen Büromitarbeitern oder ein Schlafbereich?

Das ist es, was eine „erfahrene“ Person darüber denkt, wer sich für einen Unternehmensstandort entscheiden muss. Eine fortgeschrittene Person verfügt auch über Analytik, die in Excel oder SQL eine kompetente Rechtfertigung auf der Grundlage all dieser Faktoren vornehmen kann.

Es braucht Zeit, um diese Daten zu sammeln und zu verarbeiten. Versuchen wir dies zu optimieren.

Woher bekommen Sie die Daten? Schauen wir uns die Geodienste an, die auf dem Markt sind. Die wichtigsten sind: Yandex Maps, 2GIS, Google Maps. Nach dem Vergleich der Funktionen haben wir uns für 2GIS entschieden.
Die Hauptvorteile des Dienstes sind unserer Meinung nach: Richtigkeit, Aktualität und Vollständigkeit der Daten, benutzerfreundliche API. Sie können aber auch die Lösungen anderer Hersteller verwenden.

Der Zugriff auf die 2GIS-API kann über das Formular auf der Service-Website erfolgen. Der Zugang ist kostenpflichtig und hängt von der Anzahl der Anfragen ab, gesondert muss im Vertrag mit 2GIS festgelegt werden, wie die Daten verwendet werden, weshalb wir sie anfordern, was wir mit ihnen machen und so weiter.

Ich werde Ihnen ein wenig erklären, wie Sie mit der 2GIS-API arbeiten.

Mit diesem Dienst können Sie den Standort von Organisationen in einem bestimmten Gebiet (Stadt, Bezirk, Straße usw.) auswählen. Als Filter können Sie die Rubrik der Organisation (Art der Aktivität) angeben. Wir werden Sie bitten, nach allen Organisationen in der Rubrik Einkaufszentren zu suchen. Als Ergebnis erhalten wir eine Liste der Einkaufszentren in dem Gebiet. In der Antwort für jedes Einkaufszentrum werden auch die sogenannten Hauskennungen - building_id - eingefügt. Wir senden eine Anfrage an alle Organisationen im Gebäude mit einer der erhaltenen building_id. Wir erhalten eine Liste aller Organisationen in diesem Einkaufszentrum mit ihren Namen und Überschriften.



So erhielten wir eine Liste aller Geschäfte, Salons, Restaurants und anderer Organisationen in einem bestimmten Einkaufszentrum. Wir können eine solche Anfrage für jedes Einkaufszentrum stellen, das uns interessiert.

Projektinfrastruktur


Für die Implementierung haben wir die Cloud von MS Azure gewählt . Es gibt alles, was wir brauchen, nämlich:


Alle von 2GIS erhaltenen Daten werden in Azure SQL-Datenbanktabellen geladen.
Wir haben alle Skripte zum Herunterladen in die Azure Data Factory-Pakete gestellt. Auf diese Weise können wir Daten in großen Mengen (z. B. für alle Einkaufszentren einer bestimmten Stadt) herunterladen, um die Relevanz der Daten zu erhalten, sowie auf Anfrage für ein bestimmtes Einkaufszentrum.

Beispiel für Integrationsaufgaben:



Mit Daten arbeiten


Wir können nach der Beziehung zwischen den Daten von 2GIS und den tatsächlichen Ergebnissen der Salons suchen. Laden Sie dazu Daten zu Einkaufszentren in das Geschäft hoch, in dem das Unternehmen bereits präsent ist. Dort werden wir Daten über die Arbeit von Salons aus dem ERP hochladen - Umsatz, Anzahl der Schecks, Gewinnspanne, Anzahl der Besucher.

In dieser Phase verbinden wir Spezialisten mit dem Data Science-Projekt. Für sie stellen wir einen OLAP-Cube bereit, der auf den gesammelten Daten und der Azure Machine Learning-Umgebung basiert.

Studien von Datenwissenschaftlern haben gezeigt, dass die folgenden Faktoren die Ergebnisse der Salonarbeit am stärksten beeinflussen (Umsatz und Marginalität):

  • Die Stadt, in der sich das Einkaufszentrum befindet;
  • Die Anzahl der Geschäfte im Einkaufszentrum.
  • Die Anzahl der Wettbewerber im Einkaufszentrum;
  • Das Vorhandensein bestimmter Marken;
  • Die Anzahl der anderen Einkaufszentren im Umkreis von 2 km;

Um die Attraktivität von Einkaufszentren zu bewerten, führen wir eine Skala von 1 bis 10 ein. Um die Attraktivität transparent zu machen, müssen wir dem Benutzer genau zeigen, welche Faktoren und wie sie die endgültige Bewertung beeinflusst haben. Hier ist ein Beispiel für eine Bewertung eines der Einkaufszentren:



Maschinelles Lernen verbinden


Wir berechnen diese Schätzung für alle Einkaufszentren, in denen das Unternehmen bereits tätig ist. Der resultierende Datensatz (Faktoren + Bewertung) wird verwendet, um ein Modell für maschinelles Lernen zu erstellen. Letztendlich sollte das Modell die Beurteilung der Attraktivität des Einkaufszentrums für die Eröffnung eines neuen Salons bestimmen.

Ein Beispiel zum Erstellen eines Experiments in Azure ML Studio:



Die Abbildung zeigt ein einfaches Beispiel für die Erstellung eines Experimentes zum maschinellen Lernen auf der Grundlage eines linearen Regressionsmodells.

Nachdem wir das erstellte Modell in Form eines Webservices bereitgestellt haben, können wir Attraktivitätsbewertungen für Einkaufszentren erhalten, in denen es keine Salons unseres Unternehmens gibt.

Wir haben also Daten, wir verstehen, wie man mit ihnen arbeitet, und wir haben eine Möglichkeit, Einkaufszentren zu klassifizieren. Jetzt werden wir all dies auf die Benutzer übertragen, die gerade in Betrieb sind.

Wir automatisieren die Arbeit der Mitarbeiter der Raumauswahl


Erstellen Sie zunächst Analyseberichte.

Zum Beispiel müssen wir die Möglichkeit prüfen, mehrere Einzelhandelsgeschäfte in N zu eröffnen.
Wir interessieren uns für folgende Daten:

  • Alle Einkaufszentren in der Stadt (Anzahl der Geschäfte in jedem, Anzahl der Wettbewerber, unsere Geschäfte);
  • Alle Einkaufszentren in der Stadt, in denen es Konkurrenten gibt, aber nicht wir;
  • Alle Konkurrenten in der Stadt (in welchen Einkaufszentren sind sie vertreten, wie viele Einzelhandelsgeschäfte insgesamt);

Hier ist ein Beispiel für einen der in MS Power BI erstellten Berichte. Datenquellen sind unser Data Warehouse auf MS Azure.



Als Nächstes erstellen wir ein Tool, mit dem die gesammelten Daten zu Einkaufszentren auf einer Karte angezeigt werden. Die bekannte API 2GIS hilft uns dabei. Erstellen Sie in der Webanwendung ein Karten-Widget und bringen Sie Markierungen mit Markierungen von Einkaufszentren an. Beispiel (Echtdaten geändert):



Um es zusammenzufassen


Also haben wir folgendes gemacht:

  • Wir haben den Prozess zum Abrufen von Daten zu Einkaufszentren vom 2GIS-Service aufgebaut.
  • Wir haben eine Verbindung zwischen den erhaltenen Daten und den Ergebnissen der Salons in den Einkaufszentren gefunden, in denen das Unternehmen bereits tätig ist.
  • Sie entwickelten eine Methode zur Bewertung der Attraktivität von Einkaufszentren.
  • Wir haben Berichte und Tools zur Automatisierung der Arbeit von Spezialisten bei der Auswahl von Orten für die Eröffnung von Einzelhandelsgeschäften entwickelt.

Schauen wir uns die Architektur der Lösung an, die wir haben.



Im nächsten Teil des Artikels möchte ich erläutern, wie eine Bot-Geoanalyse durchgeführt werden kann, um Mitarbeitern bei der Auswahl der Räumlichkeiten zu helfen.

Vielen Dank für Ihre Aufmerksamkeit!

Wenn sich jemand für die technischen Details der Implementierung der einzelnen Komponenten der Lösung interessiert, beantworte ich gerne Fragen in den Kommentaren oder in einer persönlichen Nachricht.

Source: https://habr.com/ru/post/de483722/


All Articles