Geoanalítica en el comercio minorista, parte 1: automatizamos el proceso de elegir un lugar para un negocio. 2GIS + MS Azure + ML



Hola a todos!

Mi nombre es Sergey Konkov. Soy arquitecto de datos en Business Reports & Data.
Este artículo habla sobre las posibilidades de utilizar el geoanálisis y el aprendizaje automático en una empresa minorista y se basa en un proyecto real de nuestro cliente: una gran red de salones de belleza. No habrá mucho código y detalles técnicos, se prestará atención a la revisión de las tecnologías, su aplicación e integración.

Desafío


Hay una empresa en desarrollo activo en el sector de servicios. La compañía abre varios salones de belleza mensuales principalmente en centros comerciales (TC).

La tarea es elegir los mejores lugares para los descubrimientos, reduciendo el tiempo y el costo de tomar decisiones.

Ejemplo de plan de implementación


  1. Recibiremos datos sobre centros comerciales que pueden ayudarnos a evaluar el atractivo de los lugares;
  2. Intentemos encontrar una conexión entre los datos obtenidos y los resultados del trabajo de los salones en los centros comerciales donde la compañía ya opera;
  3. Crearemos una metodología para evaluar el atractivo de un nuevo centro comercial;
  4. Crearemos un modelo de aprendizaje automático para calcular esta estimación para aquellos centros comerciales donde nuestra empresa aún no existe;
  5. Crearemos herramientas para automatizar el trabajo de especialistas en la selección de lugares para abrir puntos de venta;

Recopilamos datos geográficos


Entonces, qué datos sobre centros comerciales pueden ayudar.

Reflexionar:

  • Por ejemplo, en qué área y ciudad se encuentra: Moscú o Samara, Barvikha o Vykhino;
  • El tamaño del centro comercial: ¿cuántas tiendas, restaurantes y salones hay?
  • ¿Y qué son estas tiendas: materiales de construcción o boutiques de moda?
  • ¿Hay competidores allí? ¿Y cuantos hay? ¿Y cuál de ellos?
  • ¿Quizás hay información sobre la cantidad de visitantes en el centro comercial?
  • ¿Hay otros centros comerciales cerca? Dentro de un radio de 5 km, ni uno ni dos son mejores que esto a través del camino;
  • ¿Y qué más hay cerca? ¿Quizás un gran centro de negocios con muchos empleados de oficina o un área para dormir?

Eso es lo que piensa una persona "experimentada" sobre quién necesita decidir un lugar para hacer negocios. Una persona avanzada tiene a su disposición también análisis, que en Excel o SQL pueden hacer una justificación competente basada en todos estos factores.

Lleva tiempo recopilar y procesar estos datos. Intentemos optimizar esto.

¿Dónde obtener los datos? Veamos los servicios geográficos que hay en el mercado. Los principales son: Yandex Maps, 2GIS, Google Maps. Después de comparar las características, nos decidimos por 2GIS.
Las principales ventajas del servicio en nuestra opinión: precisión, relevancia e integridad de los datos, API fácil de usar. Pero puede usar las soluciones de otros fabricantes.

El acceso a la API de 2GIS se puede obtener a través del formulario en el sitio web del servicio. El acceso se paga y depende de la cantidad de solicitudes, por separado será necesario estipular en el contrato con 2GIS cómo usar los datos, es por eso que los solicitamos, qué haremos con ellos, etc.

Te contaré un poco cómo trabajar con la API 2GIS.

El servicio le permite elegir la ubicación de las organizaciones en un determinado territorio (ciudad, distrito, calle, etc.). Como filtro, puede especificar la rúbrica de la organización (tipo de actividad). Haremos una solicitud para buscar todas las organizaciones bajo el título Centros comerciales. Como resultado, obtenemos una lista de centros comerciales en el territorio. En la respuesta para cada centro comercial, también aparecerán los llamados identificadores de la casa: building_id. Haremos una solicitud a todas las organizaciones ubicadas en el edificio con uno de los building_id recibidos. Obtenemos una lista de todas las organizaciones en este centro comercial, incluidos sus nombres y encabezados.



Por lo tanto, recibimos una lista de todas las tiendas, salones, restaurantes y otras organizaciones en un centro comercial en particular. Podemos realizar dicha solicitud para cada centro comercial que nos interese.

Infraestructura del proyecto


Para la implementación, elegimos la nube de MS Azure . Hay todo lo que necesitamos, a saber:


Todos los datos obtenidos de 2GIS se cargarán en las tablas de la base de datos SQL de Azure.
Ponemos todos los scripts para descargar en los paquetes de Azure Data Factory. Esto nos permitirá descargar datos a granel (por ejemplo, para todos los centros comerciales de una ciudad en particular) en un horario para mantener la relevancia de los datos, así como a pedido de un centro comercial específico.

Ejemplo de tareas de integración:



Trabajando con datos


Podemos comenzar a buscar la relación entre los datos de 2GIS y los resultados reales de los salones. Para hacer esto, suba los datos de los centros comerciales a la tienda donde la compañía ya está presente. Allí cargaremos datos sobre el trabajo de los salones de ERP: ingresos, número de cheques, margen, número de visitantes.

En esta etapa, conectamos especialistas con el proyecto Data Science. Para ellos, implementamos un cubo OLAP basado en los datos recopilados y el entorno Azure Machine Learning.

Los estudios realizados por científicos de datos mostraron que los siguientes factores afectan más fuertemente los resultados del trabajo de los salones (ingresos y marginalidad):

  • La ciudad donde se encuentra el centro comercial;
  • El número de tiendas en el centro comercial;
  • El número de competidores en el centro comercial;
  • La presencia de ciertas marcas;
  • El número de otros centros comerciales en un radio de 2 km;

Para evaluar el atractivo de los centros comerciales, presentamos una escala del 1 al 10. Para la transparencia de la evaluación del atractivo, debemos mostrar al usuario exactamente qué factores y cómo influyeron en la calificación final. Aquí hay un ejemplo de una evaluación de uno de los centros comerciales:



Conexión de aprendizaje automático


Calculamos esta estimación para todos los centros comerciales donde la compañía ya opera. El conjunto de datos resultante (factores + evaluación) se utilizará para crear un modelo de aprendizaje automático. En última instancia, el modelo debe determinar la evaluación del atractivo del centro comercial para la apertura de un nuevo salón.

Un ejemplo de creación de un experimento en Azure ML Studio:



La figura muestra un ejemplo simple de crear un experimento de aprendizaje automático basado en un modelo de regresión lineal.

Después de implementar el modelo creado en forma de un servicio web, podremos recibir calificaciones de atractivo para los centros comerciales donde no hay salones de nuestra empresa.

Entonces, tenemos datos, entendemos cómo trabajar con ellos y tenemos una forma de clasificar los centros comerciales. Ahora transferiremos todo esto a los usuarios en funcionamiento.

Automatizamos el trabajo del personal del departamento de selección de locales.


Para comenzar, cree informes analíticos.

Por ejemplo, debemos evaluar la posibilidad de abrir varios puntos de venta en N.
Estamos interesados ​​en los siguientes datos:

  • Todos los centros comerciales de la ciudad (número de tiendas en cada uno, número de competidores, nuestras tiendas);
  • Todos los centros comerciales de la ciudad donde hay competidores, pero no nosotros;
  • Todos los competidores en la ciudad (en los cuales están representados los centros comerciales, cuántos puntos de venta total);

Aquí hay un ejemplo de uno de los informes realizados en MS Power BI. Las fuentes de datos son nuestro almacén de datos en MS Azure.



A continuación, crearemos una herramienta para mostrar los datos recopilados en los centros comerciales en un mapa. La conocida API 2GIS nos ayudará con esto. En la aplicación web, cree un widget de mapa y aplique marcadores con marcas de centros comerciales. Ejemplo (datos reales modificados):



Para resumir


Entonces hicimos lo siguiente:

  • Desarrollamos el proceso de obtención de datos sobre centros comerciales del servicio 2GIS.
  • Encontramos una conexión entre los datos obtenidos y los resultados de los salones en aquellos centros comerciales donde la compañía ya opera.
  • Crearon una metodología para evaluar el atractivo de los centros comerciales.
  • Desarrollamos informes y herramientas para automatizar el trabajo de especialistas en la selección de lugares para abrir puntos de venta.

Veamos la arquitectura de la solución que tenemos.



En la siguiente parte del artículo, planeo decir cómo hacer un bot-geoanalítico para ayudar a los empleados responsables de la selección de las instalaciones.

Gracias por su atencion!

Si alguien está interesado en los detalles técnicos de la implementación de los componentes individuales de la solución, me complacerá responder preguntas en los comentarios o en un mensaje personal.

Source: https://habr.com/ru/post/483722/


All Articles