Geoanalítica de varejo, parte 1: automatizamos o processo de escolha de um local para uma empresa. 2GIS + MS Azure + ML



Olá pessoal!

Meu nome é Sergey Konkov - sou arquiteto de dados em Relatórios e dados comerciais.
Este artigo fala sobre as possibilidades de usar geo-analytics e machine learning em uma empresa de varejo e é baseado em um projeto real de nosso cliente - uma grande rede de salões de beleza. Não haverá muito código e detalhes técnicos, será dada atenção à revisão de tecnologias, sua aplicação e integração.

Desafio


Existe uma empresa em desenvolvimento ativo no setor de serviços. A empresa abre vários salões de beleza mensais, principalmente em shopping centers (TC).

A tarefa é escolher os melhores locais para descobertas, reduzindo o tempo e o custo da tomada de decisões.

Exemplo de plano de implementação


  1. Receberemos dados sobre shopping centers que podem nos ajudar a avaliar a atratividade dos lugares;
  2. Vamos tentar encontrar uma conexão entre os dados obtidos e os resultados do trabalho dos salões nos shopping centers onde a empresa já opera;
  3. Criaremos uma metodologia para avaliar um novo shopping center quanto à atratividade;
  4. Criaremos um modelo de aprendizado de máquina para calcular essa estimativa para os shopping centers onde nossa empresa ainda não existe;
  5. Criaremos ferramentas para automatizar o trabalho de especialistas na seleção de locais para abertura de pontos de venda;

Coletamos dados geográficos


Portanto, quais dados nos shopping centers podem ajudar.

Reflita:

  • Por exemplo, em que área e cidade está localizada - Moscou ou Samara, Barvikha ou Vykhino;
  • O tamanho do shopping center - quantas lojas, restaurantes, salões de beleza existem?
  • E o que são essas lojas - materiais de construção ou butiques de moda?
  • Existem concorrentes lá? E quantos existem? E qual deles?
  • Talvez haja informações sobre o número de visitantes no shopping?
  • Existem outros centros comerciais nas proximidades? Num raio de 5 km, nenhum ou dois é melhor do que isso do outro lado da estrada;
  • E o que mais há por perto? Talvez um grande centro de negócios com muitos funcionários de escritório ou uma área de dormir?

É isso que uma pessoa "experiente" pensa sobre quem precisa decidir sobre um local de negócios. Uma pessoa avançada tem à sua disposição também análises, que no Excel ou SQL podem fazer uma justificativa competente com base em todos esses fatores.

Leva tempo para coletar e processar esses dados. Vamos tentar otimizar isso.

Onde obter os dados? Vejamos os serviços geográficos que estão no mercado. Os principais são: Yandex Maps, 2GIS, Google Maps. Depois de comparar os recursos, optamos pelo 2GIS.
As principais vantagens do serviço em nossa opinião: precisão, relevância e integridade dos dados, API fácil de usar. Mas você pode usar as soluções de outros fabricantes.

O acesso à API 2GIS pode ser obtido através do formulário no site de serviço. O acesso é pago e depende do número de solicitações; separadamente, será necessário estipular no contrato com a 2GIS como usar os dados, por isso solicitamos, o que faremos com eles e assim por diante.

Vou contar um pouco sobre como trabalhar com a API 2GIS.

O serviço permite que você escolha o local das organizações em um determinado território (cidade, distrito, rua etc.). Como filtro, você pode especificar a rubrica da organização (tipo de atividade). Solicitaremos a pesquisa de todas as organizações sob o título Shopping centers. Como resultado, obtemos uma lista de shopping centers no território. Na resposta para cada shopping center, os chamados identificadores de casas - building_id também aparecerão. Faremos um pedido a todas as organizações localizadas no prédio com um dos building_id recebido. Temos uma lista de todas as organizações neste shopping, incluindo seus nomes e títulos.



Assim, recebemos uma lista de todas as lojas, salões, restaurantes e outras organizações em um shopping center específico. Podemos fazer esse pedido para cada shopping center que nos interessa.

Infraestrutura do projeto


Para implementação, escolhemos a nuvem do MS Azure . Há tudo o que precisamos, a saber:


Todos os dados obtidos do 2GIS serão carregados nas tabelas de banco de dados SQL do Azure.
Colocamos todos os scripts para download nos pacotes do Azure Data Factory. Isso nos permitirá fazer o download de dados em massa (por exemplo, para todos os shopping centers de uma cidade específica) em um cronograma para manter a relevância dos dados, bem como mediante solicitação de um shopping center específico.

Tarefas de integração de exemplo:



Trabalhando com dados


Podemos começar a procurar a relação entre os dados do 2GIS e os resultados reais dos salões. Para fazer isso, faça o upload de dados nos shopping centers para a loja onde a empresa já está presente. Lá, enviaremos dados do trabalho dos salões do ERP: receita, número de cheques, margem, número de visitantes.

Nesta fase, conectamos especialistas ao projeto Data Science. Para eles, implantamos um cubo OLAP com base nos dados coletados e no ambiente do Azure Machine Learning.

Estudos realizados por cientistas de dados mostraram que os seguintes fatores afetam mais fortemente os resultados do trabalho dos salões (receita e marginalidade):

  • A cidade onde o shopping está localizado;
  • O número de lojas no shopping;
  • O número de concorrentes no shopping;
  • A presença de certas marcas;
  • O número de outros shopping centers em um raio de 2 km;

Para avaliar a atratividade dos shopping centers, introduzimos uma escala de 1 a 10. Para transparência da avaliação da atratividade, precisamos mostrar ao usuário exatamente quais fatores e como eles influenciaram a classificação final. Aqui está um exemplo de avaliação de um dos shopping centers:



Conectando aprendizado de máquina


Calculamos essa estimativa para todos os shopping centers em que a empresa já opera. O conjunto de dados resultante (fatores + avaliação) será usado para criar um modelo de aprendizado de máquina. Por fim, o modelo deve determinar a avaliação da atratividade do shopping para a abertura de um novo salão.

Um exemplo de criação de uma experiência no Azure ML Studio:



A figura mostra um exemplo simples de criação de um experimento de aprendizado de máquina com base em um modelo de regressão linear.

Depois de implantarmos o modelo criado na forma de um serviço da web, poderemos receber classificações de atratividade para shopping centers onde não há salões da nossa empresa.

Portanto, temos dados, temos uma compreensão de como trabalhar com eles e temos uma maneira de classificar shopping centers. Agora vamos transferir tudo isso para os usuários em operação.

Automatizamos o trabalho da equipe do departamento de seleção de instalações


Para começar, crie relatórios analíticos.

Por exemplo, precisamos avaliar a possibilidade de abrir vários pontos de venda em N.
Estamos interessados ​​nos seguintes dados:

  • Todos os shopping centers da cidade (número de lojas em cada, número de concorrentes, nossas lojas);
  • Todos os shopping centers da cidade onde existem concorrentes, mas não nós;
  • Todos os concorrentes na cidade (em que os shopping centers estão representados, quantas lojas totais de varejo);

Aqui está um exemplo de um dos relatórios feitos no MS Power BI. As fontes de dados são nosso armazém de dados no MS Azure.



Em seguida, criaremos uma ferramenta para exibir os dados coletados nos shopping centers em um mapa. A familiar API 2GIS nos ajudará com isso. No aplicativo da web, crie um widget de mapa e aplique marcadores com marcas de shopping centers. Exemplo (dados reais alterados):



Resumir


Então fizemos o seguinte:

  • Criamos o processo de obtenção de dados sobre shopping centers a partir do serviço 2GIS.
  • Encontramos uma conexão entre os dados obtidos e os resultados dos salões nos shopping centers onde a empresa já opera.
  • Eles criaram uma metodologia para avaliar os shopping centers quanto à atratividade.
  • Desenvolvemos relatórios e ferramentas para automatizar o trabalho de especialistas na seleção de locais para abertura de pontos de venda.

Vejamos a arquitetura da solução que temos.



Na próxima parte do artigo, pretendo contar como fazer uma bot geoanalítica para ajudar os funcionários responsáveis ​​pela seleção das instalações.

Obrigado pela atenção!

Se alguém estiver interessado nos detalhes técnicos da implementação dos componentes individuais da solução, terei prazer em responder a perguntas nos comentários ou em uma mensagem pessoal.

Source: https://habr.com/ru/post/pt483722/


All Articles