Como funciona a pontuação no setor de compartilhamento de carros. Parte 1. Visão geral de ferramentas populares em dados reais

O compartilhamento de carros, apesar de jovem, é uma das áreas de desenvolvimento mais ativo no setor automobilístico russo. Cinco anos se passaram desde o lançamento da primeira empresa e hoje mais de 25 operadoras especializadas em arrendamentos de curto prazo trabalham no mercado. Com o desenvolvimento do compartilhamento de carros, os dados do usuário estão sendo acumulados e agora o compartilhamento de carros, como bancos, tem um determinado sistema de pontuação de clientes. Também depende de idade, sexo, experiência de dirigir, mas esse não é o histórico dos seus empréstimos, mas o histórico das suas viagens. Um dos objetivos dessa pontuação, além de solvência, validação de uma carteira de motorista, multas, é prever a probabilidade de acidentes para um motorista em particular.



Neste artigo, analisaremos a lógica da operação de algoritmos de pontuação para usuários de compartilhamento de carros, que dependerão apenas da idade e do estilo de condução. Além desses parâmetros, e para obter resultados mais precisos, eles podem ser usados ​​- status social, viagens com crianças, atividade nas redes sociais e informações da câmera no carro. No entanto, hoje vamos nos concentrar em dois básicos - idade e estilo de dirigir.

Observe que, no artigo, demonstraremos a lógica da pontuação pelo exemplo da atividade de direção de 50.000 usuários e 260.000 viagens. Todos os dados foram anonimizados. Além disso, foram utilizados dados de 220 acidentes cometidos com Moscou e a região de Moscou.


No compartilhamento de carros, um carro é um meio de gerar lucro, além disso, comprado com dinheiro de crédito. Com essa abordagem, é importante usá-la da maneira mais eficiente possível, evitando o tempo de inatividade. E se o carro sofrer um acidente, a papelada com a seguradora, a coordenação, o pedido de peças de reposição e o reparo real podem levar um tempo considerável, de vários dias a meses. A pontuação pode identificar de forma previsível acidentes em potencial e, com base nisso, você pode dar feedback aos clientes sobre os riscos de direção insegura.

É importante que os operadores de compartilhamento de carro preservem sua propriedade e ganhem dinheiro com ela. Assim, a plataforma de compartilhamento de carros é simplesmente obrigada a coletar todas as informações possíveis sobre o carro e o que está acontecendo com ele. Para cada viagem, o carro compartilhador coleta dados telemáticos - pontos de viagem com um intervalo não superior a 1 segundo e indicadores de carro nesses pontos (velocidade, revoluções, acelerações, status de portas e janelas, etc.).

Idade



Ao concluir um contrato com um operador de compartilhamento de carro, o motorista deve indicar sua idade e experiência de condução. Com base nesses dados, podemos construir o seguinte histograma.


Figura 1. Idade dos usuários

A Figura 1 mostra um gráfico de barras com as idades dos usuários do compartilhamento de carros. O eixo horizontal é a idade dos usuários, o eixo vertical é o número, a linha tracejada marca a mediana de 30 anos. Parece uma distribuição normal e aumentos pronunciados no número de usuários com 25, 30 e 35 anos de idade.

Em seguida, consideramos a distribuição das idades dos usuários identificados pelos culpados do acidente.

Figura 2. Idade dos usuários com um acidente

A Figura 2 mostra um histograma da distribuição das idades dos usuários responsáveis ​​por acidentes de trânsito, horizontal - idade dos usuários, vertical - número de usuários. Novamente, a linha tracejada marca a mediana de 26 anos. Assim, fica claro que usuários com menos de 26 anos de idade são mais frequentemente do que outros culpados de acidentes.

De acordo com o histograma, metade do acidente ocorreu devido à falha de um grupo de um quarto de usuários (usuários com menos de 26 anos). Da mesma forma, um grupo de usuários acima de 30 anos, responsável por metade do total, gerou apenas um quarto do acidente.

Portanto, vemos que a probabilidade de um acidente para usuários com menos de 26 anos é quatro vezes maior que para usuários com mais de 30 anos. O que chama atenção adicional para o grupo mais jovem de usuários do lado dos operadores de compartilhamento de carro. Não é por acaso que muitos requisitos de idade dos operadores não começam com 18 anos, mas com 21 anos. O Carsharing também quer ver motoristas experientes entre seus usuários e indicar uma experiência de 2 anos, varrendo assim jovens motoristas inexperientes.

Estilo de condução



O estilo de condução é mais complicado. No momento, existe um modelo estabelecido na indústria para determinar um estilo de direção - um modelo para calcular acelerações e frenagens acentuadas. Vamos considerar com mais detalhes.


Figura 3. Um gráfico de mudanças na velocidade do veículo.


Se o veículo acelerar durante um intervalo de tempo ∆t≤3seg. aumenta ∆s≥15 km / h, nesse intervalo de tempo o carro acelera acentuadamente. Da mesma forma, se por um intervalo de tempo ∆t≤3 seg. A velocidade do carro diminui ∆s≥15 km / h; nesse intervalo de tempo, o carro freia bruscamente. ∆t e ares são parâmetros de modelo e podem ser alterados para cima e para baixo. Por exemplo, o gráfico 3 mostra a dependência da velocidade do veículo no tempo e, no intervalo de 8 a 11 segundos, a velocidade do carro aumentou acentuadamente de 20 km / h para 40 km / h, e no intervalo de 15 a 18 segundos, a velocidade caiu acentuadamente de 60 km / h para 30km / h
A é o número de acelerações acentuadas ao longo da rota, B é o número de travagens acentuadas. A Figura 4 mostra a distribuição da soma A + B na amostra de rotas utilizadas.


Figura 4. Distribuição de acelerações acentuadas e frenagem

Observe que a viagem pode durar 15 minutos e talvez 5 horas; portanto, você deve considerar o tempo ou a distância da viagem ao escolher os parâmetros de pontuação. D é o comprimento da rota em quilômetros. Calculamos o número de acelerações e freadas acentuadas por 1 km da rota, ou seja, ((A + B)) / D. Obtemos a distribuição assimétrica mostrada no histograma da Figura 5, onde os valores à esquerda decaem muito mais rápido que à direita. Infelizmente, a maioria dos métodos estatísticos não funciona para distribuições altamente distorcidas. Nesses casos, uma transformação logarítmica geralmente ajuda, que muitas vezes converte assimetria em simetria, pois permite esticar a escala na proximidade de zero.


Figura 5. Distribuição das acelerações e frenagens por 1 km da rota

Tendo logaritmizado essa função, obtemos Log⁡ (((A + B)) / D). Como resultado, a distribuição é muito semelhante à distribuição normal - Figura 6.


Figura 6. Logaritmo do número de acelerações e desacelerações por 1 km de viagem

É com base nessa função que geralmente é construído um modelo de pontuação de um estilo de direção. Vamos tentar executar em cada função todas as rotas de cada usuário. No histograma Figura 7.


Figura 7. Comparação de usuários com e sem acidentes

Mostra em azul os resultados de todos os usuários, com a linha pontilhada azul em sua mediana, em vermelho os resultados dos usuários com acidentes e a linha pontilhada em vermelho em sua mediana. Observa-se que os resultados dos usuários com acidentes são deslocados para a direita, ou seja, os usuários com acidentes geralmente são fortemente travados e acelerados no processo de movimentação. No entanto, o deslocamento é extremamente pequeno e, de fato, não há correlação entre esse valor da função e o fato de ocorrer um acidente. Consideramos o desempenho médio dos usuários, mas é possível que os usuários conduzam em média com segurança, mas ocasionalmente de forma imprudente. Considere viagens sem acidentes com o valor máximo da função Log⁡ (((A + B)) / D) para cada usuário. O histograma é a Figura 8, onde a linha tracejada marca a mediana.


Figura 8. Piores viagens do usuário

Adicionamos um histograma de viagens de usuários com acidentes e também não levamos em consideração as viagens nas quais o acidente ocorreu. Os histogramas resultantes são mostrados na Figura 9, onde a linha tracejada azul é a mediana dos usuários que viajam sem acidentes, a linha tracejada laranja é a mediana dos usuários que viajam com acidentes. Há uma mudança maior para a direita. I.e. usuários com acidentes desta maneira se destacam do grupo geral.


Figura 9. Comparação das piores viagens do usuário

Com base nesse método, criamos um modelo de pontuação. Os resultados do modelo são mostrados na Figura 10. Azul indica os resultados de todos os usuários, laranja - os resultados dos usuários com acidentes. A velocidade é de 0 a 10, onde 0 é o pior resultado e 10 é o melhor. Linhas pontilhadas indicam as pontuações medianas de dois grupos de usuários. Ao mesmo tempo, a velocidade média dos usuários com acidentes é de cerca de 4, e todos os usuários são 5. 80% dos usuários com acidentes têm uma velocidade abaixo da média, ou seja, 80% dos usuários com acidentes dirigem pior que a média.


Figura 10. Resultados da pontuação

Um modelo semelhante é geralmente usado no cálculo da pontuação de direção com base em dados telemáticos. Com base em seus resultados, o acesso a carros premium ou o serviço em geral pode ser limitado. No entanto, não é o único e o mais ideal para todos os casos.

O modelo descrito no artigo não é perfeito para prever acidentes. Neste artigo, fizemos apenas uma revisão dos modelos atuais de compartilhamento de carros. Na próxima parte, falaremos sobre o modelo de energia do movimento, que opera especificamente no estilo de direção (estilo de mudança de velocidade, manobras, etc.).

Postado por Kirill Kulchenkov, kulchenkov32 , Consultor de negócios, Bright Box.

Source: https://habr.com/ru/post/pt430558/


All Articles