Cómo funciona la puntuación en la industria del automóvil compartido. Parte 1. Descripción general de herramientas populares sobre datos reales

El auto compartido, a pesar de su juventud, es una de las áreas de desarrollo más activo en el negocio automotriz ruso. Han pasado 5 años desde el lanzamiento de la primera compañía, y hoy más de 25 operadores especializados en arrendamientos a corto plazo trabajan en el mercado. Con el desarrollo del uso compartido de automóviles, los datos de los usuarios se están acumulando, y ahora el uso compartido de automóviles, como los bancos, tiene un cierto sistema de puntuación de clientes. También depende de la edad, el sexo, la experiencia de manejo, pero este no es el historial de sus préstamos, sino el historial de sus viajes. Uno de los objetivos de dicha puntuación, además de la solvencia, la validación de una licencia de conducir, multas, es predecir la probabilidad de accidentes para un conductor en particular.



En este artículo, analizaremos la lógica del funcionamiento de los algoritmos de puntuación para los usuarios de vehículos compartidos, que dependerán solo de la edad y el estilo de conducción. Además de estos parámetros, y para obtener resultados más precisos, se pueden usar: estado social, viajes con niños, actividad en redes sociales e información de la cámara en el automóvil. Sin embargo, hoy nos centraremos en dos básicos: la edad y el estilo de conducción.

Tenga en cuenta que en el artículo demostraremos la lógica de la puntuación con el ejemplo de la actividad de conducción de 50,000 usuarios y 260,000 viajes. Todos los datos fueron anonimizados. Además, utilizamos datos sobre 220 accidentes cometidos con Moscú y la Región de Moscú.


En el uso compartido de automóviles, un automóvil es un medio para generar ganancias, además, se compra con dinero de crédito. Con este enfoque, es importante usarlo de la manera más eficiente posible, evitando el tiempo de inactividad. Y si el automóvil tuvo un accidente, el papeleo con la aseguradora, la coordinación, el pedido de repuestos y la reparación real pueden llevar un tiempo considerable, de varios días a meses. El puntaje puede identificar de manera predictiva posibles accidentes y, en base a ello, puede dar retroalimentación a los clientes sobre los riesgos de la conducción insegura.

Es importante que los operadores de vehículos compartidos conserven su propiedad y ganen dinero con ella. Por lo tanto, la plataforma de uso compartido de automóviles simplemente está obligada a recopilar toda la información posible sobre el automóvil y lo que está sucediendo con él. Para cada viaje, un automóvil que comparte automóvil recopila datos telemáticos: puntos de viaje con un intervalo de no más de 1 segundo e indicadores del automóvil en estos puntos (velocidad, revoluciones, aceleraciones, estados de puertas y ventanas, etc.).

Edad



Al celebrar un contrato con un operador de coche compartido, el conductor debe indicar su edad y experiencia de conducción. En base a estos datos, podemos construir el siguiente histograma.


Figura 1. Edad de los usuarios

La Figura 1 muestra un gráfico de barras de las edades de los usuarios de autos compartidos. El eje horizontal es la edad de los usuarios, el eje vertical es su número, la línea discontinua marca la mediana de 30 años. Parece una distribución normal y aumentos pronunciados en el número de usuarios con edades de 25, 30 y 35 años.

Luego consideramos la distribución de las edades de los usuarios identificados por los culpables del accidente.

Figura 2. Edad de los usuarios con un accidente.

La Figura 2 muestra un histograma de la distribución de las edades de los usuarios responsables de accidentes de tránsito, horizontal - la edad de los usuarios, vertical - el número de usuarios. De nuevo, la línea discontinua marca la mediana de 26 años. Por lo tanto, está claro que los usuarios menores de 26 años son más frecuentes que otros culpables de accidentes.

Según el histograma, la mitad del accidente ocurrió debido a la falla de un grupo de una cuarta parte de usuarios (usuarios menores de 26 años). Del mismo modo, un grupo de usuarios mayores de 30 años, que representa la mitad del total, generó solo una cuarta parte del accidente.

Por lo tanto, vemos que la probabilidad de un accidente para usuarios no mayores de 26 años es cuatro veces mayor que para usuarios mayores de 30. Lo que atrae atención adicional al grupo más joven de usuarios desde el lado de los operadores de autos compartidos. No es casualidad que los requisitos de edad de muchos operadores no comiencen con 18 años, sino con 21 años. Carsharing también quiere ver conductores experimentados entre sus usuarios e indicar una experiencia de 2 años, eliminando así a los conductores jóvenes sin experiencia.

Estilo de conducción



El estilo de conducción es más complicado. En este momento, existe un modelo establecido en la industria para determinar un estilo de conducción: un modelo para calcular aceleraciones y frenadas bruscas. Consideremos con más detalle.


Figura 3. Un gráfico de cambios en la velocidad del vehículo.


Si la velocidad del vehículo durante un intervalo de tiempo ∆t≤3seg. aumenta en ∆s≥15 km / h, luego, en este intervalo de tiempo, el automóvil acelera bruscamente. Del mismo modo, si durante un intervalo de tiempo ∆t≤3 seg. La velocidad del automóvil disminuye en ≥s≥15 km / h, luego, en este intervalo de tiempo, el automóvil frena bruscamente. ∆t y ∆s son parámetros del modelo y se pueden cambiar tanto hacia arriba como hacia abajo. Por ejemplo, el gráfico 3 muestra la dependencia de la velocidad del vehículo con el tiempo, y en el intervalo del octavo al 11º segundo, la velocidad del automóvil aumentó bruscamente de 20 km / ha 40 km / h, y en el intervalo del 15 al 18 segundo la velocidad bajó bruscamente de 60 km / h a 30km / h
A es el número de aceleraciones bruscas a lo largo de la ruta, B es el número de frenadas bruscas. La Figura 4 muestra la distribución de la suma A + B en la muestra de rutas utilizadas.


Figura 4. Distribución de aceleraciones bruscas y frenado.

Tenga en cuenta que el viaje puede durar 15 minutos, y tal vez 5 horas, por lo que debe tener en cuenta el tiempo o la distancia del viaje al elegir los parámetros de puntuación. D es la longitud de la ruta en kilómetros. Calculamos el número de aceleraciones bruscas y frenado por 1 km de la ruta, es decir ((A + B)) / D. Obtenemos la distribución asimétrica que se muestra en el histograma de la Figura 5, donde los valores de la izquierda decaen mucho más rápido que los de la derecha. Desafortunadamente, la mayoría de los métodos estadísticos no funcionan para distribuciones muy sesgadas. En tales casos, una transformación logarítmica generalmente ayuda, lo que a menudo convierte la asimetría en simetría, ya que le permite estirar la escala en las proximidades de cero.


Figura 5. Distribución de aceleraciones y frenado por 1 km de la ruta.

Habiendo logaritmizado esta función, obtenemos Log⁡ (((A + B)) / D). Como resultado, la distribución es muy similar a la normal: Figura 6.


Figura 6. Logaritmo del número de aceleraciones y desaceleraciones por viaje de 1 km

Es sobre la base de esta función que generalmente se construye un modelo de puntuación de un estilo de conducción. Intentemos ejecutar a través de cada función todas las rutas de cada usuario. En el histograma Figura 7.


Figura 7. Comparación de usuarios con y sin accidentes

Muestra azul los resultados de todos los usuarios, con la línea punteada azul como mediana, rojo los resultados de los usuarios con accidentes y la línea punteada roja como mediana. Se ve que los resultados de los usuarios con accidentes se desplazan hacia la derecha, es decir Los usuarios con accidentes suelen frenar bruscamente y acelerarse en el proceso de movimiento. Sin embargo, el desplazamiento es extremadamente pequeño y, de hecho, no existe una correlación entre este valor de la función y el hecho de tener un accidente. Consideramos el rendimiento promedio de los usuarios, pero es posible que los usuarios manejen en promedio de manera segura, pero ocasionalmente imprudente. Considere los viajes sin accidente con el valor máximo de la función Log⁡ ((((A + B)) / D) para cada usuario. El histograma es la Figura 8, donde la línea punteada marca la mediana.


Figura 8. Peores viajes de usuario

Agregamos un histograma de viajes de usuarios con accidentes, y tampoco tomaremos en cuenta sus viajes en los que ocurrió el accidente. Los histogramas resultantes se muestran en la Figura 9, donde la línea discontinua azul es la mediana de los usuarios que viajan sin accidentes, la línea discontinua naranja es la mediana de los usuarios que viajan con accidentes. Hay un mayor giro a la derecha. Es decir Los usuarios con accidentes de esta manera se destacan del grupo general.


Figura 9. Comparación de los peores viajes de usuario

Basado en este método, construimos un modelo de puntuación. Los resultados del modelo se muestran en la Figura 10. Azul indica los resultados de todos los usuarios, naranja - los resultados de los usuarios con accidentes. La velocidad es de 0 a 10, donde 0 es el peor resultado y 10 es el mejor. Las líneas punteadas indican las puntuaciones medias de dos grupos de usuarios. Al mismo tiempo, la velocidad promedio de los usuarios con accidentes es de aproximadamente 4, y todos los usuarios son 5. El 80% de los usuarios con accidentes tienen una velocidad por debajo del promedio, en otras palabras, el 80% de los usuarios con accidentes manejan peor que el promedio.


Figura 10. Resultados de puntuación

Por lo general, se usa un modelo similar para calcular el puntaje de manejo basado en datos telemáticos. Según sus resultados, el acceso a los automóviles premium o al servicio en general puede ser limitado. Sin embargo, no es el único y más óptimo para todos los casos.

El modelo descrito en el artículo no es perfecto para predecir accidentes. En este artículo, solo hicimos una revisión de los modelos actuales en el uso compartido de automóviles. En la siguiente parte, hablaremos sobre el modelo de energía de movimiento, que opera específicamente en el estilo de conducción (estilo de cambio de velocidad, maniobras, etc.).

Publicado por Kirill Kulchenkov, kulchenkov32 , Consultor de negocios, Bright Box.

Source: https://habr.com/ru/post/es430558/


All Articles