Comment fonctionne la notation dans l'industrie de l'autopartage. Partie 1. Présentation des outils populaires sur les données réelles

L'autopartage, malgrĂ© sa jeunesse, est l'un des domaines en dĂ©veloppement le plus actif du secteur automobile russe. 5 ans se sont Ă©coulĂ©s depuis le lancement de la premiĂšre entreprise, et aujourd'hui plus de 25 opĂ©rateurs spĂ©cialisĂ©s dans les baux Ă  court terme travaillent sur le marchĂ©. Avec le dĂ©veloppement de l'autopartage, les donnĂ©es des utilisateurs s'accumulent, et maintenant l'autopartage, comme les banques, dispose d'un certain systĂšme de notation des clients. Cela dĂ©pend aussi de l'Ăąge, du sexe, de l'expĂ©rience de conduite, mais ce n'est pas l'historique de vos prĂȘts, mais l'historique de vos dĂ©placements. L’un des objectifs de cette notation, outre la solvabilitĂ©, la validation d’un permis de conduire, les amendes, est de prĂ©voir la probabilitĂ© d’accidents pour un conducteur en particulier.



Dans cet article, nous analyserons la logique du fonctionnement des algorithmes de notation pour les utilisateurs de covoiturage, qui ne s'appuieront que sur l'Ăąge et le style de conduite. En plus de ces paramĂštres, et pour obtenir des rĂ©sultats plus prĂ©cis, ils peuvent ĂȘtre utilisĂ©s - statut social, voyages avec des enfants, activitĂ© sur les rĂ©seaux sociaux et informations de la camĂ©ra dans la voiture. Cependant, aujourd'hui, nous nous concentrerons sur deux principes de base: l'Ăąge et le style de conduite.

Notez que dans l'article, nous allons démontrer la logique de la notation par l'exemple de l'activité de conduite de 50 000 utilisateurs et 260 000 déplacements. Toutes les données ont été anonymisées. En outre, nous avons utilisé des données sur 220 accidents commis avec Moscou et la région de Moscou.


Dans l'autopartage, une voiture est en outre un moyen de gĂ©nĂ©rer des profits, achetĂ©s avec de l'argent de crĂ©dit. Avec cette approche, il est important de l'utiliser aussi efficacement que possible, en Ă©vitant les temps d'arrĂȘt. Et si la voiture a eu un accident, la paperasserie avec l'assureur, la coordination, la commande de piĂšces dĂ©tachĂ©es et la rĂ©paration proprement dite peuvent prendre un temps considĂ©rable, de plusieurs jours Ă  plusieurs mois. La notation peut identifier de maniĂšre prĂ©dictive les accidents potentiels et, sur cette base, vous pouvez donner aux clients des informations sur les risques d'une conduite dangereuse.

Il est important pour les opĂ©rateurs d'autopartage de prĂ©server leur propriĂ©tĂ© et d'en tirer profit. Ainsi, la plateforme d'autopartage est simplement obligĂ©e de collecter toutes les informations possibles sur la voiture et ce qui se passe avec elle. Pour chaque trajet, l'autopartage collecte des donnĂ©es tĂ©lĂ©matiques - points de trajet avec un intervalle ne dĂ©passant pas 1 seconde et indicateurs de voiture Ă  ces points (vitesse, tours, accĂ©lĂ©rations, Ă©tats des portes et fenĂȘtres, etc.).

Âge



Lors de la conclusion d'un contrat avec un opérateur d'autopartage, le conducteur doit indiquer son ùge et son expérience de conduite. Sur la base de ces données, nous pouvons construire l'histogramme suivant.


Figure 1. Âge des utilisateurs

La figure 1 montre un graphique à barres de l'ùge des utilisateurs d'autopartage. L'axe horizontal est l'ùge des utilisateurs, l'axe vertical est leur nombre, la ligne pointillée marque la médiane de 30 ans. Il ressemble à une distribution normale et à des augmentations prononcées du nombre d'utilisateurs ùgés de 25, 30 et 35 ans.

Ensuite, nous considérons la distribution des ùges des utilisateurs identifiés par les coupables de l'accident.

Figure 2. Âge des utilisateurs accidentĂ©s

La figure 2 montre un histogramme de la répartition des ùges des utilisateurs responsables d'accidents de la circulation, horizontal - l'ùge des utilisateurs, vertical - le nombre d'utilisateurs. Encore une fois, la ligne pointillée marque la médiane de 26 ans. Ainsi, il est clair que les utilisateurs de moins de 26 ans sont plus souvent que les autres coupables d'accidents.

Selon l'histogramme, la moitiĂ© de l'accident est due Ă  la faute d'un groupe d'un quart des utilisateurs (utilisateurs de moins de 26 ans). De mĂȘme, un groupe d'utilisateurs de plus de 30 ans, reprĂ©sentant la moitiĂ© du total, n'a gĂ©nĂ©rĂ© qu'un quart de l'accident.

Ainsi, nous constatons que la probabilité d'un accident pour les utilisateurs de moins de 26 ans est quatre fois plus élevée que pour les utilisateurs de plus de 30 ans. Ce qui attire l'attention supplémentaire sur le groupe plus jeune d'utilisateurs du cÎté des opérateurs d'autopartage. Ce n'est pas une coïncidence si de nombreux opérateurs ne doivent pas commencer par l'ùge de 18 ans, mais par 21 ans. L'autopartage souhaite également voir des conducteurs expérimentés parmi leurs utilisateurs et indiquer une expérience de 2 ans, balayant ainsi les jeunes conducteurs inexpérimentés.

Style de conduite



Le style de conduite est plus compliquĂ©. À l'heure actuelle, il existe un modĂšle Ă©tabli dans l'industrie pour dĂ©terminer un style de conduite - un modĂšle pour calculer les accĂ©lĂ©rations brusques et le freinage. Examinons-le plus en dĂ©tail.


Figure 3. Un graphique des changements de vitesse du véhicule.


Si la vitesse du vĂ©hicule sur un intervalle de temps ∆t≀3sec. augmente de ∆s ≄ 15 km / h, puis dans cet intervalle de temps, la voiture accĂ©lĂšre fortement. De mĂȘme, si pendant un intervalle de temps ∆t≀3 sec. La vitesse de la voiture diminue de ∆s ≄ 15 km / h, puis dans cet intervalle de temps, la voiture freine fortement. ∆t et ∆s sont des paramĂštres du modĂšle et peuvent ĂȘtre modifiĂ©s Ă  la fois vers le haut et vers le bas. Par exemple, le graphique 3 montre la dĂ©pendance de la vitesse du vĂ©hicule par rapport au temps, et dans l'intervalle de la 8e Ă  la 11e seconde, la vitesse de la voiture a fortement augmentĂ© de 20 km / h Ă  40 km / h, et dans l'intervalle de la 15e Ă  la 18e seconde, la vitesse a fortement chutĂ© de 60 km / h Ă  30 km / h
A est le nombre d'accélérations brusques le long de l'itinéraire, B est le nombre de freinages brusques. La figure 4 montre la distribution de la somme A + B sur l'échantillon de routes utilisées.


Figure 4. Répartition des accélérations brusques et du freinage

Notez que le voyage peut durer 15 minutes et peut-ĂȘtre 5 heures, vous devez donc tenir compte de la durĂ©e ou de la distance du voyage lors du choix des paramĂštres de notation. D est la longueur de l'itinĂ©raire en kilomĂštres. Nous calculons le nombre d'accĂ©lĂ©rations brusques et de freinage par 1 km de parcours, soit ((A + B)) / D. Nous obtenons la distribution asymĂ©trique indiquĂ©e dans l'histogramme de la figure 5, oĂč les valeurs sur la gauche se dĂ©sintĂšgrent beaucoup plus rapidement que sur la droite. Malheureusement, la plupart des mĂ©thodes statistiques ne fonctionnent pas pour des distributions trĂšs asymĂ©triques. Dans de tels cas, une transformation logarithmique aide gĂ©nĂ©ralement, ce qui convertit souvent l'asymĂ©trie en symĂ©trie, car elle vous permet d'Ă©tirer l'Ă©chelle au voisinage de zĂ©ro.


Figure 5. Répartition des accélérations et du freinage sur 1 km de route

AprÚs avoir logarithmisé cette fonction, nous obtenons Log⁥ (((A + B)) / D). En conséquence, la distribution est trÚs similaire à la normale - Figure 6.


Figure 6. Logarithme du nombre d'accélérations et de décélérations par trajet de 1 km

C'est sur la base de cette fonction qu'un modÚle de notation d'un style de conduite est généralement construit. Essayons de parcourir à travers chaque fonction toutes les routes de chaque utilisateur. Sur l'histogramme Figure 7.


Figure 7. Comparaison des utilisateurs avec et sans accident

Il montre en bleu les rĂ©sultats de tous les utilisateurs, avec la ligne pointillĂ©e bleue leur mĂ©diane, en rouge les rĂ©sultats des utilisateurs avec des accidents et la ligne pointillĂ©e rouge leur mĂ©diane. On voit que les rĂ©sultats des utilisateurs avec des accidents sont dĂ©calĂ©s vers la droite, c'est-Ă -dire les utilisateurs accidentĂ©s sont souvent fortement freinĂ©s et accĂ©lĂ©rĂ©s dans le processus de dĂ©placement. Cependant, le dĂ©placement est extrĂȘmement faible et, en fait, il n'y a pas de corrĂ©lation entre cette valeur de la fonction et le fait d'entrer dans un accident. Nous considĂ©rons les performances moyennes des utilisateurs, mais il est possible que les utilisateurs conduisent en moyenne en toute sĂ©curitĂ©, mais parfois de façon imprudente. Envisagez des dĂ©placements sans accident avec la valeur maximale de la fonction Log⁥ (((A + B)) / D) pour chaque utilisateur. L'histogramme est la figure 8, oĂč la ligne pointillĂ©e marque la mĂ©diane.


Figure 8. Pires déplacements des utilisateurs

Nous ajoutons un histogramme des trajets des utilisateurs avec accidents, et nous ne prendrons pas non plus en compte leurs trajets au cours desquels l'accident s'est produit. Les histogrammes rĂ©sultants sont affichĂ©s sur la figure 9, oĂč la ligne pointillĂ©e bleue est la mĂ©diane des utilisateurs voyageant sans accident, la ligne pointillĂ©e orange est la mĂ©diane des utilisateurs voyageant avec un accident. Il y a un plus grand dĂ©calage vers la droite. C'est-Ă -dire les utilisateurs avec des accidents de cette maniĂšre se distinguent du groupe gĂ©nĂ©ral.


Figure 9. Comparaison des pires trajets des utilisateurs

Sur la base de cette mĂ©thode, nous construisons un modĂšle de notation. Les rĂ©sultats du modĂšle sont prĂ©sentĂ©s dans la figure 10. Le bleu indique les rĂ©sultats de tous les utilisateurs, l'orange - les rĂ©sultats des utilisateurs avec des accidents. La vitesse est de 0 Ă  10, oĂč 0 est le pire rĂ©sultat et 10 est le meilleur. Les lignes pointillĂ©es indiquent les scores mĂ©dians de deux groupes d'utilisateurs. Dans le mĂȘme temps, la vitesse moyenne des utilisateurs accidentĂ©s est d'environ 4, et tous les utilisateurs sont 5. 80% des utilisateurs accidentĂ©s ont une vitesse infĂ©rieure Ă  la moyenne, en d'autres termes, 80% des utilisateurs accidentĂ©s conduisent moins bien que la moyenne.


Figure 10. RĂ©sultats de la notation

Un modĂšle similaire est gĂ©nĂ©ralement utilisĂ© pour calculer le score de conduite basĂ© sur des donnĂ©es tĂ©lĂ©matiques. En fonction de ses rĂ©sultats, l'accĂšs aux voitures premium ou au service en gĂ©nĂ©ral peut ĂȘtre limitĂ©. Cependant, ce n'est pas le seul et le plus optimal pour tous les cas.

Le modĂšle dĂ©crit dans l'article n'est pas parfait pour prĂ©voir les accidents. Dans cet article, nous n'avons fait qu'une revue des modĂšles actuels d'autopartage. Dans la partie suivante, nous parlerons du modĂšle d'Ă©nergie de mouvement, qui opĂšre spĂ©cifiquement sur le style de conduite (changement de vitesse, manƓuvre, etc.).

Publié par Kirill Kulchenkov, kulchenkov32 , Business Consultant, Bright Box.

Source: https://habr.com/ru/post/fr430558/


All Articles