L'autopartage, malgrĂ© sa jeunesse, est l'un des domaines en dĂ©veloppement le plus actif du secteur automobile russe. 5 ans se sont Ă©coulĂ©s depuis le lancement de la premiĂšre entreprise, et aujourd'hui plus de 25 opĂ©rateurs spĂ©cialisĂ©s dans les baux Ă court terme travaillent sur le marchĂ©. Avec le dĂ©veloppement de l'autopartage, les donnĂ©es des utilisateurs s'accumulent, et maintenant l'autopartage, comme les banques, dispose d'un certain systĂšme de notation des clients. Cela dĂ©pend aussi de l'Ăąge, du sexe, de l'expĂ©rience de conduite, mais ce n'est pas l'historique de vos prĂȘts, mais l'historique de vos dĂ©placements. Lâun des objectifs de cette notation, outre la solvabilitĂ©, la validation dâun permis de conduire, les amendes, est de prĂ©voir la probabilitĂ© dâaccidents pour un conducteur en particulier.

Dans cet article, nous analyserons la logique du fonctionnement des algorithmes de notation pour les utilisateurs de covoiturage, qui ne s'appuieront que sur l'Ăąge et le style de conduite. En plus de ces paramĂštres, et pour obtenir des rĂ©sultats plus prĂ©cis, ils peuvent ĂȘtre utilisĂ©s - statut social, voyages avec des enfants, activitĂ© sur les rĂ©seaux sociaux et informations de la camĂ©ra dans la voiture. Cependant, aujourd'hui, nous nous concentrerons sur deux principes de base: l'Ăąge et le style de conduite.
Notez que dans l'article, nous allons dĂ©montrer la logique de la notation par l'exemple de l'activitĂ© de conduite de 50 000 utilisateurs et 260 000 dĂ©placements. Toutes les donnĂ©es ont Ă©tĂ© anonymisĂ©es. En outre, nous avons utilisĂ© des donnĂ©es sur 220 accidents commis avec Moscou et la rĂ©gion de Moscou.Dans l'autopartage, une voiture est en outre un moyen de gĂ©nĂ©rer des profits, achetĂ©s avec de l'argent de crĂ©dit. Avec cette approche, il est important de l'utiliser aussi efficacement que possible, en Ă©vitant les temps d'arrĂȘt. Et si la voiture a eu un accident, la paperasserie avec l'assureur, la coordination, la commande de piĂšces dĂ©tachĂ©es et la rĂ©paration proprement dite peuvent prendre un temps considĂ©rable, de plusieurs jours Ă plusieurs mois. La notation peut identifier de maniĂšre prĂ©dictive les accidents potentiels et, sur cette base, vous pouvez donner aux clients des informations sur les risques d'une conduite dangereuse.
Il est important pour les opĂ©rateurs d'autopartage de prĂ©server leur propriĂ©tĂ© et d'en tirer profit. Ainsi, la plateforme d'autopartage est simplement obligĂ©e de collecter toutes les informations possibles sur la voiture et ce qui se passe avec elle. Pour chaque trajet, l'autopartage collecte des donnĂ©es tĂ©lĂ©matiques - points de trajet avec un intervalle ne dĂ©passant pas 1 seconde et indicateurs de voiture Ă ces points (vitesse, tours, accĂ©lĂ©rations, Ă©tats des portes et fenĂȘtres, etc.).
Ăge
Lors de la conclusion d'un contrat avec un opérateur d'autopartage, le conducteur doit indiquer son ùge et son expérience de conduite. Sur la base de ces données, nous pouvons construire l'histogramme suivant.
Figure 1. Ăge des utilisateursLa figure 1 montre un graphique Ă barres de l'Ăąge des utilisateurs d'autopartage. L'axe horizontal est l'Ăąge des utilisateurs, l'axe vertical est leur nombre, la ligne pointillĂ©e marque la mĂ©diane de 30 ans. Il ressemble Ă une distribution normale et Ă des augmentations prononcĂ©es du nombre d'utilisateurs ĂągĂ©s de 25, 30 et 35 ans.
Ensuite, nous considérons la distribution des ùges des utilisateurs identifiés par les coupables de l'accident.
Figure 2. Ăge des utilisateurs accidentĂ©sLa figure 2 montre un histogramme de la rĂ©partition des Ăąges des utilisateurs responsables d'accidents de la circulation, horizontal - l'Ăąge des utilisateurs, vertical - le nombre d'utilisateurs. Encore une fois, la ligne pointillĂ©e marque la mĂ©diane de 26 ans. Ainsi, il est clair que les utilisateurs de moins de 26 ans sont plus souvent que les autres coupables d'accidents.
Selon l'histogramme, la moitiĂ© de l'accident est due Ă la faute d'un groupe d'un quart des utilisateurs (utilisateurs de moins de 26 ans). De mĂȘme, un groupe d'utilisateurs de plus de 30 ans, reprĂ©sentant la moitiĂ© du total, n'a gĂ©nĂ©rĂ© qu'un quart de l'accident.
Ainsi, nous constatons que la probabilité d'un accident pour les utilisateurs de moins de 26 ans est quatre fois plus élevée que pour les utilisateurs de plus de 30 ans. Ce qui attire l'attention supplémentaire sur le groupe plus jeune d'utilisateurs du cÎté des opérateurs d'autopartage. Ce n'est pas une coïncidence si de nombreux opérateurs ne doivent pas commencer par l'ùge de 18 ans, mais par 21 ans. L'autopartage souhaite également voir des conducteurs expérimentés parmi leurs utilisateurs et indiquer une expérience de 2 ans, balayant ainsi les jeunes conducteurs inexpérimentés.
Style de conduite
Le style de conduite est plus compliqué. à l'heure actuelle, il existe un modÚle établi dans l'industrie pour déterminer un style de conduite - un modÚle pour calculer les accélérations brusques et le freinage. Examinons-le plus en détail.
Figure 3. Un graphique des changements de vitesse du véhicule.
Si la vitesse du vĂ©hicule sur un intervalle de temps âtâ€3sec. augmente de âs â„ 15 km / h, puis dans cet intervalle de temps, la voiture accĂ©lĂšre fortement. De mĂȘme, si pendant un intervalle de temps âtâ€3 sec. La vitesse de la voiture diminue de âs â„ 15 km / h, puis dans cet intervalle de temps, la voiture freine fortement. ât et âs sont des paramĂštres du modĂšle et peuvent ĂȘtre modifiĂ©s Ă la fois vers le haut et vers le bas. Par exemple, le graphique 3 montre la dĂ©pendance de la vitesse du vĂ©hicule par rapport au temps, et dans l'intervalle de la 8e Ă la 11e seconde, la vitesse de la voiture a fortement augmentĂ© de 20 km / h Ă 40 km / h, et dans l'intervalle de la 15e Ă la 18e seconde, la vitesse a fortement chutĂ© de 60 km / h Ă 30 km / h
A est le nombre d'accélérations brusques le long de l'itinéraire, B est le nombre de freinages brusques. La figure 4 montre la distribution de la somme A + B sur l'échantillon de routes utilisées.
Figure 4. RĂ©partition des accĂ©lĂ©rations brusques et du freinageNotez que le voyage peut durer 15 minutes et peut-ĂȘtre 5 heures, vous devez donc tenir compte de la durĂ©e ou de la distance du voyage lors du choix des paramĂštres de notation. D est la longueur de l'itinĂ©raire en kilomĂštres. Nous calculons le nombre d'accĂ©lĂ©rations brusques et de freinage par 1 km de parcours, soit ((A + B)) / D. Nous obtenons la distribution asymĂ©trique indiquĂ©e dans l'histogramme de la figure 5, oĂč les valeurs sur la gauche se dĂ©sintĂšgrent beaucoup plus rapidement que sur la droite. Malheureusement, la plupart des mĂ©thodes statistiques ne fonctionnent pas pour des distributions trĂšs asymĂ©triques. Dans de tels cas, une transformation logarithmique aide gĂ©nĂ©ralement, ce qui convertit souvent l'asymĂ©trie en symĂ©trie, car elle vous permet d'Ă©tirer l'Ă©chelle au voisinage de zĂ©ro.
Figure 5. Répartition des accélérations et du freinage sur 1 km de routeAprÚs avoir logarithmisé cette fonction, nous obtenons Log⥠(((A + B)) / D). En conséquence, la distribution est trÚs similaire à la normale - Figure 6.
Figure 6. Logarithme du nombre d'accélérations et de décélérations par trajet de 1 kmC'est sur la base de cette fonction qu'un modÚle de notation d'un style de conduite est généralement construit. Essayons de parcourir à travers chaque fonction toutes les routes de chaque utilisateur. Sur l'histogramme Figure 7.
Figure 7. Comparaison des utilisateurs avec et sans accidentIl montre en bleu les rĂ©sultats de tous les utilisateurs, avec la ligne pointillĂ©e bleue leur mĂ©diane, en rouge les rĂ©sultats des utilisateurs avec des accidents et la ligne pointillĂ©e rouge leur mĂ©diane. On voit que les rĂ©sultats des utilisateurs avec des accidents sont dĂ©calĂ©s vers la droite, c'est-Ă -dire les utilisateurs accidentĂ©s sont souvent fortement freinĂ©s et accĂ©lĂ©rĂ©s dans le processus de dĂ©placement. Cependant, le dĂ©placement est extrĂȘmement faible et, en fait, il n'y a pas de corrĂ©lation entre cette valeur de la fonction et le fait d'entrer dans un accident. Nous considĂ©rons les performances moyennes des utilisateurs, mais il est possible que les utilisateurs conduisent en moyenne en toute sĂ©curitĂ©, mais parfois de façon imprudente. Envisagez des dĂ©placements sans accident avec la valeur maximale de la fonction Log⥠(((A + B)) / D) pour chaque utilisateur. L'histogramme est la figure 8, oĂč la ligne pointillĂ©e marque la mĂ©diane.
Figure 8. Pires dĂ©placements des utilisateursNous ajoutons un histogramme des trajets des utilisateurs avec accidents, et nous ne prendrons pas non plus en compte leurs trajets au cours desquels l'accident s'est produit. Les histogrammes rĂ©sultants sont affichĂ©s sur la figure 9, oĂč la ligne pointillĂ©e bleue est la mĂ©diane des utilisateurs voyageant sans accident, la ligne pointillĂ©e orange est la mĂ©diane des utilisateurs voyageant avec un accident. Il y a un plus grand dĂ©calage vers la droite. C'est-Ă -dire les utilisateurs avec des accidents de cette maniĂšre se distinguent du groupe gĂ©nĂ©ral.
Figure 9. Comparaison des pires trajets des utilisateursSur la base de cette mĂ©thode, nous construisons un modĂšle de notation. Les rĂ©sultats du modĂšle sont prĂ©sentĂ©s dans la figure 10. Le bleu indique les rĂ©sultats de tous les utilisateurs, l'orange - les rĂ©sultats des utilisateurs avec des accidents. La vitesse est de 0 Ă 10, oĂč 0 est le pire rĂ©sultat et 10 est le meilleur. Les lignes pointillĂ©es indiquent les scores mĂ©dians de deux groupes d'utilisateurs. Dans le mĂȘme temps, la vitesse moyenne des utilisateurs accidentĂ©s est d'environ 4, et tous les utilisateurs sont 5. 80% des utilisateurs accidentĂ©s ont une vitesse infĂ©rieure Ă la moyenne, en d'autres termes, 80% des utilisateurs accidentĂ©s conduisent moins bien que la moyenne.
Figure 10. RĂ©sultats de la notationUn modĂšle similaire est gĂ©nĂ©ralement utilisĂ© pour calculer le score de conduite basĂ© sur des donnĂ©es tĂ©lĂ©matiques. En fonction de ses rĂ©sultats, l'accĂšs aux voitures premium ou au service en gĂ©nĂ©ral peut ĂȘtre limitĂ©. Cependant, ce n'est pas le seul et le plus optimal pour tous les cas.
Le modĂšle dĂ©crit dans l'article n'est pas parfait pour prĂ©voir les accidents. Dans cet article, nous n'avons fait qu'une revue des modĂšles actuels d'autopartage. Dans la partie suivante, nous parlerons du modĂšle d'Ă©nergie de mouvement, qui opĂšre spĂ©cifiquement sur le style de conduite (changement de vitesse, manĆuvre, etc.).
Publié par Kirill Kulchenkov,
kulchenkov32 , Business Consultant, Bright Box.