Wie das Scoring in der Carsharing-Branche funktioniert. Teil 1. Überblick ĂŒber gĂ€ngige Tools fĂŒr reale Daten

Carsharing ist trotz seiner Jugend eines der sich am aktivsten entwickelnden Gebiete im russischen AutogeschĂ€ft. Seit der GrĂŒndung des ersten Unternehmens sind 5 Jahre vergangen, und heute arbeiten mehr als 25 auf kurzfristige MietvertrĂ€ge spezialisierte Betreiber auf dem Markt. Mit der Entwicklung des Carsharing werden Benutzerdaten gesammelt, und jetzt verfĂŒgt Carsharing wie Banken ĂŒber ein bestimmtes Kundenbewertungssystem. Es hĂ€ngt auch von Alter, Geschlecht und Fahrerfahrung ab, aber dies ist nicht die Geschichte Ihrer Kredite, sondern die Geschichte Ihrer Reisen. Eines der Ziele einer solchen Bewertung ist neben der ZahlungsfĂ€higkeit, der Validierung eines FĂŒhrerscheins und der Geldbußen die Vorhersage der Unfallwahrscheinlichkeit fĂŒr einen bestimmten Fahrer.



In diesem Artikel analysieren wir die Logik der Funktionsweise von Bewertungsalgorithmen fĂŒr Carsharing-Benutzer, die sich nur auf Alter und Fahrstil stĂŒtzen. ZusĂ€tzlich zu diesen Parametern und um genauere Ergebnisse zu erhalten, können sie verwendet werden - sozialer Status, Reisen mit Kindern, AktivitĂ€ten in sozialen Netzwerken und Informationen von der Kamera im Auto. Heute konzentrieren wir uns jedoch auf zwei grundlegende Aspekte - Alter und Fahrstil.

Beachten Sie, dass wir in diesem Artikel die Logik der Bewertung am Beispiel der FahraktivitĂ€t von 50.000 Benutzern und 260.000 Fahrten demonstrieren werden. Alle Daten wurden anonymisiert. DarĂŒber hinaus haben wir Daten zu 220 UnfĂ€llen mit Moskau und der Region Moskau verwendet.


Beim Carsharing ist ein Auto ein Mittel, um Gewinn zu generieren und darĂŒber hinaus mit Kreditgeldern gekauft zu werden. Bei diesem Ansatz ist es wichtig, ihn so effizient wie möglich zu nutzen, um Ausfallzeiten zu vermeiden. Und wenn das Auto einen Unfall hat, kann der Papierkram mit dem Versicherer, die Koordination, die Bestellung von Ersatzteilen und die eigentliche Reparatur eine betrĂ€chtliche Zeit in Anspruch nehmen, von mehreren Tagen bis zu Monaten. Durch die Bewertung können potenzielle UnfĂ€lle vorhersehbar identifiziert werden. Auf dieser Grundlage können Sie Kunden Feedback zu den Risiken unsicheren Fahrens geben.

FĂŒr Carsharing-Betreiber ist es wichtig, ihr Eigentum zu erhalten und damit Geld zu verdienen. Die Carsharing-Plattform ist daher lediglich verpflichtet, alle möglichen Informationen ĂŒber das Auto und dessen VorgĂ€nge zu sammeln. FĂŒr jede Fahrt sammelt ein Carsharing-Auto Telematikdaten - Fahrtpunkte mit einem Intervall von nicht mehr als 1 Sekunde und Autoanzeigen an diesen Punkten (Geschwindigkeit, Umdrehungen, Beschleunigungen, TĂŒr- und Fensterstatus usw.).

Alter



Bei Abschluss eines Vertrages mit einem Carsharing-Betreiber muss der Fahrer sein Alter und seine Fahrerfahrung angeben. Basierend auf diesen Daten können wir das folgende Histogramm erstellen.


Abbildung 1. Alter der Benutzer

Abbildung 1 zeigt ein Balkendiagramm des Alters der Carsharing-Benutzer. Die horizontale Achse ist das Alter der Benutzer, die vertikale Achse ist ihre Anzahl, die gestrichelte Linie markiert den Median von 30 Jahren. Es sieht aus wie eine Normalverteilung und ein deutlicher Anstieg der Anzahl der Benutzer im Alter von 25, 30 und 35 Jahren.

Dann betrachten wir die Verteilung des Alters der Benutzer, die durch die Schuldigen des Unfalls identifiziert wurden.

Abbildung 2. Alter der Benutzer mit einem Unfall

Abbildung 2 zeigt ein Histogramm der Verteilung des Alters der fĂŒr VerkehrsunfĂ€lle verantwortlichen Benutzer, horizontal - des Alters der Benutzer, vertikal - der Anzahl der Benutzer. Wiederum markiert die gestrichelte Linie den Median von 26 Jahren. Somit ist klar, dass Benutzer unter 26 Jahren hĂ€ufiger als andere an UnfĂ€llen schuld sind.

Dem Histogramm zufolge ereignete sich die HĂ€lfte des Unfalls aufgrund eines Verschuldens einer Gruppe von einem Viertel der Benutzer (Benutzer unter 26 Jahren). In Ă€hnlicher Weise verursachte eine Gruppe von Benutzern ĂŒber 30, die die HĂ€lfte der Gesamtzahl ausmachte, nur ein Viertel des Unfalls.

Wir sehen also, dass die Wahrscheinlichkeit eines Unfalls fĂŒr Benutzer, die nicht Ă€lter als 26 Jahre sind, viermal höher ist als fĂŒr Benutzer, die nicht Ă€lter als 30 Jahre sind. Dies lenkt die Aufmerksamkeit der jĂŒngeren Benutzergruppe von Seiten der Carsharing-Betreiber auf sich. Es ist kein Zufall, dass die Altersanforderungen vieler Betreiber nicht mit 18 Jahren beginnen, sondern mit 21 Jahren. Carsharing möchte auch erfahrene Fahrer unter seinen Nutzern sehen und auf eine Erfahrung von 2 Jahren hinweisen, wodurch unerfahrene junge Fahrer weggefegt werden.

Fahrstil



Fahrstil ist komplizierter. Derzeit gibt es in der Branche ein etabliertes Modell zur Bestimmung eines Fahrstils - ein Modell zur Berechnung scharfer Beschleunigungen und Bremsen. Betrachten wir es genauer.


Abbildung 3. Ein Diagramm der Änderungen der Fahrzeuggeschwindigkeit.


Wenn die Fahrzeuggeschwindigkeit ĂŒber ein Zeitintervall ∆t ≀ 3 s ist. erhöht sich um ∆s≄15 km / h, dann beschleunigt das Auto in diesem Zeitintervall stark. In Ă€hnlicher Weise, wenn fĂŒr ein Zeitintervall ∆t ≀ 3 s. Die Geschwindigkeit des Autos nimmt um ∆s ≄ 15 km / h ab, dann bremst das Auto in diesem Zeitintervall stark ab. ∆t und ∆s sind Modellparameter und können sowohl nach oben als auch nach unten geĂ€ndert werden. Zum Beispiel zeigt Grafik 3 die AbhĂ€ngigkeit der Fahrzeuggeschwindigkeit von der Zeit, und im Intervall von der 8. bis 11. Sekunde stieg die Geschwindigkeit des Autos stark von 20 km / h auf 40 km / h an, und im Intervall von der 15. bis zur 18. Sekunde fiel die Geschwindigkeit stark von 60 km / h auf 30 km / h
A ist die Anzahl der scharfen Beschleunigungen entlang der Strecke, B ist die Anzahl der scharfen Bremsen. Abbildung 4 zeigt die Verteilung der Summe A + B auf die Stichprobe der verwendeten Routen.


Abbildung 4. Verteilung der scharfen Beschleunigungen und Bremsen

Beachten Sie, dass die Reise 15 Minuten und möglicherweise 5 Stunden dauern kann. Daher mĂŒssen Sie bei der Auswahl der Bewertungsparameter die Zeit oder Entfernung der Reise berĂŒcksichtigen. D ist die LĂ€nge der Route in Kilometern. Wir berechnen die Anzahl der scharfen Beschleunigungen und Bremsen pro 1 km der Strecke, d.h. ((A + B)) / D. Wir erhalten die asymmetrische Verteilung, die im Histogramm von 5 gezeigt ist, wobei die Werte auf der linken Seite viel schneller abfallen als auf der rechten Seite. Leider funktionieren die meisten statistischen Methoden nicht fĂŒr stark verzerrte Verteilungen. In solchen FĂ€llen hilft normalerweise eine logarithmische Transformation, die hĂ€ufig Asymmetrie in Symmetrie umwandelt, da Sie die Skala in der NĂ€he von Null strecken können.


Abbildung 5. Verteilung der Beschleunigungen und Bremsen pro 1 km Strecke

Nachdem wir diese Funktion logarithmiert haben, erhalten wir Log⁥ (((A + B)) / D). Infolgedessen ist die Verteilung der normalen sehr Àhnlich - Abbildung 6.


Abbildung 6. Logarithmus der Anzahl der Beschleunigungen und Verzögerungen pro 1 km Fahrt

Auf der Grundlage dieser Funktion wird normalerweise ein Bewertungsmodell eines Fahrstils erstellt. Versuchen wir, durch jede Funktion alle Routen jedes Benutzers zu fĂŒhren. Auf dem Histogramm Abbildung 7.


Abbildung 7. Vergleich von Benutzern mit und ohne UnfÀlle

Es zeigt blau die Ergebnisse aller Benutzer, wobei die blaue gestrichelte Linie ihren Median, rot die Ergebnisse von Benutzern mit UnfĂ€llen und die rote gestrichelte Linie ihren Median anzeigt. Es ist ersichtlich, dass die Ergebnisse von Benutzern mit UnfĂ€llen nach rechts verschoben sind, d.h. Benutzer mit UnfĂ€llen werden im Bewegungsprozess hĂ€ufig stark gebremst und beschleunigt. Die Verschiebung ist jedoch extrem gering, und tatsĂ€chlich besteht keine Korrelation zwischen diesem Wert der Funktion und der Tatsache, dass sie in einen Unfall verwickelt ist. Wir betrachten die durchschnittliche Leistung der Benutzer, aber es ist möglich, dass Benutzer im Durchschnitt sicher, aber gelegentlich rĂŒcksichtslos fahren. BerĂŒcksichtigen Sie unfallfreie Fahrten mit dem Maximalwert der Funktion Log⁥ ((((A + B)) / D) fĂŒr jeden Benutzer. Das Histogramm ist in Abbildung 8 dargestellt, wobei die gestrichelte Linie den Median markiert.


Abbildung 8. Schlechteste Benutzerauslösungen

Wir fĂŒgen ein Histogramm der Reisen von Benutzern mit UnfĂ€llen hinzu und berĂŒcksichtigen auch nicht die Reisen, auf denen sich der Unfall ereignet hat. Die resultierenden Histogramme sind in Abbildung 9 dargestellt. Die blaue gestrichelte Linie ist der Median der Benutzer, die ohne UnfĂ€lle reisen. Die orange gestrichelte Linie ist der Median der Benutzer, die mit UnfĂ€llen reisen. Es gibt eine grĂ¶ĂŸere Verschiebung nach rechts. Das heißt, Benutzer mit UnfĂ€llen auf diese Weise heben sich von der allgemeinen Gruppe ab.


Abbildung 9. Vergleich der schlechtesten Benutzerfahrten

Basierend auf dieser Methode erstellen wir ein Bewertungsmodell. Die Ergebnisse des Modells sind in Abbildung 10 dargestellt. Blau zeigt die Ergebnisse aller Benutzer an, orange - die Ergebnisse von Benutzern mit UnfÀllen. Die Geschwindigkeit liegt zwischen 0 und 10, wobei 0 das schlechteste und 10 das beste Ergebnis ist. Gepunktete Linien geben die Medianwerte von zwei Benutzergruppen an. Gleichzeitig betrÀgt die durchschnittliche Geschwindigkeit von Benutzern mit UnfÀllen etwa 4, und alle Benutzer sind 5. 80% der Benutzer mit UnfÀllen haben eine unterdurchschnittliche Geschwindigkeit, dh 80% der Benutzer mit UnfÀllen fahren schlechter als der Durchschnitt.


Abbildung 10. Bewertungsergebnisse

Ein Ă€hnliches Modell wird normalerweise bei der Berechnung der Fahrbewertung anhand von Telematikdaten verwendet. Aufgrund der Ergebnisse kann der Zugang zu Premium-Fahrzeugen oder zum Service im Allgemeinen eingeschrĂ€nkt sein. Es ist jedoch nicht das einzige und optimalste fĂŒr alle FĂ€lle.

Das im Artikel beschriebene Modell ist nicht perfekt fĂŒr die Vorhersage von UnfĂ€llen. In diesem Artikel haben wir nur einen Überblick ĂŒber die aktuellen Modelle im Carsharing gegeben. Im nĂ€chsten Teil werden wir ĂŒber das Modell der Bewegungsenergie sprechen, das speziell auf den Fahrstil (GeschwindigkeitsĂ€nderung, Manövrieren usw.) einwirkt.

Gepostet von Kirill Kulchenkov, kulchenkov32 , Unternehmensberater, Bright Box.

Source: https://habr.com/ru/post/de430558/


All Articles