Autos in den Niederlanden: Statistiken und Informationen für 2019

Hallo Habr.

Dieser Artikel ist eine Fortsetzung des Zyklus über Fahrradinfrastruktur in den Niederlanden . Dieses Mal werden wir über Autos sprechen.



Kürzlich konnte ich in einem der Projekte auf Daten von einer Kamera zugreifen, die Autonummern erkennt. Wenn Sie die Nummer kennen, erhalten Sie viele zusätzliche Informationen. Aber dann schien es ein wenig von diesen Daten, es wurde interessant, die gesamte Datenbank der niederländischen Autos als Ganzes zu verarbeiten, da es für die Öffentlichkeit offiziell zugänglich war .

Die Ergebnisse schienen interessant genug, um sie mit den Lesern zu teilen. Trotzdem gehören die Niederlande zu den zehn Ländern mit der höchsten Lebensqualität. Es war also sehr interessant zu sehen, was die Niederländer neben dem Fahrrad fahren.

Fortsetzung unter dem Schnitt.

Ausgangsdaten


Die Statistik gliedert sich in zwei Teile - lokale Tests und allgemeine Daten. Im ersten Fall wurde eine professionelle AXIS-Überwachungskamera als Datenquelle verwendet, die die Möglichkeit zur integrierten Kennzeichenerkennung bietet. Die Zahl selbst ist für die Statistik nicht so interessant, die zusätzlichen Informationen, die daraus gewonnen werden können, sind viel interessanter. Und dies geschieht in den Niederlanden einfach auf der Website rdw.nl. Für jede Nummer können Sie kostenlos Informationen zum Auto abrufen, indem Sie eine einfache GET-Anfrage senden (z. B. können Sie die Zufallszahl H789GF sehen ). Es werden eine ganze Menge Daten zurückgegeben, einschließlich Herstellungsjahr, Kapazität, Katalogkosten usw. Und das ist schon interessanter.

Und schließlich wird im zweiten Teil die gesamte Basis betrachtet. Um die Charts nicht zu sperrig zu machen, werden nur Informationen für 2019 berücksichtigt - die aktuellsten Marken und Modelle der im letzten Jahr zugelassenen Autos.

Also fangen wir an.

Lokale Daten


Wie oben erwähnt, wurde im ersten Fall eine AXIS-Überwachungskamera verwendet, die die Fähigkeit besitzt, Autonummern zu erkennen. Die Kamera ist am Eingang des Bürozentrums installiert. Der Datensatz hier ist natürlich klein, aber sie haben das Interesse, dass es sich um echte Daten von Maschinen handelt, die von normalen Leuten, Vertretern der Mittelklasse, verwendet werden und in die IT-Mitarbeiter einbezogen werden können. LKWs könnten ebenfalls auf der Liste stehen, aber es gab nicht so viele, ich habe solche Modelle nicht speziell gefiltert.

Während der drei Arbeitstage der Kamera wurden 370 Aufzeichnungen gesammelt, auf denen sich ungefähr 100 Autos befanden. Aus all dem wurde ein Datensatz erstellt, der ungefähr so ​​aussieht:

car_id,datetime,manufacturer,model,year,price 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:38,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:32,BMW,BMW 5ER REIHE,2004.0, 47,2020-01-23 16:24:55,VOLVO,VOLVO 240 POLAR U9,1993.0, 47,2020-01-23 16:24:54,VOLVO,VOLVO 240 POLAR U9,1993.0, 

Die Namen der Felder sind meines Erachtens ohne Kommentar klar. Aus Datenschutzgründen entfernte Kennzeichen werden für unsere Analyse jedoch nicht benötigt.

Mal sehen, welche Daten mit Python und Pandas extrahiert werden können. Wer sich nicht für den Code interessiert, kann sofort durch den Text zu den Grafiken scrollen.

Schließen Sie die erforderlichen Komponenten an und laden Sie den Datensatz in Pandas:

 import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("license_plates.csv", quotechar='"') 

Wir interessieren uns für Automodelle, also wählen wir die erforderliche Teilmenge aus und entfernen Duplikate (für jede Passage des Autos erzeugt die Kamera 3-4 Ereignisse). Um die Anzeige von Diagrammen zu vereinfachen, sortieren wir den Datensatz nach Automodellen.

 df_cars = df[['car_id', 'manufacturer', 'model', 'year', 'price']] df_cars = df_cars.drop_duplicates() df_cars['year'] = df_cars["year"].map(int) df_cars['price'] = df_cars["price"].map(get_rounded, na_action=None).astype('Int64') df_cars['car'] = df_cars['model'] + '/' + df_cars['year'].apply(str) df_cars = df_cars.sort_values('manufacturer', ascending=True, inplace=False) 

Wir schreiben eine Hilfsdatenextraktionsfunktion in Form eines Histogramms:

 def extract_as_hist(dataframe, param: str): g = dataframe.groupby([param]) msg_count = g.size().reset_index(name='counts') grouped = g.mean().reset_index() grouped['counts'] = msg_count['counts'] return grouped[param].values, grouped['counts'].values 

Nun können Sie zu den interessantesten übergehen - den tatsächlichen Grafiken.

Hersteller


Sie können die Daten der Hersteller sehen:

 manufacturer, manufacturer_cnt = extract_as_hist(df_cars, 'manufacturer') plt.gca().invert_yaxis() plt.xticks(np.arange(min(manufacturer_cnt)-2, max(manufacturer_cnt)+2, 1.0)) plt.barh(manufacturer, manufacturer_cnt, label='Car Manufacturer') 

Diagramm:



Volkswagen ist auf dem ersten Platz mit einem spürbaren Vorsprung ausgeschieden, der zweite wird gleichmäßig von BMW, Mercedes und Volvo geteilt. Kein einziger VAZ wurde während des Tests bemerkt;)

Baujahr


Ich werde den Code nicht geben, es ist das gleiche. Sofort einplanen:



Wie Sie sehen, fahren die meisten Menschen Autos, die nicht älter als 5 Jahre sind, obwohl 10-jährige Autos nicht exotisch sind. Es gibt sogar einige Raritäten von 1993 und 1994. Es stellte sich heraus, dass es sich um den VOLVO 240 POLAR U9 bzw. den BMW 325I CABRIOLET E2 handelte.

Preise


Ich gebe Ihnen gleich eine Tabelle:



Wir sehen, dass der Großteil des Autos bei einem Durchschnittspreis von etwa 30.000 Euro einen sehr deutlichen Höchststand aufweist. Die Oberseite der Oberseite wird von TESLA MODEL X 2018 (120 K) und PORSCHE CAYENNE DIESEL 2014 (115 K) belegt. Das billigste Auto - 2012 PEUGEOT 107 für 5K.

Natürlich ist es unmöglich, mehr aus einem Datensatz von 100 Maschinen zu extrahieren - die Auswahl ist zu klein. Fahren wir mit dem nächsten Schritt fort - wir werden die Daten des gesamten Landes berücksichtigen.

Allgemeine Daten für Holland


Zuerst müssen Sie die gesamte Datenbank herunterladen, damit wir viel mehr Daten extrahieren können. Dateien sind auf der RDW-Seite verfügbar. Die Größe der CSV-Datei, die wir benötigen, beträgt ca. 7 GB.

Der Code hier ist ungefähr gleich, ich werde ihn nicht wiederholen, wir werden gleich zu den Ergebnissen kommen. Alle Grafiken beziehen sich auf Daten für 2019, für andere Jahre können diese auf Wunsch selbst ausgedruckt werden. Insgesamt wurden im Laufe des Jahres 672.000 Autos zugelassen, was ziemlich viel ist, wenn man bedenkt, dass die Gesamtbevölkerung der Niederlande 17 Millionen Menschen beträgt.

Hersteller


Die allgemeine Liste ist ziemlich lang, lassen Sie uns die ersten 30 abrufen.



Volkswagen belegt wie im lokalen Test mit großem Abstand den ersten Platz. Der Rest ist in der Grafik sichtbar. Von dem Interessanten ist Tesla zu bemerken, der ganz sicher in die Top 10 der 2019 gekauften Autos eingestiegen ist.

Übrigens, wenn Sie einen anderen Teil des Zeitplans erweitern, können Sie sehen, dass im Jahr 2019 in Lland Lada und UAZ gekauft oder importiert wurden, mit insgesamt etwa 10 Stück:



Wenn jemand es nicht glaubt - UAZ BUKHANKA , importiert im Mai 2019, der Katalogpreis beträgt 32385 Euro (ich verstehe hier wahrscheinlich etwas in Bezug auf die Preisgestaltung nicht, na ja). Insgesamt wurden in den Niederlanden seit Jahren 732 LADA-Fahrzeuge zugelassen:



Modell


Hier waren die Ergebnisse unerwartet. Den ersten Platz im Jahr 2019 belegt Tesla Model 3, von dem fast 30.000 registriert wurden. Der Rest ist in der Grafik sichtbar.



Hier ist natürlich nur ein Teil des Zeitplans, das Ganze wäre zu lang.

Farbe


In Bezug auf Farben gibt es nur wenige Möglichkeiten, auch ohne Übersetzung ist alles aus dem Bild ersichtlich.



Zuerst kommt Grau, dann Schwarz und Weiß, und im Allgemeinen ist die Auswahl an Farben gering. Übrigens, Airbrushing und verschiedene Kunstwerke werden in Holland vom Wort "vollständig" nicht akzeptiert, solche Autos auf den Straßen sind noch kein einziges Mal aufgetaucht.

Preis


Die nächste und recht interessante Kategorie ist der Preis.



Wie im lokalen Test sind die Daten ähnlich - die Spitze fällt bei Autos mit Kosten von 20-30K. Die Grafik geht weiter nach rechts und weiter - die Top 3 belegen VOLKSWAGEN TOUAREG , CAPRON T66 und AUDI A6 3.0 TDI zu einem Preis von 8,8 Millionen Euro.

Art des Autos


Diese Kategorie erwies sich als sehr interessant.



Die Oberseite ist ziemlich offensichtlich - Stationwagen (Station Wagon), Hatchback, MPV (Station Wagon) und Limousine. Eine andere Sache ist merkwürdig - die Kategorien "Limousine" (42 Autos), "Leichenwagen" (47 Autos) und "Krankenwagen" (153 Autos). Und das ist alles in der Kategorie „Privatwagen“ (wahrscheinlich verdienen diese 47 Leute in ihrer Freizeit mehr Geld, wenn sie mit einem Leichenwagen befördert werden, das ist schwer zu sagen). Übrigens, wenn sich jemand dafür interessiert, wie ein Leichenwagen aussieht (in Russland habe ich solche noch nie gesehen, obwohl ich vielleicht nicht darauf geachtet habe), das Foto unter dem Spoiler:
Foto

Quelle: Google

Wie in den Kommentaren angedeutet, ist eine sehr beliebte Kategorie von Personenkraftwagen der „ kampeerwagen“ , von denen 5604 im Jahr 2019 zugelassen wurden.

An dieser Stelle möchte ich mit den Grafiken schließen, es gab noch Ideen, um das Gewicht oder die Leistung zu sehen, aber der Artikel ist schon zu lang.

Schlussfolgerungen


Ehrlich gesagt bin ich kein Experte für Autos, daher wird es keine separaten Schlussfolgerungen geben. Der Datensatz steht jedem zur Verfügung, der möchte, er kann selbst Statistiken sammeln, der Text enthält wichtige Codefragmente.

Wenn jemand Daten für andere Länder hat, wäre es interessant zu vergleichen.

Source: https://habr.com/ru/post/de485426/


All Articles