Mobil di Belanda: statistik dan informasi untuk 2019

Hai, Habr.

Artikel ini merupakan kelanjutan dari siklus tentang infrastruktur sepeda di Belanda . Kali ini kita akan berbicara tentang mobil.



Baru-baru ini, di salah satu proyek, saya dapat mengakses data dari kamera yang mengenali nomor mobil. Mengetahui nomornya, Anda bisa mendapatkan cukup banyak informasi tambahan. Tapi kemudian tampak sedikit dari data ini, menjadi menarik untuk memproses seluruh database mobil Belanda secara keseluruhan, karena secara resmi terbuka untuk umum .

Hasilnya tampak cukup menarik untuk dibagikan kepada pembaca. Meski demikian, Belanda termasuk di antara 10 negara teratas dalam hal kualitas hidup, sehingga sangat menarik untuk melihat apa yang dikendarai Belanda selain sepeda.

Berlanjut di bawah potongan.

Sumber data


Statistik dibagi menjadi dua bagian - pengujian lokal dan data umum. Dalam kasus pertama, kamera pengintai profesional AXIS digunakan sebagai sumber data, yang memiliki kemampuan untuk pengakuan plat nomor terintegrasi. Angka itu sendiri tidak begitu menarik untuk statistik, informasi tambahan yang dapat diperoleh darinya jauh lebih menarik. Dan ini dilakukan di Belanda secara sederhana, di situs web rdw.nl, untuk nomor apa pun, Anda dapat memperoleh informasi tentang mobil secara gratis dengan mengirimkan permintaan GET sederhana (misalnya, Anda dapat melihat nomor acak H789GF ). Cukup banyak data yang dikembalikan, termasuk tahun pembuatan, kapasitas, biaya katalog, dll. Dan ini sudah lebih menarik.

Dan akhirnya, di bagian kedua, seluruh pangkalan akan dipertimbangkan. Agar grafik tidak terlalu besar, hanya informasi untuk 2019 yang dipertimbangkan - merek dan model mobil terbaru yang terdaftar selama setahun terakhir.

Jadi mari kita mulai.

Data lokal


Seperti disebutkan di atas, dalam kasus pertama, kamera pengintai AXIS digunakan, yang memiliki kemampuan untuk mengenali nomor mobil. Kamera dipasang di pintu masuk ke pusat kantor. Kumpulan data di sini, tentu saja, kecil, tetapi minat mereka adalah bahwa ini adalah data nyata dari mesin yang digunakan oleh orang-orang biasa, perwakilan kelas menengah, di mana pekerja TI dapat dimasukkan. Truk juga mungkin ada dalam daftar, tetapi jumlahnya tidak banyak, saya tidak melakukan pemfilteran khusus pada model seperti itu.

Selama 3 hari kerja kamera, 370 catatan dikumpulkan, di mana terdapat sekitar 100 mobil. Dari semua ini, sebuah dataset dibangun yang terlihat seperti ini:

car_id,datetime,manufacturer,model,year,price 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:38,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:32,BMW,BMW 5ER REIHE,2004.0, 47,2020-01-23 16:24:55,VOLVO,VOLVO 240 POLAR U9,1993.0, 47,2020-01-23 16:24:54,VOLVO,VOLVO 240 POLAR U9,1993.0, 

Nama bidang, saya pikir, jelas tanpa komentar. Pelat lisensi dihapus karena alasan privasi, namun untuk analisis kami tidak diperlukan.

Mari kita lihat data apa yang bisa diekstraksi menggunakan Python dan Pandas. Mereka yang tidak tertarik dengan kode dapat langsung menggulir teks ke grafik.

Hubungkan komponen yang diperlukan dan muat dataset ke Pandas:

 import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("license_plates.csv", quotechar='"') 

Kami tertarik pada model mobil, jadi kami memilih subset yang diperlukan dan menghapus duplikat (untuk setiap bagian mobil, kamera menghasilkan 3-4 acara). Untuk kenyamanan menampilkan grafik, kami mengurutkan dataset berdasarkan model mobil.

 df_cars = df[['car_id', 'manufacturer', 'model', 'year', 'price']] df_cars = df_cars.drop_duplicates() df_cars['year'] = df_cars["year"].map(int) df_cars['price'] = df_cars["price"].map(get_rounded, na_action=None).astype('Int64') df_cars['car'] = df_cars['model'] + '/' + df_cars['year'].apply(str) df_cars = df_cars.sort_values('manufacturer', ascending=True, inplace=False) 

Kami menulis fungsi ekstraksi data tambahan dalam bentuk histogram:

 def extract_as_hist(dataframe, param: str): g = dataframe.groupby([param]) msg_count = g.size().reset_index(name='counts') grouped = g.mean().reset_index() grouped['counts'] = msg_count['counts'] return grouped[param].values, grouped['counts'].values 

Sekarang Anda dapat melanjutkan ke yang paling menarik - grafik yang sebenarnya.

Pabrikan


Anda dapat melihat data di produsen:

 manufacturer, manufacturer_cnt = extract_as_hist(df_cars, 'manufacturer') plt.gca().invert_yaxis() plt.xticks(np.arange(min(manufacturer_cnt)-2, max(manufacturer_cnt)+2, 1.0)) plt.barh(manufacturer, manufacturer_cnt, label='Car Manufacturer') 

Bagan:



Volkswagen tersingkir di tempat pertama dengan margin yang nyata, yang kedua dibagi secara merata oleh BMW, Mercedes dan Volvo. Tidak ada satu pun VAZ yang diperhatikan selama tes;)

Tahun pembuatan


Saya tidak akan memberikan kodenya, sama saja. Jadwalkan segera:



Seperti yang Anda lihat, kebanyakan orang mengendarai mobil tidak lebih dari 5 tahun yang lalu, meskipun mobil berusia 10 tahun tidak eksotis. Bahkan ada beberapa keanehan tahun 1993 dan 1994. Ternyata VOLVO 240 POLAR U9 dan BMW 325I CABRIOLET E2, masing-masing.

Harga


Saya akan segera memberi Anda bagan:



Kita melihat bahwa sebagian besar mobil memiliki puncak yang sangat jelas dengan harga rata-rata sekitar 30K Euro. Bagian atas ditempati oleh TESLA MODEL X 2018 (120K) dan PORSCHE CAYENNE DIESEL 2014 (115K). Mobil termurah - 2012 PEUGEOT 107 untuk 5K.

Tentu saja, tidak mungkin untuk mengekstrak lebih banyak dari dataset 100 mesin - pemilihannya terlalu kecil. Mari beralih ke langkah berikutnya - kami akan mempertimbangkan data seluruh negara.

Data umum untuk Belanda


Pertama, Anda perlu mengunduh seluruh basis data, yang akan memungkinkan kami untuk mengekstrak lebih banyak data. File tersedia di halaman RDW , ukuran file CSV yang kita butuhkan adalah sekitar 7 GB.

Kode di sini hampir sama, saya tidak akan mengulanginya, kami akan langsung ke hasil. Semua grafik berhubungan dengan data untuk 2019, untuk tahun-tahun lain, mereka yang ingin dapat mencetaknya sendiri. Secara total, 672 ribu mobil terdaftar selama tahun ini, yang cukup banyak, mengingat bahwa seluruh penduduk Belanda adalah 17 juta orang.

Pabrikan


Daftar umumnya cukup panjang, mari kita dapatkan 30 pertama.



Seperti dalam tes lokal, Volkswagen menempati posisi pertama dengan selisih yang lebar. Sisanya terlihat dari grafik. Dari yang menarik, Tesla dapat dicatat, yang cukup percaya diri masuk dalam 10 mobil teratas yang dibeli pada 2019.

Omong-omong, jika Anda menambah bagian lain dari jadwal, Anda dapat melihat bahwa pada 2019 di Lland Lada dan UAZ dibeli atau diimpor, dengan total sekitar 10 buah:



Jika ada yang tidak percaya - UAZ BUKHANKA , diimpor pada Mei 2019, harga katalognya adalah 3.385 Euro (saya mungkin tidak mengerti sesuatu dalam hal harga, oh well). Dan secara total di Belanda selama bertahun-tahun sebanyak 732 mobil LADA telah terdaftar:



Model


Di sini hasilnya tidak terduga. Tempat pertama pada tahun 2019 ditempati oleh Tesla Model 3, yang hampir 30 ribu terdaftar. Sisanya terlihat dari grafik.



Di sini, tentu saja, hanya sebagian dari jadwal, keseluruhannya akan terlalu lama.

Warna


Ada beberapa pilihan dalam hal warna, semuanya jelas dari gambar bahkan tanpa terjemahan.



Abu-abu lebih dulu, kemudian hitam dan putih, dan secara umum, pilihan warnanya kecil. Ngomong-ngomong, airbrushing dan berbagai karya seni tidak diterima di Belanda dari kata "sepenuhnya", mobil-mobil seperti itu di jalanan tidak pernah bertemu sekali pun.

Harga


Kategori berikutnya, dan cukup menarik adalah harga.



Seperti dalam tes lokal, datanya serupa - puncaknya jatuh pada mobil dengan biaya 20-30K. Grafik berlanjut ke kanan dan selanjutnya - 3 teratas ditempati oleh VOLKSWAGEN TOUAREG , CAPRON T66 dan AUDI A6 3.0 TDI dengan harga 8,8 juta Euro.

Jenis mobil


Kategori ini ternyata cukup menarik.



Bagian atas cukup jelas - stationwagen (station wagon), hatchback, MPV (station wagon) dan sedan. Hal lain yang membuat penasaran - kategori "limusin" (42 mobil), "mobil jenazah" (47 mobil) dan "ambulans" (153 mobil). Dan ini semua masuk dalam kategori "mobil pribadi" (mungkin 47 orang ini mendapatkan uang tambahan di waktu luang dengan kereta di mobil jenazah, sulit dikatakan). Ngomong-ngomong, jika ada yang tertarik dengan apa yang terlihat seperti mobil jenazah penumpang (di Rusia saya belum pernah melihat mobil seperti itu, walaupun saya mungkin tidak memperhatikannya), foto di bawah spoiler:
Foto

Sumber: Google

Seperti yang disarankan dalam komentar, kategori mobil pribadi yang agak populer adalah "kemping" ( kampeerwagen ), 5604 di antaranya terdaftar pada 2019.

Pada ini saya akan berakhir dengan grafik, masih ada ide untuk melihat berat atau kekuatan, tetapi artikelnya sudah terlalu lama.

Kesimpulan


Terus terang, saya bukan ahli dalam mobil, jadi tidak akan ada kesimpulan terpisah. Dataset tersedia untuk semua orang yang ingin, mereka dapat mengumpulkan statistik sendiri, ada fragmen kode kunci dalam teks.

Jika seseorang memiliki data untuk negara lain, akan menarik untuk membandingkan.

Source: https://habr.com/ru/post/id485426/


All Articles