السيارات في هولندا: إحصاءات ومعلومات لعام 2019

مرحبا يا هبر.

هذا المقال هو استمرار لدورة البنية التحتية للدراجات في هولندا . هذه المرة سنتحدث عن السيارات.



في الآونة الأخيرة ، في أحد المشاريع ، تمكنت من الوصول إلى البيانات من كاميرا تتعرف على أرقام السيارات. معرفة الرقم ، يمكنك الحصول على الكثير من المعلومات الإضافية. ولكن بعد ذلك بدا القليل من هذه البيانات ، أصبح من المثير للاهتمام معالجة قاعدة البيانات الكاملة للسيارات الهولندية ككل ، لأنها كانت مفتوحة للجمهور رسمياً.

كانت النتائج مثيرة للاهتمام بما يكفي لمشاركتها مع القراء. ومع ذلك ، تعد هولندا من بين أفضل 10 دول من حيث جودة الحياة ، لذلك كان من المثير للاهتمام معرفة ما يركبه الهولنديون إلى جانب الدراجات.

تابع تحت القطع.

مصدر البيانات


تنقسم الإحصاءات إلى قسمين - الاختبار المحلي والبيانات العامة. في الحالة الأولى ، تم استخدام كاميرا مراقبة AXIS احترافية كمصدر للبيانات ، والتي لديها القدرة على التعرف على لوحة ترخيص متكاملة. الرقم في حد ذاته ليس مثيرا للإحصاءات ، المعلومات الإضافية التي يمكن الحصول عليها منه أكثر إثارة للاهتمام. ويتم ذلك في هولندا ببساطة ، على موقع rdw.nl ، لأي رقم ، يمكنك الحصول على معلومات عن السيارة مجانًا عن طريق إرسال طلب GET بسيط (على سبيل المثال ، يمكنك رؤية الرقم العشوائي H789GF ). يتم إرجاع الكثير من البيانات ، بما في ذلك سنة الصنع والسعة وتكلفة الكتالوج ، وما إلى ذلك ، وهذا بالفعل أكثر إثارة للاهتمام.

وأخيرا ، في الجزء الثاني ، سيتم النظر في القاعدة بأكملها. من أجل عدم جعل المخططات ضخمة جدًا ، يتم اعتبار المعلومات فقط لعام 2019 - أحدث العلامات التجارية وطرز السيارات المسجلة خلال العام الماضي.

لذلك دعونا نبدأ.

البيانات المحلية


كما ذكر أعلاه ، في الحالة الأولى ، تم استخدام كاميرا مراقبة AXIS ، والتي لديها القدرة على التعرف على أرقام السيارات. تم تثبيت الكاميرا عند مدخل مركز المكتب. مجموعة البيانات هنا ، بطبيعة الحال ، صغيرة ، ولكن اهتمامهم هو أن هذه هي بيانات حقيقية من الآلات المستخدمة من قبل الناس العاديين ، وممثلي الطبقة الوسطى ، حيث يمكن إدراج العاملين في تكنولوجيا المعلومات. يمكن أن تكون الشاحنات أيضًا مدرجة في القائمة ، لكن لم يكن هناك الكثير منها ؛ لم أقوم بأي تصفية خاصة على هذه الطرز.

على مدار ثلاثة أيام من عمل الكاميرا ، تم جمع 370 سجلًا ، كان عدد قرابة 100 سيارة فيها. من كل هذا ، تم بناء مجموعة بيانات تبدو مثل هذا:

car_id,datetime,manufacturer,model,year,price 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 3,2020-01-23 16:57:26,PEUGEOT,PEUGEOT 206,2004.0, 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:39,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 26,2020-01-23 16:41:38,NISSAN,NISSAN NISSAN JUKE,2012.0,25965.0 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:33,BMW,BMW 5ER REIHE,2004.0, 21,2020-01-23 16:30:32,BMW,BMW 5ER REIHE,2004.0, 47,2020-01-23 16:24:55,VOLVO,VOLVO 240 POLAR U9,1993.0, 47,2020-01-23 16:24:54,VOLVO,VOLVO 240 POLAR U9,1993.0, 

أعتقد أن أسماء الحقول واضحة دون تعليق. تمت إزالة لوحات الترخيص لأسباب تتعلق بالخصوصية ، إلا أنه ليس هناك حاجة لتحليلنا.

دعونا نرى ما هي البيانات التي يمكن استخراجها باستخدام بايثون وبانداس. يمكن لأولئك الذين لا يهتمون بالشفرة التمرير عبر النص مباشرة إلى الرسوم البيانية.

قم بتوصيل المكونات الضرورية وتحميل مجموعة البيانات في Pandas:

 import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("license_plates.csv", quotechar='"') 

نحن مهتمون بطرازات السيارات ، لذلك نختار المجموعة الفرعية اللازمة ونزيل التكرارات (لكل مرور في السيارة ، تولد الكاميرا من 3 إلى 4 أحداث). لتوفير الراحة لعرض الرسوم البيانية ، نقوم بتصنيف مجموعة البيانات حسب طراز السيارة.

 df_cars = df[['car_id', 'manufacturer', 'model', 'year', 'price']] df_cars = df_cars.drop_duplicates() df_cars['year'] = df_cars["year"].map(int) df_cars['price'] = df_cars["price"].map(get_rounded, na_action=None).astype('Int64') df_cars['car'] = df_cars['model'] + '/' + df_cars['year'].apply(str) df_cars = df_cars.sort_values('manufacturer', ascending=True, inplace=False) 

نكتب وظيفة استخراج البيانات المساعدة في شكل رسم بياني:

 def extract_as_hist(dataframe, param: str): g = dataframe.groupby([param]) msg_count = g.size().reset_index(name='counts') grouped = g.mean().reset_index() grouped['counts'] = msg_count['counts'] return grouped[param].values, grouped['counts'].values 

الآن يمكنك المتابعة إلى الأكثر إثارة للاهتمام - الرسوم البيانية الفعلية.

الشركة المصنعة


تستطيع أن ترى البيانات على الشركات المصنعة:

 manufacturer, manufacturer_cnt = extract_as_hist(df_cars, 'manufacturer') plt.gca().invert_yaxis() plt.xticks(np.arange(min(manufacturer_cnt)-2, max(manufacturer_cnt)+2, 1.0)) plt.barh(manufacturer, manufacturer_cnt, label='Car Manufacturer') 

الجدول الزمني:



خرجت فولكس واجن في المقام الأول بهامش ملحوظ ، والثاني مقسوم بالتساوي على سيارات بي إم دبليو ومرسيدس وفولفو. لم يلاحظ أي VAZ واحدة أثناء الاختبار ؛)

سنة الصنع


لن أعطي الكود ، إنه نفس الشيء. جدولة على الفور:



كما ترون ، فإن معظم الناس يقودون سيارات لا يزيد عمرها عن 5 سنوات ، على الرغم من أن السيارات التي يبلغ عمرها 10 سنوات ليست غريبة. هناك بعض الندرة في عامي 1993 و 1994. اتضح أن يكون VOLVO 240 POLAR U9 و BMW 325I CABRIOLET E2 ، على التوالي.

أسعار


سأقدم لك مخططًا على الفور:



نرى أن الجزء الأكبر من السيارة لديه قمة واضحة للغاية بسعر متوسط ​​يبلغ حوالي 30 ألف يورو. يحتل الجزء العلوي من القمة TESLA MODEL X 2018 (120K) و PORSCHE CAYENNE DIESEL 2014 (115K). أرخص سيارة - 2012 بيجو 107 ل 5 K.

بالطبع ، من المستحيل استخراج المزيد من مجموعة بيانات من 100 جهاز - التحديد صغير جدًا. دعنا ننتقل إلى الخطوة التالية - سننظر في بيانات البلد بأكمله.

البيانات العامة لهولندا


تحتاج أولاً إلى تنزيل قاعدة البيانات بأكملها ، مما سيتيح لنا استخراج المزيد من البيانات. تتوفر الملفات على صفحة RDW ، وحجم ملف CSV الذي نحتاجه هو حوالي 7 جيجابايت.

الكود هنا هو نفسه تقريبا ، وأنا لن أكرر ذلك ، وسوف نذهب إلى النتائج الصحيحة. تتعلق جميع الرسوم البيانية ببيانات عام 2019 ، ولأعوام أخرى ، يمكن لأولئك الذين يرغبون في طباعتها طباعتها بأنفسهم. في المجموع ، تم تسجيل 672 ألف سيارة خلال العام ، وهو عدد كبير للغاية ، بالنظر إلى أن إجمالي سكان هولندا يبلغ 17 مليون شخص.

الشركة المصنعة


القائمة العامة طويلة جدًا ؛ فلنحصل على أول 30 قائمة.



كما هو الحال في الاختبار المحلي ، تأخذ فولكس واجن المركز الأول بهامش واسع. الباقي مرئي من الرسم البياني. من المثير للاهتمام ، يمكن ملاحظة تسلا ، التي دخلت بثقة أكبر 10 سيارات تم شراؤها في عام 2019.

بالمناسبة ، إذا قمت بزيادة جزء آخر من الجدول ، يمكنك أن ترى أنه في عام 2019 في Lland Lada و UAZ تم شراؤها أو استيرادها ، بإجمالي 10 قطع:



إذا لم يصدق أحد - UAZ BUKHANKA ، تم استيراده في مايو 2019 ، فإن سعر الكتالوج هو 32385 يورو (ربما لا أفهم شيئًا هنا في التسعير ، حسناً). وبشكل إجمالي في هولندا طوال جميع السنوات ، تم تسجيل ما يصل إلى 732 سيارة LADA:



نموذج


كانت النتائج هنا غير متوقعة. احتلت Tesla Model 3 المركز الأول في عام 2019 ، حيث تم تسجيل حوالي 30 ألفًا. الباقي مرئي من الرسم البياني.



هنا ، بالطبع ، جزء فقط من الجدول ، وكلها ستكون طويلة جدًا.

اللون


هناك خيارات قليلة من حيث الألوان ، كل شيء واضح من الصورة حتى بدون ترجمة.



يأتي اللون الرمادي أولاً ، ثم الأسود والأبيض ، وبشكل عام ، يكون اختيار الألوان صغيرًا. بالمناسبة ، لا يتم قبول الرش في الجو والفن المتنوع في هولندا من كلمة "تمامًا" ، فهذه السيارات في الشوارع لم تصادفها أبدًا ولو مرة واحدة.

السعر


الفئة التالية والمثيرة للاهتمام هي السعر.



كما هو الحال في الاختبار المحلي ، فإن البيانات متشابهة - تقع الذروة على السيارات بتكلفة تتراوح من 20 إلى 30 ألف. يستمر الرسم البياني إلى اليمين وإلى أبعد من ذلك - تحتل المراكز الثلاثة الأولى شركة فولكس واجن توارج وكابرون T66 و AUDI A6 3.0 TDI بسعر 8.8 مليون يورو.

نوع السيارة


تحولت هذه الفئة إلى أن تكون مثيرة للاهتمام للغاية.



الجزء العلوي واضح للغاية - stationwagen (عربة المحطة) ، هاتشباك ، MPV (عربة المحطة) وسيارة السيدان. شيء آخر مثير للفضول - فئات "ليموزين" (42 سيارة) ، "هارتسي" (47 سيارة) و "سيارة إسعاف" (153 سيارة). وهذا كله في فئة "السيارات الشخصية" (ربما يحصل هؤلاء الأشخاص البالغ عددهم 47 شخصًا على أموال إضافية في أوقات فراغهم عن طريق النقل على متن سيارة ، من الصعب القول). بالمناسبة ، إذا كان أي شخص مهتمًا بما تبدو عليه قلوب الركاب (في روسيا ، لم أر مثل هذه الأشياء أبدًا ، على الرغم من أنني ربما لم أكن قد اهتمت بها) ، الصورة تحت المفسد:
صور

المصدر: جوجل

كما هو موضح في التعليقات ، هناك فئة شعبية من السيارات الشخصية هي "العربة" ( kampeerwagen ) ، تم تسجيل 5604 منها في عام 2019.

حول هذا سأنتهي بالرسوم البيانية ، لا تزال هناك أفكار لمعرفة الوزن أو القوة ، لكن المقالة طويلة جدًا بالفعل.

النتائج


بصراحة ، لست خبيراً في السيارات ، لذلك لن تكون هناك استنتاجات منفصلة. مجموعة البيانات متاحة لكل من يريد ، ويمكنهم جمع إحصائيات من تلقاء أنفسهم ، وهناك شظايا رمز رئيسية في النص.

إذا كان لدى شخص ما بيانات عن بلدان أخرى ، فسيكون من المثير للاهتمام المقارنة.

Source: https://habr.com/ru/post/ar485426/


All Articles