عينة شجرة الانحدار لبيانات كأس العالم 2002-2014. يتم استخدام عدد الأهداف كمتغير استجابة.قارن خبراء التعلم الآلي من ألمانيا
ثلاثة نماذج مختلفة للتنبؤ بنتائج كأس العالم 2018 FIFA المستقبلية:
- نماذج انحدار بواسون.
- طرق الغابات العشوائية
- طرق التصنيف (وفقًا لقوة الفرق القائمة على السجال للفترة 2010-2018 ووفقًا للمعاملات في مكاتب المراهنات).
يعتمد الأولين على معلومات حول المتغيرات المشتركة ، وآخرها مباشرة على القوة الفعلية الفعلية للفرق. توصل العلماء إلى استنتاج مفاده أنه في إطار هذه المقارنة ، فإن طرق التنبؤ الأكثر فعالية لبيانات التدريب هي طرق الترتيب والغابات العشوائية. ولكن باستخدام نهج مشترك - يجمع بين خصائص الغابات العشوائية مع ترتيب الفريق - تمكن العلماء من تحسين القدرة التنبؤية للنظام بشكل كبير.
اختار الباحثون هذا المزيج من الأساليب كنموذج نهائي. بناءً على تقييماتها ، تم تصميم جميع مباريات كأس العالم 2018 بشكل متكرر. يتم احتساب احتمالات كل مباراة ، واحتمالات مرور كل فريق في كل مرحلة تالية من البطولة ، والنتائج الأكثر احتمالا للدورة.
لاحظ المؤلفون أن الصحافة العلمية نشرت في السابق العديد من النماذج الناجحة التي تتنبأ بنتائج البطولات العالمية والأوروبية. كما استخدم مطورو هذه النماذج النظام للتنبؤ بنتيجة كأس العالم 2018.
لذا ، فإن نموذج الكمبيوتر الخاص بـ Zeileis و Leitner و Hornik (2018) يعطي أعلى احتمال إحصائي للنصر للبرازيل (16.6٪) وألمانيا (15.8٪) وإسبانيا (12.5٪).
حسب نموذج الخبراء من البنك السويسري UBS (Audran ، Bolliger ، Kolb ، Mariscal ، Pilloud ، 2018) ألمانيا (24.0٪) ، البرازيل (19.8٪) وإسبانيا (16.1٪) كأكثر الفائزين احتمالًا. استخدم هذا النموذج الإحصائي أربعة عوامل كمدخل ، وبعد ذلك تم حساب الاحتمالات من 10000 محاكاة مونت كارلو.
طريقة الغابات العشوائية هي نهج جديد بشكل أساسي. خوارزمية الشجرة العشوائية هي استخدام مجموعة من الأشجار الحاسمة. هذا يجمع بين طريقة التعبئة وطريقة الفضاء الجزئي العشوائي لمهام التصنيف والانحدار والتجميع. بعبارة أخرى ، إنه مناسب تمامًا للتنبؤ بمباريات كأس العالم 2018. الفكرة الرئيسية لطريقة الشجرة العشوائية هي استخدام مجموعة كبيرة من أشجار القرار ، كل منها في حد ذاته يعطي تصنيفًا منخفضًا جدًا للجودة ، ولكن نظرًا لعددها الكبير ، تكون النتيجة جيدة.
حلل الخبراء الألمان بعناية جميع النماذج المقترحة وقوتهم التنبؤية النهائية. ثم تم تحديد عوامل تنبؤية محددة تزيد من القدرة التنبؤية للنموذج. في النهاية ، بعد هذا العمل التحضيري ، طبق العلماء النموذج المصمم (الغابات العشوائية + الترتيب) على بيانات كأس العالم 2018.
لكل مباراة ، يمكن أن يعطي النموذج العدد المتوقع من الأهداف التي سجلها كل فريق. بناءً على هذه المعلومات ، تم حساب نتيجة جميع المباريات الـ 48 في دور المجموعات. تم احتساب المركز النهائي للفرق في مجموعات بما يتفق بدقة مع لوائح FIFA. ثم ، بنفس الطريقة ، قاموا بحساب نتائج المباريات في مرحلة التصفيات. لمراعاة الوقت الإضافي الذي يمنحه البرنامج ، تم ضرب النتيجة بعدد الأهداف التي سجلها كل فريق في 1.33. إذا تم تحديد نتيجة السحب الإضافي مرة أخرى ، فإن البرنامج يحاكي سلسلة من العقوبات عن طريق "رمي قطعة نقدية".
تم استخدام هذه الاستراتيجية لـ 100.000 محاكاة لجميع مباريات البطولة. بناءً على هذه البيانات ، تم حساب احتمال مغادرة المجموعة والفوز بالبطولة.
وبحسب نتائج دور المجموعات ، أعطى البرنامج الصورة التالية:

يتمتع الفريق الروسي بفرصة عالية إلى حد ما للوصول إلى نهائيات 1/8 (50.4٪) ، ولكن يجب أن يلتقي هناك مع الفريق الإسباني ، حيث من المرجح أن يفوز 87٪ بالنهائي. يوضح الجدول شبكة البلاي اوف الأكثر احتمالية لمائة ألف محاكاة.

تبلغ فرص روسيا الإجمالية في الوصول إلى ربع النهائي 10.5٪ ، ونصف النهائي 2.4٪ ، والنهائي 0.4٪.

بالنسبة للفائز في البطولة ، أنتج هذا النموذج نتيجة مختلفة عن نتيجة برامج النمذجة السابقة. أعطت أقصى احتمال لإسبانيا (17.8٪). ويليه ألمانيا والبرازيل وفرنسا وبلجيكا.
تم
نشر المقال العلمي في 8 يونيو 2018 على موقع ما قبل الطباعة arXiv.org (arXiv: 1806.03208v3).