لقد حان الوقت لمتابعة المقال السابق حول دراسة تحويلات كرة القدم.
هذه المرة سوف تكتشف السبب كلوب إن Simeone رائع للغاية في اختيار من يتعامل كوكلاء إذا كنت لاعب كرة قدم ولماذا تقرأ كل هذا إذا لم تكن مهتمًا بكرة القدم.
لقد تعلمنا أن نجمع الكثير من البيانات.
انظر حولك ، على سبيل المثال ، في العمل ، أنا متأكد من أنك ستجد هذه اللوحة أو تلك ، مثل البيانات الضرورية المتبقية لاحقًا ، "عندما نفهم ما يجب القيام به معها". هذا جزئيًا لأن التبعيات الموجودة فيها غير خطية وغير بديهية للغاية. وأريد فقط أن أفهم أيٍّ من هذه البيانات يجب أن يولي أكبر قدر من الاهتمام لها ، والتي أثرت في الأهم على النتيجة. علاوة على ذلك ، سأوضح على سبيل المثال كيفية استخدام واحدة من أبسط الخوارزميات التي تسمح بذلك.
يمكنك العثور على نظام التشغيل نفسه ، وكذلك النتائج الكاملة في هذا الكمبيوتر المحمول ، وتوجد أدناه العديد من الرسوم البيانية مع أكثرها إثارة للاهتمام.
ولكن أولا ، قليلا عن الطريقة.
تخيل أنك لا تعمل مع تحويلات كرة القدم ، لكن لديك بيانات عن مبيعات سلع المتجر (جيدًا ، أو مثالًا أقل تجسيدًا - مع نتائج المباريات في لعبتك التي تشبه لعبة MOBA) والكثير من المعلومات الأساسية: حول المتجر والسلع والبائعين ( جيدًا ، أو عن الأبطال المختارين واللاعبين وقوتهم) ، إلخ. ثم تريد تحقيق نتيجة محددة للغاية - لزيادة مبيعات منتج معين (أو تحسين توازن لعبتك).
في أي حال ، الخطة بسيطة:
- فهم أي من العوامل تؤثر بشدة على النتيجة النهائية (عدد السلع المباعة أو نسبة الانتصارات لشخصية معينة في اللعبة) وكيف
- فهم أي من هذه الخيارات يمكنك التأثير عليها حقًا
- ركز على ما هو مهم (ص 1) وما الذي يمكن تغييره (ص 2)
كل شيء بسيط ، يبقى فقط التعامل مع الفقرة 1.
في الواقع ، هذه المهمة أبعد ما تكون عن الجديدة ومن السهل جدًا حلها دون استخدام أي شبكات عصبية ، باستخدام الإحصاءات القديمة الجيدة فقط ... إذا كان لديك بيانات Magnet. أو جامعة الأساطير. ولكن هناك فرصة كبيرة لذلك: أن تكون شبكة تضم اثنين من المتاجر ، وهي لعبة ذات شعبية معتدلة ، وببساطة ليس لديك الكثير من البيانات التي يمكنك استخدامها. نعم ، يقوم LoL بتجميع نتائج ملايين المباريات ، وسيكون هناك العديد من مجموعات المعلمات التي يمكنك من خلالها مقارنة كيفية تأثير اختيار شركائه على انتصار بطل معين ، وكل الأشياء الأخرى متساوية من الناحية العملية. مع نقص البيانات ، يتعين على المرء أن يقارن التفاح بالبرتقال - ببساطة ليس لدينا حالات معزولة كافية.
لتبسيط الموقف ، من أجل فهم كيف ، على سبيل المثال ، تؤثر مجموعة مطابقة الخريطة على احتمال الفوز باللعبة ، من الناحية المثالية ، يجب أن يكون لديك عدة آلاف من النتائج التي تكون فيها جميع المعلمات باستثناء المعلمات التي تهمنا هي نفسها. هذا هو ، بحيث يلعب نفس اللاعبين الذين لديهم نفس مستوى المهارة نفس البطل على خرائط مختلفة مع خصوم مختلفين. هذا صعب التحقيق إذا لم تكن ألعاب الشغب .
لكن العودة إلى التحويلات. تخيل أننا نريد أن نتحرى عن معلمة واحدة - "وكيل كرة قدم" ، على سبيل المثال ، من أجل فهم الشركة التي من الأفضل أن يصبح لاعب كرة قدم عميلاً لها. من الواضح أننا يجب أن نذهب إلى الوكيل الذي ينظم بيع اللاعب الأكثر تكلفة . إذا طبقنا الأساليب الإحصائية القياسية ، فسنرى أن GestiFute هي الشركة الأكثر نجاحًا في بيع عملائها ، وهو ما يتوافق تمامًا مع سمعتها. ولكن كيف يمكننا فصل مهارة البيع عن قوة اللاعب نفسه؟ بعد كل شيء ، ليس من الصعب البيع باهظ الثمن إذا كان عملائك هم ديكو وداني وبيبي ودييغو كوستا وشخص متواضع اسمه كريستيانو . بأمانة ، لا يمكنك مقارنة الوكالات إلا إذا تم منحهم جميعًا نفس مجموعة اللاعبين (سواء كانت جيدة أو غير جيدة) واضطروا إلى بيعها إلى نفس الأندية. لكن هذا الكون المتعدد يصعب تخيله في الحياة الواقعية . لكن لدينا نموذجًا يعطي النتيجة (تكلفة النقل) لأي مجموعة بيانات. نعم ، حتى لو أجبرتها على حساب تكلفة نقل Gogua من Tambov إلى CSKA ، إذا تم تنفيذها بواسطة Jorge Mendes. وغلوشاكوفا في أخمات وآزار بالريال وكل الباقي. ثم تفعل نفس الخدعة مع جميع المكاتب الأخرى. ظروف متساوية تماما. ثم يبقى فقط لحساب سعر مجموعة اللاعبين بالكامل لكل وكالة ، وهنا لدينا الإجابة على سؤال حول مقدار عضوية العلامة التجارية ، على سبيل المثال GestiFute ، يزيد سعر اللاعب .
وهذا هو ، قمنا بتحليل كيف تعتمد المعلمة الهدف على آخر تم تعيينه مسبقًا بمعزل ، وفقط .
وهذا ما يسمى التبعية الجزئية.
ولذا فمن الممكن تحليل أي معلمة ، وهو ما سنفعله الآن.
عمر
أول شيء قمت بتعيين الخوارزمية له هو عمر لاعب كرة القدم وحصلت على هذه الصورة

هي ، يجب أن يقال ، أغرقتني في الحزن. لأنه لا يتفق مطلقًا مع حدسي. هناك شيء ما مكسور هنا. أعلم جيدًا أن التكلفة القصوى للاعبين تبلغ ذروتها بحوالي 25-27 عامًا ، وأن اللاعبين في عمر 17 عامًا هم بالتأكيد ليسوا الأغلى. كما كنت مقتنعا ببناء اعتماد بسيط من البيانات المصدر ، دون أي نموذج.

نعم ، هذا صحيح ، هكذا تتصرف تكلفة اللاعبين حسب العمر ، وهو سنام واسع.
ولكن بعد التفكير قليلاً في ما رسمه النموذج بالنسبة لي ، أدركت أنها كانت على حق. كانت هذه هي اللحظة التي اعتقدت فيها أنها تعمل حقًا ، وأن هناك شيئًا ما فيها. أعطاني النموذج ، للوهلة الأولى ، نتيجة غير متوقعة ، لكنها صحيحة بشكل متناقض ، وسمح لي أن أنظر إلى موضوع الدراسة قليلاً من الجانب الآخر.
ماذا نرى على الرسم البياني الأول ولماذا اعتدنا على الثاني؟
في الواقع ، من الصعب للغاية ربط تكلفة النقل مع عمر اللاعب الذي يستخدم البيانات الأولية فقط. بعد كل شيء ، لماذا يصبح اللاعب أغلى من سن 25؟ هل لأنه يكبر؟ لا ، إنه يلعب فقط المزيد من المباريات ، ويسجل أكثر ، ويبدأ اللعب للمنتخب الوطني ، ويصبح أكثر شعبية بين المشجعين في النهاية ، وما إلى ذلك ، كل هذا ، بالطبع ، يبدو كما لو كان كاملاً مع التقدم في السن واكتساب الخبرة ، ولكن كل هذا لدينا معايير منفصلة. وعلى الرسم البياني الأول ، نرى الاعتماد فقط على العمر ، في سيناريو مثالي ، عندما يكون كل شيء آخر هو نفسه. بالطبع ، في هذه الحالة ، فإن اللاعب الذي سجل 20 هدفًا في الموسم الماضي لناديه يلعب بانتظام للمنتخب الوطني ، وهو في سن 19 عامًا سيكلف أكثر من نفس اللاعب تمامًا بنفس المؤشرات ، ويلعب في نفس المكان ، ولكن في 25!
ومن المثير للاهتمام هنا أيضًا أن منحنى المنحنى إلى 25 عامًا لطيف تمامًا ، بينما بعد هذا العصر كان هناك ببساطة انهيار. سيكون من المثير للاهتمام التفكير في سبب وجود مثل هذا الاختلاف المذهل؟
الموسم
أقترح مقارنة النمو "المقطر" في قيمة اللاعبين في المواسم

يمكنك أن ترى بوضوح كيف نجت من ارتفاع درجة حرارة سوق التسعينات والأزمة المالية في بداية العشرينيات ، فإن الرسم البياني يذهب بثقة إلى منحنى النمو الأسي.
لكن نفس المخطط مبني فقط على البيانات. لاحظ كيف أقل وضوحا النمو في قيمة اللاعبين في السنوات الأخيرة

المعلمات ذات الصلة
تعد الوكالة والعمر والموسم ، بدرجة أقل ، أمثلة على فئات مستقلة نادرة إلى حد ما من المعلمات. في النهاية ، يمكنك بسهولة تخيل كيف ينتقل اللاعب من وكالة إلى أخرى ، وسيكون لهذا تأثير ضئيل على المعايير الأخرى. ولكن دعنا نقول أننا نريد أن نفهم أي من مشتر النادي يجب أن يدفع أكثر للاعبين. يمكنك أن تأخذ معلمة واحدة to_club_name
وتحسب النتيجة. ولكن من الصعب علينا بالفعل ألا نأخذ في الاعتبار القيم ذات الصلة to_clb_lg_name
، to_clb_lg_country
، to_clb_lg_group
، والتي تعرض الدوري الذي يلعبه هذا النادي. نعم ، يمكننا الفصل بينهما ومعرفة ما هي تكلفة شراء Man Utd للاعبين فقط بسبب قوة علامته التجارية ، ومقدار "الهامش الإنجليزي" بشكل منفصل ، لكننا مهتمون في الغالب بالنتيجة المدمجة. في النهاية ، لا تخطط مانشستر للانتقال إلى أي مكان من إنجلترا ، لذلك سنبحث على الفور في مجموعة من المعايير.
ما هي الأرقام في الرسوم البيانية؟الرقم بعد "العمود" هو معامل مقدار زيادة هذه المعلمة لسعر النقل بالنسبة إلى المتوسط
يشير الرقم الموجود داخل "العمود" ، وكذلك تدرج اللون ، إلى عدد عمليات النقل باستخدام هذه المعلمة
نادي المشتري

حقيقة أنه من بين 20 مشتريًا كرمًا من 18 ناديًا إنجليزيًا وناديًا ملكيًا واحدًا من مدينة مدريد لا يفاجئني حقًا ، لكن المركز الثالث (!) لمخاشكالا أنجي يظهر مرة أخرى أنه يستحق جائزة في ترشيح " Party Like A Russian ".
بالمناسبة ، نادٍ واحد فقط من هذه القائمة لم يعد موجودًا.

إذا كان antitope أعلى من ذلك ، فلدينا هنا أندية تتيح لك علامتها التجارية ، على العكس من ذلك ، شراء نفس اللاعبين أرخص من السوق. استولت عليها البلجيكيين !
أين البرتغاليون؟ - أنت تسأل. قريبا سيكون كل شيء ، - سأجيب عليك ونفسي.
بائع النادي

الأندية التي تبيع أكثر من غيرها. يرضي المركز الثاني من عمال المناجم (الاحترام عن جدارة) ؛ وجود معظم قمم البرازيل والأرجنتين واضح ؛ اشبيلية. وأخيرا بنفيكا ، مع أكبر عدد من المبيعات.
لكن الأكثر إثارة للاهتمام ، بالطبع ، سيكون إلقاء نظرة فاحصة على أتالانتا. من الذي باعتها بشكل جيد في السنوات العشر الماضية؟ هكذا أيضا في كمية أقل من خمسين قطعة؟ اسمحوا لي أن أذكركم بأن بيانات الفترة 2008-2018 بعيدة عن Atalanta اليوم لعبة ورق جاسبريني ودوري الأبطال!

وبصفتهم غرباء ، الهولنديون ، فقد كان الأمر يتعلق بهم في تلك الأيام فقط ، حيث قالوا إنه يمكن شراء اللاعبين من أصحاب الجودة العالية. وفجأة ، زينيث مع فولفسبورج ...
أداء النادي
نظرًا لأن لدينا بيانات عن أولئك الذين يبيعون الأغلى ثمنا يشترون أرخص ، فلا يسعنا إلا أن نرى من لديه هذا الاختلاف ، من حيث النسبية ، هو الأكبر.

صورة مثيرة للاهتمام بشكل رهيب. البلجيكيون والأرجنتينيون مع البرازيليين ، الذين يستحقون بوضوح إلقاء نظرة فاحصة على بشكتاش مع ألكمار ، وأخيرا بنفيكا وبورتو مع أكثر الصفقات.
من الجدير بالذكر أندرلخت - أفضل 10 شركات في القائمة وأكثر من 100 عملية نقل.

مرة أخرى تم القبض على antitope ، هذه المرة من حيث "الكفاءة" ، من قبل البريطانيين مع برشلونة الصغيرة المتخللة. 0.5 في مانشستر يونايتد مخيف فقط.
من الضروري هنا أن نقول إن أي بيانات تظهر فقط ما تعرضه. في هذه الحالة ، هذه هي "الرسوم الإضافية للنادي" عند الشراء مقسومة على "الرسوم الإضافية للنادي" عند البيع.
لا عجب أنني أخذت "الكفاءة" في علامات الاقتباس. أفضل الأندية في العالم لا يمكنها أن ترفض قمة "الفعالية" ، فلم تكن مهمتها بيع اللاعبين بأعلى سعر ممكن ، بل أخذ أفضل سنوات حياتهم المهنية ، والضغط الأقصى ، وتحويلهم إلى نتيجة النادي. يمكن للاعب المتميز في نادٍ رفيع أن يستبدل بديلاً لسنوات فقط ، لكن هذا سيخفض سعره ، لكن إذا كان ذلك ضروريًا للنادي ، فسوف يفعل ذلك. إذا قام النادي الأعلى ببيع اللاعب للفلاح الأوسط (وهذا يؤثر على الجدول أكثر لأن التحول من الأعلى إلى الأعلى لا يغير الرصيد الكلي تقريبًا) ، فغالبًا ما يعني هذا أنه لم ينجح في الاختبار (جيدًا ، أو عادة ما يبدو ذلك) ، ما الذي سيبيعه مرة أخرى سيكون الأمر أكثر صعوبة في نادي كبير آخر (أي أنها تضخّم سعر اللاعب).
هذا يعني ، من حيث "الكفاءة" في هذا الرسم البياني ، إذا كان من المنطقي المقارنة ، عندها فقط الأندية من نفس الفئة (أفضل الأندية ، المانحين ، الأندية البلجيكية :) ، إلخ)

مثل على سبيل المثال هنا - "فعالية" الأندية الروسية. ومن المتوقع جدا القيادة CSKA. فوجئ سبارتاك حتى تذكرت أنهم ما زالوا يبيعون لاعبيهم بشكل جيد. على سبيل المثال ، تمكنوا من بيع Cavenags الذين فشلوا في روسيا لنفس السعر تقريبا اشتروا.
حول زينيت وأنجي ، قلنا بالفعل.
جامعة

وهنا هو "سر" قيادة البريطانيين في المضاد (والبلجيكيون في القمة). الهامش الانجليزي بكل خزي. إنه أكثر من مجموع هوامش جميع الدول الستة الأولى مجتمعة.
المشتري المدرب

حسنًا ، ماذا يمكنني أن أقول ... مع كبار المدربين كما هو الحال مع الأندية الكبرى - أنت تدعوهم لإعطاء نتائج ، بدلاً من زيادة قيمة اللاعبين. على العكس من ذلك ، سيتعين عليهم دفع مبالغ زائدة لهم ، وشراء اللاعبين الذين يحتاجون إليهم. إنه لأمر مدهش أن ترى مانشيني فقط في نهاية هذه القائمة ، على الرغم من وجود عدد كبير من اللاعبين. ليس أقل إثارة للدهشة أنه في الجزء العلوي هناك جارديم مع Pochettino. لكننا سننظر في هذا التنازل عن لقب "أفضل مدرب" لهم.
مدرب مبيعات

Zhardim ، Lucescu و Pochettino شراء باهظة الثمن ، ولكن أيضا بيع باهظة الثمن. ليس من المستغرب أن يكون كل واحد منهم معروفًا بالعمل في الوقت المحدد مع الأندية (موناكو وشاختار وتوتنهام) في حالة "الاحترام". Simeone - boch: نظام اللعبة ، وسحب أتليتيكو للقادة ، بزيادة لا تصدق في قيمة اللاعبين.
في سطر واحد
أكبر هامش عند الشراء من زوج مدرب النادي : 1.Gus Hiddink ، في Anji ؛ 2. السير أليكس فيرجسون ، حيث يكون واضحًا ؛ 3. لويس فان غال ، فمن الواضح أين يونايتد .
أرخص شيء ، من عدد كبير من عمليات النقل ، تم شراؤها من قبل Chenol Gunesh من بشكتاش ، ومرة أخرى تستحق نظرة فاحصة.
زوجين لاعب النادي ، ولكن في المبيعات : 1. Mircea Lucescu ، شاختار ؛ 2. دييجو سيمين ، أتلتيكو ؛ ليوناردو جارديم ، موناكو.
والمفارقة الثانية هي أن دييغو هنا ، من المفارقات ، يشير إلى أنه قبل أتلتيكو كان يبيع اللاعبين بشكل أفضل.
وكيل
وأخيراً ، فعالية الوكيل الأعلى

تحدثنا بالفعل عن Gestifute. لكن الآن يمكنك إصدار حكم: نعم ، هم الأفضل .
أنها جيدة من تلقاء نفسها. ليس لديهم كريستيانو رونالدو ولاعبون آخرون رائعون فحسب ، بل يعرفون أيضًا كيف يبيعونها ، في الواقع ، الأفضل في العالم.
تستحق الوكالتان الأوليتان أيضًا النظر بعناية خاصة ، على الرغم من أنها تعمل بشكل حصري تقريبًا في السوق الإيطالية.
على ما يبدو ، لا يكشف العملاء غير المكشوفون عن أنفسهم لسبب ما - فهم يبيعون غالياً ، مهما كان الأمر.
دليل إضافي على أن Mino Raiola ليس مزحة لجورج Mendes ، فقط أعلى قليلاً من السوق. العلاقات العامة تقوم بعملها.
حسنًا ، إذا كنت لاعب كرة قدم روسي شابًا ، إذن أنت بخير بالفعل لا تتردد في اختيار وكالة من أعلى هذه القائمة ، فلن تخسر.
سنفعل كل شيء ، هناك العديد من النتائج ، لكنني اخترت النتائج الأكثر إثارة للاهتمام ، في رأيي.
من الممكن إلقاء نظرة فاحصة على هذه الرسوم البيانية وغيرها ، إلى جانب الجداول الكاملة ، في جهاز كمبيوتر محمول . وهنا أجريت المزيد من التجارب على هذه البيانات.
والأهم من ذلك ، أود أن أذكرك بأن هذه الطريقة تعمل مع أي مجموعة من البيانات المجدولة تقريبًا. أولاً ، يمكنك تحديد المعلمات التي تؤثر بشدة على النتيجة (أهمية الميزة) ، ثم قيم المعلمات (التبعية الجزئية) التي تحتاج إلى تحقيقها من أجل تعظيم الوظيفة المحددة باستخدام الطريقة الموضحة في هذه المقالة.
أتمنى لك التوفيق في التجارب ، سيكون من المثير للاهتمام معرفة ما حدث معك :)