Modell des Fußballtransfers: Tiefer graben

Es ist Zeit, den vorherigen Artikel über das Studium des Fußballtransfers fortzusetzen.


Dieses Mal werden Sie herausfinden, warum Klopp Simeone ist so cool, wen man als Agent nimmt, wenn man Fußballer ist, und warum man das alles liest, wenn man sich nicht für Fußball interessiert.



Wir haben gelernt, viele Daten zu sammeln.


Schauen Sie sich zum Beispiel bei der Arbeit um. Ich bin sicher, Sie werden dieses oder jenes Schild mit den notwendigen Daten finden, die für später übrig bleiben, "wenn wir verstehen, was wir damit machen sollen". Dies liegt teilweise daran, dass die Abhängigkeiten in ihnen stark nicht linear und nicht intuitiv sind. Und ich möchte nur verstehen, welchen dieser Daten am meisten Aufmerksamkeit geschenkt werden soll, welche das Ergebnis am meisten beeinflusst haben. Außerdem werde ich anhand eines Beispiels zeigen, wie man einen der einfachsten Algorithmen verwendet, mit denen dies möglich ist.


Sie finden das Wiedergabeschema selbst sowie die vollständigen Ergebnisse in diesem Laptop . Unten finden Sie viele Grafiken mit den interessantesten.


Aber zuerst ein wenig über die Methode.


Stellen Sie sich vor, Sie arbeiten nicht mit Fußballtransfers, aber Sie haben Daten zum Verkauf von Ladenwaren (naja oder ein etwas weniger kaufmännisches Beispiel - mit den Ergebnissen von Spielen in Ihrem MOBA-ähnlichen Spiel) und viele Hintergrundinformationen: über das Geschäft, Waren, Verkäufer ( gut, oder über die ausgewählten Helden, Spieler, ihre Stärke) usw. Dann möchten Sie ein ganz bestimmtes Ergebnis erzielen - um den Umsatz eines bestimmten Produkts zu steigern (oder das Gleichgewicht Ihres Spiels zu verbessern).


In jedem Fall ist der Plan einfach:


  1. Verstehen Sie, welcher der Parameter das Endergebnis am stärksten beeinflusst (die Anzahl der verkauften Waren oder der Prozentsatz der Siege eines bestimmten Charakters im Spiel) und wie
  2. Verstehen Sie, welche dieser Optionen Sie wirklich beeinflussen können
  3. Konzentrieren Sie sich auf das, was wichtig ist (S. 1) und was geändert werden kann (S. 2).

Alles ist einfach, es bleibt nur Absatz 1 zu behandeln.


Tatsächlich ist diese Aufgabe alles andere als neu und es ist recht einfach zu lösen, ohne neuronale Netze zu verwenden, wobei nur die guten alten Statistiken verwendet werden ... Wenn Sie Magnetdaten haben. Oder League of Legends. Aber es besteht eine große Chance, dass dies nicht der Fall ist: Sie sind ein Netzwerk aus mehreren Geschäften, ein mäßig beliebtes Spiel, und Sie haben einfach nicht viele Daten, die Sie verwenden können. Ja, LoL sammelt die Ergebnisse von Millionen von Spielen, und es wird so viele Kombinationen von Parametern geben, dass Sie vergleichen können, wie die Wahl seiner Partner den Sieg eines bestimmten Helden beeinflusst, wobei alle anderen Dinge praktisch gleich sind. Bei fehlenden Daten muss man Äpfel mit Orangen vergleichen - wir haben einfach nicht genug Einzelfälle.


Um die Situation zu vereinfachen und zu verstehen, wie sich beispielsweise die Map-Matchup- Kombination auf die Gewinnwahrscheinlichkeit Ihres Spiels auswirkt, müssten Sie im Idealfall mehrere tausend Ergebnisse erzielen, bei denen alle Parameter außer den für uns interessanten gleich sind. Das heißt, dass dieselben Spieler mit derselben Fähigkeitsstufe denselben Helden auf verschiedenen Karten mit unterschiedlichen Gegnern spielen. Dies ist schwer zu erreichen, wenn Sie keine Riot Games sind .


Aber zurück zu den Transfers. Stellen Sie sich vor, wir möchten einen Parameter untersuchen - beispielsweise einen „Fußballagenten“, um zu verstehen, welches Unternehmen für einen Fußballspieler am besten geeignet ist, um Kunde zu werden. Es ist klar, dass wir zu dem Agenten gehen müssen, der den Verkauf des teuersten Spielers organisiert. Wenn wir statistische Standardmethoden anwenden, werden wir feststellen, dass GestiFute das erfolgreichste Unternehmen ist, das seine Kunden verkauft, was voll und ganz mit ihrem Ruf übereinstimmt. Aber wie können wir die Fähigkeit des Verkaufens von der Stärke des Spielers selbst trennen? Schließlich ist es nicht so schwierig, teuer zu verkaufen, wenn Ihre Kunden Deco, Danny, Pepe, Diego Costa und ein bescheidener Typ namens Cristiano sind . Ehrlich gesagt können Sie Agenturen nur vergleichen, wenn sie alle die gleichen Spieler haben (sowohl gute als auch nicht so gute) und gezwungen sind, sie an dieselben Vereine zu verkaufen. Aber ein solches Multiversum ist im wirklichen Leben schwer vorstellbar . Wir haben jedoch ein Modell , das das Ergebnis (Übertragungskosten) für jeden Datensatz angibt. Ja, selbst wenn Sie sie zwingen, die Kosten für den Transfer von Gogua von Tambow nach CSKA zu berechnen, wenn dieser von Jorge Mendes durchgeführt wurde. Und Glushakova in Achmat und Azar in Real und alles andere. Dann machen Sie den gleichen Trick mit allen anderen Büros. Perfekt gleiche Bedingungen. Dann bleibt nur noch die Berechnung des Preises der gesamten Gruppe von Spielern für jede der Agenturen, und hier haben wir die Antwort auf die Frage, wie sehr die Zugehörigkeit zur Marke, zum Beispiel GestiFute, den Preis eines Spielers erhöht .
Das heißt, wir haben analysiert, wie der Zielparameter von einem anderen zuvor isoliert festgelegten Parameter abhängt, und nur von diesem .


Dies wird als partielle Abhängigkeit bezeichnet.


Und so ist es möglich, jeden Parameter zu analysieren, was wir jetzt tun werden.


Alter


Das erste, wofür ich den Algorithmus eingestellt habe, war das Alter des Fußballspielers und ich habe dieses Bild bekommen



Sie hat mich in Traurigkeit gestürzt. Weil es absolut nicht mit meiner Intuition übereinstimmt. Hier ist etwas kaputt. Ich weiß, dass die maximalen Kosten von Spielern einen Höhepunkt von etwa 25 bis 27 Jahren erreichen, dass Spieler mit 17 Jahren definitiv nicht die teuersten sind. Wie ich überzeugt war, indem ich eine einfache Abhängigkeit von den Quelldaten ohne Modell aufbaute.



Ja, das ist richtig, so verhalten sich die Kosten der Spieler je nach Alter, ein weitläufiger Buckel.


Aber nachdem ich ein wenig darüber nachgedacht hatte, was das Modell für mich gemalt hatte, wurde mir klar, dass sie Recht hatte. Dies war der Moment, als ich zum ersten Mal glaubte, dass es wirklich funktioniert, dass etwas drin ist. Das Modell gab mir auf den ersten Blick ein unerwartetes, aber paradoxerweise korrektes Ergebnis und erlaubte mir, das Untersuchungsobjekt ein wenig von der anderen Seite zu betrachten.


Was sehen wir auf der ersten Karte und warum sind wir an die zweite gewöhnt?


Tatsächlich ist es sehr schwierig, die Transferkosten mit dem Alter des Spielers zu korrelieren, wenn nur Rohdaten verwendet werden. Warum wird ein Spieler im Alter von 25 Jahren immer teurer? Liegt es daran, dass er alt wird? Nein, er spielt einfach mehr Spiele, erzielt mehr Tore, beginnt für die Nationalmannschaft zu spielen, wird am Ende bei den Fans immer beliebter usw. All dies geht natürlich mit dem Alter und dem Sammeln von Erfahrung einher, aber all dies Wir haben separate Parameter. Und in der ersten Grafik sehen wir nur die Abhängigkeit vom Alter, in einem idealen Szenario, wenn alles andere gleich ist. In diesem Fall spielt natürlich ein Spieler, der in der vergangenen Saison 20 Tore für seinen Verein erzielt hat, regelmäßig für die Nationalmannschaft. Mit 19 Jahren kostet es mehr als genau denselben Spieler mit denselben Indikatoren, der am selben Ort spielt, aber mit 25!


Interessant ist hier auch, dass die Steigung der Kurve auf 25 Jahre recht gering ist, während es nach diesem Alter einfach zu einem Zusammenbruch kommt. Es wird interessant sein darüber nachzudenken, warum es so einen bemerkenswerten Unterschied gibt.


Saison


Ich schlage vor, das "destillierte" Wertwachstum der Spieler in den Spielzeiten zu vergleichen



Sie können deutlich sehen, wie die Grafik nach der Überhitzung des 90er-Jahre-Marktes und der Finanzkrise zu Beginn der 10er-Jahre zuversichtlich zu einer fast exponentiellen Wachstumskurve übergeht.


Das gleiche Diagramm basiert jedoch ausschließlich auf Daten. Beachten Sie, wie wenig ausgeprägt das Wertwachstum der Spieler in den letzten Jahren war



Verwandte Parameter


Agentur, Alter und in geringerem Maße Jahreszeit sind Beispiele für ziemlich seltene unabhängige Kategorien von Parametern. Am Ende können Sie sich leicht vorstellen, wie ein Spieler von einer Agentur zur anderen wechselt, und dies hat nur geringe Auswirkungen auf andere Parameter. Angenommen, wir möchten verstehen, welcher Clubkäufer für die Spieler am meisten bezahlen muss. Sie können einen Parameter to_club_name und das Ergebnis berechnen. Aber hier ist es schon schwierig für uns, die zugehörigen Werte to_clb_lg_name , to_clb_lg_country , to_clb_lg_group nicht zu berücksichtigen, die zeigen, in welcher Liga dieser Verein spielt. Ja, wir können sie trennen und herausfinden, wie viel teurer Man Utd Spieler allein aufgrund der Stärke seiner Marke kauft und wie viel die "englische Marge" separat verdient, aber meistens sind wir an dem kombinierten Ergebnis interessiert. Am Ende plant Manchester nicht, irgendwohin aus England zu ziehen, daher werden wir sofort eine Gruppe von Parametern untersuchen.


Was sind die Zahlen in den Grafiken?

Die Zahl nach der „Spalte“ ist der Koeffizient dafür, um wie viel dieser Parameter den Transferpreis im Verhältnis zum Durchschnitt erhöht


Die Nummer in der "Spalte" sowie der Farbton geben die Anzahl der Übertragungen mit diesem Parameter an


Club Käufer



Die Tatsache, dass von den 20 großzügigsten Käufern von 18 englischen Clubs und einem königlichen Club aus Madrid mich nicht wirklich überrascht, aber der dritte (!) Platz von Makhachkala Anji zeigt erneut, dass er einen Preis in der Nominierung " Party Like A Russian " verdient.
Übrigens existiert nur noch ein Verein aus dieser Liste nicht mehr.



Wenn das Antitop höher war, dann haben wir hier Vereine, deren Marke es Ihnen im Gegenteil ermöglicht, dieselben Spieler billiger als der Markt zu kaufen. Gefangen von den Belgiern !


Wo sind die Portugiesen? - Du fragst. Bald wird alles sein - ich werde dir und mir selbst antworten.


Clubverkäufer



Clubs, die am meisten verkaufen. Erfreut den zweiten Platz des Bergmanns (verdienter Respekt); Die Präsenz der meisten Gipfel Brasiliens und Argentiniens ist klar. Sevilla und schließlich Benfica mit der höchsten Umsatzzahl.
Am interessantesten ist natürlich ein genauerer Blick auf die Atalanta. Wen hat sie in den letzten 10 Jahren so gut verkauft? Also auch in Mengen unter fünfzig Stück? Ich möchte Sie daran erinnern, dass die Daten für 2008-2018 weit vom heutigen Atalanta entfernt sind verblasst Gasperini und die Champions League!



Als Außenseiter, die Holländer, sagten sie damals nur, dass Qualitätsspieler dort am billigsten gekauft werden könnten. Und plötzlich Zenith mit Wolfsburg ...


Clubleistung


Da wir Daten über diejenigen haben, die am teuersten verkaufen und am billigsten kaufen, können wir nicht anders, als zu sehen, wer diesen Unterschied relativ gesehen am größten hat.



Schrecklich interessantes Bild. Belgier, Argentinier mit Brasilianern, die Besiktas mit Alkmaar eindeutig näher betrachten sollten, und schließlich Benfica und Porto mit den meisten Deals.


Besonders hervorzuheben ist Anderlecht - Top 10 in der Liste und mehr als 100 Transfers.



Das Antitop, diesmal in Bezug auf "Effizienz", wird erneut von den Briten mit einem kleinen eingestreuten Barcelona eingefangen . 0,5 bei Manchester United ist nur beängstigend.


Hier muss gesagt werden, dass alle Daten nur das zeigen, was sie zeigen. In diesem Fall ist dies der "Aufpreis für den Club" beim Kauf geteilt durch den "Aufpreis für den Club" beim Verkauf.
Kein Wunder, dass ich die "Effizienz" in Anführungszeichen gesetzt habe. Die besten Vereine der Welt konnten die Spitze der „Effektivität“ nicht ablehnen. Ihre Aufgabe war es nicht, Spieler so teuer wie möglich zu verkaufen, sondern ihnen die besten Karrierejahre abzunehmen, das Maximum zu drücken und sie in ein Vereinsergebnis umzuwandeln. Ein ausgezeichneter Spieler in einem Top-Club kann nur jahrelang einen Ersatz suchen, aber dies wird seinen Preis senken, aber wenn es für den Club notwendig ist, wird er es tun. Wenn der Top-Club den Spieler an den Mittelbauern verkauft (und dies wirkt sich stärker auf den Zeitplan aus, da ein Wechsel von Top zu Top das Gesamtgleichgewicht fast nicht verändert), bedeutet dies meistens, dass er den Test nicht bestanden hat (na ja, oder es scheint normalerweise so), was er wieder verkaufen soll In einem anderen Top-Club wird es schwieriger (nämlich den Preis eines Spielers zu erhöhen).


Das heißt, in Bezug auf die "Effizienz" in dieser Grafik, wenn es sinnvoll ist, zu vergleichen, dann nur Clubs derselben Kategorie (Top-Clubs, Spender, belgische Clubs :) usw.)



Wie zum Beispiel hier - die "Effektivität" russischer Vereine. CSKA-Führung wird sehr erwartet. Spartak war überrascht, bis ich mich daran erinnerte, dass sie ihre Spieler immer noch gut verkauft hatten. Zum Beispiel gelang es ihnen, die in Russland gescheiterten Cavenags für fast den gleichen Preis zu verkaufen, den sie gekauft hatten.


Über Zenit und Anji haben wir bereits gesagt.


Liga



Und hier ist das "Geheimnis" der Führung der Briten in Antitopen (und der Belgier an der Spitze). Englischer Rand in all seiner Schande. Es ist mehr als die Summe der Margen aller anderen Top6-Länder zusammen.


Käufer Trainer



Nun, was soll ich sagen ... Bei Top-Trainern wie bei Top-Clubs laden Sie sie ein, Ergebnisse zu erzielen, anstatt den Wert der Spieler zu steigern. Im Gegenteil, sie müssen für sie zu viel bezahlen und die Spieler kaufen, die sie brauchen. Es ist erstaunlich, Mancini nur am Ende dieser Liste zu sehen, obwohl mit einer großen Anzahl von Spielern. Es ist nicht weniger überraschend, dass oben Jardim mit Pochettino ist. Aber wir werden dies als die Zuweisung des Titels "Top-Trainer" an sie betrachten.


Verkaufscoach



Zhardim, Lucescu und Pochettino kaufen teuer, verkaufen aber auch teuer. Es ist nicht überraschend, dass jeder von ihnen am besten dafür bekannt ist, zur angegebenen Zeit mit Clubs (Monaco, Shakhtar und Tottenham) zusammenzuarbeiten, die den Status "Respekt" haben. Simeone - boch: das System des Spiels, der Rückzug von Atletico zu den Führenden, eine unglaubliche Wertsteigerung der Spieler.


In einer Zeile


Die größte Marge beim Kauf von einem Club-Trainer- Paar: 1.Gus Hiddink in Anji; 2. Sir Alex Ferguson, wo es klar ist ; 3. Louis van Gaal, es ist klar, wo United .


Der billigste von allen, von einer beträchtlichen Anzahl von Transfers, wurde von Chenol Gunesh von Besiktas gekauft, wieder ist es einen genaueren Blick wert.


Ein Club-Spieler-Paar, aber im Verkauf : 1. Mircea Lucescu, Shakhtar; 2.Diego Simene, Atlético; 3. Leonardo Jardim, Monaco.


Nur der zweite Platz Diego hier, paradoxerweise , deutet darauf hin, dass er vor Atlético die Spieler sogar besser verkauft hat.


Agent


Und schließlich die Top-Agent-Effektivität



Wir haben bereits über Gestifute gesprochen. Aber jetzt können Sie ein Urteil fällen: Ja, sie sind die besten .


Sie sind alleine gut. Sie haben nicht nur Cristiano Ronaldo und andere großartige Spieler, sie wissen auch, wie man sie verkauft, tatsächlich die besten der Welt.


Die ersten beiden Agenturen sind ebenfalls einen besonderen Blick wert, obwohl sie fast ausschließlich auf dem italienischen Markt tätig sind.


Unbekannte Agenten offenbaren sich offenbar nicht aus einem bestimmten Grund - sie verkaufen sich teuer, egal was passiert .


Ein weiterer Beweis dafür, dass Mino Raiola für Georges Mendes kein Scherz ist, nur ein wenig über dem Markt. PR macht seinen Job.


Wenn Sie ein junger russischer Fußballspieler sind, dann es geht dir schon gut Fühlen Sie sich frei, eine Agentur aus dem Anfang dieser Liste zu wählen, Sie werden nicht verlieren.


Wir werden alles tun, es gibt viel mehr Ergebnisse, aber ich habe meiner Meinung nach die interessantesten ausgewählt.
Ein genauerer Blick auf diese und andere Grafiken sowie auf vollständige Tabellen ist in einem Laptop möglich . Und hier habe ich noch mehr Experimente mit diesen Daten durchgeführt.


Und vor allem möchte ich Sie daran erinnern, dass diese Methode mit fast allen tabellarischen Daten funktioniert. Zunächst bestimmen Sie , welche Parameter das Ergebnis am stärksten beeinflussen (Feature Importance) und welche Parameterwerte (Partial Dependency) Sie erreichen müssen, um die ausgewählte Funktion mithilfe der in diesem Artikel beschriebenen Methode zu maximieren.


Ich wünsche dir viel Glück bei den Experimenten, es wird interessant sein zu wissen, was mit dir passiert ist :)

Source: https://habr.com/ru/post/de471484/


All Articles