Es hora de continuar el artículo anterior sobre el estudio de las transferencias de fútbol.
Esta vez descubrirás por qué Klopp Simeone es tan genial a quién tomar como agentes si eres futbolista y por qué leer todo esto si no estás interesado en el fútbol.
Aprendimos a recopilar muchos datos.
Mire a su alrededor, por ejemplo, en el trabajo, estoy seguro de que encontrará esta o aquella placa con, como, los datos necesarios que quedan para más adelante, "cuando entendemos qué hacer con ella". Esto se debe en parte a que las dependencias dentro de ellos son altamente no lineales y no intuitivas. Y solo quiero entender a cuál de estos datos prestar más atención, lo que más afectó el resultado. Además, demostraré con el ejemplo cómo usar uno de los algoritmos más simples que permite que esto se haga.
Puede encontrar el esquema de reproducción en sí mismo, así como los resultados completos en esta computadora portátil , y a continuación habrá muchos gráficos con los más interesantes.
Pero primero, un poco sobre el método.
Imagine que no está trabajando con transferencias de fútbol, pero tiene datos sobre las ventas de productos de la tienda (bueno, o un ejemplo un poco menos mercantil, con los resultados de los partidos en su juego tipo MOBA) y mucha información de fondo: sobre la tienda, los productos, los vendedores ( bien, o sobre los héroes, jugadores seleccionados, su fuerza), etc. Entonces desea lograr un resultado muy específico: aumentar las ventas de un determinado producto (o mejorar el equilibrio de su juego).
En cualquier caso, el plan es simple:
- Comprenda cuáles de los parámetros afectan más fuertemente el resultado final (el número de bienes vendidos o el porcentaje de victorias de un determinado personaje en el juego) y cómo
- entienda en cuál de estas opciones realmente puede influir
- enfóquese en lo que es importante (p. 1) y lo que se puede cambiar (p. 2)
Todo es simple, solo queda tratar el párrafo 1.
De hecho, esta tarea está lejos de ser nueva y es bastante fácil de resolver sin usar ninguna red neuronal, usando solo las buenas estadísticas antiguas ... Si tiene datos Magnet. O League of Legends. Pero hay una gran posibilidad de que no: que seas una red de un par de tiendas, un juego moderadamente popular, y simplemente no tengas muchos datos que puedas usar. Sí, LoL recopila los resultados de millones de partidos, y habrá tantas combinaciones de parámetros que puedes comparar cómo la elección de sus compañeros influye en la victoria de un héroe dado, todas las demás cosas son prácticamente iguales. Con la falta de datos, uno tiene que comparar las manzanas con las naranjas, simplemente no tenemos suficientes casos aislados.
Para simplificar la situación, para comprender cómo, por ejemplo, la combinación de correspondencia de mapas afecta la probabilidad de ganar tu juego, idealmente, tendrías que tener varios miles de resultados en los que todos los parámetros, excepto los que son interesantes para nosotros, sean los mismos. Es decir, para que los mismos jugadores con el mismo nivel de habilidad jueguen al mismo héroe en diferentes mapas con diferentes oponentes. Esto es difícil de lograr si no eres Riot Games .
Pero volvamos a las transferencias. Imagine que queremos investigar un parámetro: un "agente de fútbol", por ejemplo, para comprender qué compañía es mejor para que un jugador de fútbol se convierta en cliente. Está claro que debemos acudir al agente que organiza la venta del jugador más caro . Si aplicamos métodos estadísticos estándar, veremos que GestiFute es la compañía más exitosa que vende a sus clientes, lo cual es totalmente consistente con su reputación. Pero, ¿cómo podemos separar la habilidad de vender de la fuerza del jugador mismo? Después de todo, no es tan difícil vender caro si sus clientes son Deco, Danny, Pepe, Diego Costa y un tipo humilde llamado Cristiano . Honestamente, puede comparar agencias solo si todas reciben el mismo conjunto de jugadores (tanto buenos como no tan buenos) y se ven obligados a venderlos a los mismos clubes. Pero tal multiverso es difícil de imaginar en la vida real . Pero tenemos un modelo que da el resultado (costo de transferencia) para cualquier conjunto de datos. Sí, incluso si la obligas a calcular el costo de la transferencia de Gogua de Tambov a CSKA, si fue realizado por Jorge Mendes. Y Glushakova en Akhmat, y Azar en Real y todo lo demás. Luego haz el mismo truco con todas las otras oficinas. Condiciones perfectamente iguales. Luego solo queda calcular el precio de todo el conjunto de jugadores para cada una de las agencias, y aquí tenemos la respuesta a la pregunta de cuánto pertenecer a la marca, por ejemplo GestiFute, aumenta el precio de un jugador .
Es decir, analizamos cómo el parámetro objetivo depende de otro previamente establecido de forma aislada, y solo de él .
Esto se llama dependencia parcial.
Y así es posible analizar cualquier parámetro, lo que haremos ahora.
Edad
Lo primero que configuré para el algoritmo fue la edad del futbolista y obtuve esta imagen

Ella, hay que decirlo, me sumió en la tristeza. Porque no es absolutamente consistente con mi intuición. Algo está roto aquí. Sé bien que el costo máximo de los jugadores alcanza un pico en unos 25-27 años, que los jugadores a los 17 años definitivamente no son los más caros. Como me convenció al construir una dependencia simple de los datos de origen, sin ningún modelo.

Sí, así es, así es como se comporta el costo de los jugadores según la edad, una joroba radical.
Pero después de pensar un poco en lo que la modelo me pintó, me di cuenta de que tenía razón. Este fue el momento en que creí por primera vez que realmente funciona, que hay algo en él. El modelo me dio, a primera vista, un resultado inesperado, pero paradójicamente correcto, y me permitió mirar el objeto de estudio un poco desde el otro lado.
¿Qué vemos en el primer gráfico y por qué estamos acostumbrados al segundo?
El costo de transferencia, de hecho, es muy difícil de correlacionar con la edad del jugador usando solo datos sin procesar. Después de todo, ¿por qué un jugador se vuelve más caro a los 25 años? ¿Es porque se está haciendo viejo? No, solo juega más partidos, anota más, comienza a jugar para el equipo nacional, se vuelve más popular entre los fanáticos al final, etc., todo esto, por supuesto, se completa con la edad y la experiencia, pero todo esto Tenemos parámetros separados. Y en el primer gráfico vemos dependencia solo de la edad, en un escenario ideal, cuando todo lo demás es igual. Por supuesto, en este caso, un jugador que anotó 20 goles la temporada pasada para su club juega regularmente para el equipo nacional, a los 19 años le costará más que exactamente el mismo jugador con los mismos indicadores, jugando en el mismo lugar, ¡pero a los 25!
También es interesante aquí que la pendiente de la curva a 25 años es bastante suave, mientras que después de esta edad simplemente hay un colapso. Será interesante pensar por qué hay una diferencia tan sorprendente.
Temporada
Propongo comparar el crecimiento "destilado" en el valor de los jugadores en las estaciones.

Puede ver claramente cómo habiendo sobrevivido el sobrecalentamiento del mercado de los 90 y la crisis financiera de principios de los 10, el gráfico va con confianza a una curva de crecimiento casi exponencial.
Pero el mismo gráfico se basa únicamente en datos. Observe cuán menos pronunciado es el crecimiento en el valor de los jugadores en los últimos años.

Parámetros relacionados
La agencia, la edad y, en menor medida, la temporada son ejemplos de categorías independientes de parámetros bastante raras. Al final, puedes imaginar fácilmente cómo un jugador se mueve de una agencia a otra y esto tendrá poco efecto en otros parámetros. Pero digamos que queremos entender qué comprador de club tiene que pagar más por los jugadores. Puede tomar un parámetro to_club_name
y calcular el resultado. Pero aquí ya es difícil para nosotros no tener en cuenta los valores relacionados to_clb_lg_name
, to_clb_lg_country
, to_clb_lg_group
, que muestran en qué liga juega este club. Sí, podemos separarlos y descubrir cuánto más caro compra Man Utd a los jugadores únicamente debido a la fortaleza de su marca, y cuánto gana el "margen inglés" por separado, pero a menudo estamos interesados en el resultado combinado. Al final, Manchester no planea mudarse de Inglaterra, por lo que investigaremos de inmediato un grupo de parámetros.
¿Cuáles son los números en los gráficos?El número después de la "columna" es el coeficiente de cuánto aumenta este parámetro el precio de transferencia en relación con el promedio
El número dentro de la "columna", así como su tono, indican el número de transferencias con este parámetro
Comprador del club

El hecho de que de los 20 compradores más generosos de 18 clubes ingleses y un club real de la ciudad de Madrid no me sorprenda realmente, pero el tercer (!) Lugar de Makhachkala Anji muestra una vez más que merece un premio en la nominación " Party Like A Russian ".
Por cierto, solo un club de esta lista ya no existe.

Si el antítopo era más alto, entonces aquí tenemos clubes cuya marca, por el contrario, le permite comprar los mismos jugadores más baratos que el mercado. ¡Capturado por los belgas !
¿Dónde están los portugueses? - usted pregunta Pronto todo estará, - te responderé a ti y a mí mismo.
Vendedor del club

Clubes que más venden. Complace el segundo lugar del Minero (respeto merecido); la presencia de la mayoría de las cimas de Brasil y Argentina es clara; Sevilla y finalmente el Benfica, con el mayor número de ventas.
Pero lo más interesante, por supuesto, será una mirada más cercana al Atalanta. ¿A quién ha vendido tan bien en los últimos 10 años? ¿Entonces también en cantidad inferior a cincuenta piezas? Permítanme recordarles que los datos para 2008-2018 están lejos de los actuales Atalanta con desvanecido Gasperini y la Champions League!

Como forasteros, los holandeses, solo en esos días decían que los jugadores de calidad allí podían comprarse los más baratos. Y, de repente, Zenith con Wolfsburg ...
Rendimiento del club
Como tenemos datos sobre quienes venden los más caros y compran los más baratos, no podemos evitar ver quién tiene esta diferencia, en términos relativos, la mayor.

Imagen terriblemente interesante. Belgas, argentinos con brasileños, que claramente merecen una mirada más cercana a Besiktas con Alkmaar, y finalmente Benfica y Oporto con la mayor cantidad de ofertas.
De particular interés es Anderlecht, el top 10 de la lista y más de 100 transferencias.

El antitopo, esta vez en términos de "eficiencia", es capturado nuevamente por los británicos con una pequeña Barcelona intercalada. 0.5 en el Manchester United da miedo.
Aquí es necesario decir que cualquier dato muestra solo lo que muestra. En este caso, este es el "cargo adicional para el club" en el momento de la compra dividido por el "cargo adicional para el club" en el momento de la venta.
No es de extrañar que tomé la "eficiencia" entre comillas. Los mejores clubes del mundo no podían rechazar la cima de la "efectividad", su tarea no era vender jugadores lo más caros posible, sino quitarles los mejores años de carrera, exprimirles al máximo, convertirlos en un resultado de club. Un jugador excelente en un club superior puede ir a un reemplazo solo durante años, pero esto reducirá su precio, pero si es necesario para el club, lo hará. Si el club superior vende al jugador al campesino medio (y esto afecta más el cronograma ya que cambiar de arriba a abajo casi no cambia el balance general), lo más frecuente es que no haya aprobado la prueba (bueno, o por lo general parece así), qué vender de nuevo va a ser más difícil en otro club superior (es decir, inflan el precio de un jugador).
Es decir, en términos de "eficiencia" en este gráfico, si tiene sentido comparar, entonces solo los clubes de la misma categoría (clubes superiores, donantes, clubes belgas :), etc.)

Como por ejemplo aquí, la "efectividad" de los clubes rusos. El liderazgo de CSKA es muy esperado. Spartak sorprendió hasta que recordé que todavía vendían bien a sus jugadores. Por ejemplo, lograron vender los Cavenags que fracasaron en Rusia por casi el mismo precio que compraron.
Sobre Zenit y Anji, ya lo hemos dicho.
Liga

Y aquí está el "secreto" del liderazgo de los británicos en antítopos (y los belgas en las cimas). Margen inglés en toda su desgracia. Es más que la suma de los márgenes de todos los demás países top6 combinados.
Entrenador de compradores

Bueno, qué puedo decir ... Con los mejores entrenadores como con los mejores clubes: los invitas a dar resultados, en lugar de aumentar el valor de los jugadores. Por el contrario, tendrán que pagar de más por ellos, comprando los jugadores que necesitan. Es sorprendente ver a Mancini solo al final de esta lista, aunque con una gran cantidad de jugadores. No es menos sorprendente que en la cima esté Jardim con Pochettino. Pero consideraremos que esta es la asignación del título de "mejor entrenador" para ellos.
Entrenador de ventas

Zhardim, Lucescu y Pochettino compran caro, pero también venden caro. No es sorprendente que cada uno de ellos sea mejor conocido por trabajar en el momento indicado con clubes (Mónaco, Shakhtar y Tottenham) del estado de "respeto". Simeone - boch: el sistema del juego, la retirada del Atlético a los líderes, un aumento increíble en el valor de los jugadores.
En una linea
El mayor margen al comprar de un par club-entrenador : 1.Gus Hiddink, en Anji; 2. Sir Alex Ferguson, donde está claro ; 3. Louis van Gaal, está claro dónde está United .
El más barato de todos, de un número significativo de transferencias, fue comprado por Chenol Gunesh de Besiktas, nuevamente vale la pena verlo más de cerca.
Una pareja de jugadores de club, pero en ventas : 1. Mircea Lucescu, Shakhtar; 2.Diego Simene, Atlético; 3.Leonardo Jardim, Mónaco.
Solo el segundo lugar de Diego aquí, paradójicamente , sugiere que antes del Atlético incluso vendió mejores jugadores.
Agente
Y finalmente, la efectividad del agente superior

Ya hablamos de Gestifute. Pero ahora puede emitir un veredicto: sí, son los mejores .
Son buenos solos. No solo tienen a Cristiano Ronaldo y otros grandes jugadores, también saben cómo venderlos, de hecho, los mejores del mundo.
Las primeras 2 agencias también merecen una atención especial, aunque trabajan casi exclusivamente en el mercado italiano.
Los agentes no revelados , aparentemente, no se revelan por una razón: se venden caro, pase lo que pase.
Más evidencia de que Mino Raiola no es una broma para Georges Mendes, solo un poco por encima del mercado. PR está haciendo su trabajo.
Bueno, si eres un joven futbolista ruso, entonces ya lo estás haciendo bien Siéntase libre de elegir una agencia de la parte superior de esta lista, no perderá.
Haremos todo, hay muchos más resultados, pero he seleccionado los más interesantes, en mi opinión.
Una mirada más cercana a estos y otros gráficos, junto con tablas completas, es posible en una computadora portátil . Y aquí realicé aún más experimentos con estos datos.
Y lo más importante, quiero recordarle que este método funciona con casi cualquier conjunto de datos tabulares. Primero, usted determina qué parámetros afectan más fuertemente el resultado (Importancia de la característica), y luego qué valores de parámetros (Dependencia parcial) necesita alcanzar para maximizar la función seleccionada utilizando el método que se describió en este artículo.
Te deseo buena suerte en los experimentos, será interesante saber qué pasó contigo :)