É hora de continuar o artigo anterior sobre o estudo das transferências de futebol.
Desta vez, você descobrirá por que Klopp Simeone é muito legal em quem tomar como agente se você é jogador de futebol e por que ler tudo isso se você não está interessado em futebol.
Aprendemos a coletar muitos dados.
Olhe ao seu redor, por exemplo, no trabalho, tenho certeza de que você encontrará este ou aquele prato com os dados necessários para mais tarde, "quando entendermos o que fazer com ele". Isso ocorre em parte porque as dependências dentro deles são altamente não lineares e não intuitivas. E só quero entender em quais desses dados prestar mais atenção e quais afetaram o resultado. Além disso, demonstrarei por exemplo como usar um dos algoritmos mais simples que permite que isso seja feito.
Você pode encontrar o esquema de reprodução em si, bem como os resultados completos neste laptop , e abaixo haverá muitos gráficos com os mais interessantes.
Mas primeiro, um pouco sobre o método.
Imagine que você não está trabalhando com transferências de futebol, mas possui dados sobre vendas de mercadorias da loja (bem, ou um exemplo um pouco menos mercantil - com os resultados de correspondências em seu jogo semelhante ao MOBA) e muitas informações básicas: sobre a loja, mercadorias, vendedores ( bem, ou sobre os heróis, jogadores, suas forças) etc. Então você deseja alcançar um resultado muito específico - aumentar as vendas de um determinado produto (ou melhorar o equilíbrio do seu jogo).
De qualquer forma, o plano é simples:
- entender quais dos parâmetros afetam mais fortemente o resultado final (o número de mercadorias vendidas ou a porcentagem de vitórias de um determinado personagem no jogo) e como
- entender quais dessas opções você pode realmente influenciar
- concentre-se no que é importante (p. 1) e no que pode ser alterado (p. 2)
Tudo é simples, resta apenas lidar com o parágrafo 1.
De fato, essa tarefa está longe de ser nova e é fácil de resolver sem o uso de redes neurais, usando apenas as boas estatísticas antigas ... Se você tiver dados do Magnet. Ou League of Legends. Mas há uma grande chance disso: você é uma rede de duas lojas, um jogo moderadamente popular e simplesmente não possui muitos dados que possa usar. Sim, LoL coleta os resultados de milhões de partidas e haverá tantas combinações de parâmetros que você pode comparar como a escolha de seus parceiros influencia a vitória de um determinado herói, sendo todas as outras coisas praticamente iguais. Com a falta de dados, é preciso comparar maçãs com laranjas - simplesmente não temos casos isolados suficientes.
Para simplificar a situação, para entender como, por exemplo, a combinação de mapa-jogo afeta a probabilidade de ganhar seu jogo, idealmente, você teria que ter vários milhares de resultados nos quais todos os parâmetros, exceto os que são interessantes para nós, são os mesmos. Ou seja, para que os mesmos jogadores com o mesmo nível de habilidade joguem o mesmo herói em mapas diferentes com oponentes diferentes. Isso é difícil de conseguir se você não é um Riot Games .
Mas voltando às transferências. Imagine que queremos investigar um parâmetro - um "agente de futebol", por exemplo, para entender qual empresa é melhor para um jogador de futebol se tornar um cliente. É claro que devemos ir ao agente que organiza a venda do jogador mais caro . Se aplicarmos métodos estatísticos padrão, veremos que a GestiFute é a empresa de maior sucesso que vende seus clientes, o que é totalmente consistente com sua reputação. Mas como podemos separar as habilidades de venda da força do próprio jogador? Afinal, não é tão difícil vender caro se seus clientes são Deco, Danny, Pepe, Diego Costa e um cara humilde chamado Cristiano . Honestamente, você pode comparar as agências apenas se elas receberem o mesmo conjunto de jogadores (boas e não tão boas) e forçadas a vendê-las para os mesmos clubes. Mas esse multiverso é difícil de imaginar na vida real . Mas temos um modelo que fornece o resultado (custo de transferência) para qualquer conjunto de dados. Sim, mesmo que você a force a calcular o custo de transferência de Gogua de Tambov para CSKA, se for realizado por Jorge Mendes. E Glushakova em Akhmat, e Azar em Real e todo o resto. Em seguida, faça o mesmo truque com todos os outros escritórios. Condições perfeitamente iguais. Resta apenas calcular o preço de todo o conjunto de jogadores para cada uma das agências, e aqui temos a resposta para a pergunta de quanto pertencer à marca, por exemplo, GestiFute, aumenta o preço de um jogador .
Ou seja, analisamos como o parâmetro target depende de outro anteriormente definido isoladamente, e somente dele .
Isso é chamado de dependência parcial.
E assim é possível analisar qualquer parâmetro, o que faremos agora.
Idade
A primeira coisa que defini o algoritmo foi a idade do jogador de futebol e consegui essa foto

É preciso dizer que ela me deixou triste. Porque não é absolutamente consistente com a minha intuição. Algo está quebrado aqui. Sei bem que o custo máximo dos jogadores atinge um pico em cerca de 25 a 27 anos, que os jogadores de 17 anos definitivamente não são os mais caros. Como fiquei convencido, construindo uma dependência simples a partir dos dados de origem, sem nenhum modelo.

Sim, é isso mesmo, é assim que o custo dos jogadores se comporta dependendo da idade, uma corcunda arrebatadora.
Mas depois de pensar um pouco sobre o que o modelo pintou para mim, percebi que ela estava certa. Este foi o momento em que eu acreditei que realmente funciona, que há algo nele. O modelo me deu, à primeira vista, um resultado inesperado, mas paradoxalmente correto, e me permitiu olhar um pouco o objeto de estudo do outro lado.
O que vemos no primeiro gráfico e por que estamos acostumados com o segundo?
O custo de transferência, de fato, é muito difícil de correlacionar com a idade do jogador, usando apenas dados brutos. Afinal, por que um jogador fica mais caro aos 25 anos? É porque ele está ficando velho? Não, ele apenas joga mais partidas, marca mais, começa a jogar pela equipe nacional, torna-se mais popular entre os torcedores no final, etc. tudo isso, é claro, é como se estivesse completo com a idade e a experiência adquirida, mas tudo isso nós temos parâmetros separados. E no primeiro gráfico, vemos dependência apenas da idade, em um cenário ideal, quando tudo o resto é o mesmo. É claro que, neste caso, um jogador que marcou 20 gols na última temporada para seu clube joga regularmente para a equipe nacional. Aos 19 anos, custará mais do que exatamente o mesmo jogador com os mesmos indicadores, jogando no mesmo lugar, mas com 25!
Também é interessante aqui que a inclinação da curva para 25 anos seja bastante suave, enquanto que após essa idade há simplesmente um colapso. Será interessante pensar por que existe uma diferença tão marcante?
Temporada
Proponho comparar o crescimento "destilado" no valor dos jogadores nas temporadas

Você pode ver claramente como, tendo sobrevivido ao superaquecimento do mercado dos anos 90 e à crise financeira do início dos anos 10, o gráfico confiavelmente chega a uma curva de crescimento quase exponencial.
Mas o mesmo gráfico é construído apenas com dados. Observe como menos acentuado o crescimento no valor dos jogadores nos últimos anos

Parâmetros relacionados
Agência, idade e, em menor grau, estação do ano são exemplos de categorias independentes razoavelmente raras de parâmetros. No final, você pode facilmente imaginar como um jogador se move de uma agência para outra e isso terá pouco efeito sobre outros parâmetros. Mas digamos que queremos entender qual comprador do clube deve pagar mais pelos jogadores. Você pode to_club_name
um parâmetro para to_club_name
e calcular o resultado. Mas aqui já é difícil não levarmos em consideração os valores relacionados to_clb_lg_name
, to_clb_lg_country
, to_clb_lg_group
, que mostram em qual liga este clube atua. Sim, podemos separá-los e descobrir quanto mais caro o Man Utd compra jogadores apenas por causa da força de sua marca e quanto a "margem inglesa" ganha separadamente, mas na maioria das vezes estamos interessados no resultado combinado. No final, Manchester não planeja se mudar para qualquer lugar da Inglaterra, portanto investigaremos imediatamente um grupo de parâmetros.
Quais são os números nos gráficos?O número após a "coluna" é o coeficiente de quanto esse parâmetro aumenta o preço de transferência em relação à média
O número dentro da "coluna", bem como sua tonalidade, indicam o número de transferências com este parâmetro
Comprador de clube

O fato de que dos 20 compradores mais generosos de 18 clubes ingleses e um clube real da cidade de Madri não me surpreende, mas o terceiro (!) Lugar de Makhachkala Anji mostra mais uma vez que ele merece um prêmio na nomeação " Party Like A Russian ".
A propósito, apenas um clube desta lista não existe mais.

Se o antítopo foi maior, aqui temos clubes cuja marca, pelo contrário, permite comprar os mesmos jogadores mais baratos que o mercado. Capturado pelos belgas !
Onde estão os portugueses - você pergunta. Em breve tudo estará - eu responderei a você e a mim.
Vendedor do clube

Clubes que vendem mais. Agrada o segundo lugar do mineiro (respeito merecido); a presença da maioria dos topos do Brasil e da Argentina é clara; Sevilha e finalmente o Benfica, com o maior número de vendas.
Mas o mais interessante, é claro, será um olhar mais atento sobre o Atalanta. Quem ela vendeu tão bem nos últimos 10 anos? Então, também em quantidade abaixo de cinquenta peças? Gostaria de lembrá-lo de que os dados para 2008-2018 estão longe do Atalanta de hoje com desbotado Gasperini e a Liga dos Campeões!

Como estrangeiros, os holandeses, era exatamente o que eles diziam naqueles dias que eles diziam que jogadores de qualidade podiam comprar o mais barato. E, de repente, Zenith com Wolfsburg ...
Desempenho do clube
Como temos dados sobre quem vende o mais caro e compra o mais barato, não podemos deixar de ver quem tem essa diferença, em termos relativos, a maior.

Imagem terrivelmente interessante. Belgas, argentinos e brasileiros, que claramente merecem um olhar mais atento de Besiktas com Alkmaar e, finalmente, Benfica e Porto com mais negócios.
Destaca-se o Anderlecht - o top 10 da lista e mais de 100 transferências.

O antítopo, desta vez em termos de "eficiência", é novamente capturado pelos britânicos com uma pequena Barcelona intercalada. 0,5 no Manchester United é assustador.
Aqui é necessário dizer que qualquer dado mostra apenas o que mostra. Nesse caso, essa é a "taxa extra para o clube" na compra dividida pela "taxa extra para o clube" na venda.
Não é à toa que tomei a "eficiência" entre aspas. Os melhores clubes do mundo não podiam recusar o topo da “eficácia”, sua tarefa não era vender jogadores o mais caro possível, mas tirar deles os melhores anos de carreira, espremer o máximo e transformá-los em resultados de clubes. Um excelente jogador em um clube de topo pode substituir apenas por anos, mas isso reduzirá seu preço, mas se for necessário para o clube, ele o fará. Se o clube de topo vende o jogador ao camponês do meio (e isso afeta o cronograma mais uma vez que mudar de cima para cima quase não altera o saldo geral), na maioria das vezes isso significa que ele não passou no teste (bom, ou geralmente parece assim), o que vender novamente será mais difícil em outro clube importante (a saber, eles aumentam o preço de um jogador).
Ou seja, em termos de "eficiência" neste gráfico, se faz sentido comparar, somente os clubes da mesma categoria (principais clubes, doadores, clubes belgas :), etc.)

Como por exemplo aqui - a "eficácia" dos clubes russos. A liderança do CSKA é muito esperada. O Spartak surpreendeu até lembrar que eles ainda vendiam bem seus jogadores. Por exemplo, eles conseguiram vender os Cavenags que falharam na Rússia pelo quase preço que compraram.
Sobre Zenit e Anji, já dissemos.
Liga

E aqui está o "segredo" da liderança dos britânicos nos antítopos (e dos belgas no topo). Margem inglesa em toda a sua desgraça. É mais do que a soma das margens de todos os outros 6 principais países juntos.
Instrutor de Compradores

Bem, o que posso dizer ... Com os melhores treinadores e com os melhores clubes - você os convida a dar resultados, em vez de aumentar o valor dos jogadores. Pelo contrário, eles terão que pagar a mais por eles, comprando os jogadores de que precisam. É incrível ver Mancini apenas no final desta lista, embora com um grande número de jogadores. Não é menos surpreendente que no topo haja Jardim com Pochettino. Mas consideraremos isso a atribuição do título "treinador principal" a eles.
Coach de Vendas

Zhardim, Lucescu e Pochettino compram caro, mas também vendem caro. Não é de surpreender que cada um deles seja mais conhecido por trabalhar no horário indicado com clubes (Mônaco, Shakhtar e Tottenham) com o status de "respeito". Simeone - boch: o sistema do jogo, a retirada do Atlético para os líderes, um aumento incrível no valor dos jogadores.
Em uma linha
A maior margem na compra de um par de treinadores de clubes : 1.Gus Hiddink, em Anji; 2. Sir Alex Ferguson, onde está claro ; 3. Louis van Gaal, é claro onde United .
O mais barato de todos, de um número significativo de transferências, foi comprado por Chenol Gunesh à Besiktas, mais uma vez vale a pena olhar mais de perto.
Um casal de jogadores de clubes, mas em vendas : 1. Mircea Lucescu, Shakhtar; Diego Simene, Atlético; 3. Leonardo Jardim, Mônaco.
Apenas o segundo lugar de Diego aqui, paradoxalmente , sugere que antes do Atlético ele até vendia jogadores melhor.
Agente
E, finalmente, a maior eficácia do agente

Já conversamos sobre a Gestifute. Mas agora você pode emitir um veredicto: sim, eles são os melhores .
Eles são bons por conta própria. Eles não apenas têm Cristiano Ronaldo e outros grandes jogadores, mas também sabem como vendê-los, de fato, os melhores do mundo.
As duas primeiras agências também merecem uma atenção especial, embora trabalhem quase exclusivamente no mercado italiano.
Aparentemente, agentes não revelados não se revelam por uma razão - eles vendem caro, não importa o quê.
Mais uma evidência de que Mino Raiola não é uma piada para Georges Mendes, apenas um pouco acima do mercado. PR está fazendo seu trabalho.
Bem, se você é um jovem jogador de futebol russo, então você já está indo bem Sinta-se livre para escolher uma agência no topo desta lista, você não perderá.
Faremos tudo, há muitos outros resultados, mas na minha opinião selecionei os mais interessantes.
Uma análise mais detalhada desses e de outros gráficos, além de tabelas completas, é possível em um laptop . E aqui eu conduzi ainda mais experimentos com esses dados.
E o mais importante, quero lembrá-lo de que esse método funciona com quase qualquer conjunto de dados tabulares. Primeiro, você determina quais parâmetros afetam mais fortemente o resultado (Importância do Recurso) e, em seguida, quais valores de parâmetros (Dependência Parcial) você precisa atingir para maximizar a função selecionada usando o método descrito neste artigo.
Desejo-lhe boa sorte nos experimentos, será interessante saber o que aconteceu com você :)