足球转移的模式:深入研究

现在该继续上一篇有关足球转移研究的文章了。


这次你会发现为什么 克洛普 如果您是一名足球运动员, Simeone非常酷 ,可以担任经纪人;如果您对足球不感兴趣,为什么还要阅读所有这些内容。



我们学会了收集很多数据。


环顾四周,例如,在工作中,我确定您会找到这款或那台平板电脑,其中包含必要的数据,供以后“当我们了解如何使用时”。 部分原因是它们之间的依赖性是高度非线性和非直观的。 我只是想了解最关注这些数据中的哪些,最重要的是影响结果的。 此外,我将通过示例演示如何使用允许完成此操作的最简单算法之一。


您可以在此笔记本电脑中找到播放方案本身以及完整的结果,下面将有许多最有趣的图表。


但首先,请介绍一下该方法。


想象一下,您不是在进行足球转账,而是拥有关于商店商品销售的数据(或者类似,但没有那么大的商业价值-类似于您的MOBA游戏中的比赛结果)以及许多背景信息:关于商店,商品,卖家(好,或者关于所选英雄,玩家,他们的实力)等等。 然后,您想要获得一个非常具体的结果-增加某种产品的销量(或改善游戏的平衡性)。


无论如何,该计划很简单:


  1. 了解哪个参数对最终结果的影响最大(出售的商品数量或游戏中某个角色的胜利百分比)以及如何
  2. 了解您可以真正影响以下哪个选项
  3. 专注于重要的事情(第1页)和可以更改的事情(第2页)

一切都很简单,仅需处理第1款。


实际上,这项任务绝非新手,而且无需使用任何神经网络,仅使用良好的旧统计数据即可轻松解决。 或英雄联盟。 但是很有可能不会:您是一个由多家商店组成的网络,一个中等受欢迎的游戏,并且您根本没有太多可使用的数据。 是的, LOL收集了数百万场比赛的结果,并且会有如此众多的参数组合,您可以比较他的搭档的选择如何影响给定英雄的胜利,而其他所有条件实际上都是相同的。 由于缺乏数据,人们不得不将苹果与橘子进行比较-我们根本没有足够的孤立案例。


为了简化这种情况,为了了解例如地图匹配组合如何影响赢得游戏的可能性,理想情况下,您必须拥有数千个结果,其中除我们感兴趣的参数以外的所有参数相同。 也就是说,具有相同技能水平的相同玩家在不同的地图上与不同的对手玩同一英雄。 如果您不是Riot Games,这将很难实现。


但是回到转移。 想象一下,我们想研究一个参数,例如“足球经纪人”,以了解哪个公司最适合足球运动员成为客户。 显然,我们必须去找组织最昂贵球员销售的经纪人。 如果我们采用标准的统计方法,我们将发现GestiFute是销售客户最成功的公司,这与他们的声誉完全一致。 但是我们如何才能将销售技巧与玩家自身的力量区分开呢? 毕竟,如果您的客户是Deco,Danny,Pepe,Diego Costa和谦虚的Cristiano ,那么卖出昂贵的商品并不难。 老实说,只有在代理商都被赋予同一组球员(既好又不是很好)并且被迫将他们卖给同一家具乐部的情况下,您才可以比较代理商。 但是在现实生活中很难想象有这样一个多元宇宙 。 但是我们有一个模型 ,可以给出任何数据集的结果(转移成本)。 是的,即使您强迫她计算戈瓜从坦波夫转移到CSKA的成本(如果由豪尔赫·门德斯进行)。 还有Akhmat的Glushakova,Real的Azar以及其他所有人。 然后对所有其他办公室执行相同的操作。 完全平等的条件。 然后剩下的只是计算每个代理商的整套参与者的价格,在这里,我们可以回答品牌多少(例如GestiFute) 增加参与者价格的问题
也就是说,我们分析了目标参数如何依赖于另一个先前 单独 设置的 参数


这称为部分依赖。


这样就可以分析任何参数了,我们现在就要做。


年龄


我为算法设置的第一件事是足球运动员的年龄并得到了这张照片



必须说,她让我陷入了悲伤。 因为这绝对不符合我的直觉。 这里有些东西坏了。 我很清楚,玩家的最高花费大约达到25-27岁,而17岁的玩家绝对不是最昂贵的。 正如我坚信的那样,无需任何模型即可从源数据构建简单的依赖关系。



是的,没错,这就是玩家的费用随年龄变化而变化的方式。


但是考虑了一下模型为我绘制的图像后,我意识到她是对的。 这是我最初认为它确实有效的那一刻,其中有些东西。 乍一看,该模型给了我一个意想不到的但矛盾的正确结果,使我可以从另一侧稍微看一下研究对象。


我们在第一个图表上看到什么,为什么习惯第二个图表?


实际上,转移成本很难仅使用原始数据与玩家年龄相关。 毕竟,为什么玩家在25岁之前变得更昂贵? 是因为他变老了吗? 不,他只是参加更多比赛,得分更高,开始为国家队效力,最终在粉丝中变得越来越受欢迎,等等,当然,这一切都随着年龄和经验的增长而完善,但这一切我们有单独的参数。 在第一个图表上,在其他所有条件相同的理想情况下,我们只能看到年龄的依赖性。 当然,在这种情况下,上赛季为俱乐部打进20球的球员经常为国家队效力,而在19岁那年,花费相同指标,在同一地点比赛但25岁的球员所花的钱将更多!


有趣的是,曲线到25年的斜率相当平缓,而在这个年龄之后,仅是坍塌。 考虑为什么会有如此显着的差异会很有趣。


季节


我建议比较各个赛季球员价值的“提炼”增长



您可以清楚地看到在90年代市场过热和10年代初的金融危机中如何幸免于难,图表自信地走向了几乎指数级的增长曲线。


但是,同一图表仅基于数据。 请注意,近年来球员价值的增长没有那么明显



相关参数


代理商,年龄和(在较小程度上)季节是相当罕见的独立参数类别的示例。 最后,您可以轻松地想象一个参与者如何从一个机构转移到另一个机构,这对其他参数几乎没有影响。 但是,假设我们要了解哪个俱乐部购买者必须为球员支付的费用最高。 您可以使用一个参数to_club_name并计算结果。 但是在这里,我们已经很难不考虑to_clb_lg_nameto_clb_lg_countryto_clb_lg_group的相关值,这些值显示了该俱乐部所在的联赛。 是的,我们可以将他们分开,以找出曼联仅凭其品牌实力购买的球员要花多少钱,以及“英国利润”分别赚多少钱,但最常见的是我们对合并结果感兴趣。 最后,曼彻斯特不打算从英格兰移动到任何地方,因此我们将立即研究一组参数。


图表中的数字是多少?

“列”之后的数字是此参数相对于平均价格增加转移价格多少的系数


“栏”内的数字及其色调指示使用此参数的传输次数


俱乐部买家



在来自马德里市的18个英国俱乐部和一个皇家俱乐部的20个最慷慨的购买者中,这并不让我感到惊讶,但是Makhachkala Anji的第三个(!)位置再次表明,他应该获得提名`` 俄罗斯派对''的奖项。
顺便说一句,此列表中只有一个俱乐部不再存在。



如果对立面价格更高,那么我们这里的俱乐部其品牌相反,它允许您购买比市场更便宜的相同球员。 被比利时人俘虏


葡萄牙语在哪里? -你问。 很快一切都会-我会回答你和我自己。


俱乐部卖家



销量最高的俱乐部。 取悦矿工的第二名(当之无愧的尊重); 巴西和阿根廷的大多数顶级地区的存在是显而易见的; 塞维利亚 最后是本菲卡,销售额最高。
但是,最有趣的当然是近距离观察Atalanta。 在过去的十年中,谁卖得这么好? 数量也少于五十件吗? 让我提醒您,2008-2018年的数据与今天的亚特兰大相比 褪色 加斯佩里尼和欧洲冠军联赛!



作为局外人,荷兰人当时就是在他们身边,他们说在那里可以买到最便宜的优质球员。 突然之间,天顶(Zenith)和沃尔夫斯堡(Wolfsburg)...


俱乐部表现


由于我们掌握了最昂贵的商品和最便宜的商品的数据,因此我们不禁看到相对而言最大的差异。



非常有趣的图片。 比利时人,阿根廷人和巴西人,显然值得与阿尔克马尔的贝西克塔斯,以及本菲卡和波尔图的交易最多。


特别值得一提的是安德莱赫特(Anderlecht)-排行榜前10名和100多次转会。



这次以“效率”来衡量的对立面,又散布在巴塞罗那的英国人抓住 。 曼联的0.5简直令人恐惧。


在这里有必要说任何数据都只显示它们显示的内容。 在这种情况下,这是购买时的“俱乐部额外费用”除以销售时的“俱乐部额外费用”。
难怪我用引号表示“效率”。 世界上最好的俱乐部不能拒绝“效率”的顶峰,他们的任务不是卖出尽可能昂贵的球员,而是从他们那里获得最好的职业生涯,从中获得最大的收益,将他们变成俱乐部的结果。 顶级俱乐部中的优秀球员只能替换数年,但这会降低其价格,但如果俱乐部需要,他会这样做。 如果顶级俱乐部将球员出售给中农(并且由于从顶部转换到顶部几乎不会改变整体平衡,所以这对时间表产生了更大的影响),那么多数情况下这意味着他没有通过测试(嗯,或者通常看起来像那样),再次出售什么在另一个顶级俱乐部,这将变得更加困难(即,它们会增加球员的价格)。


也就是说,就此图中的“效率”而言,如果比较有意义,则仅是同一类别的俱乐部(顶级俱乐部,捐助者,比利时俱乐部:)等)



例如这里-俄罗斯俱乐部的“有效性”。 CSKA领导层非常期待。 斯巴达克感到惊讶,直到我想起他们仍然卖得很好。 例如,他们设法以几乎与购买时相同的价格出售在俄罗斯失败的卡文纳格人。


关于泽尼特和安吉,我们已经说过了。


联赛



这是英国在对立面(以及比利时在上层面)中的领导地位的“秘密”。 英语页边空白。 它超过了所有其他前6个国家/地区的总和。


买家培训师



好吧,我要说的是...与顶级教练和顶级俱乐部一样-您邀请他们提供成绩,而不是增加球员的价值。 相反,他们将不得不为他们多付钱,购买所需的球员。 曼奇尼(Mancini)仅出现在此列表的末尾,尽管拥有大量的玩家,这是令人惊讶的。 毫不奇怪,在顶部有贾尔丁和波切蒂诺。 但是我们会认为这是“顶级教练”头衔的分配。


销售教练



Zhardim,Lucescu和Pochettino购买昂贵,但也出售昂贵。 不足为奇的是,他们每个人都在指定的时间与“尊重”状态的俱乐部(摩纳哥,沙克塔尔和热刺)合作而闻名。 Simeone-boch:游戏系统,将Atletico撤回给领导者,使球员的价值获得惊人的增长。


一行


从一对俱乐部教练员 那里购买时最大的利润:1.安吉的古斯·希丁克; 2.亚历克斯·弗格森爵士, 很清楚 ; 3. Louis van Gaal, 很清楚曼联在哪里


Chenol Gunesh从贝西克塔斯( Besiktas )购买了大量转账中最便宜的一次,再次值得一看。


一对俱乐部球员夫妇,但销售 :1. Shakhtar的Mircea Lucescu; 2。 2)迭戈·西梅内​​(Diego Simene),竞技队; 3,摩纳哥莱昂纳多·贾丁(Leonardo Jardim)


奇怪的是 ,在这里只有第二名的迭戈表示,在Atlético之前他甚至卖得更好。


代理人


最后,顶级代理商的有效性



我们已经讨论过Gestifute。 但是,现在您可以作出裁决:是的,它们是最好的


他们自己就是好人。 他们不仅拥有克里斯蒂亚诺·罗纳尔多(Cristiano Ronaldo)和其他伟大的球员,而且他们也知道如何出售他们,事实上,这是世界上最好的。


前两个代理商也值得特别仔细地研究,尽管它们几乎只在意大利市场上工作。


显然, 未公开的代理商不会出于某种原因而露面-无论如何,他们都卖得很高。


进一步的证据表明, Mino Raiola不是Georges Mendes的笑话,只是略高于市场。 公关正在做自己的工作。


好吧,如果您是年轻的俄罗斯足球运动员,那么 你已经很好了 随意从此列表的顶部选择代理商,您不会因此而输。


我们将尽一切努力,还有更多结果,但我认为,我选择了最有趣的结果。
笔记本电脑中 ,可以仔细查看这些图和其他图以及完整的表格。 在这里,我对这些数据进行了更多的实验。


最重要的是,我想提醒您,该方法几乎适用于任何表格数据集。 首先,您确定哪些参数对结果的影响最大(功能重要性),然后确定要使用本文介绍的方法来最大化所选功能的参数值(部分相关性)。


希望您在实验中一切顺利,知道您发生了什么会很有趣:)

Source: https://habr.com/ru/post/zh-CN471484/


All Articles