Model transfer sepakbola: menggali lebih dalam

Saatnya untuk melanjutkan artikel sebelumnya tentang studi transfer sepak bola.


Kali ini Anda akan mencari tahu alasannya Klopp Simeone sangat keren siapa yang harus menjadi agen jika Anda seorang pemain bola dan mengapa membaca semua ini jika Anda tidak tertarik dengan sepakbola.



Kami belajar mengumpulkan banyak data.


Lihatlah di sekeliling Anda, misalnya, di tempat kerja, saya yakin Anda akan menemukan ini atau piring itu dengan, seperti, data yang diperlukan tersisa untuk nanti, "ketika kita mengerti apa yang harus dilakukan dengan itu". Ini sebagian karena dependensi di dalamnya sangat non-linear dan non-intuitif. Dan saya hanya ingin memahami data mana yang paling diperhatikan, yang paling mempengaruhi hasilnya. Selanjutnya, saya akan menunjukkan dengan contoh bagaimana menggunakan salah satu algoritma paling sederhana yang memungkinkan Anda melakukan ini.


Anda dapat menemukan skema pemutaran itu sendiri, serta hasil penuh di laptop ini , dan di bawah ini akan ada banyak grafik dengan yang paling menarik.


Tapi pertama-tama, sedikit tentang metodenya.


Bayangkan bahwa Anda tidak bekerja dengan transfer sepak bola, tetapi Anda memiliki data penjualan barang toko (baik, atau contoh yang sedikit lebih merkantilis - dengan hasil pertandingan dalam permainan seperti MOBA Anda) dan banyak informasi latar belakang: tentang toko, barang, penjual ( baik, atau tentang pahlawan, pemain yang dipilih, kekuatan mereka), dll. Maka Anda ingin mencapai hasil yang sangat spesifik - untuk meningkatkan penjualan produk tertentu (atau meningkatkan keseimbangan permainan Anda).


Bagaimanapun, rencananya sederhana:


  1. memahami parameter mana yang paling kuat mempengaruhi hasil akhir (jumlah barang yang terjual atau persentase kemenangan karakter tertentu dalam permainan) dan bagaimana
  2. Pahami opsi mana yang benar-benar bisa Anda pengaruhi
  3. fokus pada apa yang penting (hal. 1) dan apa yang dapat diubah (hal. 2)

Semuanya sederhana, tetap hanya berurusan dengan ayat 1.


Sebenarnya, tugas ini masih jauh dari baru dan cukup mudah untuk diselesaikan tanpa menggunakan jaringan saraf, hanya menggunakan statistik lama yang baik ... Jika Anda memiliki data Magnet. Atau League of Legends. Tetapi ada kemungkinan besar hal itu tidak terjadi: bahwa Anda adalah jaringan beberapa toko, permainan yang cukup populer, dan Anda tidak memiliki banyak data yang dapat Anda gunakan. Ya, LoL mengumpulkan hasil jutaan pertandingan, dan akan ada begitu banyak kombinasi parameter sehingga Anda dapat membandingkan bagaimana pilihan mitranya memengaruhi kemenangan pahlawan yang diberikan, semua hal lainnya praktis sama. Dengan kekurangan data, kita harus membandingkan apel dengan jeruk - kita tidak punya cukup case yang terisolasi.


Untuk menyederhanakan situasi, untuk memahami bagaimana, misalnya, kombinasi peta-pertarungan memengaruhi probabilitas memenangkan permainan Anda, idealnya, Anda harus memiliki beberapa ribu hasil di mana semua parameter kecuali yang menarik bagi kami adalah sama. Yaitu, sehingga pemain yang sama dengan tingkat keterampilan yang sama memainkan pahlawan yang sama di peta yang berbeda dengan lawan yang berbeda. Ini sulit dicapai jika Anda bukan Riot Games .


Tetapi kembali ke transfer. Bayangkan kita ingin menyelidiki satu parameter - "agen sepakbola", misalnya, untuk memahami perusahaan mana yang terbaik bagi pemain sepak bola untuk menjadi klien. Jelas bahwa kita harus pergi ke agen yang mengatur penjualan pemain paling mahal . Jika kita menerapkan metode statistik standar, kita akan melihat bahwa GestiFute adalah perusahaan paling sukses yang menjual pelanggannya, yang sepenuhnya konsisten dengan reputasi mereka. Tetapi bagaimana kita bisa memisahkan keterampilan menjual dari kekuatan pemain itu sendiri? Pada akhirnya, tidak terlalu sulit untuk menjual mahal jika klien Anda adalah Deco, Danny, Pepe, Diego Costa dan seorang pria sederhana bernama Cristiano . Jujur, Anda dapat membandingkan agensi hanya jika mereka semua diberikan set pemain yang sama (baik dan tidak baik) dan dipaksa untuk menjualnya ke klub yang sama. Tetapi multiverse seperti itu sulit dibayangkan dalam kehidupan nyata . Tetapi kami memiliki model yang memberikan hasil (biaya transfer) untuk set data apa pun. Ya, bahkan jika Anda memaksanya untuk menghitung biaya transfer Gogua dari Tambov ke CSKA, jika itu dilakukan oleh Georges Mendes. Dan Glushakova di Akhmat, dan Azar di Real dan yang lainnya. Kemudian lakukan trik yang sama dengan semua kantor lainnya. Kondisi yang sama sempurna. Maka tetap saja menghitung harga seluruh set pemain untuk masing-masing agensi dan di sini kita memiliki jawaban untuk pertanyaan tentang seberapa banyak milik merek, misalnya GestiFute, meningkatkan harga pemain .
Yaitu, kami menganalisis bagaimana parameter target bergantung pada parameter lain yang sebelumnya ditetapkan dalam isolasi, dan hanya itu .


Ini disebut Ketergantungan Partial.


Dan jadi mungkin untuk menganalisis parameter apa pun, yang akan kita lakukan sekarang.


Usia


Hal pertama yang saya tetapkan algoritmanya adalah usia pesepakbola dan mendapatkan gambar ini



Dia, harus dikatakan, membuatku sedih. Karena itu sama sekali tidak konsisten dengan intuisi saya. Ada yang rusak di sini. Saya juga tahu bahwa biaya maksimum pemain mencapai puncaknya sekitar 25-27 tahun, bahwa pemain di usia 17 tahun jelas bukan yang paling mahal. Karena saya yakin dengan membangun ketergantungan sederhana dari sumber data, tanpa model apa pun.



Ya, benar, begitulah perilaku pemain tergantung pada usia, punuk.


Tetapi setelah berpikir sedikit tentang apa yang dilukis oleh model itu untuk saya, saya menyadari bahwa dia benar. Ini adalah saat ketika saya pertama kali percaya bahwa itu benar-benar berfungsi, bahwa ada sesuatu di dalamnya. Model itu memberi saya, pada pandangan pertama, hasil yang tak terduga, tetapi secara paradoks benar dan memungkinkan saya untuk melihat objek studi sedikit dari sisi lain.


Apa yang kita lihat pada bagan pertama dan mengapa kita terbiasa dengan bagan kedua?


Biaya transfer, pada kenyataannya, sangat sulit untuk dikorelasikan dengan usia pemain yang hanya menggunakan data mentah. Lagi pula, mengapa seorang pemain menjadi lebih mahal pada usia 25? Apakah karena dia semakin tua? Tidak, dia hanya memainkan lebih banyak pertandingan, mencetak lebih banyak, mulai bermain untuk tim nasional, menjadi lebih populer di kalangan penggemar pada akhirnya, dll., Semua ini, tentu saja, seakan lengkap dengan usia dan mendapatkan pengalaman, tetapi semua ini kami memiliki parameter terpisah. Dan pada grafik pertama kita melihat ketergantungan hanya pada usia, dalam skenario yang ideal, ketika segala sesuatu yang lain sama. Tentu saja, dalam hal ini, seorang pemain yang mencetak 20 gol musim lalu untuk klubnya secara teratur bermain untuk tim nasional, pada usia 19 tahun akan lebih mahal daripada pemain yang sama persis dengan indikator yang sama, bermain di tempat yang sama, tetapi pada usia 25!


Sangat menarik di sini bahwa kemiringan kurva hingga 25 tahun cukup lembut, sedangkan setelah usia ini hanya ada keruntuhan. Akan menarik untuk memikirkan mengapa ada perbedaan yang mencolok?


Musim


Saya mengusulkan untuk membandingkan pertumbuhan "suling" dalam nilai pemain di musim



Anda dapat melihat dengan jelas bagaimana selamat dari kepanasan pasar tahun 90-an dan krisis keuangan awal tahun 10-an, grafik dengan percaya diri bergerak ke kurva pertumbuhan yang hampir eksponensial.


Tetapi bagan yang sama dibangun semata-mata pada data. Perhatikan betapa kurang menonjolnya pertumbuhan nilai pemain dalam beberapa tahun terakhir



Parameter terkait


Agensi, usia dan, pada tingkat lebih rendah, musim adalah contoh kategori parameter independen yang cukup langka. Pada akhirnya, Anda dapat dengan mudah membayangkan bagaimana seorang pemain bergerak dari satu agensi ke agensi lain dan ini akan berdampak kecil pada parameter lainnya. Tapi katakanlah kita ingin memahami klub-pembeli mana yang harus membayar paling banyak untuk para pemain. Anda dapat mengambil satu parameter to_club_name dan menghitung hasilnya. Tapi di sini sudah sulit bagi kita untuk tidak memperhitungkan nilai terkait to_clb_lg_name , to_clb_lg_country , to_clb_lg_group , yang menunjukkan liga mana yang dimainkan klub ini. Ya, kami dapat memisahkan mereka dan mencari tahu berapa banyak Man Utd yang lebih mahal membeli pemain semata-mata karena kekuatan mereknya, dan seberapa banyak "margin bahasa Inggris" dibuat secara terpisah, tetapi paling sering kami tertarik pada hasil gabungan. Pada akhirnya, Manchester tidak berencana untuk pindah dari Inggris, jadi kami akan segera menyelidiki sekelompok parameter.


Berapakah angka dalam grafik?

Angka setelah "kolom" adalah koefisien berapa banyak parameter ini meningkatkan harga transfer relatif terhadap rata-rata


Angka di dalam "kolom", serta rona, menunjukkan jumlah transfer dengan parameter ini


Pembeli Klub



Fakta bahwa dari 20 pembeli paling dermawan dari 18 klub Inggris dan satu klub kerajaan dari kota Madrid tidak benar-benar mengejutkan saya, tetapi tempat ketiga (!) Makhachkala Anji sekali lagi menunjukkan bahwa ia layak mendapatkan hadiah dalam nominasi " Party Like A Russian ".
Ngomong-ngomong, hanya satu klub dari daftar ini yang tidak ada lagi.



Jika antitopnya lebih tinggi, maka di sini kita memiliki klub yang mereknya, sebaliknya, memungkinkan Anda membeli pemain yang sama lebih murah daripada pasar. Diambil oleh Belgia !


Di mana orang Portugis? - kamu bertanya. Segera semuanya akan, - Saya akan menjawab Anda dan saya sendiri.


Penjual klub



Klub yang paling banyak menjual. Menyenangkan tempat kedua dari Penambang (penghormatan yang layak); kehadiran sebagian besar puncak Brasil dan Argentina jelas; Seville dan akhirnya Benfica, dengan jumlah penjualan tertinggi.
Tapi yang paling menarik, tentu saja, akan lebih dekat dengan Atalanta. Siapa yang telah dia jual dengan sangat baik dalam 10 tahun terakhir? Begitu juga dalam jumlah di bawah lima puluh keping? Biarkan saya mengingatkan Anda bahwa data untuk 2008-2018 jauh dari Atalanta hari ini pudar Gasperini dan Liga Champions!



Sebagai orang luar, Belanda, itu hanya tentang mereka pada masa itu bahwa mereka mengatakan bahwa pemain berkualitas di sana dapat membeli yang termurah. Dan, tiba-tiba, Zenith dengan Wolfsburg ...


Kinerja Klub


Karena kami memiliki data tentang mereka yang menjual yang paling mahal dan membeli yang termurah, kami tidak bisa tidak melihat siapa yang memiliki perbedaan ini, secara relatif, yang terbesar.



Gambar yang sangat menarik. Orang-orang Belgia, Argentina dengan orang-orang Brasil, yang jelas layak melihat Besiktas dengan Alkmaar, dan akhirnya Benfica dan Porto dengan penawaran terbanyak.


Catatan khusus adalah Anderlecht - 10 teratas dalam daftar dan lebih dari 100 transfer.



Antitop, kali ini dalam hal "efisiensi", sekali lagi ditangkap oleh Inggris dengan Barcelona kecil diselingi. 0,5 di Manchester United menakutkan.


Di sini perlu untuk mengatakan bahwa data apa pun hanya menunjukkan apa yang ditampilkan. Dalam hal ini, ini adalah "biaya tambahan untuk klub" pada saat pembelian dibagi dengan "biaya tambahan untuk klub" pada penjualan.
Tidak heran saya mengambil "efisiensi" dalam tanda kutip. Klub-klub terbaik di dunia tidak dapat menolak atas "keefektifan", tugas mereka bukanlah menjual pemain semahal mungkin, tetapi untuk mengambil tahun-tahun karier terbaik dari mereka, memeras maksimal, mengubahnya menjadi hasil klub. Pemain yang sangat baik di klub top hanya bisa menggantikan selama bertahun-tahun, tetapi ini akan mengurangi harganya, tetapi jika diperlukan untuk klub, ia akan melakukannya. Jika klub top menjual pemain ke petani menengah (dan ini lebih mempengaruhi jadwal sejak beralih dari atas ke atas hampir tidak mengubah keseimbangan keseluruhan), maka paling sering ini berarti bahwa ia tidak lulus ujian (baik, atau biasanya tampak seperti itu), apa yang harus dijual itu akan menjadi lebih sulit di klub top lain (yaitu, mereka menaikkan harga pemain).


Yaitu, dalam hal "efisiensi" dalam grafik ini, jika masuk akal untuk membandingkan, maka hanya klub dengan kategori yang sama (klub top, donor, klub Belgia :), dll.)



Seperti misalnya di sini - "efektivitas" klub-klub Rusia. Kepemimpinan CSKA sangat diharapkan. Spartak terkejut sampai saya ingat bahwa mereka masih menjual pemain mereka dengan baik. Misalnya, mereka berhasil menjual Cavenags yang gagal di Rusia dengan harga yang hampir sama dengan yang mereka beli.


Tentang Zenit dan Anji, sudah kami katakan.


Liga



Dan inilah "rahasia" kepemimpinan Inggris di antitop (dan Belgia di puncak). Margin bahasa Inggris dalam semua aibnya. Ini lebih dari jumlah margin semua negara top6 lainnya yang digabungkan.


Pelatih Pembeli



Nah, apa yang bisa saya katakan ... Dengan pelatih top seperti halnya klub top - Anda mengundang mereka untuk memberikan hasil, bukan meningkatkan nilai pemain. Sebaliknya, mereka harus membayar lebih untuk mereka, membeli pemain yang mereka butuhkan. Sungguh menakjubkan melihat Mancini hanya di akhir daftar ini, meskipun dengan sejumlah besar pemain. Tidak kalah mengejutkan bahwa di puncak ada Jardim dengan Pochettino. Tapi kami akan menganggap ini sebagai penugasan gelar "pelatih top" bagi mereka.


Pelatih Penjualan



Zhardim, Lucescu dan Pochettino membeli mahal, tetapi juga menjual mahal. Tidak mengherankan bahwa masing-masing dari mereka terkenal karena bekerja pada waktu yang ditentukan dengan klub (Monako, Shakhtar dan Tottenham) tentang status "rasa hormat." Simeone - boch: sistem permainan, penarikan Atletico kepada para pemimpin, peningkatan luar biasa dalam nilai pemain.


Dalam satu baris


Margin terbesar saat membeli dari pasangan pelatih klub : 1.Gus Hiddink, di Anji; 2. Sir Alex Ferguson, di mana jelas ; 3. Louis van Gaal, jelas dimana United .


Yang termurah dari semua, dari sejumlah besar transfer, dibeli oleh Chenol Gunesh dari Besiktas, sekali lagi layak untuk dilihat lebih dekat.


Pasangan pemain klub, tetapi dalam penjualan : 1. Mircea Lucescu, Shakhtar; 2.Diego Simene, Atlético; 3.Leonardo Jardim, Monako.


Hanya tempat kedua Diego di sini, secara paradoks , menunjukkan bahwa sebelum Atlético ia bahkan menjual pemain lebih baik.


Agen


Dan akhirnya, efektivitas agen teratas



Kami sudah bicara tentang Gestifute. Tapi sekarang Anda bisa mengeluarkan vonis: ya, mereka yang terbaik .


Mereka baik sendiri. Mereka tidak hanya memiliki Cristiano Ronaldo dan pemain hebat lainnya, mereka juga tahu cara menjualnya, bahkan, yang terbaik di dunia.


2 agensi pertama juga patut diperhatikan secara khusus, meskipun mereka bekerja hampir secara eksklusif di pasar Italia.


Agen yang dirahasiakan , tampaknya, tidak mengungkapkan diri mereka karena suatu alasan - mereka menjual mahal, tidak peduli apa.


Bukti lebih lanjut bahwa Mino Raiola bukan lelucon untuk Georges Mendes, hanya sedikit di atas pasar. PR melakukan tugasnya.


Nah, jika Anda adalah pemain muda Rusia, maka Anda sudah melakukannya dengan baik Jangan ragu untuk memilih agensi dari atas daftar ini, Anda tidak akan kehilangan.


Kami akan melakukan segalanya, ada banyak hasil lagi, tetapi saya telah memilih yang paling menarik, menurut saya.
Melihat lebih dekat pada grafik ini dan lainnya, bersama dengan tabel lengkap, dimungkinkan di laptop . Dan di sini saya melakukan lebih banyak eksperimen pada data ini.


Dan yang paling penting, saya ingin mengingatkan Anda bahwa metode ini bekerja dengan hampir semua kumpulan data tabular. Pertama, Anda menentukan parameter mana yang paling kuat mempengaruhi hasil (Pentingnya Fitur), dan kemudian nilai parameter mana (Ketergantungan Partial) yang perlu Anda capai untuk memaksimalkan fungsi yang dipilih menggunakan metode yang dijelaskan dalam artikel ini.


Semoga sukses dalam eksperimen, akan menarik untuk mengetahui apa yang terjadi dengan Anda :)

Source: https://habr.com/ru/post/id471484/


All Articles