Apa yang memberi pembelajaran mesin ritel: contoh proyek

Ritel memiliki lingkaran pelanggan yang sangat beragam. Ada banyak dari mereka - berbagai profesi dan tingkat pendapatan, dari kaum muda hingga warga lanjut usia. Variasi seperti itu tidak dapat dijelaskan dengan benar oleh dua atau tiga aturan bisnis, karena Anda tidak dapat mencakup semua kombinasi kriteria dan kehilangan beberapa pelanggan. Oleh karena itu, untuk ritel, sangat penting untuk membuat segmentasi audiens Anda seakurat mungkin, tetapi hal ini tentu menyulitkan para model. Teknologi Machine Learning datang untuk menyelamatkan di sini, memberi perusahaan perkiraan dan jawaban yang lebih akurat untuk pertanyaan-pertanyaan penting.





Apa pertanyaan yang kamu maksud? Misalnya: apakah klien akan pergi? Seringkali pelanggan pergi jika toko tidak memiliki produk yang tepat. Misalnya, seorang wanita membeli krim khusus setiap bulan dengan harga 10 ribu rubel dan dapat memilih dari dua toko kosmetik. Di salah satu dari mereka, produk yang diperlukan sering hilang, dan yang kedua tidak ada masalah dengan ketersediaan. Kemungkinan besar, dia akan terus membeli di yang kedua, meskipun sedikit lebih mahal.

Pertanyaan mendesak lainnya: bagaimana cara mengoptimalkan kerja staf? Misalnya, Anda perlu merencanakan shift kerja untuk kasir dan konsultan penjualan. Salah satu cara melibatkan menggunakan analisis statistik. Analis mengevaluasi aktivitas klien tergantung pada hari dalam seminggu dan melihat bahwa pada hari Sabtu mereka membeli paling banyak, dan pada hari Jumat dan Minggu sedikit kurang. Hipotesis ini diperiksa dengan uji statistik, dan kesimpulan diteruskan ke manajemen.

Tetapi analisis semacam itu mungkin tidak memperhitungkan banyak kombinasi faktor. Misalnya, jika 7 Maret adalah pada hari Rabu - akankah mereka membeli lebih banyak pada hari ini daripada pada hari Jumat (setelah semua, pada waktu normal, Jumat adalah hari yang lebih populer daripada hari kerja lainnya)? Dan kelulusan? Atau hari libur lokal? Semakin banyak faktor, semakin sulit untuk memperhitungkan semuanya menggunakan aturan sederhana. Dan alih-alih menyulitkan aturan secara tak terbatas, Anda dapat membangun model yang memprediksi permintaan untuk hari tertentu.



Proyek kami di ritel non-makanan


Dalam hal ini, perlu untuk menganalisis basis pelanggan (sekitar 2,5 juta orang) dan memperkirakan yang mana dari mereka yang akan kembali ke toko dalam dua minggu ke depan. Kami mengambil dua metode perpustakaan CatBoost - CatBoostClassifier dan CatBoostRegressor, yang pertama - untuk memprediksi komposisi audiens, yang kedua - untuk memilih produk paling populer dalam 2 minggu ke depan. CatBoost keluar pada awal proyek kami, itu adalah pendekatan baru untuk bekerja dengan atribut kategorikal. Dan karena rangkaian produk pelanggan kami mengandung banyak fitur kategori, kami dengan senang hati mencoba produk baru. Setelah memilih parameter, model segera memenuhi harapan kami dengan perkiraan yang akurat. Tidak heran CatBoost adalah salah satu model peningkatan gradien paling populer saat ini.

Untuk model, kami mengambil statistik untuk 2017:

  • cek: siapa yang memiliki kartu bonus dari cek, ketika pembelian dilakukan, apa yang mereka beli, ukuran diskon, beli atau kembalikan.
  • demografi: wilayah dan kota tempat tinggal klien, tanggal lahir dan jenis kelamin, persetujuan untuk mengirim melalui telepon atau surat.
  • produk: kategori atau segmen mana yang termasuk pembelian, ruang lingkup, dll.

Kami membersihkan data kebisingan (kartu penjual, pengembalian, pembelian layanan, bukan barang) dan menghitung kriteria yang diperlukan (persentase diskon, usia). Setelah itu, kami menghitung tanda terima terbesar dan terkecil untuk setiap pelanggan, rata-rata, median, dan diskon maksimum, berapa kali seseorang masuk dan berapa banyak produk dari kategori mana ia membeli. Parameter-parameter ini dihitung dalam interval: minggu lalu, dua minggu, sebulan, tiga bulan. Pekerjaan teliti seperti itu memungkinkan untuk membangun model dengan akurasi perkiraan yang tinggi.

Data agregat untuk model dan meluncurkan perhitungan. Model pertama memperkirakan pembeli mana yang akan datang dalam dua minggu ke depan, dan yang kedua mengeluarkan rekomendasi: produk apa (hingga tingkat artikel) yang akan dibeli orang tertentu. Ngomong-ngomong, persyaratan untuk memprediksi popularitas artikel tertentu sangat menyulitkan tugas (biasanya prakiraan kebutuhan bisnis berdasarkan kategori dan nama barang daripada posisi).

Klien yang direkomendasikan oleh model untuk pengiriman surat menyurat memiliki median cek yang lebih besar dalam satu kunjungan, dan untuk periode yang dianalisis mereka membeli jumlah total yang lebih tinggi daripada klien lain.



Akibatnya, setelah pengiriman, sekitar 30% pelanggan membeli setidaknya satu dari tiga produk yang diprediksi oleh model.

Sekarang perusahaan dapat memprediksi penjualan dengan lebih akurat: pengecer tahu siapa yang akan datang kepadanya dalam waktu dekat dan apa yang akan dibeli. Ini membantu tidak hanya mengoptimalkan logistik, tetapi juga mengurangi biaya terkait. Misalnya, jika klien tertentu biasanya tidak membeli apa pun di musim dingin, maka Anda tidak perlu mengiriminya SMS pada bulan Januari. Model juga mengoptimalkan pengiriman surat: spesialis berdasarkan perkiraan segera memahami siapa yang harus mengirim email, dan kepada siapa - SMS mendesak.

Perangkap


Mereka ada dalam tugas ML - mereka ada di tangan kita. Misalnya, kami menguji apakah pengiriman rekomendasi produk membantu meningkatkan penjualan. Untuk ini, segmen pelanggan yang diprediksi dibagi menjadi tiga kelompok:

  1. Kontrol - tidak menerima buletin.
  2. Grup dengan pengingat - menerima teks umum dari toko.
  3. Grup dengan rekomendasi - menerima SMS dengan tiga produk spesifik yang diprediksi oleh model.

Ternyata orang yang menerima rekomendasi membeli kurang dari pelanggan yang tidak menerima buletin. Rata-rata tagihan dan jumlah barang yang dibeli lebih sedikit. T-test menunjukkan bahwa perbedaannya signifikan secara statistik (pvalue = 0,017).



Singkatnya, hasil seperti itu membuat semua orang kecil hati. Mereka mulai mencari alasannya dan mendapati bahwa toko-toko tersebut mengirim pesan kepada pelanggan melalui messenger tertentu, dan para penggunanya di segmen kami pada awalnya membeli lebih sedikit daripada pelanggan lain. Bahkan pemasar pelanggan tidak tahu tentang ini. Jadi percobaan itu ternyata tidak benar, tetapi menurut hasilnya, kami menambahkan parameter "pengguna messenger" ke model. Kasus ini menunjukkan cara memilih saluran untuk komunikasi dengan pelanggan dengan cermat.
Apa kesimpulan lain yang bisa ditarik?

  • Tidak banyak data.
  • Terkadang pandangan analis dari samping mengarah ke ide baru.

Segmentasi pelanggan


Analisis data memungkinkan Anda mendeteksi pola yang disembunyikan dalam informasi yang tersedia sebelumnya. Contoh yang baik adalah membandingkan grup pelanggan menggunakan segmentasi RFM (Recency Frequency Monetary) dan segmentasi menggunakan algoritma ML.

Segmentasi RFM menggunakan tiga metrik utama:

  • Resep pembelian terakhir
  • frekuensi pembelian untuk periode tersebut
  • jumlah yang dihabiskan oleh klien.

Berdasarkan data ini, kelompok utama dibedakan: "penghambur", "pelanggan setia", "pelanggan yang hampir hilang", dll. Dan pemasar sudah memasukkan kelompok sasaran yang diinginkan dalam buletin tertentu atau membuat penawaran khusus untuk kelompok ini.

Misalnya, menggunakan segmentasi RFM, Anda dapat memilih segmen pelanggan dan mewakili mereka sebagai titik dalam ruang tiga dimensi:



Ini memungkinkan Anda untuk melihat secara visual lokasi grup tertentu dalam total massa pelanggan, proporsi mereka, dan dinamika perubahan.

Sekarang proyeksikan distribusi tiga dimensi segmen di pesawat. Klien dapat dibagi dengan pendapatan yang dibawa oleh perusahaan untuk memasukkan yang paling menguntungkan dalam kampanye pemasaran, tetapi apakah ini cukup untuk perencanaan yang efektif?

Bahkan dalam data seperti itu, algoritma pembelajaran mesin menemukan kemungkinan tambahan: itu membagi pelanggan menjadi kelompok besar baru. Anda dapat menganalisis partisi ini untuk mencari tahu mengapa algoritma membagi klien dengan cara ini. Sebagai contoh, beberapa pelanggan yang sangat menguntungkan adalah para ahli yang menemani pelanggan mereka dalam berbelanja dan menggunakan kartu diskon mereka; beberapa aktif berbagi kartu mereka dengan teman dan kenalan. Artinya, setelah penggunaan pertama ML, Anda bisa mendapatkan informasi tambahan tentang pelanggan Anda berdasarkan semua data yang sama.



Mari kita memperluas serangkaian karakteristik pelanggan: tambahkan jenis kelamin, usia, perilaku, dan banyak lagi. Bagaimana sekarang algoritma akan mendistribusikan pembeli?

Misalnya, ada grup yang mencakup pelanggan terbaik (yang paling menguntungkan) dan "tetangga" mereka, yang menghasilkan lebih sedikit keuntungan. Mengapa algoritme yang dialokasikan grup ini adalah pertanyaan untuk analis. Mungkin klien dengan stimulasi tambahan ini akan menunjukkan profitabilitas yang lebih besar. Atau, sebaliknya, klien-klien ini tidak terlalu menjanjikan, dan peningkatan profitabilitas adalah penyimpangan acak - untuk merangsang mereka juga tidak ada gunanya. Berbagai teori dapat dikemukakan, tetapi harus diverifikasi secara eksperimental.



Perencanaan Gudang - Perkiraan Penjualan


Lebih lanjut, proyek ini memiliki beberapa opsi pengembangan. Misalnya, Anda dapat memperkirakan pembelian di toko tertentu untuk periode mendatang. Kemudian administrator toko akan dapat memesan barang-barang yang diperlukan dari gudang pusat tepat waktu.

Analisis pembelian di outlet tertentu akan membantu merumuskan tampilan barang di etalase. Misalnya, jika banyak pembeli pria datang ke toko, departemen dengan produk pria tidak boleh ditempatkan di sudut yang jauh.

Jangan lupa tentang kanibalisasi toko. Yaitu, jika dua titik penjualan dari jaringan yang sama berada di dekatnya (misalnya, di ujung yang berbeda dari jalan yang sama), salah satunya dapat menarik pelanggan, dan yang kedua akan diam. Anda dapat membangun model yang akan melacak fenomena dan sinyal tentang hal itu.

***

Singkatnya, pembelajaran mesin adalah alat yang ampuh yang dapat melakukan banyak hal. Seringkali ketika membangun model, pola yang tidak jelas terungkap bahwa bahkan pengguna bisnis tidak mengetahuinya. Namun, kualitas model sangat tergantung pada kualitas dan kuantitas data.

Analis Direktorat Pengembangan dan Implementasi Perangkat Lunak, Jet Infosystems

Source: https://habr.com/ru/post/id430448/


All Articles