Pengantar sistem rekomendasi

Artikel ini membahas pendekatan untuk membangun produk dan rekomendasi konten yang dipersonalisasi, dan kemungkinan penggunaan kasus.

Rekomendasi produk dan konten yang dipersonalisasi digunakan untuk meningkatkan konversi, rata-rata memeriksa dan meningkatkan pengalaman pengguna.



Contoh menggunakan pendekatan ini adalah Amazon dan Netflix. Amazon mulai menggunakan pendekatan penyaringan kolaboratif di tahun-tahun awal keberadaannya dan mencapai pertumbuhan pendapatan hanya melalui algoritma sebesar 10%. Netflix meningkatkan jumlah konten yang dilihat karena pendekatan yang didasarkan pada algoritma sistem rekomendasi sebesar 40%. Sekarang, lebih mudah untuk memberi nama perusahaan yang tidak menggunakan pendekatan ini daripada mendaftar semua orang yang menggunakannya.

Netflix memiliki kisah yang menarik terkait dengan teknologi ini. Pada 2006-2009 (bahkan sebelum tempat kompetisi ML Kaggle menjadi populer), Netflix mengumumkan kontes terbuka untuk meningkatkan algoritme dengan kumpulan hadiah sebesar $ 1.000.000. Kompetisi ini berlangsung 2 tahun dan beberapa ribu pengembang dan ilmuwan berpartisipasi di dalamnya. Jika Netflix mempekerjakan mereka di negara bagian, biayanya akan jauh lebih tinggi daripada hadiah yang dijanjikan. Akibatnya, salah satu tim menang dengan mengirimkan solusi dengan kualitas yang dibutuhkan 2 jam lebih awal dari tim lain, mengulangi hasil pemenang. Akibatnya, uang itu pergi ke tim cepat. Kompetisi telah menjadi katalisator untuk perubahan kualitatif di bidang rekomendasi pribadi.

Pendekatan utama untuk memecahkan masalah membangun sistem rekomendasi adalah penyaringan kolaboratif.

Gagasan pemfilteran kolaboratif sederhana - jika pengguna melakukan pembelian suatu produk atau konten yang dilihat, kami akan menemukan pengguna dengan selera yang sama, dan merekomendasikan kepada klien kami bahwa orang-orang seperti dia telah mengkonsumsi, tetapi klien belum. Ini adalah pendekatan berbasis pengguna.



Gambar 1 - Matriks preferensi produk

Demikian pula, Anda dapat melihat masalah dari sudut pandang barang, dan mengambil barang pelengkap ke keranjang pelanggan dengan meningkatkan cek rata-rata, atau mengganti barang yang tidak tersedia dengan analog. Ini adalah pendekatan Berbasis Item.

Dalam kasus paling sederhana, algoritma untuk menemukan tetangga terdekat digunakan.
Contoh: Jika Maria menyukai film "Titanic" dan "Star Wars", pengguna terdekat dengan seleranya adalah Anya, yang juga menonton "Hachiko" selain film-film ini. Mari kita rekomendasikan Maria film "Hachiko". Perlu diklarifikasi bahwa biasanya mereka menggunakan bukan satu tetangga terdekat, tetapi beberapa, dengan rata-rata hasilnya.



Gbr. 2 Prinsip operasi dari algoritma tetangga terdekat

Segalanya tampak sederhana, tetapi kualitas rekomendasi yang menggunakan pendekatan ini kecil.

Pertimbangkan algoritma sistem rekomendasi yang kompleks berdasarkan pada properti matriks, atau lebih tepatnya, pada dekomposisi matriks.

Algoritma klasik adalah SVD (dekomposisi matriks singular).
Arti dari algoritma adalah bahwa matriks preferensi produk (matriks di mana baris adalah pengguna dan kolom adalah produk yang berinteraksi dengan pengguna) direpresentasikan sebagai produk dari tiga matriks.


Gambar. 3 algoritma SVD

Setelah mengembalikan matriks asli, sel-sel di mana pengguna memiliki angka nol dan angka "besar" muncul, menunjukkan tingkat ketertarikan laten pada produk. Atur angka-angka ini, dan dapatkan daftar produk yang relevan bagi pengguna.

Selama operasi ini, pengguna dan produk muncul tanda "laten". Ini adalah tanda-tanda yang menunjukkan status "tersembunyi" dari pengguna dan produk.

Tetapi diketahui bahwa baik pengguna dan produk, selain yang "laten", juga memiliki tanda-tanda yang jelas. Ini adalah jenis kelamin, usia, tanda terima pembelian rata-rata, wilayah, dll.

Mari kita coba memperkaya model kita dengan data ini.
Untuk melakukan ini, kami menggunakan algoritma mesin faktorisasi.



Gambar. 4 Algoritma pengoperasian mesin faktorisasi

Dari pengalaman kami, di Data4 , studi kasus di bidang membangun sistem rekomendasi untuk toko online, yaitu mesin faktorisasi, memberikan hasil terbaik. Jadi, kami menggunakan mesin faktorisasi untuk membangun sistem rekomendasi untuk klien kami, KupiVip. Pertumbuhan dalam metrik RMSE adalah 6-7%.

Tetapi pendekatan berbasis matriks memiliki kelemahan. Jumlah pola umum dari kombinasi timbal balik barang tidak besar. Untuk mengatasi masalah ini, disarankan untuk menggunakan jaringan saraf. Tetapi jaringan saraf membutuhkan volume data yang hanya dimiliki oleh perusahaan besar.

Dari pengalaman kami, di Data4 , hanya satu klien yang memiliki jaringan saraf untuk rekomendasi produk yang dipersonalisasi yang memberikan hasil terbaik. Tetapi, dengan sukses, Anda bisa mendapatkan hingga 10% dari metrik RMSE. Jaringan saraf digunakan di YouTube dan beberapa situs konten terbesar.

Gunakan kasing


Untuk toko online


  1. Rekomendasikan produk yang relevan bagi pengguna di halaman toko online
  2. Gunakan blok "Anda mungkin suka" di kartu produk
  3. Dalam keranjang merekomendasikan barang pelengkap (remote control untuk TV)
  4. Jika produk tidak tersedia, rekomendasikan analog
  5. Buat buletin yang dipersonalisasi

Untuk konten


  1. Tingkatkan keterlibatan dengan merekomendasikan artikel, film, buku, video yang relevan

Lainnya


  1. Rekomendasikan orang dalam aplikasi kencan
  2. Merekomendasikan hidangan di restoran

Dalam artikel tersebut kami membahas dasar-dasar sistem rekomendasi perangkat dan studi kasus. Kami belajar bahwa prinsip utamanya adalah merekomendasikan produk yang disukai orang-orang dengan selera yang serupa dan penggunaan algoritma penyaringan kolaboratif.

Dalam artikel selanjutnya , peretasan kehidupan sistem rekomendasi berdasarkan kasus bisnis nyata akan dipertimbangkan. Kami menunjukkan metrik mana yang paling baik digunakan dan koefisien kedekatan mana yang harus dipilih untuk prediksi.

Source: https://habr.com/ru/post/id476222/


All Articles