Introduction aux systèmes de recommandation

L'article traite des approches de création de recommandations personnalisées de produits et de contenu, et des cas d'utilisation possibles.

Des recommandations personnalisées de produits et de contenu sont utilisées pour augmenter la conversion, la vérification moyenne et améliorer l'expérience utilisateur.



Amazon et Netflix sont un exemple d'utilisation de cette approche. Amazon a commencé à utiliser une approche de filtrage collaboratif au cours des premières années de son existence et n'a réalisé une croissance des revenus que grâce à l'algorithme de 10%. Netflix augmente de 40% la quantité de contenu consulté en raison de l'approche basée sur l'algorithme du système de recommandation. Désormais, il est plus facile de nommer une entreprise qui n'utilise pas cette approche que de répertorier toutes les personnes qui l'utilisent.

Netflix a une histoire fascinante liée à cette technologie. En 2006-2009 (avant même que le site de compétition Kaggle ML ne devienne populaire), Netflix a annoncé un concours ouvert pour améliorer l'algorithme avec un prize pool de 1000000 $. Le concours a duré 2 ans et plusieurs milliers de développeurs et scientifiques y ont participé. Si Netflix les embauchait dans l'État, les coûts seraient beaucoup plus élevés que le prix promis. En conséquence, l'une des équipes a gagné en envoyant une solution avec la qualité requise 2 heures plus tôt que l'autre équipe, en répétant le résultat du vainqueur. En conséquence, l'argent est allé à une équipe rapide. Le concours est devenu un catalyseur de changements qualitatifs dans le domaine des recommandations personnalisées.

La principale approche pour résoudre le problème de la construction de systèmes de recommandation est le filtrage collaboratif.

L'idée du filtrage collaboratif est simple - si un utilisateur a acheté un produit ou du contenu consulté, nous trouverons des utilisateurs ayant des goûts similaires et recommanderons à notre client que des gens comme lui ont consommé, mais pas le client. Il s'agit d'une approche basée sur l'utilisateur.



Figure 1 - Matrice des préférences de produits

De même, vous pouvez examiner le problème du point de vue des marchandises et ramasser des marchandises complémentaires dans le panier du client en augmentant le chèque moyen ou en remplaçant les marchandises qui ne sont pas en stock par un analogue. Il s'agit d'une approche basée sur les éléments.

Dans le cas le plus simple, l'algorithme de recherche des voisins les plus proches est utilisé.
Exemple: Si Maria aime le film "Titanic" et "Star Wars", l'utilisateur le plus proche de ses goûts sera Anya, qui a également regardé "Hachiko" en plus de ces films. Recommandons Maria le film "Hachiko". Il convient de préciser qu'en général, ils n'utilisent pas un voisin le plus proche, mais plusieurs, avec une moyenne des résultats.



Fig.2 Le principe de fonctionnement de l'algorithme des plus proches voisins

Tout semble simple, mais la qualité des recommandations utilisant cette approche est faible.

Considérons des algorithmes complexes de systèmes de recommandation basés sur la propriété des matrices, ou plutôt sur la décomposition des matrices.

L'algorithme classique est SVD (décomposition matricielle singulière).
La signification de l'algorithme est que la matrice des préférences de produit (la matrice où les lignes sont des utilisateurs et les colonnes sont les produits avec lesquels les utilisateurs ont interagi) est représentée comme le produit de trois matrices.


Fig.3 Algorithme SVD

Après avoir restauré la matrice d'origine, les cellules où l'utilisateur avait des zéros et de «grands» nombres sont apparues, montrent le degré d'intérêt latent pour le produit. Organisez ces numéros et obtenez une liste de produits pertinents pour l'utilisateur.

Au cours de cette opération, l'utilisateur et le produit apparaissent des signes "latents". Ce sont des signes montrant l'état "caché" de l'utilisateur et du produit.

Mais il est connu que l'utilisateur et le produit, en plus des produits «latents», ont également des signes évidents. Il s'agit du sexe, de l'âge, du reçu d'achat moyen, de la région, etc.

Essayons d'enrichir notre modèle avec ces données.
Pour ce faire, nous utilisons l'algorithme de la machine de factorisation.



Fig.4 Algorithme de fonctionnement des machines de factorisation

D'après notre expérience, chez Data4 , les études de cas dans le domaine des systèmes de recommandation de construction pour les magasins en ligne, à savoir les machines de factorisation, donnent le meilleur résultat. Nous avons donc utilisé des machines de factorisation pour construire un système de recommandation pour notre client, KupiVip. La croissance de la métrique RMSE était de 6 à 7%.

Mais les approches matricielles ont leurs inconvénients. Le nombre de schémas généralisés de combinaison mutuelle de biens n'est pas important. Pour résoudre ce problème, il est conseillé d'utiliser des réseaux de neurones. Mais un réseau neuronal nécessite des volumes de données que seules les grandes entreprises possèdent.

D'après notre expérience, chez Data4 , un seul client dispose d'un réseau neuronal pour des recommandations de produits personnalisées qui ont donné le meilleur résultat. Mais, avec succès, vous pouvez obtenir jusqu'à 10% de la métrique RMSE. Les réseaux de neurones sont utilisés sur YouTube et certains des plus grands sites de contenu.

Cas d'utilisation


Pour les boutiques en ligne


  1. Recommander des produits pertinents pour l'utilisateur sur les pages de la boutique en ligne
  2. Utilisez le bloc «vous pouvez aimer» dans la fiche produit
  3. Dans le panier recommander des produits complémentaires (télécommande pour TV)
  4. Si le produit n'est pas en stock, recommander un analogue
  5. Créez des newsletters personnalisées

Pour le contenu


  1. Augmentez l'engagement en recommandant des articles, des films, des livres et des vidéos pertinents

Autre


  1. Recommander des personnes dans des applications de rencontres
  2. Recommander des plats dans un restaurant

Dans l'article, nous avons discuté des bases des systèmes de recommandation d'appareils et des études de cas. Nous avons appris que le principe principal est de recommander des produits qui plaisent aux personnes ayant des goûts similaires et d'utiliser un algorithme de filtrage collaboratif.

Dans le prochain article , les hacks à vie des systèmes de recommandation basés sur des cas commerciaux réels seront examinés. Nous montrons quelles mesures sont les mieux utilisées et quel coefficient de proximité choisir pour la prédiction.

Source: https://habr.com/ru/post/fr476222/


All Articles