10 hacks de vie développant des systèmes de recommandation

Dans un article précédent, nous avons discuté des bases de la recommandation de systèmes et de cas d'utilisation. Nous avons appris que le principe principal est de recommander des produits qui plaisent aux personnes ayant un goût similaire et d'appliquer l'algorithme de filtrage collaboratif.

Dans cet article, les hacks à vie des systèmes de recommandation basés sur des cas commerciaux réels seront examinés. Il montrera quelles mesures sont les mieux utilisées et quel degré de proximité choisir pour la prédiction.



L'apprentissage automatique utilise diverses métriques pour évaluer les performances des algorithmes. Mais dans les affaires, la métrique de base est la même - combien d'argent la mise en œuvre de la solution apportera. Sur cette base, dans nos cas que l'équipe Data4 implémente , nous essayons d'augmenter le revenu total par utilisateur.

Pour maximiser les revenus, il est utile de savoir quels produits l'utilisateur a achetés. Mais malheureusement, si nous construisons la matrice des préférences de produits uniquement sur les données d'achat, notre matrice se révélera clairsemée et la qualité en souffrira.

Lifehack numéro 1


Utilisons dans la matrice des préférences produits non seulement les achats, mais aussi les étapes intermédiaires: cliquer sur une carte, l'ajouter au panier, passer une commande.

Nous attribuons un coefficient de pondération à chaque action, et notre matrice se révélera plus «dense».

Mais tous les produits ne sont pas également convertis. Après avoir ouvert la carte, une personne ne peut pas poursuivre l'achat en raison des propriétés «internes» de la marchandise. Exemple: les articles de luxe sont souvent vus, mais peu achetés.

Life hack numéro 2


Construisons la distribution des marchandises pour chaque étape de l'entonnoir et retirons des recommandations pour 5-10% des produits de conversion les plus faibles à chaque étape. L'essentiel n'est pas «d'éclabousser le bébé avec de l'eau». Les marchandises restantes auront des propriétés «internes» qui n'interfèrent pas avec l'achat. Les tailles de vêtements disponibles sont un exemple de propriété interne. Si le produit est bon, mais d'une seule taille, la conversion sera faible.

Nous avons compris les marchandises, regardons maintenant comment mesurer la "similitude" de l'utilisateur.

Il existe de nombreuses mesures de similitude, commençant par la proximité du cosinus, les moindres carrés et se terminant par des options exotiques.

Lifehack numéro 3


Sur la base de l'expérience de Data4 dans la construction de systèmes de recommandation pour les boutiques en ligne, des travaux sont en cours avec des matrices déchargées. Pour de telles matrices, il est préférable d'utiliser le coefficient de proximité - Jacquard. Cela donne une augmentation des mesures plus qu'un changement d'algorithmes.

Lifehack numéro 4


Avant d'utiliser les réseaux de neurones, essayez la SVD et les machines de factorisation. Ça marche.



Fig.1 Principe de fonctionnement des machines de factorisation

Lifehack numéro 5


Reconnaître des produits similaires par l'image est amusant, mais la qualité en utilisant des SVD basés sur le comportement est meilleure.

Lifehack numéro 6


Nous recommandons des produits populaires aux nouveaux utilisateurs (c'est ainsi que le problème d'un démarrage à froid est surmonté) et aux utilisateurs réguliers - de la longue queue de la distribution de la popularité des produits. Les recommandations fonctionnent bien lorsqu'elles recommandent des produits basse fréquence adaptés à l'utilisateur. Cela n'a aucun sens de recommander le film Titanic, si l'utilisateur voulait le regarder, il l'a déjà regardé. Mais un film ou un produit peu connu peut agréablement surprendre l'utilisateur.



Lifehack numéro 7


Faites une variété de recommandations, personne ne veut ouvrir la page, voir 10 manteaux de fourrure identiques ou juste des films d'un réalisateur. Une variété de contenus augmente la probabilité d'un achat.



Lifehack numéro 8


Choisissez une mesure dont vous comprenez le fonctionnement. Soit un RMSE simple, mais un résultat fiable que nDCG @ K (cette métrique convient), et un résultat aléatoire.

Lifehack numéro 9


Les gens peuvent être offensés par les recommandations, donc les femmes ne devraient pas recommander de grandes tailles de vêtements si vous ne connaissez pas leur taille.

Lifehack numéro 10


Seul un test A / B sur les utilisateurs vous dira comment fonctionne la solution. Des mesures de qualité - un résultat intermédiaire, un test A / B - une confirmation, qui peut vous décevoir, mais qui plaît souvent.

En utilisant les techniques décrites, notre équipe Data4 a réalisé plusieurs cas de mise en œuvre de systèmes de recommandation.

Dans l'article, nous avons expliqué que pour améliorer la qualité du système de recommandation, vous pouvez 1) prendre en compte les actions des utilisateurs intermédiaires 2) Éliminer les produits à faible conversion 3) Utiliser le coefficient Jacquard pour les matrices clairsemées 4) Utiliser SVD et les machines de factorisation si vous n'êtes pas Google 5) Soyez prudent lors de la recherche de proximité selon l'image, si le budget est limité 6) Recommander des produits non évidents aux anciens utilisateurs de la queue de la distribution de popularité 7) Recommander divers produits 8) Utiliser les bonnes mesures de qualité wa 9) N'offensez pas les gens avec des recommandations 10) Utilisez le test A / B pour vérifier le résultat.

Source: https://habr.com/ru/post/fr476224/


All Articles