10 trucos para la vida que desarrollan sistemas de recomendación

En un artículo anterior, discutimos los conceptos básicos de recomendar sistemas y casos de uso. Aprendimos que el principio principal es recomendar productos que gusten a las personas con un gusto similar y aplicar el algoritmo de filtrado colaborativo.

En este artículo, se considerarán los trucos de vida de los sistemas de recomendación basados ​​en casos comerciales reales. Mostrará qué métricas se utilizan mejor y qué grado de proximidad elegir para la predicción.



El aprendizaje automático utiliza varias métricas para evaluar el rendimiento de los algoritmos. Pero en los negocios, la métrica básica es la misma: cuánto dinero traerá la implementación de la solución. En base a esto, en nuestros casos que implementa el equipo Data4 , intentamos aumentar los ingresos totales por usuario.

Para maximizar los ingresos, es útil saber qué productos ha comprado el usuario. Pero desafortunadamente, si construimos la matriz de preferencias del producto solo en los datos de compra, nuestra matriz resultará escasa y la calidad se verá afectada.

Lifehack número 1


Usemos en la matriz de preferencias de productos no solo compras, sino también pasos intermedios: hacer clic en una tarjeta, agregar a la cesta, hacer un pedido.

Asignamos un coeficiente de ponderación a cada acción, y nuestra matriz resultará ser más "densa".

Pero no todos los productos son igualmente de conversión. Después de abrir la tarjeta, una persona no puede continuar la compra debido a las propiedades "internas" de los productos. Ejemplo: los artículos de lujo a menudo se ven, pero se compran poco.

Hack de vida número 2


Construyamos la distribución de productos para cada etapa del embudo y eliminemos de las recomendaciones el 5-10% de los productos de conversión más bajos en cada etapa. Lo principal es no "salpicar al bebé con agua". Los bienes restantes tendrán propiedades "internas" que no interferirán con la compra. Un ejemplo de una propiedad interna son los tamaños de ropa disponibles. Si el producto es bueno, pero solo de un tamaño, la conversión será baja.

Descubrimos los productos, ahora veamos cómo medir la "similitud" del usuario.

Hay muchas métricas de similitud, comenzando con la proximidad del coseno, mínimos cuadrados y terminando con opciones exóticas.

Lifehack número 3


Basado en la experiencia de Data4 en la construcción de sistemas de recomendación para tiendas en línea, se está trabajando con matrices descargadas. Para tales matrices, es mejor usar el coeficiente de proximidad - Jacquard. Esto da un aumento en las métricas más que un cambio de algoritmos.

Lifehack número 4


Antes de usar redes neuronales, pruebe con SVD y máquinas de factorización. Funciona



Fig. 1 Principio de funcionamiento de las máquinas de factorización.

Lifehack número 5


Reconocer productos similares por imagen es divertido, pero la calidad utilizando SVD basados ​​en el comportamiento es mejor.

Lifehack número 6


Recomendamos productos populares a los nuevos usuarios (así es como se supera el problema de un arranque en frío) y a los usuarios habituales, desde la larga cola de la distribución de la popularidad de los productos. Las recomendaciones funcionan bien cuando recomiendan productos de baja frecuencia adecuados para el usuario. No tiene sentido recomendar la película Titanic, si el usuario quería verla, ya la vio. Pero una película o producto poco conocido puede sorprender gratamente al usuario.



Lifehack número 7


Haga una variedad de recomendaciones, nadie quiere abrir la página, ver 10 abrigos de piel idénticos, o solo películas de un director. Una variedad de contenido aumenta la probabilidad de una compra.



Lifehack número 8


Elija una métrica que entienda cómo funciona. Deje un RMSE simple, pero un resultado confiable que nDCG @ K (esta métrica es adecuada), y un resultado aleatorio.

Lifehack número 9


Las recomendaciones pueden ofender a las personas, por lo que las mujeres no deben recomendar ropa de gran tamaño si no conoce su talla.

Lifehack número 10


Solo realizar una prueba A / B en los usuarios le dirá cómo funciona la solución. Métricas de calidad - un resultado intermedio, prueba A / B - confirmación, que puede decepcionarte, pero a menudo agrada.

Utilizando las técnicas descritas, nuestro equipo de Data4 llevó a cabo varios casos de implementación de sistemas de recomendación.

En el artículo, hablamos de que para mejorar la calidad del sistema de recomendación, puede 1) tener en cuenta las acciones intermedias del usuario 2) Eliminar productos de baja conversión 3) Usar el coeficiente Jacquard para matrices dispersas 4) Usar máquinas SVD y de factorización si no es Google 5) Tenga cuidado al buscar proximidad de acuerdo con la imagen, si el presupuesto es limitado 6) Recomiende productos no obvios a los usuarios antiguos desde la cola de la distribución de popularidad 7) Recomiende varios productos 8) Use las métricas de calidad adecuadas wa 9) No ofenda a las personas con recomendaciones 10) Use la prueba A / B para verificar el resultado.

Source: https://habr.com/ru/post/476224/


All Articles