10 الخارقة الحياة تطوير أنظمة التوصية

في مقالة سابقة ، ناقشنا أساسيات التوصية بالأنظمة واستخدام الحالات. لقد تعلمنا أن المبدأ الرئيسي هو التوصية بالمنتجات التي يحبها الأشخاص ذوو المذاق المتشابه وتطبيق خوارزمية التصفية التعاونية.

في هذه المقالة ، سيتم النظر في الاختراقات الحياتية لأنظمة التوصيات بناءً على حالات العمل الحقيقية. سيُظهر المقاييس الأفضل استخدامًا ودرجة القرب التي يجب اختيارها للتنبؤ.



يستخدم التعلم الآلي مقاييس متنوعة لتقييم أداء الخوارزميات. ولكن في الأعمال التجارية ، فإن المقياس الأساسي هو نفسه - مقدار الأموال التي سيحققها تنفيذ الحل. بناءً على ذلك ، في حالاتنا التي ينفذها فريق Data4 ، نحاول زيادة إجمالي الإيرادات لكل مستخدم.

لزيادة الإيرادات ، من المفيد معرفة المنتجات التي قام المستخدم بشرائها. ولكن لسوء الحظ ، إذا قمنا ببناء مصفوفة تفضيلات المنتج فقط على بيانات الشراء ، فسوف تتحول المصفوفة إلى متناثر ، وستعاني الجودة.

ليفاك هاك رقم 1


دعونا نستخدم في مصفوفة تفضيلات المنتج ليس فقط المشتريات ، ولكن أيضًا الخطوات الوسيطة: النقر فوق بطاقة ، إضافة إلى السلة ، وضع طلب.

نقوم بتعيين معامل ترجيح لكل إجراء ، وسوف تتحول مصفوفة لدينا إلى "أكثر كثافة".

ولكن ليس كل المنتجات هي تحويل على قدم المساواة. بعد فتح البطاقة ، لا يجوز لأي شخص متابعة عملية الشراء بسبب الخصائص "الداخلية" للبضائع. على سبيل المثال: غالبًا ما يتم عرض العناصر الفاخرة ، ولكنها اشترت القليل.

اختراق الحياة رقم 2


دعنا نبني توزيع البضائع لكل مرحلة من مراحل القمع ، ونحذف من التوصيات من 5 إلى 10 ٪ من أقل منتجات التحويل في كل مرحلة. الشيء الرئيسي هو عدم "رش الطفل بالماء". سيكون للبضائع المتبقية خصائص "داخلية" لا تتداخل مع عملية الشراء. مثال على الممتلكات الداخلية هو أحجام الملابس المتاحة. إذا كان المنتج جيدًا ، ولكن بحجم واحد فقط ، فسيكون التحويل منخفضًا.

اكتشفنا البضائع ، والآن دعونا ننظر في كيفية قياس "التشابه" للمستخدم.

هناك العديد من مقاييس التشابه ، بدءًا من جيب التمام وقرب المربعات الصغرى وتنتهي بخيارات غريبة.

رقم لايف 3


استنادًا إلى تجربة Data4 في بناء أنظمة التوصية للمتاجر على الإنترنت ، يجري العمل مع مصفوفات مفرغة. لمثل هذه المصفوفات ، من الأفضل استخدام معامل القرب - الجاكار. هذا يعطي زيادة في المقاييس أكثر من تغيير الخوارزميات.

ليفاك هاك رقم 4


قبل استخدام الشبكات العصبية ، جرّب SVD و آلات المعالجة. إنه يعمل.



الشكل 1: مبدأ تشغيل آلات التخصيم

ليفاك هاك رقم 5


يعتبر التعرف على المنتجات المماثلة بالصورة أمرًا ممتعًا ، ولكن الجودة باستخدام أقراص SVD المستندة إلى السلوك تكون أفضل.

ليفاك هاك رقم 6


نوصي بالمنتجات المشهورة للمستخدمين الجدد (هذه هي الطريقة التي يتم بها التغلب على مشكلة البداية الباردة) ، وللمستخدمين العاديين - بدءًا من التوزيع الطويل لشعبية البضائع. تعمل التوصيات جيدًا عند التوصية بمنتجات ذات تردد منخفض مناسبة للمستخدم. ليس من المنطقي التوصية بفيلم Titanic ، فإذا أراد المستخدم مشاهدته ، فقد شاهده بالفعل. لكن فيلم أو منتج غير معروف يمكن أن يفاجئ المستخدم بسرور.



ليفاك هاك رقم 7


قدم مجموعة متنوعة من التوصيات ، ولا يريد أحد فتح الصفحة ، أو رؤية 10 معاطف فراء متطابقة ، أو مجرد أفلام لمخرج واحد. مجموعة متنوعة من المحتوى يزيد من احتمال الشراء.



ليفاك هاك رقم 8


اختر مقياسًا تفهمه كيف يعمل. دع RMSE بسيطًا ، ولكن نتيجة موثوقة من nDCG @ K (هذا المقياس مناسب) ، ونتيجة عشوائية.

ليفاك هاك رقم 9


قد تتعرض التوصيات للإهانة للناس ، لذلك يجب ألا توصي النساء بأحجام كبيرة من الملابس إذا كنت لا تعرف حجمها.

Lifehack رقم 10


فقط إجراء اختبار A / B على المستخدمين سيخبرك بكيفية عمل الحل. مقاييس الجودة - نتيجة وسيطة ، اختبار A / B - تأكيد ، مما قد يخيب ظنك ، ولكن في كثير من الأحيان يحلو لك.

باستخدام التقنيات الموصوفة ، نفذ فريق Data4 العديد من حالات تطبيق أنظمة التوصية.

تحدثنا في المقالة أنه لتحسين جودة نظام التوصيات ، يمكنك 1) مراعاة تصرفات المستخدم الوسيطة 2) إزالة المنتجات ذات التحويل المنخفض 3) استخدام معامل Jacquard للمصفوفات المتناثرة 4) استخدام أجهزة SVD وعوامل المعالجة إذا لم تكن Google 5) كن حذرًا عند البحث عن قرب وفقا للصورة ، إذا كانت الميزانية محدودة 6) يوصي بمنتجات غير واضحة للمستخدمين القدامى من ذيل توزيع الشعبية 7) يوصي بمختلف المنتجات 8) استخدم مقاييس الجودة المناسبة وا 9) لا تسيء إلى الناس مع التوصيات 10) استخدم اختبار A / B للتحقق من النتيجة.

Source: https://habr.com/ru/post/ar476224/


All Articles