ما يعطي تعلم الآلة للبيع بالتجزئة: مثال على المشروع

التجزئة لديها دائرة متنوعة للغاية من العملاء. هناك الكثير منهم - مختلف المهن ومستويات الدخل ، من الشباب إلى كبار السن. لا يمكن وصف هذا التنوع بشكل صحيح من خلال قاعدتين أو ثلاث قواعد عمل ، لأنك ببساطة لا يمكنك تغطية جميع تركيبات المعايير وخسارة بعض العملاء حتمًا. لذلك ، بالنسبة إلى البيع بالتجزئة ، من المهم جدًا تقسيم جمهورك بأكبر قدر ممكن من الدقة ، ولكن هذا يؤدي حتمًا إلى تعقيد النماذج. تأتي تقنيات التعلم الآلي في الإنقاذ هنا ، مما يمنح الشركات توقعات أكثر دقة وإجابات على الأسئلة المهمة.





ما الأسئلة التي تقصدها؟ على سبيل المثال: هل سيغادر العميل؟ غالبًا ما يغادر العملاء إذا لم يكن المتجر يحتوي على المنتج المناسب. على سبيل المثال ، تشتري المرأة كريمًا خاصًا كل شهر مقابل 10 آلاف روبل ويمكنها الاختيار من محلين لمستحضرات التجميل. في أحدها ، غالبًا ما يكون المنتج المطلوب مفقودًا ، وفي الثانية لا توجد مشاكل في التوفر. على الأرجح ، سوف تشتري باستمرار في الثانية ، وإن كانت أكثر تكلفة بقليل.

سؤال آخر ملح: كيفية تحسين عمل الموظفين؟ على سبيل المثال ، تحتاج إلى تخطيط نوبات العمل للصرافين ومستشاري المبيعات. تتضمن إحدى الطرق استخدام التحليل الإحصائي. يقوم المحلل بتقييم نشاط العملاء اعتمادًا على يوم الأسبوع ويرى أنهم يوم السبت يشترون أكثر ، ويومي الجمعة والأحد أقل قليلاً. يتم التحقق من هذه الفرضية من خلال الاختبارات الإحصائية ، ويتم تمرير الاستنتاجات إلى الإدارة.

لكن مثل هذا التحليل قد لا يأخذ في الاعتبار العديد من مجموعات العوامل. على سبيل المثال ، إذا كان يوم 7 مارس يوم الأربعاء - فهل سيشترون في هذا اليوم أكثر من يوم الجمعة (بعد كل شيء ، في الأوقات العادية ، يكون يوم الجمعة أكثر شيوعًا من أيام الأسبوع الأخرى)؟ والتخرج؟ أو الأعياد المحلية؟ كلما زادت العوامل ، زادت صعوبة أخذها جميعًا في الاعتبار بمساعدة القواعد البسيطة. وبدلاً من تعقيد القواعد إلى ما لا نهاية ، يمكنك بناء نموذج يتنبأ بالطلب في يوم معين.



مشروعنا في تجارة التجزئة غير الغذائية


في هذه الحالة ، كان من الضروري تحليل قاعدة العملاء (حوالي 2.5 مليون شخص) والتنبؤ بأي منهم سيعود إلى المتجر في الأسبوعين المقبلين. اتخذنا طريقتين من مكتبة CatBoost - CatBoostClassifier و CatBoostRegressor ، الأولى - للتنبؤ بتكوين الجمهور ، والثانية - لاختيار المنتجات الأكثر شعبية في الأسبوعين المقبلين. ظهر CatBoost في بداية مشروعنا ، لقد كان نهجًا جديدًا للعمل مع السمات الفئوية. ونظرًا لأن مجموعة منتجات عملائنا تحتوي على الكثير من الميزات الفئوية ، فقد حاولنا بكل سرور المنتج الجديد. بعد اختيار المعلمات ، حقق النموذج توقعاتنا على الفور من خلال التنبؤ الدقيق. لا عجب أن CatBoost هو واحد من أشهر نماذج تعزيز التدرج اليوم.

بالنسبة للنموذج ، أخذنا إحصاءات لعام 2017:

  • الشيكات: من يملك بطاقة المكافأة من الشيك ، عند الشراء ، ما اشترى ، حجم الخصم ، شرائه أو استرداده.
  • الديموغرافيا: منطقة ومدينة إقامة العميل وتاريخ الميلاد والجنس والموافقة على البريد عبر الهاتف أو البريد.
  • المنتجات: أي فئة أو شريحة تتضمن المشتريات والنطاق وما إلى ذلك.

قمنا بتنظيف بيانات الضجيج (بطاقات البائع ، المرتجعات ، مشتريات الخدمات ، وليس السلع) وقمنا بحساب المعايير اللازمة (النسبة المئوية للخصم ، العمر). بعد ذلك ، قمنا بحساب أكبر وأصغر إيصال لكل عميل والمتوسط ​​والمتوسط ​​والحد الأقصى للخصومات وعدد مرات دخول الشخص وعدد المنتجات التي اشتراها من الفئات. تم حساب هذه المعلمات على فترات: الأسبوع الماضي ، أسبوعان ، شهر ، ثلاثة أشهر. مثل هذا العمل الدقيق جعل من الممكن بناء نماذج بدقة توقع عالية.

البيانات المجمعة للنماذج والحسابات التي تم إطلاقها. توقع النموذج الأول أي من المشترين سيأتي في الأسبوعين المقبلين ، والتوصيات الثانية الصادرة: ما هي المنتجات (حتى مستوى المقالة) التي سيشتريها شخص معين. بالمناسبة ، فإن متطلبات التنبؤ بشعبية مقالات محددة تعقد المهمة إلى حد كبير (عادةً ما تحتاج الأعمال إلى توقعات تستند إلى فئات وأسماء السلع بدلاً من المواقف).

كان العملاء الذين أوصى بهم النموذج للبريد المستهدف لديهم فحص متوسط ​​أكبر لزيارة واحدة ، وخلال الفترة التي تم تحليلها اشتروا مبلغًا إجماليًا أعلى من العملاء الآخرين.



نتيجة لذلك ، بعد إرسال البريد ، اشترى حوالي 30٪ من العملاء منتجًا واحدًا على الأقل من المنتجات الثلاثة التي توقعها النموذج.

الآن يمكن للشركة أن تتنبأ بالمبيعات بشكل أكثر دقة: يعرف بائع التجزئة من سيأتي إليه في المستقبل القريب وما الذي سيشتري. هذا لا يساعد فقط على تحسين الخدمات اللوجستية ، ولكن أيضًا تقليل التكاليف المرتبطة. على سبيل المثال ، إذا كان عميل معين لا يشتري عادةً أي شيء في الشتاء ، فلن تحتاج إلى إرسال رسالة قصيرة SMS إليه في يناير. تعمل النماذج أيضًا على تحسين الرسائل البريدية: متخصص يعتمد على التوقعات يفهم على الفور من يجب أن يرسل بريدًا إلكترونيًا ، ولمن - رسالة عاجلة.

مطبات


هم في أي مهمة ML - كانوا في مهمتنا. على سبيل المثال ، اختبرنا ما إذا كانت رسائل توصية المنتج تساعد على زيادة المبيعات. لهذا ، تم تقسيم شريحة العملاء المتوقعة إلى ثلاث مجموعات:

  1. التحكم - لم يتلق النشرة الإخبارية.
  2. مجموعة مع تذكيرات - تلقي نص مشترك من المتجر.
  3. مجموعة مع توصيات - تلقيت SMS مع ثلاثة منتجات محددة تنبأ بها النموذج.

اتضح أن الأشخاص الذين تلقوا توصيات اشتروا أقل من العملاء الذين لم يتلقوا رسائل إخبارية. متوسط ​​الفاتورة وكمية البضائع المشتراة كانت أقل. أظهر اختبار T أن الفروق كانت ذات دلالة إحصائية (pvalue = 0.017).



بعبارة ملطفة ، تثبط مثل هذه النتائج الجميع. بدأوا في البحث عن السبب واكتشفوا أن المتاجر أرسلت رسائل إلى عملاء في مراسلة معينة ، واشترى مستخدموها في قسمنا أقل من العملاء الآخرين. حتى المسوقين من العملاء لم يعرفوا ذلك. لذلك تبين أن التجربة غير صحيحة ، ولكن وفقًا لنتائجها ، أضفنا المعلمة "messenger user" إلى النموذج. توضح هذه الحالة كيفية اختيار القنوات بعناية للتواصل مع العملاء.
ما هي الاستنتاجات الأخرى التي يمكن استخلاصها؟

  • ليس هناك الكثير من البيانات.
  • في بعض الأحيان تؤدي وجهة نظر المحلل من الجانب إلى فكرة جديدة.

تجزئة العملاء


يسمح لك تحليل البيانات باكتشاف الأنماط التي كانت مخفية في المعلومات المتاحة سابقًا. مثال جيد هو مقارنة مجموعات العملاء باستخدام تجزئة RFM (نقود تكرار الحداثة) والتجزئة باستخدام خوارزميات ML.

يستخدم تجزئة RFM ثلاثة مقاييس رئيسية:

  • وصفة شراء الماضي
  • تكرار عمليات الشراء للفترة
  • المبلغ الذي أنفقه العميل.

استنادًا إلى هذه البيانات ، يتم تمييز المجموعات الرئيسية: "Squanders" ، و "للعملاء المخلصين" ، و "العملاء المفقودون تقريبًا" ، وما إلى ذلك. ويقوم المسوقون بالفعل بإدراج المجموعة المستهدفة المطلوبة في نشرة إخبارية محددة أو تقديم عرض خاص لهذه المجموعة.

على سبيل المثال ، باستخدام تجزئة RFM ، يمكنك تحديد شرائح العملاء وتمثيلهم كنقاط في مساحة ثلاثية الأبعاد:



يتيح لك ذلك رؤية موقع مجموعات معينة بشكل مرئي في إجمالي كتلة العملاء ونسبهم وديناميكيات التغييرات.

الآن إسقاط التوزيع ثلاثي الأبعاد للأجزاء على المستوى. يمكن تقسيم العملاء على الدخل الذي تجنيه الشركة لتضمين الأكثر ربحية في الحملات التسويقية ، ولكن هل سيكون هذا كافياً للتخطيط الفعال؟

حتى في هذه البيانات ، تجد خوارزمية التعلم الآلي إمكانيات إضافية: فهي تقسم العملاء إلى مجموعات كبيرة جديدة. يمكنك تحليل هذا القسم لمعرفة سبب تقسيم الخوارزمية للعملاء بهذه الطريقة. على سبيل المثال ، بعض العملاء المربحين للغاية هم خبراء يرافقون عملائهم في التسوق ويستخدمون بطاقات الخصم الخاصة بهم ؛ يشارك البعض بطاقاتهم بنشاط مع الأصدقاء والمعارف. أي أنه بعد أول استخدام لـ ML ، يمكنك الحصول على معلومات إضافية حول عملائك بناءً على جميع البيانات نفسها.



دعنا نوسع مجموعة خصائص العملاء: إضافة الجنس والعمر والسلوكيات والمزيد. كيف ستوزع الخوارزمية الآن المشترين؟

على سبيل المثال ، هناك مجموعة تغطي كلاً من أفضل العملاء (الأكثر ربحية) و "جيرانهم" ، والتي تحقق ربحًا أقل. لماذا خصصت الخوارزمية هذه المجموعة سؤالًا للمحلل. ربما هؤلاء العملاء مع التحفيز الإضافي سيظهرون ربحية أكبر. أو ، على العكس من ذلك ، هؤلاء العملاء ليسوا واعدين بشكل خاص ، وكانت الزيادة في الربحية انحرافًا عشوائيًا - لتحفيزهم لا داعي له أيضًا. يمكن طرح العديد من النظريات ، ولكن يجب التحقق منها تجريبيا.



تخطيط المستودعات - التنبؤ بالمبيعات


علاوة على ذلك ، يحتوي المشروع على العديد من خيارات التطوير. على سبيل المثال ، يمكنك توقع عمليات الشراء في متجر معين للفترة القادمة. بعد ذلك سيكون مدير المتجر قادرًا على طلب البضائع الضرورية من المستودع المركزي في الوقت المحدد.

سيساعد تحليل المشتريات في منفذ معين على صياغة عرض البضائع على نوافذ العرض. على سبيل المثال ، إذا جاء الكثير من المشترين الذكور إلى المتجر ، فلا يجب وضع القسم الذي يحتوي على منتجات الرجال في الزاوية البعيدة.

لا تنسى ما يسمى أكل لحوم البشر من المتاجر. أي أنه إذا كانت هناك نقطتا بيع للشبكة نفسها في مكان قريب (على سبيل المثال ، في نهايات مختلفة من نفس الشارع) ، يمكن لإحدىهما جذب العملاء بعيدًا ، والثانية ستبقى خاملة. يمكنك بناء نموذج لتتبع هذه الظواهر والإشارة حولها.

***

باختصار ، يعد التعلم الآلي أداة قوية يمكنها القيام بالكثير. في كثير من الأحيان عند بناء النماذج ، يتم الكشف عن الأنماط غير الواضحة التي لم يعرفها حتى رجال الأعمال. ومع ذلك ، فإن جودة النموذج تعتمد إلى حد كبير على جودة وكمية البيانات.

محللون في مديرية تطوير وتنفيذ البرمجيات والنظم النفاثة

Source: https://habr.com/ru/post/ar430448/


All Articles