التنبؤ بعنف المستخدم باستخدام طريقة RFM

تخيل: مكالمة هاتفية الساعة الثالثة صباحًا ، يمكنك التقاط الهاتف وسماع صراخ لا يستخدمه منتجك. مخيف في الحياة ، بالطبع ، هذا ليس صحيحًا ، لكن إذا لم تهتم بمشكلة التدفق الخارجي للمستخدمين ، فقد تجد نفسك في موقف مماثل.

لقد سبق أن وصفنا بالتفصيل ماهية التدفق الخارجي: لقد بحثنا في النظرية وأظهرنا كيفية تحويل الشبكة العصبية إلى أوراكل رقمية. يعرف الخبراء في Plarium Krasnodar طريقة أخرى للتنبؤ. سنتحدث عنه.



ليست هذه هي RFM التي نحتاجها.


RFM هي طريقة تُستخدم لتقسيم العملاء وتحليل سلوكهم. استنادًا إلى البيانات التي تم الحصول عليها ، يمكنك إنشاء برنامج ولاء لكل مجموعة وإنشاء توزيع للمستخدمين والتنبؤ بموعد إرجاع المشتريات.

بدأ تاريخ تطوير RFM في عام 1987 عندما تم نشر المقال الخاص بعد العملاء: من هم وماذا سيفعلون بعد ذلك . وقد وصفت طريقة تحليل تعتمد على توزيع Pareto (عائلة ذات معلمتين من توزيعات مستمرة تمامًا).

تم استدعاء النموذج Pareto / NBD وأخذ في الاعتبار فقط تاريخ شراء المستخدمين. في التفسير الكلاسيكي ، تم عمل هذا الأسلوب على خمسة أعمدة ، أو تقريب:

  1. طالما كان المستخدمون نشطين ، فإن عدد المعاملات التي أجراها المشتري خلال الفترة ر يطيع توزيع Pareto بمتوسط ​​λt.
  2. يتبع تجانس المعلمة λ (معدل المعاملة) توزيع غاما مع المعلمتين r و α.
  3. كل مشتر لديه فترة لا حدود لها من الوقت "الحياة" τ. يتم توزيع النقطة التي يصبح فيها المستخدم غير نشط بشكل كبير مع المعلمة μ (معدل التسرب).
  4. يتبع تجانس المعلمة μ بين المستخدمين توزيع غاما مع المعلمات s (الشكل) و β (المقياس).
  5. يمكن أن تختلف المعلمتان λ و independ بشكل مستقل بين المشترين.

كانت عيوب هذا النموذج كلا من التعقيد العالي لحساب وظائف Gage hypergeometric والبحث عن دالة الاحتمالية القصوى.

في مقال نشر عام 2003 بعنوان "عد العملاء" ، الطريقة السهلة: بديل لنموذج باريتو / بنك دبي الوطني ، تم نشر فكرة تطبيق نموذج أفضل. بالإضافة إلى سجل الشراء ، تم استخدام معلمتين أخريين: التردد والوصفة الطبية. كان الاختلاف الرئيسي في Pareto / NBD هو كيفية تحديد اللحظة التي يغادر فيها العميل.

في الإعداد الكلاسيكي ، كان من المفترض أن المستخدم قادر على المغادرة في أي وقت ، بغض النظر عن وتيرة ونمط مشترياته في الماضي. يستند النهج الجديد إلى فرضية أن المشتري قد يبدأ في فقدان الفائدة فور اكتمال المعاملة.

هذا تبسيط الحساب وأدى إلى نموذج بيتا الهندسية (BG / NBD). يستخدم ثلاثة معلمات رئيسية: الحداثة ، التردد ، النقدية ، - بالإضافة إلى أربعة معلمات إضافية: r ، α ، a ، b (تم إضافة المعلمتين a و b من توزيع بيتا ).

يساعد RFM في توقع ما إذا كان العميل سوف يقوم بعملية شراء في المستقبل. المتخصصين Plarium Krasnodar تعديل هذه الطريقة.

توقع التدفق الخارجي ببساطة وذوق


بالنسبة للحسابات ، نحتاج إلى مجموعة من البيانات حول جلسات اللعبة. يتم إعادة حسابه في مصفوفة تتكون من معلمات RFM ، وإلى أربعة معاملات أخرى ، يتم اختيارها بواسطة النموذج في عملية التعلم.

في سياق اللعبة ، تكتسب المعلمات المعاني التالية:
  • R ecency - كم من الوقت كان المستخدم يلعب في وقت تسجيل الدخول الأخير ؛
  • F requency - عدد مرات إعادة دخول المستخدم للعبة ؛
  • M onetary - المدة التي لعبها المستخدم (وقت "الحياة").

يتم تجميع المعلمات في مصفوفة. بعد ذلك يتم تحميله في نموذج يحسب احتمال "حياة" المستخدمين - فرصة أن يستمروا في اللعب.

تتم الحسابات وفقا للصيغة:


من الواضح ، بالنسبة للمستخدمين دون إعادة الإدخالات ، فإن احتمال "الحياة" سيكون واحداً. في عام 2008 ، اقترح مؤلفو المقال Computing P (على قيد الحياة) باستخدام BG / NBD Model حلاً لهذه المشكلة. يمكن لشركات الألعاب استخدام خيارين يوفران نتائج مماثلة.

يتم إدخال الطريقة 1 - π المعلمة لجميع المستخدمين. هذا يظهر اللاعبين الذين يعتبرون غير نشطين.
الطريقة 2 - تتم إضافة وحدة إلى معلمة التردد. يتجنب هذا الإجراء تدهور الصيغة في التردد = 0 ، لكنه يضيف بشكل مصطنع إدخالًا آخر في اللعبة لكل مستخدم.

كيفية التكيف مع طريقة RFM لعبة ديف


لنفترض أن لدينا مستخدم جديد. دخل للتو اللعبة. المعلمة F = 1 (أو 0 ، اعتمادًا على العمليات الحسابية) ، نظرًا لعدم اعتبار الإدخال الأول ، ولم يكن لدى اللاعب إدخالات متكررة.

المستخدم يلعب ثلاثة أيام. تتغير المعلمات: تأخذ F في الاعتبار المدخلات اليومية فقط ، وبالتالي تكون قيمتها 2 ، والمؤشرات M و R هي 3. باستخدام هذه البيانات ، نحصل على احتمال "الحياة" بالقرب من الوحدة.

في اليوم التالي ، لا يدخل المستخدم اللعبة. يتم تحديث المعلمة M ، بينما تظل F و R كما هي. استبدال جميع القيم في الصيغة ، نرى أن مؤشر الاحتمالات أصبح أقل.

إذا لم يكن المستخدم يلعب خلال الأسبوع ، فسيتم تحديث مؤشر M مرة أخرى ويزداد احتمال "الحياة" بدرجة أكبر.

الرسم البياني للمستخدم النشط يبدو مختلفًا. احتمال "الحياة" سينخفض ​​اعتمادًا على تاريخها. إذا ذهب إلى اللعبة كل يوم وتوقف فجأة ، فإن قيمة المؤشر ستنخفض بشكل أسرع بكثير مما لو كان يلعب كل يومين.

إيجابيات كبيرة وسلبيات غير واضحة من RFM


الميزة الرئيسية لهذه الطريقة هي بساطتها:

  • للحسابات لا تحتاج إلى استخدام جهاز رياضي معقد ؛
  • يتم حساب المؤشرات باستخدام صيغة بسيطة نسبيا ؛
  • يمكنك الاستغناء عن خطوط الأنابيب المعقدة للبيانات ؛
  • يتم تحديد جميع المعلمات النموذج الأمثل تلقائيا.

بالإضافة إلى ذلك ، بيانات RFM سهلة التفسير. دراسة تاريخ المستخدم ، يمكن للمرء أن يفهم لماذا لديه مثل هذا الاحتمال من "الحياة". في كثير من الأحيان ، عند العمل مع أساليب أكثر تعقيدًا ، يكون من الصعب استخلاص استنتاجات محددة.

RFM لديها أيضا عيوب. أولاً ، هذه ليست الطريقة الأكثر دقة. يعمل بشكل جيد ، ولكن لا يتم استخدام عدد من المعلمات في العمليات الحسابية. على سبيل المثال ، العديد من المستخدمين الذين بدأوا يفقدون الاهتمام بدافع العادة يدخلون اللعبة. أي أن متوسط ​​عدد جلسات اللعب يوميًا يتناقص ، ولا يتغير تواتر إعادة الإدخالات.

ثانياً ، لا تأخذ الطريقة في الاعتبار نشاط المستخدم: كم عدد الموارد التي نقلها ، سواء هاجم العدو ، أو أنشأ قوات. إذا أخذنا جميع اللاعبين باحتمال "الحياة" يساوي ~ 0.8 ، ثم اعتمادًا على المعايير وتاريخهم ، بالإضافة إلى العناصر النشطة ، سيكون هناك من يدخل كل ثلاثة أيام.

ثالثًا ، يصبح المستخدم المغادر "حيًا" عندما يبدأ تشغيل اللعبة مرة أخرى. ماذا عليه أن يفعل هذا بعد شهر من تسجيل الدخول الأخير. مثل هذه الحالات تعقيد اكتشاف اللاعبين مع توقف كبير بين الدورات. بشكل عام ، هذا ليس بالأمر الحاسم ، على الرغم من أنه يسبب خللاً معينًا عندما نحاول أن نفهم ما إذا كان المستخدم "على قيد الحياة" أم لا.

أليس من الأفضل استخدام شبكة عصبية؟


أفضل ، ولكن أولاً وقبل كل شيء ، تحتاج إلى فهم كيفية تنفيذ المشروع: لحل المهام واسعة النطاق مع الخاطف أو الانتقال تدريجياً نحو الهدف.

يُظهر تحليل RFM احتمال "حياة" المستخدم في الوقت الذي يتم فيه الحساب. لن نتمكن من فهم ما إذا كان اللاعب سيغادر في غضون أسبوعين أو ثلاثة أسابيع ، وستتمكن الشبكة العصبية من ذلك. بالنظر إلى البنية التحتية بأكملها ، فإن إنشاء مثل هذا النظام المتكامل لتحليل سلوك اللاعبين من نقطة الصفر أمر أكثر صعوبة. علاوة على ذلك ، فأنت بحاجة إلى خط أساس ، يمكنك من خلاله مقارنة جودة الشبكة العصبية. من المحتمل أن يؤدي هذا النهج إلى خسائر مالية إذا لم تقم بحساب القوة.

توضح تجربتنا أن المهام العالمية تحتاج إلى التنفيذ التدريجي. إنشاء نموذج أولي عملي ليس بالأمر الصعب ، ولكن جمع ومعالجة البيانات وإنشاء وتدريب شبكة عصبية أمر آخر. هذه العمليات يمكن أن تستمر لفترة طويلة ، والتي تفتقر دائما.

لهذا السبب قررنا أولاً استخدام نموذج أكثر بساطة: لقد أجرينا بحثًا ، وحددنا إيجابيات وسلبيات ، واختبرناه في العمل. النتائج مناسبة لنا. يحتوي RFM على عيوب ، لكن يتم تعويضها بسخاء عن طريق سهولة الاستخدام. والشبكة العصبية هي الخطوة التالية نحو تحسين النظام.

Source: https://habr.com/ru/post/ar431520/


All Articles