نجمع تحليل / تحليل الفوج للتدفقات على سبيل المثال من Excel

في مقال سابق ، وصفت استخدام التحليل الجماعي لتحديد أسباب ديناميكيات قاعدة العملاء. حان الوقت اليوم للتحدث عن حيل إعداد البيانات لتحليل الفوج.


من السهل رسم الصور ، ولكن من أجل قراءتها وعرضها بشكل صحيح "تحت غطاء المحرك" ، يجب القيام بالكثير من العمل. في هذه المقالة ، سنتحدث عن كيفية تنفيذ التحليل الجماعي. سأتحدث عن التنفيذ باستخدام Excel ، وفي مقال آخر باستخدام R.


سواء أحببنا ذلك أم لا ، ولكن في الحقيقة Excel هو أداة لتحليل البيانات. سوف يعتقد محللون أكثر "متعجرفين" أن هذه أداة ضعيفة وغير مناسبة. من ناحية أخرى ، في الواقع ، يقوم مئات الآلاف من الأشخاص بتحليل البيانات في Excel ، وفي هذا الصدد ، سيتغلب بسهولة على R / python. بالطبع ، عندما نتحدث عن التحليلات المتقدمة والتعلم الآلي ، سنعمل على R / python. وأود أن تتم معظم التحليلات باستخدام هذه الأدوات فقط. لكن من الجدير الاعتراف بالحقائق ، الغالبية العظمى من الشركات تقوم بمعالجة وتقديم البيانات في Excel ، وهذه هي الأداة التي يستخدمها المحللون العاديون والمديرون ومالكي المنتجات. بالإضافة إلى ذلك ، من الصعب هزيمة Excel من حيث بساطة ووضوح العملية ، لأنه تتقن حساباتك ونماذجك حرفيًا بيديك.


وهكذا ، كيف نقوم بالتحليل الجماعي في إكسيل؟ لحل هذه المشاكل ، تحتاج إلى تحديد شيئين:


  1. ما البيانات التي لدينا في بداية العملية


  2. كيف يجب أن تبدو بياناتنا في نهاية العملية.


    لجمع تحليل جماعي ، لن نحتاج فقط إلى بيانات العودة في التواريخ والأقسام. نحتاج إلى بيانات على مستوى العملاء الفرديين. في بداية العملية نحتاج إلى:


  3. تاريخ التقويم


  4. هوية العميل


  5. تاريخ تسجيل العميل


  6. حجم المبيعات لهذا العميل في تاريخ التقويم هذا



أول صعوبة يجب التغلب عليها هي الحصول على هذه البيانات. إذا كان لديك التخزين الصحيح ، فيجب أن يكون لديك بالفعل. من ناحية أخرى ، إذا كنت قد نفذت حتى الآن فقط تسجيل البيانات على إجمالي المبيعات حسب اليوم ، فحينئذٍ تكون لديك بيانات العملاء فقط في "المنتج". لتحليل المجموعة ، سيتعين عليك تنفيذ ETL ووضع البيانات في سياق العملاء في مساحة التخزين الخاصة بك ، وإلا فلن تنجح. والأفضل من ذلك كله ، إذا فصلت "prod" والتحليلات في قواعد بيانات مختلفة ، لأن المهام التحليلية والمهام الوظيفية لمنتجك لها أهداف مختلفة: التنافس على الموارد. يحتاج المحللون إلى تجميعات وحسابات سريعة للعديد من المستخدمين ، ويحتاج المنتج إلى خدمة مستخدم معين بسرعة. سأكتب مقالة منفصلة حول منظمة التخزين.


لذلك لديك بيانات البدء:



أول شيء يتعين علينا القيام به هو تحويلهم إلى "سلالم". للقيام بذلك ، تحتاج إلى بناء جدول محوري فوق هذا الجدول ، في الصفوف - تاريخ التسجيل ، في الأعمدة - تاريخ التقويم ، كقيم - عدد العملاء. إذا قمت باستخراج البيانات بشكل صحيح ، فيجب أن تحصل على مثل هذا المثلث / السلم:



بشكل عام ، السلم هو مخطط المجموعة النموذجية ، حيث يعرض كل سطر ديناميكيات مجموعة نموذجية منفصلة. العملاء في الوقت المناسب في هذه الشاشة يتحركون فقط في سطر واحد. وبالتالي ، تعكس ديناميكيات الفوج تطور العلاقات مع مجموعة من العملاء الذين جاءوا في فترة زمنية واحدة. في كثير من الأحيان ، من أجل الراحة ودون فقدان الجودة ، يمكنك دمج المجموعات النموذجية في "كتل" من الصفوف. على سبيل المثال ، يمكنك تجميعها حسب الأسبوع والشهر. بنفس الطريقة ، يمكنك تجميع عمود أيضًا. ربما لا تتطلب وتيرة تطوير منتجك تفاصيل تصل إلى أيام.


استنادًا إلى هذا السلم ، يمكنك إنشاء رسم بياني من مقالتي (أشرت حقًا إلى أنني قمت بتجميع عدة أسطر في سطر واحد بحيث تكون المجموعة النموذجية أصغر):



هذا رسم بياني يحتوي على مناطق تراكمية حيث يكون كل صف صفًا ، أفقيًا من التاريخ.


منطق أكثر تعقيدًا لتنفيذ جدول "التدفقات". بالنسبة للخيوط ، نحتاج إلى إجراء بعض الحسابات الإضافية. في منطق سلسلة المحادثات ، يصل كل عميل في حالات مختلفة:


  1. جديد - أي عميل لديه فرق بين تاريخ التسجيل وتاريخ التقويم <7 أيام
  2. تمت إعادة تنشيطه - أي عميل لم يعد جديدًا ، ولكن في الشهر التقويمي الأخير لم يحقق أرباحًا
  3. صالح - أي عميل ليس بجديد ولكنه حقق عائدًا في الشهر التقويمي
  4. غادر - أي عميل لا يدر إيرادات لمدة شهرين متتاليين

بادئ ذي بدء ، يجب عليك إصلاح هذه التعريفات في الشركة بحيث يمكنك تنفيذ هذا المنطق بشكل صحيح وحساب الحالات تلقائيًا. هذه التعاريف الأربعة لها آثار بعيدة المدى على التسويق بشكل عام. ستعتمد استراتيجياتك في الجذب والاحتفاظ والعودة على الحالة التي تعتقد أن العميل فيها. وإذا بدأت في تطبيق نماذج تعلُّم الآلة في توقع خروج العملاء ، فستصبح التعريفات هي حجر الزاوية لنجاح هذه النماذج. بشكل عام ، سأكتب مقالة منفصلة حول تنظيم العمل وأهمية المنهج التحليلي. أعلاه ، أعطيت فقط مثالاً لما يمكن أن تكون عليه هذه التعريفات.


في Excel ، تحتاج إلى إنشاء عمود إضافي حيث يمكنك إدخال المنطق الموضح أعلاه. في حالتنا ، يجب علينا "العرق". لدينا نوعان من المعايير:


  • الفرق بين تاريخ التسجيل وتاريخ التقويم - يحتوي كل صف على هذه البيانات ثم تحتاج فقط إلى حسابها (طرح التواريخ في Excel فقط يعطي الفرق في الأيام)
  • بيانات الإيرادات للشهر الحالي والأخير. هذه البيانات ليست متاحة لنا في السطر. علاوة على ذلك ، مع الأخذ في الاعتبار حقيقة أن الطلب غير مضمون في جدولنا ، لا يمكنك تحديد مكان وجود بيانات في أيام أخرى من الشهر لهذا العميل بالضبط.

هناك طريقتان لحل مشكلة نوعين من المعايير:


  1. اطلب القيام بذلك في قاعدة البيانات. يسمح SQL باستخدام الوظيفة التحليلية لحساب مقدار الإيرادات لكل عميل للشهر الحالي والشهر الماضي (للشهر الحالي SUM (الإيرادات) أكثر (الجزء حسب BY_العميل ، calendar_month ، ثم LAG للحصول على الإزاحة للشهر الماضي):
  2. في Excel ، يجب عليك تنفيذها على النحو التالي:
    • بالنسبة للشهر الحالي: SUMMES () ، ستكون المعايير هي معرف العميل وشهر خلية يوم التقويم
    • للشهر الماضي: SUMMES () ، ستكون المعايير هي معرّف العميل وشهر خلية يوم التقويم مطروحًا منها شهر تقويمي واحد بالضبط. في هذه الحالة ، أوجه الانتباه إلى حقيقة أنه يجب عليك طرح الشهر التقويمي ، وليس 30 يومًا. خلاف ذلك ، فإنك تخاطر بالحصول على صورة ضبابية بسبب العدد غير المتساوي من الأيام في الأشهر. استخدم أيضًا الدالة IF ERROR لاستبدال القيم الخاطئة للعملاء الذين لم يكن لديهم الشهر الماضي.

من خلال إضافة أعمدة الإيرادات للشهر الحالي من الشهر الماضي ، يمكنك إنشاء شرط مضمن إذا أخذ في الاعتبار جميع العوامل (الفرق في التواريخ ومقدار الإيرادات في الشهر الحالي / الماضي):
IF (فرق التاريخ <7 ؛ "جديد" ؛
IF (AND (إيرادات الشهر الماضي = 0 ؛ إيرادات الشهر الحالي> 0) ؛ "إعادة التنشيط" ؛
IF (و (إيرادات الشهر الماضي> 0 ؛ إيرادات الشهر الحالي> 0) ؛ "الحالي"
IF (AND (إيرادات الشهر الماضي = 0 ؛ إيرادات الشهر الحالي = 0) ؛ "المغادرة" ؛ "الخطأ"))))


مطلوب "خطأ" هنا فقط للتحكم في أنك لم تكن مخطئًا في التسجيل. منطق معايير حالة MECE ( https://en.wikipedia.org/wiki/MECE_principle ) ، أي إذا تم كل شيء بشكل صحيح ، فسيتم لصق كل واحد منهم على حالة واحدة من أصل 4


يجب أن تحصل عليه كما يلي:



الآن يمكن إعادة بناء هذا الجدول باستخدام جدول محوري في جدول للتخطيط. تحتاج إلى تحويله إلى جدول:


تاريخ التقويم (الأعمدة)
الدولة (الصفوف)
عدد معرف العملاء (القيم في الخلايا)


بعد ذلك ، نحتاج ببساطة إلى إنشاء مخطط تخطيطي شريطي على أساس البيانات ، مع تراكم ، على المحور X تاريخ التقويم ، الصفوف هي الحالات ، عدد العملاء هو ارتفاع العمود. يمكنك تغيير ترتيب الولايات على الرسم البياني عن طريق تغيير ترتيب الصفوف في قائمة "تحديد البيانات". نتيجة لذلك نحصل على الصورة التالية:



الآن يمكننا البدء في التفسير والتحليل.

Source: https://habr.com/ru/post/ar416017/


All Articles