تحليلات جغرافية في البيع بالتجزئة ، الجزء 1: نحن نقوم تلقائيًا بعملية اختيار مكان للعمل التجاري. 2GIS + MS Azure + ML



مرحبا بالجميع!

اسمي سيرجي كونكوف - أنا مهندس بيانات في تقارير الأعمال والبيانات.
يتحدث هذا المقال عن إمكانات استخدام التحليلات الجغرافية والتعلم الآلي في إحدى شركات البيع بالتجزئة ويستند إلى مشروع حقيقي لعميلنا - شبكة كبيرة من صالونات التجميل. لن يكون هناك الكثير من التعليمات البرمجية والتفاصيل الفنية ، وسيتم إيلاء الاهتمام لمراجعة التقنيات وتطبيقها والتكامل.

مهمة


هناك شركة النامية بنشاط في قطاع الخدمات. تفتح الشركة العديد من صالونات التجميل الشهرية بشكل رئيسي في مراكز التسوق (TC).

تتمثل المهمة في اختيار أفضل الأماكن للاكتشافات ، وتقليل الوقت وتكلفة اتخاذ القرارات.

خطة تنفيذ العينة


  1. سوف نتلقى بيانات عن مراكز التسوق التي يمكن أن تساعدنا في تقييم جاذبية الأماكن ؛
  2. دعونا نحاول العثور على اتصال بين البيانات التي تم الحصول عليها ونتائج عمل الصالونات في مراكز التسوق التي تعمل فيها الشركة بالفعل ؛
  3. سننشئ منهجية لتقييم مركز تسوق جديد لجاذبية ؛
  4. سننشئ نموذجًا للتعلم الآلي لحساب هذا التقدير لمراكز التسوق التي لا توجد فيها شركتنا بعد ؛
  5. سننشئ أدوات لأتمتة عمل المتخصصين في اختيار أماكن لفتح منافذ البيع بالتجزئة ؛

نحن نجمع البيانات الجغرافية


لذلك ، ما هي البيانات على مراكز التسوق يمكن أن تساعد.

يتأمل:

  • على سبيل المثال ، في أي منطقة أو مدينة تقع - موسكو أو سمارة ، بارفيخا أو فيخينو ؛
  • حجم مركز التسوق - كم عدد المتاجر والمطاعم والصالونات؟
  • وما هي هذه المتاجر - مواد البناء أو محلات الأزياء؟
  • هل هناك أي منافسين هناك؟ وكم هناك؟ وأي منهم؟
  • ربما هناك معلومات حول عدد الزوار في مركز التسوق؟
  • هل هناك أي مراكز التسوق الأخرى القريبة؟ داخل دائرة نصف قطرها 5 كم ، لا يوجد واحد أو اثنين أفضل من هذا عبر الطريق ؛
  • وماذا يوجد في مكان قريب؟ ربما مركز تجاري كبير مع العديد من موظفي المكاتب أو منطقة النوم؟

هذا هو ما يفكر فيه شخص "متمرس" حول من يحتاج إلى اتخاذ قرار بشأن مكان للعمل. لدى الشخص المتقدم تحت تصرفه أيضًا تحليلات ، والتي في Excel أو SQL يمكنها تقديم مبرر كفء استنادًا إلى كل هذه العوامل.

يستغرق جمع هذه البيانات ومعالجتها بعض الوقت. دعونا نحاول تحسين هذا.

أين يمكن الحصول على البيانات؟ دعونا نلقي نظرة على الخدمات الجغرافية الموجودة في السوق. أهمها: خرائط ياندكس ، 2GIS ، خرائط جوجل. بعد مقارنة الميزات ، استقرنا على 2GIS.
المزايا الرئيسية للخدمة في رأينا: دقة البيانات وأهميتها واكتمالها ، واجهة برمجة تطبيقات سهلة الاستخدام. ولكن يمكنك استخدام حلول الشركات المصنعة الأخرى.

يمكن الحصول على الوصول إلى واجهة برمجة تطبيقات 2GIS من خلال النموذج على موقع الخدمة. يتم دفع الوصول ويعتمد على عدد الطلبات ، بشكل منفصل سيكون من الضروري النص في العقد مع 2GIS على كيفية استخدام البيانات ، وهذا هو السبب في أننا نطلبها ، ما سنفعله معهم وما إلى ذلك.

سأخبركم قليلاً عن كيفية العمل مع واجهة برمجة تطبيقات 2GIS.

تتيح لك الخدمة اختيار موقع المنظمات في منطقة معينة (المدينة ، المنطقة ، الشارع ، وما إلى ذلك). كمرشح ، يمكنك تحديد نموذج تقييم المؤسسة (نوع النشاط). سنقدم طلبًا للبحث عن جميع المؤسسات تحت عنوان مراكز التسوق. نتيجة لذلك ، نحصل على قائمة بمراكز التسوق في المنطقة. استجابةً لكل مركز تسوق ، ستأتي أيضًا معرفات المنازل المزعومة - building_id. سنقدم طلبًا إلى جميع المنظمات الموجودة في المبنى مع إحدى البنايات المستلمة. نحصل على قائمة بجميع المنظمات في مركز التسوق هذا بما في ذلك أسمائها وعناوينها.



وبالتالي ، تلقينا قائمة بجميع المتاجر والصالونات والمطاعم وغيرها من المنظمات في مركز تجاري معين. يمكننا تقديم مثل هذا الطلب لكل مركز تسوق يهمنا.

البنية التحتية للمشروع


للتنفيذ ، اخترنا سحابة MS Azure . هناك كل ما نحتاجه ، وهو:


سيتم تحميل جميع البيانات التي تم الحصول عليها من 2GIS في جداول قاعدة بيانات Azure SQL.
نضع جميع البرامج النصية للتنزيل في حزم Azure Data Factory. سيتيح لنا ذلك تنزيل البيانات بكميات كبيرة (على سبيل المثال ، لجميع مراكز التسوق لمدينة معينة) وفقًا لجدول زمني للحفاظ على أهمية البيانات ، وكذلك بناءً على طلب مركز تسوق محدد.

مثال مهام التكامل:



العمل مع البيانات


يمكننا البدء في البحث عن العلاقة بين البيانات من 2GIS والنتائج الفعلية للصالونات. للقيام بذلك ، قم بتحميل البيانات من مراكز التسوق إلى المتجر الذي توجد فيه الشركة بالفعل. سنقوم بتحميل بيانات حول عمل صالونات من ERP - الإيرادات ، عدد الشيكات ، الهامش ، عدد الزوار.

في هذه المرحلة ، نربط المتخصصين بمشروع علوم البيانات. بالنسبة لهم ، نقوم بنشر مكعب OLAP استنادًا إلى البيانات التي تم جمعها وبيئة تعلم الآلة Azure.

أظهرت الدراسات التي أجراها علماء البيانات أن العوامل التالية تؤثر بشدة على نتائج عمل الصالونات (الإيرادات والهامش):

  • المدينة التي يقع فيها مركز التسوق ؛
  • عدد المتاجر في مركز التسوق ؛
  • عدد المنافسين في مركز التسوق ؛
  • وجود بعض العلامات التجارية ؛
  • عدد مراكز التسوق الأخرى داخل دائرة نصف قطرها 2 كم ؛

لتقييم مدى جاذبية مراكز التسوق ، نقدم مقياسًا من 1 إلى 10. من أجل شفافية تقييم الجاذبية ، نحتاج إلى إظهار المستخدم بالضبط أي العوامل وكيفية تأثيرها على التصنيف النهائي. فيما يلي مثال لتقييم أحد مراكز التسوق:



ربط التعلم الآلي


نحن نحسب هذا التقدير لجميع مراكز التسوق التي تعمل فيها الشركة بالفعل. سيتم استخدام مجموعة البيانات الناتجة (العوامل + التقييم) لإنشاء نموذج للتعلم الآلي. في النهاية ، يجب أن يحدد النموذج تقييم جاذبية مركز التسوق لافتتاح صالون جديد.

مثال على إنشاء تجربة في Azure ML Studio:



يوضح الشكل مثالًا بسيطًا لإنشاء تجربة تعلم آلي تعتمد على نموذج الانحدار الخطي.

بعد نشر النموذج الذي تم إنشاؤه في شكل خدمة ويب ، سنكون قادرين على الحصول على تصنيفات جاذبية لمراكز التسوق حيث لا توجد صالونات لشركتنا.

لذلك ، لدينا بيانات ، لدينا فهم لكيفية العمل معهم ، ولدينا طريقة لتصنيف مراكز التسوق. الآن سننقل كل هذا إلى المستخدمين في العملية.

نحن أتمتة عمل موظفي قسم اختيار الأماكن


للبدء ، إنشاء تقارير تحليلية.

على سبيل المثال ، نحتاج إلى تقييم إمكانية فتح العديد من منافذ البيع بالتجزئة في N.
نحن مهتمون بالبيانات التالية:

  • جميع مراكز التسوق في المدينة (عدد المتاجر في كل منها ، عدد المنافسين ، متاجرنا) ؛
  • جميع مراكز التسوق في المدينة حيث يوجد منافسون ، ولكن ليس لنا ؛
  • جميع المنافسين في المدينة (حيث يتم تمثيل مراكز التسوق ، كم عدد منافذ البيع بالتجزئة) ؛

فيما يلي مثال على أحد التقارير المقدمة في MS Power BI. مصادر البيانات هي مستودع البيانات الخاص بنا على MS Azure.



بعد ذلك ، سنقوم بعمل أداة لعرض البيانات التي تم جمعها على مراكز التسوق على الخريطة. واجهة برمجة تطبيقات API 2GIS المألوفة ستساعدنا في ذلك. في تطبيق الويب ، قم بإنشاء عنصر واجهة خريطة وتطبيق علامات مع علامات مراكز التسوق على ذلك. مثال (تم تغيير البيانات الحقيقية):



لتلخيص


لذلك قمنا بما يلي:

  • لقد صممنا عملية الحصول على بيانات عن مراكز التسوق من خدمة 2GIS.
  • لقد وجدنا صلة بين البيانات التي تم الحصول عليها ونتائج الصالونات في مراكز التسوق التي تعمل فيها الشركة بالفعل.
  • ابتكروا منهجية لتقييم مراكز التسوق لجاذبية.
  • قمنا بتطوير التقارير وأدوات لأتمتة عمل المتخصصين في اختيار أماكن لفتح منافذ البيع بالتجزئة.

دعونا نلقي نظرة على بنية الحل الذي لدينا.



في الجزء التالي من المقالة ، أخطط لمعرفة كيفية إجراء تحليلات جغرافية بوتية لمساعدة الموظفين المسؤولين عن اختيار أماكن العمل.

شكرا لاهتمامكم!

إذا كان شخص ما مهتمًا بالتفاصيل التقنية لتنفيذ المكونات الفردية للحل ، فعندها سأكون سعيدًا بالإجابة على الأسئلة الواردة في التعليقات أو في رسالة شخصية.

Source: https://habr.com/ru/post/ar483722/


All Articles