مسابقة كأس بيانات الاتصالات سخونة قادمة



في أوائل نوفمبر ، تم إطلاق بطولة تعلم الآلة وتحليل البيانات ، والتي يطلق عليها اسم Telecom Data Cup ، والتي نظمتها Mail.Ru Group و MegaFon.

تم إطلاق المسابقة على منصة ML Boot Camp الشهيرة بالفعل. نحاول إجراء معظم مسابقات تحليل البيانات الخاصة به. هذه المسابقة هي الثانية على التوالي هذا العام والسابع لكامل وجود المشروع. البطولات السابقة مفتوحة في وضع الحماية ، والذي يسمح لك بالتدريب على حل المهام السابقة في أي وقت من النهار أو الليل.

أكثر من 2500 مستخدم مسجل في المسابقة الحالية ، قام 1700 شخص بتنزيل مجموعة البيانات ، وتم تحميل 7800 حل مختلفًا ، وتجاوز مجتمع الدردشة علامة 1600 مشارك. ستنتهي المسابقة في 16 ديسمبر ، لذا فقد حان الوقت للانضمام إلى نادي القتال ، إذا لم تكن مشتركًا بالفعل. نحن نرحب ومساعدة الجميع. القهوة أو أي شيء خاص بك وتنشيط لمساعدتك :)



في تذييل المقال ستجد روابط ومواد مفيدة في هذه المسابقات السابقة. الشيء الرئيسي هو أنه في الوقت الحالي ، سوف تغوص في عالم مهمة كأس بيانات الاتصالات ، والتي ستتيح لك المشاركة بسرعة في هذه العملية والاستمتاع ببحوث حقيقية.

باختصار عن المهمة


يمكن لأولئك الذين يدركون بالفعل ما يجري في البطولة الانتقال إلى القسم التالي.

لقد سئمنا جميعًا من استطلاعات الرأي الهاتفي عبر الإنترنت والهاتف لـ "المسوقين". تخيل كيف يتصل بك ويسأل عما إذا كنت تشاهد التلفزيون الآن ، وما هي القناة ، وعدد الأجهزة التي يتم تشغيلها حاليًا ونوع البرامج التلفزيونية الجارية. يا الله ، أريد حقًا إسقاط الهاتف (نحن نفعل هذا كثيرًا). يشعر المستخدمون بالغضب ، ويحجمون عن مشاركة التعليقات ، مما يؤثر سلبًا على جودة الخدمات المقدمة. المشكلة تحتاج إلى حل.

في هذه المسابقة ، تحتاج إلى الانغماس في عالم الاتصالات السلكية واللاسلكية ، بحيث على أساس بيانات المستخدم مجهولة المصدر المقدمة من مشغل الاتصالات MegaFon والتي تم الحصول عليها خلال استطلاعات العملاء الحقيقية الحقيقية ، للتنبؤ ما إذا كان المشتركون راضون عن جودة الاتصالات.

تم مسح 9443 مشترك. نتيجة الاستطلاع هي مؤشر رضا لكل مشترك ، يساوي الصفر (0 - راضٍ) أو واحد (1 - غير راضٍ). من الضروري تحديد العملاء غير الراضين بأكبر قدر ممكن من الدقة.

المقياس الذي يقيم قراراتك هو ROC AUC. يجب إجراء التنبؤ لـ 5221 مشتركًا بنفس الترتيب كما هو الحال في ملف subs_csi_test.csv . يمكن تنزيل البيانات من موقع النظام الأساسي. سيتم إنشاء النتائج الأولية من خلال ردود 2088 من المشتركين ، والنتائج النهائية عن طريق إجابات لـ 3133 مشترك (40/60). الحد الأقصى لعدد مرات تنزيل الحلول في اليوم هو 5 ، وعدد الحلول المحددة هو 2.

Graal




أثار التحدي فضول المجتمع. المشاركون اختيار الحلول المختلفة. يقوم البعض بإنشاء نماذج N وعرضها وتدفقها لأسفل وتدفقها و ... فويلا ، لقد انتهيت. يقوم الآخرون بتكوين ميزات ، ودراسة الانضباط "نظم المعلومات والتقنيات" من خلال المحاضرات المنشورة في المستودع ، ويبدو أن كل شيء على ما يرام أيضًا. والبعض يعتمد على عشوائي مع البذور الجيدة.

لكي تصبح لوحة المتصدرين أكثر جمالا في نهاية المسابقة ، نريد مشاركة بعض Graals في المهمة معك.

الكأس رقم 0.




إيلاء الاهتمام للدردشة ومستودع جيثب مع المحاضرات. هناك الكثير من المعلومات المفيدة. الكثير منا لديهم فكرة بسيطة عن كيفية عمل الشبكة. هو الذي يسعى سيجد دائما! تمت إضافة عرض تقديمي قصير إلى المستودع مع وصف لتشغيل BS وملف مع توزيع الميزات حسب الخدمات.





في محادثة ، يقوم المشاركون بتعذيب المنظمين. تحاول التراجع ، ولكن من الصعب.



الكأس رقم 1


في البيانات المقترحة ، يشير الحقل cell_lac_id إلى خلية واحدة. كل خلية تنتمي إلى جيل واحد فقط من الاتصالات: 2G ، 3G ، 4G (LTE). نوصي بمحاولة تحديد لكل خلية الجيل الذي تنتمي إليه.

الكأس №2


يحتوي كل هاتف على الحد الأقصى لتكنولوجيا نقل البيانات التي يدعمها: 2G ، 3G ، 4G. المعلومات المتعلقة بهذا موجودة في حقل INTERNET_TYPE_ID في جدول الميزات الفرعية . الحقل مشفر. ضع في اعتبارك كيف يمكنك تحديد أي من القيم في هذا الحقل تتوافق مع أي تقنية.

الكأس رقم 3


يرجى ملاحظة: إذا كان لدى بعض العملاء هاتف يدعم 4G ، ولكن من التاريخ نرى أنه يقوم في كثير من الأحيان بتنزيل حركة المرور عبر الجيل الثالث 3G أو حتى الخلايا 2G ، كيف يمكن لهذه الحقيقة أن تؤثر على تصوره لجودة الاتصالات؟

الكأس №4


لدى العملاء أقراص عسلية يزورونها باستمرار وبشكل منتظم (المنزل ، العمل ، الطريق ، متجر ، إلخ.) ، وعسل العسل الذي نادراً ما يكونون فيه قليلين. ما رأيك ، نوعية الخلايا التي يمكن أن تكون أكثر أهمية للعميل؟ كيف يمكنك تحديد الخلايا المهمة؟

الكأس №5


يحتوي جدول الاستهلاك الفرعي لحركة المرور على الإنترنت على معلومات حول مقدار البيانات المنقولة (SUM_DATA_MB) والوقت الذي تستغرقه (SUM_DATA_MIN). ما هي المعلومات حول تجربة العميل على الخلية التي يمكن استخراجها من هذه البيانات؟

الكأس №6


في الجدولين bs_avg_kpi و bs_chnn_kpi ، توجد معلومات حول عدد كبير من خصائص الخلية في المتوسط ​​يوميًا وفي الساعة الأكثر انشغالًا (CNN) ، بالإضافة إلى سجل لعدة أشهر. حاول تحديد مجموعات من الخلايا التي تشبه بعضها البعض من حيث هذه الخصائص. ربما هناك خلايا مختلفة جدا عن الكتلة الكلية؟ ماذا يحدث للعملاء الذين يزورون هذه الخلايا غالبًا؟

على هذا الكأس من المنظمين انتهت. نحن على يقين من أنها سوف تساعدك في تحقيق محادثة خاصة أفضل. لا يعمل - التحميل بشكل عشوائي ، كما تعلمون ، سوف يطير على قميص. كل الأكثر إثارة للاهتمام في المستقبل. في نهاية البطولة ، سوف يحرق المتصدرين :) تذكر الخمسة الاوائل!



الجدول الزمني


تنتهي البطولة في 16 ديسمبر ، وفي 22 ديسمبر ، يتم منحها في مكتب MegaFon.

يعرض


المركز الأول: 400000 روبل ؛
المركز الثاني: 200000 روبل ؛
المركز الثالث: 100000 روبل.

تقليديا ، سوف تحصل على أفضل 200 قمصان تي شيرت مع رموز البطولة.
بالإضافة إلى ذلك ، هناك ترشيحات خاصة:

  • لمعظم "vkhuh" أسفل على القطاع الخاص - SSD كينغستون 120 جيجابايت.
  • سيحصل كل مشارك يأخذ أكثر من 50 شخصًا على تي شيرت مع ملصق من حزمة المجتمع.



المجتمع


انضم إلى مجتمعنا على Telegram. يمكنك دائمًا طرح الأسئلة والحصول على مشورة الخبراء في مجال علوم البيانات. تمثل Mail.Ru Group Championship Community شبكة تواصل حيث يسهل العثور على أشخاص متشابهين في التفكير.

روابط مفيدة


  1. ML Boot Camp I ( معسكر تدريب التعلم الآلي - كيف كان ... )
  2. ML Boot Camp II ( ML Boot Camp 2016. جديد في أفضل 10 "تقييم أداء." بسيط للغاية ... )
  3. ML Boot Camp III. بيانات ثنائية ( كما فعلنا مع ML Boot Camp III ، فائز بمسابقة ML Boot Camp I ... ، و ML Boot Camp III: التنبؤ بترك النصف ... )
  4. ML Boot Camp IV. مهمة سرية ( ML Boot Camp IV. رابعًا. Secret. T ... ، ML Boot Camp IV. من 1 عام إلى 35 عامًا ... ، عمليات التثبيت و Dirichlet في الحل ... )
  5. ML Boot Camp V. تنبؤ CVDs ( AgeHack - أول hackathon على الإنترنت لفترة طويلة ... ، ML Boot Camp V ، تاريخ قرار لمدة 3 أشهر ... ، Meetup بناءً على نتائج بطولة ML Boot Camp )
  6. ML Boot Camp VI. التنبؤ باستجابة الجمهور للاستطلاع عبر الإنترنت ( ML Boot Camp VI. توقعات استجابة الجمهور ... ، تاريخ المركز الأول على ML Boot Camp VI ).

Source: https://habr.com/ru/post/ar432046/


All Articles