البث المباشر ليوم Sberbank Data Science يوم 10 نوفمبر

مرحبًا

في 10 نوفمبر (غدًا!) في موسكو ، سيستضيف مركز السينما في أكتوبر مؤتمر يوم علوم البيانات Sberbank الكبير ، حيث سيتم منح الفائزين SDSJ 2018 ، والخطب التي يلقيها عدد كبير من الخبراء الدوليين والروس في مجال علوم البيانات ، قسم حول ML واستخدام الذكاء الاصطناعي في العلوم والأعمال. وأكثر إثارة للاهتمام!

يمكنك مشاهدة البث المباشر هنا . تحت katom وعلى الموقع الإلكتروني للبرنامج. كما نصف كيف تم تصنيف الفائزين في Sberbank Data Science Journey.



البرنامج


ينقسم المؤتمر إلى عدة كتل مواضيعية ، وهنا الجدول الزمني:

القاعة الرئيسية

11:00 - 11:30. افتتاح المؤتمر.
11:30 - 12:30. حلقة نقاش "تحليل البيانات وتقنيات الذكاء الاصطناعي في الاقتصاد الرقمي"
12:30 - 13:15. "الأساليب والمعماريات المكيفة بيولوجيا في التعلم العميق". سيرجي بارتونوف ، عقل عميق
13:15 - 14:00. "وكلاء المحادثة كمرافق رقمي ذكي لفهم المشاعر البشرية والتعبير عن مشاعرها." سو يونغ لي ، KAIST
15:00 - 15:45. "التعلم الآلي القابل للتطوير." أندري سبيريدونوف ، H2O
15:45 - 16:30. حلقة نقاش "Trending Innovation: استخدام DS / AI وتحسين تجربة العملاء"
17:15 - 18:00 الترسيم الرسمي للفائزين في مسابقات Sberbank Data Science Journey ومسابقات الذكاء الاصطناعي الكلاسيكية (المنافسة في التوضيح باستخدام الذكاء الاصطناعي)

قاعة "العلوم"

12:30 - 13:45 تكنولوجيا DS / AI: AutoML
13:45 - 14:45. تكنولوجيا DS / AI: رؤية الكمبيوتر
14:45 - 15:45 تكنولوجيا DS / AI: معالجة اللغات الطبيعية (NLP)
15:45 - 16:30 تكنولوجيا DS / AI: تعلم التعزيز
16:30 - 17:15 تقنيات DS / AI: تحليلات الكلام

القاعة "التجارية" (القاعة 1)

12:30 - 13:45. تطبيق DS / AI في البنوك والتمويل
13:45 - 15:00. استخدام DS / AI في الطب والمعلوماتية الحيوية
15:00 - 16:15 تطبيق DS / AI في القطاعين المصرفي والمالي
16:15 - 17:15 كتابة الدماغ: إنشاء منصة لأبحاث الذكاء الاصطناعي

قاعة الأعمال (القاعة 2)

12:30 - 14:45. استخدام DS / AI في البيع بالتجزئة
14:45 - 16:30. التطبيقات الصناعية DS / AI
16:30 - 17:15. تطبيق DS / AI في وسائل الإعلام والاتصالات

قاعة المجتمع

12:30 - 13:15. عرض ملصقات "جلسة بوستر لايتنينج توك"
13:15 - 15:00. عرض المشاريع المفتوحة في مجال DS / AI "AI Open Projects"
15:00 - 15:45. صنع القرار التقليدي في مسابقة الذكاء الاصطناعي
15:45 - 17:15. Sberbank Data Science Journey Competition Analysis

الفائزون برحلة علوم البيانات في Sberbank


اقترحنا هذا العام حل المشكلات باستخدام تقنية AutoML. حتى نهاية 3 نوفمبر ، قام المشاركون بتحميل قراراتهم ، في الساعات الـ 12 التالية اختاروا الأفضل من قراراتهم. الآن الخيار لهيئة المحلفين. في المؤتمر ، سنكافئ الفائزين في رحلة Sberbank Data Science.

تم تزويد المشاركين بمجموعات بيانات جاهزة من بنك Sberbank. تم تجميع جميع مجموعات البيانات الـ 24 المشاركة في المسابقة من قبل أقسام مختلفة: وحدة البيع بالتجزئة ، وحدة المخاطر ووحدة التكنولوجيا. كلهم تم تدريبهم بشكل خاص ونزع صفتهم. كان الأساس معلومات مثل:

  • الحد المسموح به للسهم
  • وقت تسليم البطاقة
  • أنواع مختلفة من التهديف
  • ملاحظات عرض البطاقة
  • الرد على عروض المنتجات الأخرى
  • أعطال أجهزة الصراف الآلي
  • معلومات السحب النقدي من أجهزة الصراف الآلي
  • أرصدة الحسابات والمعلومات الأخرى

لتقييم القرارات ، تم اختيار مجموعات من مجموعات البيانات: حدد (مفتوح للمشاركين) ، عام (مخفي عن المشاركين ، ولكن يمكنك رؤية النتيجة أثناء المسابقة) ، خاص (المجموعة التي تلخص فيها نتائج المسابقة)

في كل مجموعة ، هناك ثلاث مشاكل انحدار وخمس مشاكل تصنيف ثنائية. عملت الحلول على مجموعات بيانات بأحجام مختلفة: من 1 ميغابايت و 300 سطر إلى 1 غيغابايت و 1 مليون خط. قبل بدء المسابقة ، أعدت لجنة التحكيم مجموعات البيانات ، وقام نظام الاختبار بفحصها بالفعل في الوضع التلقائي ، والآن يمكنك رؤية النتائج على موقع الويب (مع مراعاة القيود المرتبطة بالمؤامرة).

تم اتخاذ القرارات في شكل محفوظات برمز. احتاج المشاركون إلى إنشاء خوارزمية تنفذ الدورة الكاملة لحل مشكلة التعلم الآلي تلقائيًا ، وتلقي البيانات كمدخلات وإرجاع إجابة جاهزة عند الإخراج.

يجب أن تتوافق قرارات المشاركين مع القيود المعطاة:

  • الموارد المتاحة
  • لا يملك الحل الوصول إلى موارد الإنترنت
  • الحجم الأقصى لأرشيف معبأ وغير معبأ بمحلول: 1 جيجابايت
  • يتم فك الأرشيف في نظام ملفات موجود في ذاكرة الوصول العشوائي (ramfs) ، وهو متاح لحل الكتابة
  • ما تبقى من محتويات الحاوية للقراءة فقط
  • لا يتجاوز CSV مع مجموعة البيانات 3 غيغابايت
  • هناك حاجة إلى القيود من أجل تحقيق مقارنات عادلة من خلال وضع المشاركين في ظروف فنية متساوية.


إليك ما هو نظام التصنيف في هذه المسابقة:

  1. بالنسبة لكل مهمة (مجموعة بيانات) ، يتم النظر إلى المقياس الخاص بالمهمة (RMSE للتراجع ، ROC-AUC للتصنيف الثنائي) في جزء الاختبار من العينة.
  2. لكل مهمة (مجموعة بيانات) ، تُترجم مقاييس المشاركين إلى مقياس مشترك وفقًا للمخطط التالي. للحصول على أفضل حل متري (من بين جميع الحلول المرسلة والمختبرة بنجاح) يتم إعطاء نقطة واحدة ، يتم تقدير حل الخط الأساسي عند 0 نقطة. يحصل المشاركون الذين هم في المقياس بين أفضل الحلول الأساسية على عدد نسبي من النقاط بين 0 و 1. يتم تقدير القرارات المتعلقة بجودة الجزء السفلي من خط الأساس عند 0 نقطة. إذا كان الحل الأفضل وقرار خط الأساس متماثلين ، فسيحصل جميع المشاركين على 0 نقطة. إذا أعطى حل المشارك خطأً في المهمة أو لم يتجاوز الحد الزمني ، فسيحصل على 0 نقطة لهذه المهمة.
  3. تعتبر النتيجة النهائية لكل مشارك بمثابة مجموع النتائج لكل مهمة بعد التحويل إلى مقياس مشترك. في لوحة الصدارة العامة ، يتم تصنيف المشاركين حسب النتيجة النهائية.

نتائج المسابقة متاحة هنا .

بالإضافة إلى التصنيف الرئيسي ، تنافس المشاركون على جائزة في ترشيح "أفضل قرار عام". طوال فترة المسابقة ، نشروا أساليبهم في حل مشكلة AutoML على GitHub ، وتم تحديد الفائزين من خلال عدد نجوم GItHub.

سيحتوي المؤتمر على قسم منفصل مخصص لـ SDSJ'18 ، حيث سيتحدث الفائزون عن قراراتهم والإجابة على جميع الأسئلة.

مرة أخرى ، اترك رابطًا لبث المؤتمر عبر الإنترنت ، بحيث يمكن لجميع المهتمين مشاهدة يوم Sberbank Data Science.

Source: https://habr.com/ru/post/ar429320/


All Articles