
الحضور في مؤتمر SmartData هم الأشخاص الذين يحبون العمل مع البيانات. يجب أن نفترض أنهم وضعوا تقييماتهم للتقارير بعد مؤتمر العام الماضي بعناية شديدة.
والآن ، وفقًا لهذه التقديرات ، قمنا بتجميع أفضل 10 مقاطع فيديو. وفي الوقت نفسه ، لإرضاء المتحمسين للبيانات ، أشاروا إلى جميع الأرقام ذات الصلة لكل من التقارير العشرة: ضعها في الأعلى ، تصنيف العارض الدقيق ، عدد المشاهدين.
بشكل عام ، لا تختلف التقييمات في المناصب العليا بشكل كبير. لذا ، ربما لا ينبغي أن تعلق أهمية كبيرة على "من يتبع من" - والأهم من ذلك أن كل هذه التقارير حصلت على درجات عالية. ولكن من ناحية أخرى ، كيف لا يمكن أن تولي اهتماما كبيرا للأرقام عندما تكون مثيرة للغاية!
نيورونا: لماذا علمنا الشبكة العصبية لكتابة القصائد بروح كورت كوبين؟
المتحدث:
إيفان يامشيكوفالموقع: 1
التقييم: 4.51 ± 0.08
عدد المشاهدين: ~ 200
تقرير العرضكان القائد الواضح للمؤتمر هو الكلمة الرئيسية الختامية لمبدع مشروع الدفاع العصبي ومشاريع Neurona. هذا أداء يمكن الوصول إليه ولا يتطلب تحضيرًا هائلاً من المشاهد - ولكنه في الوقت نفسه ليس مجرد تفسير مائة ألف "لكيفية عمل الشبكات العصبية". يبدو أن هذا تنسيق "ترفيهي" (من غير المحتمل أن يؤثر ما تسمعه على الفور على مشروع عملك) - ولكن على المدى الطويل ، قد لا يكون كل هذا مثيرًا للاهتمام فحسب ، بل مفيدًا أيضًا. بشكل عام ، هل من المستغرب أننا قمنا بدعوة إيفان للمشاركة في SmartData 2018 القادمة.
من النقر للتوقعات والعكس بالعكس: خطوط أنابيب علوم البيانات في Odnoklassniki
المتحدث:
ديمتري بوجايتشنكوالمكان: 2
التقييم: 4.36 ± 0.08
عدد المشاهدين: 140
تقرير العرضوهنا العكس. أولاً ، هذه ليست عبارة عامة عن "ما يمكن أن يمنحنا إياه التعلم الآلي" ، ولكن تفاصيل "كيف ننفذ كل شيء بالضبط". والتقرير ليس عن ML في حد ذاته (يتم إعطاء تخصيص موجز الأخبار كمثال فقط) ، ولكن عن كل ما يتعلق به: "ما يجب القيام به لجعل كل هذا ML-beauty يعمل". بشكل عام ، إذا كان خطاب Yamshchikov قد يثير اهتمام حتى جمهور واسع ، فسيكون من المثير للاهتمام أن يكون مرتبطًا شخصيًا فقط بتعلم الآلة ، ولكن يمكنهم تحمل الكثير لأنفسهم.
CatBoost - الجيل القادم من تعزيز التدرج
المتحدث:
آنا فيرونيكا دوروجوشالموقع: 3
التصنيف: 4.32 ± 0.12
عدد المشاهدين: 100
تقرير العرضإذا لم يكن تعزيز التدرج هو تخصصك ، وأثار موضوع التقرير الشعور "ربما تكون هناك فروق دقيقة لأولئك الذين يفعلون ذلك بالفعل بقوة وقدرة" ، تبديد المخاوف. التقرير ودي للمبتدئين ولا يغوص على الفور في المسبح برأسه ، ولكنه يشرح أولاً الأشياء الأساسية. وبالنظر إلى أنه على مدار العام الماضي ، أصبحت مكتبة Yandex CatBoost أكثر جمالًا وشعبية من المكتبة السابقة ، فمن المفيد أن يكون لديك فكرة عنها ، حتى لو لم يكن عليك التعامل معها في الوقت الحالي ، ويمكن أن يكون التقرير مقدمة جيدة.
العودة إلى مستقبل النظام المصرفي الحديث
المتحدث:
فلاديمير Krasilshchikالموقع: 4
التصنيف: 4.31 ± 0.17
عدد المشاهدين: 80
تقرير العرضما الذي يجب فعله إذا كانت بيانات تقريرك الفصلي ، في نهاية المطاف ، مختلفة عن البيانات الشهرية ، وكان لدى المدققين والجهات التنظيمية أسئلة؟ يشرح فلاديمير كرازيلشيك أن الطابع المصغر يصبح المفهوم الأساسي: هناك "وقت وقوع الحدث" ، وهناك "عندما اكتشف النظام ذلك" ، تحتاج إلى العمل مع هذين الميزان وإثباتهما لكل من اختبار الطرف الثالث. لا يقتصر التقرير على ذلك ، فهناك المزيد - على سبيل المثال ، هل تعتقد أنه في مؤتمر تكنولوجيا المعلومات ستسمع عبارة "لا عدالة ، ولا يجب أن تحاول إنشائها"؟
الاسم ميزة
المتحدث:
فيتالي خودوباخشوفالموقع: 5
التصنيف: 4.28 ± 0.08
عدد المشاهدين: 280
تقرير العرضالعرض الأكثر تناقضًا للمؤتمر ، مما يجبرك على خدش رأسك في الحيرة. من ناحية ، من الواضح تمامًا لأي شخص عاقل: لا توجد أسباب ملحوظة لربط اسم الشخص (إذا كنا نتحدث عن أسماء روسية شائعة) وما إذا كان هذا الشخص سيكون في علاقة. من ناحية أخرى ، يقدم فيتالي بيانات تظهر العكس. هو نفسه لم يكن لديه تفسير دقيق ، ولكن لم يجد أحد اعتراضات مقنعة. يمكنك محاولة البحث بنفسك.
لا بيانات؟ لا مشكلة! التعلم العميق في CGI
المتحدث:
إيفان دروكينالموقع: 6
التصنيف: 4.26 ± 0.18
عدد المشاهدين: ~ 40
تقرير العرضكما تعلمون ، الخوارزميات ليست كافية للتعلم العميق - نحن بحاجة إلى بيانات أولية للتعلم. ونتيجة لذلك ، أصبحت مجموعة بيانات جيدة مورداً قيماً. ولكن ماذا لو لم يكن لديك الآن ، وأنت لست Google ولا يمكنك استثمار موارد ضخمة؟ اتضح أنه ليس من الضروري دائمًا أخذ بيانات "حقيقية" من العالم الحقيقي ، وفي ظل ظروف معينة يمكن إنشاؤها حرفياً. يتعامل التقرير مع حالة محددة من هذا النوع.
شبكات تلافيفية عميقة للكشف عن الأشياء وتجزئة الصورة
المتحدث:
سيرجي نيكولينكوالموقع: 7
التصنيف: 4.24 ± 0.17
عدد المشاهدين: 80
تقرير العرضإذا كنت لا تزال بعيدًا عن التعلم الآلي / العميق بشكل عام ، فقد تظهر أول 20 دقيقة من هذا التقرير بشكل جيد: هناك مقدمة شاملة للموضوع مع رحلة تاريخية تبدأ في الخمسينيات. وإذا كنت تفهم كل شيء عنها ككل ، ولكنك لا تفهم الموضوع الفرعي للشبكات التلافيفية العميقة ، فيمكنك تخطي المقدمة على الفور والانتباه إلى النصف الثاني من التقرير ، حيث تذهب إلى الشبكات العصبية المعقدة.
توفر Hadoop العالي: تجربة Badoo
المتحدث:
ألكسندر كراشينكوفالموقع: 8
التصنيف: 4.22 ± 0.14
عدد المشاهدين: 100
تقرير العرضيبدو ، بالإضافة إلى مفهوم "البيانات الضخمة" ، أن "البيانات المتنامية" ستكون مفيدة أيضًا ، لأن النمو يفرض تفاصيله الخاصة. بمجرد أن كان لدى Badoo أوامر بيانات أصغر حجماً ونهج واحد لهم ، زادت الأحجام وكانت التغييرات مطلوبة - ويجب أن يوضع في الاعتبار أن كل شيء يمكن أن يصبح أقوى غدًا ، وأن يفعل كل شيء "بهامش".
أصبحت الشركات مهتمة بمزيج من "Hadoop" و "الوقت الحقيقي" حتى عندما كانوا يكتبون عادة "غير متوافق" بين هاتين الكلمتين ، والآن تحدثوا عن تجربتهم مع Hadoop وتوفير توافر عالي في قضيته. المكافأة: القليل من الإبداع من Vasily Lozhkin على الشرائح.
نقوم بتقسيم 600 مليون مستخدم في الوقت الفعلي كل يوم
المتحدث:
أرتيوم مارينوفالموقع: 9
التقييم: 4.21 ± 0.09
عدد المشاهدين: 120
تقرير العرضهنا يختلف المشروع تمامًا عن Badoo: ليس المواعدة ، ولكن DMP (منصة إدارة البيانات) ، حيث تريد تسليط الضوء على شرائح مثل "ربات البيوت مع سيارة أقدم من خمس سنوات" بين الجمهور. ولكن ، أولاً ، هناك أيضًا نطاق واسع (حوالي مائة ألف حدث في الثانية). وثانيًا ، هنا تحتاج إلى أن تكون أكثر استعدادًا للنمو: "من بين مصادر البيانات - تثبيت البكسل ، إذا كان موقع الويب الأكثر شهرة يضع البكسل الخاص بك في الغد - سيكون هناك دفق ضخم سيلزم التعامل معه." ما التقنيات التي يتعاملون معها وكيف يتم استخدامها بالضبط؟ إجابات في التقرير.
توزيع ML على البيانات الضخمة: خبرة في بناء نظام توصية في ivi
المتحدث:
بوريس شمينكالموقع: 10
التقييم: 4.21 ± 0.09
عدد المشاهدين: 100
تقرير العرضأخيرًا ، التقرير الأخير أيضًا "يتعلق بالبنية التحتية ، وليس الخوارزميات" ، ويستند أيضًا إلى تجربة منتج كبير. ذات مرة ، بدأت ivi في تنفيذ التوصيات باستخدام خدمة طرف ثالث قدمت "توصيات كخدمة". ثم "نشأوا" منه وبدأوا في إنشاء نظامهم الخاص. في حبري ،
كتبت الشركة عنها في عام 2014 ، ومن التقرير يمكنك معرفة الحالة الراهنة للأشياء.
إذا كانت هذه التقارير ذات أهمية ، يرجى ملاحظة ما يلي: سيعقد SmartData 2018 هذا الخريف. سيعود المتحدثون المنفصلون من هذا العشرة الأوائل بتقارير جديدة ، وستكون هناك أسماء جديدة تمامًا. يمكن دائمًا الاطلاع على أحدث المعلومات حول البرنامج على موقع الويب ، ويمكنك أيضًا شراء التذاكر هناك - وسعرها يتزايد تدريجيًا ، لذلك يجب أن تفكر الآن.