
في 1 سبتمبر ، ستعقد مجموعة Mail.Ru ومجتمع علوم البيانات المفتوحة أكبر اجتماع رئيسي لعلوم البيانات في موسكو. يتألف الحدث من خمس مجموعات مواضيعية من التقارير ، تدريب ML- وقاعة كاملة للتواصل والتعارف.
تعرف على البرنامج
والتسجيل ! الدخول إلى الحدث مجاني ، وفقًا للتسجيل المعتمد.
ستعقد العروض التقديمية في Moscow Data Science Major في تيارين. ستجد في الجدول شبكة مع جدول زمني ، وأدناه - أوصاف التقارير.
الجدول الزمني:

أوصاف العروض التقديمية:
"مشكلة استقطاب المتحدث" ، غريغوري ستيرلينغ ، NeurodataLab LLCسأتحدث باختصار عن معالجة الكلام بشكل عام وعن مهمة تشكيل المتحدث (من خلال تسجيل حوار ، تحتاج إلى تحديد من تحدث متى). سأخبركم عن تاريخ المشكلة ، لماذا ، لماذا ، حول مشكلة حفل الكوكتيل ، الذي قرر مدى صعوبة ذلك. سيتم تخصيص الجزء الرئيسي من التقرير لنتائج 2017-2018 ، على سبيل المثال ، حول مقال على Google يصف حل مشكلة الفيديو (هناك يبدو أن الشبكة العصبية تحاول قراءة الشفاه). سأنتهي بما يفعلونه عندما لا يكون هناك فيديو ، ولكن لا يوجد سوى صوت (حوار على الهاتف ، على سبيل المثال) ، سوف أتناول المقالات ونهجنا.
مشغلي الشبكات العصبية ، سيرجي دوكانوف ، Mail.Ru Groupأولاً ، سيكون هناك انحراف صغير في الأساليب الحديثة لحل مشكلة تركيب الكلام ، ثم سنتحدث عن المبرمجين ، ثم سنركز على أحد أكثرها إثارة للاهتمام (سواء من وجهة نظر النظرية والممارسة).
"بيتزا شبه خاضعة للإشراف" ، آرثر كوزان ، دبراينباستخدام مثال التحكم في المنتج في Dodo Pizza ، سأتحدث عن تقنيات العمل مع البيانات عند تدريب النماذج. على وجه الخصوص ، سأوضح كيف يتم سحب الصناديق الجانبية عن طريق التجزئة الدلالية للكائنات ، بالإضافة إلى كيفية تدريب النموذج والحصول على ترميز مجموعة البيانات ، مع وضع علامة على عينات قليلة فقط.
"هندسة OCR و TD في التعرف على صور المستندات المطبوعة" ، أليكسي جونشاروف ، إيليا زاريكوف ، نيكيتين فيليب ، مختبر ذكاء آلة MIPTيصف التقرير بنية OCR (التعرف على الأحرف) و TD (الكشف عن النوافذ مع النص) ، والتي يستخدمها فريقنا في المشاريع للتعرف على صور المستندات المطبوعة من أنواع مختلفة. دعونا نتحدث عن كل من الهندسة المعمارية وتدريب هذه الأنظمة.
"كيفية جعل التكيف مع المجال ، والأفكار لتحسين جودتها" ، Renat Bashirov ، Samsung AIالتقرير عبارة عن مجموعة من الأفكار من اثنتي عشرة مقالة. تم اختيار المقالات وفقًا لدرجة فائدتها لتطبيق تكيف المجال للصور: وجود مجموعة مرمزة ، وكيفية الحصول على / تحسين الترميز في مجموعة أخرى مشابهة.
سيكون:
- العديد من GANs
- العديد من الهياكل مع عشرات وظائف الخسارة ،
- حدث عنه
- أن مثل هذه الأشياء المختلفة يمكن عرضها في دالة الخسارة ،
- نقل النمط
- تطبيق تكيف المجال للمهام المختلفة: التصنيف ، التجزئة.
لا تعتقد أنه لن يكون هناك شيء واضح إذا فهمت ، على سبيل المثال:
- ما هي وظيفة الخسارة
- كيف يعمل backprop ،
- لماذا هناك حاجة إلى batchnorm وكيف يعمل
- ما هو حجم الموتر الذي تم الحصول عليه بعد المتوسط العالمي للتجميع.
"البحث عن طريق السلع - تنظيم العمل" ، ديمتري دريموف ، تحليل الشيكاتحول المهمة ، نهج تنظيم العمل والنتائج.
"يعرض على شبكة اجتماعية: كيف وماذا تظهر" سيرجي بويتسوف ، زملاء الدراسةسننتقل طوال الطريق من المستخدم إلى عنصر معين في واجهة المتجر يراه. جمع البيانات والمعالجة المسبقة والمعالجة التحليلية واختبار أ / ب.
"أنظمة موصى بها لتذاكر النقل" ، Artyom Prosvetov و Konstantin Kotochigov ، CleverDATAفي التقرير ، سنتحدث عن استخدام أنظمة التوصية في منطقة غير عادية بالنسبة لهم: لبيع تذاكر النقل. ما هي الأساليب التقليدية التي يمكن أن تساعد في حل هذه المشكلة ، والتي تظهرها الاستدلالات بشكل جيد ، وما هي الاكتشافات التي حققناها لأنفسنا في هذا المشروع.
"Tuning Jupyter Notebook" ، ألكسندر ليفانوف ، MarketGuardكيفية تكوين Jupyter Notebook للعمل المنتج والمريح.
"BigArtm - ليس فقط للنص" ، Maxim Statsenko ، Mail.Ru Groupاعتاد الكثيرون على حقيقة أن التضمين يدور حول النص: نقوم بتضمين الكلمات والجمل ، إلخ. بمعنى ما ، يتم تضمين النمذجة المواضيعية أيضًا. في تقريري ، أريد أن أوضح أنه بمساعدة Python والإبداع يمكنك استخدام نهج النمذجة المواضيعية والتضمين في المهام التي لا توجد فيها نصوص على الإطلاق ، أي في تجميع المستخدمين حسب مصدر الدخل والفوائد.
"مقدمة تحكم PID ، أو كيفية تحضير الجعة باستخدام PyData" ، أنطون ليبيديفيتشمقدمة خطوة بخطوة إلى وحدة التحكم الأوتوماتيكية الأكثر شيوعًا باستخدام مهروس بيرة الشعير كمثال ، مع الرسوم المتحركة ورمز Python. بالإضافة إلى وحدة التحكم PID الأساسية ، سيكون هناك بعض الحيل التي تعمل على تحسين عملها في الحياة الواقعية. من الناحية العملية ، غالبًا ما تكون هناك حاجة إلى التنظيم التلقائي ، ويحتوي أي تطبيق تقريبًا على عناصر PID إلى جانب عيوبها ، والتي تحتاج إلى معرفتها والقدرة على إصلاحها.
قاعة السينمامنطقة الشبكات والتعارف. في هذه الغرفة يمكنك التواصل مع الزملاء والمشاركين الآخرين في الحدث بتنسيق مجاني.
للمشاركة ، يجب عليك
التسجيل . لا تنس جواز سفرك أو رخصة قيادتك.
لقاء المشاركين والتسجيل : 10:00 - 11:00.
بداية التقارير : 11:00.
نهاية الحدث التقريبية : 17:00.
العنوان : موسكو ، مطار المترو ، لينينغرادسكي بروسبكت ، 39 ، ص .79.
البث