الصيحة! لقد أكملنا تشكيل برنامج
مؤتمر UseData Conf 2019 ! هذا المؤتمر مخصص لأولئك الذين يقومون بحل المشكلات العملية باستخدام أساليب التعلم الآلي. غالبًا ما توجد فجوة بين الخوارزمية المثالية في الفراغ وتطبيقه على البيانات الحقيقية. نريد من يستطيع سد هذه الهوة أن يلتقي ويتبادل الخبرات.
إن سحر التعلم الآلي للمديرين ، وتاريخ استخدام ML لتحليل فعالية الإعلان على التلفزيون ، والسيارات غير المأهولة ، وأرقام الزيوت والسيارات هي مجرد بعض التقارير في UseData 2019. المزيد عن هذه المواضيع وغيرها هي تحت القط.
في
البرنامج ، قمنا بتشكيل 5 أقسام. يتم تجميع تقارير القسم حسب توجيهات المهام التي يقومون بحلها.
- التعلم الآلي وتحليل البيانات في التجارة.
- رؤية الكمبيوتر.
- معالجة النصوص باللغات الطبيعية.
- نظم صنع القرار.
- أطر وأدوات تعلم الآلة.
في كل موضوع من هذه المواضيع ، تم العثور على شيء مثير للاهتمام.
تعلم الآلة وتحليل البيانات في التجارة
تأثير الإعلانات التلفزيونية: التقييم والتحسين
ألكسندرا لوماكين
يضيع نصف ميزانيتي الإعلانية. المشكلة هي أنني لا أعرف أي واحد.
هذا مقتبس من John Wanamaker ، رجل أعمال أمريكي افتتح أول متجر وتطبق علامات الأسعار أولاً. لقد فهم شيئًا ما في التجارة.

فكر Joom أيضًا في مقدار ميزانية الإعلانات التلفزيونية المهدرة وتعيين لقياس فعاليتها قبل بيانات العلماء. كيف نفهم أن المستخدم جاء من الإعلان على التلفزيون ، وما هي الأدوات التي يجب تتبعها وما هي البيانات اللازمة لذلك؟
لقد انتهت ألكسندرا بهذه الطريقة وهي على استعداد
لمشاركة الإجابات . المفسد: مساحة التحسين ضخمة.
تعلم الآلة للتنبؤ بمبيعات متجر OZON.RU على الإنترنت. تحسين الأسعار مع نماذج التنبؤ بالطلب.
ألكساندر أليكسييف ، OZON.RU

OZON.ru هو متجر كبير للغاية به كمية ضخمة من السلع والخدمات اللوجستية المعقدة والأسعار. يعمل النموذج على تجديد المخازن وتوقعات الطلب. المتجر الكبير هو الكثير من البيانات التي يمكن أن يتعلمها النموذج. من ناحية ، من الجيد ، أنه من المناسب وضع التوقعات. من ناحية أخرى ، على مثل هذا المقياس يظهر خطأ بسرعة ، إن وجدت.
على سبيل المثال ، لم يكن المنتج موجودًا في المخزن لفترة طويلة ، ثم ظهر وخطأ في التنبؤ بالنموذج. لا بأس بمنتج واحد ، لكن في OZON.ru هناك المئات من هذه المنتجات كل يوم. بسبب وجود خطأ ، قد ينفد المستودع من البضائع أو سيكون ممتلئًا.
سيخبرك ألكساندر بكيفية التعامل مع أخطاء التوقعات والتزويد ، وكيفية التأمين ضد الأخطاء. لا يعد تقريره مجرد دراسة حالة ناجحة للتعلم الآلي ، ولكنه أيضًا رحلة مثيرة للاهتمام في مجال الموضوع. إذا قمت بإنشاء نماذج لتوقعات المبيعات ، فستجد الكثير لنفسك.
رؤية الكمبيوتر
في هذا القسم ، سنتحدث عن الاعتراف بالدولة. الأرقام ، وقضايا الموارد والاستماع إلى تقرير علمي.
512 كيلو بايت من الذاكرة كافية للجميع! التعرف على شخص عن طريق الوجه على متحكم مع الكاميرا
ألكساندر سموركالوف ، Xperience.ai

يحدث أنك تحتاج إلى التعرف على الوجوه على الأجهزة الضعيفة حسابياً التي تعمل على طاقة البطارية. لديهم القليل من الذاكرة ، لكنهم لم يسمعوا عن GPU على الإطلاق.
سوف يشارك ألكساندر
قصة نجاح نقل النموذج إلى هذه الأجهزة. تجربة نقل النماذج إلى أجهزة غير قياسية توسع الآفاق بشكل كبير. يمكن أن تكون الأفكار مفيدة في المواقف التي يكون فيها الجهاز قياسيًا ، ولكن الموارد المستهلكة غير مقبولة.
Wasserstein التنظيم من أجل التعليم التمييزي والتمييزي
جويدو مونتوفار ، معهد ماكس بلانك

يسرنا للغاية أن أقنعت Vanya Yamshchikov زميله Guido بالحضور إلى مؤتمرنا. هذا هو التقرير العلمي الوحيد في المؤتمر ، لكن التطبيق العملي لا يزال مؤكدًا. الصراع يدور حول التعرف على الطبقات أو توليدها مع انتشار كبير في الداخل ، على سبيل المثال ، الصور. تذكر المهمة الكلاسيكية لقطط الكلاب التي لا تتشابه فيها الكلاب من سلالات مختلفة؟ لذلك ، هذه الاختلافات هشة مقارنة بما يحدث.
أنا لست خبيراً في هذا الموضوع ، لكن يبدو لي أن هذه المهام تفرض إنشاء شبكات عصبية مع عدد كبير من الطبقات. يؤدي ذلك إلى تفاقم مشكلة التوهين المتدرج ، والكفاح الذي لا ينتهي من الدروع والقذيفة يستهلك مئات من النفط من موارد الحوسبة بلا هدف. تسمح الأساليب التي يستكشفها جويدو بحل المشكلات من خلال انتشار كبير داخل كل فصل أرخص وأسرع.
كيفية العثور على وإغلاق الدولة. رقم على صورة السيارة ومنع نسخ المحتوى باستخدام الهجوم العدواني
ايليا سيرجيف ، أفيتو

ذات مرة ، عملت في Yandex ، وأنشأت خرائط Y. صورًا بانورامية للشوارع ، جنبًا إلى جنب مع فريق رؤية للكمبيوتر. في الإستعراضات ، كان من الضروري التستر على وجوه ولوحات السيارات التي سقطت عن غير قصد في الإطار. لم تكن هناك حلول جاهزة لهذا الغرض ، فقد رأيت ذلك بأنفسنا.
في Avito ، لمهمة مماثلة ، اتخذوا قرارهم أيضًا. في 2019 ، لم تعد هذه المهمة مثيرة. يبدو أن أي شخص الآن قادر على تعلم كيفية إغلاق الدولة. عدد في الساعة على الركبة. ولكن يبدو فقط ذلك. اتضح أنه بالنسبة لبعض الشركات ، من الأسهل نسخ الصور من Avito ، واستبدال العلامة الموجودة في الصورة بأخرى خاصة بها ، لأن اكتشافها أسهل من الرقم. كان على Avito بذل جهود خاصة لجلب لصوص المحتوى إلى العلن.
تم بالفعل نشر أجزاء من هذه القصة على حبري ، ولكن في مؤتمرنا ، سيقدمها إيليا بالكامل في شكل قصة ، وليس مقالًا.
كيف يمكن للشبكات العصبية المساعدة في بناء صورة لما يحدث تحت الأرض وتحديد مكان البحث عن النفط
دريما ميلزينوفا ، جازبروم نيفت

الذين في مرحلة الطفولة حل مشكلة نموذجية من رؤية الكمبيوتر حول التعرف على الأرقام المكتوبة بخط اليد؟ من كتب الأرقام على قطعة من الورق ، قام بمسحها ضوئيًا وتأكد من أنه شاهد النموذج (لا شيء)؟ يشعر الناس بنفس الشعور تقريبًا عند مواجهة مهام من العالم الواقعي.
نحن نحب حقًا المهام من القطاع الحقيقي ، لأن الفرق بين البيانات التي اعتاد الناس على التعلم والبيانات من الحياة يظهر عليها بوضوح: غير دقيق ، مع وجود أخطاء وقيود ، وبدرجات دقة مختلفة ، مع مسافات.
سوف يخبر داريما ليس فقط عن نماذج الشبكات العصبية التي يمكن أن تكون في مجال تحليل المناطق الداخلية للأرض ، ولكن أيضًا حول مقدار ما زالوا لا يعرفون كيف ، ولكنهم يريدون ذلك.
معالجة اللغة الطبيعية
هل تستطيع الآلة فهم النكات والنكات؟ كيفية تدريس نموذج لفهم أسماء غريبة؟ والتعرف على الكود؟
ابحث عن الحالات الشاذة في البيانات الشخصية بواسطة مثال الاسم الكامل
جورج شوشويف ، CFT

بالكاد يكتب بعض المستخدمين اسمهم باللغة الروسية ، وأسمائهم غير عادية. Butnaru من Iuria ، Sashka Sedlay Konya Neatly ، Eyide Lucky ، Pulotov Aslam Akhmat Zhon Ugli ، Bebalau IonNo ، لقد تعبت بالفعل من إلياسوفيتش - ما الاسم؟ هناك أسماء في هذه المجموعة من الحروف ، لكنك فكرت ، أليس كذلك؟ هنا تبرز الصعوبة - لتعليم النموذج التعرف على الأسماء ، حتى لو لم ينجح الشخص دائمًا.
نحن نحب قصص التعلم الناجح بدون معلم ، وهذا واحد منهم فقط.
سيتحدث جورج عن تطور كاشف الشذوذ في البيانات الشخصية من نموذج ماركوف إلى الشبكة العصبية ومشاركة خارقة الحياة في تطوير مثل هذه الكواشف لمجموعات نصية قصيرة.
تعلم الآلة للرمز
إيجور بوليتشيف ، المصدر {د}

هذه نظرة عامة على آخر التطورات في مجال العمل باستخدام الكود. كيف تجد مستودعات متشابهة في المهام؟ كيفية العثور على مطور لديه خبرة مماثلة على جيثب؟ كيفية إضفاء الطابع الرسمي على هذا التشابه؟ وكيف يمكن تحسين كل شيء للعمل مع GitHub في آن واحد؟ ويشارك إيجور في هذه المهام بالضبط
وسيشارك تجربته.
هل من الممكن تعليم سيارة روح الدعابة؟
فلاديسلاف بلينوف ، فاليريا بارانوفا ، تينكوف

يقوم فلاديسلاف وفاليريا بتعليم السيارة لفهم النكات باللغة الروسية. ليس هذا الكمال؟ لا يوجد شيء يمكن الحديث عنه - فقط عليك
الحضور والاستماع .
من وجهة نظر عملية ، كل شيء كما نحب: لا توجد مجموعات بيانات ملحوظة تقريبًا ، لا توجد مياه ، لا توجد نباتات ، تسكنها روبوتات. العمل الجاد على موضوع متعة.
كيفية تنفيذ البحث الدلالي السريع والفعال في مشروعك استنادًا إلى لوحة النقر والمحولات والبحث التقريبي (ANNS)
فلاديمير بوجاي ، كنويما

كيفية القيام بعملية بحث عادية في موقف حيث يوجد الكثير من الأرقام والنص القليل؟ Knoema هو مجمع للبيانات التحليلية ، والتي تحتوي جميعها تقريبًا على شكل سلسلة زمنية. إذا كنت ترغب في معرفة آخر تقديرات احتياطي النفط الفنزويلي أو حجم إنتاج الماس في الكونغو ، فهذا هو المكان الذي يحتوي على أحدث البيانات. والسؤال الوحيد هو كيفية العثور عليها.
وترد بعض البيانات في قاعدة البيانات مباشرة ، وبعضها قابل للحساب. للبحث بشكل جيد ، عليك بناء نموذج للعلاقة بين البيانات. الآن هو بالفعل نموذج الشبكة العصبية على أساس الاستخدام.
سيتحدث فلاديمير عن عدة خطوات مهمة في تطوير البحث باستخدام بيانات غير قياسية: كيفية تجميع هذا البحث سريعًا نسبيًا من مكونات جاهزة ، وكيفية إعادة تدريبه باستخدام معلوماته الإضافية ، على سبيل المثال ، النقرات ، وكيفية تقليل حجم الفهرس وتحسين الاختناقات الأخرى.
نظم صنع القرار
صافي البنى العصبية الحديثة / إصدار عام 2019
غريغوري سابونوف ، انتنتو

غريغوري ، على ما يبدو ، لا يحتاج إلى مقدمة. وهو أحد مؤسسي Intento ، وهو متحدث منتظم ورئيس قسم في مؤتمرات التعلم الآلي ، وهو الشخص الذي يشاهد هذه الصناعة وينقلها. من أحدث العبارات الشائعة التي لم يسمع بها الجميع بعد ، تضمين Google Developer Expert في فئة Learning Machine في القائمة. في وقت كتابة هذا التقرير ، كان هناك 109 أشخاص فقط في القائمة ، واحد منهم فقط من روسيا. جريشا ، تهانينا!
هذا هو بالضبط مستوى الخبرة التي يمكنك من خلالها إجراء
استعراض مثير للاهتمام للمنتجات الجديدة في عالم الشبكات العصبية على مدار العامين الماضيين. ما المهام الجديدة التي تعلمتها الشبكة لحلها؟ ماذا عليك أن تفعل لهذا؟ في أي اتجاهات ننتظر الاختراقات القادمة؟
ما هو جيد وما هو سيء: مقاييس لأنظمة التوصية
ايرينا Pchelintseva ، ياندكس

كيف تقيس فعالية نظام التوصية للأفلام؟ توقع التصنيف الذي سيقدمه أحد المشاهدين لفيلم معين ، وعرضه لمشاهدته فقط إذا كان التقييم مرتفعًا. ولكن هناك فروق دقيقة.
سيقول معظمهم بالتأكيد أن قائمة العراب أو قائمة شندلر هي أفلام جيدة ، حتى لو كان هو نفسه لم يرها. لكن تخيل كيف تعود من العمل. كان اليوم صعبًا: المشروع لا يلتزم ، والأكل يأكل الدماغ بالكامل ، وغداً سيكون هو نفسه. في هذه الحالة ، من غير المرجح أن يرغب في مشاهدة فيلم ذكي وعميق ، وسينخفض فيلم أكشن غبي ، والذي يبلغ سعره الأحمر ستة من كل عشرة. لذلك ، يجب أن يقدم نظام التوصيات ما
تنظر إليه ، وليس ما هو
معتاد على الثناء عليه .
هذا واحد فقط من الجوانب غير المتوقعة للمهمة ، وهناك العديد من هذه الجوانب. لمعرفة المزيد ، تعال إلى
خطاب إيرينا.
تطوير وتنفيذ عملاء ذكي
أندريه إيفانوف ، تينكوف

العامل الذكي هو جزء من نظام يحل مهمة فكرية لشخص ما. تم تطوير الوكيل من قبل أخصائي تعلم آلي ، حيث سيتولى الوكيل مهامه. على سبيل المثال ، بالنسبة للبنك ، هذا هو نظام التوصية الذي يمكن أن يقدم قرضًا أو وديعة أو بطاقة أو منتجًا آخر ، وفقًا لما هو معروف عن المستخدم.
لدى Andrei
عرض تقديمي عملي للغاية: كيف يتم استخدام العوامل الفكرية في Tinkoff (على سبيل المثال ، "القصص") ، وما الصعوبات التي تنشأ في تطورها وما هي الأدوات التي تساعد في ذلك.
حفر حادث التنبؤ
إيفان إساييف ، التاريكس

مرة أخرى عن القطاع الحقيقي والنفط.
سوف يروي إيفان قصة عملية جيدة حول كيفية الحصول على القليل من البيانات من العميل ، وتقديم نموذج مفيد بناءً عليها ، والحصول على المزيد من البيانات بعد ذلك ، والحصول على نتيجة جيدة عليها.
آلة التعلم على أساس خوارزميات قيادة السيارة المستقلة
سالوني جارج

هذه القصة ليست على ما يبدو. حدث Saloni لحل المشاكل ، وجود معظمنا غير مدركين.
في منطقة فقيرة ، يعد وقود الحافلة موردا قيما. يقوم السائقون بحفظه بمساعدة العديد من التقنيات المذهلة: لا يقومون بتشغيل المصابيح الأمامية ، والقيادة على المحايدين ، ولا يتبعون الخط. كيف ، في ظل هذه الظروف ، أجبره على القيادة بأمان؟
لا يوجد الكثير من المال ، لذلك فإن الأجهزة المستخدمة لحل المشكلة هي الأكثر بدائية ، حيث يجب إنشاء معظم التقديرات محليًا ، ولا يمكن نقل الفيديو من الكاميرا إلى الخادم. كيف تعمل في مثل هذه الظروف ، وتخبر Saloni Garg.
أطر وأدوات تعلم الآلة
إضافة عنصر تحكم بيانات إلى خط أنابيب ML
أرتيوم سيليزنيف ، مكبر الصوت

تتوقع من MegaFon إما أنظمة التوصية مع الخدمات والتعريفات الجديدة ، أو قصص عن إيلينا. لكن لا ، هذه المرة
ستخبر Artyom عن تجربة تطبيق أداة DVC والأجراس وصفارات إضافية التي تم إجراؤها فوقه. أجراس وصفارات مثيرة للاهتمام وغير تافهة. إذا كنت من أجل استنساخ تجارب التعلم الآلي ، تعال إلى الحديث.
AWS DeepRacer: تعلم التحديات من خلال اللعبة
ألكسندر باتروشيف ، AWS

صحيح ، سيكون من المثير للاهتمام تدريب نموذج للسباق على سيارة بدون طيار؟ وحتى الآن لكسر مع الحد الأدنى من السيارات. من الناحية المثالية ، أريد أن أحصل على بيئة افتراضية قريبة من الواقع ، والتي يمكن من خلالها التقاط معظم الأخطاء. خيار واحد لمثل هذه البيئة هو استخدام النماذج. سيارات اللعب ، على مقياس من 1 إلى 18 ، تستخدم لتدريب الخوارزميات.
سوف يشارك ألكساندر قصة إنشاء AWS DeepRacer والصعوبات التي تنشأ عند تطوير بيئة تعلم افتراضية وعند نقل نموذج إلى معدات حقيقية.
تقرير إدارة خارج القسم
إدارة المشاريع 2.0: تحويل الذكاء الاصطناعي
إدوارد Tyantov ، Mail.ru المجموعة

العالم يتغير ونماذج ML تتغلغل بشكل متزايد في منتجاتنا ، وفي بعض الأحيان تصبح جزءًا أساسيًا منها. هل سبق لك أن غضبت "لماذا؟ !!" من السلطات ، مذنب للإجابة "حسنا ، النموذج هو ضبطها ..."؟ إن الرؤساء ، الذين نشأوا في ممارسات تطوير البرمجيات في نهاية القرن الماضي ، لا يفهمون في الغالب ما يمكن توقعه من التعلم الآلي وما هو ثمن هذا السحر.
سوف ينظر إدوارد في
تقريره إلى المشكلة من قيادة الفريق والمنتج. ما هي التغييرات في دورة التطوير ، في تحديد المهام ، في مراقبة الجودة؟ إنه مجرد شخص يمكنه أن يقول الكثير حول هذا الموضوع ، لأنه منذ سنوات عديدة كان ينفذ بنجاح مشاريع تعتمد على التعلم الآلي على Mail.ru. المشروع الأكثر شهرة ، في رأيي ، هو Artisto ، تطبيق لتصميم الفيديو.
مسار المكافأة
وسيكون لدينا أيضًا ورشة عمل مدتها ثلاث ساعات من Yandex حول جمع البيانات باستخدام Yandex.Tolki! سيقودها أشخاص طوروا Toloka ، وأولئك الذين يستخدمونها بشكل مستمر: Alexei Druta و Olga Megorskaya.
ستحصل على فكرة عامة عن كيفية عمل آليات التعهيد الجماعي مثل Toloka أو Mechanical Turk. بعد ذلك ، يمكنك اختيار واحدة من العديد من المهام المقترحة لترميز البيانات ، وإنشاء مهمة للمتطفلين ، وإعداد مهام الاختبار و "الفخاخ" للغشاشين. في النهاية ، ستحاول تحديد التقديرات الحقيقية من الترميز الناتج والعلامات المشبوهة باستخدام الخوارزميات التي يوفرها النظام.
ستكون ورشة العمل مفيدة لأولئك الذين فكروا في جمع البيانات من خلال Toloka ، لكن لم يجرؤوا بسبب خطر إنفاق الميزانية بأكملها دون إعداد.
لسد الفجوة بين الخوارزميات في الفراغ والخوارزميات الحقيقية ، ننتظر 16 سبتمبر. يوم كامل من التقارير والاجتماعات والاتصالات والتعلم الآلي ودراسات الحالة - الجمال! الزيادة القادمة والأخيرة في UseData Conf 2019 هي بالفعل 9 سبتمبر ، لذا قم بحجز التذاكر الآن لإصلاح السعر. أراك في Infraspace!