
شاركت FunCorp مؤخرًا في تجربة تعلم الآلة الجميلة. قام مهندس الخلفية بتدريس محركات البحث لقراءة الميمات. في هذه المناسبة ، قررنا جمع ML-mitap من أجل تبادل أفضل ممارساتنا ، وفي الوقت نفسه للتعلم من متخصصين أكثر خبرة من شركات أخرى ، حيث يعد التعلم الآلي جزءًا مهمًا من العمل. قررنا جمع - جمعها. سوف ننفق 9 فبراير. البرنامج تحت الخفض.
البرنامج
"اكتشف تجربة الإطلاق لـ 90 مليون مستخدم: خمس توصيات لمطوري ML" ، Andrey Zakonov ، vk.com
حول التقرير
- ليس فقط النموذج مهم: نحن نصوغ المشكلات بشكل صحيح ونختار المقاييس.
- طرق مختلفة لتحسين الحلول الخاصة بك للتحميل.
- نقيم التجارب بشكل صحيح: ندرس الرسوم البيانية ونتعامل مع الملاحظات.
"الإنتاج في ML" ، مارك أندرييف ، Conundrum.ai
حول التقرير
سيتضمن التقرير:
- حول أنواع التنبؤات: في الوقت الحقيقي ، حاليا ، الوقت الحقيقي + حاليا
- كيفية الانتقال من نموذج أولي في Jupyter Notebook إلى حاوية
- حول قرارات التوسع وحول مراقبة الجودة.
"كيفية تعليم محركات البحث لقراءة الميمات" ، غريغوري كوزوفنيكوف ، FunCorp
حول التقرير
iFunny هو تطبيق يحتوي على صور ومقاطع فيديو مضحكة. المحتوى النصي الوحيد هو تعليقات المستخدمين ، ولكن لجذب حركة المرور من محركات البحث ، لا يكفي ، لذلك فقد تقرر استخراج النص من الصور ووضعه على الصفحات. خاصة لهذا الغرض ، تم إنشاء خدمة:
- يجد المنطقة التي تحتوي على "النكتة الرئيسية" في الصورة
- مقتطفات النص من هذه المنطقة
- يتحقق من جودة النص المعترف به.
تتم كتابة الخدمة في Python باستخدام tensorflow. لا أحد في الفريق لديه خبرة في تطوير خدمات ML ، لذلك مررنا بجميع المراحل:
- بيان المهمة.
- أول تجارب عندما حاولنا القيام بشيء ما يعمل على الأقل بطريقة ما ، مع تجربة بنية الشبكات العصبية.
- إعداد عينة التدريب.
- التدريب واختيار معاملات النموذج.
- إنشاء خدمة باستخدام نموذج المدربين لدينا. لفه في حاوية عامل ميناء.
- نشر وخدمة ملزمة لدينا php متراصة. بداية واحدة.
- أول نتائج العمل والتعليقات من الايجارات.
- باستخدام الاعتراف النتائج في المعركة.
- تحليل النتائج.
- نحن هنا الآن. لا يزال يتعين علينا إعادة النماذج وإعادة تدريبها لزيادة عدد الميمات المعترف بها بشكل صحيح.
تعلم الآلة في Yandex.Taxi ، Roman Khalkachev ، Yandex.Taxi
حول التقرير
سيناقش التقرير جهاز Yandex.Taxi.
ستكون هناك قصة مفصلة:
- حول المهام التي نحلها باستخدام تقنيات تحليل البيانات والتعلم الآلي
- حول خط التجميع لدينا لتطوير واختبار وإطلاق نماذج التعلم الآلي في الإنتاج
- دعنا نذهب عبر جميع المراحل: من التجارب في Jupyter Notebook إلى إنتاج ML كامل.
"التخلص من لعنة سكليرن: كتابة XGBoost من البداية" ، Artyom Hapkin ، Mail.ru Group
حول التقرير
قصة عن تعزيز. ما تحتاج إلى معرفته لكتابة ذلك بنفسك. ما هي المزالق ، وكيفية تحسين عملها.
في الوقت الحالي ، من الصعب تخيل مكان لا يتم فيه استخدام خوارزميات المجموعات لتعزيز الأشجار. هذه هي محركات البحث ، خوارزميات ترتيب التوصية ، مسابقات Kaggle ، وغيرها الكثير.
هناك العديد من التطبيقات الجاهزة للخوارزمية: Catboost و Lightgbm و Xgboost وأكثر من ذلك. ومع ذلك ، فهناك أوقات لا يكون فيها استخدام الحلول الجاهزة خارج الصندوق جيدًا - فهم الخوارزمية مفقود ، وبالنسبة لبعض المهام ، لا تكون مثل هذه التطبيقات مناسبة جدًا ، إلخ.
في هذا التقرير ، سنقوم بتحليل مبادئ الخوارزمية ، والانتقال من البسيط إلى المعقد ، سنقوم بتنفيذ خوارزمية Xgboosting الخاصة بنا ، والتي يمكن تعديلها بعد ذلك لأية مهام تعلم آلي - التصنيف والانحدار والتصنيف ، إلخ.
مزيد من المعلومات في
Telegramيمكنك التسجيل في
Timepad . عدد الأماكن محدود.
بالنسبة لأولئك الذين لا يستطيعون القدوم أو ليس لديهم وقت للتسجيل ، سيتم بث البث على
قناتنا .