FunTech ML- ميتوب



شاركت FunCorp مؤخرًا في تجربة تعلم الآلة الجميلة. قام مهندس الخلفية بتدريس محركات البحث لقراءة الميمات. في هذه المناسبة ، قررنا جمع ML-mitap من أجل تبادل أفضل ممارساتنا ، وفي الوقت نفسه للتعلم من متخصصين أكثر خبرة من شركات أخرى ، حيث يعد التعلم الآلي جزءًا مهمًا من العمل. قررنا جمع - جمعها. سوف ننفق 9 فبراير. البرنامج تحت الخفض.

البرنامج


"اكتشف تجربة الإطلاق لـ 90 مليون مستخدم: خمس توصيات لمطوري ML" ، Andrey Zakonov ، vk.com


حول التقرير


  • ليس فقط النموذج مهم: نحن نصوغ المشكلات بشكل صحيح ونختار المقاييس.
  • طرق مختلفة لتحسين الحلول الخاصة بك للتحميل.
  • نقيم التجارب بشكل صحيح: ندرس الرسوم البيانية ونتعامل مع الملاحظات.


"الإنتاج في ML" ، مارك أندرييف ، Conundrum.ai


حول التقرير


سيتضمن التقرير:
  • حول أنواع التنبؤات: في الوقت الحقيقي ، حاليا ، الوقت الحقيقي + حاليا
  • كيفية الانتقال من نموذج أولي في Jupyter Notebook إلى حاوية
  • حول قرارات التوسع وحول مراقبة الجودة.


"كيفية تعليم محركات البحث لقراءة الميمات" ، غريغوري كوزوفنيكوف ، FunCorp


حول التقرير


iFunny هو تطبيق يحتوي على صور ومقاطع فيديو مضحكة. المحتوى النصي الوحيد هو تعليقات المستخدمين ، ولكن لجذب حركة المرور من محركات البحث ، لا يكفي ، لذلك فقد تقرر استخراج النص من الصور ووضعه على الصفحات. خاصة لهذا الغرض ، تم إنشاء خدمة:

  • يجد المنطقة التي تحتوي على "النكتة الرئيسية" في الصورة
  • مقتطفات النص من هذه المنطقة
  • يتحقق من جودة النص المعترف به.

تتم كتابة الخدمة في Python باستخدام tensorflow. لا أحد في الفريق لديه خبرة في تطوير خدمات ML ، لذلك مررنا بجميع المراحل:

  1. بيان المهمة.
  2. أول تجارب عندما حاولنا القيام بشيء ما يعمل على الأقل بطريقة ما ، مع تجربة بنية الشبكات العصبية.
  3. إعداد عينة التدريب.
  4. التدريب واختيار معاملات النموذج.
  5. إنشاء خدمة باستخدام نموذج المدربين لدينا. لفه في حاوية عامل ميناء.
  6. نشر وخدمة ملزمة لدينا php متراصة. بداية واحدة.
  7. أول نتائج العمل والتعليقات من الايجارات.
  8. باستخدام الاعتراف النتائج في المعركة.
  9. تحليل النتائج.
  10. نحن هنا الآن. لا يزال يتعين علينا إعادة النماذج وإعادة تدريبها لزيادة عدد الميمات المعترف بها بشكل صحيح.


تعلم الآلة في Yandex.Taxi ، Roman Khalkachev ، Yandex.Taxi


حول التقرير


سيناقش التقرير جهاز Yandex.Taxi.

ستكون هناك قصة مفصلة:
  • حول المهام التي نحلها باستخدام تقنيات تحليل البيانات والتعلم الآلي
  • حول خط التجميع لدينا لتطوير واختبار وإطلاق نماذج التعلم الآلي في الإنتاج
  • دعنا نذهب عبر جميع المراحل: من التجارب في Jupyter Notebook إلى إنتاج ML كامل.


"التخلص من لعنة سكليرن: كتابة XGBoost من البداية" ، Artyom Hapkin ، Mail.ru Group


حول التقرير


قصة عن تعزيز. ما تحتاج إلى معرفته لكتابة ذلك بنفسك. ما هي المزالق ، وكيفية تحسين عملها.

في الوقت الحالي ، من الصعب تخيل مكان لا يتم فيه استخدام خوارزميات المجموعات لتعزيز الأشجار. هذه هي محركات البحث ، خوارزميات ترتيب التوصية ، مسابقات Kaggle ، وغيرها الكثير.

هناك العديد من التطبيقات الجاهزة للخوارزمية: Catboost و Lightgbm و Xgboost وأكثر من ذلك. ومع ذلك ، فهناك أوقات لا يكون فيها استخدام الحلول الجاهزة خارج الصندوق جيدًا - فهم الخوارزمية مفقود ، وبالنسبة لبعض المهام ، لا تكون مثل هذه التطبيقات مناسبة جدًا ، إلخ.

في هذا التقرير ، سنقوم بتحليل مبادئ الخوارزمية ، والانتقال من البسيط إلى المعقد ، سنقوم بتنفيذ خوارزمية Xgboosting الخاصة بنا ، والتي يمكن تعديلها بعد ذلك لأية مهام تعلم آلي - التصنيف والانحدار والتصنيف ، إلخ.

مزيد من المعلومات في Telegram
يمكنك التسجيل في Timepad . عدد الأماكن محدود.

بالنسبة لأولئك الذين لا يستطيعون القدوم أو ليس لديهم وقت للتسجيل ، سيتم بث البث على قناتنا .

Source: https://habr.com/ru/post/ar436900/


All Articles