التدريب في مجال علوم البيانات والتخفيف الموضوعي في فورونيج



في 25 مايو ، سيعقد اجتماع Metaconf الثاني في فورونيج ، هذه المرة مخصصة للتعلم الآلي. هناك خمسة تقارير في برنامج mitap ، التسجيل المجاني متاح هنا . على وجه الخصوص ، سيتحدث أنتون دولجيخ ، خبير DataArt في مشاريع AI في مجال الرعاية الصحية ، عن "النموذج الاحتمالي للشبكة العصبية للغة الطبيعية". لقد طلبنا من أنطون اليوم التحدث عن تجربة تنظيم معرفة التعلم الآلي ضمن DataArt.

يتسع نطاق ML باستمرار (من الرعاية الصحية إلى صناعة السفر). داخل DataArt ، في مرحلة ما ، تجاوز عدد طلبات تطوير ML قيمة حرجة. قبل ذلك ، كنا قادرين على حل مثل هذه المشاكل من قبل المهندسين الذين عملوا في الشركة.

عندما أصبح من الصعب إدارتها بمواردنا الخاصة ، أصبح من الواضح أن هناك مسارين للتطوير: توظيف موظفين جدد أو تدريب متخصصين داخل الشركة. في الحالة الأولى ، نواجه خطر عدم وقوع مطور ML الذي قمنا بتعيينه بعد ذلك مباشرة في مشروع جديد من مجالنا المهني. في الوقت نفسه ، عادةً ما يكون الأشخاص المنخرطون بصعوبة في التعلم الآلي غير مستعدين للمشاركة ، على سبيل المثال ، في التطوير الكامل للمجموعات. لذلك ، اعتمدنا على مهندسي DataArt المهتمين بالتطوير نحو ML ، ولكنهم قادرون على العودة إلى أعمالهم السابقة إذا لزم الأمر.

تحتاج عملية التحضير إلى التنظيم. قد يبدو أن الإنترنت مليء بالأطنان من الدورات التدريبية عبر الإنترنت والفيديو. ولكن من أجل التطوير الإنتاجي ، يحتاج الشخص إلى ناقل تطوير - من الاستماع العشوائي إلى أي دورات تدريبية ، يكون ذا فائدة قليلة.

ماذا فعلنا:

  1. بادئ ذي بدء ، شكلوا جوهر - مجموعة مبادرة من الزملاء مع معظم الخبرة والخبرات في مختلف مجالات التعلم الآلي. قاموا بإعداد سلسلة من العروض التقديمية ، وقدموا نظرة عامة على الدورات التدريبية الحالية وقدموا توصيات: ما هي الدورات التدريبية التي تحتاج إلى اتخاذها من أجل اكتساب المهارات ذات الصلة بالمهام التي يحلها DataArt.
  2. قمنا بتنظيم دورات الرياضيات. من الواضح أن ML هي إحصائيات رياضية وطرق تحسين بطبيعتها. لفهم واستخدام أساليب التعلم الآلي بشكل صحيح ، هناك حاجة إلى معرفة رياضية معينة. للوهلة الأولى ، يعرف المتخصصون الذين تلقوا تعليمًا تقنيًا الرياضيات جيدًا. لكن في الممارسة العملية ، اتضح أن المهارات تُنسى بسرعة كبيرة. وهذا يفرض قيودًا على الدورة التدريبية: لا تستطيع الشركة ، على عكس الجامعة ، تقديم المعرفة الأساسية ، ولكن يجب أن تكون المعرفة كافية وعميقة بدرجة كافية. لقد قمنا بدعوة مدرس من الخارج لقراءة الدورة (كان زملائنا مشغولون للغاية). ركز البرنامج على مجالات مرتبطة مباشرة بالتعلم الآلي: الجبر الخطي ، التحليل ، نظرية الاحتمالات ، طرق التحسين. وتستكمل الدورة بفصول منتظمة مع الخبراء ، حيث على أساس النظرية نعتبر المشاكل العملية من المشاريع مع التعلم الآلي.
  3. كل شهر ، يعقد متخصصو ML لدينا ندوات تعليمية حول آخر الإنجازات في هذا المجال. تسجيل الندوات متاح لجميع موظفي الشركة.
  4. بالإضافة إلى الندوات ، ينشر متخصصو DataArt ML بانتظام ملخصًا للمواد المثيرة للاهتمام (الأساليب والمقالات والكتب) مع التعليقات التوضيحية القصيرة والتعليقات.

تدعم الشركة هذه المبادرات ، يتم تخصيص ميزانية لشراء الأدب ومشاركة الزملاء في المؤتمرات ، لبرامج الحديد والتوجيه. نتيجة التدريب الإرشادي الفردي هي نموذج أولي جاهز يمكن استخدامه في المؤتمرات أو في الاجتماعات مع العملاء المحتملين. على سبيل المثال ، يمكننا الاستشهاد بنتيجة عمل خبيرنا Andrei Sorokin - نموذج يكتشف ويصنف آفات الجلد ( arxiv.org/pdf/1807.05979.pdf ). لتحسين النموذج الناتج للاستخدام على الأجهزة المحمولة ، ساعد الموظف للتو في إطار برنامج التوجيه. احتل هذا النموذج المركز الثاني عشر في المسابقة الدولية ISIC 2018 ، حيث لم يفز فقط بالمشاركين الأفراد ، ولكن أيضًا بالفرق الجامعية.

أتاح لنا التنظيم أعلاه للعملية معالجة جميع الطلبات من مجال التعلم الآلي التي تأتي إلى DataArt من العملاء المحتملين بسرعة وبخبرة. لقد أعددنا مواد تسويقية ، وفرق المبيعات هم دائمًا خبراء متاحون يمكنهم الإجابة على أسئلة العملاء. تم بالفعل الانتهاء من العديد من المشاريع.

مثل العديد من شركات التكنولوجيا الكبيرة ، تقوم DataArt بتوسيع نطاق الخبرات والبرامج التعليمية إلى جمهور خارجي. في 25 مايو ، عُقد لقاء مفتوح للتعلم الآلي في فورونيج ، سيتعرف المشاركون فيه على الاتجاهات في تقنيات ML والمشاكل والمهام التي يمكن حلها بمساعدتهم ، حول مشاريع الحياة الواقعية التي تستخدم أساليب التعلم الآلي والذكاء الاصطناعي.

Source: https://habr.com/ru/post/ar452996/


All Articles