برنامج المقيم ياندكس ، أو كيف إلى النهاية الخلفية من ذوي الخبرة تصبح مهندس ML



Yandex يفتح برنامج تعلم الآلة المقيم للمطورين الخلفية ذوي الخبرة. إذا كنت قد كتبت الكثير في C ++ / Python وترغب في تطبيق هذه المعرفة في ML ، فسوف نعلمك كيفية إجراء البحوث العملية واختيار القيمين ذوي الخبرة. ستعمل على خدمات Yandex الرئيسية واكتساب مهارات في مجالات مثل النماذج الخطية وتعزيز التدرج ، وأنظمة التوصية ، والشبكات العصبية لتحليل الصور والنصوص والصوت. سوف تتعلم أيضًا كيفية تقييم النماذج بطريقة صحيحة باستخدام المقاييس في وضع عدم الاتصال وعبر الإنترنت.

مدة البرنامج سنة واحدة ، خلالها سيعمل المشاركون في قسم الاستخبارات الآلية ودراسات ياندكس ، وكذلك حضور المحاضرات والندوات. تُدفع المشاركة وتتحمل العمالة الكاملة: 40 ساعة في الأسبوع ، بدءًا من 1 يوليو من هذا العام. التطبيقات مفتوحة بالفعل وستستمر حتى 1 مايو.

والآن بمزيد من التفصيل - حول نوع الجمهور الذي ننتظره ، ما سيكون سير العمل وبشكل عام ، كيف يمكن للمتخصص الخلفي أن يتحول إلى مهنة في ML.

الاتجاهية


لدى العديد من الشركات برامج إقامة ، بما في ذلك ، على سبيل المثال ، Google و Facebook. وهي تهدف أساسا إلى المتخصصين المبتدئين والمتوسطين الذين يحاولون التحرك نحو البحث ML. برنامجنا لجمهور مختلف. ندعو مطوري الخلفية الذين اكتسبوا بالفعل ما يكفي من الخبرة ونعرف على وجه اليقين أنهم في كفاءاتهم يحتاجون إلى التحرك نحو ML ، والحصول على مهارات عملية - وليس مهارات العالم - في حل المشاكل الصناعية للتعلم الآلي. هذا لا يعني أننا لا ندعم الباحثين الشباب. بالنسبة لهم ، قمنا بتنظيم برنامج منفصل - جائزة إيليا سيجالوفيتش ، والذي يسمح لك أيضًا بالعمل في ياندكس.

حيث يجب على المقيم العمل


نحن ، في إدارة ذكاء الآلة والأبحاث ، نطور أنفسنا أفكارًا للمشروع. المصدر الرئيسي للإلهام هو الأدب العلمي والمقالات والاتجاهات في مجتمع البحث. أنا وزملائي نحلل ما قرأناه ، ونرى كيف يمكن تحسين أو توسيع الطرق المقترحة من قبل العلماء. في الوقت نفسه ، يأخذ كل واحد منا في الاعتبار مجال معرفتنا واهتماماتنا ، ويصوغ المشكلة على أساس المجالات التي نعتبرها مهمة. عند التقاء نتائج البحوث الخارجية وكفاءاتها الخاصة ، عادةً ما تُولد فكرة المشروع.

مثل هذا النظام جيد لأنه يحل المشكلات التكنولوجية لخدمات ياندكس إلى حد كبير حتى قبل ظهورها. عندما تنشأ مشكلة قبل الخدمة ، يأتي ممثلوها إلينا ، على الأرجح ، لاتخاذ التقنيات التي أعدناها بالفعل ، والتي لا يمكن تطبيقها إلا بشكل صحيح في المنتج. إذا لم يكن هناك شيء جاهز ، فسوف نتذكر بسرعة على الأقل المكان الذي يمكنك فيه "البدء بالحفر" ، حيث المقالات التي تبحث عن حل. كما تعلمون ، فإن النهج العلمي هو الوقوف على أكتاف العمالقة.

ما يجب القيام به


في Yandex - وبالتحديد في إدارتنا - تتطور جميع اتجاهات ML الحالية. مهمتنا هي تحسين جودة مجموعة واسعة من المنتجات ، وهذا بمثابة حافز لاختبار كل شيء جديد. بالإضافة إلى ذلك ، تظهر خدمات جديدة بانتظام. لذلك في برنامج المحاضرة ، هناك كل المجالات الرئيسية (الراسخة) للتعلم الآلي في التنمية الصناعية. في تجميع الجزء الخاص بي من الدورة التدريبية ، استخدمت تجربة التدريس في كلية تحليل البيانات ، وكذلك المواد والتطورات الخاصة بمعلمي SHAD الآخرين. أعلم أن زملائي فعلوا الشيء نفسه.

في الأشهر الأولى ، سيكون التدريب على برنامج الدورة التدريبية حوالي 30٪ من وقت عملك ، ثم حوالي 10٪. ومع ذلك ، من المهم أن نفهم أن العمل مع نماذج ML نفسها سيستمر يستغرق حوالي أربع مرات أقل من جميع العمليات المرتبطة. وتشمل هذه إعداد الخلفية ، وتلقي البيانات ، وكتابة خط أنابيب لعملية ما قبل المعالجة ، وتحسين الكود ، والتكيف مع أجهزة معينة ، وما إلى ذلك. مهندس ML ، إذا كنت ستفعل ذلك ، مطور fullstack (فقط مع وجود تحيز كبير في التعلم الآلي) ، قادر على حل المشكلة من البداية إلى النهاية. حتى مع النموذج النهائي ، قد تحتاج إلى القيام بعدد من الإجراءات: موازاة تنفيذها عبر العديد من الأجهزة ، وإعداد التنفيذ في شكل قلم أو مكتبة أو مكون من الخدمة نفسها.

اختيار الطالب
إذا كان لديك انطباع بأنه من الأفضل أن تذهب إلى مهندسي ML من خلال العمل أولاً كمطور خلفي ، فهذا ليس كذلك. يعد إدخال SHAD نفسه دون خبرة حقيقية في تطوير الخدمات ، والتعلم وتصبح شائعًا للغاية في السوق خيارًا ممتازًا. كان العديد من الخبراء في ياندكس في مناصبهم الحالية بهذه الطريقة. إذا كانت أي شركة على استعداد لتقديم عمل لك في مجال ML بعد التخرج مباشرة ، فمن المحتمل أن يكون الأمر يستحق قبول العرض. حاول الدخول في فريق جيد مع معلم خبير واستعد لتعلم الكثير.

ما يتداخل عادة مع ML


إذا كان المؤيد يريد أن يصبح مهندس ML ، فبإمكانه - دون مراعاة البرنامج المقيم - أن يختار من اتجاهين للتطوير.

أولاً ، للدراسة كجزء من دورة تعليمية. ستقربك الدروس في Coursera من فهم التقنيات الأساسية ، ولكن لتغمر نفسك في المهنة بشكل كاف ، تحتاج إلى تكريس المزيد من الوقت لها. على سبيل المثال ، قم بإنهاء SHAD. في سنوات مختلفة ، كان هناك عدد مختلف من الدورات مباشرة في التعلم الآلي في شاد - في المتوسط ​​، حوالي ثمانية. كل واحد منهم مهم ومفيد حقا ، بما في ذلك وفقا للخريجين.

ثانياً ، يمكنك المشاركة في المشاريع القتالية حيث يلزم تنفيذ خوارزمية ML أو أخرى. ومع ذلك ، هناك عدد قليل جدًا من هذه المشاريع في سوق تطوير تكنولوجيا المعلومات: لا يتم استخدام التعلم الآلي في معظم المهام. حتى في البنوك التي تستكشف بفعالية الفرص المتعلقة بعمليات غسل الأموال ، فإن القليل منهم يقومون بتحليل البيانات. إذا لم تتمكن من الانضمام إلى أحد هذه الفرق ، فعليك إما أن تبدأ مشروعك الخاص (حيث ، على الأرجح ، ستحدد المواعيد النهائية بنفسك ، وهذا ليس له علاقة تذكر بمهام الإنتاج القتالي) ، أو البدء في التنافس على Kaggle.

في الواقع ، من السهل نسبياً العمل كفريق مع أعضاء آخرين في المجتمع ومحاولة نفسك في المسابقات - خاصةً إذا كنت تعزز مهاراتك من خلال التدريب والدورات التدريبية المذكورة في كورسيرا. كل مسابقة لها موعد نهائي - سيكون بمثابة حافز لك والاستعداد لنظام مماثل في شركات تكنولوجيا المعلومات. هذه طريقة جيدة - ومع ذلك ، فهي أيضًا منفصلة قليلاً عن العمليات الحقيقية. في Kaggle تحصل على معالجة مسبقة ، وإن لم تكن دائمًا بيانات مثالية ؛ لا تقدم للتفكير في المساهمة في المنتج ؛ والأهم من ذلك ، أنها لا تحتاج إلى حلول مناسبة للإنتاج. من المحتمل أن تكون الخوارزميات قابلة للتطبيق وستكون ذات دقة عالية ، لكن النماذج والرمز الخاص بك سيبدو مخيطًا من أجزاء مختلفة من Frankenstein - في مشروع قتال ، سيعمل هذا الإنشاء بالكامل ببطء شديد ويصعب تحديثه وتوسيعه (على سبيل المثال ، خوارزميات اللغة والصوت دائمًا تتوافق جزئيا مع تطور اللغة). تهتم الشركات بحقيقة أنه ليس بإمكانك فقط القيام بالعمل المذكور أعلاه (من الواضح أنك ، بصفتك مؤلف الحل ، يمكنك القيام بذلك) ، ولكن أيضًا أي من زملائك. لقد قيل الكثير عن الفرق بين الرياضة والبرمجة الصناعية ، ويقوم كاغل بتعليم "الرياضيين" على وجه التحديد - حتى لو كان يفعل ذلك جيدًا ، مما يسمح له باكتساب بعض الخبرة.

وصفت خطين محتملين للتنمية - التدريب من خلال البرامج التعليمية والتدريب "في المعركة" ، على سبيل المثال على Kaggle. البرنامج المقيم هو مزيج من هاتين الطريقتين. محاضرات وندوات على مستوى SHAD في انتظارك ، وكذلك المشاريع القتالية حقا.

Source: https://habr.com/ru/post/ar446554/


All Articles