اسمي ساشا وأنا أحب التعلم الآلي ، وكذلك تعليم الناس. أشرف الآن على البرامج التعليمية في مركز علوم الكمبيوتر وأدير شهادة البكالوريوس في تحليل البيانات في جامعة ولاية سانت بطرسبرغ. قبل ذلك ، عمل كمحلل في ياندكس ، وحتى قبل ذلك كعالم: كان يشارك في النمذجة الرياضية في ICT SB RAS.
في هذا المنشور ، أود أن أخبركم بما حدث من فكرة إطلاق دورات تدريبية في التعليم الآلي للطلاب وخريجي جامعة ولاية نوفوسيبيرسك والجميع.

أردت منذ فترة طويلة تنظيم دورة خاصة للتحضير للمسابقات في تحليل البيانات على Kaggle وغيرها من المنصات. هذا يبدو وكأنه فكرة رائعة:
- سيقوم الطلاب وجميع القادمين بتطبيق المعرفة النظرية واكتساب الخبرة في حل المشكلات في المسابقات العامة.
- الطلاب الذين يحتلون المراكز العليا في مثل هذه المسابقات لديهم تأثير جيد على جاذبية NSU للمتقدمين والطلاب والخريجين. مع التدريبات البرمجة الرياضية ، يحدث الشيء نفسه.
- هذه الدورة الخاصة تكمل وتوسع المعرفة الأساسية تمامًا: يقوم المشاركون بتنفيذ نماذج التعلم الآلي بشكل مستقل ، وغالبًا ما يتحدون في فرق تتنافس على المستوى العالمي.
- وقد أجرت جامعات أخرى بالفعل مثل هذا التدريب ، لذلك كنت أتمنى نجاح الدورة الخاصة في NSU.
إطلاق
يعد Akademgorodok في نوفوسيبيرسك أرضًا خصبة جدًا لمثل هذه المهام: الطلاب والخريجين والمدرسين في مركز علوم الكمبيوتر والإدارات الفنية القوية ، على سبيل المثال ، FIT و MMF و FF ، ودعم قوي من إدارة NSU ، ومجتمع ODS نشط ، ومهندسين ذوي خبرة ومحللين من مختلف شركات تكنولوجيا المعلومات. في الوقت نفسه تقريبًا ، علمنا ببرنامج المنح من
Botan Investments - يدعم الصندوق الفرق التي تظهر نتائج جيدة في مسابقات ML الرياضية.
لقد وجدنا جمهورًا في NSU للاجتماعات الأسبوعية ، وأنشأنا غرفة دردشة في Telegram ، ومنذ 1 أكتوبر بدأ الطلاب والخريجين من مركز CS. جاء 19 شخصا إلى الدرس الأول. ستة منهم أصبحوا مشاركين منتظمين في التدريب. في المجموع ، خلال العام الدراسي ، حضر 31 شخصًا مرة واحدة على الأقل.
النتائج الأولى
التقينا مع اللاعبين وتبادلنا الخبرات وناقشنا المسابقات وخطة تقريبية للمستقبل. لقد أدركوا بسرعة أن الكفاح من أجل الحصول على أماكن في مسابقات تحليل البيانات هو عمل شاق منتظم ، على غرار العمل بدوام كامل غير مدفوع الأجر ، ولكنه مثير وممتع للغاية :) نصحنا أحد المشاركين ، Kaggle-master Maxim ، بالتقدم بشكل فردي في المسابقات ، وبعد أسابيع قليلة فقط من هذا الفريق ، بالنظر إلى النتيجة العامة. لقد فعلنا ذلك! في التدريب بدوام كامل ، ناقشنا النماذج والمقالات العلمية وتعقيدات مكتبات بايثون ، وحل المشكلات معًا.
نتج عن فصل الخريف ثلاث ميداليات فضية في مسابقتي Kaggle:
TGS Salt Identification و
PLAsTiCC التصنيف الفلكي . والمركز الثالث في مسابقة CFT لتصحيح الأخطاء المطبعية بأول مال فاز (في المال ، كما يقول kegglers ذوي الخبرة).
ومن النتائج الأخرى غير المباشرة الهامة للدورة الخاصة إطلاق وتهيئة مجموعة جامعة عموم روسيا. طورت قوتها الحاسوبية بشكل ملحوظ حياتنا التنافسية: 40 وحدة المعالجة المركزية ، ذاكرة الوصول العشوائي 755 جيجا بايت ، 8 وحدات معالجة الرسومات NVIDIA Tesla V100.

قبل ذلك ، نجحنا بأفضل ما في وسعنا: الاعتماد على أجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر المكتبية الشخصية ، في Google Colab و Kaggle-kernels. حتى أن فريقًا واحدًا كان لديه برنامج نصي مكتوب ذاتيًا قام بحفظ النموذج تلقائيًا وإعادة تشغيل الحساب ، والذي توقف عند الحد الزمني.
في فصل الربيع ، واصلنا جمع وتبادل النتائج الناجحة والتحدث عن قرارات المنافسة لدينا. بدأ المشاركون المهتمون الجدد يأتون إلينا. خلال فصل الربيع ، اتضح أنه حصل بالفعل على ذهبية وثلاث فضيات وتسع برونزيات في ثماني مسابقات في Kaggle:
PetFinder ، و
Santander ،
وضوابط Predoune Gender ، و
Whale Identification ، و
Quora ، و
Google Landmarks وغيرها ، و البرونزية في
تحدي Recco ، والمركز الثالث في كأس Changellenge >> والمركز الأول (مرة أخرى في المال) في مسابقة التعلم الآلي في
بطولة برمجة ياندكس.
ماذا يقول المشاركون في التدريب؟
ميخائيل كارشيفسكي"أنا سعيد جدًا لأن هذه الأنشطة يتم تنفيذها في بلدنا في سيبيريا ، لأنني أعتقد أن المشاركة في المسابقات هي أسرع وسيلة لإتقان ML. في مثل هذه المسابقات ، يكون الحديد مكلفًا بما يكفي للشراء بمفردك ، ولكن يمكنك هنا تجربة الأفكار مجانًا. "
كيريل برودت"قبل مجيء التدريب العملي ، لم أشارك بشكل خاص في المسابقات باستثناء التدريب ومسابقات هندوسية: لم أكن أرى هذه النقطة في ذلك ، لأنني عملت في مجال وزارة التعليم ، وأنا أعرفه. ذهب الفصل الدراسي الأول كمستمع. وابتداء من الفصل الدراسي الثاني ، وبمجرد ظهور موارد الحوسبة ، فكرت ، لماذا لا تشارك. وامتص لي. تم اختراع المهمة والبيانات والمقاييس وإعدادها لك ، واستغلها واستخدم كل قوة منطقة موسكو ، والتحقق من النماذج والتقنيات الحديثة. إذا لم تكن للتدريب ، ولا تقل أهمية عن موارد الحوسبة ، فلن أبدأ المشاركة قريبًا. "
أندريه شيفيليف"لقد ساعدني التدريب الشخصي في ML على إيجاد أشخاص متشابهين في التفكير ، حيث تمكنت معهم من تعميق معرفتي في مجال التعلم الآلي وتحليل البيانات. إنه خيار كبير أيضًا بالنسبة لأولئك الذين ليس لديهم وقت فراغ كبير للتحليل والغطس بشكل مستقل في موضوع المسابقات ، لكنهم ما زالوا يريدون أن يكونوا في هذا الموضوع. "
انضم إلينا
المسابقات في Kaggle وغيرها من الأماكن تعمل على صقل المهارات العملية وتتحول بسرعة إلى عمل مثير للاهتمام في مجال علم البيانات. الأشخاص الذين شاركوا في منافسة صعبة غالبًا ما يصبحون زملاء ويستمرون في حل مهام العمل بنجاح. حدث هذا معنا: تحول ميخائيل كارشيفسكي ، مع صديق من الفريق ، للعمل في نفس الشركة على نظام التوصية.
مع مرور الوقت ، نخطط لتوسيع هذا النشاط من خلال المنشورات العلمية والمشاركة في مؤتمرات التعلم الآلي. انضم إلينا كمشاركين أو خبراء في نوفوسيبيرسك - اكتب
لي أو
كيريل . تنظيم تدريب مماثل في مدنك وجامعاتك.
فيما يلي ورقة غش صغيرة ستساعدك على اتخاذ الخطوات الأولى:
- النظر في مكان مناسب والوقت للفصول العادية. الأمثل - 1-2 مرات في الأسبوع.
- الكتابة إلى الأطراف المهتمة المحتملة حول الاجتماع الأول. بادئ ذي بدء ، هؤلاء هم طلاب الجامعات التقنية والمشاركين في نظام الوثائق الرسمية.
- احصل على غرفة محادثة لمناقشة الشؤون الحالية: Telegram أو VK أو WhatsApp أو أي رسول آخر مناسب لمعظم الأشخاص.
- الحفاظ على خطة الدرس العام ، قائمة المسابقات والمشاركين ، اتبع النتائج.
- في الجامعات أو معاهد البحوث أو الشركات القريبة ، يمكنك العثور على طاقة حوسبية مجانية أو منح لها.
- PROFIT!