اسمي عزات بولياكولوف. أعمل كمحلل مخاطر في شركة ID Finance المالية. لقد بدأت مع التحليلات ، وإنشاء تقارير لأقسام المخاطر والتسويق والمالية. في شركتنا الصغيرة نسبيًا ، كان علي التفاعل مع جميع الأقسام. ونتيجة لذلك ، تمكنت من الحصول على خبرة مهنية متنوعة. شاركت في حساب الاحتياطيات المالية ، ومقارنة الأداء في اختبارات A / B ، والعملاء المجزأة للتسويق ، وما إلى ذلك. في أقل من عام من العمل ، انضممت إلى تطوير بطاقات التسجيل. وأدركت أنني أريد فهم تحليل البيانات ومعالجتها بشكل أفضل.

استخدمنا الانحدارات اللوجستية الكلاسيكية للتنبؤ بالافتراضات للعملاء. أحد مصادر بياناتنا هو المعاملات المالية ، التي يوفر لنا العملاء الوصول إليها إذا رغبت في ذلك. يتطلب العمل معهم نهجًا مبتكرًا ، حيث يمكن استخراج الكثير من المعلومات المفيدة من مخزن البيانات هذا. كما علمت لاحقًا ، تسمى هذه العملية هندسة الميزات. لقد جذبني - أصبحت أكثر اهتماما بعلوم البيانات.
من خلال العمل مع الإدارات الأخرى ، رأيت أن نطاق تطبيق ML كبير للغاية. لم يتم لعب أقل دور في اهتمامي بـ DS من خلال حقيقة أننا كنا نطور في SAS-e الثقيل. ليس لديها واجهة أكثر ملاءمة ووظيفة غير مكتملة. كنت أرغب في العمل باستخدام أداة أكثر مرونة.
أدركت أن الدراسة الذاتية لعلوم البيانات ، على سبيل المثال ، في Coursera ، تتطلب إرادة قوية وانضباطًا ذاتيًا ، وهو ما ليس لدي ما يكفي. لذلك ، بدأت في النظر ليس نحو الدورات عبر الإنترنت ، ولكن الدورات "الحية" مع المحاضرات والمناقشات والواجبات المنزلية.
أبلغت مشرفي في العمل عن الاتجاه الذي أريد أن أتطور فيه. جاءت الإدارة لمقابلتي ، وعرضت دفع ثمن الدورات ، وبعد ذلك انتقل إلى قسم علوم البيانات داخل المبنى.
لذلك ، بدأت باختيار الدورات. الغريب ، تسود الدورات عبر الإنترنت في سوق DS التعليمية. حتى في موسكو ، لا توجد مجموعة كبيرة من الدورات التدريبية الجادة التي لا تتبع أسلوب "سنعلمك علوم البيانات في غضون 21 يومًا". أدركت أن التدريب الجيد يجب أن يستمر ستة أشهر على الأقل. لم أفكر في Yandex SHAD ، لأنه يتطلب غمرًا كاملاً وأنشطة يومية. العمل بدوام كامل ، سيكون من الصعب استيعاب ومعالجة المواد التعليمية بطريقة عالية الجودة. بالنظر إلى المستقبل ، سأقول أنه في الدورة المختارة ، واجهت مشاكل في وقت الدراسة ، ناهيك عن الدورة المجانية. ونتيجة لذلك ، توقفت في دورة عالم البيانات في إحدى المدارس الشعبية التي استمرت ستة أشهر: 5 أشهر من التدريب المكثف + شهر لكتابة دبلوم.
عن الدورة
تكلفة التدريب حوالي 200،000 روبل. كان هناك العديد من الفصول - 3 مرات في الأسبوع لمدة 3 ساعات. بعد كل فصلين من أصل 3 فصول ، كان هناك واجبات منزلية. كان البرنامج كلاسيكيًا وتضمن الأساليب الأساسية لتعلم الآلة وأنظمة التوصيات والتعرف على الصور ورؤية الآلة ومعالجة لغة الطبيعة (NLP) والسلسلة الزمنية. بالإضافة إلى وجود العديد من الهاكاثون ودبلومة لأولئك الذين سيسلمون الحد الأدنى المطلوب من الواجبات المنزلية.

تم عقد الفصول الدراسية في بومانسكايا ، وتم تسجيل 30 شخصًا في المجموعة ، لكنهم ساروا بشكل مطرد 15-20. تدربت مرتين في المساء في أيام الأسبوع والسبت من 10:00 إلى 13:00. من الغريب أن يأتي أشخاص من مختلف المجالات ، لا يرتبطون بالضرورة بتكنولوجيا المعلومات ، إلى الدورات. نعم ، كان هناك مطورون أمامي / خلفي ، ولكن نصف الدورة كانت مرتبطة بالمنتج / الأعمال أو تحليلات المخاطر. وبالنسبة للجميع تقريبًا ، كانت هذه الدورات تعني تغييرًا في المهنة. جاء البعض لأن هناك الآن ضجة معينة حول علم البيانات ، والبعض الآخر يشعر بالملل من أنشطتهم الحالية ، بينما يخطط البعض الآخر لاستخدام DS في عملهم. دفع كل شخص تقريبًا تكاليف التدريب بمفرده ، لذا كان مستوى الاهتمام مرتفعًا جدًا.
انطباعاتي
بدأ كل شيء بالمعرفة الأساسية ومهارات البرمجة في الثعبان وتصور البيانات. ثم انتقلنا إلى العدو وبدأنا في اتباع طريقة واحدة للتعلم الآلي في درس واحد: الأشجار الحاسمة ، والانحدار الخطي / اللوجستي ، والغابات العشوائية ، والتعزيزات. أنا شخصياً أعتقد أن تعلم هذه الأساليب الكلاسيكية يستغرق وقتاً أطول.
ما أعجبني
- لقد درسنا تقريبًا جميع الأساليب والأساليب الحديثة للتعلم الآلي.
- كانت هناك كتلة منفصلة في هندسة الميزات - ما يصل إلى 3 دروس. هذه معلومات مفيدة ، ولكن للأسف ، لم يقرأ المحاضر هذا الجزء بأفضل طريقة.
- جزء من الواجبات المنزلية كان من مسابقة Kaggle. بعد تقديم النتائج ، يمكنك رؤية موقفك. بعد ذلك ، كان هناك دافع لتحسين نموذجك ، وضبط معلماته ، وليس فقط القيام بالواجب المنزلي على "الجحيم".
- كانت هناك دورات متعمقة حول أنظمة التوصية ، البرمجة اللغوية العصبية ورؤية الكمبيوتر ، ولكل منها 6-8 فصول. وفي رأيي ، كان هناك أفضل المحاضرين.
- بعد كتل على رؤية الكمبيوتر والسلسلة الزمنية ، كان هناك 2 hackathons.
تبين أن هذا تمرين مفيد للغاية. الحاجة للحصول على نتيجة مقبولة في أقل وقت من الوقت تنشط الدماغ وتحمله إلى أقصى حد. بالإضافة إلى ذلك ، عند العمل في فريق ، ترى أساليب الآخرين.
- في حسابي الشخصي ، كان هناك تقييم للطالب ، حيث شاهدت تقدم زملائي في الواجبات المنزلية. كان ذلك مفيدا. منذ الاستراحة اقتربت من "المهووسين" وسألت كيف جعلوا هذا أو ذاك الواجبات المنزلية.
- ميزة المحاضرات "الحية" هي الأسئلة خلال الدرس.
- في الحضور ، بناء على تعليمات المحاضر ، قمنا بتمارين صغيرة على الفور في الثعبان
- مجتمع الطلاب - التواصل مع زملاء الدراسة وتبادل الآراء ، كان من المثير للاهتمام أن نسمع من الآخرين عن دوافعهم والمجالات التي تهمهم ML.
ما لم يعجبه
- كثافة عالية في النظرة العامة على الطرق الرئيسية - درس واحد فقط لكل طريقة.
- بشكل عام ، أود الحصول على فصلين في الأسبوع ، وليس 3. شخصيًا ، بالنسبة لي ، الدراسة كانت صعبة ، لقد أكلت كل وقت فراغي تقريبًا. جزء من زملائي ، حسدتي ، يمكن أن يدرس في العمل.
- لأسباب غير معروفة ، تم نقل الوحدة عن طريق البرمجة اللغوية العصبية وتم إجراؤها على رؤية الكمبيوتر (السيرة الذاتية). ونتيجة لذلك ، في NLP ، كان علينا استخدام الشبكات العصبية ، التي تم وصفها بمزيد من التفصيل فقط من حيث السيرة الذاتية.
- كان هناك محاضرون لديهم قدرات تربوية منخفضة للغاية. بالإضافة إلى ذلك ، لم يتحققوا من الواجبات المنزلية في الوقت المحدد.
تم توسيع نطاق علم البيانات مؤخرًا.المجموع
لقد تلقيت 5 أشهر من التدريب المكثف ، حيث انغمست بشكل عميق في عالم ML. تعلمت كتابة معالجة البيانات في Python ، لتصورها ، لبناء نماذج مختلفة. كما تم إنشاء نص باستخدام الشبكات العصبية والصور المصنفة.
أعتقد أن لدي تجربة جيدة للبدء. قال موجه الدبلوم الخاص بي أن معرفتنا يتم سحبها من قبل عالم بيانات متوسط ، وخبرة من قبل صغار. حسنًا ، سنرى في غضون شهرين. منذ أن انتقلت إلى قسم علوم البيانات في شركتنا لمدة أسبوعين.