
في الآونة الأخيرة ، ظهرت العديد من الدورات التدريبية ، الأكاديمية منها والخاصة ، والتي تهدف إلى تدريب تحليل البيانات وتدريب المتخصصين القادرين على حل مشاكل العمل باستخدام التعلم الآلي. إذا نظرت عن كثب إلى برامج هذه الدورات ، فهي جميعها متشابهة ، والفرق هو فقط في تنسيقات التدريب (عبر الإنترنت دون اتصال بالإنترنت) وفي المعلمين.
بدأت مدرسة البيانات القيام بهذه الدورات في عام 2015. علاوة على ذلك ، بدأوا في القيام بنفس السيناريو. لقد استعرضنا عددًا كبيرًا من برامج الدورات الأكاديمية المختلفة في التعليم الآلي ، استنادًا إلى الخبرة ، واخترنا فقط ما هو مطلوب حقًا لحل المشكلات العملية وصنعنا عددًا كبيرًا من دفاتر Jupyter التي حاولنا فيها إعداد الرياضيات والتعلم الآلي بأصابعنا.
حاولنا تدريس تقنيات التعلم الآلي في المقام الأول ، وأساليب معالجة النصوص ، والشبكات العصبية ، وتحليل هياكل الشبكات ، وأنظمة التوصية وغيرها من مجالات تحليل البيانات. ويبدو أن مراجعات الطلاب كانت جيدة ، ولكن لا يزال هناك شيء مفقود.
بالنظر إلى أن نشاطنا الرئيسي هو تطوير مهام حقيقية في إطار
Data Studio ، فقد أعدنا الطلاب أولاً وقبل كل شيء لأنفسنا. سرعان ما أدركنا أن المعرفة بتحليل البيانات وأساليب التعلم الآلي هي ، كما يقول علماء الرياضيات ، "شرط ضروري ولكنه غير كاف". لهذا السبب قمنا بتحديث برنامج فصولنا بسرعة شديدة ، مع مراعاة الاحتياجات الحقيقية.
باختصار ، الاستنتاجات التي توصلنا إليها (والتي على أساسها نبني الآن تدريبنا):
- تعلم الآلة وتقنيات الشبكات العصبية مبالغ فيها
- أساليب التعلم الآلي تفكيك ثقافة التفكير التحليلي
- لتحقيق التأثير الاقتصادي للمشاريع التي تنطوي على تحليل البيانات ، والمهارات الناعمة هي أكثر أهمية من المعرفة العميقة ML
- مهنة عالم البيانات مبالغ فيها إلى حد كبير ، لن يكون هناك متخصصون عالميون
سوف الفقرات التالية مناقشة جميع هذه القضايا.
تم حل معظم المهام في الشركات الكبيرة التي تحاول حلها الآن باستخدام الأساليب الحديثة لتحليل البيانات والشبكات العصبية لفترة طويلة. البنوك هي أنجح الحالات في إدارة المخاطر. في مجال الاتصالات ، هذا هو CRM / CBM ، حيث يرتبط نموذج الأعمال بأكمله بزيادة عدد المشتركين في تقنية LTV. أعمال البيع بالتجزئة بالمثل - هناك العديد من المهام (توقعات RTO ، وإدارة المخزون ، والترقيات) التي توفر الأعمال الأساسية.
هناك شركات تصنيع تتمثل مهمتها الرئيسية في زيادة استقرار النظام وتقليل الخسائر والصيانة التنبؤية من جهة وإدارة أرصدة المخزون والتسويق من جهة أخرى.
هذه المهام ليست جديدة ، لقد حل محللوها لفترة طويلة. علاوة على ذلك ، المحللين الذين يفهمون مجال الموضوع. علاوة على ذلك ، يوجد في معظم الحالات عدد كبير من البائعين الذين يعتبرون معايير فعلية لبعض المهام ، مثل إدارة التسعير (في حالة البيع بالتجزئة) ، أو أنظمة APC (في حالة الإنتاج). علاوة على ذلك ، كقاعدة عامة ، خوارزميات التحسين بما في ذلك التعلم الآلي في مثل هذه الأنظمة موجودة بالفعل.
إن جعل شيء جديد بشكل أساسي هنا وكسب المال أمر صعب للغاية. وكما يقول المثل ، فإن "التفاح الذي سقط من شجرة" قد تم حصاده بالفعل. يبقى البحث فقط عن الحالات التجارية الجديدة التي تعطي فيها التحليلات تأثيرًا اقتصاديًا. هناك بالفعل أمثلة من هذا القبيل - وهناك المزيد والمزيد منها.
ومع ذلك ، للعثور على هذه الأمثلة ورؤية تأثير التحليلات ليس بالأمر السهل. للقيام بذلك ، يجب أن تكون قادرًا على أن تفهم بعمق مجال الموضوع في عملية معينة (لا يتم وصفها في الغالب). فهم نوع البيانات المطلوبة بشكل عام ، وفهم بالضبط ما تتم عليه الأعمال. لفهم ما إذا كانت هناك حاجة إلى التحليلات هنا على الإطلاق ، ما إذا كانت هناك حاجة إلى بعض الخوارزميات التنبؤية (في أكثر الأحيان) ، ما إذا كان من الضروري تغيير العملية التجارية (في أكثر الأحيان نعم) ، ما إذا كانت هناك أدوات تشغيلية (ما هو الهدف من التنبؤ بإغلاق المعدات إذا لم تكن هناك طرق لتجنب ذلك. ؟).
لذلك - في عملية تنفيذ مثل هذا المنتج الرقمي ، تثور أسئلة كثيرة تتطلب منهجًا تحليليًا ، وثقافة معينة من العمل مع البيانات ، والقدرة على وضع فرضيات ، وطرح الأسئلة على نفسك ، والتفكير فيما يتعلق بمالك الأعمال. الحقيقة هي أن هذا لا يتم تدريسه في مدارس تحليل البيانات ، ولا يتم تدريسه في كورسيرا. نعم ، ربما تقوم الدورات الحديثة بتدريب المهندسين والرياضيين الجيدين ، لكن لا محللين ، فهم لا يفعلون ذلك.
علاوة على ذلك ، فإن معرفة أساليب التعلم الآلي والشبكات العصبية من المرجح أن تقتل ثقافة التفكير التحليلي. يعتبر معظم علماء البيانات المعاصرين ، مثلهم مثل الأطفال الذين يقودون سيارة رياضية ، أنفسهم فريدين (فهم يعرفون الكثير من الكلمات الذكية حول xgboost والشبكات العصبية وما إلى ذلك) ، ولا يعرفون كيفية القيادة (ولكن لماذا إذا كانت السيارة تفعل كل شيء من أجلك) ، وهم يسيرون بسرعة فقط نظرًا لوجود قدر كبير من القدرة الحصانية (الحديد القوي ، على الرغم من أنه من المحتمل جدًا إعادة تدريبه).
نتيجة لذلك ، نتعرف على الصورة التالية: بعض الأشخاص الأذكياء يأتون ، ولا يطرحون أي أسئلة تقريبًا ، قائلين إن البيانات ستخبرنا بكل شيء. يأخذون بعض البيانات ، ثم يأتون - يقولون إنهم قاموا ببناء نوع من النماذج ، يطلقون عليها الدقة في المئة وهذا كل شيء. بمجرد أن تبدأ التحدي - يقولون بكلمات غريبة ، سحق الذكاء ، ولكن لا يوجد أي معنى منهم.
هذا ما يفسر أنه الآن بين المقاولين للتحول الرقمي أو تحليل البيانات - لا سيما شركات الاستشارات الاستشارية (وليس تكنولوجيا المعلومات) هي المسيطرة. نظرًا لأن لديهم ثقافة تحليلية وثقافة تفكير في العمل ، فإنهم دائمًا ما يخففون من الصداع ويقدمون الحلول. لا يقتصر الأمر على بناء نموذج للتعلم الآلي ، بل يقومون بإجراء تحليلات حقيقية تساعد في اتخاذ القرار.
هناك اتجاه آخر يحدث في العالم في الوقت الحالي وهو أنه حتى لو كان عالم البيانات أقل نجاحًا ، فلا يمكن أن يكون عالميًا. في العديد من الشركات ، أصبح الهيكل المركزي الذي تم إنشاؤه في البداية والمشترك في تحليل البيانات موزعًا. ليس للمكتب المركزي سوى دور توفير البنية التحتية ، وجزء البقالة بأكمله ، يتم بالفعل تصنيع المنتجات الرقمية الحقيقية مباشرة في وحدات الأعمال. في هذا الهيكل ، على التوالي ، يصبح عالم البيانات (شريطة أن يكون "صحيحًا") خبيرًا في مجال الموضوع - يتم نقل الوظيفة إليه ، والتي كانت حتى ذلك الحين مدعومة من قبل المحللين "القدامى" الذين عملوا من قبله. في حالة النجاح ، يحصل أيضًا على أدوات التشغيل.
نتيجة لذلك ، هناك ميل متزايد لإعطاء المحللين الناجحين نفوذًا عمليًا في أيديهم وتتزايد مسؤوليتهم. ولكن فقط في مجال موضوع واحد. نتوقع (كما أكدت الشركات الكبيرة في السوق) أنه لن يكون هناك محللون عالميون أكثر - لقد انتهى الضجيج ، فقد حان الوقت ليكون مسؤولاً عن النتيجة. أولئك الذين يمكنهم حل مشاكل العمل بمساعدة التحليلات سوف يذهبون إلى قسم البقالة ، وأولئك الذين يستطيعون تدريس xgboost سيعودون إلى الأكاديمية أو يلقيون محاضرات حول التعلم الآلي.
لهذا السبب ، قمنا بمراجعة دوراتنا بالكامل (بما في ذلك لأننا نأخذ العديد من خريجينا إلى
استوديو البيانات الخاص بنا) والآن:
0. بادئ ذي بدء ، عند المدخل ، نرى في كل طالب موظفينا المستقبليين الذين سيبحرون معنا في نفس القارب ويشاركون في مشاريع كبيرة. لذلك ، نحن مهتمون بحقيقة أن الطالب في هذه الأشهر 3.5 مستعد على أكفأ وجه ممكن. يمكنك دائمًا الحصول على وقت لأخذ الدورة التدريبية التالية في كورسيرا ، إذا كانت هناك حاجة لفهم تفاصيل خوارزمية معينة. ومع ذلك ، فإن الحصول على تجربة الحالات الحقيقية أكثر صعوبة بكثير. وهذا هو السبب:
1. يعتمد التدريب على طريقة الحالة. نحن نأخذ المهمة الحقيقية ، أولاً نحلل نموذج العمل ، وحدة الاقتصاد ، نفهم ما الجودة ، على أساس الأرقام الحقيقية ، يجب أن نحققها في هذه المهمة. نقيم التأثير الاقتصادي المحتمل. وفقط بعد ذلك نبدأ في التعامل مع الجزء الفني ، ونغرق تدريجياً في الأساليب التحليلية والتعلم الآلي والشبكات العصبية. وما هو مهم - نحن نفعل ذلك فقط إذا كان ذلك ضروريًا في هذه المهمة
2. نحن نعمل مع كل طالب على حدة. على الرغم من حقيقة أننا نحاول تجنيد مجموعة متجانسة ، فإننا نفهم أن الناس مختلفون - لكل منهم خطة التدريب الفردية الخاصة به وواجبه المنزلي. في رأينا ، هذا هراء عندما يحل بضع عشرات الأشخاص نفس المشكلة. هذا ليس فعالا حتى من حيث الحس السليم. يتلقى جميع الطلاب إجابات المعلم في الدردشة ، ولن يتم إلقاء الطالب على الآخر في مهمة.
الشيء الوحيد الذي نحذره مقدمًا عند المدخل هو أن التدريب سيتطلب وقتًا كبيرًا ، وستحتاج دائمًا إلى أداء الواجب المنزلي ، والتعمق في التفاصيل ، وقضاء عطلة نهاية الأسبوع في التدريب في كثير من الأحيان.
نحن نفهم أن هذه ليست قصة جماعية. تم تشغيل
Data Studio بنجاح لعدة سنوات ، بما في ذلك لأنه من الصعب الدخول فيه. نحن ندرك جيدًا أنه في الواقع الحالي ، من السهل تطوير التحليلات بدلاً من أخذها بعد الدورات التدريبية مع كورسيرا. هذا هو السبب في أن الطلاب الأكثر تحفيزًا يأتون في البداية إلى
مدرسة البيانات . عادة - لا يتجاوز حجم المجموعة 15-20 شخصًا ، مما يتيح لك جعل التدريب فرديًا تقريبًا.
ناهيك عن حقيقة أننا فكرنا تمامًا في الجانب الفني بالكامل - أجهزة Jupyter المحمولة المعدة مسبقًا ، ونظام اتصال فعال للمشاركين عن بُعد ، والبث عبر الإنترنت - كل هذا يساعد حتى المشاركين عن بُعد على التواصل مباشرة مع الأطفال الآخرين في الفصل.
نحن لا نعلم علماء البيانات - نحن ندرب أشخاصًا أكفاء يستطيعون حل مشكلات العمل بمساعدة التحليلات.
بداية
الدورة الجديدة في 23 سبتمبر. لأسئلة المشروع ، يرجى الاتصال بنا على
استوديو البيانات .