مراحل تقديم نماذج التعلم الآلي في الشركات الكبيرة



في منتدى RAIF 2019 ، الذي عقد في سكولكوفو كجزء من Open Innovations ، تحدثت عن كيفية تطبيق إدخال نماذج التعلم الآلي. فيما يتعلق بخصائص المهنة ، أقضي عدة أيام كل أسبوع في الإنتاج ، وأقدم نماذج التعلم الآلي ، وبقية الوقت في تطوير هذه النماذج. هذا المنشور عبارة عن تسجيل لتقرير حاولت فيه تلخيص تجربتي.

نبدأ من خلال وصف العملية في السكتات الدماغية الكبيرة ، تدريجيا في تفاصيل كل مرحلة.
سواء كنا نعول على تحسين الإنتاج استنادًا إلى نتائج مسح كامل (مثالي) ، أو مجرد جمع أفكار "تحسين الترقيع" ، فإن النتيجة هي إلى حد ما تكوين قائمة من المبادرات . من الضروري أن نفهم مجالات الإنتاج التي سنقوم بتحسينها. هذه العملية تستغرق عادة حوالي شهرين.

بعد ذلك ننتقل إلى مرحلة التجريب ، وسوف يستغرق الأمر من ثلاثة إلى أربعة أشهر - يجب أن نبني نموذجًا أساسيًا ونفهم ما إذا كان التعلم الآلي قابل للتطبيق عليه ، وما الفوائد التي يمكن أن يحققها هذا العمل.

في المرحلة التالية ، التي تستغرق وقتًا أطول بكثير ، لا يوجد الكثير من التعلم الآلي عليها - التنفيذ ، عندما تحتاج إلى التكامل ، وبناء النظم الحالية والبدء في الحصول على الربح الذي توقعناه في المرحلة الثانية. يستغرق التنفيذ عادة من ستة أشهر إلى تسعة أشهر.

مرحلة التحكم تكمل العملية. يعد إنتاج النموذج وعرضه شيءًا آخر ، والحفاظ على النموذج لبعض الوقت. الإنتاج يتغير ، يتم استبدال الأدوات الآلية. في هذه الظروف ، يتعين على النموذج "الدوران" باستمرار والبحث عن فرص جديدة للتحسين.



الآن بمزيد من التفاصيل بالترتيب:

تبحث عن فرضية


من أين تأتي الفرضية؟ من سيرشحها؟

عادة ما يكون من الشائع الذهاب إلى قسم تكنولوجيا المعلومات للحصول على الفرضيات ، ولكن الأشخاص الذين يمكنهم تكوين الأنظمة يعملون هناك ، ويعرفون عن التكامل ولا يعرفون أي شيء عن التعلم الآلي. بالإضافة إلى ذلك ، فهي ليست على علم جيد بالإنتاج. ليس لديهم الكفاءة لفهم كيفية عمل التعلم الآلي في الممارسة العملية.

محاولة رقم اثنين هو الذهاب إلى فرضية الإنتاج. في الواقع ، يعرف المتخصصون المقربون من الإنتاج الميزات التقنية للعملية ، لكن ... لا يعرفون التعلم الآلي. لذلك ، لا يستطيعون تحديد أين هو قابل للتطبيق وأين لا.

في هذه الحالة ، من أين يمكن أن تأتي الفرضية؟ للقيام بذلك ، توصلوا إلى منصب خاص - رئيس قسم التحول الرقمي. هذا هو الشخص الذي يشارك في التحول الرقمي. أو كبير موظفي التاريخ - الشخص الذي يعرف البيانات وكيف يمكن تطبيقها. إذا لم يكن هذان الشخصان في الشركة ، فينبغي أن تأتي الفرضيات من الإدارة العليا. وهذا هو ، المتخصصين الذين يفهمون تماما الأعمال ويشاركون في التكنولوجيا الحديثة.

إذا لم يكن لدى المؤسسة كبير مسؤولي التحول الرقمي ، أو كبير مسؤولي التاريخ ، ولم تتمكن الإدارة العليا من وضع فرضية ، فعندئذ ... سيأتي المتنافسون. إذا قاموا بتنفيذ شيء ما ، فلا يمكن أن يؤخذ منهم. ولكن ، يمكن لشركة تكامل متصلة بالمشروع معرفة ما وكيف يمكن تحسينه.



كيفية اختيار فكرة؟


هناك أربعة عوامل مهمة هنا:

  1. دوران العملية ليكون الأمثل.
  2. انحرافات كبيرة في العملية. هناك منهجية من ستة سيغما ، والتي تشير إلى أن جميع العمليات يجب أن تنحرف بما لا يزيد عن ستة انحرافات معيارية عن نتائجها. إذا كان لديك المزيد من هذه الانحرافات ، فأنت بحاجة إلى تحليلها ، وسوف يساعدك التعلم الآلي.
  3. توافر وتوافر البيانات. على سبيل المثال ، إذا تلقيت بيانات من أجهزة استشعار عن تشغيل المعدات بعد 12 شهرًا ، فلن تنفذ التعلم الآلي.
  4. مدى تعقيد تنفيذ الرقمنة في العملية. تكلفة تقديم النموذج الخاص بك ، مقارنة بتكلفة ما يمكنه توفيره.

ما هي البيانات؟


هيكل البيانات هي:

منظم: بعض الجداول والقراءات - كل شيء بسيط. عندما نريد استخدام البيانات من الشبكات الاجتماعية ، أو مجموعات من الصور ، يتعين علينا التعامل مع البيانات غير المنظمة. من الضروري التأكيد على أنه يجب هيكلة هذه البيانات أيضًا ، بحيث تتحول إلى أرقام يمكن أن يتصورها التعلم الآلي. النوع الثالث من البيانات مترابط. إذا عملنا مع البيانات التي تتغير كل ميلي ثانية واحدة ، فعلينا أن نفكر على الفور في موازنة التحميل: هل يمكن لنظامنا تحمل سرعة استلامه؟



حسب الأصل ، يتم تقسيم البيانات إلى:

أجهزة الاستشعار الآلي - تولد بعض أنواع الأرقام ، ونحن نثق بهم أم لا. لكنهم تقريبا نفس الشيء. دخلت يدويا - هنا تحتاج إلى فهم أنه قد يكون هناك خطأ يتعلق بالعامل البشري. ويجب أن يكون النموذج مقاومًا لهذا. البيانات الخارجية - ربما سنكون مهتمين بأسعار الصرف إذا كان التنفيذ متعلقًا بالمعاملات المالية ، أو توقعات الطقس إذا توقعنا تبادل درجات الحرارة. البيانات الثابتة هي كل ما يمكن إعادة استخدامه.



مشاكل البيانات


  1. الاكتمال - لحظة تخطي بعض البيانات / الأشهر.
  2. خطأ التغيير - إذا كان لدى المستشعر ، على سبيل المثال ، خطأ قدره 5 ميلي ثانية ، ثم النموذج بدقة 2 ملي ثانية - لن تتمكن ، نظرًا لأن بيانات الإدخال تبدأ في التباعد.
  3. إمكانية الوصول عبر الإنترنت - إذا كنت تريد إجراء تنبؤ "الآن" ، يجب أن تكون البيانات جاهزة.
  4. وقت التخزين - إذا كنت تريد استخدام الاتجاهات السنوية ، وتحتاج إلى التنبؤ بالطلب ، ويتم تخزين البيانات لمدة ستة أشهر فقط - فلن تصنع نموذجًا.

العمل مع البيانات


استمع للمحترفين ، لكن صدق فقط البيانات. تحتاج إلى الذهاب إلى ورشة العمل ، والتحدث إلى المحترفين ، والذهاب إلى المصنع ، والتحدث إلى المشغلين ، وفهم أعمالهم. لكن صدق فقط البيانات. كان هناك الكثير من الأمثلة عندما يقول المشغلون أن هذا لا يمكن أن يكون - نعرض البيانات - اتضح أن هذا يحدث بالفعل. مثال مثير للاهتمام: بمجرد أن أظهر النموذج أن يوم الأسبوع يؤثر على الإنتاج. يوم الاثنين - معامل واحد ، يوم الجمعة - آخر.

التأثير مفهوم فقط في المعركة - النماذج الأولية السريعة مهمة للغاية. الشيء الأكثر أهمية هو أن نرى بسرعة كيف يعمل النموذج في الحياة اليومية. في العروض التقديمية وعلى أجهزة الكمبيوتر المحمولة المحلية ، قد يبدو المشروع مختلفًا تمامًا عما هو عليه بالفعل: كقاعدة عامة ، في الواقع تأتي المشكلات المختلفة تمامًا في المقام الأول.

فقط النموذج المفسر لديه فرصة للتحسين. تحتاج دائمًا إلى فهم سبب اختيار النموذج لهذه الطريقة بوضوح وليس بطريقة أخرى.

العمل مع المقاييس


في الواقع ، يمكن أن يكون اعتماد الدقة على الربح أي. حتى نفهم كيف تؤثر هذه الدقة على التأثير ، فإن مسألة الدقة لا معنى لها تمامًا. تحتاج دائمًا إلى الترجمة إلى ربح. توضح الرسوم البيانية أدناه أن الأرباح يمكن أن تختلف اعتمادًا على دقة النموذج. يوضح الرسم البياني الأول مدى صعوبة تحديد مقدمًا بدقة عند أي نقطة تكفي دقة النموذج لنمو الأرباح:



علاوة على ذلك ، بالنسبة إلى بعض الحالات التي لا تتمتع بدقة كافية للنموذج ، فإنه يؤدي ببساطة إلى خسارة:



النقاط الرئيسية حول التكامل:

  • التكامل يستغرق وقتا أطول من تطوير النموذج.
  • أفكار جديدة. في بعض الأحيان اتضح أن المشروع يستفيد من حيث لم يكن متوقعا.
  • التعليم. الناس تتكيف أسرع من الحديد.

النقطة الأخرى التي غالباً ما ينسى علماء البيانات هي هدف تقديم النموذج: التنبؤ أو التوصية. عادةً ما تستند التوصيات إلى النموذج التنبئي ، ولكن في هذه الحالة ، يجب بناء النموذج التنبئي بشكل خاص ، لأنه من الصعب جدًا العثور على الحد الأدنى من الصندوق الأسود مع تأثيرات غير سارة مفاجئة. إذا تحدثنا عن مقاييس الأداء ، فاعتمادًا على الغرض من التنفيذ:

  • إصدار توقعات ، - تقييم نتيجة تطبيق المعرفة ؛
  • تقديم توصيات - تقييم المقارنة مع العملية القديمة.

الفروق المهمة في مرحلة التنفيذ:

التنفيذ / التدريب


  • معرفة القراءة والكتابة الإحصائية - يكون التنفيذ أكثر نجاحًا عندما يبدأ الموظفون المحليون في العمل بشروط إحصائية صحيحة.
  • الدافع وراء مختلف الوحدات الهيكلية - يجب أن يفهم الجميع سبب حدوث ذلك وألا يخشوا التغيير.
  • التغييرات التنظيمية - سيقوم موظف واحد على الأقل بالاطلاع على نتائج النموذج ، مما يعني أنهم سيغيرون منهجهم في العملية. غالبًا ما يتبين أن الناس ليسوا مستعدين لذلك.

دعم


لا تنس أن الظروف تتغير ويتعين على النموذج "التواء" باستمرار والبحث عن فرص جديدة للتحسين. هنا مهمة:

  • استراتيجيات الإدارة النموذجية وردود الفعل على التنبؤات هي جزء من الترويج الذاتي: لقد فكرنا في Jet Infosystems في هذا الأمر وقمنا بتطوير نظام JET GALATEA الخاص بنا.
  • العامل البشري - المشاكل الرئيسية للنموذج غالباً ما ترتبط باستخدامه ، أو التدخل البشري ، والذي لا يمكن للنموذج التنبؤ به.
  • تحليل منتظم للعمل مع المهنيين من الميدان - من غير المرجح أن يتم تخفيض كل شيء إلى رقم واحد ، مما يشير إلى ما يجب تحسينه ، وسيكون من الضروري تحليل كل توقعات أو توصيات مشكوك فيها. كن مستعدًا لتعلم مهنة أخرى للتحدث بنفس اللغة مع التقنيين ومشغلي الأجهزة في مكان العمل.



بقلم نيكولاي كنيازيف ، رئيس مجموعة تعلم الآلة ، Jet Infosystems

Source: https://habr.com/ru/post/ar476478/


All Articles