مقدمة
مرة أخرى أثناء العمل مع شركة تنفذ مشروعًا يتعلق بالتعلم الآلي (ML) ، لاحظت أن المديرين يستخدمون مصطلحات من مجال ML ، ولا يفهمون جوهرها. على الرغم من أن الكلمات يتم نطقها بشكل صحيح نحويًا وفي الأماكن الصحيحة من الجمل ، إلا أن معانيها ليست أكثر وضوحًا من تعيين sepules ، والتي ، كما تعلمون ، تستخدم في sepularia منفصلة. في الوقت نفسه ، يبدو لقادة الفرق والمطورين البسيطين أنهم يتحدثون نفس اللغة مع الإدارة ، مما يؤدي إلى مواقف الصراع التي تعقد العمل في المشروع. لذا ، فإن هذه المقالة مخصصة لتقنيات التيسير (من اللاتينية: التبسيط أو التيسير) لتواصل المطورين مع الإدارة أو كيفية شرح المصطلحات الأساسية ل ML بسهولة وواضحة ، مما يؤدي بمشروعك إلى النجاح. إذا كان هذا الموضوع قريبًا منك ، مرحبًا بك في cat.
إيضاح للمذكرة: Sepuls ، sepulcarius و sepulation هي المصطلحات المستخدمة من قبل الرائد Stanislav Lem في الرحلة 14 من Iyon the Pacific.
بداية المشروع
يجب أن يبدأ مشروع ML بإضفاء الشرعية على مقياس التحقق من الصحة. يبدو مخيفا ، أليس كذلك؟ لنبدأ التفسير. التقنين (باللغة الروسية من اللاتينية هو تقنين) هو مجرد التوصل إلى اتفاق بين الأطراف ، ثابتة في الكتابة وأيد - من المستحسن ، بطبيعة الحال ، أيضا في الكتابة. الأطراف هي الجهة المانحة وإدارة المشروع ، وكذلك منفذيها.
الآن دعنا ننتقل إلى التحقق من الصحة . عادةً ما يكون لدى مبرمج ML خبرة في كتابة رمز التحقق من الصحة ، وعند التتبع ، يرى أنه عاد صحيحًا وخطأًا. ولكن كيف نفسر هذا المفهوم لمدير لا يتعامل مع الكود؟ هيا نستخدم مثال الحياة البسيطة.
تخيل أنك تمر بالسوق وترى: تباع الخوخ. يخبرك البائع: "بيري! "هاروشا بارسيك ، طازج ، كثير العصير ، ني بيتيش". ومع ذلك ، يمكنك إلقاء نظرة فاحصة ونرى: في مكان واحد تفسد. أنت تقول: "حسنًا ، أين هو جيد؟ هذا فاسد ". البائع يقدم نصف السعر. إذا كنت تعتقد: "يمكنك الاستغناء عن الفاسد ، إنه ربع فقط ، يبدو أنه مربح" - وشرائه ، ثم بلغة التحقق من صحة اللغة (ML) والتأكد من صحة الخوخ (في العينة ML العامية). إذا كنت تعتقد أنه يمكنك أن تجد في مكان آخر الأفضل بدلاً من المكان المدلل ، فحينئذٍ تحدث الإعاقة ، ومن المسلم به أن الخوخ غير صالح.
اتضح أنه لا يوجد شيء معقد في التحقق من الصحة ، ونحن جميعًا نقوم بالتحقق من الصحة كل يوم ، ونعترف بشيء واحد على أنه جيد ، أو ملائم لأنفسنا ، أو يبطل ، معترفًا بشيء آخر سيئًا ، وغير مناسب.
ملاحظة إلى إستيتي: فجأة ، فوجئ جوردان عندما علم أن حياته كلها قد تم التعبير عنها في النثر. موليير ، تاجر في النبلاء.
أخيرًا ، يبقى فقط شرح ماهية التحقق من الصحة . دعونا نفكر لماذا قررنا شراء الخوخ من المثال السابق؟
- أنها رخيصة بما فيه الكفاية (السعر <قيمة العتبة)
- أنها ناضجة تمامًا (النضج> قيمة العتبة) ، ولكنها غير ناضجة (النضج أقل من قيمة العتبة الثانية)
- إنه من الحجم الطبيعي ، أي أن حجمه يقع في فئة "طبيعي" (جميع الفئات: صغير جدًا ، صغير ، عادي ، كبير ، ضخم)
- ليس مدللًا بما فيه الكفاية (مساحة المناطق الفاسدة والمفسدة أقل من قيمة العتبة)
كل هذا ، المدرجة أعلاه ، مثال على مقياس التحقق من الصحة الذي يتكون من 4 فئات في هذا المثال. في أبسط الحالات ، عندما تفي الخوخ بجميع المعايير في وقت واحد ، سيتم الاعتراف بها على أنها صالحة ويتم شراؤها.
أصبح من الواضح الآن لماذا من المهم للغاية الاتفاق من البداية ، وكيف سيتم التحقق من الصحة بالضبط ، وعلى عدد المعايير والقيم العتبية التي ستكون جميع الأطراف راضية عنها. قد تحتل أوصاف الإجراءات في حالة الامتثال الجزئي للشروط قسمًا خاصًا.
بطبيعة الحال ، سيكون لكل مشروع ML ، حسب مجال الموضوع ، مقياس التحقق من الصحة الخاص به. تعتبر الوثيقة التي تحدد مقياس التحقق من الصحة مهمة بالنسبة لمشروع ML مثل دستور الولاية.
فقط بعد ظهور المستند أخيرًا في المشروع الذي ينظم مقياس التحقق من الصحة وأصبح متاحًا لجميع المشاركين في المشروع ، هل من المنطقي أن يكتب رمزه. رمز التحقق هو جوهر المشروع ويجب أن تكون جودته لا تشوبها شائبة ، وأي خطأ في هذا الجزء مع وجود درجة عالية من الاحتمال يمكن أن يؤدي إلى انهيار مشروع ML بأكمله.
سر حساب الدقة
أهم مؤشر للحالة الراهنة في مشروع للإدارة هو الدقة . كيف يمكن للمرء ببساطة أن يشرح للمدير ما هو وما هي الإجراءات التي يتعين القيام بها لحساب ذلك؟
نحتاج أولاً إلى شرح ماهية العينة التي تم التحقق منها. في مثالنا ، هذا عندما اشترينا لا خوخ واحد ، ولكن للطن. نجلس أو نوظف العمال ويقومون بفرز الخوخ في حاويتين. النقوش على الحاويات: X (جيدة) و P (سيئة). العمل المنجز عن طريق فرز الخوخ هو إنشاء عينة التحقق من صحتها.
كيف تشرح لماذا هناك حاجة إلى التحقق من صحة عينة؟ تخيل أن لديك أختًا صغيرة وتريد أن تعلمها كيفية اختيار الخوخ. أنت تأخذها إلى السوق وتقول: "تعلم ، شاهد كيف أفعل". عندما يبدو لك أنها تعلمت بالفعل ، فأنت تريد اختبار مهاراتها. كيف نفعل ذلك؟ يمكنك إنشاء نموذج تحكم ، أي كنت تأخذ من الحاويات ، على سبيل المثال ، 100 الخوخ التي تم فرزها بالفعل من كل حاوية ولصق ملصقات سرية عليها بهدوء لمعرفة أي حاوية تم أخذها من نفسك ، ولكن هذا لن يعرف لأختك ، وتشير إلى أنها وضعت بشكل مستقل في حاويات فارغة جديدة. إن النسبة المئوية لمطابقات انتخاب أختك مع الملصقات السرية هي مقياس الدقة. بمعنى آخر ، الدقة هي القيمة الموضوعية لمدى ثقة أختك باختيارك للخوخ. 100 ٪ يعني أنها نسختك سكب ويفعل كل شيء تماما كما تفعل. 0 ٪ - أن رأيها هو بالضبط عكس رأيك.
ملاحظة إلى Esthete: نعم ، أنت على صواب ، مع مرور الوقت ، يمكن أن تبدأ الخوخ في التدهور ويجب أن تأخذ في الاعتبار أنه يجب مراجعة صلاحيتها من وقت لآخر. ويحدث هذا أيضًا في بيانات الكمبيوتر ، على سبيل المثال ، مع خاصية مميزة مثل "الأهمية".
الآن دعونا نلقي نظرة على 4 مؤشرات أداء ML التي يمكن الخلط. هذه هي ايجابية (TP) ، ايجابية كاذبة (FP) ، حقيقية سلبية (TN) وخطيرة سلبية (FN). النصف الأول من الكلمة يعني صدفة (صواب) أو عدم تطابق (خطأ) رأي أختك مع ملصق خوخ سري. يعني النصف الثاني ببساطة الحاوية التي ألقيت فيها أختك الخوخ (X-good - إيجابي ، P - سيء - سلبي). وكلمتين معا هي فقط عدد الخوخ في تلك الفئة.
بالإضافة إلى الدقة ، يتم أيضًا استخدام 3 مؤشرات مساعدة ، وهي الدقة (الدقة) ، الاستعادة (الحساسية) و f1_score.
يظهر Precision النسبة المئوية للتطابق مع رأيك في الخوخ الذي تم إلقاؤه في الحاوية X (جيد) 100 ٪ يعني أن جميع الخوخ التي تعرفت على أنها مناسبة يتم التعرف عليها من قبل أختك. يعني انخفاض القيمة أن تلك التي يتم التعرف على أنها غير صالحة قد دخلت أيضًا في الحاوية X. يكون المؤشر مهمًا عندما يكون من الأهمية بمكان بالنسبة للأعمال التجارية أن الخوخ الذي لا قيمة له لا يدخل في مكان مناسب ، ولكن إذا وجد أن هذا النوع غير مناسب بطريقة خاطئة ، فلا داعي للقلق.
يشير الاستدعاء إلى العلاقة بين الخوخ الجيد المحدد بشكل صحيح (TP) ومجموع هذه القيمة مع الخوخ الجيد الذي يعتبر خطأً غير مناسب (TP + FN). 100٪ تعني أن أختك لا ترمي أبدًا خوخًا جيدًا في سلة بأخرى سيئة وتناقض Precision. هذا المؤشر مهم عندما يكون من الضروري لشركة تجارية أن يكون لها خوخ مناسب نادراً ما يقع في حاوية غير صالحة للاستعمال.
F1 النتيجة هي نتيجة اصطناعية تجمع بين فوائد الدقة والتذكر. إن أهميتها الكبيرة تشهد على توازن التدريب وتشير إلى أن الخوخ الجيد لا يسقط في السلة بأخرى سيئة ، لذلك لا تتسرع تلك السوائل إلى الجيدة.
ملحوظة لـ Esthete: هذا المؤشر هو الوسط التوافقي بين الدقة و الاسترجاع ويتم حسابه بواسطة الصيغة:
f1_score = 2*(recall*precision) / (recall + precision)
يطرح السؤال غالبًا: لماذا يحتاج مدير مشروع ML إلى معرفة وفهم كل هذه المؤشرات بعمق. الإجابة: هذا مهم للأعمال. باعتبارك مدير مزرعة للألبان ، فأنت بحاجة إلى معرفة ما هو محصول الحليب وما هي الصيغة التي يتم اعتبارها ، كمدير للمزرعة تحتاج إلى معرفة ماهية المحصول وكيف يتم حسابه. نعم ، لا يجوز للمدير أن يبحث في كيفية حليب الأبقار ، وكيف تتم العجزة وكيفية معاملتها ، ولكن فهم مؤشرات العمل الرئيسية للمشروع هو مفتاح نجاح الأعمال.
النتائج
كلنا ، المشاركين في مشاريع ML ، يقومون بعمل جيد وضروري. أي منا ، كطالب ، لم يحلم ، وفرز البطاطس والطماطم والملفوف في مزرعة جماعية حتى يقوم الإنسان الآلي بذلك من أجله ، وليس لشخص (ق). نجعل القصة تتحقق وندع مشاريعنا ناجحة. سأكون سعيدًا إذا كانت هذه المقالة تساعد في تقديم مساهمة صغيرة في البداية الناجحة لمشاريع ML.
إذا كانت هذه المقالة مفيدة لك ، فاكتب في التعليقات وسأفعل المقالة الثانية حول كيفية شرح الإضافة والتعميم للإدارة ، هذه الركائز لمشروع ML الصحيح المناسب.