كيفية تحديد المخاطر في سيطرة الدولة ولماذا لهذا التعلم الآلي



في المقالة السابقة حول موضوع إدارة مخاطر الدولة ، استعرضنا الأساسيات: لماذا يجب على سلطات الدولة إدارة المخاطر ، وأين تبحث عنها ، وما هي طرق التقييم. سنتحدث اليوم عن عملية تحليل المخاطر: كيفية تحديد أسباب حدوثها وتحديد المخالفين.

تقييم المخاطر


لتقييم المخاطر - حتى في إطار نهج ثابت ، على الرغم من الديناميكية - تحتاج إلى معرفة أسبابه وظروف حدوثه وتحديد الخصائص الرئيسية: الاحتمالية والضرر المحتمل من التنفيذ.

خذ على سبيل المثال ، التخليص الجمركي: عند استيراد أي منتج إلى البلد باستثناء مجموعة متنوعة من المعلومات المختلفة (التكلفة ، الوزن ، التغليف ، المرسل ، المستلم ، إلخ) ، يجب أن يتم الإعلان في الإعلان وفقًا لتصنيف خاص - تسمية السلع للنشاط الاقتصادي الأجنبي (TN FEA). ثم يحدد هذا الرمز للسلع الرسوم وفقًا للتعريفة الجمركية (أسعار TN FEA +).

التعريفة الجمركية مصنفة معقدة: للوهلة الأولى ، يمكن أن تعزى بعض السلع إلى رموز مختلفة بمعدلات رسوم مختلفة. على سبيل المثال ، يمكنك التعامل مع معدات التعدين المعقدة فقط من خلال الخوض في رسوماتها. ومن هنا يغري المستورد بإعلان الكود الخاطئ (ولكنه مشابه للحقيقة) من أجل دفع أموال أقل للميزانية.

لذلك حددنا الخطر - بيان رمز منتج غير موثوق به في الإعلان من أجل تقليل المدفوعات الجمركية. والسبب هو وجود وظائف "حدودية" بمعدلات رسوم مختلفة في المصنف.

من الأصعب اكتشاف ظروف حدوث مثل هذا الخطر - متى وبأي البضائع يحدث في الممارسة. للقيام بذلك ، تحتاج إلى إجراء تحليل للمخاطر : لدراسة تاريخ ملاحظات عناصر التحكم ، ومعرفة متى وأعلن رمز المنتج الخطأ ، وتحديد بعض الخصائص العامة لهذه الحالات. سيجعل هذا من الممكن صياغة قواعد لإدارة المخاطر في المستقبل: أي الأشياء التي سننسبها إلى المخاطر وما هي المراجعة التي سنخضع لها.

أسهل طريقة للحصول على هذه القواعد هي الثقة في حكم الخبراء لموظفيك.

قواعد الخبراء


هذه القواعد لتحديد المخاطر هي متخصصين في الموضوع. إنهم يسترشدون بخبراتهم العملية أو يلخصون آراء الزملاء الذين يواجهون المخالفين كل يوم. والنتيجة هي أحكام بسيطة من النموذج "إذا ... ثم ...".

يتم تحديد احتمالية حدوث المخاطر والضرر المحتمل من التهديد في هذه الحالة "بالعين" أو بالتقديرات التقريبية.

ميزة القواعد الخبيرة هي سهولة تجميعها وتفسيرها من قبل الإنسان. العيب هو أن عددًا كبيرًا من الأشخاص ، سواء المخالفين أو الأشخاص المحترمون للنشاط الاقتصادي ، يمكن أن يقعوا في نفس الوقت تحت القاعدة. لذلك ، ستكون فعالية التحكم منخفضة. في الوقت نفسه ، سيمر بعض المخالفين ، حيث لم يتمكن الخبير من اكتشاف الأنماط ومراعاتها.

على سبيل المثال ، تخبرنا قاعدة خبراء للرقابة الجمركية أن جميع دفعات التفاح التي تقل قيمتها عن حد معين تتعلق بتسليم المخاطر:



عندما ننفذ السيطرة ، سنجد كلًا من السلع ذات المخالفات (الحمراء) والتسليم العادي تمامًا (الأخضر) ، والتي يتم تفسير تكلفتها المنخفضة من خلال الخصومات الفردية ، أو صراع المرسل مع المخزون الزائد أو النموذج الاقتصادي للمؤسسات.

أي شيء أعلى من هذه القيمة الشرطية (الخط الأحمر) سيكون خارج نطاق السيطرة (الدوائر الرمادية). ولكن إذا تحققنا منها أيضًا ، فسوف نجد كلاً من عمليات التسليم والتسليم المشروعة بالفعل والتي تكون قيمتها الحقيقية أعلى مما ورد في الإعلان (الدوائر الرمادية ذات الخطوط الحمراء المتقطعة) والتي لا يتم دفع المدفوعات الجمركية مقابلها بالكامل.

لذلك ، يؤدي تطبيق قواعد الخبراء عادة إلى تغطية مفرطة لعناصر التحكم والأداء المنخفض (تذكر ، مربعاتنا من المقالة الأولى؟):



لا يجب إلقاء اللوم على الخبراء: إن الوعي البشري محدود في الأشياء التي يمكن أن يعمل بها (تم نشر مقال غريب على هابر مرة ، اقترح مؤلفه أن عددهم يقتصر على سبعة). ومن ثم فإن الضربات الكبيرة بدلاً من التفاصيل الدقيقة: دعنا نقول ، يتم تحديد خطر الحريق فقط في العام الذي تم فيه بناء المبنى ، ومنطقة الموقع وفئة السكان. كل هذه الخصائص "لعبت" مرة واحدة: شب حريق في منزل قديم ، اشتعلت النيران في غرفة في منطقة مختلة. لذلك ، يتوقع الخبراء التهديدات المستقبلية بدقة من أشياء من هذا النوع.

لكن ليست كل هذه المباني "الخطيرة" ستحترق بالفعل ، حتى لو كانت تقع تحت قاعدة الخبراء: العديد من المنازل القديمة والخشبية تقف كما لو لم يحدث شيء. ظلت بعض المنازل المختلة تعمل بدون حريق منذ سنوات. إنه فقط لا يمكن للخبير أن يأخذ في الاعتبار بعض الخصائص الفردية الدقيقة للأشياء الخطرة.

هنا يأتي دور التعلم الآلي الذي يساعد في إنشاء ملفات تعريف إحصائية للمخاطر . يتم تشكيلها عندما نطبق تقنيات تحليل البيانات على تاريخ الانتهاكات والمعلومات حول الأشياء الخاضعة للرقابة.

الملامح الإحصائية الإحصائية


في هذه الحالة ، نحل مشكلة التصنيف الثنائي: تحدد خوارزمية تحليلية متخصصة في حد ذاتها خصائص الكائنات التي تجعل من الممكن نسبها إلى "سيئة" أو "جيدة". إذا تم عمل كل شيء بشكل صحيح ، فسوف نحصل في النهاية على تقييمات دقيقة للمخاطر إلى حد ما: الشروط التفصيلية والاحتمال المحسوب تلقائيًا بالإضافة إلى الضرر المحتمل (والذي يتم تحديده بطريقة أو بأخرى من خلال "نهج خبير" بطريقة ما) تحدد هذه الخصائص "موجز المخاطر" - ماذا وأين ومتى وكيف مخيف.

يتم إنشاء ملفات تعريف المخاطر الإحصائية بطرق مختلفة. قد تكون قائمة على شجرة قرار أو غابة عشوائية. يمكنك تطبيق شبكة عصبية صعبة مع عدد كبير من الطبقات المخفية.

لكننا في SAS نعتقد أنه لأغراض السيطرة على الدولة ، من الأفضل إنشاء ملفات تعريف إحصائية للمخاطر تستند إلى خوارزميات مفسرة ، على سبيل المثال ، الانحدار أو شجرة القرار . وقد أظهرت الممارسة أنه من الصعب على هيئة الدولة توجيه نفسها حتى لو كانت توقعات دقيقة ولكنها غير مفهومة للآلة ، إذا لم تفسر سبب تمييز هذا الشخص المحترم على أنه شرير.

تحتاج وكالة الدولة إلى أن تفهم بالضبط العوامل التي تشير إلى التهديد وأي من المخالفين له نفس الخصائص ، حيث توجد إجراءات للموافقة على القرارات الإدارية (حالة معينة منها ملفات تعريف المخاطر). يجب أن يفهم المسؤول بالضبط ما أطلقه "في المعركة" ، لأنه مسؤول عن نتيجة ملف تعريف المخاطر.

يجب تبرير أي تحقق ويجب التعبير عن هذا التبرير بالكلمات. وبخلاف ذلك ، عليك أن تحمر أمام المدعي العام وتشرح كيف اتضح أن وكالة الدولة "تضغط" على الأعمال التجارية المحلية على أساس التعليمات الغامضة التي تنطوي عليها الآلة.

لذلك ، يبدو ملف تعريف المخاطر الإحصائية أيضًا كقاعدة يمكن قراءتها وفهمها. قائمة الخصائص التي تصف المخالفين المحتملين فقط هي الأكبر والأكثر تعقيدًا من الملفات الشخصية للخبراء:


* يتم تغيير قيم معلمات الملف الشخصي ولا تتوافق مع القيم الحقيقية

قد تبدو مجموعة من مؤشرات المخاطر (الظروف) غريبة بعض الشيء. لكن هذه ليست "شعوذة عظيمة" - ببساطة بمساعدة تقنيات التعلم الآلي والمعلومات المحدودة التي لدينا ، نحن نصف بعض أنماط السلوك البشري الخفية التي تؤدي إلى الاضطراب.

وينطبق الشيء نفسه على الرقابة الضريبية - يمكن للمخالفين التمييز بين الكتلة الإجمالية لدافعي الضرائب نطاقات معينة من مبالغ معاملات معينة ، والمواعيد النهائية لتقديم الإقرارات ، وعدد الموظفين في موظفي الشركة ، وعدد الحسابات ومجموعة أخرى من 30 معلمة مختلفة تصف مجتمعة رجال الأعمال عديمي الضمير الذين يقللون من ضريبة القيمة المضافة.

لن يتمكن الشخص من مقارنة كل هذه الخصائص ، وسيديره بثلاث أو خمس ، وهي أسهل في الفهم. ويمكن للبرنامج. كما هو مفصل على النحو المطلوب. عند بناء نموذج ، تتكرر الخوارزمية تلقائيًا عبر كتلة من البيانات وتكتشف ما هو مشترك بين الجناة - حتى لو كان حبًا للعلاقات الحمراء في شبكة صفراء.

وهذا مشابه لوصف المجرم في سماته الفردية: شكل الأنف والأذنين وانحناء الحاجبين وألوان القمصان وطول القدم. لا نعرف وجهه وطوله ووزنه ، لكن لدينا آلاف من خصائصه ، بما في ذلك طول الشعر على كتيبة الإصبع الأيسر الأيسر. لا تعطي كل من هذه المعلمات بشكل فردي نوايا إجرامية - لا تحتاج إلى تقييد شخص فقط من أجل نصف قطر انحناء أذنيه. لكن المجموعة الكاملة من هذه الخصائص معًا تشكل صورة دقيقة إلى حد ما للدخيل:



عندما ننتقل من تطبيق قواعد الخبراء إلى التنميط الإحصائي بناءً على تحليل الأنماط المخفية ، نتخلص من عمليات التحقق غير الفعالة عمداً. يضيق المجال الضخم للتحكم المستمر إلى نقطة تأثير على الأشياء التي تقع تحت النمط الموضح للسلوك غير العادل .

أذكر التفاح من المثال الجمركي أعلاه. من خلال تقديم تاريخ الشيكات إلى مدخل النموذج الإحصائي ، نحصل على ملف تعريف للمخاطر يأخذ في الاعتبار الخصائص السلوكية للمستوردين المخالفين ، بغض النظر عن السعر الذي يصرحون فيه عن السلع:


* تم تغيير مجموعة معلمات ملف تعريف المخاطر ولا تتوافق مع المعلمة الحقيقية

هذه هي الطريقة التي يتم بها بناء ملف تعريف المخاطر الإحصائية باستخدام خوارزميات فئة "شجرة القرار" - يفصل كل مستوى منها أكثر فأكثر مجموعة الكيانات المختبرة إلى "جيد" و "سيئ" ويظهر أي خصائص الفصل تبين أنها الأكثر أهمية (في لقطة شاشة الإحصائيات المرئية لـ SAS):



إن الملامح الإحصائية أفضل من الخبراء - بشكل أكثر دقة وأكثر انتقائية ونزيهة. تساعد على زيادة فعالية عمليات التفتيش من خلال تقليل عدد "التدريبات" الخاملة:



عيب الملفات الإحصائية هو أنها تسترشد بالتجربة السابقة في تحديد الانتهاكات. لمخططات معروفة.

إذا كانت هناك في تاريخ الرقابة الجمركية حالات تقلل من قيمتها عند استيراد البضائع ، فستجد الخوارزمية علامات المخالفين وتشكل ملفًا إحصائيًا للمخاطر. إذا كنا نبحث عن انتهاك جديد لم يلفت انتباه وكالة الدولة بعد ، ولا نعرف خصائصه ، فعلينا أن نتصرف "عن طريق اللمس" - عن طريق التجربة والخطأ.

بحث غير معروف


يمكنك أن تشعر بالمجهول بعدة طرق.

الأول هو أخذ عينات عشوائية . نأخذ كائنًا تعسفيًا (ضمن سلطاتنا) - منتجًا أو مؤسسة أو مبنى أو مواطنًا - وننظر فيه بعناية. هذا النهج غير متحيز إلى حد ما ، ولكنه ليس فعالًا جدًا - يمكن أن يخضع الموضوع المحترم أيضًا إلى "استخلاص المعلومات". سيتم إنفاق قوة وكالة الدولة وأموال الميزانية عبثا.

والثاني هو تحديد الشذوذ . في هذه الحالة ، يتم أخذ كائن للتحقق ، ويتم تمييز معلماته عن الباقي. عندما نحلل الأحداث الشاذة ، وليس فقط "كزة" عشوائية حفنة من الأشياء ، فإن احتمال العثور على انتهاك أعلى.

على سبيل المثال ، عند إجراء الإشراف البيئي ، اتضح أن المصنع يستهلك الكثير من الكهرباء بشكل غير متوقع:



ربما يجدر إلقاء نظرة فاحصة عليه والتحقق مما إذا كان النبات لا يفرغ في الماء أو الهواء أكثر من المسموح به.

أو البضائع في الجمارك لديها نسبة غير عادية من وزن البضائع والتغليف:



بعد التحقق ، قد يتبين أن المستورد "لعب" بالوزن من أجل التستر على بعض المخالفات: التقليل من التكلفة وبالتالي أراد تشديد إحدى قيم الاختبار أو إصدار بعض السلع تحت ستار الآخرين. تختلف خصائص الوزن "الطبيعية" ، إذا قمت بالحفر جيدًا ، عن الخصائص الوهمية.

ومع ذلك ، فهذه هي أبسط الأمثلة التي يمكن للشخص رؤيتها. في الواقع ، يحدث البحث عن الحالات الشاذة في مساحة متعددة الأبعاد من السمات - يمكن أن يكون هناك المئات منها. تقوم الخوارزمية بما لا يستطيع الإنسان فعله - فهي تجد الأشياء التي تختلف بشكل كبير عن الأشياء الأخرى في نفس الوقت في عدد كبير من العلامات ، وتحدد ما يسمى القيم المتطرفة متعددة الأبعاد (في لقطة شاشة الإحصائيات المرئية SAS):



أيضًا ، خارج حدود الإدراك البشري ، هناك مجموعة متنوعة من العلاقات القانونية بين الشركات المختلفة التي يتم تصورها باستخدام رسم بياني (في لقطة شاشة SAS Social Network Analysis):


* اختراع أسماء المنظمات ، والصدفة مع الشركات الحقيقية عشوائية

لا تشير الخصائص غير العادية بالضرورة إلى وجود مشكلة. قد لا يظهر الشيك أي شيء: نعم ، المؤشرات غريبة ، ولكن لا يوجد انتهاك.

الشذوذ ليس خطرًا ، إنه مجرد "شيء غير عادي". هناك حاجة إلى ملفات تعريف الشذوذ لتوفير "مواد أولية" جديدة لبناء ملامح شخصية أو إحصائية ، حيث يتم تضمين نتيجة التحقق من الشذوذ في تاريخ الملاحظات على الأشياء تحت السيطرة.

نهج هجين


يمكن تحقيق أفضل النتائج في أنشطة المراقبة والإشراف لهيئات الدولة (وليس فقط في ذلك) من خلال الجمع بين الطرق الثلاث لتحديد المخاطر: قواعد الخبراء ، وملامح المخاطر الإحصائية المستندة إلى تقنيات التعلم الآلي والملفات الشاذة. في الوقت نفسه ، من الأفضل تقليل تغطية الأشياء بقواعد الخبراء ، وتركها فقط للتأثيرات الإدارية المستهدفة (على سبيل المثال ، العقوبات المفروضة - نحن نحظر البضائع من هذه البلدان):



لا يمكنك الاستغناء عن قواعد الخبراء في المرحلة الأولى من بناء نظام إدارة المخاطر ، حيث يلزم وجود قاعدة سابقة لإنشاء نماذج تحليلية. لإنشائه ، سيكون من الضروري إجراء عمليات فحص بناءً على ملفات تعريف المخاطر ، ثم الانتقال فقط إلى النماذج الرياضية.

نحن في SAS نؤمن بأن مستقبل سيطرة الدولة ونشاط الرقابة يعتمد على نهج مختلط يجمع بين خبرة هيئات الدولة والمعرفة الخبيرة لموظفيها مع تقنيات التعلم الآلي الحديثة. في هذه الحالة ، قمنا بتقليل نتائج جميع الوحدات الثلاث في تقييم واحد متكامل للمخاطر:



وبالفعل ، فإن التقييم المتكامل (على سبيل المثال ، استنادًا إلى مصفوفة قرارات الخبراء) يحدد اختيار هيئة التحكم - من يجب التحقق منه ومن الذي يثق به.

في المقالة التالية ، سنقوم بتحليل الطرق لتقليل التهديدات المحددة والتفكير في سبب أهمية التغذية الراجعة وإعادة تقييم المخاطر الديناميكية.

Source: https://habr.com/ru/post/ar421677/


All Articles