🙋🏾 👏 🚜 منظمة العفو الدولية روبوت مع InterSystems IRIS منصة البيانات 🏳️ 🏮 👴🏿

المؤلف: سيرجي لوكيانتشيكوف ، مهندس مبيعات في InterSystems

تحديد المصطلحات

لا يُتوقع أن يكون الروبوت ضخمًا أو إنسانيًا أو حتى مادة (في خلاف مع ويكيبيديا ، على الرغم من أن الأخير يخفف التعريف الأولي في فقرة واحدة ويعترف بالشكل الافتراضي للروبوت). الروبوت هو آلية ، من وجهة نظر حسابية ، آلية للتنفيذ الذاتي (الخوارزمي) لمهام ملموسة. كاشف الضوء الذي يطلق أضواء الشوارع في الليل هو روبوت. يعد برنامج البريد الإلكتروني الذي يفصل رسائل البريد الإلكتروني إلى "خارجي" و "داخلي" روبوتًا أيضًا.

الذكاء الاصطناعي (بالمعنى التطبيقي والضيق ، ويكيبيديا تفسيره بشكل مختلف مرة أخرى) هو خوارزميات لاستخراج التبعيات من البيانات. لن ينفذ أي مهام بمفرده ، لذلك سيحتاج ذلك إلى تنفيذها كعمليات تحليلية ملموسة (بيانات الإدخال ، النماذج الإضافية ، بالإضافة إلى بيانات المخرجات ، بالإضافة إلى التحكم في العملية). يمكن إطلاق العملية التحليلية التي تعمل "حاملة ذكاء اصطناعي" من قبل الإنسان أو بواسطة روبوت. يمكن إيقافه بواسطة أي من الاثنين أيضًا. وتدار من قبل أي منهم أيضا.

التفاعل مع البيئة

يحتاج الذكاء الاصطناعي إلى بيانات مناسبة للتحليل. عندما يبدأ المحلل في تطوير عملية تحليلية ، يعد المحلل نفسه بيانات النموذج. عادةً ما يقوم بإنشاء مجموعة بيانات تحتوي على حجم وميزات كافية لاستخدامها في التدريب والاختبار النموذجيين. بمجرد أن تصبح الدقة (وفي الحالات الأقل تكرارًا ، "الاستقرار المحلي" في الوقت المناسب) للنتيجة التي تم الحصول عليها مرضية ، يعتبر المحلل النموذجي أن عمله قد تم. هل هو على حق؟ في الواقع ، العمل هو نصف فقط. يبقى تأمين "تشغيل متواصل وفعال" للعملية التحليلية - وهذا هو المكان الذي قد يواجه فيه محللنا صعوبات.

الأدوات المستخدمة لتطوير آليات الذكاء الاصطناعي والتعلم الآلي ، باستثناء بعض الحالات البسيطة ، ليست مناسبة للتفاعل الفعال مع البيئة الخارجية. على سبيل المثال ، يمكننا (لفترة قصيرة من الزمن) استخدام Python لقراءة بيانات المستشعر وتحويلها من عملية الإنتاج. لكن بيثون لن تكون الأداة الصحيحة للمراقبة الشاملة للوضع وتبديل التحكم بين العديد من عمليات الإنتاج ، وتوسيع نطاق موارد الحساب المقابلة لأعلى ولأسفل ، وتحليل ومعالجة جميع أنواع "الاستثناءات" (على سبيل المثال ، عدم توفر مصدر بيانات ، فشل البنية التحتية ، وقضايا تفاعل المستخدم ، وما إلى ذلك). للقيام بذلك ، سنحتاج إلى منصة لإدارة البيانات والتكامل. وكلما زاد تحميلنا ، كلما كانت عملية التحليل لدينا أكثر تنوعًا ، كلما تم تعيين أعلى لتوقعاتنا من مكونات تكامل المنصة و "DBMS". سيواجه المحلل الذي يتم تربيته بلغات البرمجة النصية وبيئات التطوير التقليدية لبناء نماذج (بما في ذلك الأدوات المساعدة مثل "أجهزة الكمبيوتر المحمولة") الاستحالة القريبة لتأمين عمليته التحليلية تنفيذًا فعالًا ومنتجًا.

القدرة على التكيف والقدرة على التكيف

تظهر قابلية تغيير البيئة نفسها بطرق مختلفة. في بعض الحالات ، سوف يغير جوهر وطبيعة الأشياء التي تديرها الذكاء الاصطناعي (على سبيل المثال ، دخول مؤسسة ما إلى مجالات أعمال جديدة ، والمتطلبات التي تفرضها الجهات التنظيمية الوطنية والدولية ، وتطور تفضيلات العملاء ذات الصلة بالمشروع ، وما إلى ذلك). في الحالات الأخرى - سيختلف توقيع المعلومات للبيانات الواردة من البيئة الخارجية (على سبيل المثال ، المعدات الجديدة المزودة بأجهزة استشعار جديدة ، وقنوات نقل بيانات أكثر فاعلية ، وتوافر تكنولوجيات جديدة "لتوسيم البيانات" ، وما إلى ذلك).

هل يمكن للعملية التحليلية "إعادة اختراع نفسها" مع تغير بنية البيئة الخارجية؟ دعونا نبسط السؤال: ما مدى سهولة ضبط العملية التحليلية إذا تغيرت بنية البيئة الخارجية؟ استنادًا إلى تجربتنا ، فإن الإجابة التالية واضحة وصاحبة: في معظم التطبيقات المعروفة (وليس من جانبنا!) سيكون مطلوبًا على الأقل إعادة كتابة العملية التحليلية ، وعلى الأرجح إعادة كتابة الذكاء الاصطناعي الذي يحتوي عليه. حسنًا ، قد لا تكون إعادة الكتابة من البداية إلى النهاية هي الحكم النهائي ، ولكن قد تكون هناك حاجة بالفعل إلى إجراء البرمجة لإضافة شيء يعكس الواقع الجديد أو تغيير "جزء النمذجة". ويمكن أن يعني ذلك النفقات العامة الباهظة - خاصة إذا كانت التغيرات البيئية متكررة.

وكالة: الحد من الحكم الذاتي؟

ربما لاحظ القارئ بالفعل أننا نسير في اتجاه واقع أكثر تعقيدًا يقترح الذكاء الاصطناعي. مع الأخذ في الاعتبار "عواقب جانب الصك" المحتملة. على أمل أن نتمكن في النهاية من توفير استجابة للتحديات الناشئة.

إننا نقترب الآن من ضرورة تزويد العملية التحليلية بمستوى من الاستقلال الذاتي بحيث يمكنها التعامل ليس فقط مع إمكانية تغيير البيئة ، ولكن أيضًا مع عدم التأكد من حالتها. لا يُقصد هنا الإشارة إلى الطبيعة الكمية للبيئة (سنناقشها في أحد منشوراتنا الأخرى) ، فنحن ببساطة ننظر في احتمال أن تواجه عملية تحليلية الحالة المتوقعة في الوقت المتوقع في "المجلد" المتوقع. على سبيل المثال: "فكرت" العملية بأنها ستتمكن من إكمال نموذج تدريبي للتشغيل قبل وصول بيانات جديدة لتطبيق النموذج عليها ، ولكن "فشلت" في إكماله (على سبيل المثال ، لعدة أسباب موضوعية ، تضمنت عينة التدريب المزيد سجلات من عادة). مثال آخر: أضاف فريق وضع العلامات مجموعة من الصحافة الجديدة في هذه العملية ، وتم تدريب نموذج مكافحة الاتجاه باستخدام هذه المادة الجديدة ، في حين أن الشبكة العصبية لا تزال تستخدم الموجه السابق وتتعامل مع بعض المعلومات ذات الصلة "بالضوضاء". تُظهر تجربتنا أن التغلب على مثل هذه المواقف يتطلب تقسيم ما كان في السابق عملية تحليلية واحدة في العديد من المكونات المستقلة وإنشاء كل عامل ناتج يعالج "الإسقاط المخزن" للبيئة. دعنا نسمي هذا الإجراء (وداعا ، ويكيبيديا) وكيل لعملية تحليلية. ودعونا ندعو وكالة الجودة التي اكتسبتها عملية تحليلية (أو بالأحرى إلى نظام العمليات التحليلية) بسبب وكيل.

مهمة للروبوت

في هذه المرحلة ، سنحاول الخروج بمهمة تحتاج إلى الذكاء الاصطناعي الآلي مع كل الصفات المذكورة أعلاه. لن يستغرق الأمر رحلة طويلة للوصول إلى الأفكار ، خاصةً بسبب مجموعة كبيرة من الحالات والحلول المهمة للغاية لتلك الحالات المنشورة على الإنترنت - سنقوم ببساطة بإعادة استخدام إحدى هذه الحالات / الحلول (للحصول على كل من المهمة وصياغة الحل). السيناريو الذي اخترناه يدور حول تصنيف المنشورات ("التغريدات") في شبكة Twitter الاجتماعية ، استنادًا إلى شعورهم. لتدريب النماذج ، لدينا عينات كبيرة من التغريدات "المميزة" (أي مع تحديد المشاعر) ، بينما سيتم إجراء التصنيف على التغريدات "غير المعلمة" (أي بدون تحديد المعنويات):

الشكل 1 الشكل 1. صياغة النص القائم على المعنويات (تحليل المشاعر) صياغة المهمة

يتم تقديم طريقة لإنشاء نماذج رياضية قادرة على التعلم من النصوص ذات التسمية وتصنيف النصوص غير المسماة مع مشاعر غير معروفة ، في مثال رائع منشور على الويب.

تم إتاحة بيانات السيناريو الخاص بنا على الويب.

مع وجود كل ما سبق في أيدينا ، يمكن أن نبدأ في "تجميع روبوت" - ومع ذلك ، نفضل تعقيد المهمة الكلاسيكية عن طريق إضافة شرط: يتم تغذية كل من البيانات المصنفة وغير المُعلَّمة على العملية التحليلية كملفات ذات حجم قياسي كعملية "يستهلك" الملفات التي تم تغذيتها بالفعل. لذلك ، سيحتاج روبوتنا إلى بدء التشغيل بأقل قدر ممكن من بيانات التدريب وتحسين دقة التصنيف باستمرار من خلال تكرار التدريب النموذجي على وحدات تخزين البيانات المتنامية تدريجياً.

إلى ورشة عمل InterSystems

سوف نوضح ، مع أخذ السيناريو الذي تم صياغته للتو كمثال ، أن InterSystems IRIS و ML Toolkit ، وهي مجموعة من الامتدادات ، يمكنهما تحسين الذكاء الاصطناعي. وحقق تفاعلًا فعالًا مع البيئة الخارجية للعمليات التحليلية التي نقوم بإنشائها ، مع إبقائها قابلة للتكيف والتكيف والعامل ("الثلاثة أ").

دعونا نبدأ مع وكالة. نقوم بنشر أربع عمليات أعمال في النظام الأساسي:

الشكل 2 الشكل 2. تكوين نظام قائم على الوكيل من العمليات التجارية مع عنصر للتفاعل مع بيثون

GENERATOR - كما تستهلك العمليات الأخرى الملفات التي تم إنشاؤها مسبقًا ، يقوم بإنشاء ملفات جديدة مع إدخال البيانات (المسمى - التغريدات الإيجابية والسلبية - بالإضافة إلى التغريدات غير المسماة)
BUFFER - كما يتم بالفعل تخزين السجلات المخزنة مؤقتًا بواسطة العمليات الأخرى ، وقراءة السجلات الجديدة من الملفات التي أنشأها GENERATOR وحذف الملفات بعد قراءة السجلات منها
ANALYZER - يستهلك سجلات من المخزن المؤقت غير المُعلَّم وينطبق عليها RNN المدربين (الشبكة العصبية المتكررة) ، وينقل السجلات "المطبقة" مع إضافة قيم "احتمال أن تكون إيجابية" المضافة إليها ، إلى المخزن المؤقت للمراقبة ؛ يستهلك سجلات من المخازن المؤقتة (الإيجابية والسلبية) ويدرب الشبكة العصبية بناءً عليها
MONITOR - يستهلك السجلات التي تمت معالجتها ونقلها إلى المخزن المؤقت بواسطة ANALYZER ، وتقييم مقاييس الخطأ في التصنيف التي أظهرتها الشبكة العصبية بعد التدريب الأخير ، وإطلاق تدريب جديد بواسطة ANALYZER

يمكن توضيح نظام العمليات القائم على الوكيل لدينا على النحو التالي:

الشكل 3: تدفقات البيانات في النظام القائم على الوكيل

جميع العمليات في نظامنا تعمل بشكل مستقل عن بعضها البعض ولكنها تستمع إلى إشارات بعضها البعض. على سبيل المثال ، إشارة إلى عملية GENERATOR لبدء إنشاء ملف جديد مع السجلات هو حذف الملف السابق بواسطة عملية BUFFER.

الآن دعونا نلقي نظرة على القدرة على التكيف. يتم تنفيذ تكيف العملية التحليلية في مثالنا من خلال "تغليف" الذكاء الاصطناعي كعنصر مستقل عن منطق عملية الناقل والتي تكون وظائفها الرئيسية - التدريب والتنبؤ - معزولة عن بعضها البعض:

الشكل 4 الشكل 4: عزل الوظائف الرئيسية لمنظمة العفو الدولية في عملية تحليلية - التدريب والتنبؤ باستخدام النماذج الرياضية

نظرًا لأن الجزء المذكور أعلاه من عملية ANALYZER يعد جزءًا من "الحلقة اللانهائية" (التي يتم تشغيلها عند بدء تشغيل العملية وتعمل حتى يتم إيقاف تشغيل النظام القائم بالكامل على الوكيل) ، وحيث يتم تنفيذ وظائف AI بشكل متزامن ، العملية قادرة على تكييف استخدام الذكاء الاصطناعى مع الموقف: نماذج التدريب إذا دعت الحاجة ، والتنبؤ على أساس النسخة المتاحة من النماذج المدربة ، وإلا. تتم الإشارة إلى الحاجة إلى تدريب النماذج من خلال عملية MONITOR التكيفية التي تعمل بشكل مستقل عن عملية ANALYZER وتطبق معاييرها لتقدير دقة النماذج المدربة بواسطة ANALYZER:

الشكل 5. التعرف على نوع النموذج وتطبيق مقاييس الدقة المعنية من خلال عملية المراقبة

نواصل مع القدرة على التكيف. عملية تحليلية في InterSystems IRIS هي عملية أعمال لها تمثيل رسومي أو XML في شكل سلسلة من الخطوات. يمكن أن تكون الخطوات بدورها تتابعًا للخطوات الأخرى والحلقات وفحوصات الحالة وعناصر تحكم العملية الأخرى. يمكن للخطوات تنفيذ التعليمات البرمجية أو نقل المعلومات (يمكن أن تكون رمزًا أيضًا) للمعالجة بواسطة عمليات وأنظمة خارجية أخرى.

إذا كانت هناك حاجة لتغيير عملية تحليلية ، فلدينا إمكانية للقيام بذلك إما في محرر الرسومات أو في IDE. يتيح تغيير العملية التحليلية في المحرر الرسومي تكييف منطق العملية دون برمجة:

الشكل 6: عملية ANALYZER في المحرر الرسومي مع فتح القائمة لإضافة عناصر التحكم في العملية

أخيرًا ، إنه تفاعل مع البيئة. في حالتنا ، فإن أهم عنصر في البيئة هو مجموعة الأدوات الرياضية Python. للتفاعل مع Python و R ، تم تطوير الامتدادات الوظيفية المقابلة - Python Gateway و R Gateway . تمكين التفاعل المريح مع مجموعة أدوات ملموسة هي وظيفتها الرئيسية. يمكننا بالفعل رؤية مكون التفاعل مع بيثون في تكوين نظامنا القائم على الوكيل. لقد أثبتنا أن العمليات التجارية التي تحتوي على الذكاء الاصطناعي المنفذة باستخدام لغة بيثون ، يمكن أن تتفاعل مع بيثون.

تحمل عملية ANALYZER ، على سبيل المثال ، وظائف التدريب والتنبؤ النموذجية المطبقة في InterSystems IRIS باستخدام لغة Python ، كما هو موضح أدناه:

الشكل 7 نموذج التدريب وظيفة تنفيذها في عملية ANALYZER في InterSystems IRIS باستخدام بيثون

كل خطوة من الخطوات في هذه العملية مسؤولة عن تفاعل محدد مع Python: نقل بيانات الإدخال من سياق IRS InterSystems إلى سياق Python ، ونقل التعليمات البرمجية للتنفيذ إلى Python ، وإرجاع بيانات المخرجات من سياق Python إلى سياق IRS InterSystems .

أكثر أنواع التفاعلات المستخدمة في مثالنا هو نقل الكود للتنفيذ في بيثون:

الشكل 8: رمز Python الذي تم نشره في عملية ANALYZER في InterSystems ، يتم إرسال IRIS للتنفيذ إلى Python

في بعض التفاعلات ، يتم إرجاع بيانات المخرجات من سياق Python إلى سياق InterSystems IRIS:

شكل 9 تتبع مرئي لجلسة عملية ANALYZER مع معاينة المخرجات التي تم إرجاعها بواسطة Python في إحدى خطوات العملية

إطلاق الروبوت

إطلاق الروبوت هنا في هذه المقالة؟ لماذا لا ، هنا هو التسجيل من خلال ندوة الويب لدينا التي (إلى جانب غيرها من قصص الذكاء الاصطناعي المثيرة للاهتمام ذات الصلة بالروبوتية!) تم عرض المثال الذي تمت مناقشته في مقالتنا. الوقت المحدد للندوة عبر الإنترنت محدود دائمًا ، لسوء الحظ ، وما زلنا نفضل عرض عملنا بشكل توضيحي ولو لفترة وجيزة قدر الإمكان - وبالتالي فإننا نشارك أدناه نظرة عامة أكثر اكتمالا عن المخرجات المنتجة (7 دورات تدريبية ، بما في ذلك التدريب الأولي ، بدلاً من مجرد 3 في الندوة):

الشكل 10: الروبوت يصل إلى AUC ثابت فوق 0.8 عند التنبؤ

تتماشى هذه النتائج مع توقعاتنا البديهية: حيث تمتلئ مجموعة البيانات التدريبية بتغريدات إيجابية وسلبية "معنونة" ، تتحسن دقة نموذج التصنيف الخاص بنا (وهذا يثبت من خلال الزيادة التدريجية في قيم AUC الموضحة عند التنبؤ).

ما هي الاستنتاجات التي يمكن أن نقدمها في نهاية المقال:

• InterSystems IRIS هي عبارة عن منصة قوية لروبوتية العمليات التي تنطوي على الذكاء الاصطناعي

• يمكن تنفيذ الذكاء الاصطناعي في كل من البيئة الخارجية (على سبيل المثال ، Python أو R مع وحداتهم التي تحتوي على خوارزميات جاهزة للاستخدام) وفي نظام InterSystems IRIS (باستخدام مكتبات الوظائف الأصلية أو عن طريق كتابة خوارزميات بلغات Python و R). InterSystems IRIS يؤمن التفاعل مع مجموعات أدوات AI الخارجية مما يسمح بدمج قدراتها مع وظائفها الأصلية

• InterSystems IRIS تقوم بتطبيق AI من خلال تطبيق "three A": العمليات التجارية القابلة للتكيف والتكيف والوكيل (أو العمليات التحليلية الأخرى)

• InterSystems IRIS تقوم بتشغيل AI خارجي (Python، R) عبر مجموعات من التفاعلات المتخصصة: نقل / إرجاع البيانات ، نقل الكود للتنفيذ ، إلخ. يمكن أن تتفاعل عملية تحليلية واحدة مع عدة مجموعات أدوات رياضية

• توحيد InterSystems IRIS على بيانات نمذجة المدخلات والمخرجات على منصة واحدة ، وتحافظ على تاريخ الحسابات وإصدارها

• بفضل InterSystems IRIS ، يمكن استخدام الذكاء الاصطناعي كآليات تحليلية متخصصة أو مدمجة في OLTP وحلول التكامل

بالنسبة لأولئك الذين قرأوا هذه المقالة والمهتمين بقدرات InterSystems IRIS كمنصة لتطوير ونشر آليات التعلم الآلي والذكاء الاصطناعي ، فإننا نقترح مناقشة إضافية للسيناريوهات المحتملة ذات الصلة بشركتك ، وتعريفًا تعاونيًا من الخطوات التالية. البريد الإلكتروني للاتصال بفريق الخبراء AI / ML لدينا هو MLToolkit@intersystems.com .

منظمة العفو الدولية روبوت مع InterSystems IRIS منصة البيانات