أرسلت بواسطة سيرجي Lukyanchikov ، مهندس استشاري ، InterSystems
اتفق على المصطلحات
لا يجب أن يكون الروبوت كبيرًا أو إنسانيًا أو أساسيًا (إلى ذروة
ويكيبيديا ، ولكن بعد بضع فقرات يخفف الصياغة الأولية ويسمح للروبوت بأن يكون غير مادي). الروبوت هو آلي في المعنى الخوارزمي ، وهو آلي للحل (الخوارزمي) المستقل لبعض المشاكل. كاشف الضوء الذي يضيء الأنوار في المساء هو روبوت. تحليل رسائل البريد الإلكتروني إلى عميل البريد "الخارجي" و "الداخلي" - أيضًا.
الذكاء الاصطناعي (بالمعنى التطبيقي الضيق ،
ويكيبيديا لا تشاركه مرة أخرى) خوارزميات لاستخراج التبعيات من البيانات. لن يحل أي مشاكل في حد ذاته ، لذلك يجب أولاً تنفيذها في شكل عمليات تحليلية محددة (بيانات الإدخال ، النماذج ، بيانات المخرجات ، التحكم في العملية). يمكن أن تبدأ العملية التحليلية التي تعمل "حاملة للذكاء الاصطناعي" من قبل شخص ، ويمكن أن تبدأ بواسطة الروبوت. وتوقف أيضا ، إما واحد أو آخر. وإدارة أيضا.
التفاعل مع البيئة
يحتاج الذكاء الاصطناعي إلى بيانات ، علاوة على ذلك ، في شكل مناسب للتحليل. عندما يبدأ المحلل في تطوير العملية التحليلية ، يتم إعداد البيانات للنموذج بواسطة المحلل نفسه. كقاعدة عامة ، يتم إنشاء مجموعة بيانات كافية في الحجم والنطاق ("مجموعة البيانات") يتم تدريب النموذج عليها واختبارها. بعد الحصول على نتيجة مرضية في الدقة (وفي حالات نادرة أكثر ، "مستقرة محليًا" في الوقت المناسب) ، يعتبر المحلل النموذجي أن عمله قد تم. لكن حقا؟ في الواقع ، هذه ليست سوى نصف المعركة. نحتاج الآن إلى ضمان "التشغيل المتواصل والفعال" للعملية التحليلية - وقد يتسبب ذلك في صعوبات للمحلل.
الأدوات المستخدمة لتطوير آليات الذكاء الاصطناعي والتعلم الآلي ، ما عدا في أبسط الحالات ، ليست مناسبة للتفاعل المثمر مع البيئة الخارجية. أي قد يكون من الممكن إجبار بايثون ، على سبيل المثال ، على قراءة البيانات وتحويلها من أجهزة استشعار في عملية الإنتاج (على الأقل لفترة قصيرة). لكن التبديل بين العديد من عمليات الإنتاج والإدارة ، اعتمادًا على الموقف ، وتوسيع نطاق قوة الحوسبة المقابلة ، والتعامل مع جميع أنواع "الاستثناءات" (عدم إمكانية الوصول إلى أحد مصادر البيانات ، وفشل البنية التحتية ، ومشاكل تفاعل المستخدم ، وما إلى ذلك) - هذا غير مخصص لـ Python . وهذا يتطلب إدارة البيانات والتكامل منصة. وكلما زاد تحميلنا ، كانت تنوعنا التحليلي أكثر تنوعًا ، كلما زاد حاجز متطلبات التكامل ومكونات الحل "الفرعي". يواجه المحلل ، الذي ينجذب إلى آليات الذكاء الاصطناعي ، ويحاول تنفيذ العملية التحليلية من خلال لغة البرمجة في بيئة تصميم النماذج المعتادة (والمرافق التي طورت "من أجله" ، مثل "أجهزة الكمبيوتر المحمولة") ، عدم القدرة على تزويد عمليته التحليلية باستخدام منتج مثمر.
القدرة على التكيف والقدرة على التكيف
تظهر تقلبات البيئة بطرق مختلفة. في بعض الحالات ، سيتغير جوهر وطبيعة الظواهر التي يتحكم فيها الذكاء الاصطناعي (إدخال مؤسسة في مجالات جديدة من الأعمال ، ومتطلبات الهيئات التنظيمية الوطنية والدولية ، وتطور تفضيلات المستهلكين لمنتجات المؤسسة ، وما إلى ذلك). في حالات أخرى ، طبيعة البيانات الواردة من البيئة (معدات جديدة مزودة بأجهزة استشعار جديدة ، قنوات نقل بيانات أكثر كفاءة ، وتوافر تكنولوجيات جديدة لبيانات "تمييز" ، وما إلى ذلك).
هل يمكن للعملية التحليلية "إعادة بناء نفسها" عند تغيير بنية البيئة؟ لتبسيط السؤال: ما مدى سهولة إعادة بناء العملية التحليلية عند تغيير بنية البيئة؟ من ملاحظاتنا ، الإجابة بسيطة وحزينة: في معظم التطبيقات (وليس تنفيذنا!) المعروفة لنا ، سيتعين علينا إعادة كتابة العملية التحليلية على الأقل - وغالباً ما تكون الذكاء الاصطناعي المتضمن فيها. قد لا تتم إعادة كتابة حرفيًا من "الدخول إلى الخروج" لإعادة الكتابة ، ولكن سيتعين عليك إضافة شيء ما إلى البرمجة لمعالجة حقائق جديدة ، وتغيير المنطق الداخلي "لعملية تطبيق النماذج" نفسها ، إلخ. وهذا يمكن أن يؤدي إلى عمل باهظ الثمن - خاصة إذا كانت البيئة تتغير بشكل حيوي.
وكالة: الحد من الحكم الذاتي؟
كما لاحظ القارئ على الأرجح بالفعل ، نحن نتحرك نحو زيادة في تعقيد الواقع المقدم لعناية الذكاء الاصطناعي. ونحن نحتفل العواقب المحتملة ل "جزء فعال". على أمل أن نتمكن في النهاية من العثور على إجابة لجميع التحديات التي تنشأ.
لقد اقتربنا من الحاجة إلى تزويد العملية التحليلية بدرجة من الاستقلالية بحيث تكون قادرة على التعامل ليس فقط مع تقلب البيئة ، ولكن أيضًا مع عدم اليقين في حالتها. لا يتعلق الأمر بالطبيعة الكمومية للبيئة (على الرغم من أننا سنتحدث عن ذلك في أحد المنشورات التالية) ، إنه يتعلق فقط باحتمال الحصول على الحالة المتوقعة من خلال العملية التحليلية في الوقت الذي تتوقعه وفي "الحجم" المتوقع. على سبيل المثال: "اعتقدت" العملية بأنها ستدار بالتدريب التالي للنموذج حتى وصول بيانات جديدة لتطبيق النموذج ، لكنها لم "تدير" (لأسباب موضوعية ، تم إدخال المزيد من السجلات في مجموعة التدريب أكثر من المعتاد ، وتم تأخير التدريب النموذجي). أو بخلاف ذلك: أضافت المجموعة الترميزية ضغطًا جديدًا إلى العملية ، وقد تم بالفعل تدريب نموذج التوجيه على مواد نصية جديدة ، وما زالت الشبكة العصبية تعمل على التوضيح القديم وترسل معلومات جديدة مهمة للغاية إلى "الخردة". للتعامل مع مثل هذه المواقف ، كما توضح ممارستنا ، يمكنك فقط تقسيم العملية التحليلية الموحدة سابقًا إلى عدة مكونات تعمل بشكل مستقل وإنشاء "الإسقاط المؤقت الخاص" بالبيئة لكل عملية وكيل مستلمة. سيطلق على هذا الإجراء (وداعا ، ويكيبيديا) تسيير العملية التحليلية. والجودة التي تنقلها الوكالة إلى العملية التحليلية (كقاعدة عامة ، للنظام بأكمله الذي يتكون من عدة عمليات في آن واحد) تسمى الوكالة.
وضعنا المهمة للروبوت
دعنا نحاول الخروج بمثل هذه المشكلة ، والتي من أجلها ستكون هناك حاجة إلى حل الذكاء الاصطناعي الآلي مع جميع الخصائص المذكورة أعلاه. لا يتعين علينا أن نتجاوز هذه الفكرة كثيرًا ، حيث تم نشر العديد من الحالات والحلول المهمة لها على الإنترنت - سنستخدم أحد "حلول الحالات" (لكل من بيان المشكلة والحل فيما يتعلق بالذكاء الاصطناعي). سيتم تقليل مهمتنا المختارة إلى تصنيف البيانات على شبكة التواصل الاجتماعي Twitter ("التغريدات") إلى "السلبية" و "الإيجابية" من حيث تلوينها العاطفي. لتدريب الموديلات ، سيكون لدينا عينات كبيرة بما يكفي من التغريدات "المميزة" (أي بلون عاطفي محدد بالفعل) ، وسنحتاج إلى تصنيف التغريدات "غير المميزة" (أي ، بتلوين عاطفي غير محدد):
الشكل 1: بيان مشكلة تصنيف النصوص عن طريق التلوين العاطفي (تحليل المعنويات الإنجليزية)تمت صياغة النهج المتبع في إنشاء نماذج رياضية قادرة على التعلم على النصوص المرموقة وتصنيف النصوص لاحقًا باستخدام تلوين عاطفي إلى أجل غير مسمى في
مثال معروف إلى حد ما نشره S. Smetanin على الإنترنت.
يرجى من يو يو روبتسوفا جمع
بيانات مهام هذه الفئة ومعالجتها ونشرها.
وبهذا يمكننا أن نبدأ في "تجميع الروبوت" - لكننا سوف نعقد البيان الكلاسيكي قليلاً بشرط واحد: يتم توفير كل من البيانات المرمزة والبيانات غير المخصصة للعملية التحليلية في شكل ملفات ذات حجم قياسي حيث أن العملية "تستهلك" الملفات المقدمة بالفعل. وبالتالي ، سيحتاج روبوتنا إلى بدء العمل على الحد الأدنى لوحدات تخزين بيانات التدريب ، مما يزيد باستمرار من دقة التصنيف من خلال تكرار التدريب النموذجي على زيادة أحجام بيانات التدريب.
نذهب إلى ورشة عمل InterSystems
دعنا نظهر بمثال المهمة التي صاغناها للتو كيفية روبوت الذكاء الاصطناعي باستخدام منصة InterSystems IRIS ومجموعة من الامتدادات لها تسمى ML Toolkit. في الوقت نفسه ، التأكد من أن العمليات التحليلية التي نقوم بإنشائها قادرة على التفاعل بشكل منتج مع البيئة ، وتكون قابلة للتكيف ، وقابلة للتكيف ، وعاملة ("ثلاثة أ").
لنبدأ مع الوكالة. دعنا نضع أربع عمليات أعمال في المنصة:
الشكل 2 الشكل 2. تكوين نظام وكيل العملية التجارية مع مكون للتفاعل مع بيثون- GENERATOR ("المولد") - نظرًا لأن الملفات الأخرى تستهلكها عمليات أخرى ، فإنها تنشئ ملفات جديدة تحتوي على بيانات الإدخال (تم تمييزها على أنها "إيجابية" و "سلبية" - التغريدات ، وتويت بتلوين عاطفي غير محدد)
- BUFFER ("المخزن المؤقت") - حيث يتم استهلاك السجلات من قبل عمليات أخرى ، ويقرأ سجلات جديدة من الملفات التي أنشأها المولد ، وحذف هذه الملفات بعد قراءة السجلات
- ANALYZER ("محلل") - يستهلك المدخلات من المخزن المؤقت للتغريدات غير المحددة ، ويطبق شبكة عصبية تلافيفية مدربة على هذه الإدخالات ويضع الإدخالات الناتجة مع "احتمال الإيجابية" المحسوبة في المخزن المؤقت للشاشة ؛ تستهلك الإدخالات من المخازن المؤقتة للتغريدات الإيجابية والسلبية ، وتجري تدريبًا على الشبكة العصبية
- MONITOR ("مراقب") - من خلال استهلاك السجلات التي يعالجها المحلل من مخزنه المؤقت ، فإنه يراقب قيم مقاييس الخطأ في تصنيف tweet بواسطة الشبكة العصبية أثناء التدريب الأخير ويرسل إشارة إلى المحلل حول الحاجة إلى تدريب جديد للشبكة العصبية
يمكننا تمثيل نظام وكيلنا للعمليات التجارية بشكل تخطيطي على النحو التالي:
الشكل 3 الشكل 3. تدفق البيانات عاملجميع العمليات داخل نظامنا تعمل بشكل مستقل عن بعضها البعض ، ولكن مع الأخذ في الاعتبار إشارات بعضها البعض. على سبيل المثال ، الإشارة إلى بداية تكوين الملف التالي مع السجلات بواسطة منشئ العملية هي حذف الملف السابق بالسجلات بواسطة المخزن المؤقت.
الآن عن القدرة على التكيف. يتم تنفيذ قابلية التكيف للعملية التحليلية في مثالنا من خلال "تغليف" الذكاء الاصطناعي في شكل عنصر مستقل عن منطق عملية الحامل للعنصر ، مع عزل وظائفه الرئيسية - التدريب وتطبيق النماذج:
الشكل 4 الشكل 4. العزلة في محلل العملية التحليلية للوظائف الرئيسية لمنظمة العفو الدولية - التدريب وسجل النماذج الرياضيةلأن جزء عملية محلل المقدمة أعلاه هو جزء من "دورة لا نهاية لها" (التي تبدأ عندما تبدأ عملية محلل ويعمل حتى يتوقف النظام الوكيل بأكمله) ، ويتم تنفيذ وظائف AI بالتوازي ، العملية لديها القدرة على تكييف AI مع الموقف: نماذج تدريب عند الضرورة ، ودون توقف لاستخدام نسخة من النماذج تحت تصرفه. يتم تحديد الحاجة إلى نماذج التدريب من خلال عملية مراقبة تكيفية تعمل بشكل مستقل عن عملية التحليل وتستخدم معاييرها الخاصة لتقييم دقة النماذج المدربة من قبل المحلل:
الشكل 5 - الاعتراف من قبل عملية رصد لنوع النموذج وتطبيق المعايير المناسبة لتقييم دقة النماذجننتقل إلى القدرة على التكيف. العملية التحليلية في InterSystems IRIS هي عملية أعمال لها تمثيل رسومي أو XML كسلسلة من الخطوات. قد تكون الخطوات ، بدورها ، متواليات للخطوات والدورات واختبارات الحالة وعناصر التحكم الأخرى في العملية. يمكن تشغيل الخطوات لرمز البرنامج للتنفيذ أو نقل المعلومات (والتي قد تكون أيضًا رمز البرنامج) للتنفيذ في عمليات أخرى أو بيئات خارجية.
على وجه الخصوص ، إذا كان من الضروري تغيير العملية التحليلية ، فلدينا الفرصة للقيام بذلك في كل من محرر الرسومات وفي IDE. يتيح لك تغيير العملية التحليلية في محرر رسوم بيانية تكييف منطق العملية دون الحاجة إلى البرمجة:
الشكل 6 محلل العملية في محرر رسومية مع قائمة مفتوحة لإضافة عناصر التحكموأخيرا ، التفاعل مع البيئة. العنصر الأكثر أهمية في البيئة ، في حالتنا ، سيكون بيئة بيثون للنمذجة الرياضية. لضمان التفاعل مع بيئات Python و R ، تم إنشاء الامتدادات الوظيفية المقابلة:
Python Gateway و
R Gateway . من أهم وظائف كلتا الآليتين القدرة على التفاعل مع البيئة المناسبة باستخدام مكونات تكامل مريحة. لقد رأينا بالفعل مكون التفاعل مع بيثون في تكوين نظام الوكيل لدينا. بهذه الطريقة ، تتفاعل العمليات التجارية التي تحتوي على الذكاء الاصطناعي المطبق في بيثون مع بيثون.
على سبيل المثال ، تحتوي عملية التحليل على وظائف للتدريب وتطبيق النماذج ، يبدو تنفيذ أحدها في Python في نظام InterSystems IRIS كما يلي:
الشكل 7 التنفيذ في بيثون من منصة IRS InterSystems لتدريب النماذج في عملية محللكل خطوة من خطوات هذه العملية مسؤولة عن معالجة تفاعل معين مع Python: نقل المدخلات من سياق عملية IRS InterSystems إلى سياق Python ، تمرير التعليمات البرمجية للتنفيذ في Python ، وإرجاع الإخراج من سياق Python إلى سياق عملية IRS InterSystems.
أكثر أنواع التفاعل شيوعًا في مثالنا هو تمرير الكود لتنفيذه في بيثون:
الشكل 8 يتم إرسال رمز Python المستضاف في عملية محلل InterSystems IRIS إلى Python للتنفيذفي بعض التفاعلات ، يتم إرجاع البيانات من سياق Python إلى سياق عملية InterSystems IRIS:
شكل 9: تتبع مرئي لجلسة عملية المحلل مع عرض المعلومات التي أرجعها بيثون في إحدى خطوات العمليةنبدأ الروبوت
تشغيل الروبوت الصحيح في هذه المقالة؟ لماذا لا ، هنا
تسجيل لندوة الويب الخاصة بنا ، والتي خلالها (بالإضافة إلى عدد من القصص الأخرى المثيرة للاهتمام والمتصلة ب robotization AI!) يتم عرض عمل السيناريو أعلاه. نظرًا لأن وقت الندوة عبر الإنترنت ، للأسف ، محدود - ونريد أن نظهر "العمل المفيد" للنص الآلي الخاص بنا بشكل مضغوط وبصريًا قدر الإمكان - وضعنا أدناه نظرة عامة أكثر اكتمالا على نتائج التدريب النموذجي (7 دورات تدريبية متتالية بدلاً من 3 في الندوة عبر الويب):

تتوافق النتائج تمامًا مع التوقعات البديهية: حيث أن عينة التدريب تملأ بالتغريدات الإيجابية والسلبية "المميزة" ، تتحسن جودة نموذج التصنيف لدينا (يتضح هذا من خلال "المساحة تحت المنحنى" المتزايدة ، وهي نفس المنطقة تحت المنحنى).
ما هي الاستنتاجات التي أود تقديمها في نهاية المقال:
- InterSystems IRIS هي عبارة عن منصة AI قوية للعمليات الآلية
- يمكن تطبيق الذكاء الاصطناعي في البيئات الخارجية (على سبيل المثال ، Python و R مع وحداتهما التي تحتوي على خوارزميات جاهزة للاستخدام) ، وفي النظام الأساسي InterSystems IRIS نفسه (باستخدام مكتبة الخوارزميات المضمنة أو عن طريق كتابة الخوارزميات في Python أو R) - يوفر InterSystems IRIS التفاعل مع بيئات AI الخارجية ، مما يسمح لك بدمج قدراتها مع وظائفها الخاصة
- InterSystems IRIS robots AI باستخدام "three A": عمليات الأعمال القابلة للتكيف والتكيف والوكيل (وهي أيضًا عمليات تحليلية)
- تعمل InterSystems IRIS مع AI خارجي (Python، R) من خلال مجموعات من التفاعلات المتخصصة: نقل / إرجاع البيانات ، ونقل الرمز للتنفيذ ، إلخ. في إطار عملية تحليلية واحدة ، يمكن إجراء التفاعلات مع العديد من بيئات النمذجة الرياضية.
- يقوم InterSystems IRIS بدمج بيانات المدخلات والمخرجات النموذجية في نظام أساسي واحد ، ويضفي طابعًا تاريخيًا على الحسابات وإصدارها
- بفضل InterSystems IRIS ، يمكن استخدام الذكاء الاصطناعي في كل من الآليات التحليلية المتخصصة وجزءا لا يتجزأ من حلول OLTP أو التكامل.
أولئك الذين قرأوا المقال والمهتمين بقدرات InterSystems IRIS كمنصة لتطوير أو نشر آليات الذكاء الاصطناعي والتعلم الآلي ، نقترح مناقشة السيناريوهات المحتملة التي تهم مؤسستك. سنحلل بسهولة احتياجات مؤسستك ونحدد بشكل مشترك خطة عمل ؛ البريد الإلكتروني للاتصال بفريق الخبراء AI / ML هو
MLToolkit@intersystems.com .