حطم الذكاء الاصطناعي لشركة Microsoft الرقم القياسي المسجل لدى السيدة باك مان



على الرغم من عمرها الكبير ، لا تزال لعبة Pac-Man ، إصداراتها المختلفة ، تحظى بشعبية كبيرة. يتنافس مشجعو اللعبة بانتظام مع بعضهم البعض في من سيحرز أكبر عدد من النقاط أثناء المرور. كما يقوم مطورو الذكاء الاصطناعي بدراستها ، وتحسين مهارات أنظمتهم في تمرير الألعاب.

تمكن فريق التطوير من شركة Maluuba الكندية الناشئة ، التي استحوذت عليها سابقًا من قبل Microsoft ، على إنشاء منصة برمجية أظهرت نتائج جيدة بشكل غير عادي عند اجتياز السيدة. Pac-Man ، إصدار هذه اللعبة لـ Atari 2600. حطم البرنامج جميع الأرقام القياسية التي تم تسجيلها سابقًا ، حيث حصل على 999990 نقطة.

بالمناسبة ، تم إنشاء اللعبة في عام 1982. ثم Atari Inc. تم إطلاق لعبة Pac-Man الصادرة من Namco في ميناء الألعاب. كما هو الحال في النسخة الأصلية ، يجب عليك التحكم في بطل الرواية بعصا التحكم. يجب أن يتحرك بطل الرواية عبر المتاهة ، ويكتسب نقاطًا ، ويتجنب الأشباح. منشئ لعبة Ported هو Tod Fry.

وفقا لبعض الخبراء ، فإن حقيقة أن منصة البرمجيات سجلت أكبر عدد من النقاط في اللعبة هو إنجاز كبير في مجال الذكاء الاصطناعي (شكله الضعيف). والحقيقة هي أن منصات البرامج الأخرى أظهرت نتائج أقل نجاحًا - تبين أن اللعبة معقدة جدًا للذكاء الاصطناعي. بالطبع ، لم ينشئ جميع المطورين مشاريعهم بناءً على السجل في السيدة تحدث باك مان ، ولكن أولئك الذين عملوا عليها ، عن عدد كبير من المشاكل التقنية عند محاولتهم إظهار أي نتائج ذات مغزى.

من أجل تحقيق النجاح ، قرر فريق مالوبا تقسيم اللعبة إلى مجموعة من العناصر الصغيرة ، مع البحث عن حل للتفاعل مع كل منها. علاوة على ذلك ، تم توزيع هذه العناصر بين وكلاء الذكاء الاصطناعي ، حيث حل كل منها مهمته المحددة. ذكرت Doina Prekap ، الأستاذ في جامعة McGill في مونتريال ، أن الفكرة التي اقترحها المطورون تستحق الاهتمام. في رأيها ، هذه هي الطريقة التي يعمل بها الدماغ البشري في بعض الحالات - فهو يقسم المشكلة إلى عدة مكونات ويحل كل عنصر على التوالي.

أطلق المطورون على أسلوبهم Hybrid Reward Architecture ، ويستخدم أكثر من 150 وكيل AI ، يعمل كل منهم بالتوازي مع الآخرين في عملية تمرير اللعبة. علاوة على ذلك ، يحصل كل وكيل على "مكافأة" عند المرور الناجح لقسمه الخاص من اللعبة.

بالإضافة إلى الوكلاء "الصغار" ، هناك وكيل آخر رفيع المستوى يشارك في جمع جميع البيانات الواردة من جميع "المرؤوسين". يقرر أيضًا أين يجب أن يتحرك شخصية البطل. في هذه الحالة ، يتم تحليل كمية كبيرة من البيانات. العامل الرئيسي هو اتجاه الحركة المحدد بواسطة الحد الأقصى لعدد العوامل الأولية. من ناحية أخرى ، إذا كان 100 وكيل يرغبون في الذهاب يمينًا للحصول على الكأس ، لكن 3 وكلاء يخططون للانعطاف إلى اليسار ، لأنهم لاحظوا شبحًا ، فإن الوكيل الرئيسي "يستمع" إلى هؤلاء الثلاثة.

وفقًا لكبير المطورين ، بدأ النظام في إظهار نتائج أفضل بعد برمجة العملاء للسلوك الأناني. أي أن كل منهم يتخذ قرارًا دون النظر إلى الآخرين. لكن القرار العام بشأن اتجاه حركة البطل يتخذ من قبل الوكيل الرئيسي. يقيم العوامل والأوامر المختلفة إلى أين يذهب.


قال هارم فان سيجن ، رئيس فريق أبحاث مايكروسوفت ، "هذا توازن بين الحاجة إلى التفاعل من جهة ، والحاجة إلى اتخاذ قرارات فردية من ناحية أخرى".

ولكن لماذا تقرر عمومًا اختيار السيدة باك مان؟ قد يبدو اختيار هذه اللعبة غريبًا بالنسبة للشخص العادي. لكن الخبراء يقولون إنه لا يوجد شيء غريب هنا ، لأن هذه الفئة من الألعاب معقدة للغاية بالنسبة للذكاء الآلي ، حيث توجد الكثير من حالات "الطوارئ" في وحدة زمنية ، يحتاج كل منها إلى نسخته الخاصة من تطوير الأحداث. ولإيجاد حل تحتاج إلى "التفكير" تقريبًا مثل الشخص ، كما ذكر أعلاه.

قال راؤول مهروترا ، أحد مبرمجي مالوبا: "تعمل العديد من الشركات على الذكاء الاصطناعي للألعاب ، وتطور مشاريعها الخاصة ، لأن التمرير يتطلب العديد من الصفات البشرية".

تعمل منصة البرامج التي تم تطويرها في Microsoft وفقًا لطريقة التعلم الآلي التي تسمى التعلم المعزز. أثناء العمل ، يتعلم نظام الاختبار (وكيل أو وكلاء) من خلال التفاعل مع البيئة. هذا ، بحكم تعريفه ، هو نوع من تجربة علم التحكم الآلي. تعد طريقة التعلم المعزز أحد أنواع التدريس مع المعلم ، ولكن الوسيلة أو نموذجها هو المعلم. يعمل الوكيل على البيئة ، وهو بدوره يؤثر على العامل. تنشأ ردود الفعل.

المشروع نفسه ليس نظرية خالصة. وفقًا للمطورين ، يمكن استخدام النظام الأساسي للبرمجيات التي تم إنشاؤها في العديد من المجالات. على سبيل المثال ، يمكنك جذبها للعمل داخل شركة تبيع للتنبؤ بديناميكيات تدفق العملاء وشعبية البضائع وأشياء مهمة أخرى. يمكن أن يعمل النظام مع الاتجاهات العامة ومع العوامل الفردية ، بما في ذلك المشترين الأفراد.

Source: https://habr.com/ru/post/ar404575/


All Articles