سيتنافس المتسابقون في العديد من الألعاب على منصة Minecraft. Left: Build Battle لعبة حيث يحتاج اللاعبون إلى إعادة إنشاء الهيكل (في هذه الحالة ، توجد البنية على الأرض). اليمين: لعبة خنزير تشيس حيث يجب أن يعمل عملاء منظمة العفو الدولية معًا لتركيع الخنزيرأكملت Microsoft Research المرحلة التأهيلية
لمسابقة MarLÖ 2018 (التعلم المتعدد الوكلاء في MalmÖ). قدم المتسابقون وكلاء AI قادرين على التعلم المعزز الذين يمكنهم لعب العديد من الألعاب ثلاثية الأبعاد كما هو محدد على نظام
MalmO .
الهدف من المسابقة هو تشجيع البحث في مجال الذكاء العام. يتم تدريب وكلاء الذكاء الاصطناعى ليس على لعبة واحدة محددة ، ولكن على عدة. بالإضافة إلى ذلك ، يجب أن يتعاونوا ، الأمر الذي يتطلب فهم نوايا وأهداف بعضهم البعض (هذه خاصية مهمة للوعي الإنساني). لذلك سيكون النظام أكثر تكيفًا للبقاء على قيد الحياة في العالم الحقيقي.
من أجل تحفيز نهج أكثر عمومية لتدريب وكيل AI عالمي ، لا تتألف المهمة من لعبة واحدة ولكن من عدة ألعاب ، وفي كل منها مهام متعددة ذات تعقيد وإعدادات مختلفة. بعض هذه المهام عامة بطبيعتها ، ويمكن للمشاركين التعلم منها. ومع ذلك ، بقي البعض الآخر مغلقين ، سيتم استخدامها فقط لتحديد التصنيف النهائي للمسابقة.
منظمو المسابقة هم مايكروسوفت وجامعة كوين ماري بلندن ومنصة
الجماهير . بدأت المنافسة في 27 يوليو 2018. تنتهي جولة التصفيات في 31 ديسمبر 2018. ستقام البطولة النهائية في وضع عدم الاتصال بعد أسبوع من انتهاء الجولة التصفيات.

الألعاب والمهام
واحدة من السمات الرئيسية للمسابقة هي أن الوكلاء يلعبون العديد من الألعاب. لذلك ، يتم تقديم العديد من المهام للمسابقة. قد تختلف المهام في اللعبة عن بعضها البعض في موقع المستويات والحجم والتعقيد والمعلمات الأخرى التي تعتمد على اللعبة. يوضح الشكل كيفية تنظيم الألعاب والمهام في المسابقة.

كما ترون ، كل لعبة لها أربع مهام ، اثنتان منها تنشران في المجال العام واثنتان سريتان.
للمشاركة في المسابقة ، تحتاج إلى التسجيل في crowdAI ، ثم استنساخ
مجموعة أدوات المنافسة على GitHub .
توفر
منصة Malmö واجهة برمجة تطبيقات تتيح الوصول إلى الإجراءات والملاحظات (أي الموقع ، المحيط ، إطارات الفيديو ، إحصائيات اللعبة) وغيرها من البيانات الشائعة الموجودة على منصة Minecraft. Marlo ، من ناحية أخرى ، عبارة عن غلاف لـ Malmö يوفر مستوى أعلى من واجهة برمجة التطبيقات وبيئة تعليمية موحدة أكثر مع تعزيز البحث.
تتم كتابة الإطار كإضافة إلى
إطار عمل OpenAI Gym ، وهو عبارة عن مجموعة أدوات لتطوير ومقارنة خوارزميات التعلم التعزيز ، وبالتالي توفير منصة قياسية ومألوفة للعلماء والمطورين والأطر الشعبية.
تم إطلاق مشروع Malmö في عام 2015 من قِبل باحثة الذكاء الاصطناعي كاتيا هوفمان في Microsoft Research Cambridge ، المملكة المتحدة. على الرغم من أن وكلاء الذكاء الاصطناعى الحديث قد أظهروا العديد من الإنجازات في ألعاب مختلفة ، إلا أن كاتيا كانت تبحث عن لعبة تسمح لمنظمة العفو الدولية بإتقان مجموعة واسعة من المهارات: "في اللحظة التي بدأنا في الحديث عن Minecraft ، كان من الواضح أن هذه كانت بيئة مثالية لأبحاث الذكاء الاصطناعى" ، على حد
تعبيره. هي هي. "هذا عالم ينضم إليه الناس بدون غرض محدد". وبالتالي ، فإن مشروع Malmö هو عبارة عن منصة مبنية على أعلى Minecraft ، حيث يمكن للباحثين إجراء العديد من التجارب المختلفة مع الذكاء الاصطناعى ، وكذلك مقارنة نتائجهم بطريقة موحدة.
عند اختبار مسابقة مارلو في عام 2017 ، لم يتم تقديم سوى لعبة واحدة للمشاركين: اصطياد خنزير. تعد مسابقة 2018 أكثر تعقيدًا: لقد تم تطوير ثلاث مهام تتطلب كل منها تعاونًا. يحتاج الوكلاء إلى فهم كيفية التعرف على عامل AI آخر في البيئة ، ثم إيجاد طريقة للعمل معًا لتحقيق هدفهم المشترك.
إذا افترض عميل الذكاء الاصطناعي أهداف عميل آخر ، فيمكن أن يطلق عليه شكلاً بدائيًا لما يسميه علماء النفس "
نموذجًا للحالة العقلية " - القدرة البشرية على فهم الحالات والنوايا الذهنية للأشخاص الآخرين. تأمل Katya Hoffman أن يصقل عملاء AI هذه القدرة في نهاية المطاف من خلال التعاون مع لاعبين بشريين في Minecraft. "ثم ستتعلم الخوارزميات كيفية التعاون مع الناس ومعرفة ما يريده الناس" ، كما تقول.