تحليل مفصل لمباراة Dota 2 بين OpenAI والأشخاص بتنسيق 5x5. خسر الناس



يوم أمس ، 5 أغسطس ، في سان فرانسيسكو ، جرت مباراة عرض بين أشخاص OpenAI وبرامج الروبوت في تخصص Dota 2. في عام 2017 ، كجزء من مباريات المعرض الدولي 2017 ، قاتل الناس OpenAI بتنسيق "1x1 Mirror mid" ومع نطاق كامل قيود لصالح الروبوتات (حظر على استخدام عدد من العناصر والميكانيكي) ، والتي انتهت بهزيمة لاعبي الوسط المحترفين.

نظرًا لأن Dota 2 هو نظام انضباط متعدد الاستخدامات وصعب للغاية ، فقد عقد الاجتماع بين الناس والذكاء الاصطناعي مرة أخرى مع عدد من القيود ، والتي ، مع ذلك ، لم تؤثر على طريقة اللعب بشكل جذري للغاية:

  • مجموعة من 18 من الأبطال في وضع المسودة العشوائية (الفأس ، كريستال البكر ، نبي الموت ، إيرث شاكر ، جيروكوبتر ، ليتش ، ليون ، نيكروفوس ، كوين أوف بين ، رازور ، ريكي ، شادو فيند ، سلارك ، قناص ، سفين ، تايد هانتر ، فايبر ، أو ساحرة دكتور) ؛
  • بدون Divier Rapier ، زجاجة ؛
  • بدون مخلوقات وأوهام محكومة ؛
  • تتطابق مع خمس سعاة (لا يمكن كشفهم وعبورهم) ؛
  • بدون استخدام مسح.

أخطر قيود: مجموعة صغيرة للغاية من الأبطال لكلا الجانبين. الآن في Dota 2 هناك 115 حرفًا بقدرات وميكانيكية مختلفة لتطبيقهم. يمكن لـ OpenAI حتى الآن التحكم في 18 منهم فقط. كان الاجتماع أقرب ما يمكن إلى الظروف "الحقيقية" وعقد بتنسيق 5 × 5. لعب الأشخاص العاديون ضد الذكاء الاصطناعي في الماضي ، وكانوا منخرطين في الرياضة الإلكترونية ، لكنهم الآن ليسوا رياضيين إلكترونيين. كان التنازل الوحيد للأشخاص هو أن استجابة الروبوتات كانت محدودة بـ 200 مللي ثانية لتجنب المواقف مع "الضغط" الفوري على الأزرار. خلاصة القول: هزم فريق منظمة العفو الدولية الناس بنتيجة 2-0 على البطاقات . كان من الممكن الفوز ضد OpenAI فقط بعد أن اختار الجمهور أبطال AI (Slark و Sven و Ax و Riki و Queen of Pain) ، وفقًا لتقديرات OpenAI ، كانت فرصة الفوز بمثل هذه المسودة 2.9٪ فقط. بالإضافة إلى ذلك ، قبل بداية المباراة الرئيسية ، كان بإمكان الضيوف العاديين في الحدث اللعب باستخدام الروبوتات ، وفي هذه الاجتماعات كانت هيمنة الذكاء الاصطناعي أكثر وضوحًا ، وهو أمر مثير للإعجاب.

لماذا هو مهم جدا


OpenAI هو مشروع غير هادف للربح ، ومع ذلك ، فإن الأشخاص المعروفين والمؤثرين. تم تأسيس المشروع في عام 2015 من قبل Ilon Musk و Sam Altman ، وكان من الرعاة بيتر Thiel و Jessica Livingston . Dota 2 ليست النشاط الوحيد لفريق مشروع OpenAI. إذا نظرت إلى قسم "البحث" على الموقع الرسمي للمشروع ، يمكنك أن ترى أن OpenAI تعمل بنشاط من أجل إنشاء الذكاء الاصطناعي ، على سبيل المثال ، الروبوتات.

ولكن إذا كان مؤسسو المشروع أشخاص مؤثرين ، فلماذا اخترت لعبة كمبيوتر؟ إن تعلم الذكاء الاصطناعي للعمل في ظروف متغيرة ديناميكيًا مهمة غير تافهة. تعمل النماذج الحالية للذكاء الاصطناعي والطيار الآلي بشكل حصري في ظروف محددة بدقة ، ويتطلب تدريبها الملايين من مجموعات مختلفة من الأحداث والعوامل لكي لا يتصرف البوت وفقًا للأنماط المحددة مسبقًا فحسب ، بل للبدء في تحليل ما يحدث واتخاذ قرارات بناءً على سياق الموقف. أثبت اختيار Dota 2 كمنصة لتعلم الذكاء الاصطناعي وإنشاء برامج الروبوت لهذا التخصص أنه مفيد من عدة وجهات نظر:

  • الرياضات الإلكترونية صديقة للغاية لوسائل الإعلام ؛
  • إنها منصة آمنة لممارسة أساليب التدريب على الذكاء الاصطناعي ؛
  • التباين الهائل في آليات اللعبة في Dota 2 يعطي عددًا غير محدود تقريبًا من السيناريوهات للتدريب ؛
  • يوفر الوصول المفتوح إلى تسجيلات اللعبة الحية إمدادًا لا نهائيًا من البيانات للتحليل.

ربما يكون العنصر الأخير في هذه القائمة المؤقتة هو الأهم. إحدى مشاكل جميع أنظمة التدريب بالذكاء الاصطناعي هي إنشاء عينة ذات صلة يمكن تدريب النظام عليها. ينشئ اللاعبون المباشرون الملايين من سجلات الألعاب المجانية للعب كل يوم مجانًا تمامًا ، ولا يمكن للباحثين اختيار المباريات إلا مع مجموعة من الشخصيات ذات الصلة. والنتيجة مثيرة للإعجاب.

ما حدث في 5 أغسطس


في معظم الأحيان ، تكون الروبوتات في ألعاب الكمبيوتر إما ثديًا باهتًا أو كتابيًا أو وحوشًا لا تقهر مع رد فعل لا إنساني. كمثال - الروبوتات "المجنونة" لـ CS 1.6 ، التي قُتلت في الرأس بمسدس على مسافة 50 مترًا في قفزة على شكل حرف U. لتحقيق سلوك واقعي ، ولكن في نفس الوقت فعال من ألعاب الذكاء الاصطناعي ، لم يتمكن المطورون منذ عقود ، وهذا واضح بشكل خاص في ألعاب العالم المفتوح. في الواقع ، أصبح هذا هو سبب شعبية التخصصات عبر الإنترنت.

بعد مباريات العرض في عام 2017 بتنسيق "مرآة 1x1" ، قال فريق OpenAI أن الهدف التالي هو ألعاب 5x5 كاملة. وقد تمكنوا تقريبًا من تحقيق هدفهم: توقع من الروبوتات أن تكون القدرة على إدارة وتحليل التآزر بين جميع الشخصيات الـ 115 في وضع الكابتن أمرًا غبيًا ، ولكن بالفعل 18 بطلًا - هذا كثير. فيما يلي حساب خيارات الذروة 5 × 5 (10 أحرف) لـ 18 أبطال:

$ C_ {18} ^ {10} = \ frac {18!} {10! \ cdot (18-10)!} = \ frac {18!} {10! \ cdot 8!} = \ frac {11 \ cdot 12 \ cdot 13 \ cdot ... \ cdot 16 \ cdot 17 \ cdot 18} {1 \ cdot 2 \ cdot 3 \ cdot ... \ cdot 6 \ cdot 7 \ cdot 8} = 43758 $



وإليك عدد الخيارات التي نحصل عليها لـ 115 حرفًا:

$ C_ {115} ^ {10} = \ frac {115!} {10! \ cdot (115-10)!} = \ frac {115!} {10! \ cdot 105!} = \ frac {106 \ cdot 107 \ cdot 108 \ cdot ... \ cdot 113 \ cdot 114 \ cdot 115} {1 \ cdot 2 \ cdot 3 \ cdot ... \ cdot 8 \ cdot 9 \ cdot 10} = 74540394223878 $


نعم ، 74.5 تريليون تركيبة! من الواضح أنه من أجل التعامل مع مثل هذا التنوع وتضمين جميع الأحرف الـ 115 في تجمع OpenAI ، يلزم وجود الذكاء الاصطناعي للتعلم الذاتي الكامل ، وهو الأمر الذي ليس لدينا حتى الآن. علاوة على ذلك ، لا تأخذ الحسابات في الاعتبار قدرات الشخصيات (من 4 إلى 6 "أزرار" لكل حرف ، باستثناء Invoker) ، وأنواع القدرات (نشطة ، سلبية ، اتجاهية ، غير اتجاهية ، AoE موجهة إلى نقطة) ، عشرات الكائنات ، التأثيرات النشطة للكائنات ، المعدلات وهكذا دواليك.

ولكن حتى بالنسبة لمجموعتنا المصغرة المكونة من 18 حرفًا ، تم عمل قدر هائل من العمل.

يمكنك أدناه تقييم كيفية تصرف روبوتات OpenAI في الألعاب ضد الأشخاص:


كيف اختلفت البوتات ولم تختلف عن الناس


بالنسبة لأولئك الذين كسالى جدًا لمشاهدة أكثر من 5 ساعات من التسجيل مع Twitch ، سنشرح بإيجاز كيف كان سلوك فريق OpenAI Five bot ملحوظًا مقارنة بالأشخاص العاديين.

تجدر الإشارة على الفور إلى أن الذكاء الاصطناعي فكر في مرحلة مسودة الشخصيات ، أي أنه حسب فرص الفوز بمزيج معين من الشخصيات بناءً على البيانات غير المكتملة التي يمتلكها. في الوقت نفسه ، أفادت OpenAI عن النسبة المتوقعة لفوزها بناءً على المسودة. في بعض الأحيان ، وفقًا لمنظمة العفو الدولية ، وصلت إلى 95 ٪.

يمكن وصف لعبة OpenAI Five بأكملها بمصطلح شائع بين المجتمع بأنها "مخنوقة". نعم ، وفقًا للأحاسيس ، فإن البوتات "خنق" في الواقع خطوطًا معينة ، ودون أي ندم أو خوف دخلوا الأبراج في الدقائق الأولى من المباراة من أجل إرسال لاعب بشري للراحة تحت النافورة في القاعدة. يمكن رؤية بعض النقاط في المقطع أدناه (لا يتوافق اسم الفيديو مع الواقع):


بالإضافة إلى انعدام الخوف (الحد من الوقاحة) والعمل المنظم في مرحلة مبكرة من اللعبة ، لاحظ البوتات أيضًا فهمهم الخاص لآليات Dota 2. الغرض من اللعبة: كسر الهيكل الرئيسي للعدو ، الذي ركزت عليه البوتات. لذلك ، حطمت 3-4 شخصيات منظمة العفو الدولية أبراج المعارضين البشريين باستمرار ، و "تحطيم" البرج بشكل رئيسي لحفظ زحفهم وتدمير الهيكل بسرعة. بالإضافة إلى ذلك ، لوحظت البوتات لحقيقة أنها تستخدم أجنحة غير قياسية ، والتي قامت أيضًا بتخزين الأبراج لهم. ونتيجة لذلك ، في إحدى الألعاب مع ضيوف الحدث ، دخلت الروبوتات قاعدة العدو بالفعل في 9 دقائق (يعتبر الوصول إلى قاعدة العدو حتى في 15-18 دقيقة توقيتًا مبكرًا للغاية).

أيضًا ، أعادت البوتات تجربة توزيعها بشكل فعال فيما بينها ، وتجنب سحب الشخصيات من 4-5 مواقع ، وتميزت في حساب الضرر (عند توجيه الضربة الأخيرة ، لم يستمر البوت في اللحاق بالهدف ، مع فهم واضح أن هناك ضررًا كافيًا للقتل) واستخدم بنشاط بعض العناصر.

سيلاحظ المشاهد اليقظ على الفيديو واتخاذ القرارات بناءً على بيانات غير مكتملة (باستخدام مهارات AoE في "ضباب الحرب") ، واتخاذ قرارات غير قياسية (باستخدام التمرير السريع عبر النقل بدلاً من محاولة الهروب لشخصين) ، والدخول إلى الخلف مع حظر العدو في الغابة وتنسيقه بؤرة أخطر الخصوم البشرية.

لتبرير الإنسانية ، يمكن القول أن اللاعبين البشريين لم يظهروا مستوى عاليًا جدًا من اللعبة ، وكانوا محدودين من حيث اختيار الشخصيات وارتكبوا العديد من الأخطاء ، ولكن تقدم الذكاء الاصطناعي في عام واحد فقط من التطوير لا يمكن أن يفشل في إثارة إعجاب.

من المحتمل أن نشهد مباراة عرض أخرى ، هذه المرة في The International 2018 (ستقام في 20-25 أغسطس) ضد المهنيين الذين هم أقوى بشكل واضح من الذكاء الاصطناعي. ومع ذلك ، فمن الممكن أن يفاجئنا OpenAI Five بشيء.

Source: https://habr.com/ru/post/ar419407/


All Articles