تحسبًا لبطولتنا حول لعبة فيديو المدرسة القديمة
Game Overnight ، قررنا التحدث عن الروبوتات في ألعاب الكمبيوتر.
ربما سمعت أن قدرات الروبوتات الحديثة لألعاب الكمبيوتر تفوق قدرات الإنسان. يمكن أن تكون هذه البوتات مشفرة ، وتتفاعل دائمًا بشكل متساوٍ مع نفس مجموعات بيانات الإدخال. نهج آخر لتطورهم هو أنه يسمح لهم
بالتعلم والتطور . يتصرفون بشكل مختلف في نفس المواقف في محاولة إيجاد حلول مثالية للمشاكل التي يواجهونها.

فيما يلي بعض الأمثلة المعروفة لمثل هذه الروبوتات:
- AlphaZero هو بوت شطرنج أصبح بعد 24 ساعة من التدريب أعظم لاعب على وجه الأرض.
- AlphaGo هو البرنامج الذي تغلب على Lee Sedola و Ke Jie في Go.
- MarI / O عبارة عن روبوت لـ Super Mario يتعلم من تلقاء نفسه ، محاولًا إكمال مستويات اللعبة في أسرع وقت ممكن.
الشطرنج ، اذهب ، Super Mario - الألعاب الصعبة ، البوتات هي مجموعات مختارة بشكل معقول من الخوارزميات ، ويستغرق تدريبها الكثير من الوقت.
هذه المادة مخصصة لتحليل روبوت MarI / O وقصة لماذا لن يساعد النهج المستخدم لإنشاء هذا الروبوت في كتابة برنامج يمكنه لعب Pokemon جيدًا.
ما الفرق بين ماريو وبوكيمون؟
هناك ثلاثة اختلافات رئيسية بين ألعاب Mario و Pokemon التي تحدد النجاح المحتمل للبوتات:
- عدد الأهداف.
- معامل التفرع.
- التناقض بين التحسين العالمي والمحلي
قارن الألعاب مع هذه العوامل في الاعتبار.
عدد الأهداف
تتعلم الآلات من خلال تحسين وظيفة موضوعية معينة. يمكن أن يكون تعظيم وظيفة المكافأة أو وظيفة
اللياقة البدنية (عند
التعلم مع التعزيز وعند استخدام
الخوارزميات الجينية ) ، يمكن أن يقلل
من وظيفة الخسارة (عند
التعلم مع المعلم ). على أي حال ، إذا تحدثنا عن التطبيق في اللعبة ، فإننا نتحدث عن مجموعة أكبر عدد ممكن من النقاط.
لدى ماريو هدف واحد: الوصول إلى نهاية المستوى. ببساطة ، كلما تقدمت في اللعبة ، كان ذلك أفضل. يعبر هذا المؤشر عن وظيفة هدف واحد ، ويمكن تقدير قدرات النموذج ، ببساطة ووضوح ، من خلال مؤشر واحد.
هدف لعبة ماريوالبوكيمون لديه العديد من الأهداف. دعونا نحاول معرفة ذلك. ربما هدف اللعبة هو هزيمة النخبة الأربعة؟ ربما هذا هو التقاط كل بوكيمون؟ أو ربما تحتاج إلى تدريب أقوى فريق؟ من الممكن أن يكون هدف اللعبة مزيجًا من جميع الأهداف السابقة أو حتى شيء مختلف تمامًا. من المحتمل أنه في الواقع ، إذا سألت لاعبًا معينًا عن هذا ، فسيتم عرض هدفه في شكل مجموعة معقدة من الإنجازات العديدة المتاحة في اللعبة.
أهداف لعبة البوكيمونعند تحليل اللعبة ، من الضروري ليس فقط تحديد هدفها النهائي ، ولكن أيضًا تحديد كيفية تقدم اللعبة ، وكيفية تأثير إجراءات معينة على الوظيفة الهدف ، أو تفاقمها أو تحسينها اعتمادًا على مجموعة كبيرة من الخيارات المتاحة للاعب في وقت معين.
في الواقع ، يؤدي اختيار متغير للعمل في موقف معين إلى المؤشر الثاني لمقارنة الألعاب.
نسبة التفرع
معامل التفريع ، بعبارات بسيطة ، مؤشر يشير إلى عدد خيارات العمل المتاحة في كل خطوة من عملية اللعبة. في الشطرنج ، متوسط معامل التفرع هو 35. في الذهاب - 250. إذا حاول الروبوت "النظر إلى المستقبل" ، بعد حساب جميع التحركات التي يمكنه القيام بها الآن ، ثم كل التحركات التي يمكن أن يقوم بها بعد إكمال الخطوة الحالية ، وهكذا ، فإن كل مستوى من هذا القبيل يعني زيادة خطيرة في تعقيد المهمة. أي أن عدد الخيارات مع هذا النهج ينمو بشكل كبير ، معبرًا عنه بصيغة من الصيغة (معامل التفرع) ^ (عدد المستويات).
في Mario ، يمكن للشخصية أن تتحرك يسارًا أو يمينًا ، ويمكن أن تقفز ولا يمكنها فعل أي شيء. عدد الخيارات التي يحتاج البوت لتقييمها صغير. كلما انخفض معامل التفرع ، كلما كان بإمكان البوت أن ينظر إلى المستقبل ، وينفق موارد حوسبة مقبولة على ذلك.
خيارات ماريوبوكيمون لديه عالم ألعاب مفتوح. هذا يعني أنه في كل نقطة معينة من الوقت يكون لدى اللاعب العديد من الخيارات للعمل. علاوة على ذلك ، لا يعد التعداد البسيط لاتجاهات الحركة المحتملة للشخصية في هذه الحالة مناسبًا لحساب معامل التفرع. بدلاً من ذلك ، يتم لعب دور من خلال بعض الإجراءات المنطقية في عالم اللعبة. هل سيكون الإجراء التالي معركة ، محادثة مع شخصية لعبة ، الانتقال إلى منطقة أخرى من الخريطة؟ علاوة على ذلك ، يزداد عدد الخيارات ، أثناء تقدمك في اللعبة.
عرض مبسط لأفعال الشخصية في بوكيمونمن أجل إنشاء روبوت يمكنه تحديد تسلسل القرارات التي يجب اتخاذها في مثل هذه الحالة ، يحتاج هذا البوت إلى مراعاة أهدافه قصيرة المدى وطويلة المدى ، مما يقودنا إلى البعد التالي لمقارنة ألعاب ماريو وبوكيمون.
التناقض بين التحسين العالمي والمحلي
يمكن اعتبار التحسين المحلي والعالمي مكانيًا وزمنيًا. ترتبط الأهداف قصيرة المدى ومنطقة صغيرة تحيط بشخصية اللعبة بالتحسين المحلي. ترتبط الأهداف طويلة المدى والأجزاء الكبيرة نسبيًا من مساحة اللعبة (شيء مثل "مدينة" أو عالم اللعبة بأكمله) بالتحسين العالمي.
إذا قمت ، في Pokemon ، بتفكيك كل حركة إلى الأجزاء المكونة لها - سيساعد ذلك على عرض المشكلة التي يجب على البوت ، الذي يتكون من أجزاء صغيرة جدًا ، حلها. التحسين المحلي ، الذي يسمح ، على سبيل المثال ، بالانتقال من النقطة A إلى النقطة B ، لن يسبب صعوبات. هناك مشكلة أكثر تعقيدًا بكثير هي اختيار النقطة B ، اتجاه الحركة. لن تساعدنا
الخوارزميات الجشعة هنا ، لأن الحلول المثلى محليًا لا تؤدي بالضرورة إلى نتائج مثلى عالميًا.
مشكلة اختيار الخطوة التاليةالخرائط في ماريو صغيرة وخطية. الخرائط في بوكيمون كبيرة ومعقدة وغير خطية. أمام اللاعب ، أثناء تقدمك في اللعبة ، وبينما يسعى لتحقيق المزيد والمزيد من الأهداف المهمة ، تنشأ مهام جديدة باستمرار. ومهمة تنظيم ربط التحسينات المحلية بالأهداف العالمية ليست سهلة. على الأقل النماذج الحالية ليست جاهزة بعد لحلها.
الملخص
من وجهة نظر الروبوتات ، فإن لعبة البوكيمون ليست لعبة واحدة. تتميز برامج الروبوت بتخصصها الضيق ، وسيكون الروبوت الذي يساعد اللاعب على التحرك حول الخريطة عديم الفائدة إذا واجه اللاعب شخصية لعبة تحتاج إلى الانضمام إلى المعركة. من وجهة نظر الروبوتات ، فإن التحرك حول الخريطة والمعركة مهام مختلفة تمامًا.
البوتات هي أنظمة متخصصة للغايةأثناء المعركة في كل خطوة ، عليك الاختيار من بين عشرات الخيارات. تحتاج إلى تحديد الإجراء الذي يجب اتخاذه ، أي البوكيمون الذي يتعين عليك اتخاذه ، عليك أن تفهم متى تستخدم عناصر مختلفة. كل هذا ، في حد ذاته ، يقدم تحديات تحسين معقدة.
فيما يلي المادة التي تستكشف التحدي المتمثل في تطوير محاكاة معركة في بوكيمون. هذه المقالة متطورة جيدًا ، ومعقدة إلى حد ما ، ولكن حتى هناك مشكلة الأجسام ، وهي العامل الأكثر أهمية الذي يؤثر على نتيجة المعركة.
في النهاية ، يمكننا القول أننا بحاجة إلى أن نفرح في حقيقة أنه يمكننا إنشاء روبوتات تلعب ألعابنا بشكل أفضل منا. هذه الألعاب معقدة من وجهة نظر رياضية ، ولكن يتم تحديد أهدافها بسهولة. مع تطور تقنيات الذكاء الاصطناعي ، ستتمكن البشرية من صنع آلات يمكنها حل المشكلات المتزايدة الأهمية في العالم الحقيقي. سيفعلون ذلك من خلال دراسة هذه المشاكل ، وهي مهام تحسين معقدة. ولكن في الوقت الحالي ، يمكنني أن أؤكد لكم ، أن هناك مهامًا نقوم بحلها بشكل أفضل من الآلات ، بما في ذلك الألعاب التي لعبها الكثير منا في مرحلة الطفولة. على الأقل هذا هو الحال الآن.
أعزائي القراء! ندعوك للمشاركة في البطولة الأولى في روسيا على ألعاب الفيديو في المدرسة القديمة
Game Overnight . تحتوي البطولة على جزء مؤهل ومعركة حقيقية لأفضل الأفضل ، والتي ستقام في 30 نوفمبر في متحف ماكينات القمار السوفييتية. نحن ننتظر البطولة من 20 إلى 3 ساعات ، ومشروبات الرغوة Smart Admin ، و DJ Ogurets (Sergey Mezentsev) ، و RUVDS admin Unpushible DJ سوف يساعده ، وسنحاول أيضًا برغر ثلج Sub Zero الجديد من مشرفينا. لذا ، كما يقولون ، أهلا وسهلا!
