تمكن المطورون الإسرائيليون من تعليم الذكاء الاصطناعي لهزيمة الإنسان في مورتال كومبات

الصورة
لا يزال من الصعب إدراك البيئة ثلاثية الأبعاد من خلال الشكل الضعيف للذكاء الاصطناعي ، والذي ينطوي على مشاكل في الكمبيوتر عند لعب هذه الألعاب.

وباستخدام ألعاب الفيديو ، سيقوم متخصصو الذكاء الاصطناعي الحديثون بتدريس طرق الذكاء الاصطناعي للتغلب على العقبات وحل المشكلات أثناء التنقل. على سبيل المثال ، قام موظفو DeepMind ، جنبًا إلى جنب مع Blizzard ، بتحويل StarCraft II إلى بيئة لتدريب شكل ضعيف من الذكاء الاصطناعي. في العام الماضي ، أتقن نظام الذكاء الاصطناعي من Google 49 لعبة Atari قديمة من تلقاء نفسه .

وهذا لا يتعلق بنظام متكامل في اللعبة (مثل خصوم الذكاء الاصطناعي في ألعاب القتال أو ألعاب محاكاة كرة القدم أو ألعاب محاكاة السباق) ، والذي يدرك جيدًا الشروط والقواعد. الذكاء الاصطناعي ، الذي يتم تدريسه من قبل المطورين في ألعاب الكمبيوتر الآن ، يتم وضعه على قدم المساواة مع البشر. يراقب النظام الصورة على الشاشة ، ويتعلم طرق التجربة والخطأ. ومثل هذا البرنامج قادر على إيجاد حل ليس فقط في الألعاب ، فهو مناسب لإيجاد حل في مجموعة واسعة من المهام ، بغض النظر عن القواعد أو الشروط.


أعلنت مجموعة من الطلاب من الجامعة التكنولوجية في إسرائيل مؤخرًا عن تطويرها ، نظام بيئة التعلم الرجعية (RLE). هذه منصة برمجية تسمح لك بتدريب الذكاء الاصطناعي على سبيل المثال في العديد من الألعاب في التسعينات ، بما في ذلك الألعاب التي تم إصدارها لوحدات تحكم Nintendo و Sega. هذا ، على سبيل المثال ، العديد من F-Zero و Wolfenstein و Mortal Kombat الشهيرة. وفقًا للمطورين ، بالنسبة إلى الذكاء الاصطناعي ، كانت العديد من الألعاب صعبة ، ولم يتعلم بعض النظام فهمها وتمريرها. لكن RLE تعلم لعب Mortal Kombat جيدًا. حدد الخبراء نتائج عملهم في مقال عن arXiv . تمكنت منظمة العفو الدولية مرارًا وتكرارًا من الفوز بشكل واضح ضد خصم بشري. وهذا الخصم لم يكن مبتدئًا بأي حال من الأحوال. تنص المقالة على أن الكمبيوتر قد عارضه لاعب مورتال كومبات ذي خبرة.

في Wolfenstein ، حيث توجد مستويات الصوت ، بالإضافة إلى أنك تحتاج إلى التنقل عبر المتاهة وتحديد عدد من الأشياء ، أظهر النظام نتائج غير جيدة. في Gradius III ، كان RLE قادرًا على دراسة الجوانب التقنية للعبة ، والتي تشمل الحاجة إلى تدمير أعداء الاجتماع مع الإجراءات اللاحقة. لكن النظام لم يتمكن من إظهار نتيجة أفضل من اللاعب البشري. هنا من الضروري تحسين قدرات الشخصية مع القطع الأثرية التي تمت مواجهتها. كلما افتقد اللاعب المزيد من القطع الأثرية ، كان من الصعب إكمال اللعبة. لم ينتبه الكمبيوتر عمليًا إلى كائنات الطاقة ، مما أدى إلى تعقيد عملية المرور بشكل كبير.

حقيقة أن البرنامج كان قادرًا على تعلم كيفية لعب لعبة كمبيوتر بشكل جيد لدرجة أنه بدأ في هزيمة شخص ما هي ميزة لا يمكن إنكارها للمطور. ليس من السهل على الكمبيوتر أن يتعلم كيفية لعب لعبة من خلال التجربة والخطأ ؛ إنها مهمة صعبة تتغلب عليها بعض منصات البرامج. قال شاي روزنبرغ ، أحد مؤلفي الدراسة: "إذا كانت الخوارزميات قادرة على لعب ألعاب معقدة ، فيمكننا البدء في العمل على تطبيق هذه الأنظمة في العالم الحقيقي لحل المشكلات الحقيقية". "مثلما يتعلم الطفل ممارسة الألعاب ، يرى الكمبيوتر أيضًا المعلومات على الشاشة فقط. يتعلمان (الطفل والكمبيوتر على حد سواء) كيفية تجنب العوائق وحل المشكلات من أجل الحصول على أقصى مكافأة ".


تعلمت منظمة العفو الدولية أن تلعب بشكل جيد في كل من Boxing on Atari و Mortal Kombat ، ببساطة "النظر إلى الشاشة" وتقييم عواقب أفعالهم في بيئة الألعاب.

في العالم الحقيقي ، يمكن أن تكون قدرة أنظمة الكمبيوتر على التعلم من أخطائها والتنبؤ بعواقب بعض "الإجراءات" مفيدة. العديد من المجالات. يمكن للروبوتات أن تتحرك عبر مساحات معقدة (أروقة الغرف ، على سبيل المثال) مع عدد كبير من العوائق دون الاصطدام بها. سيتم أخذ أي خطأ صغير يرتكبه الكمبيوتر في الاعتبار في المرة القادمة ، عند تنفيذ نفس المهمة أو مهمة مماثلة.

وفقًا لـ Rosenberg ، يمكن لـ RLE أن تتعلم من خلال أنظمة ألعاب أكثر تعقيدًا ، وليس فقط لعب ألعاب SNES. ستكون المرحلة التالية من المشروع تطوير الألعاب على منصة PlayStation. صحيح ، حتى الآن ، يركز المطورون الإسرائيليون على تعليم نظامهم لتمرير معظم الألعاب الرئيسية. حقيقة أن الكمبيوتر تعلم لعب لعبة Mortal Kombat أمر جيد ، ولكنه ليس كافيًا - ومع ذلك ، فإن جزءًا كبيرًا من الألعاب "تجاوز الحدود" ، لم تستطع RLE إتقانها.


نتائج تمرير ألعاب مختلفة بواسطة نظام RLE باستخدام خوارزميات تمرير مختلفة

وقال المطورون: "في المراحل اللاحقة ، نعتبر أنه من الممكن بل ومن السهل نسبيًا تكييف نظام التدريب لدينا مع الألعاب الأكثر تعقيدًا ، بما في ذلك ، على سبيل المثال ، Grand Theft Auto". الآن ، لسوء الحظ ، لا تتوفر ألعاب مثل Grand Theft Auto V AI - فهي معقدة للغاية.

جعل المطورون الكود المصدري لنظامهم مفتوحًا ونشروه على Github. يمكنك الحصول على المصدر هنا .

Source: https://habr.com/ru/post/ar399067/


All Articles