
قدم مطورو جامعة إدنبرة خوارزمية جديدة لإنشاء حركات شخصية واقعية في الألعاب. تحاول الشبكة العصبية ، المدربة على مسارات Motion Capture ، نسخ حركات أناس حقيقيين ، لكن في الوقت نفسه تتكيف مع شخصيات ألعاب الفيديو.
شبكة عصبية واحدة قادرة على إدارة العديد من الإجراءات في اللعبة في وقت واحد. فتح الأبواب ، نقل العناصر ، باستخدام الأثاث. في نفس الوقت ، تقوم بتغيير ديناميكي في موضع الساقين والذراعين بحيث يمكن للشخصية أن تحمل واقعية بأدراج بأحجام مختلفة ، وتجلس على كراسي بأحجام مختلفة ، وتزحف أيضًا إلى مقاطع ذات ارتفاعات مختلفة.
عادة ، تحت سيطرة الشخصيات في الألعاب التي تستخدم الذكاء الاصطناعي ، فهذا يعني السيطرة الكاملة على الجهود المبذولة في الأطراف ، بناءً على نوع من المحركات الفيزيائية التي تحاكي قوانين الفيزياء. هذا هو مجال التعلم الآلي المسمى تعزيز التعلم. لسوء الحظ ، بهذه الطريقة ،
لا يمكن تحقيق الحركات الواقعية بعد.
من ناحية أخرى ، يمكنك محاولة تدريب الشبكة العصبية لمحاكاة حركات الأشخاص الحقيقيين الذين تم التقاطهم باستخدام Motion Capture. بهذه الطريقة ، منذ حوالي عام ، تم إحراز تقدم كبير في الرسوم المتحركة الواقعية لشخصيات ثلاثية الأبعاد.


كان هناك العديد من الأعمال العلمية المتتالية حول هذا الموضوع ، ولكن يمكن العثور على الوصف الأكثر اكتمالا في عمل "
نحو نحو Stuntman الظاهري " على الشبكة العصبية DeepMimic (
https://www.youtube.com/watch؟v=vppFvq2quQ0 ).
الفكرة الأساسية هي محاكاة الحركات البشرية أثناء التدريب لبدء الحلقة ليس من بداية مسار Motion Capture ، كما فعلوا من قبل ، ولكن من نقاط عشوائية على طول المسار بأكمله. تستكشف خوارزميات تعلم التعزيز الحالية محيط نقطة البداية ، لذلك في معظم الأحيان لم تصل إلى نهاية المسار. ولكن إذا بدأت كل حلقة على طول المسار بالكامل ، فستزداد فرصة تعلم الشبكة العصبية لتكرار المسار بأكمله.

في وقت لاحق ، تم التقاط هذه الفكرة في مناطق مختلفة تمامًا. على سبيل المثال ، من خلال تعليم الناس تشغيل شبكة عصبية في الألعاب ، وأيضًا بدء الحلقات ليس من البداية ، ولكن من نقاط عشوائية (خاصة في هذه الحالة ، من النهاية ، والانتقال تدريجياً إلى البداية) ، قام OpenAI بتدريس الشبكة العصبية
للعب Montezuma Revenge . والتي لم تستسلم لخوارزميات التعلم التعزيز المعتادة من قبل.
بدون هذه الخدعة ، انتهت محاولات تدريب الشبكة العصبية لنسخ الحركات المعقدة بالفشل لأن الشبكة العصبية وجدت مسارًا أقصر. على الرغم من عدم منح مثل هذه المكافأة الكبيرة كما هو الحال بالنسبة للمسار بأكمله ، ولكن لا يزال هناك نوع من المكافأة. على سبيل المثال ، بدلاً من القيام بشقلبة في الظهر ، ارتدت الشبكة العصبية ببساطة إلى حد ما وتراجعت على ظهرها.

ولكن مع هذا النهج ، فإن الشبكة العصبية دون أي مشاكل تدرس مسار أي تعقيد تقريبا.

تتمثل المشكلة الرئيسية لـ DeepMimic ، التي حالت دون تطبيقها مباشرة على ألعاب الفيديو ، في أنه لم يكن من الممكن تدريب الشبكة العصبية على أداء العديد من الرسوم المتحركة المختلفة في وقت واحد. كان من الضروري تدريب شبكة عصبية منفصلة لكل الرسوم المتحركة. حاول المؤلفون الجمع بينهما بطرق مختلفة ، لكن لا يمكن الجمع بين أكثر من 3 إلى 4 رسوم متحركة.
في العمل الجديد ، لم يتم حل هذه المشكلة تمامًا ، ولكن تم إحراز تقدم كبير نحو الانتقال السلس بين الرسوم المتحركة المختلفة.
تجدر الإشارة إلى أن هذه المشكلة تؤثر على جميع الشبكات العصبية المتحركة الموجودة حاليًا. على سبيل المثال ،
هذه الشبكة العصبية ، المدربة أيضًا على تقليد Motion Capture ، قادرة على التحكم بصدق في عدد ضخم من العضلات (326!) ذات طابع بشري على محرك مادي. التكيف مع الأوزان المختلفة للأوزان المرفوعة وإصابات المفاصل المختلفة. ولكن في نفس الوقت ، لكل الرسوم المتحركة ، هناك حاجة إلى شبكة عصبية منفصلة المدربين.
يجب أن يكون مفهوما أن هدف هذه الشبكات العصبية ليس فقط لتكرار الرسوم المتحركة البشرية. وكرره على محرك الفيزياء. في الوقت نفسه ، تجعل خوارزميات التعلم المعزز هذا التدريب موثوقًا به ومقاومًا للتداخل. بعد ذلك ، يمكن نقل هذه الشبكة العصبية إلى روبوت مادي يختلف في الشكل الهندسي أو في الكتلة عن أي شخص ، لكنه سيستمر في تكرار حركات الأشخاص بشكل واقعي (بدء التدريب من نقطة الصفر ، كما ذكرنا سابقًا ، لم يتحقق هذا التأثير بعد). أو ، كما في العمل أعلاه ، يمكنك فعليًا استكشاف كيفية تحرك الشخص المصاب بجروح في الساق من أجل تطوير أطراف صناعية أكثر راحة.
حتى في أول DeepMimic كانت هناك بدايات مثل هذا التكيف. كان من الممكن تحريك الكرة الحمراء ، وألقت الشخصية عليه الكرة في كل مرة. تهدف وقياس قوة الرمي لضرب الهدف بالضبط. على الرغم من أنه تم تدريبه على مسار Motion Capture الوحيد الذي لا يوفر مثل هذه الفرصة.

لذلك ، يمكن اعتبار ذلك تدريبًا كاملًا على الذكاء الاصطناعى ، وتقليد الحركات الإنسانية يتيح لك ببساطة تسريع عملية التعلم وجعل الحركات أكثر جاذبية بصريا ، مألوفة لنا (على الرغم من أنها من وجهة نظر الشبكة العصبية ، فإنها قد لا تكون الأكثر مثالية في نفس الوقت).
ذهب
عمل جديد أبعد من ذلك في هذا الاتجاه.
لا يوجد محرك مادي ، بل هو نظام رسوم متحركة خالص لألعاب الفيديو. لكن التركيز على التبديل الواقعي بين الرسوم المتحركة المتعددة. والتفاعل مع عناصر اللعبة: تحريك العناصر واستخدام الأثاث وفتح الأبواب.

تتكون بنية الشبكة العصبية من جزأين. واحد (Gating network) ، استنادًا إلى الحالة الحالية للولاية والهدف الحالي ، يختار الرسوم المتحركة المراد استخدامها ، والآخر (شبكة التنبؤ بالحركة) التي تتوقع الإطارات التالية للرسوم المتحركة.

تم تدريب كل هذا على مجموعة من مسارات التقاط الحركة باستخدام محاكاة التعلم التعزيز.
لكن الإنجاز الرئيسي لهذا العمل مختلف. في كيفية قيام المطورين بتدريس الشبكة العصبية للعمل مع كائنات ذات أحجام مختلفة والضغط على مقاطع ذات عروض أو ارتفاعات مختلفة. بحيث تبدو مواقف الذراعين والساقين واقعية وتتوافق مع حجم الكائن الذي تتفاعل معه الشخصية في اللعبة.
السر كان بسيطا: زيادة!
أولاً ، من مسار الالتقاط Motion Capture ، حددوا نقاط تلامس الأيدي مع مساند ذراع الكرسي. ثم استبدلوا نموذج الكرسي بنموذج أوسع ، وأعدوا حساب مسار الالتقاط ، بحيث لمست الأيدي مساند الذراعين في نفس النقاط ، ولكن على كرسي أوسع. وأجبروا الشبكة العصبية على محاكاة هذا المسار الجديد الذي تم إنشاؤه بواسطة Motion Capture. بالمثل مع أبعاد الصناديق ، ارتفاع الممرات ، إلخ.

كرر هذا الأمر عدة مرات باستخدام نماذج ثلاثية الأبعاد للبيئة التي سيتفاعل بها اللاعب ، فقد تعلمت الشبكة العصبية التعامل مع الكائنات ذات الأحجام المختلفة بشكل واقعي.

للتفاعل مع البيئة في اللعبة نفسها ، كان من الضروري بالإضافة إلى ذلك تحجيم الكائنات الموجودة حولها بحيث تعمل كأجهزة استشعار عند إدخال الشبكة العصبية.

وكانت النتيجة الرسوم المتحركة جيدة للغاية لشخصيات اللعبة. مع الانتقال السلس بين الإجراءات والقدرة على التفاعل بشكل واقعي مع الأشياء ذات الأحجام المختلفة.
أوصي بشدة بمشاهدة الفيديو إذا لم يقم أي شخص بذلك بالفعل. وهو يصف بتفصيل كبير كيف حققوا هذا.
يمكن استخدام هذا النهج للرسوم المتحركة ، بما في ذلك الحيوانات ذات الأرجل الأربعة ، والحصول على جودة وواقعية غير مسبوقة لحركات الحيوانات والوحوش:
مراجع
فيديوصفحة المشروع مع المصدرملف PDF مع وصف مفصل للعمل:
SIGGRAPH_Asia_2019 / Paper.pdf