معهد ماساتشوستس للتكنولوجيا روبوت يتعلم Jenga الاعتماد على الرؤية واللمس



يمكن أن يساعد النهج الخاص في التعلم الآلي على تعلم الروبوتات كيفية تجميع الهواتف والعمل مع الأجزاء الصغيرة الأخرى على خط التجميع.

في الطابق السفلي من المبنى الثالث لمعهد ماساتشوستس للتكنولوجيا ، ينعكس الروبوت بعناية على حركته التالية. إنه يلطف البرج بلطف من الكتل ، ويبحث عن الكتلة الأنسب للتمدد ، حتى لا يدمر البرج بأكمله. وغني عن ذلك لعبته المنفصلة ، بطيئة ولكن ديناميكية بشكل مدهش من Jenga.

تم تصميم الروبوت ، الذي طوره مهندسون من معهد ماساتشوستس للتكنولوجيا ، بقبضة ناعمة وسوار مزود بمستشعر ضغط وكاميرا خارجية - وهم يستخدمون كل هذا لرؤية البرج بأكمله وكتله الفردية وشعورهما بهما.

بينما يضغط الروبوت برفق على الوحدة ، ينظر الكمبيوتر إلى ملاحظات مرئية وملموسة من الكاميرا والسوار ، ومقارنة القياسات مع التحركات السابقة. كما أنه يحسب النتائج المحتملة لهذه التحركات - على وجه التحديد ، هل سيكون من الممكن استخراج كتلة معينة بنجاح ، بالنظر إلى التكوين المحدد للبرج وبتطبيق القوة من حجم معين. ثم ، في الوقت الفعلي ، "يتعلم" الروبوت ما إذا كان من الضروري الاستمرار في الضغط على الكتلة ، أو ما إذا كان من الضروري التبديل إلى مبنى جديد لمنع سقوط البرج.

تم نشر وصف مفصل للروبوت الذي يلعب "Jenga" في يناير في مجلة Science Robotics. البرتو رودريغيز ، أستاذ مشارك ، مركز التوظيف يقول والتر هنري غيل من قسم الهندسة في معهد ماساتشوستس للتكنولوجيا إن الروبوت يوضح شيئًا كان من الصعب تحقيقه عند تطوير أنظمة سابقة: القدرة على التعلم بسرعة أفضل طريقة لإنجاز مهمة ، ليس فقط من خلال البيانات المرئية ، والتي تستخدم غالبًا في علم الروبوتات ، ولكن أيضًا من خلال اللمس المادي التفاعل.

"على عكس المهام أو الألعاب التي تم شغلها بشكل منطقي ، على سبيل المثال ، لعبة الشطرنج أو الذهاب ، للعب Dzhenga ، فإنك تحتاج إلى امتلاك مهارات بدنية جيدة - للبحث عن الكتل وسحبها ووضعها ومحاذاةها. وهذا يتطلب الإدراك التفاعلي والتلاعب ، تحتاج إلى لمس البرج لفهم كيف ومتى تحريك الكتل ، كما يقول رودريغيز. - من الصعب للغاية محاكاة هذه المهمة ، لذلك يجب أن يتعلم الروبوت في العالم الحقيقي ، والتفاعل مع برج Jenga الحقيقي. تكمن الصعوبة الرئيسية في الحاجة إلى التعلم من عدد قليل نسبياً من التجارب ، باستخدام الحس السليم عند تطبيقها على الأشياء والفيزياء ".

يقول إن نظام التعلم عن طريق اللمس الذي طوروه يمكن استخدامه في مهام أخرى غير Jenga ، وخاصة تلك التي تتطلب تفاعلًا بدنيًا دقيقًا ، مثل فرز النفايات القابلة لإعادة التدوير أو تجميع المنتجات الاستهلاكية.

يقول رودريغيز: "في خط التجميع للهواتف ، تحتاج في كل خطوة تقريبًا إلى الشعور بأن الجزء في مكانه ، أو أن البرغي محكم - كل هذا يأتي من إحساس اللمس والقوة ، وليس الإحساسات المرئية". "النماذج التعليمية لمثل هذه الإجراءات هي الجزء الأكثر لذيذًا من هذه التكنولوجيا اليوم."

المؤلف الرئيسي للعمل هو طالبة الدراسات العليا بمعهد ماساتشوستس للتكنولوجيا نعمة فاسيلي. ويضم الفريق أيضًا: ميكيل أولر ، وجياجون وو ، وتشنغ وو ، وجوشوا تينينباوم ، أستاذ العلوم المعرفية وأبحاث الدماغ في معهد ماساتشوستس للتكنولوجيا.


ادفع دفع


في لعبة "Jenga" ، والتي تعني في اللغة السواحيلية "build" ، يتم وضع 54 قالبًا مستطيلًا في 18 طبقة من 3 كتل لكل منها ، بحيث تكون الطبقات في الطبقات المجاورة عموديًا على بعضها البعض. الهدف من اللعبة هو إزالة الكتل بعناية ووضعها على قمة البرج ، وبناء مستوى جديد حتى لا يسقط البرج.

لبرمجة روبوت لتشغيل Jenga ، ستتطلب مخططات التعلم الآلي التقليدية وصف كل ما يمكن أن يحدث عندما تتفاعل كتلة وروبوت وبرج - هذه حسابات مكلفة للغاية تتطلب معالجة البيانات من الآلاف أو حتى عشرات الآلاف من المحاولات للحصول على كتلة.

بدلاً من ذلك ، بدأ رودريجيز وزملاؤه في البحث عن طريقة أكثر فعالية من وجهة نظر استخدام البيانات ، لكي يتعلم الروبوت كيفية لعب لعبة "Jenga" ، مستوحاة من القدرات المعرفية البشرية وكيف يمكننا أن نتعامل مع هذه اللعبة.

قام الفريق بتكييف معيار القبضة الآلية ABB IRB 120 للصناعة من أجل المهمة ، ثم قام بتثبيت برج Jenga في مكان يمكن الوصول إليه لالتقاط الصور ، وبدأت فترة التدريب. في البداية ، اختار الروبوت كتل عشوائية والمكان على الكتلة حيث كان من الضروري الضغط. ثم بذل القليل من الجهد ، في محاولة للضغط على كتلة خارج البرج.

أثناء كل محاولة ، سجل الكمبيوتر القياسات المرئية واللمسية المرتبطة به ، ولاحظ ما إذا كانت ناجحة.

بدلاً من إجراء عشرات الآلاف من هذه المحاولات (عندها يجب استعادة البرج عدة مرات) ، تم تدريب الروبوت بنسبة 300 فقط. تم تجميع محاولات إجراء قياسات ونتائج مماثلة ، مما يشير إلى جوانب معينة من سلوك الكتل. على سبيل المثال ، قد تشير إحدى مجموعات البيانات إلى محاولات لتحريك كتلة تقاوم الحركة ، ومجموعة أخرى - العمل مع كتلة تتحرك بسهولة ، وثالثة - محاولات أدت إلى سقوط البرج. بالنسبة لكل مجموعة من البيانات ، طور الروبوت نموذجًا بسيطًا يتنبأ بسلوك الكتلة استنادًا إلى قياساتها المرئية واللمسية الحالية.

يقول فاسيلي إن تقنية التجميع هذه تزيد بشكل خطير من الكفاءة التي يتعلم بها الروبوت هذه اللعبة ، وكان مستوحى من الطريقة الطبيعية التي يجمع بها الناس السلوكيات المماثلة للأجسام. "يقوم الروبوت بإنشاء مجموعات من البيانات ثم يتعلم النماذج لكل من هذه المجموعات ، بدلاً من تعلم النموذج ، ويصف كل شيء يمكن أن يحدث من حيث المبدأ."

جمع المكدس


اختبر الباحثون مقاربتهم بمقارنتها بخوارزميات MO المتقدمة في محاكاة الكمبيوتر للعبة باستخدام محاكي MuJoCo. البيانات التي تم الحصول عليها في أجهزة المحاكاة تسمح للعلماء بفهم كيفية تعلم الروبوت في العالم الحقيقي.

يقول أولر: "إننا نوفر لهذه الخوارزميات نفس البيانات التي يتلقاها نظامنا لمعرفة كيف يمكنهم تعلم كيفية لعب Jenga بمستوى مماثل". "مقارنةً بنهجنا ، فإن هذه الخوارزميات لإتقان اللعبة كان عليها أن تلعب مع عدد الأبراج ، عدة أوامر بحجم أكبر مما لدينا".

أصبح الفريق مهتمًا بما إذا كان نهجهم تجاه منطقة موسكو يمكن أن يتنافس مع لاعبين بشريين ، وعقد العديد من المسابقات غير الرسمية مع المتطوعين.

يقول أولر: "نظرنا في عدد الكتل التي يمكن للرجل أن يخرجها من البرج قبل سقوطه ، والفرق لم يكن بهذا الحجم".

ومع ذلك ، هناك طريقة لحفر الروبوت والبشر حقًا ، إذا أراد الباحثون ذلك. بالإضافة إلى التفاعل المادي ، للعب "Jenga" ، فإنك تحتاج إلى إستراتيجية ، حيث تقوم بإخراج كتلة مناسبة بحيث يكون من الصعب على خصمك سحب الكتلة التالية دون إسقاط البرج.

حتى الآن ، لا يهتم الفريق بإنشاء روبوت يفوز بـ "Jenga" ، فهو أكثر انشغالًا باستخدام مهاراته الجديدة في مجالات أخرى.

يقول رودريغيز: "هناك العديد من المهام التي نؤديها بأيدينا ، حيث يمكن التعبير عن شعور" القيام بذلك بشكل صحيح "بلغة القوة والمطالبات اللمسية". "قد يكون نهج مماثل لمنهجنا مفيدًا لمثل هذه المهام."

Source: https://habr.com/ru/post/ar441422/


All Articles