كيف جعلت Boston Dynamics BigDog قائمة بذاتها


في الأسبوع الماضي ، اكتشفنا كيف تعمل خوارزمية تنسيق المشية BigDog الأسطورية. لم يكن الروبوت مستقلاً بعد ويمكنه عبور التضاريس فقط تحت سيطرة المشغل.

وافق معظم القراء في المرة الأخيرة على فكرة الترجمة الجديدة - حول كيفية تعلُّم BigDog كيفية الانتقال بشكل مستقل إلى النقطة الصحيحة والتنقل في الفضاء. حسنا ، في الواقع ، ها هو ذا.

يستخدم نظام الملاحة BigDog مزيجًا من المسح بالليزر المستوي والرؤية الاستريو والإدراك الحسي. بمساعدتها ، يتم تحديد موقع الروبوت في العالم المحيط. تكتشف العقبات وتضعها في نموذج ثنائي الأبعاد للعالم. ثم تخطط المسار وتتحكم في الروبوت لمتابعة المسار المختار. مخطط المسار هو شكل من أشكال خوارزمية البحث الكلاسيكية A *. تقوم خوارزمية التنعيم بمعالجة النتائج وتمريرها إلى خوارزمية تتبع المسار. يقوم بحساب أوامر التوجيه لـ BigDog.

تم اختبار النظام الموصوف في منطقة حرجية بها العديد من الأشجار والصخور والشجيرات. بالإضافة إلى المناطق المسطحة ، كان لديها أيضًا منحدرات (زوايا تصل إلى 11 درجة). تم إجراء ما مجموعه 26 اختبارًا ، نجح 88٪ منها. "رأى" الروبوت التضاريس داخل دائرة نصف قطرها 130 متراً عندما يتحرك بسرعة معينة وتغلب على أكثر من 1.1 كم.

المعدات


1) أجهزة استشعار الإدراك الحسي

تستخدم للسيطرة على مشية BigDog والملاحة المستقلة. تم تجهيز كل من 16 درجة نشطة و 4 درجات سلبية للحرية للروبوت بجهاز استشعار. أنها توفر بيانات عن الوضع الحالي والحمل. يتم دمج هذه المعلومات مع بيانات IMU لتقييم حالة الاتصال بالأرض ، وارتفاع الجسم ، وسرعة الجسم. بالإضافة إلى ذلك ، يشير عدد من أجهزة الاستشعار إلى حالة الدفع والحوسبة والأنظمة الهيدروليكية والحرارية وأنظمة BigDog الأخرى.


أجهزة استشعار BigDog: أ) هوائي GPS ؛ ب) ليدار ؛ ج) كاميرا ستيريو نحلة ؛ د) هانيويل IMU ؛ هـ) أجهزة استشعار المفاصل.

2) أجهزة الاستشعار exteroceptive

وقد تم تجهيز الروبوت بأربعة أجهزة استشعار خارجية: SICK LMS 291 lidar ، وكاميرا ستيريو Bumblebee PointGrey ، وجهاز استقبال NovAtel GPS و Honeywell IMU. تدخل البيانات منها النظام الموضح في الرسم البياني أدناه.


3) أجهزة الكمبيوتر

لتنفيذ النظام مع الرسم البياني أعلاه ، يتم استخدام جهازي كمبيوتر. الكمبيوتر الرئيسي BigDog هو PC104 مع معالج Intel Pentium M أحادي النواة (1.8 جيجاهرتز). يتفاعل مع أجهزة الاستشعار ذات الإدراك الحسي ، ويتحكم في توازن وحركة الروبوت ، ويحسب النموذج الحالي للبيئة والمسار من خلاله ، ويتحكم أيضًا في المشي.

يتم توفير Vision بواسطة كمبيوتر منفصل بمعالج Intel CoreDuo (1.7 غيغاهرتز). يتواصل مع زوج من الكاميرات ، ويكشف عن التناقضات ، ويقيم قياس اللون البصري ويدعم خريطة التضاريس ثلاثية الأبعاد. ينقل هذا الكمبيوتر الخريطة وبيانات قياس الضوء البصري إلى الكمبيوتر المضيف بتردد 15 هرتز من خلال الشبكة المحلية على متن الطائرة.

ميزة مثل هذا النظام هي القدرة على تبسيط مهمة التخطيط عن طريق تقسيمها إلى قسمين. البيانات من lidar والمستشعرات ثلاثية الأبعاد ، ولكن يمكننا الاعتماد على التثبيت الذاتي لنظام التحكم في المشي للتخلي عن الإدراك والتخطيط ثلاثي الأبعاد الأكثر تعقيدًا.

نهج تقني


في نهجنا التقني العام ، نستخدم البيانات من مستشعرين بيئيين لاكتشاف العوائق ، وحساب المسار عبر أو حول العوائق ، ونأمر نظام التحكم في المشي للروبوت باتباع مسار معين.

يمكن تقسيم العملية برمتها إلى ثلاث مراحل. أولاً ، تتم معالجة الصور من الكاميرا والليدار للحصول على قائمة بالنقاط التي تشير إلى العقبات في البيئة. ثم يتم تقسيم هذه النقاط إلى كائنات مفككة ويتم تتبعها لبعض الوقت. علاوة على ذلك ، يتم دمج هذه الكائنات في ذاكرة مؤقتة لرسم الخرائط. يستخدم هذا المخطط لتخطيط اتجاه السفر إلى وجهة وسيطة. تم تصميم المجدول للتحكم في أن مسارات BigDog تقع على مسافة مناسبة من العوائق وأن المسارات مستقرة في الفضاء أثناء تكرار المجدول. تجبر خوارزمية الحركة على طول مسار معين الروبوت على اتباع المسار المقصود ، وإرسال أوامر السرعة إلى نظام التحكم في المشي. تقوم بالتناوب بتحريك أطراف الروبوت.

أ. جمع المعلومات


1) تقييم الوضع

هناك مصدران للمعلومات اللونية: أجهزة استشعار حركية في الساقين ونظام رؤية اصطناعي. يتم جمع البيانات التي تم الحصول عليها منها لتقييم موقع الروبوت.



يستخدم نظام قياس الضوء معلومات حركية من الساقين لحساب حركات الروبوت. ويراقب نظام قياس المسافات البصري الخصائص البصرية لحساب الحركة. تستخدم كل من هذه الأدوات وحدة قياس القصور الذاتي (IMU) كمصدر للمعلومات للتوجه المكاني. يجمع العداد العام بين ناتج جهازي قياس المسافات هذين ، مع التركيز على قياس المسافات البصري بسرعات منخفضة وحركية في السرعات الأعلى. يقضي الجمع بين هذين المؤشرين على أوجه القصور في كل من العدادات: الفشل المحتمل لأنظمة الاستريو ، وانحراف قراءات عداد المسافات الموجودة في الأطراف أثناء التشغيل ، بالإضافة إلى أخطاء هذا المستشعر على طول المحور الرأسي.

وينتج الليدار المستخدم في روبوت BigDog صورة جديدة كل 13 مللي ثانية. يتم تحويل كل صورة إلى نظام إحداثيات خارجي مع المركز في موقع الروبوت. في هذه الحالة ، يتم استخدام المعلومات المتزامنة مع الوقت من عداد الموقع. ثم يتم إرسال سحابة النقاط ثلاثية الأبعاد الناتجة للمعالجة بواسطة خوارزمية التجزئة الموضحة أدناه. وبالمثل ، يقوم نظام الرؤية المجسمة بجمع خرائط غير مطابقة لبعض الوقت لإنشاء خريطة تضاريس ثلاثية الأبعاد في مساحة 4 × 4 متر تتمركز حول الروبوت. يحدد المرشح المكاني مناطق التغيرات البارزة في الارتفاع (أي العوائق المحتملة) وينقل قائمة بالنقاط التي تنتمي إلى هذه المناطق إلى خوارزمية تجزئة سحابة النقاط.

2) تجزئة سحابة نقطة وتتبع الكائن

بسبب عدم انتظام الأرض وحركات الروبوت ، سيتضمن جزء من بيانات الماسح الضوئي ليدار صورًا للأرض. تتشابه الانعكاسات من العوائق الطويلة (مثل الجدران) في الانعكاسات من سطح الأرض. من أجل التشغيل الناجح ، يجب على النظام تفسير هذه الانعكاسات بطريقة تمكنه من التحكم في الروبوت بالقرب من الجدران ، ولا يكون "خائفًا" من الأرض. الخطوة الأولى في هذه العملية هي تقسيم نقاط العوائق التي يوفرها اللدار وخريطة التضاريس إلى كائنات منفصلة. يتم تقسيم السحب النقطية الثلاثية الأبعاد النادرة إلى كائنات من خلال دمج نقاط فردية مفصولة بمسافة أقل من 0.5 متر.

يتم تعقب الكائنات التي تم الحصول عليها بفضل خوارزمية التجزئة لبعض الوقت. لإنجاز هذه المهمة ، نستخدم خوارزمية تكرارية جشعة مع قيود إرشادية. يتزامن الكائن في الصورة الحالية مع أقرب كائن من الصورة الأخيرة ، بشرط أن تكون الكائنات مفصولة بمسافة لا تزيد عن 0.7 متر.

نظرًا لحقيقة أن الغيوم النقطية يتم تقسيمها إلى كائنات وتتبعها لبعض الوقت ، يمكن للروبوت أن يتحرك بشكل كاف في البيئة مع تفاوت معتدل في الأرض وأنواع مختلفة من العوائق: الأشجار ، الحصى ، الجذوع الساقطة ، الجدران. يتم تحديد الأشجار والجدران بشكل رئيسي بواسطة ماسح ضوئي ليداري ، ويتم تحديد الحصى والسجلات بواسطة نظام رؤية مجسم.


سلسلة من الرسوم التوضيحية تظهر الروبوت (مستطيل أصفر) مع: أ) بيانات من ليدار (نقاط زرقاء) مسجلة في بضع ثوان ؛ ب) مرافق كل منهما. الأشياء البنية الطويلة هي الأشجار. وتظهر انعكاسات الأرض شفافة ومسطحة. الاسطوانة الخضراء هي الهدف. الخط الأزرق للمسار المحسوب يؤدي إليه. ج) منظر علوي لرسم الخرائط: يشار إلى المناطق ذات القيمة الأقل فتكًا باللون الأخضر ، بينما تظهر المناطق ذات القيمة الأعلى باللون الأرجواني. كل وحدة شبكية تقابل 5 أمتار.

تخطيط الملاحة


نهجنا في حل مشكلة الملاحة مقبول بشكل عام في المجتمع الآلي. يتم رسم نقاط العوائق (التي تم الحصول عليها بسبب عمليات الإدراك) على رسم خرائط مع المركز في موقع الروبوت. يتم عرض الهدف النهائي للروبوت على حدود رسم الخرائط ، ويتم تطبيق متغير من الخوارزمية A it عليه. تتكرر هذه العملية مرة واحدة في الثانية تقريبًا.

1) ذاكرة العقبات المتعقبة

نظرًا لمجال الرؤية المحدود لاثنين من مستشعرات الروبوت ، من الضروري أن يحتفظ الروبوت بذاكرة دقيقة للعقبات التي لم يعد بإمكانه رؤيتها. نظرًا لأن قائمة العناصر يتم توفيرها بواسطة نظام تتبع الكائنات ، تتم إضافة الكائنات الفردية أو تحديثها أو حذفها في ذاكرة الكائن لنظام التخطيط. حجم قائمة الكائنات محدود ، لذلك عند إضافة كائنات جديدة إليها ، يجب حذف الكائنات الأخرى.

بالإشارة إلى القائمة الحالية لكائنات المتغير O ، يمكننا حساب فئتين فرعيتين معلمتين من O:



هنا العمر (ف) هو الفرق بين الوقت الحالي ووقت آخر قياس للكائن ف ،
norm (q، r) inf - الحد الأدنى للمسافة بين الموقع الحالي للروبوت وحدود الكائن q.

يتم حذف الكائنات من O بالمعايير التالية:

  • تطرح المجموعة {P (30) ∩ Q (15)} من O. هذه كائنات أقدم من 30 ثانية وتقع على مسافة لا تزيد عن 15 مترًا عن الروبوت.
  • يتم طرح المجموعة {P (1800) ∩ Q (10)} من O. هذه الأشياء أقدم من نصف ساعة ولا تقع على مسافة قريبة من 10 أمتار من الروبوت.
  • تتم إزالة الكائنات من O عند الوصول إلى حد القائمة. يتم تحديد أولوية الكائن من خلال الوقت الذي تم تعقبه بنجاح من قبل المتتبع. وبعبارة أخرى ، فإن الأشياء التي "نظر إليها" الروبوت لفترة أطول يتم تخزينها لفترة أطول في الذاكرة.
  • ومع ذلك ، لا يتم تجاهل أي كائنات تم تتبعها في الثواني العشر السابقة.

يؤدي تخصيص موارد الذاكرة هذا إلى السلوك التالي: عندما تغادر الكائنات مجال رؤية مستشعرات الروبوت ، فإنها تنسى الأشياء والكائنات المحذوفة التي لم ترها عدة مرات. لا يتم نسيان الأشياء الموجودة في الأفق أو التي يتعذر الوصول إليها ، ولكنها تقع بالقرب من الروبوت.

2) إنشاء رسم خرائط

نستخدم رسم خرائط تم إنشاؤه على أساس شبكة ثنائية الأبعاد لتمثيل البيئة المحيطة بالروبوت. بدلاً من إنشاء رسم الخرائط بشكل حيوي (حيث يتلقى الروبوت معلومات بيئية جديدة) ، يتم تجميع رسم الخرائط الجديد مع كل تكرار للتخطيط ومليء بالعناصر من ذاكرة المجدول. ويترتب على ذلك أنه لا يمكن استخدام مخطط المسار الديناميكي بدلاً من خوارزمية A *. نظرًا لأننا نفترض أن حجم الأشياء محدود (أن غياب الطريق المسدود في البيئة هو أكثر من نصف الخريطة) ، فإن نطاق مهمة التخطيط ووقت حساب المسار صغير.

يمتلئ رسم الخرائط بقيم من قائمة الكائنات وفقًا للخوارزمية التالية:



يتم تعيين قيمة مميتة للغاية للخلايا حيث توجد الكائنات. يتم تعيين مؤشر الخلايا بالقرب من الكائن وفقًا للوظيفة f ، والتي تأخذ في الاعتبار المسافة الحالية إلى هذه النقطة. بالنسبة لنتائج الاختبار المعروضة هنا ، كان f ببساطة المكعب العكسي للمسافة.

تأثير هذا النهج هو أنه يتناقص تدريجيًا من الخلايا ذات القيمة العالية جدًا حيث يتحرك بعيدًا عنها (والأشياء التي تحددها).

3) استقرار المسار

للتأكد من أننا لا نتحكم في BigDog بطريقة عشوائية وغير منهجية ، يتم إيلاء اهتمام خاص لاستقرار المسار المخطط. يجب أن يكون مستقرًا قدر الإمكان من خلال تكرارات مخطط المسار. يتم توفير هذا بثلاث طرق.

أولاً ، نقطة البداية التي تم تمريرها إلى خوارزمية A * ليست الموضع الحالي للروبوت ، ولكن إسقاط موقعه في نقطة نهاية المسار المعطى من قبل خوارزمية A * (دعنا نطلق على هذه النقطة p). طالما أن BigDog يتبع المسار المخطط له ، فقد ينحرف قليلاً عنه بشكل جانبي. من خلال إسقاط نقطة البداية على نقطة الحساب السابق لخوارزمية A * ، نقوم بتصفية تقلب موضع الروبوت ، وتصبح المسارات التي يعرضها المجدول أكثر استقرارًا. إذا انحرف الروبوت عن المسار أكثر من القيمة المحددة (افتراضيًا هو 3 أمتار) ، يتم نقل النقطة p ببساطة إلى الوضع الحالي للروبوت.

ثانيًا ، من أجل التحقق من استمرارية مخطط المسار ، نحسب q - إسقاط موضع الروبوت من 2.5 ثانية في الماضي إلى النقطة الأخيرة المحسوبة بواسطة خوارزمية A *. ثم يضاف جزء آخر مسار مخطط من q إلى p إلى حساب المسار الجديد. ونتيجة لذلك ، يتتبع الروبوت مسافة صغيرة سبق قطعها المسار. وبفضل هذا ، تظهر خوارزمية تتبع المسار بشكل أفضل مع الانتهاكات الكبيرة للموقف ، والتي غالبًا ما تصادفها الروبوتات على أقدامها.

ثالثًا ، يتم تخزين بعض تاريخ المسارات المخطط لها في ذاكرة الروبوت. تُستخدم هذه المسارات لتقليل قيم تلك الخلايا في رسم الخرائط حيث ذهب الروبوت بالفعل ، مع زيادة قيمة الخلايا في المنطقة المحيطة. لذلك ، كقاعدة ، سيعيد المسار المخطط الجديد في نفس الاتجاه المسار الذي سلكه الروبوت بالفعل (ولكن بدون ضمان صارم لذلك).

4) تمهيد الطريق

المسار المحسوب ، لأنه يستند إلى شبكة عادية ، مسنن قليلاً. يمكن أن تؤدي التغييرات الكبيرة في الاتجاه إلى أوامر تحكم غير مرغوب فيها. لتجنب ذلك ، يتم تطبيق خوارزمية تجانس De Boer.

بالإضافة إلى ذلك ، غالبًا ما يؤدي تخطيط المسار المستند إلى الشبكة إلى مسارات مثالية تقنيًا ولكن أقل جاذبية إلى الهدف. نقوم بحل هذه المشكلة عن طريق حساب مسار سلس لكل تكرار للجدولة. للتكرارات اللاحقة ، يتم تعيين قيمة أقل لخلايا رسم الخرائط حيث يعمل المسار المنعم. وهذا يوفر مسارًا مباشرًا وأكثر سلاسة نحو الهدف.

السيطرة على المشي: التنقل والتوازن


يحدد نظام تخطيط الملاحة مسارًا جديدًا تقريبًا مرة واحدة في الثانية. خوارزمية لمتابعة مسار يعمل بتردد 200 هرتز يوجه الروبوت وفقًا لآخر مسار مخطط له. تنشئ هذه الخوارزمية مجموعة من الأوامر على شكل سرعات الجسم المطلوبة ، بما في ذلك السرعة الأمامية والسرعة الجانبية ومعدل انحراف الجسم. يتم نقل هذه السرعات إلى وحدة التحكم في المشي ، والتي تتحكم في حركة الساقين.

بناءً على المسافة بين الروبوت والمسار ، يتم استخدام واحدة من ثلاث استراتيجيات. إذا كان الروبوت يقع بالقرب من جزء من المسار ، فإنه يبدأ في التحرك قطريًا حتى يدخله من الجانب ، يتحرك بأقصى سرعة. إذا كان الروبوت بعيدًا عن المسار ، فإنه يوجه تمامًا إلى النقطة المطلوبة. في موقع متوسط ​​، يتم استخدام مجموعة من هذه الاستراتيجيات.

وصف مفصل لخوارزميات التحكم في المشي خارج نطاق هذه المقالة. ومع ذلك ، كقاعدة ، تعمل سرعات الجسم كمدخلات تحكم لوحدات تحكم مشية BigDog ذات المستوى المنخفض. ينتج جهاز التحكم في المشي أوامر القوة والموضع لكل وصلة لضمان الاستقرار ، ويستجيب للشذوذ ويوفر سرعات الجسم الضرورية. على الرغم من أن حسابات خوارزمية محقق المسار يمكن استخدامها لأي مشية BigDog ، فإن الهرولة هي الأمثل بسبب السرعة والقدرة على عبور التضاريس الوعرة.

نتائج الاختبار الميداني


تم تركيب جهاز الاستشعار ونظام الملاحة الموصوف أعلاه على BigDog وتم اختباره خارج المختبر. وأجريت الاختبارات في منطقة بها العديد من الأشجار والصخور والشجيرات والتلال ذات المنحدرات حتى 11 درجة. يوضح الشكل 1 أمثلة المناظر الطبيعية. يوضح الشكل 2 البيانات من ليدار معالجتها بواسطة الروبوت.


التين. 1. التضاريس التي أجريت فيها الاختبارات


التين. 2. الاختبار ، منظر علوي. تم استلام الصورة من كاميرات ليدار وستيريو. المناطق المظلمة هي الأشجار والعقبات الأخرى. حجم الشبكة 5 أمتار.

تم تطوير نظام الملاحة والمخطط على مدى 7 أشهر ، مع اختبارات منتظمة مرة كل خمسة أسابيع تقريبًا. نتائج أحدث الاختبارات موصوفة هنا.

من بين 26 اختبارًا تم إجراؤها ، انتهى 23 بنجاح: وصل الروبوت إلى الهدف ، ولم يواجه أيًا من العقبات ، ولم يكن قريبًا من ذلك. تم وضع علامة على نتائج هذه الاختبارات في PivotTable كهدف. سقط الروبوت في نهاية اختبار واحد فقط بعد أن داس على حجر صغير. عادة ما يتكيف نظام التحكم في المشي مع مثل هذه المواقف ، ولكن ليس هذه المرة (يتم تمييز النتيجة في الجدول باسم Fall - "Fall"). ( 20 ). , (20 ). , . Live-lock («»).



26 . Live-lock , .

— robo-hunter.com :

  • ;
  • ;
  • .

YouTube

Source: https://habr.com/ru/post/ar411711/


All Articles