Libratus لعبة البوكر الاستراتيجية بوت تكييفها لمحاكاة عسكرية

في عام 2017 ، تصدرت لعبة البوكر Libratus عناوين الصحف عندما تغلبت على أربعة محترفين في لعبة Hold'em غير محدودة على مسافة 120000 توزيع ورق. الآن تم تكييف التكنولوجيا للاستخدام العسكري .

يقوم مطورو أنظمة الذكاء الاصطناعي الضعيفة في كثير من الأحيان بمقارنة فعالية برامجهم في مواجهة اللعبة ضد البشر. في الألعاب التي تحتوي على معلومات كاملة في أي وقت أثناء اللعبة ، يكون لدى جميع اللاعبين معلومات كاملة عن حالة اللعبة ، أي عن الموضع وجميع التحركات المحتملة لأي من اللاعبين. على عكس مثل هذه المواقف الحتمية ، في الألعاب التي تحتوي على معلومات غير كاملة ، يتم إخفاء جزء من المعلومات حول حالة اللعبة عن اللاعب - على سبيل المثال ، بطاقة الخصم. بلا حدود hold'em هي مجرد واحدة من هذه الألعاب. بالإضافة إلى بطاقات الخصم المغلقة ، تتم إضافة عنصر من عدم اليقين هنا بسبب الحجم التعسفي لكل رهان. مع وضع ذلك في الاعتبار ، يقدر عدد النتائج المحتملة بـ 10 161 . إن وضع استراتيجية مثالية في مواجهة حالة عدم اليقين ، مع الأخذ في الاعتبار تكتيكات الخصم ، هو بالضبط ما يحتاجه الجيش.

تم إنشاء Libratus ("متوازن" من اللغة اللاتينية) من قبل باحثين من جامعة كارنيجي ميلون لاختبار أفكار اتخاذ القرار الآلي على أساس نظرية اللعبة. في بداية العام الماضي ، بعد انتصار ساحق على المحترفين ، أسس المؤلف الرئيسي للبرنامج ، البروفيسور توماس ساندهولم ، شركة ناشئة تدعى "إستراتيجية الروبوت" لتكييف تكنولوجيا الألعاب لتستخدمها الحكومة. على سبيل المثال ، في ألعاب الحرب والمحاكاة لدراسة الاستراتيجية العسكرية والتخطيط. في أواخر شهر أغسطس ، وفقًا للسجلات العامة ، أبرمت الشركة عقدًا مدته سنتان مع الجيش الأمريكي بقيمة تصل إلى 10 ملايين دولار ، وتم توفير التمويل من قبل وحدة الدفاع عن الابتكار ، التي شكلها البنتاجون في عام 2015 لتحسين الاتصالات مع شركات وادي السيليكون وإدخال نشاط جديد بشكل أكثر فعالية التكنولوجيا.


إستراتيجية Libratus في مراحل التوزيع المختلفة. بناءً على نتائج التوزيع ، يتم تحديد نموذج اللعبة ضد خصم محدد

بنيت Libratus على نظرية اللعبة الحسابية (الحسابية). في المواجهات الفردية مع المحترفين ، فاز الروبوت بأكثر من 1.8 مليون دولار تقليدي: خلال الدورة ، قام بتطوير استراتيجيات مراهنة قوية وأظهر حتى إمكانية الخداع.

Sandholm واثق من أن هذا النهج ينطبق على العديد من الألعاب الأخرى ، وكذلك المحاكاة العسكرية. في أيامنا هذه ، تختبر التدريبات العسكرية عادة عددًا صغيرًا فقط من الاستراتيجيات للمعارضين الوهميين: "هذا يفتح العديد من فرص الاستغلال ، لأن الخصم الحقيقي قد لا يلعب وفقًا لافتراضاتك " ، كما يقول الأستاذ.

ترفض Sandholm مناقشة تفاصيل مشاريع Strategy Robot ، على الرغم من أن الشركة أبرمت عقدًا حكوميًا واحدًا آخر على الأقل. يقول إن البرنامج يساعد في محاكاة المهام ، والتي تشمل اتخاذ القرارات في الفضاء المادي المحاكاة ، على سبيل المثال ، أين تضع الوحدات العسكرية.

تشير تقنية لعبة البوكر Libratus إلى أن الروبوت الاستراتيجي قد يعطي الجيش بعض التوصيات المدهشة. فوجئ اللاعبون المحترفون الذين عارضوا الروبوت ، خلال البطولة ، بأنهم تحولوا بشكل غير متوقع من تكتيكات صارمة إلى تكتيكات مفرطة العدسة ، لذلك من المستحيل التنبؤ بتصرفاته - لكن كل تصرفات الروبوت تهدف بشكل صارم إلى الفوز. يقول ساندهولم: "هذا غريب لأنه لا يوجد انطباع بأنه يلعب أفضل منك ، ولكن بعد ذلك تنظر إلى النتيجة وتفهم ما حدث".

وفقًا للخبراء ، يمكن لهذه التقنيات أن تجعل الألعاب الحربية وعمليات المحاكاة أكثر فائدة ، على الرغم من أن النتائج ستبقى فقط أحد مكونات التخطيط الاستراتيجي. العالم الحقيقي أكثر تعقيدًا وإرباكًا من السيناريوهات القادرة على إتقان أفضل تقنيات الذكاء الاصطناعي.

ليست روبوتات ليباتوس هي المحاولة البنتاغون الوحيدة لتطبيق نظرية اللعبة الحديثة وضعف الذكاء الاصطناعي في الشؤون العسكرية. أطلقت وكالة الأبحاث DARPA برنامجًا خاصًا يسمى "التفاعل المستمر في الألعاب التي تحتوي على معلومات غير كاملة فيما يتعلق بتبني القرارات العسكرية المعقدة (SI3-CMD)" . يقول Michael Wellman ، الأستاذ في جامعة ميشيغان ، يوضح مثال Libratus: أن التكنولوجيا أصبحت جاهزة للاستخدام في العالم الحقيقي: "لقد كان الاختراق في لعبة البوكر مذهلاً ، والأمور تسير بسرعة مع ألعاب أخرى. لقد حان الوقت لتجربته في مناطق أكثر واقعية ".

بالإضافة إلى Strategy Robot ، أسس البروفيسور Sandholm بدء تشغيل استراتيجي آخر للماكينة ، حيث يقوم بتكييف الروبوت الاستراتيجي للمهام التجارية مثل أسواق الكهرباء والرياضة وألعاب الكمبيوتر.

تقنيات الذكاء الاصطناعى تهم الجيش ليس فقط في الولايات المتحدة ، ولكن أيضا في روسيا والصين ، يكتب Wired . لا يشارك البروفيسور ساندهولم المخاوف بشأن هذا. إنه يعتقد أن الذكاء الاصطناعي "سيجعل العالم أكثر أمانًا".

Source: https://habr.com/ru/post/ar436958/


All Articles