الذكاء الاصطناعي مايكروسوفت تتقن جونغ



أنشأ علماء من Microsoft Research (MSR) آسيا نظامًا للذكاء الاصطناعي (AI) تعلم تعقيدات لعبة mahjong. تعتبر لعبة Mahjong واحدة من أصعب الألعاب من حيث إتقان الخوارزميات هناك عامل عشوائي في ذلك.

كان Super Phoenix (Suphx) أول نظام لمنظمة العفو الدولية يحصل على المرتبة العاشرة على المرتبة Tenhou ، وهي منصة منافسة على الإنترنت ريتشي جونغ مع أكثر من 300000 مشارك من جميع أنحاء العالم. 180 شخص فقط لديهم هذه المؤهلات. هذا هو أقصى تفريغ للخوارزمية في الوقت الحالي ، حيث يلعب عدد قليل فقط من المحترفين المعترف بهم على مستوى أعلى.

لإنشاء النظام ، تم استخدام تعلم التعزيز العميق - مبدأ شامل لخوارزميات التعلم على أساس مزيج من التعلم العميق والتعلم التعزيز. يتقن Suphx تعقيدات mahjong من خلال المشاركة في 5000 لعبة في 4 أشهر. زاد النظام تدريجيا من جودة وسرعة اللعبة. الآن الخوارزمية لديها استراتيجيتها الخاصة ، والتي تشمل حركات ضعيفة عمدا ، مما يتيح في النهاية الحصول على ميزة أكبر.

على عكس لعبة الشطرنج والذهاب ، والتي حققت فيها منظمة العفو الدولية بالفعل تقدماً ملحوظاً ، فإن لعبة mahjong هي لعبة تحتوي على معلومات غير كاملة. ليست كل العوامل معروفة للمشاركين ، على سبيل المثال ، من المستحيل رؤية الصور على مفاصل الخصم. تشبه عملية اللعبة لعبة البوكر - يحتاج المشاركون إلى ذاكرة جيدة ومراقبة وتفكير استراتيجي وقدرة على الخداع.

وفقًا لعلماء من MSR ، يمثل وجود عامل عشوائي في لعبة mahjong تحديًا فريدًا لأنظمة الذكاء الاصطناعي ، ويمكن أن تجد الخبرة المكتسبة في تدريس الخوارزميات للمشاكل غير الخطية تطبيقه في مواقف الحياة الواقعية التي تنطوي على مجموعة من العوامل غير المعروفة.
قامت شركة Microsoft Research و Maluuba بتدريب الذكاء الاصطناعي في السابق للسيدة Ms. تم إصدار Pac-Man في واحدة من أولى لوحات المفاتيح Atari 2600. وحطمت الخوارزمية الرقم القياسي العالمي بـ 999،990 نقطة ، بينما كانت أفضل نتيجة للشخص هي 266،360 نقطة.

Source: https://habr.com/ru/post/ar469071/


All Articles