فاز AlphaGo بلعبة Lee Sedol الحاسمة الثالثة

النصر الثالث للذكاء الاصطناعي في سلسلة تاريخية من خمس مباريات في العاشر


Go هي لعبة منطق شرق آسيوية ذات تاريخ قديم وتقاليد ثقافية غنية. هناك العديد من القواعد والاختلافات ، ولكن الهدف الرئيسي هو نفسه: يحتاج كل لاعب من اللاعبين إلى إبعاد المنطقة ذات أكبر حجم ممكن بالحجارة من لونه الخاص. ينجذب باحثو الذكاء الاصطناعي في التعقيد. لقد فات الأوان للتغلب على الشطرنج - لقد لعبت أجهزة الكمبيوتر بشكل أفضل من البشر منذ عدة سنوات حتى الآن. ولكن في الحال ، فإن عدد المواقف المحتملة أعلى بكثير (10 100 ) من الشطرنج. البرامج الحديثة تلعب بشكل جيد ، ولكن على مستوى عشاق الذهاب. قبل إنشاء نظام قادر على التغلب على أفضل الناس ، في أفضل الأحوال عقد من الزمن.

لذلك قال الخبراء قبل ظهور AlphaGo. يستخدم التطوير من DeepMind (اشترت Google الشركة في عام 2014) طريقة Monte Carlo. تستخدم أفضل أنظمة الكمبيوتر الحديثة هذه التكنولوجيا. ولكن في AlphaGo ، تساعد التحركات أيضًا في اختيار الشبكات العصبية للسياسة والقيم. يمكن أن يطلق عليهم أقارب الشبكات العصبية التي تتعرف على الصور والكلام. تم تعليم النظام لأول مرة للعب على 160 ألف لعبة من خادم KGS. ثم تدربت AlphaGo في الألعاب ضد نفسها.

وللمرة الأولى ، جذبت عينة الذكاء الاصطناعي الانتباه في يناير. ثم نشرت Google ورقة علمية عن AlphaGo ، ذكرت مباراة أكتوبر 2015. خسر البطل الأوروبي ثلاث مرات Fan Hui التطور الجديد في خمس من أصل خمس مباريات.

ويعتقد أن المستوى الأوروبي من الذهاب أقل مما هو عليه في وطن اللعبة في آسيا. أثارت الحركات الفردية وأخطاء هوى أسئلة. لذلك ، كان اللاعبون المتحمسون وعشاق الذكاء الاصطناعي يتطلعون إلى مباراة AlphaGo Seoul ضد أحد أفضل ممثلي فريق الأشخاص - صاحب التاسع المحترف دان لي سيدول .

حتى مارس ، كان السؤال كما يلي: هل لدى AlphaGo فرصة ضد Lee Sedola ؟ لكن Sedol فقدوا كلا الأولى و الثانيةحزب. إذا أبدى سيد دان التاسع تفاؤلاً بعد المباراة الأولى ، فقد غادر بعد المباراة الثانية في حيرة من أمره . صرح Sedoll أنه لم ير اللحظات التي لعب فيها اللعبة.

اليوم كان الدفعة الثالثة. حضر المباراة الرئيس التنفيذي السابق لشركة Google Eric Schmidt ، أحد المهندسين المهمين في الشركة ، Jeff Dean ، و Sergey Brin ، الذي وصل إلى سيول في اليوم الآخر. من الواضح أن الانتصار يرمز إلى أهمية تقنيات تعلُم الآلة ، والتي تعد جوهر Google. من اليسار إلى اليمين: مؤسس DeepMind Demis Hassabis ، مالك دان المحترف التاسع لي سيدول ، المؤسس المشارك لشركة Google ، سيرجي برين.




كما هو الحال في اللعبة الأولى ، أصبح Sedol أسود ، أي الأول. أيضا ، يمكن تضمين التعارف مع النظام من بين النقاط الجيدة - لم يكن لدى مهندسي DeepMind الموارد لتغيير شيء ما في أيام المباراة. تدعي الشائعات على الأقل أن Sedoll وفريق من خبراء الذهاب أمضوا الليل في البحث عن نقاط ضعف AlphaGo. كانت تحركات بلاك الأولى عدوانية. يبدو أن Sedol كان يحاول أخذ اللعبة في اتجاه مختلف ، محاولاً الضغط على نقاط الضعف في النظام.


بث فيديو للجزء الثالث من مباراة AlphaGo - Lee Sedol.

خلال اللعبة ، أظهر الذكاء الاصطناعي القدرة على العمل في اللحظات الصعبة في شكل مواقع كو. ويعتقد أن الكمبيوتر يذهب أنظمة تتعامل بشكل سيئ مع كو. بحلول نهاية المباراة الثالثة ، نفاد الوقت ، لذا كان على الرجل التفكير في التحركات لمدة دقيقة.

بعد 176 خطوة ، انتهت اللعبة بفوز نظام AlphaGo. بقي لدى منظمة العفو الدولية 8 دقائق و 31 ثانية على مدار الساعة.



هذا هو الفوز الثالث على التوالي لـ AlphaGo في السلسلة. يتم تحديد النتيجة الإجمالية للسلسلة التاريخية لخمس مباريات. تم تحديد مصير المكافأة النقدية - من الواضح أنه سيذهب الآن إلى الأعمال الخيرية وتطوير الذهاب ، كما كان مقصودًا في حالة هزيمة الشخص. ستحدد المباراتان الأخيرتان يومي الأحد والثلاثاء عمق عرض فوائد AlphaGo - على الرغم من الاستنتاج الواضح للمسلسل ، إلا أنه سيستمر اللعب.


في آذار (مارس) الماضي ، تغلب النظام على لاعب دان المحترف الثاني ، وهو اليوم يتجاوز حوالي الدان التاسع. ربما ساعد ذلك حقيقة أن نظام AlphaGo تدرب في الألعاب ضد نفسه على مدى الأشهر الخمسة الماضية. كما يؤكد على الخيار الذي فاز فان هوي رئيس DeepMind ديميس حاسابيز، الاستخدامات التكوين الحالية حول نفس الكمية من موارد الأجهزة، و. يقول حسبس إن الخوارزميات أكثر أهمية من الأجهزة.

وستقام المباراة الخامسة والخامسة يوم الثلاثاء. بعد ذلك ، سيتم تلخيص نتائج معركة آلاف السنين من الألعاب البشرية في تطوير العامين والسنتين ، والتي تم إطلاقها على مجموعة من عشرات معالجات الخادم المتاحة تجاريًا من مسرعات الرسومات.

مواد مفيدة حول الموضوع:

Source: https://habr.com/ru/post/ar391513/


All Articles