Cho Chikun و Deep Zen Go: محاولة أخرى لتجاوز الرجل في ال



في 27 يناير 2016 ، أعلنت Google DeepMind لأول مرة عن نجاح تطويرها الجديد. حاولت شركة الذكاء الاصطناعي البريطانية ، التي اشترتها Google في عام 2014 ، التغلب على لعبة الذهاب الآسيوية القديمة. في بداية هذا العام ، كانت حالة الذهاب كلعبة مستقلة عن الكمبيوتر لا تزال ثابتة. كانت أنظمة تشغيل الكمبيوتر موجودة ، ولكنها لعبت على مستوى الهواة. خسر المحترفون لهم فقط مع إعاقة كبيرة.

DeepMind AlphaGo مبنية على مزيج من طريقة مونتي كارلو و الشبكات العصبية الاصطناعية. بعد إنشاء النظام ، وتعديل معلماته وتدريب الشبكات العصبية ، تم اختباره ضد برامج الكمبيوتر الأخرى والبطل البشري. فاز AlphaGo على بطل أوروبا 2013 و 2014 و 2015 Fan Hui.

الذهاب تقليديا في أوروبا أقل من المنزل في آسيا. إن قوة AlphaGo لديها شكوك قوية . لكن جوجل أعلنت على الفور أن معركة AlphaGo التالية ستقام مع صاحب دان لي سيدول المحترف التاسع ، أحد أفضل اللاعبين في العقد الماضي. في مارس ، وقعت سلسلة من خمس مباريات ... وخسر الرجل مرة أخرى بنتيجة 4: 1 . وأعقبت صدمة مجتمعات الذكاء الاصطناعي واللاعبين الصمت التام حول المباريات المستقبلية. لا توجد مباريات جديدة مقررة ضد AlphaGo .

سيتم تنفيذ محاولة هزيمة AlphaGo من قبل فريق المشروع الياباني Deep Zen Go ، الذي يقوم حتى الآن بتعليم نظامه للعب ضد الناس. في 19 و 20 و 23 نوفمبر ، تم التخطيط لثلاث مباريات ضد تشو تيكون ، سيد دان التاسع من اليابان. توقعات مثيرة للاهتمام هي من قبل آيا هوانغ ، موظفة في DeepMind ، جلس في مارس ، كجزء من مباراة تاريخية ، مقابل لي سيدول ووضع الحجارة على متن AlphaGo. يعتقد هوان أن الإصدار الجديد من Zen سيفوز بنتيجة 3: 0 أو 2: 1.

لقد حل DeepMind مهمة صعبة حقًا. وفقًا لقواعد اللعبة ، يضع خصمان حجارة سوداء وبيضاء على لوح بحجم معين (في الألعاب الاحترافية - 19 × 19). يمكن التقاط الأحجار ، وبعض الإجراءات ممنوعة ، وهناك العديد من القواعد التي تختلف عن إصدار اللعبة. لكن الهدف دائمًا هو واحد: الشخص الذي يحمي منطقة أكبر يفوز.

بالنسبة لنظام الكمبيوتر ، فإن متعة سطح الطاولة البسيطة ظاهريًا صعبة للغاية: المواضع المحتملة للحجارة على لوحة 19 × 19 أكبر من مائة قطعة من قطع الشطرنج على لوحة 8 × 8. الأحجار لا تنقص ، هناك المزيد منها - لا يمكنك إنشاء قاعدة لنهايات الحفلات. من التحركات الأولية يمكنك بسرعة استنتاج موقف جديد يستحيل توقعه. كل هذا يعقد إنشاء أنظمة كمبيوتر قوية.

تم إنشاء أول برامج تشغيل في السبعينيات. منذ بداية الثمانينيات ، أقيمت بطولة العالم بين برامج الكمبيوتر. لفترة طويلة ، فقدت السيارات لذوي الإعاقة من 9 أحجار أو أكثر. حتى بداية هذا العام كان الإنجاز على 4 أحجار للمعوق يعتبر إنجازاً .

أحدث التقنيات هي البحث عن الأخشاب أو طريقة مونت كارلو ، الأنظمة الخبيرة مع قاعدة بيانات من التحركات الجيدة. في DeepMind ، تمت إضافة الشبكات العصبية للسياسة والقيم إلى طريقة مونت كارلو. تم تدريبهم بمساعدة 160 ألف مباراة من خادم لاعبي KGS من السادس إلى التاسع. ثم درس النظام الكثير ضد نفسه. والنتيجة هي هزيمة أول بطل أوروبي للدان المحترف الثاني ، ثم هزيمة البطل الكوري للدان المحترف التاسع.

بالنسبة لجوجل ، فإن معنى التنمية ليس فقط حلاً لمشكلة نظرية. هذا سبب جيد للفخر. حضر المباريات سيرجي برين ، أحد مؤسسي البحث وموظفين بارزين آخرين. أرادوا جميعًا رؤية لحظة انتصار الشركة.

في الآونة الأخيرة ، تكتسب أنظمة الذكاء الاصطناعي زخمًا على نفس الشبكات العصبية. اليوم ، يمتلك كل شخص تقريبًا في جيبه مساعد صوت ذكي يمكنه الإجابة عن الأسئلة بلغة بشرية: Siri أو Google Assistant أو Google Now ، Cortana. ترغب الشركات في تذكيرك بأن هذا مجرد غيض من فيض من إنجازات الذكاء الاصطناعي. على سبيل المثال ، فوز AlphaGo ضد أفضل الناس ، ذكر الرئيس التنفيذي لشركة Google Sundar Pichai في خطابه الافتتاحي خلال عرض هواتف Google Pixel الذكية الشهر الماضي. للتذكير فقط لها تحرك كالديدانفي مكان ما بين توجيهات نظام الترجمة الآلية الجديد ← ← → الصينية وخوارزميات التعرف على الصور المتقدمة والتعرف على الكلام.

فوز رن "جوجل" بعيد. أقيمت المباراة في عاصمة كوريا الجنوبية وأصبحت السبب في إنشاء صندوق بقيمة تريليون وون (860 مليون دولار) لتطوير أنظمة الذكاء الاصطناعي. تعرّف مطورو أنظمة الكمبيوتر الأخرى على التقارير من أبحاث DeepMind و AlphaGo وقاموا بتحسين أنظمتهم. قليل من الناس يرغبون في تحمل مثل هذا الوافد الجديد الحاد إلى المشهد القائم لبرامج go.

زن عميق يذهب


في 1 مارس ، حتى قبل بدء مباراة AlphaGo ، أعلن Li Sedol ، مبتكر Zen Yoji Ojima والشركة اليابانية Dwango عن تعاون لإنشاء نسخة موزعة من Deep Zen Go. بالنسبة لـ Ojima ، كان Zen مشروعًا للهواة لم يتمكن من إنفاق الأموال عليه بجدية. كانت الشركة مستعدة لتوفير المعدات وأخصائي التعلم الآلي. وقد ساعد فريق التطوير أيضًا فريق التعلم العميق من جامعة طوكيو ومطور برنامج Ponanza ، وهو أنجح نظام شوغي للكمبيوتر في العالم يتفوق على الأشخاص المحترفين.



الهدف النهائي هو هزيمة AlphaGo ، مدة الإنجاز هي من ستة أشهر إلى سنة. وفقًا لمؤلفي البرنامج ، تتمتع AlphaGo بميزة 500 نقطة تصنيف Elo بسبب التعرف على الأنماط بشكل أفضل. اعتقد مبدعو Zen أنهم يمكنهم الحصول على 400 نقطة من خلال تحسين التعرف على الأنماط و 200 من التعديلات الأخرى. ومع ذلك ، تم تقديم هذه التقديرات قبل المباراة مع Li Sedol ، فقط وفقًا للألعاب مع Fan Hui.

بدأ العمل. يحسب المشروع من 1 مارس من هذا العام من فرع الإصدار الحادي عشر من البرنامج. في الإصدار الثاني عشر ، تظهر التطورات الأولى في التعلم الآلي. في الإصدار 12.2 ، تم دمج شبكة عصبية قيمة. في سبتمبر ، ظهر التعلم الآلي في الإصدار 12.4. كيفية نقول للمطورين، وكان هدفهم عدم جعل نسخة AlphaGo، ولكن لم يتخذ الوقت التشغيل من هذه المادة في الطبيعة بعين الاعتبار.

الأداء الحقيقي لـ Zen ليس مجرد تقارير من فريق التطوير. يمكن "لمس" النظام على خادم KGS للألعاب عبر الإنترنت أثناء التنقل ، حيث تعمل إصدارات مختلفة من Zen بشكل سريع لمدة 15 ثانية لبضع سنوات. منذ مارس ، حدثت زيادة تدريجية في تصنيف روبوتات Zen. أولاً ، ظهر Zen19 من بين مئات الأفضل ، تم تضمين الإصدار التالي من Zen19X في أفضل 50 لاعبًا بسبب شبكاته العصبية ، كسر Zen19A العشرين.

Zen19K ويحصل على 8 dan على خادم KGS - هذا الإصدار له شبكة عصبية قيمة. جسديا ، يبدو هذا اللاعب وكأنه خادم Kurisu مع معالجين Intel Xeon رباعي النواة E5-2623 v3وأربع مسرعات نفيديا GTX تيتان X (ماكسويل). هذا الإصدار يتنافس بالفعل مع المحترفين. على سبيل المثال ، في 30 أغسطس ، خسر بطل روسيا المحترف والعديد من البطل الأوروبي إيليا شيكشين أمام البوت ، وفاز 31 .

وصل أحدث إصدار من برنامج Zen19K2 لأول مرة إلى 9 dan على الخادم ووصل إلى السطر الأول من التصنيف. تجدر الإشارة إلى أن هذا الخادم أكثر شيوعًا في أوروبا وأمريكا ، والمهنيين الآسيويين يتابعونه نادرًا جدًا.


مخطط نمو تصنيف Zen19K2 بوت من 8 سبتمبر إلى 15 نوفمبر 2016.

مبارزة مع الرجل


يظهر زين التقدم في المباريات الرسمية ضد الناس. في نهاية مارس 2016 ، أصبح زين الفائز بكأس الكمبيوتر التاسع الذي أقامته الجامعة اليابانية للاتصالات الكهربائية. تعتبر هذه المسابقة البطولة العالمية بين برامج الكمبيوتر للعبة الذهاب. لقد لعبوا جميع البرامج الأقوى باستثناء AlphaGo - ربما قررت Google أنه ليس لديهم ما يثبتونه هنا. كفائز في البطولة ، تنافس برنامج Zen على 3 أحجار معاقة مع الياباني Kobayashi Koichi (المحترف التاسع) وفاز.

27 يوليو كجزء من البطولة الأوروبيةعقد هذا العام في سانت بطرسبرغ ، نظام زن مع 2 حجر عائق لعب ضد Cho Heyang (9 dan محترف) ، واحدة من أقوى المحترفين الإناث. تبين أن Zen أقوى مرة أخرى. وصل البرنامج تدريجياً إلى اللعبة على قدم المساواة مع الناس.

لإخبار العالم عن AlphaGo ، عقدت DeepMind مباراة مع أكثر الأشخاص المحترفين خبرة وخبرة من أولئك الذين كانوا متاحين جغرافيًا. هنا تأتي لحظة مماثلة: وفقًا للمطورين ، وصل النظام إلى مستوى AlphaGo من المباراة مع Fan Hui. قبل أيام قليلة ، تم اختيار منافس جديد لـ Deep Zen Go .


من اليسار إلى اليمين: أحد مطوري Zen هو Kato Hideki و Cho Chikun.

تشو تيكون - يتم منح سيد البالغ من العمر 60 عامًا للمحترف التاسع من اليابان ، وهو واحد من الأقوى في العالم في الثمانينيات والتسعينيات. خلال مسيرته المهنية ، فاز بأكثر من مائة بطولة كبرى. ستقام ثلاث مباريات ضده في 19 و 20 و 23 نوفمبر. ستكون هذه ثلاث مباريات بنقاط تعويض 6.5 كومي اليابانية للعبة بيضاء ، مع معيار لحفلة كبيرة تستمر ساعتين وضرب 3 × 60 ثانية.

سيعمل خادم قوي مع تبديد الحرارة في حصانين ضد شخص: معالجان Intel Xeon E5-2699v4 22 نواة ، و 4 Nvidia Titan X  (هذه المرة أحدث Pascal) ، و 128 GB RAM ، و 128 GB محركات الأقراص الصلبة (النظام) واثنين عند 480 جيجا بايت.

ومن المثير للاهتمام أن Lee Sedola قد هزم AlphaGo ، التي تم تشغيلها في Google Cloud Platform على 1920 معالج النواة و 280 مسرعات فيديو. وفقًا لمقالة في Nature ، تفقد النسخة غير المخصصة نسخة موزعة في 77 ٪ من الحالات. ولكن وفقًا لتقرير DeepMind ، فإن الإصدار العادي غير المخصص لـ AlphaGo ليس ضعيفًا أيضًا. يقارن الرسم البياني الموجود على اليمين أداء AlphaGo على جهاز واحد وفي شكل موزع عبر مجموعة من الخوادم المتعددة.



سيتم بث الألعاب عبر الإنترنت مع التعليقات باللغة اليابانية. من غير الواضح ما إذا كانت التعليقات الرسمية ستكون باللغة الإنجليزية.

السبت 19 نوفمبر. بداية البث: 06:30 بتوقيت موسكو (12:30 بتوقيت المنطقة اليابانية). بداية اللعبة: 07:00 بتوقيت موسكو (13:00 بتوقيت اليابان). المباراة الاولى .
الأحد 20 نوفمبر ، في نفس الوقت.المباراة الثانية .
23 نوفمبر ، الأربعاء ، في نفس الوقت. المباراة الثالثة .

كما ترى ، تجري جميع المباريات الثلاث في عطلة نهاية الأسبوع الرسمية. 23 نوفمبر في اليابان ، غنية بالعطلات ، ولكنها فقيرة في العطل والعطلات ، اليابان - عيد الشكر .



في غضون أيام قليلة ، سيتم تحديد نتيجة المباراة مع Tikun. يمكن توقع وتوقع قوة اللاعب البشري. لكن لا يعرف الكثير عن AlphaGo: لم نشهد مباراة عامة واحدة منذ مارس. من غير المعروف إلى أي مدى بدأ تطور DeepMind يلعب خلال هذه الفترة. يستمر Deep Zen Go في التحسن: يأمل المطورون أن يصل برنامجهم قريبًا إلى مستوى AlphaGo في مارس 2016.

بالنسبة إلى عملاق تكنولوجيا شامل ، لا يُسمح بإعطاء أمجاد الذكاء الاصطناعي في اتجاه رمزي واحد. ومع ذلك ، لدى Google المزيد من الموارد. لكن لا تفقد الأمل في أن يتمكن التطور الآسيوي الجديد من التغلب على AlphaGo في مباراة رسمية إذا حددت الأطراف مبارزة. ومع ذلك ، بادئ ذي بدء ، يحتاج البرنامج إلى تعلم كيفية هزيمة الناس.

يشكر المؤلف مجموعة go_secrets للمساعدة في كتابة هذا المقال .

Source: https://habr.com/ru/post/ar399127/


All Articles