الذكاء الاصطناعي: ليلا الشطرنج. أو حول كيفية فوز شبكة عصبية مفتوحة بالكامل

صورة

بصراحة ، أشعر بخيبة أمل كبيرة من هبر. لماذا لم يسلط أي شخص الضوء على شيء مثل الفوز في نهج الشبكة العصبية بمصدر مفتوح بالكامل ، أي؟ وفتح تماما بيانات الشبكة العصبية؟ في الواقع ، لقد وصفت DeepMind Technologies كيف قاموا بتدريس لعبة الشطرنج AI بنفسها ... الآن فقط ، تم إغلاق الكود هناك ، وتم التدريب على مجموعات Google ، ولم يتم توزيعه على Nvidia Turing باستخدام نواة التنسور ، كما في هذه الحالة. لماذا يجب عليّ تعديل ويكيبيديا الإنجليزية لأسترعي الانتباه إلى هذا؟

حسناً ، لقد ذهبت بعيداً عن المشاعر. (لا يزال هناك رابط في التعليقات التي تذكر leela.) هذه المقالة عبارة عن تجربة: طريقة لإظهار لي كيف ستؤثر مقالتي الأخرى ، والتي تحظى بشعبية كبيرة ، في رأيي.

بدأت القصة عندما قمت بترقية جهاز Nvidia Geforce GTX 770 القديم إلى RTX 2080 Ti. حسنًا ، نظرًا لتكلفتها ، أردت تعظيمها. في البداية لعبت مع Ray Tracing ، اقرأ عن كيفية عمله مع CUDA عبر NVIDIA OptiX . قرأت عن كيفية تمكن شخص واحد من استخدام نوى RT لأغراض أخرى. كرر ذلك. ولكن عدد التعليقات التي طلقها سترة جلدية الناس كان كبيرا جدا لدرجة أنني كنت قد سئمت من القراءة حول هذا الموضوع. خاصة وأنني أعرف أن تتبع المسار هو أهم خوارزمية لصناعة الأفلام والألعاب ، وهذا ليس اكتشاف نفيديا. لا على الإطلاق. حتى الأجهزة.

ثم قررت أن ننظر إلى NVENC . أنا عموما عاشق الهدية الترويجية. كما اتضح ، كان هناك الكثير منه في هذا الجهاز التشفير. أولاً ، المقال الأكثر شيوعًا حول Habr حول NVENC يتحدث عن كيفية تمكن YourChief ، المسلح بمصحح الأخطاء ، من كسر الحد المسموح به لعدد تدفقات الترميز المتزامن لها (ويمكن أن تكون بطاقتي رائعة ، كما اتضح فيما بعد). علاوة على ذلك ، فإن التصحيح ، كما يحدث عادة ، يغير بضعة بايت فقط .

ثم اتضح أنه يمكن أيضًا تمكين تقنية NvFBC (التقاط فائق السرعة لإطار كامل) على بطاقة geforce ، إذا كنت تستخدم تصحيحًا سحريًا أعلى إطار Looking glass ، قبل تنشيط هذه التقنية (يمكن رؤية التصحيح هنا ).

ثم أردت اللون 30 بت في فوتوشوب. تكرارًا لنجاح الآخرين ، وجدت بايتًا محدودًا يدعم OpenGL في وضع الإطارات (كما هو الحال في DirectX في أوضاع ملء الشاشة وظهور ملء الشاشة وفي OpenGL في وضع ملء الشاشة ، يعمل اللون 30 بت بهذه الطريقة). وكتب نفيديا عن ذلك ، واعدا لكشف النقاب عن التصحيح. ربما هذه صدفة ، لكنهم أزالوا هذا التقييد في Gamescom 2019. ولكن لا يزال هناك دعم غير رسمي لـ HDR10 + (بيانات تعريف HDR ديناميكية).

لذلك ، لقد حان الوقت الآن لمسرع المصفوفة ، المعجل العصبي ، نوى الموتر ، نسميها ما تريد. كان أكثر تعقيدا قليلا. سأقول على الفور أنني أغرقت في محاضرة على الشبكة العصبية في الجامعة ، لذلك كان لا بد لي من معرفة ذلك. ولكن بعد مشاهدة مقطعين من مقاطع الفيديو ، حيث يفرخ رجل الآلاف من الطيور يمر عبر Flappy Bird ، وبعد بضعة أجيال تمر هذه الطيور بعقبات كالساعة ، استلهمت الفكرة. كان السؤال ما يجب إطلاقه. ثم تذكرت أن Google تباهت مؤخرًا بأنها فازت على أفضل لاعب Go مع الذكاء الاصطناعي ، والذي كان يعتبر مستحيلًا قبل استخدام خوارزميات "طبيعية". بصراحة ، يحب إصدار Google DeepMind المعقد. حسنًا ، من قام باختراعها: AlphaGo Lee → AlphaGo Master → AlphaGo Zero → AlphaZero (يمكن أن يكون الأخير في لعبة الشطرنج ، وفي لعبة shogov ، وفي الذهاب ، وبشكل عام ، نظرًا لأنهم طبقوا آلية طويلة لشرح قواعد اللعبة ، لعبة البوكر يمكن تكييفها). أنا على علم بالبوكر ، إن لم يكن هناك أي شيء ، لا أكتب عنه ، وإلا فأنا أعلمك.

بحث جوجل الخاص بي "alphazero source code" لم يسفر عن شيء. حسنًا ، اتضح أنهم لم يفكروا في فتح الكود! لكنني لم أصدق ذلك. حسنًا ، يعني Elon Musk اختصارًا لـ OpenAI (من المفترض أنه عندما يتطور الذكاء الاصطناعى ، فإنه يتم دراسته أكثر أو أي شيء ، ويكون أكثر تحررًا من حقوق الطبع والنشر للمؤلفين). وهنا على reddit جئت عبر الرابط . كما اتضح فيما بعد ، ما زال بعض الأشخاص المتعاطفين من DeepMind يقررون إعطاء جزء من الكود المصدري ، عن طريق طباعته مباشرةً في ملف pdf. / facepalm

حسنا ، أنا هنا تحميلها على الفور والشبكة العصبية من هنا . وبعد اللعب معها ، أدركت أنه لا يلعب لعبة الشطرنج لسبب ما. استغرق الأمر مني حوالي 20 دقيقة لفهم أنه يلعب ، وليس لعبة الشطرنج ، و 40 دقيقة أخرى للعثور على نسخة للشطرنج. وهنا فوجئت. أولاً ، لقد تمكنوا بالفعل من تنفيذ خلفية cuda مع دعم حبات التنسور من Nvidia سواء بالنسبة للعبة أو للتدريب ( اختياريًا وموزعًا ، علاوة على ذلك). ثانياً ، في تلك اللحظة ، كان لديهم مبارزة مع Stockfish للحصول على المركز الأول في ترتيب لعبة الشطرنج على الكمبيوتر! أنا لم أنم نصف ليلة ، ومشاهدة نهائي TCEC وفاز الشبكة العصبية! ركضت على الفور لتحرير ويكيبيديا ، التي كانت في ذلك الوقت تحتوي على القليل من المعلومات ، وفي اليوم التالي كتب الجميع عنها! كما اتضح فيما بعد ، استخدمت ليلا حفنة من 2080 Ti و 2080 فقط ، أي أن بطاقتي كانت كافية. بعد تنزيل الشبكة العصبية من هنا ، أطلقتها بهدوء شديد على جهاز الكمبيوتر الخاص بي! حسنا ، بالطبع ، لقد كسرتني الشبكة العصبية. إليك كيفية إعداده.

شخصيا ، لقد استخدمت حقا قذيفة مستكشف HIARCS الشطرنج. علاوة على ذلك ، أعطيت أيضًا أشخاصًا على android لاختبار leela في DroidFish. يستخدم Android شبكة مقطرة ، أبسط وأصغر ، لكن لا يزال غير ضعيف.

من حيث المبدأ ، أستطيع أن أرسم تعليمات التثبيت بمزيد من التفاصيل ، وأضف الروابط ، والكتابة: =))
بالمناسبة ، مثل هذا السؤال ، هل سمع أحد عن الاستخدام غير القياسي لـ NVENC و NVDEC؟ يبدو أنه يمكن تكييفها لتسريع العمليات الرياضية. قرأت عن ذلك في مكان ما ، ولكن لم تكن هناك تفاصيل.

Source: https://habr.com/ru/post/ar468775/


All Articles