لقد تعلمت منظمة العفو الدولية نفسها كيفية بناء مكعب روبيك



لطالما كانت برامج الكمبيوتر قادرة على لعب الشطرنج ، وقد تم تدريب منصة متخصصة نسبيًا مؤخرًا من Deep Mind على اللعب بشكل احترافي. محترف جدًا لدرجة أنه لا يوجد لاعبون بين الأشخاص على قدم المساواة مع الكمبيوتر ، وعلى الأرجح لن يفعلوا ذلك.

في ذلك اليوم أصبح من المعروف أن الآلة تعلمت بشكل مستقل حل لغز معقد آخر - مكعب روبيك. علاوة على ذلك ، أثناء التدريب ، لم يثبتوا لها كيفية تجميع المكعب بشكل صحيح ، حيث تعلمت منصة البرامج التي أنشأها علماء من الولايات المتحدة كل شيء بشكل مستقل. يعتقد بعض الخبراء أن "معقلًا آخر ، كان يعتبر ملكًا للإنسان" ، سقط أمام الآلات.

إن مكعب روبيك ، أو بالأحرى ، خوارزمية التجميع ، معقد من حيث أن كل إجراء تجميع له نتائج معينة ، ولكن من الصعب التنبؤ بتأثيرها على عملية التجميع الشاملة. حتى بالنسبة للسيارة. يتعلم الناس عادة كيفية تجميع مكعب وفقًا لخوارزميات تم تطويرها مسبقًا تسمح بحل اللغز في أقصر وقت ممكن.

يحقق بعض الطلاب نجاحات مذهلة في هذا المجال. لذلك ، في شهر مايو من هذا العام ، تم تسجيل رقم قياسي آخر لتجميع مكعب روبيك بيدين. كان البطل ، الأسترالي البالغ من العمر 22 عامًا والذي يدعى فيليكس زيمديجز ، قادرًا على جمع المكعب في 4.22 ثانية فقط. بدأ التدريب من سن 12 ، ومشاهدة تسجيلات التجميع على موقع يوتيوب.


أما بالنسبة للسيارة ، فإن الروبوتات تجمع المكعب بشكل أسرع. تم تسجيل الرقم القياسي هذا العام في 0.38 ثانية. كان يمكن أن يكون أسرع ، لكن آليات المكعب نفسها لم تستطع تحملها. في محاولة لتحقيق رقم قياسي ، كان على المطورين تعزيز تصميم المكعب ، وإلا فقد انهار بعيداً عن التلاعب السريع للغاية في الماكينة.


في حالة المنصة الموصوفة أعلاه ، يتم تنفيذ العمل وفقًا للخوارزميات التي تم إدخالها مسبقًا في ذاكرة النظام. لكن العلماء من معهد ماساتشوستس للتكنولوجيا كانوا قادرين على تدريب نظامهم الخاص لتجميع المكعب بأنفسهم.



عند إنشاء المكعب نفسه ، كان المخترع الأكثر إثارة للاهتمام هو تطوير طريقة لحل اللغز من أي موقف. تمكن المهندس روبيك من القيام بذلك في غضون شهر. في المستقبل ، تم تحسين خوارزمية التجميع بشكل متكرر.

في الآونة الأخيرة ، بدأ خبراء الذكاء الاصطناعي في البحث عن طريقة لتعليم الآلة كيفية الموت. تم استخدام التعلم الآلي العميق. تم تكليف النظام بمهمة وتم شرح القواعد. بعد ذلك ، كان على الروبوت أن يعمل من تلقاء نفسه. في حالة التقدم ، حصلت الآلة على مكافأة - شيء من هذا القبيل وتعليم أشكال ضعيفة من الذكاء الاصطناعي. بعد كل شيء ، يجب أن يعرف الكمبيوتر ما يتحرك في الاتجاه الصحيح. وأخبروه بذلك من خلال نظام المكافآت. كل هذا يساعد الآلة على التعلم.

في حالة مكعب روبيك ، هذا أكثر تعقيدًا إلى حد ما مما هو عليه في الحالة المعتادة. والحقيقة هي أنه حتى لحظة معينة من المستحيل فهم ما إذا كان النظام يعمل بشكل صحيح أم لا. ولا فائدة من المكافأة على الانعطاف العرضي لوجه لا يحقق نتائج. في الشطرنج ، كل شيء أبسط - هناك بالفعل من الخطوة الثانية أو الثالثة يمكنك أن تفهم في أي اتجاه تتحرك اللعبة وما إذا كانت الماكينة تعمل بشكل جيد أم لا. تبعا لذلك ، هناك شيء للمكافأة.

من أجل تعليم الكمبيوتر كيفية صنع مكعب روبيك ، تم استخدام تكنولوجيا التعلم العميق المتخصصة ، والتي كانت تسمى "التكرار التلقائي". تتيح لك هذه التقنية "تدوير" المكعب الذي تم تجميعه بالفعل لتحقيق تكوين مشابه للتكوين الحالي. اتضح شيئًا مثل الهندسة العكسية ، إذا كان هذا المصطلح ينطبق على التعلم الآلي. يتم إنشاء "شجرة قرارات" متخصصة ، والتي تستخدمها الآلة لحساب خطوات كل تكوين.

كانت النتيجة مثيرة للإعجاب. وفقًا للمطورين أنفسهم ، يمكن للخوارزمية حل اللغز في حوالي 30 حركة. علاوة على ذلك ، تقوم الآلة بجمع المكعب في 100٪ من الحالات ، بغض النظر عن إصدار اللغز المفكك الذي تصادفه. بشكل عام ، من أجل تجميع لغز مجزأ جيدًا ، تحتاج من 19 إلى 23 خطوة. تؤدي بعض الحلول إلى النتيجة المرجوة بشكل أسرع من غيرها. تتكون خوارزمية البناء الأسرع من 21 خطوة.

المنصة ، التي طورها مهندسو معهد ماساتشوستس للتكنولوجيا ، تسمى DeepCube. يقول التقرير: "إن منصتنا قادرة على التعلم الذاتي في البيئات المعقدة ، حيث تتلقى جائزة واحدة فقط لكامل عملية العمل".

يعمل الآن نفس الفريق من العلماء على تنفيذ طريقة التدريس الخاصة به لحل مشاكل اندماجية معقدة أخرى. من بين أمور أخرى ، التنبؤ بالهيكل الثالث للبروتين .

Source: https://habr.com/ru/post/ar414463/


All Articles