الشبكات العصبية لا تفهم ما هي الخداع البصري.

يمكن لأنظمة رؤية الماكينة التعرف على الوجوه على مستوى مع الناس وحتى إنشاء وجوه اصطناعية واقعية. لكن الباحثين وجدوا أن هذه الأنظمة لا تستطيع التعرف على الأوهام البصرية ، وبالتالي ، إنشاء أخرى جديدة.




إن البصر البشري جهاز مذهل. على الرغم من أنها تطورت في بيئة معينة لملايين السنين ، إلا أنها قادرة على المهام التي لم تأت عبر الأنظمة البصرية المبكرة. من الأمثلة الجيدة قراءة أو تحديد الأشياء الاصطناعية - السيارات والطائرات وإشارات المرور وما إلى ذلك.

لكن النظام البصري لديه مجموعة معروفة من العيوب التي نعتبرها خداع بصري. لقد حدد الباحثون بالفعل العديد من الخيارات التي تسبب فيها هذه الأوهام الأشخاص لتقييم اللون والحجم والوضع النسبي والحركة بشكل غير صحيح.

الأوهام في حد ذاتها مثيرة للاهتمام لأنها تعطي فكرة عن طبيعة النظام البصري والإدراك. لذلك ، سيكون من المفيد جدًا التوصل إلى طريقة للعثور على أوهام جديدة ستساعد في دراسة قيود هذا النظام.


دوائر متحدة المركز؟

هنا يجب أن نأتي في تدريب متعمق ومفيد. في السنوات الأخيرة ، تعلمت الآلات التعرف على الأشياء والوجوه في الصور ، ثم إنشاء صور مماثلة. من السهل تخيل أن نظام رؤية الآلة يجب أن يكون قادرًا على التعرف على الأوهام وإنشاء نظامه الخاص.

وهنا يأتي دور روبرت ويليامز ورومان يامبولسكي من جامعة لويزفيل بولاية كنتاكي. حاول هؤلاء الرجال إثارة مثل هذا الشيء ، لكنهم وجدوا أن كل شيء لم يكن بهذه البساطة. أنظمة التعلم الآلي الحالية ليست قادرة على تقديم خداع بصري خاص بها - على الأقل ليس بعد. لماذا؟

أولا ، معلومات عامة. تستند التطورات الحديثة في التعلم العميق إلى انفراجين. الأول هو توفر الشبكات العصبية القوية وبعض الحيل البرمجية التي تسمح لهم بالتعلم بشكل جيد.

والثاني هو إنشاء قواعد بيانات ضخمة ملحوظة من حيث الحجم ، على أساس الآلات التي يمكنها التعلم. على سبيل المثال ، لتعليم آلة التعرف على الوجوه ، فإنها تأخذ عشرات الآلاف من الصور التي تحتوي على وجوه محددة بوضوح. باستخدام هذه المعلومات ، يمكن للشبكة العصبية أن تتعلم التعرف على الأنماط المميزة للوجوه - عينان وأنف وفم. أكثر إثارة للإعجاب ، زوج من الشبكات - ما يسمى شبكة تنافسية تنافسية (GSS) - قادرة على تعليم بعضهم البعض كيفية إنشاء صور واقعية ومصطنعة تمامًا للوجوه.

تصور ويليامز ويامبولسكي لتعليم الشبكة العصبية لتحديد الأوهام البصرية. سعة الحوسبة كافية ، ولا توجد قواعد بيانات مناسبة كافية. لذلك ، كانت مهمتهم الأولى إنشاء قاعدة بيانات للأوهام البصرية للتدريب.

اتضح أنه من الصعب القيام به. ويقولون: "لا يوجد سوى بضعة آلاف من الأوهام البصرية الثابتة ، وعدد الأنواع الفريدة من الأوهام صغير جدًا - ربما عشرات."

وهذا يمثل عقبة خطيرة أمام أنظمة التعلم الآلي الحديثة. ويقولون: "إن إنشاء نموذج يمكن أن يتعلم من مجموعة بيانات صغيرة ومحدودة سيكون قفزة كبيرة للأمام للنماذج المولدة وفهمًا للرؤية البشرية".

لذلك ، جمع ويليامز ويامبولسكي قاعدة بيانات لأكثر من 6000 صورة لأوهام بصرية ، ودربوا الشبكة العصبية على التعرف عليها. ثم أنشأوا GSS ، الذي يجب أن يخلق أوهام بصرية بشكل مستقل.

النتائج خيبت أملهم. قال الباحثون الذين فتحوا قاعدة البيانات ليستخدمها الجميع: "بعد سبع ساعات من التدريب على Nvidia Tesla K80 ، لم يتم إنشاء أي شيء ذي قيمة".

النتيجة ، مع ذلك ، مثيرة للاهتمام. ويشيرون إلى أن "الأوهام البصرية الوحيدة التي عرفنا إياها تم إنشاؤها بواسطة التطور (على سبيل المثال ، أنماط العين على أجنحة الفراشة) أو الفنانين البشر". وفي كلتا الحالتين ، لعب الناس دورًا حاسمًا في تقديم التغذية الراجعة - يمكن للأشخاص رؤية الوهم.

ولا تستطيع أنظمة رؤية الآلة. يقول ويليامز ويامبولسكي: "من غير المرجح أن يتعلم جهاز الأمن العام كيفية خداع الرؤية دون فهم المبادئ التي تكمن وراء الأوهام".

يمكن أن يكون هذا تحديًا ، حيث توجد اختلافات حاسمة بين الأنظمة البصرية للإنسان والآلة. ينشئ العديد من الباحثين شبكات عصبية أكثر تذكُّرًا بالنظام البصري البشري. ربما يكون أحد الاختبارات المثيرة للاهتمام لهذه الأنظمة هو ما إذا كان يمكنهم رؤية الوهم.

في غضون ذلك ، فإن وليامز ويامبولسكي ليسا متفائلين: "على ما يبدو ، قد لا تكون مجموعة البيانات مع الأوهام كافية لخلق أوهام جديدة ،" كما يقولون. حتى الآن ، تظل الأوهام البصرية معقلًا لتصور الإنسان ، ولا تخضع لآلات.

Source: https://habr.com/ru/post/ar427947/


All Articles