حصادات تحليلات الفيديو: ما يفعله الدماغ والآلات مع وجوهنا

صورة

القدرة على رؤية الوجوه والتعرف عليها بسرعة هي القوة العظمى. لا حاجة لقضاء بعض الوقت في تحليل ودراسة التجاعيد والطيات والأشكال البيضاوية. التعرف على الوجوه فوري وبدون عناء. من السهل جدًا أننا لا ندرك كيف نفعل ذلك.

فكر في كيف تبدو الوجوه المختلفة مثل بعضها البعض - عينان ، فم ، أنف ، آذان تدوران على الجانبين ، في كل مرة بنفس الترتيب (في أغلب الأحيان). إنه أمر لا يصدق أن نقوم بتحليل كائن بهذه السهولة.

نحن "مبرمجون" للتعرف على الوجوه منذ الولادة ، ولكن الآن حقق الناس المزيد - لقد علموا الآلة هذه المهارة. كيف سيؤثر التطبيق الواسع لأنظمة التعرف على الأشخاص وتحديد هويتهم على المجتمع؟

Pareidolia: البحث التلقائي عن الوجه


صورة

يستطيع الأشخاص في الوضع "التلقائي" التمييز بين الصور المألوفة على أي سطح. ينظر فقط إلى ثلاثة عناصر معمارية للمبنى على أنها وجه بطة مفاجئة. هذا مثال على pareidolia.

الكلمة pareidolia تأتي من الكلمات اليونانية الفقرة (الفقرة - القريبة ، القريبة ، الانحراف عن أي شيء) و eidolon - صورة. هذا هو اسم الوهم البصري ، أو تصور الصورة أو المعنى حيث لا توجد في الواقع. على سبيل المثال ، الوجه على جذع الشجرة أو الأشكال الحيوانية في السحب هو pareidolia.

صورة
يمكن العثور على المزيد من هذه الصور على thingswithfaces.com

وجوه الناس ووجوه الحيوانات التي نراها بأي شكل هندسي. ثقافة الرموز التعبيرية بأكملها مبنية على هذا المبدأ. :-)

صورة

يتم ترجمة ظاهرة pareidolia بسهولة إلى لغة الخوارزميات. صور فنانو Shinseungback Kimyonghun الغيوم ، ودمجوا للحظة في الوجوه البشرية ، باستخدام برنامج نصي مع مكتبة OpenCV.

وهم تاتشر: أخطاء بيولوجية للنظام


صورة

يوجد خطأ بيولوجي يوضح الأهمية الكبرى لمهارة التعرف . معظم الأشياء من حولك - الكرسي ، الجدول ، الكمبيوتر ، يسهل رؤيتها والتعرف عليها بشكل صحيح من أي زاوية. ليس فقط وجوه.

يؤدي الوجه المقلوب إلى حدوث خلل في الدماغ يسمى تأثير تاتشر (وهم). تصف هذه الظاهرة حالة يصعب فيها اكتشاف التغييرات المحلية في صورة مقلوبة.

اقلب صورة مارغريت تاتشر وانظر إلى النتيجة.
صورة

تبدو الصورة الأولى طبيعية ، لكن إذا قلبتها ، فإن العين الخاطئة للعيون والفم تخطيان العين على الفور. رجل وشبكة عصبية مصطنعة تصور الصور بطرق مختلفة. إنه لأمر مدهش أن تكون "الشبكة العصبية" بين آذاننا سهلة الخداع.

يوضح وهم Thatcher بعض الآليات الأساسية التي يقوم بها عقلك بمعالجة المعلومات. يقرأ الدماغ مجموعة من العناصر الفردية: زوج من العيون والأنف والفم والأذنين. بالإضافة إلى الخصائص الفردية لميزات الوجه ، يتم أخذ العلاقة بينها وبين الموقع بعين الاعتبار. وهذا هو ، ينظر إلى الشخص على أنه نظام كامل.

لذلك ، عندما يظهر لنا وجه مقلوب ، يكون من الصعب على المخ تقييم الصورة بالكامل - يتم "جمع" المعلومات بشكل منفصل لكل عنصر: العينان في مكانهما ، فمثل الفم. ومع ذلك ، ما أن نظهر الوجه الصحيح ، فجأة يعيد النظر إلى نظام واحد يعيد الاتصال وتبدأ المشاكل: يصبح من الواضح أن الميزات المألوفة مرتبطة بطريقة غير عادية.

لماذا هذا مهم؟ الدماغ البشري قادر على التعرف على أصغر الاختلافات في ملامح الوجه بسبب سلامة الإدراك. تعترف منطقة القشرة الدماغية بالوجه وتحدد اتجاه النظرة ، ويحلل اللوزة المخية والجزيرة الصغيرة تعبير الوجه ، والمنطقة الموجودة في المنطقة الأمامية من الفص الجبهي ونظام المخ ، المسؤول عن الشعور بالمتعة ، تقيم جمالها.

خطأ يشبه الميزة: وجوه تشيرنوف


صورة
( ج )

يتم استخدام خصوصية الإدراك البشري لتحليل البيانات المجمعة متعددة الأبعاد باستخدام "الوجوه". في عام 1973 ، أوضح عالم الرياضيات الأمريكي الألماني تشيرنوف مفهوم استخدام "الأشخاص" لتحديد العلاقات المميزة ودراسة العلاقات المعقدة بين عدة متغيرات.

تنعكس بيانات تشيرنوف في شكل صور توضيحية للوجوه ، حيث يتم تقديم القيم النسبية للمتغيرات المحددة كأشكال وأحجام لميزات فردية: طول الأنف ، الزاوية بين الحواجب ، عرض الوجه - ما يصل إلى 36 متغيرًا في المجموع. وبالتالي ، يمكن للمراقب تحديد الخصائص المرئية للكائنات الفريدة لكل تكوين للقيم.

تتيح لك نظرة سريعة على المخطط المكوّن من الوجوه تحديد ما إذا كانت خصائص الملفات الشخصية تختلف اختلافًا كبيرًا (تتزامن) أم لا. من خلال مراجعة تفصيلية لميزات الوجه ، يصبح من الواضح في أي ميزات (كل ميزة للوجه هي ميزة منفصلة لمجموعة البيانات الأصلية) التشابه ، وما هو الفرق. على سبيل المثال ، في الرسم التوضيحي أعلاه ، من السهل أن نلاحظ الفرق بين البلدان عن طريق التعبيرات الحزينة والمضحكة.

لماذا سيارة وجهك


صورة

تساعد مهارة التعرف على الوجوه السريعة على انتقاء طفلك من رياض الأطفال ، واختيار شريك ، والتعبير عن المشاعر بشكل صحيح ومناسب. ولكن ماذا يحدث عندما ينقل الشخص هذه القدرة إلى شبكة عصبية اصطناعية؟

فكرة يمكن أن تسبب الرفض. ليس الجميع على استعداد لقبول التكنولوجيا التي تخزن البيانات بسهولة ، وترصد الحركة ، وتحلل عمليات الشراء والعواطف. يستلزم الانتقال من المراقبة المرئية البسيطة إلى تحليلات الفيديو المخصصة زيادة ملحوظة في المسؤولية.

صورة

اليوم ، تحدد الخوارزميات مثل DeepFace أوجه التشابه بين الأفراد بدقة أعلى من دقة البشر. خوارزمية نفيديا نفسها تخلق وجوه الأشخاص غير الموجودين في بضع ثوان. يتم إنشاء الوجوه في الصورة المجمعة أعلاه بواسطة شبكة StyleGAN العصبية ، المدربة على مجموعة من البيانات تصل إلى 70000 صورة. تبدو واقعية بشكل مخيف.

صورة
SearchFace خوارزمية مظاهرة

في البداية ، تسببت خوارزمية التعرف على الوجوه على Facebook في زيادة اليقظة ، ولكن بعد ذلك اعتاد الجميع على ذلك (أو غادر الشبكة الاجتماعية). تلقت خدمة FindFace للبحث عن الأشخاص على الصور على VKontakte مراجعات مختلطة واستخدمت في التنمر ، ولكن إغلاق مشروع SearchFace المماثل تسبب بالفعل في رد فعل سلبي من المستخدمين - في النهاية ، إذا كانت البيانات متاحة ، فدعها مفتوحة للجميع.

يقوم تجار التجزئة بتثبيت تقنية التعرف على الوجوه لمنع السرقة ، وجمع البيانات حول العمر والجنس وحتى عواطف العملاء. في النهاية ، الهدف هو تحسين خدمة العملاء والاستفادة منها. عندما يدرك العملاء أن النظام مفيد لهم شخصيًا ، فسيوافق الكثيرون على تقديم تقنيات جديدة.

بالنظر إلى العدد المتزايد من حالات "سرقة الهوية" - بطاقة الائتمان والاحتيال في البيانات الشخصية ، فإن المستهلكين يفضلون النظام في الوقت المناسب. يحددهم بشكل صحيح.

في الوقت الحالي ، تساعد الخوارزميات في حل مشكلات الإضاءة الرديئة للإضاءة ، ودقة الوضوح المنخفضة والإخفاء - مثل النظارات والشعر المستعار والشعيرات المتعددة الأيام. تعمل الأنظمة بسرعة هائلة وتعيين شخص لقاعدة بيانات بملايين الأشخاص في ثانية واحدة فقط.

تقدم بعض المتاجر في الولايات المتحدة خيارًا للمشتبه بهم في السرقة: اسمح لنفسك بالتقاط صورة أو الحصول على تهمة رسمية تتعلق بالجريمة. يحصل اللص على الحرية إلى جانب فرض حظر على التسوق ، وتصور صورته رسميًا في قاعدة البيانات. يتم تشفير الملفات التي تحتوي على صور للأشخاص ومتاحة فقط لمالك النظام.

الذي يجعل الربح من الاعتراف



قامت معظم المتاجر بالفعل بتثبيت كاميرات الدوائر التلفزيونية المغلقة. بالنسبة لتحليلات الفيديو ، لا يلزم تحديث الأجهزة - فقط قم بتوصيل الخدمة السحابية. ومع خدمة تحليلات الفيديو Ivideon ، تكون عتبة الدخول غير موجودة عملياً. تكلفة الحل هي من 1700 روبل لكل كاميرا ، مما يتيح لأي رجل أعمال الوصول إلى البرنامج.

الدافع الرئيسي لتجار التجزئة لاستخدام تقنية التعرف على الوجوه هو منع السرقة. وفقًا لمؤسسة National Retail Foundation ، الولايات المتحدة وحدها ، فقد حوالي 1.33٪ من إجمالي البضائع في عام 2017 بسبب السرقة - ما لا يقل عن 46.8 مليار دولار من الأضرار.

تقلل تقنية التعرف على الوجوه من عدد سرقة المتاجر بأكثر من 30٪.

غالبًا ما تؤثر العوامل الثانوية على مقدار الضرر: إهمال الموظفين ، وضعف إعداد جهاز الأمن ، الرغبة في الادخار. يجب حل هذه المشاكل وغيرها باستخدام الكاميرات والتكنولوجيا السحابية.

يسهل نظام التعرف على الوجوه العمل السريع مع قوائم سوداء: فهو يقارن صورة العميل مع قاعدة بيانات للأشخاص غير الموثوق بهم ، وإذا كان يطابق ذلك ، يرسل تحذيرًا مناسبًا إلى الحراس.

البرنامج التحليلي يعزز إلى حد كبير أمن المتجر. لص من ذوي الخبرة قادر على ملاحظة "البقع العمياء" للكاميرات. في هذه الحالة ، يمكن للحارس استخدام هاتفه لتصوير المشتبه فيه ، ثم التحقق مما إذا كان هذا الشخص في قاعدة البيانات.

تستخدم العلامات التجارية التسويق عبر الأجهزة المحمولة منذ فترة طويلة - حيث تقوم بإرسال رسائل نصية قصيرة وإشعارات بالدفع وعرض الإعلانات المستهدفة. بالنسبة لتجارة التجزئة التقليدية ، توفر أنظمة التعرف على نفس الإمكانيات التي حصل عليها البائعون عبر الإنترنت مع ملفات تعريف الارتباط.

تساعد نفس المنصة التي يتم استخدامها لتحديد اللصوص البائعين على التعرف على واجهات المتاجر التي تجذب العملاء بشكل أفضل. يساعد نظام التعرف على تحديد هوية عميل VIP عند مدخل المتجر. باستخدام البيانات من CRM ، يمكن للبائع أن يجعل العميل عرضًا مفيدًا بسرعة.

صورة
في مركز سيول المالي الدولي ، تحدد الكاميرات على لوحات المعلومات في الوقت الفعلي عمر ونوع الشخص ، وتقدم الإعلانات وفقًا للمعايير المحددة

تعمل معلومات العميل على تنشيط أداة قوية لزيادة المبيعات وتقييم احتياجات الجمهور. ستساعدك الكاميرات في تكوين عرض إعلانات الفيديو لزائر معين ، اعتمادًا على نوع الجنس والعمر والحالة العاطفية ، بالإضافة إلى أن تصبح موفري بيانات لحساب فعالية الإعلانات.

الفرص المذكورة أعلاه لتجار التجزئة غالبا ما تبدو وكأنها طنين الإعلان المزعج. تصاحب أطروحات "نمو الأرباح" و "احتياجات الجمهور" أي أداة لتكنولوجيا المعلومات في السوق - من ERP إلى علامة أسعار إلكترونية. هل هناك أي شيء يواجه أنظمة التعرف أكثر من التسويق البحت حول الذكاء الاصطناعي والتقنيات المستقبلية؟ سوف نجيب على هذا السؤال من خلال أمثلة على استخدام أنظمة حقيقية في المتاجر الموجودة.

"العمل في الميدان": من في الظروف الحقيقية يتعرف على الوجوه


صورة

تعد 7-Eleven أكبر سلسلة بيع بالتجزئة في العالم ، حيث تدير Seven-Eleven Japan أكثر من 36000 متجر صغير في 18 دولة. قامت الشركة مؤخرًا بتثبيت البرامج في 11000 من متاجرها. يستخدم التعرف على الوجه وتكنولوجيا تحليل السلوك في شبكة التوزيع لتحديد حاملي بطاقات الولاء ، ومراقبة حركة العملاء ، وتحديد مستوى مخزون البضائع في المستودعات.

صورة

ساكس هي سلسلة مئة من المتاجر المتميزة المملوكة حاليًا من قبل واحدة من أقدم الشركات في العالم (التي تأسست عام 1670) بواسطة شركة هدسون باي. يستخدم Saks تحليلات الفيديو بشكل أساسي لمنع السرقة. يقوم البرنامج بالتحقق من صور المشتبه بهم في السرقة مقابل قاعدة بيانات من المتسوقين المعروفين. يتم توصيل الكاميرات بالشبكة ، بحيث يمكن الاطلاع على النتائج في مقر ساكس في نيويورك.

وفقًا لصحيفة الغارديان ، تستخدم المتاجر الفخمة والفنادق في أوروبا تقنية التعرف على الوجوه بانتظام لتتبع الشخصيات المهمة والمشاهير لتزويدهم بظروف مريحة للغاية.

صورة

في الولايات المتحدة ، تستخدم شبكة CaliBurger Burger Network تقنية التعرف على الوجوه في برنامج الولاء. كشك تفاعلي "يتعرف" على العملاء ، يتذكر الطلبات ويقدم الأطباق المفضلة ، ويقبل المدفوعات مع تحديد الوجه.

يزيل النظام الحد الأدنى لدخول برنامج المكافآت لكبار السن ، الذين قد يجدون صعوبة في استخدام تطبيق الهاتف المحمول ونقاط المكافأة وبطاقات الائتمان.

تستخدم أنظمة التعرف على الوجوه على نطاق واسع في آسيا ، خاصة في الصين ، حيث يتم استخدامها لدفع ثمن الطعام ، أو السحب النقدي من أجهزة الصراف الآلي ، أو حتى الحصول على قروض. دقة التعرف على الوجه في الصين متفوقة على العين البشرية. ويرجع ذلك أيضًا إلى انتقال الصين على نطاق واسع من التعرف على الأبعاد الثنائية.

في الحالة الأولى ، تستخدم الخوارزميات صورًا ثنائية الأبعاد مخزنة في قواعد البيانات للتحليل. يحلل التعرف ثلاثي الأبعاد الصور ثلاثية الأبعاد التي أعيد بناؤها ويوضح دقة أعلى بكثير. في الصين ، باستخدام مسح الوجه ، يمكنك إجراء عمليات شراء (على سبيل المثال ، أوامر الدفع في KFC) ، إجراء الدفعات ، ودخول المباني.

صورة

في Alipay ، يجب أن تبتسم حتى يفهم نظام التعرف على الدفع: قبل أن لا يكون صورة فوتوغرافية ، بل هو شخص حي. يزعم أنه من المستحيل خداع Alipay: تغيير لون الشعر ، والماكياج ، واستخدام شعر مستعار لا يغير شيئا. يستخدم النظام مجموعة من الميزات المميزة التي تأخذ في الاعتبار هندسة الوجه وموقع نقاط معينة عليه.

النتائج


حجم الاستثمار المباشر من قبل الشركات الغربية والصين في تكنولوجيا التعرف على الوجوه ضخم. ومع ذلك ، فإن تنفيذ هذه المشاريع في روسيا مسألة وقت. الشركات التجارية الكبيرة تفهم بالفعل الفوائد والفوائد الاقتصادية. إذا اعتبرنا التعرف على الوجوه منتجًا ، فمن المهم أن نفهم أن كل قطاع من قطاعات الأعمال له تفاصيله الخاصة ، بما في ذلك السعر. كلما زاد حجم المؤسسة ، قد تكون هناك حاجة إلى المزيد من الكاميرات ووحدات التحليلات. حلول الشركات الكبيرة هي دائمًا مشاريع مخصصة معقدة ، والتخصيص يتطلب أموالًا إضافية. يمكن للشركات الصغيرة والمتوسطة القيام بسهولة باستخدام كاميرا واحدة مع وحدة التعرف على الوجوه المتصلة. في هذه الحالة ، تكون تكلفة الحل مماثلة لاستخدام المراقبة بالفيديو السحابية.

Source: https://habr.com/ru/post/ar443906/


All Articles