वीडियो एनालिटिक्स हार्वेस्टर: मस्तिष्क और मशीनें हमारे चेहरे के साथ क्या करती हैं

छवि

चेहरे को देखने और जल्दी से पहचानने की क्षमता महाशक्ति है। झुर्रियों, सिलवटों और अंडाकारों का अध्ययन करने, विश्लेषण करने में समय बिताने की आवश्यकता नहीं है। चेहरा पहचान तुरंत और सरल है। यह इतना आसान है कि हम महसूस नहीं करते कि हम इसे कैसे करते हैं।

इस बारे में सोचें कि अलग-अलग चेहरे एक दूसरे की तरह कैसे दिखते हैं - दो आंखें, एक मुंह, एक नाक, पक्षों पर कान, हर बार एक ही क्रम में (सबसे अधिक बार)। यह अविश्वसनीय है कि हम इतनी आसानी से किसी वस्तु का विश्लेषण करते हैं।

हम जन्म से चेहरे को पहचानने के लिए "प्रोग्राम्ड" हैं, लेकिन अब लोगों ने अधिक हासिल कर लिया है - उन्होंने मशीन को यह कौशल सिखाया। व्यक्ति की पहचान और पहचान प्रणाली का व्यापक कार्यान्वयन समाज को कैसे प्रभावित करेगा?

पेरिडोलिया: स्वचालित चेहरा खोज


छवि

"स्वचालित" मोड में लोग किसी भी सतह पर परिचित छवियों के बीच अंतर करने में सक्षम हैं। इमारत के केवल तीन वास्तुशिल्प तत्वों को आश्चर्य चकित चेहरे के रूप में माना जाता है। यह पेरिडोलिया का एक उदाहरण है।

पेरिडोलिया शब्द ग्रीक शब्द पैरा (पैरा - समीप, पास, किसी भी चीज़ से विचलन) और ईडोलन - छवि से आया है। यह एक ऑप्टिकल भ्रम, एक छवि या अर्थ की धारणा का नाम है जहां वे वास्तव में नहीं हैं। उदाहरण के लिए, बादलों में एक पेड़ के तने या जानवरों की आकृतियों पर एक चेहरा एक पेरिडोलिया है।

छवि
इस तरह के और भी फोटो चीजों पर पाए जा सकते हैं

लोगों के चेहरे और जानवरों के चेहरे हम किसी भी ज्यामितीय आकृति में देखते हैं। पूरी इमोजी संस्कृति इसी सिद्धांत पर बनी है। :-)

छवि

पैरीडोलिया की घटना को एल्गोरिदम की भाषा में आसानी से अनुवादित किया गया है। शिंज़ुंगबैक के कलाकारों किमयोंघुन ने बादलों की तस्वीर खींची, जो मानव चेहरों में एक पल के लिए विलीन हो गई, ओपनसीवी लाइब्रेरी के साथ एक स्क्रिप्ट का उपयोग कर।

थैचर इल्यूजन: सिस्टम बायोलॉजिकल मिस्टेक्स


छवि

एक जैविक बग है जो मान्यता कौशल के महान महत्व को दर्शाता है। आपके आस-पास की अधिकांश वस्तुएं - एक कुर्सी, एक मेज, एक कंप्यूटर, किसी भी कोण से देखने और सही पहचानने में आसान है। सिर्फ चेहरे नहीं।

उल्टा चेहरा थैचर प्रभाव (भ्रम) नामक मस्तिष्क में एक खराबी को जन्म देता है। घटना एक ऐसी स्थिति का वर्णन करती है जिसमें एक उल्टे चित्र फोटो में स्थानीय परिवर्तनों का पता लगाना मुश्किल होता है।

मार्गरेट थैचर की तस्वीर को चालू करें और परिणाम देखें।
छवि

पहली तस्वीर सामान्य लगती है, लेकिन अगर आप इसे पलटते हैं, तो आंखों और मुंह की गलत स्थिति तुरंत आंख को पकड़ लेती है। मनुष्य और एक कृत्रिम तंत्रिका नेटवर्क अलग-अलग तरीकों से छवियों का अनुभव करते हैं। यह आश्चर्यजनक है कि हमारे कानों के बीच "तंत्रिका नेटवर्क" मूर्ख बनाना आसान है।

थैचर का भ्रम कुछ बुनियादी तंत्रों को प्रदर्शित करता है जिनके द्वारा हमारा मस्तिष्क जानकारी की प्रक्रिया करता है। मस्तिष्क व्यक्तिगत तत्वों का एक सेट पढ़ता है: आंखों, नाक, मुंह, कान की एक जोड़ी। चेहरे की विशेषताओं की व्यक्तिगत विशेषताओं के अलावा, उनके और स्थान के बीच के संबंधों को ध्यान में रखा जाता है। अर्थात्, एक व्यक्ति को संपूर्ण प्रणाली के रूप में माना जाता है।

इसलिए, जब हमें एक उल्टा चेहरा दिखाया जाता है, तो मस्तिष्क के लिए पूरी छवि का मूल्यांकन करना अधिक कठिन होता है - जानकारी प्रत्येक तत्व के लिए अलग से "एकत्र" की जाती है: आंखें जगह में होती हैं, मुंह मुंह की तरह होता है। हालांकि, जैसे ही हमें सही चेहरा दिखाया जाता है, अचानक एकल प्रणाली की धारणा फिर से शुरू हो जाती है और समस्याएं शुरू हो जाती हैं: यह स्पष्ट हो जाता है कि परिचित विशेषताएं एक असामान्य तरीके से परस्पर जुड़ी हुई हैं।

यह महत्वपूर्ण क्यों है? मानव मस्तिष्क धारणा की अखंडता के कारण चेहरे की विशेषताओं में सबसे छोटे अंतर को पहचानने में सक्षम है। सेरेब्रल कॉर्टेक्स का क्षेत्र चेहरे को पहचानता है और टकटकी की दिशा निर्धारित करता है, एमिग्डाला और आइलेट लोब चेहरे की अभिव्यक्ति का विश्लेषण करते हैं, और ललाट लोब के पूर्ववर्ती क्षेत्र में क्षेत्र और मस्तिष्क प्रणाली, जो आनंद की भावना के लिए जिम्मेदार है, इसकी सुंदरता और सुंदरता का मूल्यांकन करते हैं।

फीचर की तरह एक बग: चेर्नोव के चेहरे


छवि
( )

मानवीय धारणा की ख़ासियत "चेहरे" का उपयोग करते हुए समग्र बहुआयामी डेटा का विश्लेषण करने के लिए उपयोग की जाती है। 1973 में, अमेरिकी गणितज्ञ जर्मन चेरनोव ने "व्यक्ति" का उपयोग करने की अवधारणा की विशेषता चरित्रों की पहचान करने और अन्य चर के बीच जटिल संबंधों का अध्ययन करने के लिए बताई।

चेर्नोव डेटा चेहरे-पिक्टोग्राम के रूप में परिलक्षित होता है, जहां चयनित चर के सापेक्ष मूल्यों को व्यक्तिगत विशेषताओं के आकार और आकार के रूप में प्रस्तुत किया जाता है: नाक की लंबाई, भौंहों के बीच का कोण, चेहरे की चौड़ाई - कुल 36 चर तक। इस प्रकार, पर्यवेक्षक उन वस्तुओं की दृश्य विशेषताओं की पहचान कर सकता है जो मूल्यों के प्रत्येक विन्यास के लिए अद्वितीय हैं।

चेहरों से बने आरेख पर एक त्वरित नज़र आपको जल्दी से यह निर्धारित करने की अनुमति देगा कि क्या प्रोफाइल की विशेषताओं में काफी अंतर है (संयोग)। चेहरे की विशेषताओं की एक विस्तृत समीक्षा के साथ, यह स्पष्ट हो जाता है कि किन विशेषताओं में (प्रत्येक चेहरे की विशेषता मूल डेटा सेट की एक अलग विशेषता है) समानता, और क्या अंतर है। उदाहरण के लिए, ऊपर दिए गए दृष्टांत में, उदास और मजाकिया इमोटिकॉन्स द्वारा देशों के बीच अंतर को नोटिस करना आसान है।

क्यों अपना चेहरा कार


छवि

त्वरित चेहरे की पहचान का कौशल आपके बच्चे को बालवाड़ी से लेने में मदद करता है, एक साथी का चयन करता है, सही ढंग से और उचित रूप से भावनाओं को व्यक्त करता है। लेकिन क्या होता है जब कोई व्यक्ति इस क्षमता को एक कृत्रिम तंत्रिका नेटवर्क में स्थानांतरित करता है?

एक विचार अस्वीकृति का कारण बन सकता है। हर कोई आसानी से प्रौद्योगिकी को स्वीकार करने के लिए तैयार नहीं है जो डेटा संग्रहीत करता है, आंदोलन की निगरानी करता है, खरीद और भावनाओं का विश्लेषण करता है। साधारण वीडियो निगरानी से व्यक्तिगत वीडियो एनालिटिक्स तक संक्रमण जिम्मेदारी में उल्लेखनीय वृद्धि दर्ज करता है।

छवि

आज, डीपफेस जैसे एल्गोरिदम मनुष्यों की समानता को मनुष्यों की तुलना में अधिक सटीकता के साथ निर्धारित करते हैं। एनवीडिया एल्गोरिथ्म कुछ ही सेकंड में गैर-मौजूद लोगों के चेहरे बनाता है। ऊपर कोलाज में चेहरे स्टाइलगन तंत्रिका नेटवर्क द्वारा उत्पन्न होते हैं, 70,000 छवियों के डेटा सेट पर प्रशिक्षित होते हैं। वे भयावह रूप से यथार्थवादी दिखते हैं।

छवि
SearchFace एल्गोरिथम प्रदर्शन

सबसे पहले, फेसबुक फेस रिकग्निशन अल्गोरिद्म ने सतर्कता बढ़ा दी, लेकिन तब सभी को इसकी आदत पड़ गई (या सोशल नेटवर्क छोड़ दिया)। VKontakte पर फ़ोटो पर लोगों को खोजने के लिए फाइंडस्पेस सेवा को मिश्रित समीक्षाएं मिलीं और इसे बदमाशी के लिए उपयोग किया गया था, लेकिन इसी तरह के सर्चफ़ास प्रोजेक्ट के बंद होने से पहले ही उपयोगकर्ताओं की नकारात्मक प्रतिक्रिया हुई - अंत में, यदि डेटा उपलब्ध है, तो यह सभी के लिए खुला होना चाहिए।

खुदरा विक्रेता चोरी को रोकने, उम्र, लिंग और यहां तक ​​कि ग्राहकों की भावनाओं पर डेटा एकत्र करने के लिए चेहरा पहचान तकनीक स्थापित करते हैं। अंत में, लक्ष्य ग्राहक सेवा में सुधार करना और उस पर पूंजी लगाना है। जब ग्राहकों को पता चलता है कि सिस्टम उनके लिए व्यक्तिगत रूप से फायदेमंद है, तो कई नई तकनीकों को पेश करने के लिए सहमत होंगे।

"पहचान की चोरी" - क्रेडिट कार्ड और व्यक्तिगत डेटा धोखाधड़ी के मामलों की बढ़ती संख्या को देखते हुए, उपभोक्ता सही समय पर सिस्टम को पसंद करेंगे। उनकी सही पहचान करता है।

वर्तमान में, एल्गोरिदम खराब फ्रेम रोशनी, कम रिज़ॉल्यूशन और मास्किंग की समस्याओं को हल करने में मदद करते हैं - जैसे चश्मा, विग और मल्टी-डे ब्रिस्टल्स। सिस्टम जबरदस्त गति से चल रहे हैं और एक व्यक्ति को सिर्फ एक सेकंड में लाखों लोगों के डेटाबेस में मैप करते हैं।

संयुक्त राज्य अमेरिका के कुछ स्टोर चोरी के संदिग्धों को पसंद करने का प्रस्ताव देते हैं: अपने आप को एक तस्वीर लेने या औपचारिक अपराध शुल्क प्राप्त करने की अनुमति दें। एक चोर खरीदारी पर प्रतिबंध के साथ स्वतंत्रता प्राप्त करता है, और उसकी तस्वीर आधिकारिक तौर पर डेटाबेस में मिलती है। लोगों की छवियों वाली फाइलें एन्क्रिप्टेड हैं और केवल सिस्टम के मालिक के लिए उपलब्ध हैं।

जो मान्यता से लाभ कमाता है



अधिकांश दुकानों में पहले से ही सीसीटीवी कैमरे लगे हैं। वीडियो एनालिटिक्स के लिए, हार्डवेयर अपडेट की आवश्यकता नहीं है - बस क्लाउड सेवा कनेक्ट करें। और Ivideon वीडियो एनालिटिक्स सेवा के साथ, प्रवेश सीमा व्यावहारिक रूप से अनुपस्थित है। समाधान की लागत प्रति कैमरा 1,700 रूबल से है, जो किसी भी उद्यमी को सॉफ़्टवेयर तक पहुंच प्रदान करता है।

खुदरा विक्रेताओं का मुख्य उद्देश्य चेहरे की पहचान तकनीक का उपयोग करना है ताकि चोरी को रोका जा सके। अकेले नेशनल रिटेल फाउंडेशन, संयुक्त राज्य अमेरिका के अनुसार, 2017 में सभी सामानों का लगभग 1.33% चोरी के कारण खो गया था - 46.8 बिलियन डॉलर का कोई कम नुकसान नहीं हुआ।

फेस रिकग्निशन टेक्नोलॉजी स्टोर की चोरी की संख्या को 30% से कम कर देती है।

अक्सर माध्यमिक कारक क्षति की मात्रा को प्रभावित करते हैं: कर्मचारियों की लापरवाही, सुरक्षा सेवा की खराब तैयारी, बचाने की इच्छा। इन और अन्य समस्याओं को कैमरा और क्लाउड तकनीक से हल किया जाना चाहिए।

फेस रिकग्निशन सिस्टम ब्लैकलिस्ट के साथ त्वरित कार्य करने की सुविधा प्रदान करता है: यह ग्राहक के फोटो की तुलना अविश्वसनीय व्यक्तियों के डेटाबेस से करता है और यदि यह मेल खाता है, तो गार्ड को एक उपयुक्त चेतावनी भेजता है।

विश्लेषणात्मक सॉफ्टवेयर स्टोर की सुरक्षा को बहुत बढ़ाता है। एक अनुभवी चोर कैमरों के "ब्लाइंड स्पॉट" को नोटिस करने में सक्षम है। इस मामले में, गार्ड संदिग्ध का फोटो खींचने के लिए अपने फोन का उपयोग कर सकता है, और फिर जांच सकता है कि यह व्यक्ति डेटाबेस में है या नहीं।

ब्रांड्स लंबे समय से मोबाइल मार्केटिंग का उपयोग कर रहे हैं - वे एसएमएस भेजते हैं, सूचनाएं भेजते हैं और लक्षित विज्ञापन दिखाते हैं। पारंपरिक रिटेल के लिए, मान्यता प्रणाली वही क्षमताएं प्रदान करती हैं जो ऑनलाइन विक्रेताओं को कुकीज़ से मिली हैं।

चोरों की पहचान करने के लिए उपयोग किया जाने वाला एक ही मंच विक्रेताओं को यह पता लगाने में मदद करता है कि कौन से स्टोरफ्रंट ग्राहकों को बेहतर तरीके से आकर्षित करते हैं। मान्यता प्रणाली वीआईपी ग्राहक को स्टोर के प्रवेश द्वार पर सही पहचान करने में मदद करती है। सीआरएम से डेटा का उपयोग करते हुए, विक्रेता जल्दी से ग्राहक को एक लाभप्रद प्रस्ताव बना सकता है।

छवि
सियोल के अंतर्राष्ट्रीय वित्तीय केंद्र में, वास्तविक समय में सूचना बोर्डों पर कैमरे किसी व्यक्ति की उम्र और लिंग का निर्धारण करते हैं , और पहचान किए गए मापदंडों के अनुसार विज्ञापन प्रदान करते हैं

ग्राहकों की जानकारी बिक्री बढ़ाने और दर्शकों की जरूरतों का आकलन करने के लिए एक शक्तिशाली उपकरण को सक्रिय करती है। कैमरे आपके लिंग, आयु और भावनात्मक स्थिति के आधार पर किसी विशेष आगंतुक के लिए वीडियो विज्ञापनों के प्रदर्शन को कॉन्फ़िगर करने में मदद करेंगे, साथ ही साथ विज्ञापन की प्रभावशीलता की गणना के लिए डेटा प्रदाता बनेंगे।

खुदरा विक्रेताओं के लिए उपरोक्त अवसर अक्सर कष्टप्रद विज्ञापन चर्चा की तरह लगते हैं। ईआरपी से इलेक्ट्रॉनिक मूल्य टैग पर - "लाभ वृद्धि" और "दर्शकों की जरूरत" पर शोध बाजार पर किसी भी आईटी उपकरण के साथ होता है। क्या कृत्रिम बुद्धिमत्ता और भविष्य की तकनीकों के बारे में शुद्ध विपणन की तुलना में मान्यता प्रणालियों का सामना करने के लिए कुछ और है? हम मौजूदा दुकानों में वास्तविक सिस्टम का उपयोग करने के उदाहरणों के माध्यम से इस सवाल का जवाब देंगे।

"कार्य क्षेत्र में": जो वास्तविक परिस्थितियों में चेहरे को पहचानता है


छवि

7-इलेवन दुनिया की सबसे बड़ी खुदरा श्रृंखला है, जिसमें सात-इलेवन जापान 18 देशों में 36,000 से अधिक छोटे स्टोर का प्रबंधन करता है। कंपनी ने हाल ही में अपने स्टोरों में 11,000 सॉफ्टवेयर स्थापित किए हैं । वितरण नेटवर्क में चेहरे की पहचान और व्यवहार विश्लेषण तकनीक का उपयोग वफादारी कार्ड धारकों की पहचान करने, ग्राहक यातायात की निगरानी करने, गोदामों में माल के स्टॉक के स्तर का निर्धारण करने के लिए किया जाता है।

छवि

सक्स प्रीमियम स्टोर्स की एक शताब्दी श्रृंखला है जो वर्तमान में दुनिया की सबसे पुरानी कंपनियों में से एक है (1670 में स्थापित) हडसन की बे कंपनी। सक्स मुख्य रूप से चोरी को रोकने के लिए वीडियो एनालिटिक्स का उपयोग करता है । सॉफ्टवेयर चोरी के संदिग्धों के फोटो की जांच करता है जो जाने-माने दुकानदारों के डेटाबेस के खिलाफ हैं। कैमरों को नेटवर्क किया जाता है, इसलिए परिणामों को न्यू यॉर्क के सैक्स मुख्यालय में देखा जा सकता है।

गार्जियन के अनुसार, यूरोप में प्रीमियम स्टोर और होटल नियमित रूप से VIP और हस्तियों को ट्रैक करने के लिए फेस रिकग्निशन तकनीक का उपयोग करते हैं और उन्हें सबसे आरामदायक स्थिति प्रदान करते हैं।

छवि

अमेरिका में, कैलीबर्गर बर्गर नेटवर्क एक वफादारी कार्यक्रम में चेहरे की पहचान तकनीक का उपयोग करता है । इंटरैक्टिव कियोस्क "ग्राहकों को पहचानता है", आदेशों को याद करता है और पसंदीदा व्यंजन पेश करता है, चेहरे द्वारा पहचान के साथ भुगतान स्वीकार करता है।

सिस्टम पुराने लोगों के लिए बोनस कार्यक्रम में प्रवेश करने की सीमा को हटा देता है, जिन्हें मोबाइल एप्लिकेशन, बोनस अंक और क्रेडिट कार्ड का उपयोग करना मुश्किल हो सकता है।

एशिया में विशेष रूप से चीन में चेहरा पहचान प्रणाली का व्यापक रूप से उपयोग किया जाता है, जहां उनका उपयोग भोजन का भुगतान करने, एटीएम से नकदी निकालने या यहां तक ​​कि ऋण लेने के लिए किया जाता है। चीन में चेहरा पहचान सटीकता मानव आँख से बेहतर है। यह चीन के 2 डी से 3 डी मान्यता के बड़े पैमाने पर संक्रमण के कारण भी है।

पहले मामले में, एल्गोरिदम विश्लेषण के लिए डेटाबेस में संग्रहीत दो-आयामी छवियों का उपयोग करते हैं। 3 डी मान्यता विश्लेषण ने तीन आयामी छवियों को फिर से संगठित किया और उच्च सटीकता प्रदर्शित करता है। चीन में, फेस स्कैन का उपयोग करके, आप खरीदारी कर सकते हैं (उदाहरण के लिए, केएफसी में ऑर्डर का भुगतान करें), भुगतान करें और इमारतों में प्रवेश करें।

छवि

Alipay में, आपको मुस्कुराने की ज़रूरत है ताकि भुगतान मान्यता प्रणाली समझे: इससे पहले कि यह एक तस्वीर नहीं है, लेकिन एक जीवित व्यक्ति है। यह आरोप लगाया जाता है कि Alipay को धोखा देना असंभव है: बालों का रंग, मेकअप बदलना, विग का उपयोग करने से कुछ भी नहीं बदलता है। सिस्टम विशिष्ट विशेषताओं के एक सेट का उपयोग करता है जो चेहरे की ज्यामिति और उस पर कुछ बिंदुओं के स्थान को ध्यान में रखता है।

निष्कर्ष


पश्चिमी कंपनियों और चीन द्वारा प्रत्यक्ष पहचान प्रौद्योगिकी में प्रत्यक्ष निवेश का पैमाना बहुत बड़ा है। फिर भी, रूस में ऐसी परियोजनाओं का कार्यान्वयन समय की बात है। बड़ी वाणिज्यिक कंपनियां पहले से ही लाभ और आर्थिक लाभ को समझती हैं। यदि हम एक उत्पाद के रूप में चेहरे की पहचान पर विचार करते हैं, तो यह समझना महत्वपूर्ण है कि व्यवसाय के प्रत्येक खंड की अपनी विशिष्टताएं हैं, जिसमें मूल्य भी शामिल है। जितना बड़ा उद्यम, उतने अधिक कैमरे और एनालिटिक्स मॉड्यूल की आवश्यकता हो सकती है। बड़े व्यवसायों के लिए समाधान हमेशा जटिल अनुकूलित परियोजनाएं होती हैं, और अनुकूलन के लिए अतिरिक्त धन की आवश्यकता होती है। मध्यम और छोटे व्यवसाय आसानी से एक कैमरा के साथ कनेक्टेड फेस रिकग्निशन मॉड्यूल के साथ कर सकते हैं। इस मामले में, समाधान की लागत क्लाउड वीडियो निगरानी के उपयोग के लिए तुलनीय है।

Source: https://habr.com/ru/post/hi443906/


All Articles