मशीन विजन सिस्टम लोगों के साथ एक स्तर पर चेहरे को पहचान सकता है और यहां तक कि यथार्थवादी कृत्रिम चेहरे भी बना सकता है। लेकिन शोधकर्ताओं ने पाया कि ये सिस्टम ऑप्टिकल भ्रम को पहचान नहीं सकते हैं, और इसलिए, नए निर्माण करते हैं।

मानव दृष्टि एक अद्भुत उपकरण है। यद्यपि यह लाखों वर्षों से एक विशेष वातावरण में विकसित हुआ है, यह उन कार्यों में सक्षम है जो शुरुआती दृश्य प्रणालियों में कभी नहीं आए। एक अच्छा उदाहरण कृत्रिम वस्तुओं को पढ़ना, या परिभाषित करना होगा - कार, हवाई जहाज, यातायात संकेत, आदि।
लेकिन दृश्य प्रणाली में खामियों का एक प्रसिद्ध सेट है जिसे हम ऑप्टिकल भ्रम मानते हैं। शोधकर्ताओं ने पहले से ही कई विकल्पों की पहचान की है जिसमें ये भ्रम लोगों को गलत तरीके से रंग, आकार, रिश्तेदार की स्थिति और आंदोलन का मूल्यांकन करने का कारण बनाते हैं।
प्रति दृश्य भ्रम इस मायने में दिलचस्प है कि वे दृश्य प्रणाली और धारणा की प्रकृति का एक विचार देते हैं। इसलिए, नए भ्रमों को खोजने के तरीके के साथ आने के लिए यह बहुत उपयोगी होगा जो इस प्रणाली की सीमाओं का अध्ययन करने में मदद करेगा।
कंसेंट्रिक सर्कल?यहां हमें काम में गहराई से प्रशिक्षण लेना चाहिए। हाल के वर्षों में, मशीनों ने चित्रों में वस्तुओं और चेहरों को पहचानना सीखा है, और फिर इसी तरह की छवियां बनाई हैं। यह कल्पना करना आसान है कि एक मशीन विजन सिस्टम को भ्रम को पहचानने और खुद को बनाने में सक्षम होना चाहिए।
यहां केंटकी में लुइसविले विश्वविद्यालय के रॉबर्ट विलियम्स और रोमन यमपोलस्की ने मंच संभाला। इन लोगों
ने इस तरह की हरकत करने की कोशिश की , लेकिन पाया कि सब कुछ इतना सरल नहीं था। मौजूदा मशीन लर्निंग सिस्टम अपने स्वयं के ऑप्टिकल भ्रम देने में सक्षम नहीं हैं - कम से कम अभी तक नहीं। ऐसा क्यों?
सबसे पहले, सामान्य जानकारी। गहन शिक्षा में हालिया प्रगति दो सफलताओं पर आधारित हैं। पहला शक्तिशाली तंत्रिका नेटवर्क की उपलब्धता और कुछ सॉफ्टवेयर ट्रिक्स हैं जो उन्हें अच्छी तरह से सीखने की अनुमति देते हैं।
दूसरा वॉल्यूम के संदर्भ में विशाल चिह्नित डेटाबेस का निर्माण है, जिसके आधार पर मशीनें सीखने में सक्षम हैं। उदाहरण के लिए, चेहरे को पहचानने के लिए एक मशीन सिखाने के लिए, यह स्पष्ट रूप से चिह्नित चेहरों के साथ हजारों छवियों को लेता है। इस जानकारी के साथ, तंत्रिका नेटवर्क चेहरे के विशिष्ट पैटर्न को पहचानना सीख सकता है - दो आंखें, एक नाक और एक मुंह। और भी प्रभावशाली, नेटवर्क की एक जोड़ी - तथाकथित
जनन-प्रतिस्पर्धी नेटवर्क (GSS) - एक-दूसरे को सिखाने में सक्षम कि कैसे चेहरे की यथार्थवादी और पूरी तरह से कृत्रिम छवियां बनाई जाएं।
विलियम्स और याम्पोलस्की ने ऑप्टिकल भ्रम को निर्धारित करने के लिए तंत्रिका नेटवर्क को सिखाने की कल्पना की। कम्प्यूटिंग क्षमता पर्याप्त है, और पर्याप्त उपयुक्त डेटाबेस नहीं हैं। इसलिए, उनका पहला काम प्रशिक्षण के लिए ऑप्टिकल भ्रम का एक डेटाबेस बनाना था।
यह करना मुश्किल हो गया। वे कहते हैं, "केवल कुछ हज़ार स्थिर ऑप्टिकल भ्रम हैं, और अद्वितीय प्रकार के भ्रम बहुत कम हैं - शायद एक दर्जन"।
और यह आधुनिक मशीन लर्निंग सिस्टम के लिए एक गंभीर बाधा है। "एक मॉडल बनाना जो इस तरह के एक छोटे और सीमित डेटा सेट से सीख सकता है, जेनरेटर मॉडल और मानव दृष्टि की समझ के लिए एक बड़ी छलांग होगा।"
इसलिए, विलियम्स और याम्पोलस्की ने ऑप्टिकल भ्रम के 6,000 से अधिक छवियों का एक डेटाबेस एकत्र किया, और तंत्रिका नेटवर्क को उन्हें पहचानने के लिए प्रशिक्षित किया। फिर उन्होंने जीएसएस बनाया, जो स्वतंत्र रूप से ऑप्टिकल भ्रम पैदा करना चाहिए।
परिणामों ने उन्हें निराश किया। "एनवीडिया टेस्ला के 80 पर सात घंटे के प्रशिक्षण के बाद, मूल्य का कुछ भी नहीं बनाया गया था," शोधकर्ताओं ने कहा, जिन्होंने सभी के उपयोग के लिए डेटाबेस खोला।
परिणाम, हालांकि, दिलचस्प है। "हमें ज्ञात केवल ऑप्टिकल भ्रम विकास (उदाहरण के लिए, तितली के पंखों पर आंखों के पैटर्न) या मानव कलाकारों द्वारा बनाए गए थे," वे बताते हैं। और दोनों ही मामलों में, लोगों ने प्रतिक्रिया प्रदान करने में महत्वपूर्ण भूमिका निभाई - लोग भ्रम देख सकते हैं।
और मशीन विजन सिस्टम नहीं कर सकते। विलियम्स और यमपोलस्की कहते हैं, "यह संभावना नहीं है कि जीएसएस अपने सिद्धांतों को समझने के बिना उनकी दृष्टि को धोखा देने में सक्षम होगा।"
यह चुनौतीपूर्ण हो सकता है, क्योंकि मनुष्य और मशीन के दृश्य प्रणालियों के बीच महत्वपूर्ण अंतर हैं। कई शोधकर्ता तंत्रिका नेटवर्क बनाते हैं जो मानव दृश्य प्रणाली की और भी अधिक याद दिलाते हैं। शायद इन प्रणालियों के लिए एक दिलचस्प जांच यह होगी कि क्या वे भ्रम देख सकते हैं।
इस बीच, विलियम्स और याम्पोलस्की आशावादी नहीं हैं: "जाहिर है, भ्रम के साथ सेट एक डेटा नए भ्रम बनाने के लिए पर्याप्त नहीं हो सकता है," वे कहते हैं। तो अब के लिए, ऑप्टिकल भ्रम मानव धारणा का एक गढ़ है, मशीनों के अधीन नहीं।