कम्प्यूटर विजन समर कैम्प - इंटेल कम्प्यूटर विजन समर स्कूल



यूएनएन के आधार पर 3 से 16 जुलाई तक। एनआई लोबचेवस्की ने इंटरन्यूसिटी समर स्कूल ऑफ इंटेल कंप्यूटर विजन - कंप्यूटर विजन समर कैंप पास किया, जिसमें 100 से अधिक छात्रों ने भाग लिया। यह विद्यालय निज़नी नोवगोरोड विश्वविद्यालयों के तकनीकी विशिष्टताओं के छात्रों के उद्देश्य से था, जो कंप्यूटर दृष्टि, गहन शिक्षा, तंत्रिका नेटवर्क, इंटेल ओपनविनो, ओपनसीवी में रुचि रखते हैं।

इस लेख में, हम साझा करेंगे कि स्कूल के लिए चयन कैसे हुआ, हमने क्या अध्ययन किया, लोगों ने व्यावहारिक भाग में क्या किया, और रक्षा पर प्रस्तुत कुछ परियोजनाओं के बारे में भी बात की।

चयन प्रक्रिया और भागीदारी प्रपत्र


हमने बच्चों को प्रशिक्षण के दो रूपों के लिए आवेदन करने का विकल्प देने का फैसला किया: पूर्णकालिक और अंशकालिक। छात्रों ने पूर्णकालिक पत्राचार के लिए चयन पास नहीं किया और तुरंत दाखिला लिया। उन्होंने केवल व्याख्यान में भाग लिया, सप्ताह के दिनों में, सुबह में। लोगों को व्यावहारिक कार्यों को पूरा करने और शिक्षकों द्वारा परीक्षण के लिए गिटहब भेजने का अवसर मिला।

पूर्णकालिक जाने के लिए, लोगों को आयोग के साथ साक्षात्कार के लिए इंटेल कार्यालय में आना पड़ा। अंशकालिक रूप से अंतर यह था कि व्याख्यान के अलावा, शिविर के प्रतिभागियों ने क्यूरेटर - यूएनएन के शिक्षकों और इंटेल के इंजीनियरों के साथ व्यावहारिक कार्यों को हल किया। दूसरे सप्ताह में, व्यावहारिक कार्य पूरे हो गए और परियोजनाएं शुरू हुईं, जिस पर प्रतिभागियों ने 3 लोगों के समूहों में काम किया।

साक्षात्कार में, छात्रों को गणित और प्रोग्रामिंग में प्रश्न पूछे गए, साथ ही एक कार्य दिया गया जिसे मौके पर हल करने की आवश्यकता थी। यह ध्यान देने योग्य है कि आयोग में सॉफ्टवेयर इंजीनियर, एल्गोरिदम इंजीनियर और विश्वविद्यालय के प्रोफेसर शामिल थे। एनआई लोबचेवस्की, इसलिए साक्षात्कार बहुपक्षीय और उत्कृष्ट निकला। साक्षात्कारकर्ता के दृष्टिकोण से, कंप्यूटर दृष्टि पर लागू होने वाले छात्रों के बुनियादी तकनीकी ज्ञान का पता लगाना दिलचस्प था, इसलिए सी ++ / एसटीएल, ओओपी, बुनियादी एल्गोरिदम और डेटा संरचनाएं, रैखिक बीजगणित, गणितीय विश्लेषण, विवेकशील गणित और बहुत कुछ जैसे विषयों से पूछा गया। कार्यों से छात्रों का तर्क सीखना प्राथमिकता थी। आयोग की भी रुचि थी कि वे कहाँ अध्ययन करते थे, इस स्कूल (उदाहरण के लिए, वैज्ञानिक गतिविधि) से पहले उन्हें क्या अनुभव था और इसे सीधे कंप्यूटर विज़न के क्षेत्र में कैसे लागू किया जा सकता था।

कुल मिलाकर 78 छात्रों ने पूर्णकालिक चयन में भाग लिया, जबकि 24 पूर्णकालिक स्थान थे। प्रतियोगिता में प्रति स्थान 3 छात्र थे। आप नीचे दी गई तालिका में भाग लेने के पूर्णकालिक और अंशकालिक रूपों के बीच प्रतिभागियों और दृश्य अंतर पर आंकड़े देख सकते हैं:



2 हफ्ते तक दोस्तों ने क्या किया?


सिद्धांत और व्यवहार में छात्र कंप्यूटर दृष्टि के मुख्य कार्यों से परिचित हुए: छवियों का वर्गीकरण, वस्तुओं का पता लगाना और उनकी संगत। एक नियम के रूप में प्रत्येक विषय पर व्याख्यान घटक में मशीन सीखने और तंत्रिका नेटवर्क का उपयोग करके कंप्यूटर दृष्टि समस्याओं को हल करने के आधुनिक तरीकों और हल करने के लिए शास्त्रीय तरीकों के विकास में एक ऐतिहासिक भ्रमण शामिल था। सिद्धांत का पालन एक अभ्यास द्वारा किया गया था, जहां छात्रों ने लोकप्रिय तंत्रिका नेटवर्क मॉडल डाउनलोड करने के बाद, ओपनसीवी लाइब्रेरी के डीएनसी मॉड्यूल का उपयोग करके उन्हें लॉन्च किया, जिससे एक उपयोगकर्ता अनुप्रयोग बना।

सभी व्याख्यानों की प्रस्तुतियाँ गितूब के सार्वजनिक भंडार में पोस्ट की गई थीं, ताकि छात्र स्कूल के बाद सहित आवश्यक जानकारी हमेशा खोल सकें और देख सकें। व्याख्याताओं, अभ्यास के शिक्षकों और इंटेल इंजीनियरों दोनों के साथ या गटर में चैट के माध्यम से चैट करना संभव था। परियोजना सप्ताह का समय भी सफल हो गया: यह बुधवार को शुरू हुआ, जिसने हमें कई फैसलों में सुधार करते हुए व्याख्यान से मुक्त सप्ताहांत बिताने की अनुमति दी। सबसे अधिक जिम्मेदार प्रतिभागियों ने इंटेल कार्यालय में आधा शनिवार बिताया, जिसके लिए उन्हें उसी दिन एक अनिर्धारित भ्रमण द्वारा प्रोत्साहित किया गया था।

परियोजनाओं की सुरक्षा कैसी थी?


प्रत्येक टीम को परियोजना के दौरान उन्होंने क्या किया और क्या करने आए, इस बारे में बात करने के लिए 10 मिनट का समय दिया गया। इस समय के बाद, 5 मिनट शुरू हुए, जिसमें कंपनी के इंजीनियरों ने लोगों से सवाल पूछे और थोड़ी सलाह दी जिससे उन्हें अपने प्रोजेक्ट को बेहतर बनाने या भविष्य में गलतियों को रोकने में मदद मिलेगी। दोस्तों में से प्रत्येक ने कंप्यूटर विज़न के अपने ज्ञान को दिखाते हुए और प्रोजेक्ट के निर्माण में उनके योगदान की पुष्टि करते हुए, एक वक्ता के रूप में खुद को आजमाया, जिसने हमें स्कूल के प्रत्येक प्रतिभागी के बारे में एक निष्कर्ष पर विचार करने और आकर्षित करने में मदद की। रक्षा में 3 घंटे लगे, लेकिन हमने लोगों की देखभाल की और एक छोटे से कॉफी ब्रेक के साथ स्थिति को खराब कर दिया, जहां लोग एक सांस ले सकते थे और प्रमुख इंटेल विशेषज्ञों के साथ समस्याओं पर चर्चा कर सकते थे।

दिन के अंत में, हमने पहला, दो दूसरा और तीन तीसरा स्थान सौंपा। यह चुनना काफी मुश्किल था, क्योंकि प्रत्येक टीम, प्रत्येक परियोजना का अपना स्वाद था और प्रस्तुति की मौलिकता से प्रतिष्ठित था।


पूर्णकालिक सीवी कैंप, परियोजना संरक्षण, निज़नी नोवगोरोड में इंटेल कार्यालय

प्रस्तुत परियोजनाएँ


स्मार्ट दस्ताने




अंतरिक्ष में दृश्य नेविगेशन के लिए OpenCV का उपयोग करके डिटेक्टर और ट्रैकर का उपयोग करना। टीम ने अतिरिक्त रूप से दो कैमरों का उपयोग करके गहराई निर्धारित करने की क्षमता को जोड़ा। Microsoft भाषण API का उपयोग प्रबंधन इंटरफ़ेस के रूप में किया जाता है।

रिसेप्टर




खाद्य पदार्थों का पता लगाना और तैयार पकवान के लिए एक नुस्खा का चयन करना, जिसमें पाया गया सामग्री भी शामिल है। लोग कार्य से डरते नहीं थे और एक हफ्ते के लिए उन्होंने अपने दम पर पर्याप्त संख्या में चित्र चिह्नित किए, डिटेक्टर को टेन्सरफ्लो ऑब्जेक्ट डिटेक्शन एपीआई का उपयोग करके प्रशिक्षित किया और नुस्खा खोजने के लिए तर्क जोड़ा। सरल और स्वादिष्ट!

संपादक 2.0




प्रोजेक्ट प्रतिभागियों ने तंत्रिका वीडियो (चेहरे की खोज, प्रमुख बिंदुओं द्वारा चेहरे की छवियों के सामान्यीकरण, चेहरे की छवि विवरणक की गणना) का एक सेट का उपयोग किया, जो लंबे वीडियो में टुकड़ों के लिए खोज के कार्य के भाग के रूप में चेहरे को पहचानने के लिए जिसमें एक निश्चित व्यक्ति मौजूद है। विकसित प्रणाली का उपयोग वीडियो संपादन के लिए एक सहायता प्रणाली के रूप में किया जा सकता है, जो व्यक्ति को आवश्यक अंशों की तलाश में वीडियो को देखने से मुक्त कर सकता है। OpenVINO मॉडल लाइब्रेरी से तंत्रिका नेटवर्क का उपयोग करते हुए, टीम एक उच्च अनुप्रयोग गति प्राप्त करने में कामयाब रही: एक इंटेल कोर i5 प्रोसेसर वाले लैपटॉप पर, वीडियो प्रसंस्करण की गति 58 फ्रेम प्रति सेकंड थी।

anonymizer




किसी व्यक्ति के चेहरे पर चश्मा और मुखौटे खींचना। चेहरे और मुख्य बिंदुओं का पता लगाने के लिए, MTCNN नेटवर्क का उपयोग किया गया था।

गुमनाम




व्यक्तित्व के छिपाव के विषय पर एक और दिलचस्प काम। इस टीम ने कई चेहरे विकृति के विकल्प पेश किए: धब्बा और पिक्सेलेशन। एक सप्ताह में, लोगों ने न केवल कार्य का पता लगाया, बल्कि एक विशिष्ट व्यक्ति (चेहरे की पहचान के साथ) के लिए एक अनाम मोड भी प्रदान किया।

वार्म अप करें


"वार्म अप" परियोजना की टीम ने सिर के झुकाव के अभ्यास के लिए एक खेल सहायक बनाने की समस्या को हल किया। और यहां तक ​​कि अगर इस एप्लिकेशन का अंतिम आवेदन अभी भी विवादास्पद है, तो विभिन्न चेहरे का पता लगाने वाले एल्गोरिदम की तुलना में एक व्यापक अध्ययन किया गया था: हार कैस्केड, टेन्सरफ्लो, ओपनसीवी और ओपनविनो के नेटवर्क। न केवल शारीरिक रूप से, बल्कि मानसिक रूप से भी गर्म रहें!

निचला 800




निज़नी नोवगोरोड, जिस शहर में स्कूल आयोजित किया गया था, वह 2 साल में 800 साल पुराना हो जाएगा, जिसका मतलब है कि एक दिलचस्प परियोजना को लागू करने के लिए पर्याप्त समय है। हमने सुझाव दिया कि लोग एक गाइड बनाने के कार्य के बारे में सोचते हैं, जो इस बात की जानकारी दे सकता है कि छवि में वस्तु का प्रतिनिधित्व क्या है और इमारतों के मुखौटे की छवि से इसके बारे में कौन से तथ्य ज्ञात हैं। हमारी राय में, यह कार्य सबसे कठिन में से एक था, क्योंकि यह शास्त्रीय कंप्यूटर दृष्टि से संबंधित है, लेकिन टीम ने एक सभ्य परिणाम दिखाया।

पत्थर, कैंची, कागज


डिजाइन कार्य के कार्यान्वयन के लिए सख्त समय सीमा के बावजूद, यह टीम एक प्रसिद्ध खेल में हाथ की स्थिति को वर्गीकृत करने के लिए अपने स्वयं के तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए एक प्रयोग करने से भी डरती नहीं थी।

प्रतिभागी समीक्षा


हमने विभिन्न पाठ्यक्रमों के छात्रों से समर स्कूल के अपने छापों को साझा करने के लिए कहा:

हाल ही में, मैं इंटेल कंप्यूटर विजन समर कैंप में प्रशिक्षण प्राप्त करने के लिए पर्याप्त भाग्यशाली था, और यह एक अद्भुत अनुभव था। हमें सीवी के क्षेत्र में बहुत से नए ज्ञान और कौशल प्राप्त हुए, सॉफ्टवेयर इंस्टॉलेशन, डिबगिंग भी काम के माहौल में डूबे हुए थे, वास्तविक समस्याओं का सामना करना पड़ा, स्कूल के सहयोगियों और शिक्षकों के साथ संभावित समाधानों पर चर्चा हुई। एक मिथक है कि प्रोग्रामर का काम विशेष रूप से कंप्यूटर के साथ संवाद करने में है। हालांकि, यह शब्द से बिल्कुल भी ऐसा नहीं है। हमारा रचनात्मक कार्य लोगों के साथ संचार से अविभाज्य है। संवाद करने से, अद्वितीय ज्ञान प्राप्त करना संभव था। और स्कूल का यह घटक मुझे सबसे ज्यादा पसंद आया। हालांकि, वहाँ एक माइनस है ... स्नातक होने के बाद मैं जारी रखना चाहता था! डीएल में सैद्धांतिक ज्ञान और सीवी में व्यावहारिक कौशल के अलावा, मुझे एक विचार मिला कि गणित के किन क्षेत्रों पर विशेष ध्यान दिया जाना चाहिए, किन प्रौद्योगिकियों का अध्ययन किया जाना चाहिए। इंटेल इंजीनियरों और शोधकर्ताओं के काम के समर्पण, व्यावसायिकता और प्यार ने आईटी में मेरी पसंद की दिशा को प्रभावित किया। इसके लिए मैं स्कूल के सभी आयोजकों को धन्यवाद देना चाहूंगा।
क्रिस्टीना, 1 वर्ष, एचएसई

इतने कम समय में, स्कूल कंप्यूटर दृष्टि के विषय पर अधिकतम जानकारी और अभ्यास प्रदान करने में सक्षम था। और यद्यपि यह बुनियादी ज्ञान के लिए डिज़ाइन किया गया था, व्याख्यान में बहुत सारी तकनीकी सामग्री थी, जिसे मैं समझना और अध्ययन के लिए अधिक समय बिताना चाहूंगा। स्कूल के मेंटर्स और लेक्चरर्स ने सभी सवालों के जवाब दिए और छात्रों से बात की। खैर, अंतिम परियोजना के कार्यान्वयन के दौरान, मुझे एक तैयार अनुप्रयोग विकसित करने और कठिनाइयों का सामना करने के जंगल में उतरना पड़ा जो अध्ययन करते समय हमेशा उत्पन्न नहीं होते हैं। हमारी टीम ने अंततः गेम "रॉक-पेपर-कैंची" एक कंप्यूटर के साथ खेलने के लिए एक आवेदन किया। हमने मॉडल को प्रशिक्षित किया, वेब कैमरा पर आकृति को पहचानते हुए, तर्क लिखा और ऑपनेंव फ्रेमवर्क के आधार पर एक इंटरफ़ेस बनाया। स्कूल ने विचार के लिए भोजन और आगे की शिक्षा और विकास के लिए एक वेक्टर प्रदान किया। बहुत खुशी हुई कि मैंने भाग लिया।
सर्गेई, 3 वर्ष, यूएनएन

स्कूल मेरी उम्मीदों पर खरा नहीं उतरा। इंटेल डेवलपर्स के काफी अनुभवी लोगों द्वारा व्याख्यान आयोजित किए गए थे। व्याख्याताओं के साथ संचार हमेशा दिलचस्प और उपयोगी रहा है, संरक्षक उत्तरदायी हैं, हमेशा मदद के लिए तैयार हैं। व्याख्यान सुनने के लिए सुखद हैं, विषय काफी प्रासंगिक और जानकारीपूर्ण हैं। लेकिन मैं पहले से ही कुछ चीजों को जानता था, और जिन्हें मैं नहीं जानता था उन्हें अभ्यास द्वारा समर्थित नहीं किया गया था, और इसलिए मुझे वास्तव में पूरी सामग्री को समझने और अध्ययन करने की आवश्यकता नहीं थी। हां, अधिकांश जानकारी केवल सूचना के प्रयोजनों के लिए प्रदान की गई थी, ताकि बाद में मैं इसे पहले से ही घर पर आज़मा सकूं, या बस कल्पना कर सकता हूं कि यह क्या था, लेकिन फिर भी मैं अनुभवी शिक्षकों की देखरेख में अपने दम पर कुछ मौजूदा एल्गोरिदम को लागू करना चाहता था जो कुछ भी सलाह या मदद कर सकते हैं यह काम नहीं करता है नतीजतन, तैयार-किए गए समाधान व्यवहार में उपयोग किए गए थे, और कोड, जो एक कह सकता है, पहले हमारे लिए लिखा गया था, केवल इसे थोड़ा संशोधित करने के लिए आवश्यक था। परियोजनाएं सबसे सरल थीं, और यदि आप किसी तरह से कार्य को जटिल बनाने का प्रयास करते हैं, तो आपके पास इतना समय नहीं है कि हम इसे कम या ज्यादा स्थिर स्थिति में लागू कर सकें, जैसा कि हमारे साथ हुआ है।
सामान्य तौर पर, पूरा स्कूल डेवलपर्स में किसी प्रकार के गंभीर खेल की तरह नहीं दिखता है, और यह सिर्फ व्यावहारिक भाग की गलती है। मुझे लगता है कि अभ्यासों की सामग्री को जटिल करने के लिए, एक स्कूल के संचालन के लिए समय बढ़ाना आवश्यक है, ताकि आप खुद को कुछ लिख सकें, कुछ वास्तव में जटिल और आवश्यक हो, और समाप्त एक का उपयोग न करें, बढ़ती जटिलता में अभ्यास को अधिक सुचारू बना सकें, प्रतिस्पर्धी पर विषय शुरुआती दिनों में परियोजनाओं को बाहर करने के लिए ताकि व्याख्यान और प्रथाओं से सामग्री को तुरंत अपनी परियोजनाओं में इस्तेमाल किया जा सके और कार्यान्वयन के लिए अधिक समय होगा। फिर स्कूल में बिताया गया समय शुरुआती लोगों के लिए एक अच्छा अनुभव होगा।
दिमित्री, 1 वर्षीय मास्टर कोर्स, NSTU

इंटेल का समर स्कूल इस गर्मी को वे जो प्यार करते हैं उसे बिताने का एक शानदार मौका था। तथ्य यह है कि कंप्यूटर दृष्टि के क्षेत्र में प्रोग्रामिंग से संबंधित इंटेल व्याख्याताओं ने व्याख्यान नहीं दिया, मैं पूरी प्रक्रिया से अधिकतम लेना चाहता था, हालांकि यह कभी-कभी मुश्किल था। हर दिन बहुत जल्दी, चुपचाप और फल से गुजरा। अपनी खुद की परियोजना को लागू करने के अवसर ने मुझे अद्भुत क्यूरेटर और अन्य स्कूल प्रतिभागियों के साथ एक टीम में काम करने की अनुमति दी। इन दो हफ्तों को संक्षेप में रोचक और क्षणभंगुर बताया जा सकता है।
एलिजाबेथ, 2 वर्ष, यूएनएन

गिरावट (अक्टूबर-नवंबर) में आपको डेल्टा शैक्षिक कार्यक्रम मिलेगा, जिसके बारे में जानकारी आप हमारे VKontakte समूह से प्राप्त कर सकते हैं। देखते रहो!

Source: https://habr.com/ru/post/hi464579/


All Articles