कोडफेस्ट में डेटा विज्ञान: क्रांति का स्वाद

छवि

स्व, पहले सन्निकटन में, समानांतर है। स्वचालिततावाद वास्तव में अहंकार पैदा करता है। हेदोनिज़्म के विचार मिल और बेंथम के उपयोगितावाद के लिए केंद्रीय हैं, लेकिन संदेह घटनात्मक संघर्ष को बदल देता है। कोड लिंग को समझना शुरू करता है।

यैंडेक्स में शामिल होने का प्रायोजक।

डेटा साइंस और मशीन लर्निंग ने हमारे जीवन और कोडफेस्ट दोनों में लंबे समय तक प्रवेश किया है, लेकिन पहली बार हम उन्हें एक अलग खंड में बाहर करते हैं। क्योंकि खंडों के देवता के और भी खंड हैं!

मंजिल को अनुभाग बंधांक 5 के क्यूरेटर को दिया जाता है । वह आपके लोइस और कर्म के पुरस्कारों से खुश होगा, वैसे।

डेटा साइंस सेक्शन में क्या होगा?

इस बारे में लिखने से पहले, मैं एक छोटा (बहुत छोटा!) दार्शनिक विषयांतर करूँगा।

हम मनुष्य सामाजिक प्राणी हैं, और हम संचार के बिना नहीं रह सकते हैं: एक कार्यालय की बैठक कक्ष में काम पर या एक आरामदायक बार में एक गिलास बीयर के साथ। लेकिन सभी संचार "समान रूप से उपयोगी नहीं हैं।" पेशे हैं - उदाहरण के लिए, एक कॉल सेंटर ऑपरेटर - जिसमें अलग-अलग के साथ संवाद करना, कभी-कभी बहुत सुखद नहीं होता है, लोग काम के पूरे बिंदु बनाते हैं और सप्ताह के बाद दिन, दिन के बाद रहते हैं। फिर संचार एक कठिन, मनोवैज्ञानिक रूप से थकाऊ काम में बदल जाता है जिसे सुगम या स्वचालित नहीं किया जा सकता है। या हो सकता है?

ऐसा लगता है कि इस मामले में, एल्गोरिथ्म को केवल इमेजनेट से तस्वीर में बिल्ली को पहचानने की आवश्यकता नहीं है, लेकिन समझें (सुनें या पढ़ें) कि वार्ताकार क्या चाहता है, पर्याप्त रूप से उसे जवाब दें, "व्यर्थ", यदि आवश्यक हो, तो कुछ पूछें या स्पष्ट करें। चुनौतीपूर्ण कार्य!

आसान नहीं है, लेकिन कृत्रिम बुद्धि के आधुनिक तरीकों से हल किया गया है। और इसलिए, यह मौका नहीं था कि अनुभाग में हमारे अधिकांश वक्ताओं के भाषण इस समस्या को हल करने के तरीकों और प्रौद्योगिकियों के लिए समर्पित होंगे।

छवि क्या तंत्रिका नेटवर्क इससे हमारी मदद करेगा या नहीं? और वे क्या हैं, ग्रंथों और संचार के लिए आधुनिक तंत्रिका नेटवर्क आर्किटेक्चर? क्या एक साधारण आईटी-शिकोनी उनके साथ सामना कर सकता है? शब्द संसाधन में तंत्रिका नेटवर्क: प्रचार या गंभीरता से और लंबे समय तक? "- कंप्यूटर भाषा विज्ञान के एक विशेषज्ञ, rusvectores.org परियोजना के संस्थापक, और ओस्लो विश्वविद्यालय के एक शोधकर्ता, एंड्री कुतुज़ोव, हमें इस बारे में बताएंगे।


छवि लेकिन क्या होगा अगर हम अपने एल्गोरिथ्म को न केवल पढ़ना चाहते हैं, बल्कि सुनना भी चाहते हैं? कैसे एक अच्छा भाषण मान्यता प्रणाली बनाने के लिए? और सामान्य तौर पर, भाषण प्रौद्योगिकी के संबंध में "अच्छा" क्या है? नई पीढ़ी के वाक् पहचान प्रणाली के "हुड के तहत" क्या है? क्या हमारे लिए अच्छे पुराने क्लासिक्स - छिपे हुए मार्कोव मॉडल, या एक तंत्रिका नेटवर्क - और यहाँ "हमारा सब कुछ" है? इन सवालों के जवाब जो कई लोगों के लिए चिंताजनक हैं (और मैं निश्चित रूप से) उनकी कहानी में निकोलाई श्यामरेव , एसी टेक्नोलॉजीज के प्रमुख और स्रोत भाषण मान्यता परियोजनाओं सीएमयू स्फिंक्स और कालडी को खोलने के लिए मुख्य योगदानकर्ताओं में से एक द्वारा दिया जाएगा


छवि खैर, हमने एक व्यक्ति को सुना या उसके संदेश को पढ़ा, पाठ को मान्यता दी। और पाठ से मुख्य बात कैसे निकाली जाए जो हमारे वार्ताकार हमें बताना चाहते थे? वे लंबे समय से संक्षेप (ऑटो-अमूर्त) पाठ की समस्या को हल करने की कोशिश कर रहे हैं। मुझे याद है कि मैंने विश्वविद्यालय में दर्शनशास्त्र पर एक निबंध तैयार करने के लिए एक बार सारांश की एक प्रणाली का उपयोग किया था। और अब इस बारे में क्या? " ग्रंथों को सारांशित करना: सब कुछ और सब कुछ संक्षेप करने के लिए समाचारों को सुर्खियों में लाने से " - यह डेनकिल गैविलोव की प्रस्तुति के लिए समर्पित होगा, जो कि VKontakte टीम के एक डेवलपर और मशीन सीखने के विशेषज्ञ हैं।


छवि अंत में, रोबोट को एहसास हुआ कि एक आदमी उससे क्या चाहता है। अब उसे पर्याप्त उत्तर देना चाहिए! शायद गद्य भी नहीं, लेकिन कविता! एक एल्गोरिथ्म कैसे विकसित किया जाए जो ग्रंथों को लिख सकता है, स्वतंत्र रूप से समझ सकता है कि आपको किस विषय को लिखने की आवश्यकता है, और एक ही समय में सही शैली की नकल करना - यह न केवल एक कविता प्रतियोगिता में भाग लेने के लिए महत्वपूर्ण है, बल्कि एक शिक्षित और सांस्कृतिक चैट बॉट बनाने के लिए भी है जो ग्राहकों के साथ बैंकिंग में संवाद करता है। उदाहरण के लिए कॉल सेंटर। नोवोसिबिर्स्क स्टेट यूनिवर्सिटी की आन्या मोसोलोवा ने अपनी लघु कहानी " एक कवि का अनुकरण , या पुश्किन ने दो सौ वर्षों में कैसे लिखा होगा" हमें रूसी में ग्रंथों के एक जनरेटर के एल्गोरिथम "भराई" से परिचित कराएगा जो अर्थ और तुक दोनों है!


छवि ये सभी विषय, जो हमारे अद्भुत वक्ताओं द्वारा प्रकट किए जाएंगे, दोनों अपने आप में और एक आधुनिक चैट बॉट के निर्माण के लिए बहुत महत्वपूर्ण हैं। सिद्धांत रूप में, उनकी कहानियों को सुनने और विशेषज्ञ क्षेत्र में उनसे बात करने के बाद, आप पहले से ही कृत्रिम बुद्धिमत्ता के साथ अपनी खुद की चैटबॉट बना सकते हैं (या बना सकते हैं), पिज्जा किस्मों के बारे में बातचीत को बनाए रखने में सक्षम, बैंक ऋण पर कम से कम ब्याज।

लेकिन मैं खुद को सब कुछ डिजाइन और प्रोग्राम नहीं करना चाहता, भले ही मौजूदा सॉफ्टवेयर लाइब्रेरीज़ का उपयोग कर रहा हो (जो, वैसे, आप कहानियों में भी सुनेंगे, क्योंकि खुला स्रोत पवित्र है)! हो सकता है कि पूरी तरह से चैट बॉट के लिए कुछ तैयार समाधान या समाधान टेम्पलेट हैं, और न केवल इसके व्यक्तिगत घटकों के लिए? तंत्रिका तंत्र की प्रयोगशाला और MIPT में गहन प्रशिक्षण के विकासकर्ता व्लादिस्लाव लाइलिन की रिपोर्ट में , आप इस प्रश्न के उत्तर के रूप में एक निर्णायक "हां" सुनेंगे। व्लादिस्लाव आपको iPavlov संवादी कृत्रिम बुद्धिमत्ता परियोजना और DeepPavlov python पुस्तकालय से मिलवाएगा, जो वास्तव में, विभिन्न प्रकार की संवाद प्रणालियों के निर्माण के लिए एक खुला मंच है: लक्षित चैट बॉट, प्रश्न-उत्तर बॉट, FAQ चैट बॉट, आदि।


छवि और अंत में, डेटा विज्ञान केवल संवादी एआई जीवित नहीं है! कंप्यूटर की दृष्टि के बारे में भी याद रखना चाहिए। यह इस बारे में है - स्थानिक दृष्टि और तीन-आयामी दुनिया में वस्तुओं के स्थान के स्वत: निर्धारण के बारे में - नोवोसिबिर्स्क कंपनी मोटिव के इंजीनियर अलेक्सी ग्रिशेंको द्वारा एक कहानी होगी। अलेक्सी और उनके सहयोगियों ने हाल ही में एक कंप्यूटर विज़न प्रतियोगिता जीती थी, जिसमें एक तंत्रिका नेटवर्क बनाने और प्रशिक्षित करने के लिए आवश्यक था जो वास्तव में एक कामाज़ टर्बोचार्जर को इकट्ठा करने की पूरी प्रक्रिया जानता था और असेंबली लाइन पर श्रमिकों को नियंत्रित करने में सक्षम था ताकि वे खराब न हों। लेकिन जीत के बाद किसी ने भी अपनी प्रशंसा नहीं की, और व्यवस्था में सुधार जारी है! जानना चाहते हैं कैसे? एलेक्सी के प्रदर्शन में आओ!


छवि और आपको बुनियादी बातों के आधार पर याद रखने की भी ज़रूरत है - मशीन सीखने की बहुत ही तकनीक! भले ही तंत्रिका नेटवर्क हल करता है - यह पाठ का विश्लेषण करता है या छवि में वस्तुओं का चयन करता है, इस तंत्रिका नेटवर्क को प्रशिक्षित करने की आवश्यकता है। प्रशिक्षण डेटा की मात्रा जितनी अधिक होगी, यह तंत्रिका नेटवर्क उतना ही बेहतर और "स्मार्ट" बनेगा, लेकिन तकनीकी अर्थों में बड़े डेटा के साथ सीखना बहुत मुश्किल हो जाता है। म्यूनिख में Google क्लाउड से डेवलपर और मशीन सीखने के विशेषज्ञ लियोनिद कुलगिन, आधुनिक तंत्रिका नेटवर्क के प्रशिक्षण में बड़ी डेटा समस्या को हल करने के तरीके के बारे में बात करेंगे, प्रसिद्ध तंत्रिका नेटवर्क लाइब्रेरी TensorFlow के साथ सीखने के काम कैसे वितरित किए जाते हैं, कैसे डेटा प्रोसेसिंग की व्यवस्था की जाती है और प्रशिक्षण रूपरेखा के लिए कौन से उपकरण उपलब्ध हैं। ।

मूल्य निर्धारण रणनीति बजट को अनुकूलित करते हुए, धारणा के उपभोक्ता सिद्धांत को पुनर्स्थापित करती है। स्पॉट एक्शन समान रूप से उत्पाद रेंज की निगरानी करता है। दूसरे शब्दों में, दोस्तों, सबसे पहले, 4 मार्च के बाद से, कीमत बढ़ रही है, और दूसरी बात, उन्होंने ऑनलाइन प्रसारण को लाया।

संचार अनमोल है, और यहां तक ​​कि एआई भी सहमत होगा!

पंजीकरण आवश्यक है। भागीदारी भी। आओ, कमाल हो जाएगा!

Source: https://habr.com/ru/post/hi441072/


All Articles