
कुछ समय पहले, हमें अपनी पुरानी सामग्री मिली, जिस पर हमने
डेटा स्कूल में अपने मशीन लर्निंग कोर्स में पहली स्ट्रीम सिखाई और उनकी तुलना करंट से की। हम आश्चर्यचकित थे कि हमने 5 वर्षों के प्रशिक्षण में कितना जोड़ा और बदल दिया। यह महसूस करते हुए कि हमने ऐसा क्यों किया और कैसे, वास्तव में, डेटा विज्ञान की समस्याओं को हल करने के लिए दृष्टिकोण बदल गया है, हमने इस प्रकाशन को लिखने का फैसला किया।
हमने मशीन सीखने के बुनियादी तरीकों और एल्गोरिदम के साथ प्रशिक्षण शुरू किया, बताया कि उन्हें कैसे व्यवहार में लाना है, कैसे मापदंडों का चयन करना है, कैसे डेटा को साफ और तैयार करना है, कैसे गुणवत्ता को मापना है। हमें विश्वास था (और अभी भी विश्वास है) कि एक पूर्ण एजेंट-वैज्ञानिक के प्रशिक्षण में न केवल शास्त्रीय मशीन सीखने के तरीके शामिल हैं, बल्कि ग्राफ विश्लेषण के तरीके (सामाजिक नेटवर्क, एसएनए), पाठ विश्लेषण, तंत्रिका नेटवर्क और बड़े डेटा के साथ काम करना चाहिए (बिग डेटा)।
इस प्रकार, आउटपुट में हमें डेटा विज्ञान के एक विस्तृत क्षेत्र में एक विशेषज्ञ मिला, जो व्यवहार में तरीकों के एक व्यापक शस्त्रागार को लागू करने में सक्षम है। हम अपने व्यवसाय के लिए समान विशेषज्ञ ले गए। सबसे पहले, कंपनी में जहां हमने काम किया और संबंधित क्षेत्रों का निर्देशन किया, और फिर मशीन लर्निंग पर आधारित उत्पादों के विकास के लिए हमारे व्यवसाय में -
डेटा स्टूडियो ।
लेकिन बाद में हमने महसूस किया कि यह केवल डेटा साइंस परियोजनाओं के सफल कार्यान्वयन के लिए पर्याप्त नहीं है, लेकिन यह भी मुख्य बात नहीं है।
डेटा साइंस की प्रथा की शुरुआत में दृष्टिकोण और, कई विश्लेषकों के लिए ईमानदार होना, इस प्रकार है: मुझे डेटा दें, मैं इसे स्पष्ट कर दूंगा, एक फीचर वेक्टर बनाऊंगा, इसे प्रशिक्षण और परीक्षण नमूनों में विभाजित करूंगा, कई एमएल एल्गोरिदम चलाऊंगा, और यहां परिणाम है।
क्या इस दृष्टिकोण को जीवन का अधिकार है?
हां, यह करता है, लेकिन जहां विषय क्षेत्र पहले से ही अच्छी तरह से अध्ययन किया गया है और विश्लेषिकी लागू करने में पहले से ही एक अच्छा संचित अनुभव है। उदाहरण? बैंक स्कोरिंग, ऑपरेटरों से बहिर्वाह, खुदरा, बैंक, टेलीकॉम में क्रॉस-सेलिंग (नेक्स्ट बेस्ट ऑफर), रिटेल में शेयरों की प्रभावशीलता का पूर्वानुमान लगाते हुए, शेष राशि का पूर्वानुमान। यह सूची जारी है।
अब अन्य क्षेत्रों की कल्पना करते हैं: मल्टीमॉडल परिवहन (जहाज, ट्रेन, ट्रक) में आगमन के समय का पूर्वानुमान: आप किन संकेतों का उपयोग करेंगे? कार्गो का प्रकार, कार्गो वजन, कुछ छंटाई नोड्स की उपस्थिति? और अगर आप इसके बारे में सोचते हैं? शायद कुछ और सरल और स्पष्ट संकेत (बिना मशीन लर्निंग मॉडल के) आपको महत्वपूर्ण सटीकता देंगे?
या आपको कुछ उत्पादों के लिए कीमतों में बदलाव के लिए बड़े ग्राहकों की संवेदनशीलता की भविष्यवाणी करने की आवश्यकता है। लोच कैसे निर्धारित करें? आप वास्तव में क्या भविष्यवाणी करेंगे?
लेकिन क्या किसी मॉडल का निर्माण करना आवश्यक है यदि उत्पादन प्रक्रिया को बाद में वैसे भी बदल दिया जाए?
यह पता चला है कि आपको एनालिटिक्स के नए विषय क्षेत्रों में काम करने में सक्षम होने की आवश्यकता है, क्योंकि अच्छी तरह से अध्ययन किए गए क्षेत्रों में, पहले से ही बहुत सारे विकास हैं और यह "लाल सागर" है।
एनालिटिक्स के साथ नए क्षेत्रों में जाने के लिए क्या करना होगा?
ऐसा करने के लिए, आपको किसी विशेष प्रक्रिया के विषय क्षेत्र को गहराई से समझने में सक्षम होना चाहिए, जिसके विवरण अक्सर उपलब्ध नहीं हैं। यह समझें कि आमतौर पर किस तरह के डेटा की जरूरत होती है, यह समझें कि वास्तव में व्यापार क्या किया जाता है। क्या आपको यहां विश्लेषिकी को समझने की आवश्यकता है, क्या आपको कुछ भविष्य कहनेवाला एल्गोरिदम की आवश्यकता है, क्या आपको व्यवसाय प्रक्रिया को बदलने की आवश्यकता है, क्या परिचालन लीवर हैं (यदि इससे बचने के लिए अभी भी कोई उपाय नहीं हैं तो क्या भविष्यवाणी उपकरण बंद होने की बात है?)
संक्षेप में, निम्नलिखित बातों की आवश्यकता है:
- विश्लेषणात्मक दृष्टिकोण, परिकल्पना तैयार करने और परीक्षण करने की क्षमता
- व्यापार और व्यक्तिगत प्रक्रियाओं के सिद्धांतों और विशेषताओं को समझना
- प्रक्रिया अर्थशास्त्र को समझना
- प्रौद्योगिकी की समझ
- व्यावसायिक प्रक्रियाओं के साथ डेटा को बाँधने की क्षमता
और, अगर आप मशीन सीखने से खुद को दूर कर लेते हैं, तो कौन सा क्षेत्र ऐसा करने में सक्षम है? सही - प्रबंधन परामर्श। और यह तथाकथित केस-पद्धति (विभिन्न व्यावसायिक स्थितियों से कई उदाहरण) का उपयोग करके कहां पढ़ाया जाता है - सही, एमबीए पाठ्यक्रम (व्यवसाय प्रशासन के मास्टर) में।
इस प्रकार, यह पता चलता है कि आदर्श डेटा साइंटिस्ट परामर्श में अनुभव के साथ एमबीए स्नातक हैं, जिन्होंने मशीन लर्निंग पाठ्यक्रम पूरा कर लिया है।
यह, ज़ाहिर है, ओवरकिल है, लेकिन यह सच है कि नेताओं में, जिनके पास विश्लेषणात्मक सोच की एक विकसित संस्कृति है, वे कर्मचारियों के चयन और प्रशिक्षण के स्तर पर प्रक्रियाओं और मानकों के स्तर पर आगे बढ़ रहे हैं। हम अपने
डेटा स्टूडियो में उसी दृष्टिकोण का पालन करते हैं। और, तार्किक रूप से, हमने
स्कूल ऑफ डेटा में अपने प्रशिक्षण में समान दृष्टिकोण रखा।
आप आपत्ति कर सकते हैं। आखिरकार, जो कुछ ऊपर लिखा गया था, वह परामर्श में अधिक लागू है, जहां हर बार आपको पहले से पता नहीं होता है कि परियोजना किस विषय क्षेत्र से होगी। और बड़ी कंपनियों के बारे में क्या है जहां क्षेत्र को सिद्धांत रूप में उल्लिखित किया गया है?
कंपनियों में, हम ऊपर वर्णित सभी समान बारीकियों का पालन करते हैं, और एक विश्लेषक और व्यवसाय को समझने के लिए पूरी टीम की आवश्यकता, अंतिम परिणाम के लिए जिम्मेदारी की आवश्यकता।
इस कारण से, बड़ी कंपनियों में, अब हम डेटा साइंस इकाइयों के विशेषज्ञता में एक प्रवृत्ति और एक केंद्रीयकृत इकाई से एनालिटिक्स फ़ंक्शन को स्थानांतरित करने के लिए देख रहे हैं, जो कि पूरी कंपनी के लिए, एक व्यावसायिक फ़ंक्शन के लिए, जो व्यवसाय के करीब है। इस विशेषज्ञता के साथ, विश्लेषक की क्षमता एक नए व्यवसाय को समझने और मॉडल के बजाय यथार्थवादी समाधान पेश करने की क्षमता है, एक प्रतिस्पर्धात्मक लाभ है।
वास्तव में हमारे पाठ्यक्रम में क्या बदलाव आया है? हम सभी से पहले, हमने व्यावहारिक मामलों के आधार पर पढ़ाया। मामलों की संरचना और प्रकृति बदल गई है। पहले, हमारे मामले कागले पर कार्यों की तरह थे: यहां कार्य है, यहां लक्ष्य चर है, यहां गुणवत्ता मीट्रिक है, यहां डेटा हैं।
अब कार्य अलग-अलग लगता है: यहाँ ग्राहक के संदर्भ में कार्य है, यहाँ ग्राहक प्रक्रिया का वर्णन है। एनालिटिक्स कार्य को तैयार करें, एक गुणवत्ता मीट्रिक का प्रस्ताव करें, एनालिटिक्स का उपयोग करने की उपयुक्तता का मूल्यांकन करें, आर्थिक प्रभाव की गणना करें, तरीकों का सुझाव दें, आपके द्वारा आवश्यक डेटा के लिए अनुरोध तैयार करें। और फिर सब कुछ हमेशा की तरह है: डेटा को साफ करें, एक मॉडल बनाएं, आदि। और हम इस तरह के उदाहरण पूरी तरह से अलग-अलग क्षेत्रों से देते हैं, सौभाग्य से, इस क्षेत्र में हमारे अपने परामर्श की उपस्थिति उपलब्ध कार्यों की सीमा का बहुत विस्तार करती है जिसे हमने अपने अनुभव पर हल किया है।
लेकिन विश्लेषणात्मक दृष्टिकोण का अनुशासन केवल मामलों का अभ्यास नहीं है। हम परामर्श में उपयोग किए जाने वाले मानक ढांचे (बुनियादी विश्लेषण पैटर्न) भी सिखाते हैं। हमने उस विश्लेषणात्मक उत्पाद की विकास प्रक्रिया को भी प्रशिक्षण में शामिल किया, जिसका हम कक्षा में पालन करते हैं, व्यापार विश्लेषण से लेकर ग्राहक के लिए परिणामों की प्रस्तुति तक और चरणों, भूमिकाओं, मुख्य निर्णय बिंदुओं और ग्राहक के साथ बातचीत के क्षणों सहित एक उत्पादक समाधान की तैनाती की योजना बनाते हैं।
हम प्रस्तुतियों को एक अलग भूमिका देते हैं - अक्सर हमने विश्लेषकों के विचारों और ग्राहक के कर्मचारियों द्वारा इन विचारों की धारणा के बीच एक अंतर देखा है।
सामान्य तौर पर, हम मानते हैं कि डेटा साइंटिस्ट को प्रशिक्षित करने का कार्य मौजूदा क्षेत्रों के लिए एक विशेषज्ञ को तैयार करना नहीं है (इसके लिए पहले से ही कई पाठ्यक्रम हैं और यह कई तरह से कमोडिटी बन गया है), लेकिन नए क्षेत्रों में काम के लिए एक विशेषज्ञ शोधकर्ता तैयार करना डिजिटलाइजेशन अभी आ रहा है।
खैर, और, हमेशा की तरह - 16 सितंबर को हमारे
स्कूल ऑफ डेटा में एक नए पाठ्यक्रम की शुरुआत। हम हर समय
डेटा स्टूडियो में नई परियोजनाओं के आदेशों को स्वीकार करते हैं, जैसे हम कर्मचारियों की भर्ती करते हैं (खुली रिक्तियों पर अनुभाग देखें)।
पुनश्च हमने इसे और अधिक सुविधाजनक बनाने के लिए अपनी साइट को थोड़ा अपडेट किया। इसलिए, नए रूप में आश्चर्यचकित न हों।