मैंने 12 स्टार्टअप में काम करने के बाद मशीन लर्निंग के बारे में क्या सीखा

सभी को नमस्कार।

मशीन सीखने के क्षेत्र में 12 स्टार्टअप में काम करने के बाद, मैंने उत्पादों, डेटा और लोगों के बारे में आठ उपयोगी निष्कर्ष दिए।

सभी स्टार्टअप विभिन्न क्षेत्रों (फिनटेक, बायोटेक्नोलॉजी, हेल्थकेयर, ट्रेनिंग टेक्नोलॉजी) और विभिन्न चरणों से थे: दोनों प्री-सीड स्टेज पर और एक बड़ी कंपनी द्वारा अधिग्रहण के चरण में। मेरी भूमिका भी बदल गई है। मैं एक रणनीतिक सलाहकार था, जो डेटा विश्लेषण का प्रमुख था, पूर्णकालिक कर्मचारी के साथ बाढ़ में था। इन सभी कंपनियों ने एक अच्छा उत्पाद बनाने की कोशिश की, और कई सफल हुए।

काम के दौरान, मैं निम्नलिखित निष्कर्ष पर आया:

उत्पाद एआई से अधिक महत्वपूर्ण है


ये स्टार्टअप कृत्रिम बुद्धिमत्ता न सीखकर उत्पाद विकसित कर रहे हैं। एक आश्वस्त गणितज्ञ के रूप में, पहली बार मुझे मशीन सीखने और नए तरीकों और एल्गोरिदम के निर्माण में अधिक रुचि थी।

मुझे जल्द ही एहसास हुआ कि सटीक मशीन लर्निंग मॉडल भी अपने आप में मूल्यवान नहीं थे। एआई और मशीन लर्निंग का मूल्य सीधे उस उत्पाद के मूल्य पर निर्भर करता है जिसमें उनका उपयोग किया जाता है। स्टार्टअप का लक्ष्य मशीन सीखने के उत्पादों को बनाना सीखना है।

इस दृष्टिकोण के साथ, यह कभी-कभी पता चलता है कि मशीन सीखना सबसे प्रभावी उपकरण नहीं है। कभी-कभी मामला हाथ में नहीं होता, लेकिन हल करने की प्रक्रिया में होता है। यहां तक ​​कि ऐसी स्थितियों में, वैज्ञानिकों की ओर मुड़ना उपयोगी है: वे एक वैज्ञानिक, डेटा-आधारित दृष्टिकोण का उपयोग करते हैं। हालांकि, एआई पर समय बर्बाद न करें जहां आपको प्रक्रिया को ठीक करने की आवश्यकता है।

डेटा और उत्पाद के बीच तालमेल के लिए प्रयास करें


आप किसी मौजूदा उत्पाद के मशीन लर्निंग मॉडल के आधार पर पूर्वानुमान जोड़कर कुछ मूल्यवान नहीं बना सकते। एक मजबूत एआई उत्पाद पूरक नहीं है, यह नींव है। ऐसे मामलों में, यह एआई है जो मूल्य बनाता है। इस तरह के उत्पादों को इस तथ्य को ध्यान में रखते हुए विकसित किया जाता है: उनमें उत्पाद और डेटा दोनों तालमेल में काम करते हैं।

एक निष्पादन में अच्छा निष्पादन परिणाम है जिसे मैं "उत्पाद और डेटा का संयोजन" कहता हूं। उत्पाद पूरी तरह से डेटा की क्षमता का एहसास करता है और एक ही समय में सुधार के लिए आवश्यक नए डेटा उत्पन्न करता है।

एआई पर काम करते समय, न केवल इंजीनियरों और वैज्ञानिकों को इन आंकड़ों के साथ काम करने की आवश्यकता होती है। उत्पाद के मूल्य पर काम तेज है अगर टीम के अन्य सदस्य उत्पाद प्रबंधकों से प्रबंधकों तक चर्चा में भाग लेते हैं। इसके लिए ज्ञान और भागीदारी के स्तर की आवश्यकता होती है, यहां तक ​​कि स्टार्टअप में काम करने वाले इंजीनियरों का भी उपयोग नहीं किया जाता है।

पहले डेटा, फिर ए.आई.


एआई और मशीन लर्निंग को उच्च गुणवत्ता वाले डेटा की बहुत आवश्यकता है। खरोंच से उत्पाद बनाते समय, पहले दिन से डेटा एकत्र करने के बारे में सोचें। किसी मौजूदा उत्पाद में कृत्रिम बुद्धिमत्ता तकनीक को पेश करने से पहले, डाटा इंजीनियरिंग और वास्तु परिवर्तन में बहुत अधिक निवेश करने के लिए तैयार रहें।

सबसे पहले, उत्पाद के मूल्य का पता लगाएं, और उसके बाद ही काम करें। डेटा प्रोसेसिंग जितनी बेहतर होगी, एनालिटिक्स उतनी ही बेहतर होगी - यह कंपनी के विकास के लिए महत्वपूर्ण है। इसलिए आप उत्पाद का मूल्य प्रदर्शित करते हैं और निवेशकों को आकर्षित करते हैं। जब एनालिटिक्स विश्वसनीय हो तो मशीन इंटेलिजेंस के बारे में सोचना शुरू करें।

संचार में निवेश करें


उत्पाद बनाने के लिए, आपको योग्य उत्पाद प्रबंधकों और प्रबंधन सहायता की आवश्यकता होती है। मजबूत एआई और गहरी शिक्षा बहुत से लोगों की रुचि है, लेकिन जो लोग आईटी उद्योग से दूर हैं, वे इन प्रौद्योगिकियों में पारंगत नहीं हैं। मशीन लर्निंग और एआई पर चर्चा करने के लिए, आपको आंकड़ों को समझने की जरूरत है: अकुशल संचार अवास्तविक उम्मीदों की ओर जाता है।

उत्पाद प्रबंधक और डेटा इंजीनियरों को लगातार व्यावसायिक मैट्रिक्स पर चर्चा करनी चाहिए और उन्हें उत्पाद में कैसे बदलना है। यह इंजीनियरों के लिए विशेष रूप से महत्वपूर्ण है: प्रभावी काम के लिए, उन्हें अपने क्षेत्र में और व्यावसायिक क्षेत्र में ज्ञान को गहरा करने की आवश्यकता है।

"सरल और स्पष्ट समाधान" इतने स्पष्ट नहीं हैं


जैसा कि मैंने ऊपर उल्लेख किया है, अक्सर सरल और स्पष्ट तरीकों का उपयोग करके हल करना आसान होता है। यह आंशिक रूप से है क्योंकि आज के "सरल और स्पष्ट" निर्णय जटिल और मूल कल थे। शब्द 2vec का उपयोग अब प्रतिगमन के रूप में आसान है। हर दिन अधिक नए उपकरण उभर रहे हैं, और इन उपकरणों को समझना एक डेटा विश्लेषक के लिए महत्वपूर्ण है।

नए ओपन सोर्स टूल्स के आगमन ने इस तथ्य को जन्म दिया है कि अब मशीन लर्निंग में मालिकाना मंच एक प्रभावी समाधान नहीं है। बेशक, आपको मालिकाना एल्गोरिदम का उपयोग करना चाहिए यदि वे आपके उद्योग में प्रभावी हैं और आपकी समस्या को हल करने के लिए। लेकिन आइए Google कर्मचारियों की गहन पढ़ाई को छोड़ दें - व्यावसायिक कार्यों पर ध्यान केंद्रित करें।

यदि संदेह है, तो उपयोगकर्ताओं को डेटा दिखाएं


एक प्रारंभिक चरण में, बाजार के साथ प्रतिक्रिया स्थापित करना महत्वपूर्ण है। हालांकि, मशीन लर्निंग को डेटा की आवश्यकता होती है जिसे इकट्ठा करने में बहुत समय लगता है। यह समस्या है: बड़ी मात्रा में डेटा के बिना तस्वीर का विश्लेषण कैसे करें?

अधिक बार नहीं, उपयोगकर्ताओं को संचित डेटा दिखाने के लिए सबसे अच्छा समाधान है। इससे कोई फर्क नहीं पड़ता कि आपके पास बहुत कम डेटा है: लोग केवल एक बार में कम मात्रा में डेटा संसाधित करते हैं। देखें कि उपयोगकर्ता डेटा के साथ कैसे सहभागिता करते हैं: वे क्या अनदेखा करते हैं और वे और अधिक विस्तार से क्या समझना चाहते हैं? इस तरह आप समझ पाएंगे कि आपका व्यावसायिक डेटा कितना संभावित है।

विश्वास पैदा करो


ट्रस्ट अधिकांश प्रौद्योगिकियों की सफलता का आधार है: लोग उन प्रौद्योगिकियों पर भरोसा करना चाहते हैं जो वे उपयोग करते हैं। कुछ लोगों को चिंता है कि स्वचालन उनके काम को लूट लेगा, जबकि अन्य महत्वपूर्ण निर्णय लेने के लिए प्रौद्योगिकी पर भरोसा करते हैं। दोनों मामलों में, मशीन लर्निंग एप्लिकेशन और एल्गोरिदम में विश्वास महत्वपूर्ण है।

यदि कृत्रिम बुद्धिमत्ता किसी व्यक्ति को निर्णय लेने में मदद नहीं करता है, लेकिन इसके बजाय निर्णय लेता है, तो उपयोगकर्ता जल्दी से आवेदन पर विश्वास खो देते हैं।

विश्वास खोना आसान है और फिर से हासिल करना बेहद मुश्किल। ऐसे उत्पाद बनाएं जिन पर लोग भरोसा करेंगे।

सहकर्मियों के साथ लेख साझा करें, निष्कर्ष निकालें और उत्पादक रूप से काम करें। यदि आपके पास साझा करने के लिए कुछ है, तो टिप्पणियों में लिखें। टेलीग्राम चैनल न्यूरॉन (@neurondata) में मशीन सीखने पर अधिक जानकारी।

सभी ज्ञान!

Source: https://habr.com/ru/post/hi459775/


All Articles