आधुनिक इंटरनेट प्लेटफार्मों के विरोधाभासों में से एक यह है कि, हालांकि वे पर्याप्त रूप से स्वचालित हैं और उपयोगकर्ताओं को जो सामग्री दिखाई देती है वह बिना किसी मानवीय मॉडरेशन के दिखाई जाती है, फिर भी, वे पूरी तरह से मानव व्यवहार पर निर्भर हैं, क्योंकि वास्तव में, वे केवल निरीक्षण करते हैं, जानकारी प्राप्त करते हैं और सैकड़ों या लाखों लोगों के कार्यों के आधार पर निष्कर्ष निकालते हैं।
इस सिद्धांत का मूल पेजरैंक था। मैन्युअल रूप से बनाए गए नियमों पर भरोसा करने के बजाय, जो प्रत्येक व्यक्ति के पेज के अर्थ की समझ प्रदान करेगा, या मूल पाठ के साथ काम करते हुए, पेजरैंक यह देखता है कि लोगों ने ऐसे पृष्ठ के बारे में वास्तव में क्या कहा या कहा। यह किसी भी तरह से जुड़ा हुआ है, वे किस पाठ का उपयोग करते हैं, और इस पृष्ठ से जुड़े लोगों से कौन जुड़ा है? उसी समय, Google प्रत्येक उपयोगकर्ता को मैन्युअल रूप से खोज परिणामों के प्रत्येक सेट को रैंक (इंडेक्स, रेट) करने का अवसर देता है: आपको 10 ब्लू लिंक दिए जाते हैं, और आप बस Google को बताते हैं कि कौन सा उपयुक्त है। फेसबुक के लिए भी यही सच है: फेसबुक वास्तव में यह नहीं जानता कि आप कौन हैं या आप किस चीज में रुचि रखते हैं या इस बारे में क्या है। लेकिन वह जानता है कि आप किसका अनुसरण कर रहे हैं, आपको क्या पसंद है, आपको और कौन पसंद है लेकिन आपको क्या पसंद है और उन्हें क्या पसंद है। फेसबुक एक मानव-उन्मुख पेजरैंक है। सामान्य तौर पर, YouTube पर भी यही बात लागू होती है: वह कभी नहीं जानता था कि विशेष वीडियो किस बारे में था, लेकिन केवल लोगों ने इसके नीचे क्या लिखा और उन्हें क्या देखा और पसंद किया।
इसके मूल में, ये सिस्टम विशाल "मैकेनिकल तुर्क" हैं। आखिरकार, वे पूरी तरह से उस सामग्री की सामग्री को नहीं समझते हैं जिसके साथ वे काम करते हैं, वे केवल इस सामग्री के बारे में मानवीय भावना को बनाने, पकड़ने और व्यक्त करने की कोशिश कर रहे हैं। वे विशाल वितरित कंप्यूटिंग सिस्टम हैं, जिसमें लोग प्रोसेसर के रूप में कार्य करते हैं, और मंच स्वयं राउटर और इंटरकनेक्ट का संयोजन है। (यह मुझे "हिचहाइकर गाइड टू गैलेक्सी" पुस्तक से थोड़ा सा विचार याद दिलाता है कि पूरी पृथ्वी वास्तव में एक विशाल कंप्यूटर है जो कुछ कार्य करता है, और हमारी दैनिक गतिविधियां गणना का हिस्सा हैं)।
इसका मतलब यह है कि सिस्टम का अधिकांश डिज़ाइन एक स्वचालित प्रणाली के साथ काम करने में मानव संसाधनों के आवेदन के इष्टतम बिंदुओं को खोजने के लिए बंधा हुआ है। क्या आप कब्जा कर रहे हैं जो पहले से ही हो रहा है? इसलिए Google ने पहले से मौजूद लिंक का उपयोग करना शुरू कर दिया। क्या आपको इसके मूल्य को प्रकट करने के लिए गतिविधि को प्रोत्साहित करने की आवश्यकता है? इससे पहले कि उन्हें इससे कोई लाभ मिल सके फेसबुक को खुद एक गतिविधि बनानी होगी। शायद आप मानव संसाधनों पर बहुत अधिक भरोसा करते हैं? यह दृष्टिकोण Apple Music में उपयोग किया जाता है, अपने मैन्युअल रूप से चयनित प्लेलिस्ट के साथ, जो लाखों उपयोगकर्ताओं के लिए स्वचालित रूप से जारी किए जाते हैं। या क्या आपको लोगों को सब कुछ करने के लिए भुगतान करना होगा?
प्रारंभ में, याहू का इंटरनेट संसाधन निर्देशिका "लोगों को सब कुछ करने के लिए भुगतान" नामक एक दृष्टिकोण लेने का एक प्रयास था - याहू ने पूरे इंटरनेट को सूचीबद्ध करने के लिए लोगों को भुगतान किया। सबसे पहले यह प्राप्त करने योग्य लग रहा था, लेकिन जैसे-जैसे इंटरनेट बहुत तेजी से बढ़ता गया, यह जल्द ही एक भारी चुनौती साबित हुआ और जब याहू ने आत्मसमर्पण किया, तो उनके कैटलॉग का आकार पहले ही 3 मिलियन पृष्ठों से अधिक हो गया। पेजरैंक ने इस समस्या को हल किया। इसके विपरीत, Google मैप्स बड़ी संख्या में ऐसी कारों का उपयोग करता है जिनमें कैमरे लोगों द्वारा नियंत्रित किए जाते हैं (अभी के लिए) और दुनिया की लगभग सभी सड़कों पर ड्राइव करते हैं और कई और लोग इन तस्वीरों को देखते हैं, और यह एक भारी काम नहीं है - यह सिर्फ बहुत खर्च करता है। Google मानचित्र एक ऐसा निजी "मैकेनिकल तुर्क" है। अब हम ठीक उसी प्रश्न की जांच कर रहे हैं, लोगों द्वारा सामग्री के मॉडरेशन के बारे में बात करते हुए - आपको प्रत्येक पोस्ट को देखने के लिए कितने दसियों लोगों की आवश्यकता होगी और यह कार्य कितना स्वचालित हो सकता है? क्या यह कार्य भारी है या इसका कार्यान्वयन बहुत महंगा है?
यदि आप इन प्लेटफार्मों को अरबों लोगों द्वारा वास्तविक कंप्यूटिंग का उपयोग करने के रूप में देखते हैं, तो इससे दो दिलचस्प सवाल उठने चाहिए: ऐसे प्लेटफार्मों में क्या कमजोरियां मौजूद हैं और मशीन लर्निंग इस क्षेत्र को कैसे बदल सकती है?
अतीत में, जब हमने कंप्यूटर सिस्टम को हैक करने के बारे में सोचा था, तो हमें विभिन्न तकनीकी कमजोरियों - चोरी या कमजोर पासवर्ड, सिस्टम, बग, बफर ओवरफ्लो, एसक्यूएल इंजेक्शन में खुली कमजोरियों का विचार था। हम सॉफ्टवेयर में छेद की तलाश में "हैकर्स" का प्रतिनिधित्व किया। लेकिन, यदि आप कल्पना करते हैं कि YouTube या फेसबुक कंप्यूटर सिस्टम वितरित किए जाते हैं, जिसमें सामान्य सॉफ्टवेयर राउटर्स के रूप में कार्य करता है, लेकिन लोग प्रोसेसर की भूमिका निभाते हैं, तो कोई भी हमलावर तुरंत न केवल सॉफ्टवेयर में, बल्कि लोगों में कमजोरियों को खोजने के बारे में भी सोचेगा। विशिष्ट संज्ञानात्मक पूर्वाग्रह सॉफ्टवेयर में विशिष्ट दोषों के समान भूमिका निभाना शुरू करते हैं।
यही है, वास्तव में, बैंक को लूटने के दो तरीके हैं - आप अलार्म सिस्टम को बायपास कर सकते हैं और एक तिजोरी के लिए एक मास्टर कुंजी उठा सकते हैं, या आप एक बैंक कर्मचारी को रिश्वत दे सकते हैं। इनमें से प्रत्येक उदाहरण में, सिस्टम विफल हो गया, लेकिन अब सिस्टम में से एक आप और मैं हैं। इसलिए, जैसा कि मैंने इस लेख में गोपनीयता और उपयोगकर्ता सुरक्षा के प्रति फेसबुक के पाठ्यक्रम में बदलाव के बारे में लिखा है, ऐसे प्लेटफार्मों पर जीवित लोगों द्वारा सामग्री का मॉडरेशन स्वाभाविक रूप से एंटीवायरस के काम के समान है, जो दो दशक पहले विंडोज पर मैलवेयर की उपस्थिति के जवाब में तेजी से विकसित होना शुरू हुआ था। । कंप्यूटर का एक हिस्सा देख रहा है कि क्या उसका दूसरा हिस्सा कुछ ऐसा कर रहा है जो उसे नहीं करना चाहिए।
यहां तक कि अगर हम सिस्टम के जानबूझकर हैकिंग के बारे में बात नहीं करते हैं, तो अन्य समस्याएं हैं जो किसी व्यक्ति की गतिविधि का विश्लेषण करने की कोशिश करते समय किसी अन्य व्यक्ति की मदद से उत्पन्न होती हैं। इसलिए, जब आप दूसरे कंप्यूटर का विश्लेषण करने के लिए कंप्यूटर का उपयोग करना शुरू करते हैं, तो आप फीडबैक लूप बनाने का जोखिम उठाते हैं। यह "फ़िल्टर बबल," "YouTube के रेडिकलाइज़ेशन" या खोज स्पैम जैसी अवधारणाओं में परिलक्षित होता है। इसी समय, फेसबुक ने जिन समस्याओं का सामना किया है उनमें से एक यह है कि कभी-कभी बड़ी मात्रा में डेटा की उपलब्धता और उत्पादन इस डेटा के मूल्य को ऑफसेट करेगा। हम इसे समाचार फ़ीड को ओवरलोड करने की समस्या कहेंगे: उदाहरण के लिए, आपके 50 या 150 मित्र हैं और आप प्रतिदिन 5 या 10 प्रविष्टियाँ प्रकाशित करते हैं, या ऐसा ही कुछ करते हैं, लेकिन आपके सभी मित्र बिल्कुल वैसा ही करते हैं और अब आपके फ़ीड में प्रति दिन 1,500 प्रविष्टियाँ हैं। डनबर नंबर + जकरबर्ग लॉ = ओवरलोड ... जो हमें गुडहार्ट लॉ में लाता है।
"किसी भी मनाया सांख्यिकीय पैटर्न को नष्ट करने के लिए प्रवण होता है जैसे ही उस पर नियंत्रण करने के लिए दबाव डाला जाता है।" - चार्ल्स गुडहार्ट
फिर भी मशीन लर्निंग से कैसे फर्क पड़ सकता है? इससे पहले, मैंने पहले ही कहा था कि मुख्य कठिनाई यह है कि सबसे इष्टतम तरीके से सॉफ्टवेयर के साथ काम करने में मानव संसाधनों का उपयोग कैसे किया जाए, हालांकि एक और विकल्प है - बस कंप्यूटर को सभी काम करने दें। हाल ही में जब तक, इस तरह की प्रणाली मौजूद थी, कठिनाइयों और कारणों में मुख्य रूप से कार्यों का एक बड़ा वर्ग शामिल था जो कंप्यूटर हल नहीं कर सकते थे, हालांकि लोगों ने उन्हें तुरंत हल किया। हमने इसे "कार्य जो किसी व्यक्ति के लिए आसान है, लेकिन कंप्यूटर के लिए मुश्किल है" कहा, लेकिन वास्तव में वे ऐसे कार्य थे जो किसी व्यक्ति के लिए आसान थे, लेकिन जो व्यक्ति कंप्यूटर का वर्णन करने में व्यावहारिक रूप से असमर्थ है। मशीन लर्निंग की एक सफलता की विशेषता यह है कि यह कंप्यूटर को आवश्यक विवरण विकसित करने की अनुमति देता है।
नीचे दी गई कॉमिक (2014 से सीधे, जब मशीन लर्निंग और कंप्यूटर विज़न सिस्टम तेजी से विकसित होने लगे) इन बदलावों को पूरी तरह से दर्शाती है। पहला कार्य आसानी से पूरा हुआ, दूसरे के विपरीत, कम से कम मशीन सीखने के आगमन तक।

इस समस्या को हल करने का पुराना तरीका उन लोगों को ढूंढना है जो छवि को वर्गीकृत करेंगे - किसी तरह की क्राउडसोर्सिंग का सहारा लेना। दूसरे शब्दों में, "मैकेनिकल तुर्क" का उपयोग करें। लेकिन आज, हमें अब किसी को भी इस छवि को देखने की आवश्यकता नहीं हो सकती है, क्योंकि मशीन सीखने की मदद से, हम अक्सर इस विशेष समस्या के समाधान को स्वचालित कर सकते हैं।
इसलिए: लाखों या करोड़ों लोगों के कार्यों के विश्लेषण का उपयोग करने से पहले आप कितनी समस्याओं को हल कर सकते थे जिन्हें आप अब मशीन सीखने का उपयोग करके और आमतौर पर उपयोगकर्ताओं को संलग्न करने की आवश्यकता के बिना हल कर सकते हैं?
बेशक, इसमें कुछ विरोधाभास है, क्योंकि मशीन सीखने में आपको हमेशा बड़ी मात्रा में डेटा की आवश्यकता होती है। जाहिर है, इस मामले में, कोई कह सकता है कि यदि आपके पास एक बड़ा मंच है, तो आपके पास स्वचालित रूप से बहुत अधिक डेटा है, इसलिए, मशीन सीखने की प्रक्रिया भी आसान हो जाएगी। यह निश्चित रूप से सही है, कम से कम शुरुआत में, लेकिन मुझे लगता है कि यह पूछने के लिए जगह से बाहर नहीं होगा कि कितने कार्यों को केवल मौजूदा उपयोगकर्ताओं की मदद से हल किया जा सकता है। अतीत में, यदि आपके पास एक बिल्ली की तस्वीर थी, तो इसे "बिल्ली" के रूप में चिह्नित किया जा सकता था, यदि आपके पास पर्याप्त उपयोगकर्ता थे, और उनमें से एक उस विशेष तस्वीर को देखेगा और उसे टैग करेगा। आज, आपको बिल्ली की इस विशेष छवि को संसाधित करने के लिए वास्तविक उपयोगकर्ताओं की आवश्यकता नहीं है - आपको बस किसी भी अन्य उपयोगकर्ता के लिए, दुनिया में कहीं भी, किसी भी समय अतीत में, जो पहले से ही पर्याप्त अन्य छवियों को वर्गीकृत कर चुके हैं, की आवश्यकता है आवश्यक मान्यता मॉडल बनाने के लिए बिल्लियों।
यह मानव संसाधनों का सबसे अच्छा उपयोग करने का सिर्फ एक और तरीका है: किसी भी मामले में, आपको लोगों को वस्तुओं को वर्गीकृत करने की आवश्यकता है (और नियमों को लिखने के लिए जिनके द्वारा लोग उन्हें वर्गीकृत करेंगे)। लेकिन यहां हम पहले से ही लीवर को स्थानांतरित कर रहे हैं और शायद मौलिक रूप से लोगों की आवश्यक संख्या को बदल रहे हैं और इस प्रकार, खेल के नियम, कुछ हद तक "विजेता को सब कुछ मिलता है" के प्रभाव के कारण बदल रहे हैं। अंत में, प्लेटफ़ॉर्म के इन सभी बड़े पैमाने पर सामाजिक नेटवर्क मैन्युअल रूप से वर्गीकृत डेटा का सिर्फ विशाल संग्रह हैं, क्योंकि अंत में यह पता चला है कि उनका गिलास आधा भरा हुआ है या आधा खाली है? एक तरफ, यह आधा भरा हुआ है: उनके पास अपने निपटान में मैन्युअल रूप से वर्गीकृत डेटा (गतिविधि के अपने विशिष्ट क्षेत्र में) का सबसे बड़ा संग्रह है। दूसरी ओर, ग्लास आधा खाली है: यह डेटा चयनित और मैन्युअल रूप से वर्गीकृत किया गया था।
यहां तक कि जहां डेटा इन प्लेटफार्मों में से एक बना सकता है (जो, सबसे अधिक संभावना है, यह नहीं होगा - निश्चित रूप से ऐसा नहीं होगा - जैसा कि मैंने यहां लिखा है ), वे अभी भी बन जाएंगे, ठीक है, एक मंच। एडब्ल्यूएस के साथ, जिसने स्टार्टअप को सक्षम किया कि अब लाखों उपयोगकर्ताओं को अपने बुनियादी ढांचे के लिए पैमाने की अर्थव्यवस्थाओं की आवश्यकता नहीं है, ऐसे उपकरण बनाने का मतलब होगा कि आपको बिल्ली को पहचानने के लिए लाखों या अरबों उपयोगकर्ताओं की आवश्यकता नहीं होगी। आप प्रक्रिया को स्वचालित कर सकते हैं।
अनुवाद: अलेक्जेंडर त्रेगूबोव
संपादन: एलेक्सी इवानोव
समुदाय: @ponchiknews