أحد مفارقات منصات الإنترنت الحديثة هو أنه ، على الرغم من كونها مؤتمتة إلى حد كبير والمحتوى الذي يراه المستخدمون النهائيون معروض دون أي اعتدال بشري ، إلا أنهم يعتمدون تمامًا على السلوك البشري ، لأن في الواقع ، فهم يراقبون ويتلقون المعلومات ويستخلصون استنتاجات بناءً على تصرفات مئات الملايين أو مليارات الأشخاص.
أصل هذا المبدأ هو تصنيف الصفحات. بدلاً من الاعتماد على القواعد التي تم إنشاؤها يدويًا والتي من شأنها أن توفر فهمًا لمعنى كل صفحة فردية ، أو العمل مع النص الأصلي ، يلاحظ PageRank ما فعله الأشخاص بالضبط أو قالوه بشأن هذه الصفحة. من هو المتصل بأي شكل من الأشكال ، وما هو النص الذي استخدموه ، ومن يرتبط بالأشخاص المرتبطين بهذه الصفحة؟ في الوقت نفسه ، تمنح Google لكل مستخدم الفرصة للترتيب (فهرس ، معدل) لكل مجموعة من نتائج البحث يدويًا: يتم منحك 10 روابط زرقاء ، ويمكنك فقط إخبار Google عن أيها مناسب. وينطبق الشيء نفسه على Facebook: Facebook لا يعرف حقًا من أنت أو ما الذي تهتم به أو ما الذي يدور حوله هذا المحتوى أو ذاك. لكنه يعرف من تتابع وماذا تحب ومن آخر ولكنك تحب هذا وماذا يحلو لهم وما الذي اشتركوا فيه. فيسبوك هو PageRank الموجهة نحو الإنسان. بشكل عام ، ينطبق الأمر نفسه على YouTube: لم يكن يعلم أبدًا ما الذي كان يدور حوله مقطع الفيديو الخاص ، ولكن فقط ما كتبه الأشخاص تحته وما الذي شاهدوه وأحبوه.
في جوهرها ، هذه النظم هي ضخمة الأتراك الميكانيكية. بعد كل شيء ، فهم لا يفهمون مطلقًا محتوى المحتوى الذي يعملون به ، فهم يحاولون فقط إنشاء ، والتقاط ، ونقل المشاعر الإنسانية فيما يتعلق بهذا المحتوى. إنها أنظمة حوسبة موزعة ضخمة يعمل فيها الأشخاص كمعالجات ، والنظام الأساسي نفسه عبارة عن مزيج من أجهزة التوجيه والربط البيني. (هذا يذكرني قليلاً بالفكرة من كتاب "دليل هتشهكر للمجرة" أن الأرض بأكملها هي في الواقع جهاز كمبيوتر ضخم يؤدي وظائف معينة ، وأنشطتنا اليومية هي جزء من الحسابات).
هذا يعني أن الكثير من تصميم النظام مرتبط بإيجاد النقاط المثلى لتطبيق الموارد البشرية في العمل مع نظام آلي. هل التقاط ما يحدث بالفعل؟ لذلك بدأت Google باستخدام الروابط الموجودة بالفعل. هل تحتاج إلى تحفيز النشاط من أجل الكشف عن قيمته؟ كان على Facebook إنشاء نشاط بأنفسهم قبل أن يتمكنوا من الاستفادة منه. ربما كنت تعتمد اعتمادا كبيرا على الموارد البشرية؟ يتم استخدام هذا الأسلوب في Apple Music ، مع قوائم التشغيل المحددة يدويًا ، والتي يتم إصدارها تلقائيًا لعشرات الملايين من المستخدمين. أو هل يجب أن تدفع للناس أن يفعلوا كل شيء على الإطلاق؟
في البداية ، كان دليل موارد الإنترنت في Yahoo مكتوبًا محاولة لأخذ منهج "دفع أجر للناس لفعل كل شيء" - دفعت Yahoo مكتوب للناس لفهرسة الإنترنت بالكامل. في البداية بدا الأمر قابلاً للتحقيق ، لكن مع نمو الإنترنت بسرعة كبيرة ، سرعان ما أثبت أنه تحد هائل ، وعندما استسلم Yahoo ، تجاوز حجم فهرسها بالفعل 3 ملايين صفحة. PageRank حل هذه المشكلة. على العكس من ذلك ، تستخدم خرائط Google عددًا كبيرًا من السيارات المزودة بكاميرات يتحكم فيها الأشخاص (في الوقت الحالي) وتقود جميع الشوارع تقريبًا في العالم والعديد من الأشخاص ينظرون إلى هذه الصور ، وهذه ليست مهمة ساحقة - إنها تكلف الكثير. خرائط جوجل هي مثل "الترك الميكانيكية". نحن الآن نحقق في نفس السؤال بالضبط ، ونتحدث عن الإشراف على المحتوى من قِبل الأشخاص - كم عدد عشرات الآلاف من الأشخاص الذين ستحتاج إليهم لعرض كل منشور وكيف يمكن تشغيل هذه المهمة تلقائيًا؟ هل هذه المهمة ساحقة أم أن تنفيذها مكلف للغاية؟
إذا نظرت إلى هذه المنصات على أنها تستخدم المليارات من الأشخاص للقيام بحوسبة حقيقية ، فإن هذا يجب أن يثير سؤالين مهمين: ما هي نقاط الضعف الموجودة في مثل هذه المنصات وكيف يمكن للتعلم الآلي تغيير هذا المجال؟
في الماضي ، عندما فكرنا في اختراق أنظمة الكمبيوتر ، كانت لدينا فكرة عن نقاط الضعف التقنية المختلفة - كلمات المرور المسروقة أو الضعيفة ، نقاط الضعف المفتوحة في الأنظمة ، الأخطاء ، تجاوزات المخزن المؤقت ، حقن SQL. مثلنا "المتسللين" الذين يبحثون عن ثقوب في البرمجيات. ولكن ، إذا كنت تتخيل أن YouTube أو Facebook عبارة عن أنظمة كمبيوتر موزعة يعمل فيها البرنامج المعتاد كموجهات ، ولكن الناس يلعبون دور المعالجات ، فسوف يفكر أي مهاجم على الفور في العثور على نقاط الضعف ، ليس فقط في البرامج ، ولكن أيضًا في الأشخاص. تبدأ التحيزات المعرفية النموذجية في لعب نفس دور العيوب النموذجية في البرامج.
هذا ، في الواقع ، هناك طريقتان لسرقة أحد البنوك - يمكنك تجاوز نظام الإنذار والتقاط مفتاح رئيسي لخزينة ، أو يمكنك رشوة موظف بنك. في كل من هذه الأمثلة ، فشل النظام ، ولكن الآن أحد الأنظمة هو أنت وأنا. لذلك ، كما كتبت في هذا المقال حول التغيير الأخير لمسار Facebook نحو الخصوصية وسلامة المستخدم ، فإن الإشراف على المحتوى من قِبل الأشخاص الذين يعيشون على مثل هذه المنصات يشبه بطبيعته عمل برامج مكافحة الفيروسات ، التي بدأت تتطور بسرعة استجابة لظهور البرامج الضارة على نظام Windows قبل عقدين من الزمن . يراقب جزء واحد من الكمبيوتر ما إذا كان الجزء الآخر منه يقوم بشيء لا يجب عليه فعله.
حتى إذا لم نتحدث عن أنظمة القرصنة المتعمدة ، فهناك مشاكل أخرى تنشأ عند محاولة تحليل أنشطة شخص ما بمساعدة شخص آخر. لذلك ، عند البدء في استخدام جهاز كمبيوتر لتحليل جهاز كمبيوتر آخر ، فإنك تخاطر بإنشاء حلقات التعليق. ينعكس هذا في مفاهيم مثل "فقاعة التصفية" أو "تطرف YouTube" أو البحث العشوائي. في الوقت نفسه ، تتمثل إحدى المشكلات التي واجهها موقع Facebook في بعض الأحيان في أن توفر وإنتاج كمية كبيرة من البيانات سيؤدي إلى تعويض قيمة هذه البيانات. سوف نسمي هذا مشكلة التحميل الزائد للأخبار: على سبيل المثال ، لديك 50 أو 150 صديقًا وتنشر 5 أو 10 مقالات كل يوم ، أو شيء من هذا القبيل ، لكن جميع أصدقائك يفعلون نفس الشيء تمامًا ، والآن لديك 1500 إدخال في خلاصتك كل يوم. رقم دنبار + قانون زوكربيرج = الحمل الزائد ... الذي يقودنا إلى قانون جودهارت.
"أي نمط إحصائي ملاحظ عرضة للتدمير بمجرد ممارسة الضغط عليه للسيطرة عليه." - تشارلز جودهارت
لكن كيف يمكن للتعلم الآلي أن يحدث فرقًا؟ لقد ذكرت في وقت سابق أن الصعوبة الرئيسية تكمن في كيفية استخدام الموارد البشرية في العمل مع البرامج بالطريقة المثلى ، على الرغم من وجود خيار آخر - فقط دع الكمبيوتر يقوم بكل العمل. حتى وقت قريب جدًا ، كانت الصعوبات والأسباب وراء وجود مثل هذه الأنظمة ، تتألف في المقام الأول من فئة كبيرة من المهام التي لا تستطيع أجهزة الكمبيوتر حلها ، على الرغم من أن الناس حلوها على الفور. أطلقنا عليها "المهام التي يسهل على أي شخص ، ولكنها صعبة بالنسبة لجهاز الكمبيوتر" ، لكنها في الواقع كانت مهام كانت سهلة بالنسبة لشخص ما ، لكن شخصًا غير قادر عمليًا على وصفها لجهاز كمبيوتر. من الميزات المتقدمة للتعلم الآلي أنها تتيح لأجهزة الكمبيوتر نفسها تطوير الوصف اللازم.
يوضح الشكل الهزلي أدناه (مباشرة من عام 2014 ، عندما بدأت أنظمة التعلم الآلي ورؤية الكمبيوتر تطورًا سريعًا) هذه التغييرات تمامًا. تم إنجاز المهمة الأولى بسهولة ، على عكس المهمة الثانية ، على الأقل حتى ظهور التعلم الآلي.

الطريقة القديمة لحل هذه المشكلة هي العثور على أشخاص يصنفون الصورة - يلجئون إلى نوع من التعهيد الجماعي. بمعنى آخر ، استخدم "Turk الميكانيكية". لكن اليوم ، لم نعد بحاجة إلى أي شخص للنظر في هذه الصورة ، لأنه بمساعدة التعلم الآلي يمكننا في كثير من الأحيان أتمتة حل هذه المشكلة بالذات.
لذلك: كم عدد المشاكل التي يمكن حلها قبل استخدام تحليل لأفعال ملايين أو مئات الملايين من الأشخاص الذين يمكنك حلهم الآن باستخدام التعلم الآلي وبدون الحاجة إلى إشراك المستخدمين؟
بالطبع ، هناك بعض التناقض في هذا ، لأنه في التعلم الآلي تحتاج دائمًا إلى كمية كبيرة من البيانات. من الواضح ، في هذه الحالة ، يمكن لأي شخص أن يقول أنه إذا كان لديك منصة كبيرة ، فلديك تلقائيًا الكثير من البيانات ، وبالتالي ، فإن عملية التعلم الآلي ستصبح أسهل أيضًا. هذا صحيح بالتأكيد ، على الأقل في البداية ، لكنني أعتقد أنه لن يكون في غير مكانه السؤال عن عدد المهام التي يمكن حلها فقط بمساعدة المستخدمين الحاليين. في الماضي ، إذا كان لديك صورة قطة ، فيمكن تمييزها على أنها "قطة" فقط إذا كان لديك عدد كافٍ من المستخدمين وسوف ينظر أحدهم إلى تلك الصورة المعينة ويضع علامة عليها. اليوم ، لا تحتاج إلى مستخدمين حقيقيين على الإطلاق لمعالجة هذه الصورة الخاصة للقط - فقط تحتاج إلى وجود أي مستخدمين آخرين ، في أي مكان في العالم ، في مرحلة ما في الماضي قاموا بالفعل بتصنيف ما يكفي من الصور الأخرى مع القطط لتوليد نموذج الاعتراف اللازم.
هذه مجرد طريقة أخرى لاستخدام الموارد البشرية على النحو الأمثل: في أي حال ، فإنك بحاجة إلى أشخاص لتصنيف الكائنات (وكتابة القواعد التي سيقوم الناس بتصنيفها). لكننا هنا نغير بالفعل الرافعة ، وربما نغيّر عدد الأشخاص المطلوبين تغييراً جذرياً ، وبالتالي فإن قواعد اللعبة ، إلى حد ما ، تتغير بسبب تأثير "الفائز يحصل على كل شيء". في النهاية ، كل هذه الشبكات الاجتماعية واسعة النطاق للمنصة هي مجرد مجموعات ضخمة من البيانات المصنفة يدويًا ، لأنه في النهاية اتضح أن زجاجها نصف ممتلئ أو نصف فارغ؟ من ناحية ، يكون نصف ممتلئ: لديهم تحت تصرفهم أكبر مجموعة من البيانات المصنفة يدويًا (في مجال نشاطهم المحدد). من ناحية أخرى ، يكون الزجاج نصف فارغ: تم تحديد هذه البيانات وتصنيفها يدويًا.
حتى في الحالات التي يمكن أن تشكل فيها البيانات إحدى هذه المنصات (والتي ، على الأرجح ، لن يحدث هذا - بالتأكيد لن يحدث - كما كتبت هنا ) ، فإنها ستظل كذلك. كما هو الحال مع AWS ، التي مكّنت الشركات الناشئة التي لم تعد بحاجة لملايين المستخدمين من الحصول على وفورات الحجم للبنية التحتية الخاصة بهم ، فإن إنشاء هذه الأدوات يعني أنك لم تعد بحاجة إلى ملايين أو مليارات المستخدمين للتعرف على القط. يمكنك أتمتة العملية.
ترجمة: الكسندر تريجوبوف
التحرير: أليكسي إيفانوف
المجتمع: ponchiknews