يصعب إثبات أنك لست روبوتًا
في مرحلة ما من العام الماضي ، بدأت مطالب Google المستمرة لإثبات أنني إنسان تبدو أكثر عدوانية. على نحو متزايد ، من أجل زر بسيط ولطيف للغاية "أنا لست روبوتًا" ، بدأت الطلبات تظهر لإثبات ذلك - عن طريق اختيار جميع إشارات المرور أو التحولات أو النوافذ في شبكة الصور. سرعان ما بدأت إشارات المرور في الاختباء في أوراق الشجر ، وكانت التحولات مشوهة وذهب قاب قوسين أو أدنى ، وأصبحت علامات المتجر ضبابية وتحولت إلى اللغة الكورية. هناك شيء مخيب للآمال للغاية في محاولات فاشلة للعثور على صنبور النار في الصورة.
تسمى هذه الاختبارات اختبار CAPTCHA ، وهو اختصار لـ "اختبار تورينج العام الأوتوماتيكي بالكامل المصمم للتمييز بين الأشخاص وأجهزة الكمبيوتر" ، وبمجرد وصولهم إلى درجة مماثلة من عدم الوضوح. في أوائل القرن الحادي والعشرين ، كانت الصور البسيطة ذات النص كافية لإيقاف معظم برامج التتبع العشوائي. مرت عشر سنوات ، وبعد أن اشترت Google البرنامج من باحثين في جامعة كارنيجي ميلون واستخدمته لرقمنة في مشروع كتب Google ، كان لا بد من تشويه النصوص وإخفائها أكثر وأكثر لتجاوز برامج تحسين التعرف البصري على الحروف - البرامج ذاتها الذين ساعدوا في تحسين الأشخاص الذين اضطروا لحل كل هذه الكابتشا.
نظرًا لأن اختبار CAPTCHA هو أداة أنيقة لتدريب الذكاء الاصطناعى ، فإن أي اختبار تم اختراعه يمكن أن يدوم فقط لفترة ، وهو ما يعترف به المخترعون. مع كل هؤلاء الباحثين والمخادعين والناس العاديين الذين حلوا بلايين الألغاز على شفا ما هو ممكن بالنسبة إلى الذكاء الاصطناعي ، في مرحلة ما كان على الآلات ببساطة أن تتغلب علينا. في عام 2014 ،
حرضت Google أفضل خوارزمية لحل أكثر النصوص تشويهاً والأشخاص: تعترف الكمبيوتر بشكل صحيح بالنص في 99.8٪ من الحالات ، و
33٪ فقط من الأشخاص.
بعد ذلك ، انتقلت Google إلى
NoCaptcha ReCaptcha ، الذي يراقب سلوك الأشخاص ويجمع بياناتهم ، مما يتيح لبعضهم أن يذهبوا أبعد من ذلك ببساطة عن طريق النقر على زر "أنا لست روبوتًا" ، بينما يمنحهم الآخرون مهام للبحث عن الصور التي نراها اليوم. لكن السيارات تتفوق علينا مرة أخرى. كل هذه المظلات ، التي قد تكون أو لا تكون نوافذ المتاجر ، هي المرحلة الأخيرة من سباق التسلح والأسلحة.
جيسون بولاكيس ، أستاذ علوم الكمبيوتر بجامعة إلينوي في شيكاغو ، مسؤول شخصيًا عن المضاعفات الأخيرة لكابتشا. في عام 2016 ، نشر عملاً استخدم فيه برامج التعرف على الصور الجاهزة ، بما في ذلك البحث عن الصور من Google ، لحل دقة captcha البالغة 70٪. تعامل باحثون آخرون مع التعرف على الصوت captcha من Google باستخدام برامج التعرف على الكلام من الشركة نفسها.
يقول بولاكيس إن التعلم الآلي ليس أسوأ من البشر في التعرف على النصوص والصور والصوت البسيطة. ربما تعمل الخوارزميات بشكل أفضل: "لقد وصلنا إلى النقطة التي تؤدي فيها تعقيدات المهام للبرنامج إلى حقيقة أن المهام تصبح معقدة للغاية بالنسبة للأشخاص. نحتاج إلى بديل ، لكن لا توجد خطة واضحة بعد ".
أدب CAPTCHA مليء ببداية خاطئة ومحاولات غريبة للعثور على شيء آخر غير النصوص والصور ، وهو ما يفعله جميع الناس بشكل جيد والسيارات سيئة.
حاول الباحثون
أن يقدموا للمستخدمين فرز صور الأشخاص حسب تعبيرات الوجه والجنس والعرق (يمكنك أن تتخيل كيف تسير الأمور). كانت هناك اقتراحات لتنظيم اختبار CAPTCHA مع اختبارات ، اختبار CAPTCHA على أساس
التهويدات ، وهو أمر شائع في تلك الأماكن التي نشأ فيها المستخدم ، كما هو متوقع. هذه كلمة التحقق مع مرجع ثقافي لا تهدف فقط إلى الروبوتات ، ولكن أيضًا إلى أشخاص من دول أخرى يقررون اختبار كلمة التحقق مقابل قرش. حاول الأشخاص دفع خوارزميات التعرف على الصور إلى طريق مسدود ، مما دفع المستخدم إلى تحديد ، على سبيل المثال ، خنزير ، ولكن في نفس الوقت يتم رسمه وفي النظارات الشمسية. اكتشف الباحثون خيارات مثل دعوة المستخدمين للتعرف على الكائنات في
تجزئة المشكال . في أحد الخيارات المثيرة للاهتمام في عام 2010 ، اقترح الباحثون استخدام كلمة التحقق (captcha) لفرز
الصخور القديمة - تقوم أجهزة الكمبيوتر بعمل ضعيف في التعرف على الرسومات أو صور الغزلان على جدران الكهوف.
في الآونة الأخيرة ، كانت هناك محاولات لتطوير captcha
اللعبة حيث يحتاج المستخدم إلى تدوير الكائنات في زوايا معينة أو نقل قطع اللغز ، ولم يتم إعطاء تعليمات لحل captcha في شكل نص ، ولكن في شكل رموز ، أو تم تضمينها في سياق ملعب. الأمل هو أن يفهم الناس منطق اللغز ، وأن أجهزة الكمبيوتر سوف تتعثر دون تعليمات واضحة. حاول باحثون آخرون استخدام حقيقة أن الأشخاص لديهم أجسام ، ويستخدمون كاميرات الجهاز أو الواقع المعزز لتأكيد وجود شخص بشكل تفاعلي.
لا تكمن مشكلة العديد من هذه الاختبارات في أن الروبوتات ذكية للغاية ، ولكن الناس لا يتعاملون معها بشكل جيد. وليس الأمر أن الناس أغبياء ؛ إنها تختلف اختلافًا كبيرًا في اللغة والثقافة والخبرة. بعد أن تخلصت من كل هذا من أجل إجراء اختبار يمكن لأي شخص اجتيازه دون تدريب وفكر طويل ، فقد تركنا بمهام فظ مثل التعرف على الصور - وهذا هو بالضبط ما ستعمله منظمة العفو الدولية المصممة خصيصًا بشكل جيد.
يقول بولاكيس: "الاختبارات محدودة بالقدرات البشرية". - لا يتعلق الأمر فقط بالقدرات المادية - بل تحتاج إلى العثور على شيء ما بين الثقافات واللغات. نحتاج إلى مهمة تعمل بشكل جيد مع شخص من اليونان ، ومع شخص من شيكاغو ، ومع شخص من جنوب إفريقيا وإيران وأستراليا في نفس الوقت. ويجب أن لا تعتمد على الفروق والاختلافات الثقافية. نحتاج إلى مهمة يتكيف معها الشخص العادي جيدًا ، ويجب ألا تقتصر على مجموعة فرعية محددة من الأشخاص ، ويجب أن تكون صعبة على جهاز كمبيوتر. كل هذا يحد كثيرا من اختيار الخيارات. كما يجب أن يكون الأمر شيئًا يتعامل معه الناس بسرعة ، وهذا ليس مزعجًا جدًا ".
تحاول محاولات حل هذه الألغاز بصور ضبابية نقل الشخص بسرعة إلى القضبان الفلسفية: هل هناك أي جودة إنسانية عالمية يمكن إظهارها لآلة والتي لا يمكن للآلة تقليدها؟ ماذا يعني أن تكون إنسانًا؟
ربما لا تُقاس إنسانيتنا بالكيفية التي نؤدي بها المهام ، بل كيف نتصرف ، أو نتنقل عبر العالم - أو ، في هذه الحالة ، عبر الإنترنت. يقول Shuman Ghosemajumder ، فريق Google للتشغيل الآلي لمكافحة النقر ، الذي أصبح فيما بعد مدير تقنية Shape Security الخاص بالكشف عن الروبوتات ، إن لعبة captcha أو فيديو captcha أو أي اختبار يمكن أن تصنعه سيتم اختراقه. يميل إلى "ترخيص دائم" بدلاً من الاختبارات الفردية - لمراقبة سلوك المستخدم والبحث عن علامات الأتمتة. يقول Gosmahumder: "الشخص الحقيقي لا يتحكم في المهارات الحركية بشكل جيد للغاية ، ولا يمكنه تحريك الماوس بنفس الطريقة عدة مرات خلال عدة تفاعلات ، حتى لو حاول القيام بذلك". سوف يتفاعل الروبوت مع الصفحة دون تحريك الماوس ، أو تحريكه بدقة شديدة ، وفي تصرفات الشخص سيكون هناك "إنتروب" يصعب تزويره ، كما يقول جوسمايدر.
يعمل فريق captcha من Google في اتجاه مماثل. يستخدم أحدث إصدار من
reCaptcha v3 ، الذي تم الإعلان عنه أواخر العام الماضي ، "تحليل المخاطر التكيفي" لتقييم حركة المرور للريبة. يمكن لمالكي الموقع تقديم مهام للمستخدمين المشتبه فيهم مثل إدخال كلمة مرور أو تفويض عاملين. لا تكشف Google عن العوامل التي يتم أخذها في الاعتبار في التقديرات ، باستثناء أن الشركة تقيم كيفية ظهور "حركة المرور الجيدة" على الموقع وتستخدم هذه المعلومات لتصفية "حركة المرور السيئة" ، وفقًا لما قاله Cy Khormaee ، مدير المنتج من الفريق. كلمة التحقق يقول الباحثون في مجال الأمن إنه من المحتمل أن يكون مزيجًا من ملفات تعريف الارتباط وسمات المتصفح وأنماط حركة المرور وعوامل أخرى. يتمثل أحد عيوب نموذج التعرف على الروبوت الجديد في أن التنقل عبر الويب عند محاولة تقليل ملاحظات المستخدم قد يكون مزعجًا بعض الشيء ، لأن أشياء مثل VPN والإضافات التي تجعل من الصعب تتبع المستخدم قد تكون مشبوهة.
يقول آرون مالينفانت ، كبير مهندسي Google لفريق CAPTCHA ، إن الابتعاد عن اختبارات تورينج يجب أن يساعد في التغلب على المنافسة التي يخسرها الناس طوال الوقت. "كلما استثمرنا في التعلم الآلي ، زادت صعوبة هذه المهام بالنسبة للناس ، وعلى وجه الخصوص ، أطلقنا اختبار CAPTCHA V3 - للمضي قدماً في هذا المنحنى." يقول Malenfant أنه بعد 5 إلى 10 سنوات ، لن تكون المهام في captcha منطقية على الإطلاق. تعتمد معظم الويب على اختبار Turing الثابت والمخفى الذي يعمل على الخلفية.
في كتابه "الإنسان الأكثر إنسانية" ، يشارك برايان كريستيان في اختبار تورينج باعتباره شركًا ، ويدرك أنه من الصعب جدًا إثبات إنسانيته في المحادثات. من ناحية أخرى ، وجد مطورو الروبوتات أن هذه الاختبارات يسهل اجتيازها دون التظاهر بأنه محاور بليغ أو ذكي ، ولكن الإجابة على الأسئلة بنكات غير منطقية أو عمل أخطاء مطبعية أو ، كما في حالة روبوت فاز
في مسابقة تورينج في عام 2014 ، مدعيا أن أنت فتى أوكراني يبلغ من العمر 13 عامًا ولا يتحدث الإنجليزية جيدًا. بعد كل شيء ، فمن الطبيعة البشرية لارتكاب الأخطاء. من الممكن أن ينتظر اختبار captcha هذا المستقبل ، وهو اختبار تورينج الأكثر شيوعًا في العالم - لن يخلق سباق التسلح الجديد روبوتات تتفوق على الأشخاص في فرز الصور وتحليل النص ، ولكن الروبوتات التي ترتكب أخطاء ، وتغيب عن الأزرار ، وتشتت علامات التبويب وتبديلها. "أعتقد أن الناس بدأوا يفهمون أن هناك مجالات تطبيق لمحاكاة المستخدم البشري العادي ... أو الأشخاص الأغبياء" ، كما يقول جوسماخر.
كلمة التحقق يمكن أن تستمر في هذا العالم. في عام 2017 ،
قدمت Amazon
براءة اختراع لمشروع يستخدم الأوهام البصرية والألغاز المنطقية التي يصعب على الأشخاص التعامل معها. يسمى هذا الاختبار "اختبار تورينج من خلال الخطأ" ، والطريقة الوحيدة لاجتيازه هي إعطاء إجابة خاطئة.