طور مهندسون من جامعة ماريلاند نظامًا "يتخطى" reCAPTCHA من Google باحتمالية تقارب مائة بالمائة. ويستخدم خوارزميات التعرف على الكلام لحل الصوت captcha. نقول كيف يعمل.
صورة فوتوغرافيةغير حقيقي / PDالخلفية
لأول مرة ، قدم مطورو جامعة ماريلاند
نظامًا لتجاوز reCAPTCHA "الصوتي" (أطلقوا عليه حل unCAPTCHA) في عام 2017. ثم كان Google captcha الصوتي سجلًا أطلق عليه المذيع سلسلة من الأرقام. استخدم المؤلفون خوارزميات التعرف على الكلام لأتمتة عملية إدخال القيم. تمكنوا من تحقيق دقة حل captcha في 85 ٪.
أرسل المؤلفون معلومات حول الثغرة الأمنية إلى Google. قام عملاق تكنولوجيا المعلومات
بتحديث reCAPTCHA حيث استبدل تسلسل الأرقام بالعبارات. ومع ذلك ، في نهاية العام الماضي ، وضع مهندسون من ولاية ماريلاند اللمسات الأخيرة على شبكتهم العصبية. تمكنت من الالتفاف على اختبار الصوت المحدث بدقة 90٪.
كيف يعمل؟
يزور الروبوت صفحة على الإنترنت محمية بواسطة reCAPTCHA ، ثم يقوم بعدد من الإجراءات لمحاكاة السلوك البشري. بعد أن ينقر على captcha ويحدد الخيار لحلها باستخدام التسجيلات الصوتية.
في إصدار unCAPTCHA لعام 2017 ، تم
تقسيم الملف الصوتي إلى مقاطع. كانت علامات التوقف بين الأرقام. وكانت النتيجة تسجيلات صوتية متعددة بكلمات منفصلة. أرسل المطورون هذه التسجيلات إلى خدمات التعرف على الكلام في السحاب: واجهة برمجة تطبيقات Google Cloud Speech-to-Text </ iron> و Bing Speech Recognition و IBM Bluemix و Wit-AI. لقد حددوا محتوى التسجيلات الصوتية حسب نمط تردد الطيفية. في الوقت نفسه ، تم استخدام العديد من الخدمات السحابية من قبل المطورين لتقليل الخطأ في التعرف على القيم العددية.
ثم قام unCAPTCHA v1 بتجميع ما يسمى بالخريطة الصوتية. وشملت إجابات من أنظمة مختلفة لنفس المقطع. علاوة على ذلك ، تم تشغيل شبكة عصبية تلافيفية ، حيث استخرجت الكلمات من البطاقة التي لم تشر إلى اسم الرقم ، وقمت بتصحيح الأخطاء ، واخترت الإجابة الأكثر احتمالًا لملء reCAPTCHA. بشكل عام ، العملية هي كما يلي:

في الإصدار الثاني من unCAPTCHA (الذي تم تقديمه في ديسمبر) ، لم
تعد هناك حاجة إلى تجزئة وخريطة صوتية. تستخدم Google captcha المحدثة عبارات منفصلة بدلاً من الأرقام ، وتحدد خدمات السحابة الخاصة بها بشكل أفضل. لذلك ، كان من الممكن تحقيق دقة عالية في التعرف على الصوت captcha باستخدام أداة واحدة - Google Speech-to-Text. بعد التحليل ، يقوم الروبوت على الفور بإدخال النص المستلم في سطر captcha.
هذه
هي الطريقة التي يبدو بها إرسال الصوت إلى السحابة وإدخال استجابة (من المستودع على GitHub). يمكن مشاهدة العرض التوضيحي للبرنامج
على هذا gif-ke .
ماذا يقولون عن التكنولوجيا
وفقًا لمؤلفي unCAPTCHA ، فإن الإصدار الجديد من captcha من Google لم يعقد ، بل على العكس من ذلك ، قام بتبسيط الاختراق. الآن لا تحتاج خدمة الإدخال التلقائي إلى إرسال طلبات إلى منصات سحابية مختلفة وتدريب شبكة عصبية منفصلة لتقييم النتائج.
صور AdNorrel / CC BY-SAدفاعًا عن reCAPTCHA ، تجدر الإشارة إلى أن الإصدار الجديد أضاف مع ذلك عدة عقبات أمام المتسللين. الأول هو محاكاة سلوك المستخدم على الصفحة أصبح أكثر صعوبة. في unCAPTCHA v1 ، تم تسجيل الحساب آليا بالكامل مع
السيلينيوم . تعرف captcha الآن على Google ما إذا كانت الصفحة تستخدم هذه الخدمة وتمنع الوصول تلقائيًا. كان على المطورين من جامعة ماريلاند أن يصفوا إجراءات "المستخدم" يدويًا وأن يغيروا البرنامج النصي لكل محاولة إدخال جديدة. بينما كان المهندسون من ولاية ماريلاند يعملون على حلهم ، أعادت Google تحديث reCAPTCHA مرة أخرى ، وما زالت unCAPTCHA غير قادرة على التعامل معه. ومع ذلك ، لا يزال العديد من المواقع تستخدم الإصدارات الأقدم من حماية DDoS. لذلك ، لا تزال مشكلة عدم الحصانة ذات صلة.
كيف اخترق الصوت captcha
على الشبكة ، يمكنك العثور على معلومات حول الحلول الأخرى لاختراق الصوت captcha. كان أحد الأنظمة الأولى يعتمد على التصنيف اليدوي للملفات الصوتية. تم تقسيم الصوت إلى مقاطع مع كلمات منفصلة - الحروف والأرقام ، والتي كانت مرتبطة مع الطيفية الخاصة بهم. على سبيل المثال ، تم اقتراح طريقة القرصنة هذه بواسطة مشروع devoicecaptcha لعام 2006. ثم تجاوز البرنامج برنامج Google captcha بدقة 33٪.
نفذت مشاريع أخرى خوارزميات أكثر تعقيدًا تعمل تلقائيًا بالكامل على حل كلمة التحقق. على سبيل المثال ، استخدموا برنامج
Sphinx للقرصنة ، الذي تم تطويره لأول مرة في أواخر التسعينيات في جامعة كارنيجي ميلون. اخترق Sphinx captcha على موقع eBay الإلكتروني في 75 ٪ من الحالات ، ولكن في وقت لاحق انخفضت فعاليته إلى 25-30 ٪.
في عام 2012 ، قدم مؤلفو مشروع Stiltwalker شبكة عصبية كانت قادرة على التمييز بين "نمط" تردد الكلمات الفردية ، على الرغم من ضجيج الخلفية. وفقًا للمطورين ، تجاوز النظام بنجاح التحقق من صحة Google الحالي في ذلك الوقت في 99٪ من الحالات.
بالنسبة لمنشئي unCAPTCHA ، من المحتمل
أن نسمع المزيد عن عملهم. هناك فرصة لمحاولة كسر reCAPTCHA المحدثة للمرة الثالثة بطريقة مماثلة.
قراءة إضافية من قناة Telegram و "Hi-Fi World":
ما هو الصوت 8D - مناقشة اتجاه جديد
شريحة بلوتوث لا تحتاج إلى بطارية
أ.
يتعلم العلماء نقل الصوت بالليزر
أ.
KPM تسمية رقمنة كتالوجها بأكمله