من أين تأتي الصور لاختبار أنظمة التعرف على الوجوه؟


قامت IBM بتوضيح التنوع في وجوه مجموعة البيانات

في الآونة الأخيرة ، تم انتقاد IBM لالتقاط الصور المتاحة للجمهور من استضافة الصور Flickr والمواقع الأخرى حيث يقوم المستخدمون بتحميل صورهم لتدريب الشبكات العصبية دون إذن. بشكل رسمي ، كل شيء وفقًا للقانون - يتم نشر جميع الصور بموجب ترخيص المشاع الإبداعي - لكن الناس يشعرون بعدم الارتياح لأن منظمة العفو الدولية تتعلم من وجوههم. لم يعرف البعض حتى أنه تم تصويرهم. كما تعلمون ، لتصوير شخص في مكان عام ، لا تحتاج أن تطلب منه الإذن.

وفقًا لتقارير وسائل الإعلام ، استخدمت IBM ما يقرب من مليون صورة خاصة من Flickr لتدريب نظام التعرف على الوجوه. ولكن بعد ذلك تبين أن IBM لم تقم بالفعل بنسخ الصور من Flickr ، فهذه الصور هي جزء من مجموعة بيانات YFCC100M التي تحتوي على 99.2 مليون صورة متاحة لتدريب الشبكات العصبية. هذه القاعدة صنعتها ياهو ، المالك السابق لفليكر.

اتضح أن القصة مع IBM ليست سوى قمة جبل الجليد. هنا ، وقعت الشركة عن طريق الخطأ تحت التوزيع ، وفي الواقع ، تم استخدام صور المستخدم منذ فترة طويلة لتدريب مجموعة متنوعة من الأنظمة ، وقد أصبح هذا بالفعل ممارسة شائعة: "أظهرت دراستنا أن الحكومة الأمريكية والباحثين والشركات استخدمت صور المهاجرين ، والأطفال المعتدى عليهم ، و الناس الميتة لاختبار نظم التعرف على وجوههم ، " يكتب سليت . ويؤكد أنه حتى الهيئات الحكومية مثل المعهد الوطني للمعايير والتكنولوجيا (NIST) تمارس هذه الأنشطة.

على وجه الخصوص ، تدير NIST برنامج اختبار التحقق من التعرف على الوجه (FRVT) للاختبار الموحد لأنظمة التعرف على الوجوه التي طورتها شركات خارجية. يتيح لك هذا البرنامج تقييم جميع الأنظمة بنفس الطريقة ، بمقارنتها بموضوعية مع بعضها البعض. في بعض الحالات ، يتم منح جوائز نقدية تصل إلى 25 ألف دولار للفوز بالمسابقة ، ولكن حتى بدون مكافأة مالية ، فإن الحصول على درجة عالية في اختبار NIST يعد حافزًا قويًا للنجاح التجاري لشركة التطوير ، لأن العملاء المحتملين سيوليون اهتمامًا على الفور لهذا النظام ، ويمكن الإشارة إلى تصنيف A + في النشرات الصحفية والمواد الترويجية.

لتقييم NIST ، يتم استخدام مجموعات البيانات الكبيرة مع الصور الفوتوغرافية للوجوه التي تم التقاطها بزوايا مختلفة وفي ظروف الإضاءة المختلفة.

كشف تحقيق في Slate أن مجموعة بيانات NIST تتضمن الصور التالية:


تم التقاط العديد من الصور من قبل موظفي وزارة الأمن الداخلي (DHS) في الأماكن العامة ، بينما أثناء تصوير المارة ، قام موظفو وزارة الأمن القومي بالتقاط صور للسائحين الذين يصورون المناطق المحيطة.

تحتوي مجموعات البيانات NIST على ملايين الصور من الأشخاص. منذ أن تم جمع البيانات في الأماكن العامة ، يمكن لأي شخص أن يكون في قاعدة البيانات هذه. تقوم NIST بتوزيع مجموعات البيانات الخاصة بها بشكل نشط ، مما يسمح للجميع بتنزيل هذه الصور وتخزينها واستخدامها لتطوير أنظمة التعرف على الوجوه (لا يتم نشر صور استغلال الأطفال). من المستحيل تحديد عدد الأنظمة التجارية التي تستخدم هذه البيانات ، ولكن العديد من المشاريع العلمية تفعل ذلك بالتأكيد ، يكتب Slate .

في تعليق للنشر ، قال ممثل NIST أن قاعدة FRVT تم تجميعها من قبل المنظمات الحكومية الأخرى وفقًا لمهامها ، وهذا ينطبق أيضًا على القاعدة مع صور للأطفال. يستخدم NIST هذه البيانات بما يتفق بدقة مع القانون واللوائح الحالية. وأكد أن قاعدة البيانات التي تحتوي على إباحية للأطفال تُستخدم فعليًا لاختبار المنتجات التجارية ، لكن الأطفال في قاعدة البيانات هذه مجهولون ، أي أن أسمائهم ومكان إقامتهم غير مذكورون. لا يعرض موظفو NIST هذه الصور ، بل يتم تخزينها على خوادم DHS.

تم استخدام مجموعة بيانات بها صور للأطفال منذ عام 2016 على الأقل. وفقًا للوثائق الخاصة بالمطورين ، تتضمن "صورًا للأطفال من سن الرضيع إلى سن المراهقة" ، حيث تظهر معظم الصور "الإكراه والعنف والنشاط الجنسي". تعتبر هذه الصور من الصعب التعرف عليها نظرًا لزيادة التباين في الموضع والسياق وما إلى ذلك.

ربما يتم استخدام مجموعة البيانات هذه لأنظمة التدريب والاختبار من أجل التصفية التلقائية للمحتوى الفاحش .

يسلط الصحفيون الضوء أيضًا على "التحيز" الخاص بمجموعة بيانات Multi Encounter Dataset. على الرغم من أن السود لا يشكلون سوى 12.6٪ من سكان الولايات المتحدة ، فإن 47.5٪ منهم في قاعدة بيانات صور المجرمين ، ولهذا السبب يمكن لمنظمة العفو الدولية أيضًا أن تتعلم التحيز وتصبح عنصرية .

Source: https://habr.com/ru/post/ar444984/


All Articles