جيل من الصور الفنية في شبكة عصبية تم تدريبها على التعرف على الإباحية

تحذير: تحتوي هذه المقالة على صور عُري مجردة وقد لا تكون مناسبة للعرض في مكان العمل.


بعض الأمثلة على الفن التجريدي الذي تم إنشاؤه باستخدام الشبكة العصبية open_nsfw. فتحت Yahoo

مؤخرًا شفرة المصدر للشبكة العصبية open_nsfw. هذه شبكة تعليمية عصبية متبقية مدربة تدريباً خاصاً ( ResNet ) ، والتي تصنف الصور عن طريق تعيين "تصنيف غير لائق" من 0 إلى 1. تم تصميم البرنامج لاكتشاف صور NSFW تلقائيًا ، أي أنها غير مناسبة للعرض في مكان العمل. ببساطة ، لتحديد المواد الإباحية. بطبيعة الحال ، الهدف هو تصفية مثل هذه الصور - إزالتها من الوصول المفتوح.

ربما لم تتوقع Yahoo مكتوبفي الطريقة التي سيستخدم بها المخترقون الحافلون تطورهم الفكري.

رسمياً ، لم يرتكب طالب الدراسات العليا غابرييل جوه من جامعة كاليفورنيا في ديفيس أي خطأ. يتخصص الرجل في التعلم الآلي ، ونظرية الاحتمالات ، والتقليل المحدب. لقد تساءل فقط عما تفهمه الشبكة العصبية Yahoo بالضبط بواسطة NSFW. الصور التي تحصل على الحد الأقصى من التصنيف من قبل المصنف.

للحصول على إجابة لهذا السؤال ، طبق غابرييل تقنية تصور جديدة نسبيًا ، تم تطويرها مؤخرًا للشبكات العصبية للرؤية الآلية.مجموعة من الباحثين بمشاركة آنا نجوين وأليكسي دوسوفيتسكي ، إلخ. ولم يتم نشر أعمالهم بعد في الجريدة الرسمية ، ولكنها موجودة بالفعل في المجال العام. تتضمن هذه التقنية دراسة متعمقة لكيفية عمل الشبكة العصبية. يمكن للباحثين أن يتصوروا بوضوح العلامات المحددة في الصور التي تعلم كل عصبون تسليط الضوء عليها. إحدى الطرق المعروفة لتحقيق ذلك هي من خلال استخدام تقنيات زيادة التنشيط (AM). يقوم بتوليف قيم الإدخال هذه (أي مثل هذه الصورة) التي تزيد من تنشيط الخلايا العصبية. في ورقة علمية منشورة ، أظهر الباحثون كيف يمكنك زيادة جودة AM بشكل كبير باستخدام أداة قوية - منشئ صور الشبكة العصبية!

تولد ما يسمى بشبكة المولدات العميقة (DGN) عددًا كبيرًا من الصور الاصطناعية. إنها تبدو تقريبًا مثل الصور الحقيقية ، وبالتالي تحدد الوظائف المكتسبة لكل خلية عصبية من الشبكة العصبية المدروسة بدقة عالية وقابلية تكرار. ميزة مولد DGN هو أنه يختبر بشكل جيد نسبيًا الشبكات العصبية لبنى مختلفة مدربة على مجموعات بيانات مختلفة. أي أنها أداة بحث عالمية إلى حد ما.

من نواح عديدة ، يشبه تشغيل DGN هذا مولد ديب دريم .تم تطويره بواسطة متخصصين من وحدة البحث في Google Research قبل عام ونصف. لكن DGN ، على ما يبدو ، تعمل بكفاءة وفعالية أكبر بسبب التدريب التمهيدي الإضافي على مجموعة من الصور الطبيعية ، على الرغم من أنها لا تتعلق بمجموعة البيانات التي تم تدريب أو عمل الشبكة العصبية المدروسة عليها. ثم يولد مولد DGN مجموعة متنوعة من الصور الاصطناعية ، ويغير معلمات الصور الطبيعية. في الواقع ، تعمل هذه الطريقة كشبكة خصومة مولدة تتصارع فيها الشبكات العصبية فيما بينها .

بالمناسبة ، يمكن استخدام DGN بشكل عام لغرض آخر - كمؤلف للصور الاصطناعية. الأعمال الفنية التي تلبي معايير محددة.

في حالتنا ، المعيار المحدد هو الحد الأقصى للتصنيف على مقياس NSFW. من الصعب تسميته فنًا متميزًا ، لكن المهمة محددة تمامًا. إذا تم تعيين المهمة ، فمن الضروري حلها.

لذا ، فإن "مساحة الصور الطبيعية" ، وفقًا لمنطق الشبكة العصبية الخصومة التوليدية ، تبدو تقريبًا مثل الفن التجريدي. بطبيعة الحال ، تحصل الصور التي يتم إنشاؤها بشكل عشوائي على تصنيفات منخفضة على مقياس NSFW.

على سبيل المثال ، تحتوي هذه الصورة على مؤشر إباحي يبلغ 0.06.



هنا المزيد من المواد الإباحية - 0.07.



حسنًا ، بعد ذلك نطلق DGN وفقًا للتقنية الموضحة في العمل العلمي لـ Nguyen و Dosovitsky ، إلخ. علاوة على ذلك ، نشر المؤلفون رمز المصدر لـ DGN على Github .

لذلك ، تبدأ DGN بالشرط التالي للحصول على أقصى مؤشر NSFW ، أي تعظيم الدالة D (x).



هذا كل ما في الأمر ، يمكنك الآن الاستمتاع بعدد لا يحصى من الصور الإباحية بمؤشر 1.00.

يجب أن أقول أن الصور الاصطناعية المجردة في معظم الحالات تبدو واقعية للغاية. على الرغم من أنه من الواضح أن هذه ليست بعض الكائنات الحقيقية ، ولكن ببساطة إنشاء مجموعات من وحدات البكسل بمحتوى غير معروف تمامًا.

هنا بعض منهم.



واصل الطالب الخريج التجربة - وحدد المهمة المعاكسة لـ DGN: إنشاء صور بحد أدنى من قيمة مؤشر NSFW.



هذا ليس ، ليس فقط الغياب المضمون للمواد الإباحية ، ولكن هناك شيء أكثر - هذا هو مكافحة المواد الإباحية .



الشيء الأكثر إثارة للاهتمام هو أنه في شبكة ياهو العصبية ، يتم حساب قيمة D (x) من خلال قوة التنشيط النسبية للعصبين المستقلين ولكن اثنين - واحد NSFW ، كما كنت تتوقع ، والثاني - SFW. أي أن الشبكة العصبية "متحمسة" قليلاً حتى في صور آمنة تمامًا ، مثل التلال المستديرة وما إلى ذلك.

بمعرفة هذه المعلومات ، من الممكن إنشاء صور مثيرة لينة مضمونة خالية من المواد الإباحية ، ولكنها مع ذلك "تثير" شبكة عصبية موجهة نحو العثور على الإباحية.

لعب الباحث بالمعاملات في المعادلة للعثور على المزيج الأمثل من المواد الإباحية والخلايا العصبية المضادة للإنجاب للحصول على أفضل تأثير فني ، ولكن في نفس الوقت للحصول على الحد الأقصى من مؤشر الإباحية 1.

هذه صور مذهلة.



فوجئ بجمال هذه النتائج ، أطلق المؤلف DGN ليس على شبكة عصبية open_nsfw واحدة ، ولكن في نفس الوقت على شبكة عصبية أخرى من CNN ، والتي تصنف الصور حسب الموقع. وهكذا ، حصل على لوحات تحصل على أقصى النتائج في نفس الوقت وفي مكان التصوير (الشاطئ ، الوادي ، الحفل ، إلخ) ، والحد الأدنى / الأقصى للنتيجة لمؤشر NSFW.

شاطئ


حفلة موسيقية بركان


الصحراء


متحف حقا ، هناك مجال غني للتجارب. يعترف المؤلف للأسف أنه يمكن تحديد عناصر NSFW ، من حيث المبدأ ، على الإطلاق







صور. الشيء هو القدرة على التعرف عليهم. إذا نظرت إلى أصل هذه العينات ، فلن تتمكن من "رؤية" هذه العناصر حتى في الصور الأصلية من الحفلات الموسيقية والمتاحف وما إلى ذلك.

إذا كنت تدرس الشبكة العصبية open_nsfw لفترة طويلة ، فمن يدري ، هل يمكنك البدء في رؤية عناصر NSFW بشكل عام في كل مكان؟

Source: https://habr.com/ru/post/ar398547/


All Articles