يتم تعليم السيارة الجمال ، أو اختبار تورينج للمصورين المحترفين.

شرع مبرمجو Google في غرس طعم فني في السيارة وبدأوا بمعالجة الصور الصحيحة من الناحية الجمالية. إن خصوصية مفهوم الجمال هي أنه ليس لديه معايير واضحة. كان على الآلة إنشاء هذه المعايير. تم التدريب على أساس موقع صور شهير ، وقاعدة بيانات للسياق مع بيانات وصفية للصور ، وكان موضوع المعالجة عبارة عن صور بانورامية كروية من Google Street View. تسمى مجموعة الخوارزميات الناتجة Creatism - نظام التعلم العميق لإنشاء محتوى فني.

يعتقد مؤلفو الإبداع Hui Fang و Meng Zhang أنهم طوروا مقياسًا لتصنيفات الجمال التي يمكن للمصورين استخدامها لإجراء مقارنات موضوعية في المستقبل. بناءً على النتائج ، قاموا بما أسموه اختبار تورينج للمصورين. دعا الباحثون الخبراء إلى تقييم مزيج من أفضل الصور التي تم التقاطها من قبل الناس والتي تم إنشاؤها بواسطة Creatism ، ناهيك عن أن المجموعة تحتوي على آلات تم إنشاؤها. تم تصنيف 40٪ من أعمال الذكاء الاصطناعي على أنها "صور جيدة وذوق فني". يهدف المطورون إلى مساعدة أي مصور هاوٍ على تحويل صورته إلى صورة جميلة بدون فلاتر وإعدادات. بلمسة زر ، إطلاق الإبداع.


تقرب الخوارزمية في بعض الأحيان من الضوء الطبيعي والأكثر عمقًا ، وقد ارتكبت في بعض الأحيان أخطاء طفيفة في لصق البانوراما ، والتي يمكن رؤيتها في هذه الصورة.

مشاكل نقل الصور


إن مصفوفة الكاميرا الرقمية غير قادرة على التقاط المعلومات في نفس الوقت في المناطق المظلمة من الصورة ، والتي تحتاج إلى مزيد من التعرض لها (سرعة الغالق) ، وفي الضوء ، حيث يكون هناك تعرض أقل. النطاق الديناميكي هو الفرق في مستويات التعرض بين الأجزاء الأكثر قتامةً وسطوعًا من الصورة والتي يمكن إعادة إنتاجها دون فقد المعلومات. في المناطق السوداء تمامًا من الصورة (في التعريض الزائد) ، وكذلك في المعلومات الزائدة التعريض (التعريض المنخفض) ، من المستحيل استردادها. يمكن توضيح المناطق المظلمة من الصورة ، ولكن مع التشوهات. باستخدام طريقة HDR ، يتم دمج صورة من عدة صور تم التقاطها مع تعريضات ضوئية مختلفة في ملف 32 بت واحد.

رؤية الشخص قادرة على التقاط صورة بصرية بفارق 10-14 درجة من الإضاءة تحت ضوء الشمس الساطع (في الشمس ، لا يملك التلميذ القدرة على التكيف مع الإضاءة المختلفة) وما يصل إلى 24 خطوة في الضوء الخافت للنجوم (يمكن للتلميذ التكيف مع فرق الضوء). يمكننا أن نرى ، ولكن قد يكون من الصعب التقاط جزء من هذا النطاق في الصورة. النطاق الديناميكي للفيلم السلبي العادي هو حوالي 9-11 مستويات تعرض ، فيلم منزلق - 5-6 خطوات ، مصفوفة كاميرا رقمية - من 8 إلى 11 لمعظم الكاميرات الرقمية. توفر الكاميرات الخاصة 17 خطوة تصوير أو أكثر. إن لعب النطاق الديناميكي الحقيقي ليس بالأمر السهل أيضًا. ورق الصور على سبيل المثال قادر على إعادة إنتاج مستويات التعرض 7-8 فقط.

ملامح الخلق


للتجربة ، تم التقاط 15000 صورة احترافية من 500px.com بدقة لا تقل عن 299 × 299 بكسل. بمساعدتهم ، قام المطورون بتدريس الإبداع لإبراز الأكثر إثارة للاهتمام في المشهد. ثم ، استنادًا إلى 40،000 منظر كروي بانورامي في الولايات المتحدة الأمريكية وكندا وأوروبا ، تم تعليم الخوارزمية للعمل مع اللون والضوء.

ثم ، تم تعزيز النطاق الديناميكي لكل إطار ، وتم تطبيق عملية "مرشح التعبير" الخاصة بهم ، مما يحسن الظلال والإضاءة واللون. للقيام بذلك ، تقليديًا لمعالجة الصور ، استخدمنا نموذج الشبكة العصبية التنافسية التنافسي - وهو نموذج عندما يقوم جزء واحد من البرنامج بتدهور جودة الأصل ويحاول الآخر استعادته ويتعلم "كيفية القيام بذلك".



لإنشاء مقياس التصنيف النهائي ، أخذنا قاعدة بيانات AVA ، التي تضم 250.000 صورة ، والأهم من ذلك ، مجموعة متنوعة من البيانات الوصفية ، بما في ذلك عدد كبير من التصنيفات الجمالية لكل صورة ، والعلامات الدلالية في 60 فئة ، بالإضافة إلى التصنيفات المرتبطة بأسلوب التصوير للفرز الاحترافي.

بعد نتائج جميع عمليات المعالجة ، تم خلط 400 صورة تجريبية مع 800 صورة AVA وتم إعطاؤها للخبراء.

هيئة المحلفين


طُلب من خبراء الصور الذين حصلوا على تعليم مهني وخبرة لا تقل عن سنتين تقييم الفئة التي تنتمي إليها الصورة وتقديم تقييم مناسب:

  1. صنع بواسطة "صندوق صابون" - كما اتضح ، حدث ذلك. لا إعدادات ، لا تركيز.
  2. صورة جيدة للمبتدئين عديمي الخبرة ، ولكن القيمة الفنية ضئيلة.
  3. لقطة شبه احترافية. الذوق الفني واضح للعيان.
  4. من صنع محترف.

من المخلوقات المعالجة 40٪ من الصور تندرج في الفئة من 3 إلى 4 - أي أنها معترف بها على الأقل شبه احترافية. كان متوسط ​​الدرجة أقل من 3.

نشر الباحثون أفضل اللقطات التي عالجها الإبداع. تحت كل ، للمقارنة ، يتم عرض صورة بانورامية كاملة تم قطعها منها.

Source: https://habr.com/ru/post/ar405419/


All Articles