Einem Auto wird Schönheit beigebracht oder ein Turing-Test für professionelle Fotografen.

Google-Programmierer wollten dem Auto einen künstlerischen Geschmack verleihen und begannen mit einer ästhetisch korrekten Fotoverarbeitung. Die Besonderheit des Schönheitsbegriffs besteht darin, dass er keine klaren Kriterien hat. Die Maschine musste diese Kriterien erstellen. Das Training fand auf der Grundlage einer beliebten Foto-Site statt, einer Kontextdatenbank mit Metadaten für Bilder, und das Thema der Verarbeitung waren sphärische Panoramabilder von Google Street View. Der resultierende Satz von Algorithmen heißt Kreatismus - ein tiefes Lernsystem zur Erstellung künstlerischer Inhalte.

Die Autoren des Kreatismus, Hui Fang und Meng Zhang, glauben, dass sie eine Skala von Schönheitsbewertungen entwickelt haben, die Fotografen in Zukunft für objektive Vergleiche verwenden können. Basierend auf den Ergebnissen haben sie den sogenannten Turing-Test für Fotografen durchgeführt. Die Forscher luden Experten ein, eine Mischung der besten Bilder zu bewerten, die von Menschen aufgenommen und vom Kreatismus erstellt wurden, ganz zu schweigen davon, dass das Set von Maschinen erstellt wurde. 40% der Werke der künstlichen Intelligenz wurden mit "guten Bildern mit künstlerischem Geschmack" bewertet. Die Entwickler möchten jedem Amateurfotografen helfen, sein Foto ohne Filter und Einstellungen in ein schönes Bild zu verwandeln. Auf Knopfdruck starten Sie den Kreatismus.


Der Algorithmus brachte die Lichtdurchlässigkeit näher an die natürliche und die „tiefste“ und machte manchmal kleinere Panorama-Klebefehler, die auf diesem Foto zu sehen sind.

Probleme bei der Fotoübertragung


Die Matrix einer Digitalkamera kann nicht gleichzeitig Informationen in den dunklen Bereichen des Bildes erfassen, für die Sie mehr Belichtung (Verschlusszeit) benötigen, und im Licht, wo weniger Belichtung erfolgt. Der Dynamikbereich ist der Unterschied in den Belichtungsstufen zwischen den dunkelsten und hellsten Teilen des Bildes, die ohne Informationsverlust reproduziert werden können. In vollständig schwarzen Bereichen des Bildes (in überbelichteten) sowie in überbelichteten (unterbelichteten) Informationen ist eine Wiederherstellung nicht möglich. Dunkle Bereiche des Bildes können geklärt werden, jedoch mit Verzerrungen. Bei der HDR-Methode wird ein Bild aus mehreren Bildern, die mit unterschiedlichen Belichtungen aufgenommen wurden, in einer 32-Bit-Datei kombiniert.

Das Sehvermögen einer Person ist in der Lage, ein visuelles Bild mit einem Beleuchtungsunterschied von 10 bis 14 Grad bei hellem Sonnenlicht (in der Sonne kann sich die Pupille nicht an unterschiedliche Beleuchtungsgrade anpassen) und bei schwachem Licht von Sternen (die Pupille kann sich an den Lichtunterschied anpassen) mit bis zu 24 Schritten aufzunehmen. Wir können sehen, aber es kann schwierig sein, auch nur einen Teil dieses Bereichs auf dem Foto festzuhalten. Der Dynamikbereich eines gewöhnlichen Negativfilms beträgt etwa 9 bis 11 Belichtungsstufen, der Diafilm - 5 bis 6 Schritte, die Matrix einer Digitalkamera - für die meisten Digitalkameras 8 bis 11. Spezielle Kameras bieten 17 oder mehr Aufnahmeschritte. Es ist auch nicht einfach, einen echten Dynamikbereich zu spielen. Fotopapier kann beispielsweise nur 7-8 Belichtungsstufen reproduzieren.

Merkmale des Kreatismus


Für das Experiment wurden 15.000 professionelle Fotos von 500px.com mit einer Auflösung von mindestens 299 x 299 Pixel aufgenommen. Mit ihrer Hilfe haben die Entwickler dem Kreatismus beigebracht, die interessantesten in der Landschaft hervorzuheben. Basierend auf 40.000 kugelförmigen Panorama-Landschaften in den USA, Kanada und Europa wurde dem Algorithmus das Arbeiten mit Farbe und Licht beigebracht.

Dann wurde der Dynamikbereich für jedes Bild verstärkt und ein eigener Operations-Ausdrucksfilter angewendet, der Schatten, Beleuchtung und Farbe verbessert. Zu diesem Zweck haben wir traditionell für die Bildverarbeitung das generative kompetitive neuronale Netzwerkmodell verwendet - ein Modell, bei dem ein Teil des Programms die Qualität des Originals verschlechtert und der andere versucht, es wiederherzustellen, und lernt, wie es geht.



Um die endgültige Bewertungsskala zu erstellen, haben wir die AVA-Datenbank verwendet, in der 250.000 Bilder und vor allem eine Vielzahl von Metadaten enthalten sind, darunter eine große Anzahl ästhetischer Bewertungen für jedes Bild, semantische Beschriftungen in 60 Kategorien sowie Beschriftungen im Zusammenhang mit dem fotografischen Stil für die professionelle Sortierung.

Nach den Ergebnissen aller Verarbeitungsvorgänge wurden 400 Experimentfotos mit 800 AVA-Fotos gemischt und Experten übergeben.

Die Jury


Fotoexperten mit Berufsausbildung und mindestens 2 Jahren Erfahrung wurden gebeten, die Kategorie, in die das Bild gehört, zu bewerten und eine angemessene Bewertung abzugeben:

  1. Hergestellt von einer „Seifenkiste“ - wie sich herausstellte, passierte es. Keine Einstellungen, kein Fokus.
  2. Ein gutes Foto eines unerfahrenen Anfängers, aber der künstlerische Wert ist minimal.
  3. Semiprofessioneller Schuss. Der künstlerische Geschmack ist deutlich sichtbar.
  4. Von einem Fachmann gemacht.

Vom verarbeiteten Kreatismus fielen 40% der Bilder in die Kategorie von 3 bis 4 - das heißt, sie wurden als mindestens semiprofessionell anerkannt. Die durchschnittliche Punktzahl lag unter 3.

Forscher haben die besten vom Kreatismus verarbeiteten Aufnahmen veröffentlicht. Unter jedem wird zum Vergleich ein vollständiges Panorama gezeigt, aus dem es geschnitten wurde.

Source: https://habr.com/ru/post/de405419/


All Articles