Was durchbohrt die KI, wenn sie menschliche Gesichter erzeugt?

Im Jahr 2014 brachte der Forscher fĂŒr maschinelles Lernen, Jan Goodfellow, die Idee generativer Konfliktnetzwerke oder GANs vor. "GenerativitĂ€t" besteht in der Tatsache, dass das Ergebnis ihrer Arbeit Bilder und keine Bewertung des Inputs (wie "Hot Dog oder nicht") und "WettbewerbsfĂ€higkeit" sind - dass zwei neuronale Netze Katz und Maus wie Feds mit FĂ€lschern spielen : Ein neuronales Netzwerk versucht, das andere zu tĂ€uschen, indem es realistische Bilder erstellt, und das zweite versucht, FĂ€lschungen zu unterscheiden.

Die ersten GAN-Bilder waren leicht zu identifizieren. Schauen Sie sich diese Gesichter von 2014 an .


„Lehrerloses Lernen zur ReprĂ€sentation mit tief konvolutionellen generativen Wettbewerbsnetzwerken“ (2014), Radford et al., Auch bekannt als DCGAN

Die zuletzt generierten Gesichter aus dem Oktober 2017 sind jedoch bereits schwerer zu identifizieren.


„Progressives GAN-Wachstum zur Verbesserung von QualitĂ€t, StabilitĂ€t und Vielfalt“ (2017), Karras et al. Auch bekannt als PGAN oder ProGAN

Hier sind einige der Funktionen der Bilder, die das GAN generiert hat. Wir konzentrieren uns auf Gesichter, weil sie ein gemeinsames Testfeld fĂŒr Forscher sind und viele der sichtbarsten Artefakte in anderen Bildtypen auftreten.

Glattes Haar sieht aus wie Farbe




Langes Haar sieht oft mit geraden StrĂ€hnen hypertrophiert aus, als hĂ€tte jemand mit einem Spachtel oder einer riesigen BĂŒrste ein BĂŒndel Acryl verschmiert.

Der Text ist nicht entschlĂŒsselbar




Wenn die GAN auf Gesichtern trainiert, ist es fĂŒr sie schwierig, seltene strukturierte Objekte im Hintergrund zu finden. DarĂŒber hinaus werden GANs sowohl fĂŒr Standard- als auch fĂŒr Spiegelversionen von Bildern geschult, was zu Problemen bei der Modellierung von Text fĂŒhrt, der normalerweise nur in einer Ausrichtung angezeigt wird.

Surrealer Hintergrund




Einer der GrĂŒnde, warum die erzeugten Gesichter glaubwĂŒrdig aussehen, ist, dass alle Trainingsbilder zentriert waren. Dies verringert die Variation bei der Erzeugung von beispielsweise Augen und Ohren. Andererseits kann der Hintergrund alles enthalten. Die Modellierung ist zu schwierig, daher repliziert das neuronale Netzwerk letztendlich die allgemeinen Hintergrundtexturen und nicht die „echten“ Hintergrundszenen.

Asymmetrie




Ein GAN kann Schwierigkeiten haben, weit entfernte AbhĂ€ngigkeiten zu verwalten. Beispielsweise stimmen gepaarte Accessoires wie Ohrringe normalerweise im Datensatz ĂŒberein, nicht jedoch in den erstellten Bildern. Die Augen auf diesen Fotografien schauen normalerweise in die gleiche Richtung und normalerweise in die gleiche Farbe, und die erzeugten Gesichter leiden hĂ€ufig unter Strabismus und Heterochromie. Asymmetrie tritt hĂ€ufig an den Ohren unterschiedlicher Höhe oder GrĂ¶ĂŸe auf.

Seltsame ZĂ€hne




GANs können eine gemeinsame Szene zusammenstellen, haben jedoch derzeit Schwierigkeiten mit sich regelmĂ€ĂŸig wiederholenden Details wie ZĂ€hnen. Manchmal gibt die GAN krumme ZĂ€hne aus, streckt oder knirscht einzelne ZĂ€hne auf seltsame Weise. Historisch gesehen hat sich dieses Problem in anderen Bereichen manifestiert, beispielsweise in der Synthese von Texturen mit Bildern wie Ziegeln.

Chaotisches Haar




Dies ist eine der schnellsten Methoden, um ein gefĂ€lschtes Bild zu erkennen. In der Regel sammelt das GAN Haare zu Klumpen, bildet zufĂ€llige BĂŒndel um die Schultern und wirft dicken Zottel auf die Stirn. Echte Frisuren sind sehr vielfĂ€ltig und detailliert, was sie zu einem der schwierigsten Objekte fĂŒr eine realistische GAN-Generierung macht. Fremdkörper können manchmal zu haarigen Texturen werden.

UnverstÀndlicher Boden




Diese GAN wurde in der CelebA-Suite mit 200.000 Bildern von 10.000 Prominenten trainiert. In diesem Set traf ich niemanden mit Gesichtsbehaarung, Ohrringen und Make-up gleichzeitig; Das GAN mischt jedoch regelmĂ€ĂŸig die typischen Attribute verschiedener Geschlechter. Im Allgemeinen denke ich, dass dies auf die Tatsache zurĂŒckzufĂŒhren ist, dass die GAN nicht immer eine Vorstellung von den entgegengesetzten binĂ€ren Kategorien bekommt, die in der menschlichen Gesellschaft akzeptiert werden (in diesem Fall „Mann gegen Frau“).

HalbregelmĂ€ĂŸiger LĂ€rm




Anstelle eines monochromen Hintergrunds können einige Bereiche halbregelmĂ€ĂŸiges Rauschen mit horizontalen oder vertikalen Streifen empfangen. In den oben genannten FĂ€llen versucht das Netzwerk wahrscheinlich, die Textur des Gewebes nachzuahmen. Ältere GANs erzeugen ein viel stĂ€rker wahrnehmbares Rauschen, das normalerweise als Schachartefakte bezeichnet wird .

Regenbogenfackel




Einige Bereiche mit einer leichten festen FĂŒllung erhalten eine mehrfarbige Fackel: Dies sind Kragen, HĂ€lse und weiße Augen (hier nicht gezeigt).

Beispiele fĂŒr reale Bilder




Achten Sie auf einen klaren Hintergrund, Text, gepaarte Ohrringe, gleich große ZĂ€hne und detaillierte Frisuren. Wenn Sie alle GAN-Tricks kennen, versuchen Sie, das Spiel zu spielen und zu ĂŒberprĂŒfen, wie Sie echte Gesichter von falschen unterscheiden. Hinweis: Einige haben Probleme mit der SchaltflĂ€che Start .

Source: https://habr.com/ru/post/de432580/


All Articles