Apa yang ditembus AI saat menghasilkan wajah manusia

Pada 2014, peneliti pembelajaran mesin Jan Goodfellow mengemukakan gagasan jaringan pertentangan generatif atau GAN. "Generativeness" terdiri dari kenyataan bahwa hasil pekerjaan mereka adalah gambar, dan bukan penilaian input (seperti "hot dog atau tidak"), dan "daya saing" - bahwa dua jaringan saraf bermain kucing dan tikus seperti feds dengan pemalsu. : satu jaringan saraf mencoba untuk menipu yang lain dengan membuat gambar yang realistis, dan yang kedua mencoba untuk membedakan palsu.

Gambar GAN pertama mudah diidentifikasi. Lihatlah wajah-wajah tahun 2014 ini .


"Pembelajaran tanpa guru untuk Representasi dengan Deep Competitivevolucative Competitive Networks" (2014), Radford et al. Juga dikenal sebagai DCGAN

Tetapi wajah yang dihasilkan terakhir dari Oktober 2017 sudah lebih sulit untuk diidentifikasi.


"Pertumbuhan GAN Progresif untuk Meningkatkan Kualitas, Stabilitas dan Keanekaragaman" (2017), Karras dkk. Juga dikenal sebagai PGAN atau ProGAN

Berikut adalah beberapa fitur gambar yang dihasilkan GAN. Kami fokus pada wajah karena merupakan tempat uji yang umum bagi para peneliti, dan banyak artefak yang paling terlihat muncul dalam jenis gambar lainnya.

Rambut lurus terlihat seperti cat




Rambut panjang sering terlihat hipertrofi dengan helai lurus, seolah-olah seseorang mengolesi seikat akrilik dengan pisau palet atau kuas besar.

Teks tidak dapat didekripsi




Jika GAN dilatih pada wajah, maka sulit baginya untuk menemukan objek terstruktur yang langka di latar belakang. Selain itu, GAN dilatih pada versi gambar standar dan cermin, yang mengarah ke masalah saat memodelkan teks, yang biasanya ditampilkan hanya dalam satu orientasi.

Latar belakang nyata




Salah satu alasan mengapa wajah yang dihasilkan terlihat dapat dipercaya adalah karena semua gambar pelatihan dipusatkan. Ini mengurangi variasi dalam generasi, misalnya, mata dan telinga. Di sisi lain, latar belakang bisa berisi apa saja. Ini terlalu sulit untuk dimodelkan, sehingga jaringan saraf akhirnya mereplikasi tekstur latar belakang umum, daripada adegan latar belakang "nyata".

Asimetri




GAN mungkin mengalami kesulitan mengelola ketergantungan yang jauh. Misalnya, aksesori yang dipasangkan, seperti anting-anting, biasanya cocok dengan dataset, tetapi tidak pada gambar yang dibuat. Mata dalam foto-foto ini biasanya melihat ke arah yang sama dan biasanya warna yang sama, dan wajah yang dihasilkan sering menderita strabismus dan heterokromia. Asimetri sering muncul pada telinga dengan ketinggian atau ukuran yang berbeda.

Gigi aneh




GAN dapat menyatukan pemandangan umum, tetapi saat ini mengalami kesulitan dengan detail berulang semi-reguler seperti gigi. Kadang-kadang GAN mengeluarkan gigi bengkok, meregangkan atau mengepalkan gigi individu dengan cara yang aneh. Secara historis, masalah ini telah memanifestasikan dirinya di bidang lain, seperti sintesis tekstur dengan gambar seperti batu bata.

Rambut acak-acakan




Ini adalah salah satu cara tercepat untuk mengenali gambar palsu. Sebagai aturan, GAN mengumpulkan rambut menjadi benjolan, membuat bundel acak di sekitar bahu dan melempar rambut tebal ke dahi. Gaya rambut asli sangat bervariasi dan terperinci, menjadikannya salah satu objek paling sulit untuk generasi GAN realistis. Benda asing terkadang bisa berubah menjadi tekstur berbulu.

Lantai yang tidak bisa dipahami




GAN ini dilatih di suite CelebA dengan 200.000 gambar 10.000 selebriti. Pada set ini saya tidak bertemu siapa pun dengan rambut wajah, anting-anting, dan makeup pada saat yang sama; tetapi GAN secara teratur mencampur atribut khas dari jenis kelamin yang berbeda. Secara umum, saya pikir ini disebabkan oleh fakta bahwa GAN tidak selalu mendapatkan gagasan tentang kategori biner yang berlawanan yang diterima dalam masyarakat manusia (dalam hal ini, "pria versus wanita").

Kebisingan semi-reguler




Alih-alih latar belakang monokrom, beberapa area mungkin menerima derau semi-reguler dengan garis-garis horizontal atau vertikal. Dalam kasus di atas, jaringan mungkin mencoba meniru tekstur kain. GAN yang lebih lama menghasilkan suara yang jauh lebih terlihat, yang biasanya digambarkan sebagai artefak catur .

Suar pelangi




Beberapa area dengan isi padatan ringan menerima suar multi-warna: ini adalah kerah, leher, dan mata putih (tidak diperlihatkan di sini).

Contoh gambar nyata




Perhatikan latar belakang yang jelas, teks, anting-anting yang dipasangkan, gigi dengan ukuran yang sama, gaya rambut terperinci. Mengetahui semua trik GAN, cobalah memainkan permainan dan periksa bagaimana Anda membedakan wajah asli dari yang palsu. Catatan: beberapa memiliki masalah dengan tombol Start .

Source: https://habr.com/ru/post/id432580/


All Articles