Sistem visi mesin dapat mengenali wajah pada tingkat yang sama dengan orang-orang dan bahkan membuat wajah buatan yang realistis. Tetapi para peneliti menemukan bahwa sistem ini tidak dapat mengenali ilusi optik, dan karenanya, membuat yang baru.

Penglihatan manusia adalah perangkat yang luar biasa. Meskipun telah berkembang di lingkungan tertentu selama jutaan tahun, ia mampu melakukan tugas yang tidak pernah menemukan sistem visual awal. Contoh yang baik adalah membaca, atau mendefinisikan benda buatan - mobil, pesawat terbang, rambu lalu lintas, dll.
Tetapi sistem visual memiliki serangkaian kelemahan yang kita kenal sebagai ilusi optik. Para peneliti telah mengidentifikasi banyak pilihan di mana ilusi ini menyebabkan orang salah menilai warna, ukuran, posisi relatif dan pergerakan.
Ilusi itu sendiri menarik karena memberikan gagasan tentang sifat sistem visual dan persepsi. Karena itu, akan sangat berguna untuk menemukan cara untuk menemukan ilusi baru yang akan membantu mempelajari keterbatasan sistem ini.
Lingkaran konsentris?Di sini kita harus mengikuti pelatihan mendalam yang praktis. Dalam beberapa tahun terakhir, mesin telah belajar mengenali objek dan wajah dalam gambar, dan kemudian membuat gambar serupa. Mudah dibayangkan bahwa sistem visi mesin harus mampu mengenali ilusi dan menciptakan ilusinya sendiri.
Di sini Robert Williams dan Roman Yampolsky dari University of Louisville di Kentucky naik panggung. Orang-orang ini
mencoba mendongkrak hal seperti itu , tetapi ternyata semuanya tidak sesederhana itu. Sistem pembelajaran mesin yang ada tidak mampu memberikan ilusi optik mereka sendiri - setidaknya belum. Kenapa begitu?
Pertama, informasi umum. Kemajuan terbaru dalam pembelajaran mendalam didasarkan pada dua terobosan. Yang pertama adalah ketersediaan jaringan saraf yang kuat dan beberapa trik perangkat lunak yang memungkinkan mereka untuk belajar dengan baik.
Yang kedua adalah pembuatan database mark-up yang besar dalam hal volume, atas dasar yang dapat dipelajari mesin. Misalnya, untuk mengajarkan mesin mengenali wajah, dibutuhkan puluhan ribu gambar berisi wajah yang ditandai dengan jelas. Dengan informasi ini, jaringan saraf dapat belajar mengenali pola karakteristik wajah - dua mata, hidung, dan mulut. Bahkan lebih mengesankan, sepasang jaringan - yang disebut
Generative-competitive network (GSS) - mampu saling mengajarkan cara membuat gambar wajah yang realistis dan sepenuhnya buatan.
Williams dan Yampolsky disusun untuk mengajarkan jaringan saraf untuk menentukan ilusi optik. Kapasitas komputasi sudah cukup, dan tidak ada cukup basis data yang sesuai. Oleh karena itu, tugas pertama mereka adalah membuat basis data ilusi optik untuk pelatihan.
Ternyata sulit dilakukan. "Hanya ada beberapa ribu ilusi optik statis, dan jumlah jenis ilusi unik sangat kecil - mungkin beberapa lusin," kata mereka.
Dan ini merupakan hambatan serius bagi sistem pembelajaran mesin modern. βMenciptakan model yang dapat belajar dari kumpulan data yang begitu kecil dan terbatas akan menjadi lompatan besar untuk model generatif dan pemahaman tentang visi manusia,β kata mereka.
Oleh karena itu, Williams dan Yampolsky mengumpulkan database lebih dari 6.000 gambar ilusi optik, dan melatih jaringan saraf untuk mengenalinya. Kemudian mereka menciptakan GSS, yang secara independen harus menciptakan ilusi optik.
Hasilnya mengecewakan mereka. "Setelah tujuh jam pelatihan tentang Nvidia Tesla K80, tidak ada nilai yang diciptakan," kata peneliti, yang membuka database untuk digunakan semua orang.
Namun hasilnya menarik. "Satu-satunya ilusi optik yang diketahui oleh kita diciptakan oleh evolusi (misalnya, pola mata pada sayap kupu-kupu) atau seniman manusia," kata mereka. Dan dalam kedua kasus, orang memainkan peran penting dalam memberikan umpan balik - orang dapat melihat ilusi.
Dan sistem visi mesin tidak bisa. "GSS tidak mungkin belajar bagaimana menipu visi tanpa memahami prinsip-prinsip yang mendasari ilusi," kata Williams dan Yampolsky.
Ini bisa jadi menantang, karena ada perbedaan kritis antara sistem visual manusia dan mesin. Banyak peneliti membuat jaringan saraf yang bahkan lebih mengingatkan pada sistem visual manusia. Mungkin salah satu pemeriksaan menarik untuk sistem ini adalah apakah mereka dapat melihat ilusi.
Sementara itu, Williams dan Yampolsky tidak optimis: "Rupanya, kumpulan data dengan ilusi mungkin tidak cukup untuk membuat ilusi baru," kata mereka. Jadi untuk saat ini, ilusi optik tetap menjadi benteng persepsi manusia, bukan milik mesin.