Apakah jaringan saraf memimpikan kabel listrik?

Jika Anda menggunakan Internet, Anda harus berinteraksi dengan jaringan saraf. Ini adalah bentuk algoritma pembelajaran mesin yang digunakan di banyak bidang, dari terjemahan bahasa ke pemodelan keuangan. Salah satu spesialisasi dari pendekatan ini adalah pengenalan gambar. Beberapa perusahaan - termasuk Google, Microsoft, IBM dan Facebook - telah mengembangkan algoritma tata letak foto mereka sendiri. Tetapi sementara algoritma ini dapat membuat kesalahan yang sangat aneh.


Microsoft Azure API untuk visi komputer menambahkan keterangan di bawah ini pada gambar ini: "sekawanan domba merumput di lereng bukit yang ditutupi dengan vegetasi yang rimbun," dan tag: "tergores, domba, gunung, ternak, kuda." Tetapi tidak ada domba di foto. Umumnya. Saya mempelajari setiap tempat.


Tag: rumput, bidang, domba, berdiri, pelangi, manusia

Di foto ini, komputer juga melihat domba. Secara kebetulan, saya tahu ada domba yang merumput di dekat tempat ini. Tetapi mereka tidak terlihat di foto.


tag: lereng bukit, tergores, domba, jerapah, kawanan

Ini adalah contoh lain. Jaringan saraf umumnya membayangkan domba setiap kali dia melihat gambar seperti itu. Apa yang sedang terjadi

Jaringan saraf dilatih oleh pemrosesan banyak contoh. Dalam hal ini, dia diberi banyak gambar yang ditandai oleh orang-orang secara manual - dan ada banyak domba di sana. Dimulai dengan kurangnya pengetahuan tentang apa yang Anda lihat, jaringan saraf perlu membuat aturan yang menurut gambar mana harus diberi label "domba". Rupanya, dia tidak mengerti bahwa kata "domba" berarti binatang, dan bukan hanya rumput tanpa pohon. Dalam cara yang mirip dengan foto kedua dia memberi label "pelangi", karena lanskap itu basah dan hujan, tidak menyadari bahwa pelangi membutuhkan strip multi-warna.

Mungkin jaringan saraf terlalu sensitif, dan mereka melihat domba di mana-mana? Ternyata tidak. Mereka melihat domba hanya ketika mereka berharap untuk melihat mereka. Mereka dengan mudah menemukan domba di ladang dan di lereng gunung, tetapi segera setelah domba mulai muncul di tempat yang tak terduga, menjadi jelas seberapa banyak algoritma ini bergantung pada tebakan dan probabilitas.

Bawa domba ke kamar, dan dia akan ditunjuk sebagai kucing. Angkat domba atau kambing di tangan Anda dan mereka akan menandainya sebagai anjing.


β€œKiri: seorang pria memegang seekor anjing di tangannya. Kanan: seorang wanita memegang seekor anjing di tangannya. ”

Cat mereka oranye dan mereka akan menjadi bunga.


"Beberapa bunga oranye di ladang"

Letakkan domba di tali dan mereka akan menunjuknya sebagai anjing. Masukkan dia ke dalam mobil dan itu akan menjadi anjing atau kucing. Jika mereka memasuki air, mereka dapat dicatat sebagai burung atau bahkan beruang kutub.

Dan jika kambing memanjat pohon, mereka akan berubah menjadi burung. Atau jerapah (ternyata Microsoft Azure terkenal karena melihat jerapah di mana-mana karena banyaknya jerapah yang dikabarkan dalam kumpulan data awal).


NeuralTalk2: sekawanan burung terbang di udara
Microsoft Azure: beberapa jerapah berdiri di sebelah pohon

Jaringan saraf mengkorelasikan pola. Mereka melihat potongan-potongan tekstur yang mirip dengan bulu, bercak hijau, dan memutuskan bahwa ada domba dalam gambar. Jika mereka melihat bulu dan bentuk menyerupai dapur, mereka mungkin memutuskan bahwa mereka melihat kucing.

Jika kehidupan mengikuti aturan, pengenalan gambar berfungsi sebagaimana mestinya. Tetapi begitu orang atau domba melakukan sesuatu yang tidak terduga, algoritme segera menunjukkan kelemahan.

Jika Anda ingin membawa sesuatu tanpa diketahui melewati jaringan saraf, maka Anda akan terbantu dalam gaya cyberpunk oleh surealisme. Mungkin di masa depan, agen rahasia akan berpakaian seperti ayam atau mengendarai mobil yang bernoda seperti sapi.

Ada banyak contoh kesalahan sangat lucu di utas Twitter yang dimulai dengan pertanyaan sederhana:


Dan Anda sendiri dapat menguji operasi API untuk pengenalan pola dari Microsoft Azure dan memastikan bahwa bahkan algoritma yang paling maju pun bergantung pada keberuntungan dan probabilitas. Algoritme lain, NeuralTalk2, kebanyakan saya gunakan untuk memproses gambar dari utas komentar ini di Twitter.

Source: https://habr.com/ru/post/id411401/


All Articles