🦇 👨🏼‍🍳 💍 Keterbatasan mendasar pembelajaran mesin 🚧 👥 🐆

Baru-baru ini, bibi saya mengirim email ke rekan-rekannya dengan tema “masalah matematika! Apa jawaban yang benar? " Surat itu memiliki teka-teki sederhana:

1 + 4 = 5
2 + 5 = 12
3 + 6 = 21
8 + 11 =?

Baginya, keputusan itu jelas. Tetapi rekan-rekannya memutuskan bahwa keputusan mereka benar - yang tidak sesuai dengan keputusannya. Apakah masalah dengan salah satu jawaban mereka, atau dengan teka-teki itu sendiri?

Bibiku dan rekan-rekannya menemukan masalah mendasar dari pembelajaran mesin, sebuah disiplin yang mempelajari komputer belajar. Hampir semua pelatihan yang kami harapkan dari komputer - dan yang kami lakukan sendiri - terdiri dari pengurangan informasi menjadi undang-undang dasar berdasarkan kesimpulan yang dapat ditarik tentang sesuatu yang tidak diketahui. Dan teka-tekinya sama.

Untuk seseorang, tugasnya adalah mencari pola apa saja. Tentu saja, intuisi kita membatasi rentang dugaan kita. Tetapi komputer tidak memiliki intuisi. Dari sudut pandang komputer, kesulitan dalam mengenali pola ada dalam kelimpahannya: jika ada jumlah tak terbatas dari pola yang sama-sama sah, karena yang mana ada yang benar dan ada yang tidak?

Dan masalah ini baru-baru ini pindah ke bidang praktis. Sampai tahun 1990-an, sistem AI umumnya jarang terlibat dalam pembelajaran mesin. Misalkan komputer catur Deep Thought, pendahulu Deep Blue, tidak belajar catur secara coba-coba. Alih-alih, grandmaster catur dan penyihir pemrograman dengan hati-hati menciptakan aturan yang dengannya seseorang bisa mengetahui apakah posisi catur itu baik atau buruk. Penyesuaian manual yang teliti ini adalah tipikal dari "sistem pakar" saat itu.

Untuk mengatasi misteri bibi saya menggunakan pendekatan sistem pakar, penting bagi seseorang untuk menyipit tiga baris contoh pertama dan perhatikan pola berikut di dalamnya:

1 * (4 + 1) = 5

2 * (5 +1) = 12

3 * (6 +1) = 21

Kemudian orang tersebut akan menginstruksikan komputer untuk mengikuti pola x * (y + 1) = z. Menerapkan aturan ini ke hasil terakhir, kami mendapatkan solusi - 96.

Terlepas dari keberhasilan awal sistem pakar, tenaga kerja manual yang dibutuhkan untuk mengembangkan, menyempurnakan dan memperbaruinya menjadi luar biasa. Sebaliknya, para peneliti menarik perhatian pada pengembangan mesin yang dapat mengenali pola sendiri. Program tersebut dapat, misalnya, memeriksa ribuan foto atau transaksi pasar dan memperolehnya dari sinyal statistik yang sesuai dengan orang yang ada di foto atau lonjakan harga pasar. Pendekatan ini dengan cepat menjadi dominan, dan sejak saat itu telah menjadi inti dari segalanya mulai dari penyortiran surat otomatis dan penyaringan spam hingga mendeteksi penipuan kartu kredit.

Tetapi, terlepas dari semua keberhasilan, sistem MO ini membutuhkan seorang programmer di suatu tempat dalam proses. Ambil contoh teka-teki dari bibiku. Kami berasumsi bahwa di setiap baris ada tiga komponen penting (tiga angka dalam satu baris). Tetapi ada elemen keempat yang potensial di dalamnya - hasil dari baris sebelumnya. Jika properti string ini valid, maka pola masuk akal lainnya muncul:

0 + 1 + 4 = 5

5 + 2 + 5 = 12

12 + 3 + 6 = 21

Menurut logika ini, jawaban akhirnya harus 40.

Keteraturan apa yang benar? Tentu, keduanya - dan bukan salah satu dari mereka. Itu semua tergantung pada pola apa yang diizinkan. Anda dapat, misalnya, membangun pola dengan mengambil angka pertama, mengalikannya dengan yang kedua, menambahkan seperlima dari jumlah jawaban sebelumnya dan tiga, dan membulatkannya ke bilangan bulat terdekat (sangat aneh, tetapi berfungsi). Dan jika kita mengizinkan penggunaan properti yang berkaitan dengan penampilan angka, mungkin ada urutan yang terkait dengan serif dan garis. Pencarian pola tergantung pada asumsi pengamat.

Hal yang sama berlaku untuk MO. Bahkan ketika mesin melatih diri mereka sendiri, pola yang disukai dipilih oleh orang-orang: haruskah perangkat lunak pengenalan wajah mengandung aturan eksplisit jika / kemudian, atau haruskah ia menganggap setiap fitur sebagai bukti tambahan yang mendukung atau melawan setiap orang yang mungkin menjadi milik orang tersebut? Fitur gambar apa yang harus ditangani oleh perangkat lunak? Apakah dia perlu bekerja dengan piksel individual? Atau mungkin dengan tepi antara area terang dan gelap? Pilihan opsi semacam itu membatasi pola apa yang dianggap sistem mungkin atau bahkan mungkin. Pencarian untuk kombinasi ideal ini adalah karya baru para spesialis di Kementerian Pertahanan Moskow.

gambar

Tetapi proses otomatisasi tidak berhenti di situ. Sama seperti programmer yang pernah disiksa untuk menulis aturan kerja, sekarang mereka enggan mengembangkan fitur baru. "Bukankah lebih baik jika komputer itu sendiri bisa mengetahui fitur apa yang dibutuhkannya?" Jadi mereka mengembangkan jaringan saraf pembelajaran mendalam, teknologi MO yang dapat secara independen menarik kesimpulan tentang properti tingkat tinggi berdasarkan informasi yang lebih sederhana. Beri makan satu set piksel ke jaringan saraf, dan itu akan belajar untuk memperhitungkan tepi akun, kurva, tekstur - dan semua ini tanpa instruksi langsung.

Jadi, para programmer kehilangan pekerjaan karena Satu Algoritma, Untuk Mengedit Semua Orang?

Belum. Jaringan saraf masih secara ideal tidak cocok untuk tugas apa pun. Bahkan dalam kasus terbaik, mereka harus disesuaikan. Jaringan saraf terdiri dari lapisan "neuron", yang masing-masing melakukan perhitungan berdasarkan input data dan output hasilnya ke lapisan berikutnya. Tetapi berapa banyak neuron yang dibutuhkan dan berapa banyak lapisan? Haruskah setiap neuron menerima input dari masing-masing neuron dari level sebelumnya, atau haruskah beberapa neuron lebih selektif? Transformasi apa yang harus dilakukan setiap neuron pada input data untuk menghasilkan hasilnya? Dan sebagainya.

Masalah-masalah ini membatasi upaya untuk menerapkan jaringan saraf pada tugas-tugas baru; jaringan saraf yang dengan sempurna mengenali wajah sepenuhnya tidak mampu menerjemahkan otomatis. Dan lagi, elemen-elemen struktural yang dipilih oleh manusia jelas mendorong jaringan menuju hukum-hukum tertentu, membawanya menjauh dari yang lain. Orang yang berpengetahuan memahami bahwa tidak semua hukum diciptakan sama. Programmer tidak akan dibiarkan tanpa pekerjaan.

Tentu saja, langkah logis berikutnya adalah jaringan saraf, secara independen menebak berapa banyak neuron yang harus dimasukkan, koneksi apa yang digunakan, dll. Proyek penelitian tentang hal ini telah berlangsung selama bertahun-tahun.

Seberapa jauh bisa? Akankah mobil belajar untuk bekerja sendiri dengan sangat baik sehingga penyetelan eksternal akan berubah menjadi peninggalan kuno? Secara teori, seseorang dapat membayangkan seorang siswa universal yang ideal - seseorang yang dapat menyelesaikan segalanya untuk dirinya sendiri, dan selalu memilih skema terbaik untuk tugas yang dipilih.

Tetapi pada tahun 1996, spesialis ilmu komputer David Walpert membuktikan ketidakmungkinan siswa seperti itu. Dalam "teorema tentang ketiadaan makan gratis" yang terkenal, ia menunjukkan bahwa untuk pola apa pun bahwa siswa terlatih dengan baik, ada pola yang akan ia pelajari dengan sangat. Ini mengembalikan kita pada misteri bibi saya - ke jumlah pola yang tak terbatas yang dapat muncul dari data yang terbatas. Pilihan algoritme pelatihan berarti pemilihan pola yang akan dihadapi mesin dengan buruk. Mungkin semua tugas, misalnya, pengenalan pola, pada akhirnya akan jatuh ke dalam satu algoritma yang komprehensif. Tetapi tidak ada algoritma pembelajaran yang dapat mempelajari semuanya dengan baik.

Ini membuat pembelajaran mesin terlihat seperti otak manusia. Meskipun kita suka menganggap diri kita pintar, otak kita juga tidak belajar dengan sempurna. Setiap bagian otak disetel secara hati-hati oleh evolusi untuk mengenali pola-pola tertentu - baik itu yang kita lihat, bahasa yang kita dengar, atau perilaku objek fisik. Tapi kami tidak melakukannya dengan baik dengan mencari pola di pasar saham; di sini mesin mengalahkan kita.

Sejarah pembelajaran mesin memiliki banyak pola. Tetapi yang paling mungkin adalah sebagai berikut: kami akan melatih mesin untuk belajar selama bertahun-tahun lagi.

Keterbatasan mendasar pembelajaran mesin

More articles: