
Karya baru Google menawarkan arsitektur jaringan saraf yang dapat mensimulasikan naluri bawaan dan refleks makhluk hidup, diikuti dengan pelatihan lebih lanjut sepanjang hidup.
Dan juga secara signifikan mengurangi jumlah koneksi dalam jaringan, sehingga meningkatkan kecepatannya.
Jaringan saraf tiruan, meskipun secara prinsip mirip dengan yang biologis, masih terlalu berbeda dari mereka untuk digunakan dalam bentuk murni untuk membuat AI yang kuat. Misalnya, sekarang tidak mungkin untuk membuat model seseorang (atau tikus, atau bahkan serangga) dalam simulator, memberinya "otak" dalam bentuk jaringan saraf modern dan melatihnya. Itu tidak bekerja.
Bahkan setelah membuang perbedaan dalam mekanisme pembelajaran (di otak tidak ada analog yang tepat dari algoritma propagasi kesalahan kembali, misalnya) dan kurangnya korelasi waktu multiskala, atas dasar di mana otak biologis membangun pekerjaannya, jaringan saraf tiruan memiliki beberapa masalah lagi yang tidak memungkinkan mereka untuk mensimulasikan secara memadai otak yang hidup. Mungkin karena masalah yang melekat pada alat matematika yang digunakan sekarang, Reinforcement Learning, yang dirancang untuk meniru pelatihan makhluk hidup berdasarkan hadiah, tidak bekerja sebaik yang kita inginkan dalam praktik. Meskipun didasarkan pada ide yang sangat bagus dan benar. Para pengembang sendiri bercanda bahwa otaknya adalah RNN + A3C (yaitu, algoritma jaringan + aktor-kritik berulang untuk pelatihannya).
Salah satu perbedaan yang paling mencolok antara otak biologis dan jaringan saraf tiruan adalah bahwa struktur otak yang hidup telah dikonfigurasikan oleh jutaan tahun evolusi. Meskipun neokorteks, yang bertanggung jawab atas aktivitas saraf yang lebih tinggi pada mamalia, memiliki struktur yang hampir seragam, struktur umum otak secara jelas didefinisikan oleh gen. Selain itu, hewan selain mamalia (burung, ikan) tidak memiliki neokorteks sama sekali, tetapi pada saat yang sama mereka menunjukkan perilaku kompleks yang tidak dapat dicapai oleh jaringan saraf modern. Seseorang juga memiliki keterbatasan fisik dalam struktur otak, yang sulit dijelaskan. Misalnya, resolusi satu mata adalah sekitar 100 megapiksel (~ 100 juta batang dan kerucut fotosensitif), yang berarti bahwa dari dua mata aliran video harus sekitar 200 megapiksel dengan frekuensi setidaknya 15 frame per detik. Namun pada kenyataannya, saraf optik mampu melewati dirinya sendiri tidak lebih dari 2-3 megapiksel. Dan hubungannya tidak diarahkan sama sekali ke bagian terdekat dari otak, tetapi ke bagian oksipital ke korteks visual.
Oleh karena itu, tanpa mengurangi pentingnya neokorteks (secara kasar, dapat dianggap saat lahir sebagai analog dari jaringan saraf modern yang diprakarsai secara acak), fakta menunjukkan bahwa bahkan pada manusia struktur otak yang telah ditetapkan memainkan peran besar. Misalnya, jika bayi baru beberapa menit menunjukkan lidahnya, maka berkat neuron cermin, ia juga akan menjulurkan lidahnya. Hal yang sama terjadi dengan tawa anak-anak. Sudah diketahui bahwa bayi sejak lahir telah "dijahit" dengan pengakuan wajah manusia yang luar biasa. Tetapi yang lebih penting, sistem saraf semua makhluk hidup dioptimalkan untuk kondisi kehidupan mereka. Bayi tidak akan menangis berjam-jam jika lapar. Dia akan lelah. Atau takut akan sesuatu dan tutup mulut. Rubah tidak akan mencapai kelelahan sampai mencapai kelaparan untuk anggur yang tidak dapat diakses. Dia akan melakukan beberapa upaya, memutuskan bahwa dia pahit dan pergi. Dan ini bukan proses belajar, tetapi perilaku yang ditentukan oleh biologi. Selain itu, spesies yang berbeda memiliki perbedaan. Beberapa predator segera mencari mangsa, sementara yang lain duduk dalam penyergapan untuk waktu yang lama. Dan mereka belajar ini bukan melalui coba-coba, tetapi itulah biologi mereka, yang diberikan oleh naluri. Demikian juga, banyak hewan telah menghubungkan program penghindaran predator sejak menit pertama kehidupan, meskipun secara fisik mereka belum dapat mempelajarinya.
Secara teoritis, metode modern untuk melatih jaringan saraf dapat dari jaringan yang sepenuhnya terhubung untuk menciptakan kesamaan otak yang sudah dilatih sebelumnya, menghilangkan koneksi yang tidak perlu (pada kenyataannya, memutus sambungan) dan hanya menyisakan yang diperlukan saja. Tetapi ini membutuhkan sejumlah besar contoh, tidak diketahui bagaimana melatihnya, dan yang paling penting - saat ini tidak ada cara yang baik untuk memperbaiki struktur otak "awal" ini. Pelatihan selanjutnya mengubah bobot ini dan semuanya memburuk.
Peneliti dari Google juga menanyakan pertanyaan ini. Apakah mungkin untuk membuat struktur otak awal yang mirip dengan struktur biologis, yaitu, sudah dioptimalkan dengan baik untuk menyelesaikan masalah, dan kemudian hanya melatihnya kembali? Secara teoritis, ini akan secara dramatis mempersempit ruang solusi dan memungkinkan Anda untuk dengan cepat melatih jaringan saraf.
Sayangnya, algoritma optimisasi struktur jaringan yang ada, seperti Neural Architecture Search (NAS), beroperasi pada seluruh blok. Setelah menambah atau menghapus yang mana, jaringan saraf harus dilatih lagi dari awal. Ini adalah proses yang intensif sumber daya dan tidak sepenuhnya menyelesaikan masalah.
Oleh karena itu, para peneliti mengusulkan versi yang disederhanakan, yang disebut "Weight Agnostic Neural Networks" (WANN). Idenya adalah untuk mengganti semua bobot jaringan saraf dengan satu bobot "umum". Dan dalam proses pembelajaran, ini bukan untuk memilih bobot antar neuron, seperti pada jaringan saraf biasa, tetapi untuk memilih struktur jaringan itu sendiri (jumlah dan lokasi neuron), yang dengan bobot yang sama menunjukkan hasil terbaik. Dan setelah itu, optimalkan sehingga jaringan bekerja dengan baik dengan semua nilai yang mungkin dari berat total ini (umum untuk semua koneksi antar neuron!).
Akibatnya, ini memberikan struktur jaringan saraf, yang tidak tergantung pada bobot tertentu, tetapi bekerja dengan baik dengan semua orang. Karena berfungsi karena struktur jaringan keseluruhan. Ini mirip dengan otak hewan yang belum diinisialisasi dengan sisik tertentu saat lahir, tetapi sudah mengandung naluri tertanam karena struktur umumnya. Dan fine-tuning skala berikutnya selama pelatihan sepanjang hidup, membuat jaringan saraf ini lebih baik.
Efek positif samping dari pendekatan ini adalah penurunan signifikan dalam jumlah neuron dalam jaringan (karena hanya koneksi yang paling penting yang tersisa), yang meningkatkan kecepatannya. Di bawah ini adalah perbandingan kompleksitas jaringan saraf klasik yang sepenuhnya terhubung (kiri) dan yang baru (kanan) yang cocok.

Untuk mencari arsitektur seperti itu, peneliti menggunakan algoritma pencarian Topologi (NEAT). Pertama, satu set jaringan saraf sederhana dibuat, dan kemudian satu dari tiga tindakan dilakukan: neuron baru ditambahkan ke koneksi yang ada antara dua neuron, koneksi baru dengan yang acak ditambahkan ke neuron lain, atau fungsi aktivasi di neuron berubah (lihat gambar di bawah). Dan kemudian, tidak seperti NAS klasik, di mana bobot optimal antara neuron dicari, di sini semua bobot diinisialisasi dengan satu angka tunggal. Dan optimasi dilakukan untuk menemukan struktur jaringan yang bekerja paling baik dalam berbagai nilai dari berat total satu ini. Dengan demikian, jaringan diperoleh yang tidak tergantung pada berat spesifik antara neuron, tetapi bekerja dengan baik di seluruh rentang (tetapi semua bobot masih diprakarsai oleh satu angka, dan tidak berbeda seperti pada jaringan normal). Selain itu, sebagai tujuan tambahan untuk optimasi, mereka mencoba untuk meminimalkan jumlah neuron dalam jaringan.

Di bawah ini adalah garis besar umum dari algoritma.

- menciptakan populasi jaringan saraf sederhana
- setiap jaringan menginisialisasi semua bobotnya dengan satu angka, dan untuk berbagai angka: w = -2 ... + 2
- jaringan yang dihasilkan diurutkan berdasarkan kualitas solusi untuk masalah dan oleh jumlah neuron (turun)
- di bagian perwakilan terbaik, satu neuron ditambahkan, satu koneksi atau fungsi aktivasi dalam satu neuron berubah
- jaringan yang dimodifikasi ini digunakan sebagai inisial dalam poin 1)
Semua ini baik, tetapi ratusan, jika tidak ribuan ide berbeda telah diusulkan untuk jaringan saraf. Apakah ini berhasil dalam praktek? Ya itu. Di bawah ini adalah contoh hasil pencarian arsitektur jaringan untuk masalah troli pendulum klasik. Seperti yang dapat dilihat dari gambar, jaringan saraf bekerja dengan baik dengan semua varian berat total (lebih baik dengan +1.0, tetapi juga mencoba mengangkat pendulum dari -1.5). Dan setelah mengoptimalkan berat tunggal ini, mulai bekerja dengan sempurna sempurna (opsi Bobot Halus pada gambar).

Biasanya, Anda dapat melatih ulang sebagai berat total tunggal ini, karena pemilihan arsitektur dilakukan pada sejumlah parameter diskrit terbatas (dalam contoh di atas -2, -1,1,2). Dan Anda bisa mendapatkan parameter optimal yang lebih akurat, katakanlah, 1,5. Dan Anda dapat menggunakan berat total terbaik sebagai titik awal untuk melatih kembali semua bobot, seperti dalam pelatihan klasik jaringan saraf.
Ini mirip dengan bagaimana hewan dilatih. Memiliki naluri yang mendekati optimal saat lahir, dan menggunakan struktur otak ini yang diberikan oleh gen sebagai yang pertama, selama perjalanan hidup mereka, hewan melatih otak mereka dalam kondisi eksternal tertentu. Lebih detail dalam artikel terbaru di jurnal Nature .
Di bawah ini adalah contoh jaringan yang ditemukan oleh WANN untuk tugas kontrol mesin berbasis pixel. Harap dicatat bahwa ini adalah tumpangan pada "naluri telanjang", dengan berat total yang sama di semua persendian, tanpa penyetelan klasik semua bobot. Pada saat yang sama, jaringan saraf sangat sederhana dalam struktur.


Para peneliti menyarankan untuk membuat ansambel dari jaringan WANN sebagai kasus penggunaan lain untuk WANN. Jadi, jaringan saraf yang diinisialisasi secara acak yang biasa pada MNIST menunjukkan akurasi sekitar 10%. Jaringan saraf tunggal WANN yang dipilih menghasilkan sekitar 80%, tetapi ansambel dari WANN dengan bobot total yang berbeda menunjukkan sudah> 90%.
Akibatnya, metode yang diusulkan oleh para peneliti Google untuk mencari arsitektur awal dari jaringan saraf yang optimal tidak hanya meniru pembelajaran hewan (lahir dengan insting optimal dan pelatihan ulang selama hidup), tetapi juga menghindari simulasi seluruh kehidupan hewan dengan pembelajaran penuh dari seluruh jaringan dalam algoritma evolusi klasik, menciptakan Jaringan sederhana dan cepat sekaligus. Yang cukup hanya sedikit melatih untuk mendapatkan jaringan saraf yang sepenuhnya optimal.
Referensi
- Entri Blog Google AI
- Artikel interaktif di mana Anda dapat mengubah berat total dan memantau hasilnya
- Artikel alam tentang pentingnya naluri tertanam saat lahir