DeepMind menciptakan komputer yang belajar menggunakan memorinya



DeepMind telah mengembangkan AI jenis baru yang dapat mempelajari cara menggunakan memorinya sendiri. Proyek ini disebut " Komputer Neural Diferensial " (Differential Neural Computer, atau DNC).

Apa konsekuensi dari proyek yang tujuannya adalah untuk "mengajar" komputer untuk menggunakan ingatannya sendiri? Hal utama adalah bahwa bentuk AI yang lemah menjadi lebih efektif dari sebelumnya. Sebagai contoh, sistem seperti itu dapat membantu seseorang bergerak di kota yang sama sekali asing tanpa sedikitpun ketidaknyamanan.


Ilustrasi arsitektur DNC. Pengontrol jaringan saraf menerima informasi dari luar, menggunakan data untuk bekerja dengan memori melalui operasi baca / tulis tertentu. Untuk membantu pengontrol bekerja dengan memori, DNC memelihara tautan sementara untuk melacak data yang direkam, dan juga menangkap tingkat penggunaan saat ini untuk setiap lokasi memori.

Prestasi utama karyawan DeepMind adalah bahwa mereka mampu mengajarkan AI mereka untuk melakukan setiap tugas berikutnya, tidak melupakan bagaimana yang sebelumnya berjalan. Dalam situasi normal, sistem dapat menggunakan area memori yang sama untuk merekam informasi tentang berbagai tugas. Setelah menyelesaikan tugas pertama, mesin mulai melakukan tugas kedua. Dan data tentang implementasi yang pertama untuk menggantikan data tentang implementasi yang kedua.


DNC memainkan tag

DNC DeepMind tidak. Karyawan perusahaan menyediakan jaringan saraf dengan sepotong memori dalam media eksternal, dan mengajarkan sistem cara menggunakannya. Proses pembelajaran dalam kasus ini adalah sifat coba-coba. Perwakilan proyek menyatakan di situs web mereka sebagai berikut: “Ketika DNC menghasilkan tanggapan, kami membandingkannya dengan jawaban yang benar yang diinginkan. Seiring waktu, sistem belajar untuk memberikan jawaban lebih dekat dan lebih dekat ke kanan. "

Jantung dari DNC adalah jaringan saraf yang disebut pengontrol. Pencipta sistem menggambar analogi di sini dengan prosesor di komputer. Pengontrol bertanggung jawab untuk menerima data, menulisnya ke memori, dan membaca dari memori. Selain itu, pengontrol menganalisis data dan menghasilkan jawaban sebagai jawaban atas pertanyaan yang diajukan oleh sistem.

Pengontrol melakukan beberapa jenis operasi dalam memori. Setiap saat ia memutuskan apakah akan menulis sesuatu di memori atau tidak. Jika solusinya adalah ya, maka pengontrol dapat memilih dua opsi perekaman - di sektor yang tidak digunakan atau di sektor di mana sudah ada informasi yang sebelumnya dicari oleh pengontrol. Ini memungkinkan untuk memperbarui informasi yang direkam di beberapa sektor tetap. Jika semua sektor dalam memori digunakan, pengontrol dapat memutuskan untuk membebaskan memori, mirip dengan bagaimana Anda dapat menimpa sektor pada hard disk biasa yang tidak lagi diperlukan.

Seperti dalam kasus perekaman, pengontrol dapat membaca data dari sejumlah sektor. Sistem dapat mencari informasi yang diperlukan di setiap sektor, atau segera membaca data yang disimpan di sektor terkait dengan data yang diminta.

Semua ini memungkinkan sistem untuk secara efektif menyelesaikan masalah penggunaan memori, penyimpanan data, dan pengambilan.


Setelah jaringan saraf menerima peta London Underground, komputer segera mulai memberikan jawaban kompleks untuk pertanyaan kompleks tentang bergerak di sekitar kereta bawah tanah. Jawaban-jawaban ini didasarkan pada prinsip deduksi. Berikut adalah contoh dari salah satu pertanyaan yang dapat dijawab oleh DNC dengan benar setelah memuat peta kereta bawah tanah ke dalam memori sistem: “Ketika kita masuk ke dalam kereta bawah tanah dan melewati satu pemberhentian di sepanjang garis Central, maka ada empat pemberhentian lagi di sepanjang jalur Koltsevaya dan ada jalur Dzhubili lainnya dua perhentian, di perhentian manakah kita akan keluar? ” Untuk asisten digital seperti Siri, pertanyaan ini tidak tertahankan - mereka tidak akan dapat menemukan jawaban yang tepat, terlepas dari semua kekuatan komputasi pusat data Apple. Namun AI dari DeepMind cukup mampu memberikan jawaban yang benar.


Sumber: Photofusion / Getty

Selain itu, sistem ini dapat memberikan saran untuk memperpendek jalur antara berbagai perhentian. Jawaban yang benar dia memberikan di 9 kasus dari 10.

Dalam kata-kata dari para pengembang, sistem mereka dapat memberikan jawaban yang benar, karena prinsip operasinya adalah kesamaan dengan prinsip-prinsip dasar pemikiran manusia. Tentu saja, sistem dari DeepMind masih jauh dari analog mesin kecerdasan manusia yang sebenarnya, tetapi versi saat ini berfungsi dengan baik. Otak manusia masih lebih terampil mengelola data yang tersimpan, termasuk proses memposting informasi baru.

Spesialis DeepMind berharap bahwa di masa depan mereka akan dapat membuat sistem yang, tanpa memasukkan program khusus ke dalam memorinya, dapat menggunakan informasi yang tersedia untuk menyelesaikan masalah tertentu. Dalam hal ini, kita sudah dapat berbicara tentang sistem belajar mandiri lengkap yang dapat menggunakan data yang tersedia untuk memecahkan masalah yang kompleks.

Belum jelas kapan Alphabet akan dapat menggunakan keunggulan sistem baru dalam produk dan layanan komersialnya. Sejauh ini, tim unit sedang melakukan studi mendalam dan tidak mengatakan apa-apa tentang kapan penggunaan komersial dari sistem yang dikembangkan akan dimulai.

Para ahli mengatakan perusahaan telah membuat kemajuan besar dalam penelitian AI, Herbert Jaeger dari Jacobs University of Bremen, menyatakan bahwa tim DeepMind "telah mengatasi salah satu tahap terpenting dalam pengembangan evolusi sistem saraf modern." Ilmuwan ini yakin bahwa sebenarnya perusahaan telah menciptakan sesuatu yang lebih signifikan daripada yang dijelaskan oleh perwakilannya dalam sebuah artikel di jurnal Nature .

Seperti semua proyek DeepMind lainnya, proyek ini didasarkan pada pembelajaran yang mendalam. Teknologi yang hampir sama yang membantu sistem AlphaGo memenangkan 4 game dari juara dunia ke-5 Lee Sedol.

Sekarang DeepMind bersama dengan Future of Humanity Institute sedang melakukan pekerjaan menarik lainnya. Tim spesialis terpadu menciptakan "tombol merah" untuk bentuk AI yang kuat. Ini adalah alat yang akan mematikan kecerdasan buatan jika tidak dapat dikendalikan.

Masalah menciptakan instrumen seperti itu ditunjukkan dengan baik dalam pernyataan Nick Bostrom, direktur Institute for the Future of Humanity: “Jika ledakan intelektual mengancam kita dengan kepunahan, maka kita perlu memahami apakah kita dapat mengendalikan proses peledakan. Hari ini akan lebih masuk akal untuk mempercepat pekerjaan memecahkan masalah kontrol, daripada menunda penelitian di bidang kecerdasan buatan. Namun sejauh ini, enam orang sedang menyelesaikan masalah kontrol, sementara puluhan, jika tidak ratusan ribu, sedang mengerjakan penciptaan kecerdasan buatan. ”

Source: https://habr.com/ru/post/id398357/


All Articles